Pagina documente » Informatica, Matematica » Sistem de informare bazat pe o reprezentare ontologica a cunostintelor

Cuprins

lucrare-licenta-sistem-de-informare-bazat-pe-o-reprezentare-ontologica-a-cunostintelor
Aceasta lucrare poate fi descarcata doar daca ai statut PREMIUM si are scop consultativ. Pentru a descarca aceasta lucrare trebuie sa fii utilizator inregistrat.
lucrare-licenta-sistem-de-informare-bazat-pe-o-reprezentare-ontologica-a-cunostintelor


Extras din document

Cuprins
Cuprins 2
Introducere 4
Capitolul I. Webul Semantic si Managementul de Cunostinte 9
1.1 Problemele Actuale 9
1.2 Impactul Webului Semantic- Managementul de Cunostinte 9
1.3 Tehnologiile Webului Semantic: 10
1.3.1 MetaDate 11
1.3.2 Ontologiile 11
1.3.3 Logica si Inferenta 12
1.1.4 Agentii 13
1.4 Interoperabilitatea Semantica si Piramida Limbajelor Web-ului Semantic 13
1.4.1 XML 14
1.4.2 RDF 16
1.4.3 Stratul Ontologic 17
1.4.4 Stratul Logic 19
Capitolul II. Ontologia ca arhitectura de baza a MC-ului: 20
2.1 Metodologia pentru Managmentul de Cunostinte bazata pe Ontologie 20
2.1.1 Studiul de fezabilitate 22
2.1.2 Faza de inceput 25
2.1.3 Faza de rafinare 28
2.1.4 Faza de evaluare 28
2.1.5 Faza de mentinere si evolutie 29
2.1.6 Referinte 29
2.1.7 Metodologia de programare 30
2.2 Managmentul Ontologiei: depozitarea, aliniamentul si intretinerea 32
2.2.1 Cerintele administrarii ontologice 33
2.2.2 Aliniamentul Ontologiilor 34
2.2.3 Sustinerea schimbarii ontologiei 37
2.2.4 Organizarea ontologiilor 43
2.3 Exemple de Ontologii Existente 48
2.3.1 WordNet 48
2.3.2 Cyc 49
2.3.3 TOVE si KA 50
Capitolul III. Instrumente Ontologice 51
3.1 Sesame: arhitectura generala pentru stocarea si interogarea RDF-ului si a schemei RDF-ului 52
3.2 Generarea Ontologiilor pentru Web-ul Semantic 52
3.3 Ingineria coloborata a Ontologiei 54
3.4 QuizRDF: Tehnologia de cautare pentru Webul Semantic 55
3.5 Reprezentarea Informatiei 56
3.6 OntoShare: Evolueaza Ontologii in sistemul de partajare a cunostintelor 58
3.7 Midleware Ontologic 59
3.8 Experimentarea domeniului cu unelte semantice de retea intr-o organizare virtuala 60
3.8.1 Consortiul EnerSearch in cercetarea industriala ca organizare virtuala 61
3.8.2 Cum pot metodele semantice de retea sa ne ajute? 63
3.8.3 Consideratiile de proiectare a experimentelor domeniului semantic al retelei 64
3.8.4 Setarea experimentala in organizarea virtuala 69
3.8.5 Aspectele tehnice si sistematice ale experimentelor semantice ale Web-ului 74
3.8.6 Recuperarea informatiei pe baza ontologica: Cum arata? 76
3.8.7 Citeva lectii invatate 77
3.9 O perspectiva de viitor: Exploatarea de la P2P Semantic web-ul pentru managementul cunostintelor 79
3.9.1 O viziune a managementului modern de cunostinte 80
3.9.2 O viziune asupra ontologiilor: semnificatia retelelor dinamice 85
3.9.3 P2P Ontologii si Cunostinte 89
3.9.4 P2P pentru cunostintele de management 95
Capitolul IV. Prezentarea aplicatiei 97
4.1 FORMULAREA PROBLEMEI: Posibila clasificare Ontologica a Proiectelor de Cercetare si Dezvoltare disponibile in Rominia 97
4.2 REZUMATUL SOLUTIILOR 98
4.3 TEHNOLOGII PRINCIPALE 99
4.4 Prezentarea Aplicatiei Onto-Poiect 100
4.4.1 Prezentarea Generala 101
4.4.2 Prezentarea Interfetei 104
4.4.3 Directiile viitoare de dezvoltare 107
Concluzii 109
Bibliografie: 110
Anexa 111
Cod fisierilor RDFS: 111
Clase.rdfs 111
Instante.rdfs 113
Pentru fereastra Cautarea: 115

Alte date

?Introducere

Tehnologia de baza a Web-ului semantic este ontologia. Scopul ei este de a facilita distribuirea cunostintelor si refolosirea acestora. Dupa natura lor, ontologiile, sunt specificatii formale ale conceptiilor care permit o intelegere distribuita a domeniului, o intelegere care poate fi atinsa in procesul de comunicare intre oameni si agentii software. Ontologia asigura o conceptualizare explicita care descrie semantica datelor. Ea inglobeaza des si functiile asemanatoare cu cele ale bazelor de date, cu toate ca realizarea lor este cu totul alta. În timp ce Bazele de Date opereaza numai cu Datele la nivel de tabele, Ontologia poate include atat Datele cat si Cunostintele, precum si legatura intre aceste doua reprezentari informationale. Reprezentand o structura mai avansata, Ontologia are destula putere sa inlocuiasca Bazele de Date, ce va rezolva, in primul rand, problema descrierii resurselor si intelegerii comune ale acestora.

Crearea Ontologiilor poate avea urmatoarele cauze:

? utilizarea concomitenta de catre oameni si agentii software a unei structuri comune de intelegere a informatiei.

? posibilitatea reutilizarii cunostintelor dintr-un anumit domeniu.

? usurinta modificarii cunostintelor, fara spargerea integritatii acestora.

? separarea cunostintelor din domeniu de cunostintele operative.

? analiza cunostintelelor de domeniu.

Toate aceste cauze reflecta si principiile de baza ale Managementului de Cunostinte actual. Cu aceasta problema se confrunta cel mai mult intreprinderile mari, in care Cunostintele devin un instrument la fel de puternic ca si ceilalti factori de productie. Manegerii se confrunta cu problema necunoasterii resurselor umane si intelectuale ale intreprinderii, ce scade semnificativ capacitatea de productie si creste posibilitatea dublarii taskurilor, cerintelor catre diferiti angajati. Aceeasi problema apare si cu componentele Software, nefiind cunoscute ca un intreg, ele la fel pot crea dublicarea informatiei care, datorita caracterului ei dinamic, are ca efect aparitia redundantei.

Asadar Ontologia, prin acceptarea sa de catre mai multi agenti, creaza o coloana vertebrala in organizarea cunostintelor, si resurselor acestora. Ontologia reprezinta o baza care poate fi accesata la fel de usor de catre Agentii Software, cat si de oameni. Agentii pot nu numai extrage cunostintele necesare, dar pot si procesa prin metode de inferenta, generand si concluziile necesare.

Lucrarea de fata, cu titlu “Sistem de Informare bazat pe reprezentare ontologica a cunostintelor” are ca scop cercetarea in domeniul Manegementului de Cunostinte si anume subdomeniul principal al acestora care se numeste Ontologia, facilitatile ei precum si legatura intre aceste doua notiuni. Ca un set de cuvinte cheie care descriu in linii mari aceasta lucrarea putem specifica: Managementul de Cunostinte, Ontologia, Limbaje Ontologice, Framework-uri Ontologice, Jena, RDF, RDQL, Protégé… Scopul principal al acestei lucrari este intelegerea generala a tehnologiilor Web-ului Semantic ca o parte integrata a Managementului de Cunostinte si rolul Ontologiei in structura acestei tehnologii. Ca sub-obiective am incercat sa studiez si sa descriu principalele metode, instrumente si alte elemente, care au un caracter aplicativ in cea ce priveste Ingineria Ontologiei si dezvoltarea Software-ului pe baza Ontologiei.

Lucrarea este structurata pe 4 capitole in care sunt descrise notiunile mentionate mai sus.

Capitolul 1 are un caracter introductiv, care reprezinta descrierea problematicii lucrarii. Aici sunt definite notiuni de baza precum: Managementul de Cunostinte, Ontologia, Limbaje Ontologice, Interoperabilitatea… Se ridica problemele majore a Web-ului actual, si se discuta variantele posibile de rezolvarea a lor, cu ajutorul elementelor predefinite. Se discuta legatura intre Ontologie si Managementul de Cunostinte. Sunt enumerate principalele tehnologii a Web-ului Semantic.

Capitolul 2, se focalizeaza pe problematica Ontologiei, si explicarea mai detaliata a notiunilor acestora. Capitolul are mai multe subcapitole, fiecare avand un aspect important in descrierea Ontologiei. În primul rand se discuta Metodologia pentru Managementul de Cunostinte si fazele principale de proiectare. Dupa ce se descrie notiunea Managementul Ontologiei, care presupune depozitarea, aliniamentul si intretinerea acesteia. În continuare sunt prezentate si exemple de Ontologii deja existente.

În capitolul 3, este descrisa partea aplicativa a Ontologiilor, si anume intrumentele, blocurile functionale a midleware-ului precum si interactiunea intre ele. Subcapitolul 3.8 descrie activitatea Consortiului EnerSearch in cercetarea industriala. Un subiect de importanta deosebita este descris in subcapitolul 3.9 care descrie perspectivele P2P in domeniului Web-ului Semantic, aceasta fiind una dintre cele mai promitatoare directii de dezvoltare.

În capitolul 4 este prezentata partea practica a lucrarii. Scopul acestui capitol este de a demonstra integritatea instrumentelor Managementului de Cunostinte, prin exemplificarea cazurilor celor mai importante. În acest capitol este descris un studiu de caz, care are la baza posibilitatea imbunatatirii procesului de cautare a Proiectelor de Cercetare si Dezvoltare ce sunt disponibile doar pe teritoriul Romaniei. Se face o paralela intre problema navigarii si cautarii proiectelor necesare si problemele generale descrise in capitole anterioare care, de obicei, apar in Web-ul actual. Dupa aceea se dau variantele posibile de imbunatatire a acestui proces. În primul rand, accentul se pune pe o rezolvare perfecta, din punct de vedere al Managementului de Cunostinte, a problemelor ce se bazeaza pe o singura Ontologie, dupa ce se discuta si situatia reala, care este alta decat acea dorita in acest domeniu, si se propune o solutie posibila care ar putea fi integrata fara realizarea schimbarilor majore in structura actuala de stocare a Bazelor de Date a Proiectelor de Cercetare si Dezvoltare. Aplicatia prezentata in acest capitol are scopul de a arata un exemplu de aplicatie posibila care ar putea rezolva problema interfetei cu utilizatorul, ce se bazeaza pe Framework-ul Jena (HP).

Cercetarea prezentata in acesta lucrare se bazeaza atat pe bibliografia moderna din domeniu, cat si pe comunicarea virtuala cu inginerii de Ontologii din intreaga lume pe canale de chat din domeniu. Asadar pentru studiu mai profund al problemei in afara studiului bibliografic am apelat la „Semantic Web Interest Group IRC Scratchpad“ (http://swig.xmlhack.com/), care reprezinta un canal de tip IRC de pe serverul FreeNode; canalul #swig. Mai multe din raspunsurile importante le-am primit si pe forumul de pe pagina Sesame-ului: http://www.openrdf.org/forum/mvnforum/index.

Acum vreau sa descriu pe scurt sursele bibliografice, si sa precizez pe ce idei mi-am bazat lucrarea. În primul rand toate cartile din domeniu sunt aparute dupa anul 2000, pentru ca notiunea Web-ului Semantic in general este destul de noua.

Una dintre cartile principalele, pe care a fost bazata in linii mari si cercetarea mea este “TOWARDS THE SEMANTIC WEB Ontology-driven Knowledge Management[5]”. Dupa ce am parcurs aceasta carte am scris o scrisoare de E-mail autorului, in care l-am intrebat despre instrumentele mai actuale de dezvoltare a Ontologiei, decat cele descrise in carte, din cauza ca, dupa aparitia cartii, au trecut doi ani. În raspunsul personal profesorul Dieter Fensel mi-a indicat sa ma bazez mai mult pe solutiile contemporane dezvoltate de catre asa lideri a IT-ului cum sunt: HP, IBM, Aduna, etc. Asadar, in ultimul capitol al lucrarii eu prezint Framework-ul Jena de la HP, in care am incercat sa arat si cateva exemple de Interogare a Ontologiei cu un limbaj de interogare RDQL. Despre limbajul RDQL sunt foarte multe resurse electronice, unele dintre care le-am trecut si la bibliografie. Mai mult teoretic am studiat si solutiile de la Aduna, si anume serverul Sesame, care este la fel descris in urmatoarele capitole.

O sursa de informare foarte importanta in acest domeniu este revista IEEE INTELEGENT SISTEM[2], aici putem urmari ultimile stiri si articole din domeniul Inteligentei Artificiale, mai ales si despre Web-ul Semantic si Managementul de Cunostinte.

Pentru partea aplicativa am folosit tehnologia java, din 2 motive. Primul este legat de independenta de platforma pe care ne-o ofera aceasta tehnologie. Al doilea motiv este legat de Framework-ul Jena de la firma Hewlett-Packard, care este realizat sub forma pachetelor Java. Ca mediu de dezvoltare am ales JBuilder, datorita facilitatilor oferite de el. Pentru a studia mai profund tehnologiile Java am folosit cartea Java de la 0 la expert[11].

Asadar, lucrarea mea este bazata pe cercetarea si studiul propriu-zis a urmatoarelor tehnologii, instrumente si altor notiuni:

? Aspectele generale a problematicii Web-ului actual;

? Aspectele generale a Managementului de Cunostinte;

? Aspectele mai aprofundate despre tehnologia Ontologiei;

? Modul de functionare a serverului Sesame de la firma Aduna;

? Modul de functionare a Framework-ului Jena de la firma HP;

? Modul de Functionare a Redactorului Ontologic Protege

? Limbajul de descriere a resurselor RDF;

? Limbajul de interogare a RDF-ului RDQL;

? Limbajul de programare Java in mediu de dezvoltare JBuilder.

Printre punctele tari ale lucrarii eu consider studiul propriu in toate domeniile enumerate mai sus. Mai ales limbajului Ontologic RDF, limbajului de interogare RDQL si Frameworkului Jena, ce reprezinta o tehnologie foarte actuala in ziua de azi.

Printre punctele slabe as numi studiul practic al Serverului Sesame, datorita complexitatii documentatiei propuse de catre firma producatoare „Aduna”.