Pagina documente » Informatica, Matematica » Formalisme alternative pentru Semantic Web

Despre lucrare

lucrare-licenta-formalisme-alternative-pentru-semantic-web
Aceasta lucrare poate fi descarcata doar daca ai statut PREMIUM si are scop consultativ. Pentru a descarca aceasta lucrare trebuie sa fii utilizator inregistrat.
lucrare-licenta-formalisme-alternative-pentru-semantic-web


Cuprins

Cuprins
Introducere 2
1 Notiuni generale despre Semantic Web 3
1.1 O scurta istorie a Web-ului. De la HTML la XML 3
1.1.1 HTML 3
1.1.2 XML 5
1.1.3 XHTML. Relatiile dintre SGML, HTML, XML si XHTML 5
1.2 Semantic Web: Noua generatie Web 6
1.2.1 Definitii 7
1.2.2 Tehnologii 8
1.2.3 Viziunea Semantic Web 11
1.3 Fundatia Semantic Web 12
1.4 Structura Semantic Web 14
1.5 RDF. Introducere. 16
1.6 Topic Maps. Introducere 18
1.7 Rezumat 19
2. Doua formalisme de adnotare: RDF si Topic Maps 20
2.1 Introducere. Adnotari 20
2.1 .1 Sisteme de adnotare pentru Web 20
2.1.2 Imbunatatirea adnotarii. 23
2.2 Modelul RDF 23
2.2.1 Introducere 23
2.2.2 Proprietati RDF 28
2.2.3 Grafuri RDF 29
2.2.4 Capabilitati RDF. 33
2.2.5 Serializarea RDF in sintaxa XML 37
2.2.5.1 XML 38
2.2.5.2 Sintaxa XML 38
2.2.5.3 Sintaxa RDF/XML 45
2.2.6 RDF Schema- Vocabularul RDF 49
2.2.7 Dublin Core Metadata Initiative 52
2.2.8 Rezumat RDF 53
2.3 Topic Maps 54
2.3.1 Modelul Topic Maps 54
2.3.2 Obiective 55
2.3.3 Sintaxa XTM 55
2.3.4 Concepte 58
2.3.4.1 Topice 58
2.3.4.2 Ocurente 63
2.3.4.3 Asocieri 63
2.3.5 Concluzii 64
3 Studiu de caz 66
3.1 Corpus-ul 66
3.2 Protigi -3.0 67
3.3 Omnigator Eight 70
4. Modelarea cu RDF 75
4.1 Adnotarea corpusului cu RDF 75
4.1.1 Extragerea informatiei 75
4.1.2 Transformarea corpusului intr-un document structurat. 77
4.1.3 Crearea ierarhiilor 79
4.2 Modelarea RDF utilizand Protigi-3.0 80
4.3 Codul RDF si RDFS. 81
5 Modelarea cu Topic Maps 91
5.1 Adnotarea corpusului cu Topic Maps. 91
5.1.1 Extragerea informatiei 91
5.1.2 Transformarea corpusului intr-un document structurat 92
5.1.3 Crearea ierarhiilor. 96
5.2 Modelarea Topic Maps cu Protigi-3.0 : 96
5.3 Codul Topic Maps. 97
6 Studiu comparativ al celor doua formalisme prezentate 126
6.1 RDF si Topic Maps 126
6.2 Compararea modelelor 126
6.2.1. Lucruri 126
6.2.2. Relatii 127
6.2.3. Atribute 129
6.2.4. Categorii de lucruri 129
6.2.5. Context 130
6.2.6. Reificarea 130
6.3 Concluzii 131
7. Bibliografie 133

EXTRAS DIN DOCUMENT

?

Introducere

Scopul acestei lucrari este de a compara si evalua doua formalisme de adnotare pentru Semantic Web: Resource Description Framework (RDF) si Topic Map. In acest scop a fost ales un scenariu particular: am adnotat informatia turistica gasita pe site-ul www.turism.ro folosind instrumente de proiectare specifice pentru Semantic Web.

Semantic Web poate aduce imbunatatiri substantiale in rezultatele motoarelor de cautare. Un prim pas in aceasta directie este organizarea si structurarea informatiei utilizand RDF si Topic Maps.

Acesta lucrare este impartita in 6 capitole dupa cum urmeaza:

Capitolul 1 intitulat “Notiuni generale despre Semantic Web” ofera o scurta prezentare a web-ului si a principalelor elemente care fac din Semantic Web noua generatie a www . Acest capitol este si o introducere pentru cele doua formalisme de adnotare: RDF si Topic Maps, care vor fi discutate pe larg in Capitolul 2: “Doua formalisme de adnotare: RDF si Topic Maps ”

Capitolul 3 intitulat “Studiu de caz” contine modalitatea de adnotare a corpusului preluat de la adresa www.turism.ro si prezentarea celor doua instrumente de proiectare folosite: Protégé-3.0 si Omnigator Eight.

In Capitolul 4 intitulat “Modelarea cu RDF” sunt ilustrate: extragerea informatiei de pe web, structurarea corpusului astfel obtinut, crearea ierarhiilor de clase si subclase, implementarea acestora in Protégé 3.0, vizualizarea si navigarea cu Omnigator Eight.

Capitolul 5 intitulat “Modelarea cu Topic Maps” reia acelasi demers, pe acelasi corpus, dar pentru Topic Maps.

In Capitolul 6 intitulat “Studiu comparative al celor doua formalisme prezentate” sunt ilustrate asemanarile si deosebirile dintre cele doua formalisme, comparatia fiind realizata atat la nivel formal cat si la nivel de aplicatie.

Capitolul 1- Notiuni generale despre Semantic Web

Semantic Web este un concept depre modul in care calculatoarele, oamenii si web-ul pot lucra impreuna mai eficient decat este acum posibil

1.1 O scurta istorie a “Web”-ului. De la HTML la XML

World Wide Web (deasemenea cunoscut ca www, w3 sau web) a fost creat de Tim Berners-Lee. Programul "World Wide Web" a fost lansat pe Internet in vara anului 1991. Avea scopul de a facilita accesul la informatiile gasite pe diferite computere.

World Wide Web a schimbat modul de comunicare intre oameni si modul in care informatia este raspandita si obtinuta. De asemenea, a schimbat rolul de baza al computerelor: initial erau folosite pentru calcule numerice, acum sunt folosite in principal pentru procesarea informatiei.

1.1.1 HTML

Unul dintre principalele mecanisme care a facut posibila expansiunea rapida a web-ului este HTML (HyperText Markup Language).

HTML nu este un limbaj de programare, ci un limbaj de marcare bazat pe SGML (Standard Generalized Markup Language).

SGML a fost ales ca baza pentru ca nu depinde de computerul pe care este folosit, si pentru ca sunt disponibile multe documentati si specificatii pentru acest limbaj.

Definitia HTML-ului este: Limbaj de Marcare a Hiper-Textelor (HyperText Markup Language).

* HiperText este o metoda folosita pentru navigarea unui document sau a unei pagini web prin simplul click pe un text special numit hiperlink care te trimite la urmatoarea pagina.

* Hiper inseamna ca nu este liniar — i.e. oricine poate ajunge oriunde pe internet prin intermediul link-urilor.

* Marcarea reprezinta ceea ce face un tag HTML textului din interiorul acestuia: il marcheaza ca fiind un anumit tip de text.

HTML este alcatuit dintr-o serie de taguri ce contin texte. Un astfel de document este salvat ca fisier html si vizualizat cu ajutorul unui browser ca Internet Explorer sau Netscape Navigator.

Browserul citeste fisierul si afiseaza textul.

Principalul avantaj al HTML-ului este simplicitatea acestuia, dar are si dezavantaje. Acest limbaj de marcare a fost creat in scopul prezentarii informatiei pe Web. Numai oamenii pot intelege continutul unui astfel de document. Din acest motiv computerele au jucat un rol pasiv in acest proces.

Ca rezultat al folosirii HTML-ului, o mare parte din informatia care se gaseste pe Web este adecvata doar pentru intelegerea umana. Web-ul este utilizat pentru cautarea de informatie, contactarea altor persoane, cumparaturi on-line, etc. Toate acestea sunt activitati care consuma mult timp.

Problemele si limitarile HTML-ului sunt:

? exista o colectie fixa de taguri cu o semantica fixa

? nu se deosebeste sintaxa de semantica

? nu descrie continutul unui document web

? nu marcheaza continutul documentelor intr-un mod in care acestea sa poata fi intelese atat de oameni cat si de computere

? trebuie sa fie suficient de flexibil incat sa poata descrie anumite arii de interes atat pentru companiile si organizatiile din prezent cat si pentru cele din viitor

Trebuie sa mentionam ca nu toata informatia de pe Web este hipertext.