Pagina documente » Informatica, Matematica » Recunoasterea actelor de vorbire dintr-un dialog

Despre lucrare

lucrare-licenta-recunoasterea-actelor-de-vorbire-dintr-un-dialog
Aceasta lucrare poate fi descarcata doar daca ai statut PREMIUM si are scop consultativ. Pentru a descarca aceasta lucrare trebuie sa fii utilizator inregistrat.
lucrare-licenta-recunoasterea-actelor-de-vorbire-dintr-un-dialog


Cuprins

CUPRINS
Capitolul 1. Introducere 02
Capitolul 2. Notiuni referitoare la dialog 03
Capitolul 3. Acte de vorbire
3.1 Adnotarea actelor de vorbire 05
3.2 Interpretarea actelor de vorbire 07
3.3 Identificarea actelor de vorbire pe baza unui Model Markov ascuns (Hidden Markov Model - HMM) 09
3.4 Recunoasterea actelor de vorbire folosind algoritmul Viterbi 12
Capitolul 4. Netezirea matricei HMM folosind metoda lui Katz 14
Capitolul 5. Prezentarea aplicatiei 16
Capitolul 6. Schema bloc a aplicatiei 16
Capitolul 7. Prezentarea detaliata a fiecarui pas in parte 17
7.1 Pasul 1 - Adnotare 17
7.2 Pasul 2 - Adnotare manuala (Adnotare star) 22
7.3 Pasul 3 - Invatare 26
7.4 Pasul 4 - Recunoastere 40
7.5 Pasul 5 - Statistica 52
Capitolul 8. Rularea aplicatiei 56
8.1 Linux 56
8.2 Windows 57
Capitolul 9. Calculul de complexitate 59
Capitolul 10. Prezentarea rezultatelor 61 Capitolul 11. Concluzii 69
ANEXA 1. BIBLIOGRAFIE 70
ANEXA 2. PREZENTAREA SURSELOR 71

EXTRAS DIN DOCUMENT

?

Recunoasterea actelor de vorbire dintr-un dialog

Capitolul 1. Introducere

Limbajul natural este un fenomen extrem de complicat. El se dezvolta incet si treptat de-a lungul unei perioade indelungate de timp, aparent pentru a optimiza comunicarea dintre oameni.

In limbajul natural, apare o mare incidenta a variatiei si incertitudinii. Cea mai mare sursa a variatiei este data de continutul mesajelor. In plus, fiecare mediu de transmisie a limbajului natural este supus la zgomote, distorsiuni si pierderi.

Datorita acestor incertitudini se naste nevoia unui model lingvistic. Cea mai importanta utilizarea a modelelor lingvistice este aplicarea in recunoasterea automata a actelor de vorbire, unde un computer este folosit pentru a pune textul intr-o forma acceptabila. Limbajul natural poate fi vazut ca un proces stohastic. Fiecare cuvant, enunt, document sau alt nivel al vorbirii este tratat ca fiind o variabila aleatoare cu o anumita probabilitate de distributie. Daca W=w1w2…wn reprezinta o secventa de n cuvinte, scopul modelului lingvistic este de a calcula probabilitatea P(W).

O metoda de a calcula aceasta probabilitate este de a considera o regula de tip lant, in care cuvintele de la un anumit moment depind de cele dinaintea lui.

In lucrarea de fata se inceaca o abordare de acest gen. Se doreste sa se ajunga la recunoasterea actelor de vorbire din texte de tip chat care au un anumit format, recunoastere bazata pe identificarea unor modele lingvistice ale textelor si pe gasirea unor cuvinte-cheie specifice fiecarui act de vorbire in parte.

Initial se incearca obtinerea unui model lingvistic prin aplicarea unor tehnici de invatare asupra unor texte adnotate manual si prin folosirea unui model Markov ascuns, iar dupa aceea se incearca recunoasterea actelor de vorbire din texte neadnotate pe baza modelului obtinut in pasul anterior si a identificarii unor cuvinte-cheie specifice pentru fiecare act de vorbire in parte.

Capitolul 2. Notiuni referitoare la dialog