Universitatea Babeş-Bolyai Cluj-Napoca
Facultatea de Matematică şi Informatică
Ciclul de studii: Masterat

FISA DISCIPLINEI

Codul
Denumirea disciplinei
MI282 Prelucrarea limbajului natural
Specializarea
Semestrul
Ore: C+S+L
Categoria
Statutul
Sisteme inteligente - în limba engleză
1
2+2+0
obligatorie
Titularii de disciplina
Lect. Dr. LUPSA Dana,  danacs.ubbcluj.ro
Obiective
Prezentarea unuia dintre cele mai active domenii ale inteligentei artificiale, prelucrarea limbajului natural. Aplicarea, in cazul concret al acestui domeniu, al notiunilor de ierarhie de tipuri si structuri de atribute, notiuni de baza in paradigma orientarii obiect. Necesitatea studiului acestui domeniu se impune in scopul optimizarii cantitatii imense de informatie scrisa stocata in acest moment pe Web.
Continutul
1. Introducere in NLP. Etape si domenii. Corpora.
2. Problema Word Sense Disambiguation. Abordarea prin $machine learning$: supervizata (NBC si k-NN) si nesupervizata (prin clustering). Abordarea pe baza dictionarelor (Lesk, Yarowsky, dictionare bilingve).
3. Metode statistice de prelucrare a limbajului natural: Lanturi Markov, modelul Markov acoperit (HMM). Calculul probabilitatii secventelor de intrare, drum de probabilitate maxima. Aplicatii la POS tagging.
4. Gramatici Context- free probabiliste. Probabilitati Inside si Outside. Arbore de probabilitate maxima. Analiza sintactica cu algoritmul lui Earley.
5. Gramatici de unificare. Structuri de atribute (FS) ca obiecte de reprezentare a cunostintelor lingvistice. Reprezentarea ca grafe, AVM si prin descriptori. Analiza sintactica folosind gramatici de unificare.

Bibliografie
1. J.ALLEN : Natural language understanding, Benjamin/Cummings Publ. , 2nd ed., 1995.
2. E. CHARNIAK: "Statistical language learning", MIT press, 1996.
3. B.CARPENTER: ALE:The attribute logic engine.User's guide. Carnegie Mellon University,1994.
4. D.JURAFSKY, J.MARTIN: Speech and language processing, Prentice Hall, 2000.
5. C.MANNING, H.SCHUTZE: Foundation of statistical natural language processing, MIT, 1999.
6. S.J.RUSSELL, P.NORVIG: Artificial intelligence.A modern approach, Prentice-Hall International,1995.
7. D.TATAR: Inteligenta artificiala: demonstrare automata de teoreme, prelucrarea limbajului natural, Editura Albastra, Microinformatica, 2001.
8. D.TATAR: Unification Grammars in Natural Language Processing, in "Recent topics in mathematical and computational linguistic, ed. C. Martin-Vide, G. Paun, Editura Academiei, 2000, pg 289-300.
9. D. TATAR: Inteligenta artificiala. Aplicatii in prelucrarea limbajului natural,Editura Albastra, Microinformatica, 2003, ISBN 973-650-100-0
10. Editor R. MITKOV: The Oxford Handbook of Computational Linguistics, Oxford University Press, 2003.
Evaluare
Examenul este scris, cu subiecte din intreaga materie (60%). Nota finala va reflecta deasemenea modul de intelegere si prezentarea a unor articole recente in domeniu precum si realizarea de aplicatii (40%).
Legaturi: Syllabus-urile tuturor disciplinelor
Versiunea in limba engleza a acestei discipline
Versiunea in format rtf a acestei discipline