Universitatea Babeş-Bolyai Cluj-Napoca
Facultatea de Matematică şi Informatică
Ciclul de studii: Licență

FISA DISCIPLINEI

Codul
Denumirea disciplinei
MI070 Prelucrarea limbajului natural
Specializarea
Semestrul
Ore: C+S+L
Categoria
Statutul
Informatică - linia de studiu română
7
2+0+2
optionala
Matematică-Informatică - linia de studiu română
7
2+0+2
optionala
Titularii de disciplina
Lect. Dr. LUPSA Dana,  danacs.ubbcluj.ro
Obiective
Prezentarea unuia dintre cele mai active domenii ale inteligentei artificiale, prelucrarea limbajului natural. In acest scop este prezentat modelul lingvistic de structura de atribute. Deasemenea sunt prezentate problemele de semantica si de pragmatica care apar in acest domeniu. Acestea sunt importante atunci cand sunt abordate aspectele legate de dialogul (interfetele) om-calculator sau probleme care pot fi incadrate in "information retrieval" sau "text mining".
Continutul
1. Structuri de atribute (FS) ca obiecte de reprezentare a cunostintelor lingvistice.
Ierarhii de tipuri. Relatia de subsumare pe multimea FS. Unificarea ca operatie pe multimea FS. Descriptori si legatura cu FS. Teoria deductiva a descriptorilor. Cel mai general FS care satisface un descriptor. Cazul variabilelor si legatura cu programarea logica. Notiunile de buna-tipizare, total buna-tipizare a structurilor de atribute.
2. Gramatici de unificare, gramatici ale clauzelor definite, formalismul PATR, gramatici HPSG. Reguli de rescriere. Programul ALE.
3. Metode statistice de prelucrare a limbajului natural. Modelul Markov acoperit ( HMM). Drum de probabilitate maxima intr-un HMM, calculul probabilitatii unor secvente de intrare. Gramatici probabiliste.
4. Dezambiguare semantica. Dezambiguare supervizata, dezambiguare $bootstrapping$, dezambiguare nesupervizata. Aplicatii la categorizarea de text, sumarizarea de text si traducere automata.
Bibliografie
1. J.ALLEN : "Natural language understanding", Benjamin/Cummings Publ., 2nd ed., 1995.
2. B.CARPENTER: "The logic of typed feature structures", Cambridge University Press,1992.
3. B.CARPENTER: "ALE:The attribute logic engine.User's guide". Carnegie Mellon University,1994.
4. D.JURAFSKY, J.MARTIN: "Speech and language processing", Prentice Hall, 2000.
5. C.MANNING, H.SCHUTZE: "Foundation of statistical natural language processing", MIT, 1999.
6. G.MORILL:"Type LogicalGrammar.Categorial Logic of Signs", Kluwer Academic Publishers, 1994.
7. S.J.RUSSELL, P.NORVIG: "Artificial intelligence.A modern approach", Prentice-Hall International, 1995.
8. D.TATAR: "Inteligenta artificiala: demonstrare automata de teoreme, prelucrarea limbajului natural", Editura Albastra, Microinformatica, 2001.
9. D.TATAR: "Inteligenta artificiala. Aplicatii in prelucrarea limbajului natural", Ed. Albastra, Microinformatica, 2003
10.E. CHARNIAK: "Statistical language learning", MIT Press, 1996.
Evaluare
Examenul este oral, cu subiecte din intreaga materie (70%). In nota finala se va tine cont de activitatea de realizare a unui proiect in legatura cu materia predata (30%).
Legaturi: Syllabus-urile tuturor disciplinelor
Versiunea in limba engleza a acestei discipline
Versiunea in format rtf a acestei discipline