Universitatea Babeş-Bolyai Cluj-Napoca
Facultatea de Matematică şi Informatică
Ciclul de studii: Licență

FISA DISCIPLINEI

Codul
Denumirea disciplinei
MII0007 Tehnici pentru regăsirea informaţiei
Specializarea
Semestrul
Ore: C+S+L
Categoria
Statutul
Informatică - linia de studiu română
5
2+0+2
specialitate
optionala
Matematică informatică - linia de studiu română
5
2+0+2
specialitate
optionala
Ingineria informatiei - in limba romana
7
2+0+2
optionala
Titularii de disciplina
Lect. Dr. LUPSA Dana,  danacs.ubbcluj.ro
Obiective
Prezentarea unuia dintre cele mai active domenii ale inteligentei artificiale, regasirea informatiei, cu aplicatii in prelucrarea limbajului natural. Cursul trece in revista atat abordari traditionale, precum si cateva abordari in noul domeniu al regasirii inteligente a informatiei. Sunt prezentati algoritmi si modele folosite in IR (Information Retrieval). Cautarea si regasirea informatiei este strans legata de organizarea si descrierea informatiei de regasit, motiv pentru care sunt prezentate tehnici de procesare a limbajului natural.
Continutul
1. Introducere in procesarea limbajului natural (NLP) si regasirea informatiei (IR).
2. Informatie in text: legatura intre informatia sintactica si semantica, informatie semantica (cu accent pe semantica lexicala). Modele de reprezentare a informatiei.
3. Proprietati ale textelor; procesarea textelor. Caracteristici statistice ale textelor, importanta termenilor, algoritmi de clasificare cu aplicatii la clasificarea textelor.
4. Organizarea fisierelor pentru IR.
5. Modele probabilistice in NLP si IR.
6. Aplicatii practice ale tehnicilor IR in NLP.
7. Sisteme IR si WWW.
Bibliografie
1. J.ALLEN : $Natural language understanding$, Benjamin/Cummings Publ., 2nd ed., 1995.
2. S.COZENS, P.WAINWRIGHT: $Beginning Perl$, Wrox Press, 2000
3. C.MANNING, P.RAGHAVAN, H.SCHÜTZE: $Introduction to Information Retrieval$, Cambridge University Press. 2007.
http://www-csli.stanford.edu/~schuetze/information-retrieval-book.html
4. D.JURAFSKY, J.MARTIN: $Speech and language processing$, Prentice Hall, 2000.
5. C.J. van RIJSBERGEN: $Information Retrieval$, 1979
6. D.TATAR: $Inteligenta artificiala. Aplicatii in prelucrarea limbajului natural$, Ed. Albastra, Microinformatica, 2003
Evaluare
Nota finala se va calcula astfel:
examen final = 70%
activitate practica = 30%
Activitatea practica va fi evaluata pe baza unor programe sau proiecte dezvoltate in timpul orelor de laborator.
Legaturi: Syllabus-urile tuturor disciplinelor
Versiunea in limba engleza a acestei discipline
Versiunea in format rtf a acestei discipline