Universitatea "Babes-Bolyai" Cluj-Napoca
Facultatea de Matematica si Informatica
FISA DISCIPLINEI

Tehnici de realizare a sistemelor inteligente
Cod
Semes-
trul
Ore: C+S+L
Credite
Tipul
Sectia
MI098
8
2+0+2
10
optionala
Informatică
MI098
8
2+0+2
7.5
optionala
Matematică-Informatică
Cadre didactice indrumatoare
Lect. SERBAN Gabriela, gabis@cs.ubbcluj.ro
Obiective
1. Sa prezinte domeniul Agentilor Inteligenti, ca fiind o importanta arie de cercetare si dezvoltare in domeniul Informaticii, in special in domeniul Inteligentei Artificiale;
2. Sa prezinte principalele aspecte legate de proiectarea si implementarea Agentilor Inteligenti precum si cum se leaga acestia de alte paradigme de programare (in particular programarea obiectuala);
3. Sa prezinte domeniul invatarii prin intarire, un domeniu extrem de actual si dinamic al Inteligentei Artificiale.
Continut
1. Sisteme Inteligente
1.1. Inteligenta Artificiala: problematica, directii de cercetare
1.2. Agenti Inteligenti
1.2.1. Conceptul de Agent Inteligent
1.2.2. Structura Agentilor Inteligenti
1.2.3. Tipuri de Agenti Inteligenti
1.2.4. Arhitecturi abstracte pentru Agenti Inteligenti
1.2.5. Arhitecturi concrete pentru Agenti Inteligenti
1.2.6. Limbaje de programare pentru agenti
1.2.7. Agenti Inteligenti si Obiecte
1.3. Reprezentarea bazata pe logica si rationamentul in sistemele bazate pe agenti
1.3.1. Ingineria soft a sistemelor bazate pe agenti
1.3.2. Metode formale in Inteligenta Artificiala
1.3.3. Fundamente logice in teoria sistemelor bazate pe agenti
1.3.4. Primitive cognitive in formalizarea sistemelor bazate pe agenti

2. Tehnici de Joc in Inteligenta Artificiala
2.1. Notiuni introductive de Teoria Jocurilor
2.2. Procedura de cautare MiniMax
2.3. Adaugarea taieturilor alfa-beta
2.4. Rafinari suplimentare: asteptarea unei perioade de liniste, cautare secundara, utilizarea unei arhive de mutari, alternative la MiniMax
2.5. Adancirea Iterativa

3. Tehnici de Planificare in Inteligenta Artificiala
3.1. Notiuni introductive in Teoria Planificarii
3.2. Domeniu exemplu: lumea blocurilor
3.3. Componentele unui sistem de planificare
3.4. Planificare folosind stive de obiective
3.5. Planificare neliniara folosind declararea limitarilor
3.6. Planificare ierahica
3.7. Sisteme reactive
3.8. Alte tehnici de planificare

4. Invatarea in sistemele cu Inteligenta Artificiala
4.1. Modelul general al unui agent care invata
4.2. Invatarea unui domeniu
4.3. Strategii de invatare
4.4. Tipuri de invatare: inductiva, prin retele neuronale, prin arbori de decizie, supervizata, nesupervizata

5. Modele matematice pentru Agenti Inteligenti de Invatare
5.1. Procese de Decizie Markov
5.2. Procese de Decizie Markov Partial Observabile
5.3. Modele Markov Ascunse

6. Invatare prin Intarire
6.1. Concepte generale
6.2. Invatarea bazata pe functii de utilitate
6.3. Invatarea valorilor actiunilor (Q-invatare)
6.4. Merode Monte Carlo
6.5. Mecanisme de selectie a actiunilor (epsilon-Greedy, SoftMax)
6.6. Algoritmul SARSA
6.7. Generalizare a invatarii prin Intarire
Bibliografie
1. Pop, H., F., Serban, G., Inteligenta Artificiala, Centrul de Formare Continua si Invatamant la Distanta, 2003
2. Harmon, M., Harmon, S., Reinforcement Learning - A Tutorial, Wright State University, www-anw.cs.umass.edu./~mharmon/rltutorial/frames. html, 2000
3. Weiss, G., Multiagent systems - A Modern Approach to Distributed Artificial Intelligence, The MIT Press, Cambridge, Massachusetts, London, 1999
4. Sutton, R.S., Barto, A.G., Reinforcement learning, The MIT Press Cambridge, Massachusetts, London, England, 1998
5. Russell, J.S., Learning agents for uncertain environments, Proceedings of the 11th annual Conference on Computational Learning theory, 1998, pp.101-103
6. Wooldridge, M., Agent-Based Software Engineering, Mitsubishi Electric Digital Library Group, London, 1997
7. Rao, A.S., Georgeff, M., BDI Agents: from theory to practice, Proceedings of the First International Conference on Multi-Agent Systems (ICMAS-95), pp.312-319, San Francisco, CA, 1995
8. Russell, J.S, Norvig, P., Artificial Intelligence- A Modern Approach, Prentice- Hall, Inc.,New Jersey, 1995
9. Shoham, Y., Agent-oriented programming, Artificial Intelligence, 60(1), pp.51-92, 1993
10. Fisher, M., Concurrent MetateM, A language for modeling reactive systems, Proceedings of Parallel Architectures and languages Europe (PARLE), Springer Verlag, 1993
11. Brooks, R.A,, A robot layered control system for a mobile robot, IEE Journal of Robotics and Automation, 2(1), pp.14-23, 1986
12. Winston, P.H., Artificial Intelligence, Addison Wesley, Reading, MA, 1984, 2nd ed.
Evaluare
Activitatea se incheie la sfarsitul semestrului printr-un colocviu
in care va fi prezentat un proiect realizat pe parcursul activitatii
de laborator (N1) si va avea loc o discutie pe marginea cunostintelor
predate la curs (N2). Nota finala se calculeaza ca (N1+N2)/2.