Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours introduit le concept de renforcement de l'apprentissage, en mettant l'accent sur l'apprentissage Q comme méthode sans modèle pour les agents à apprendre par essai et erreur. Il couvre l'échange exploration-exploitation, les valeurs d'action et les politiques. La séance de cours traite également des propriétés de convergence de Q-Learning, de l'importance de l'IA compatible avec l'être humain et de l'impact des algorithmes sur la société.