Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre l'application de l'apprentissage du renforcement pour enseigner à Pacman à jouer de manière autonome par essai et erreur, en mettant l'accent sur les méthodes de gradient de politique, les processus de décision Markov, et les défis rencontrés dans l'optimisation de l'espace de paramètre pour un apprentissage efficace.