Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours explore une version biologiquement inspirée de la tâche classique de l'apprentissage par renforcement, où l'instructeur discute de l'hippocampe, place des cellules dans le cerveau du rat, le Morris Water Maze, modélise une tâche de labyrinthe, la navigation de labyrinthe avec Actor-Critic, et la mise en œuvre des neurones de spiking. La séance de cours se termine par un résumé reliant l'apprentissage TD dans un cadre acteur-critique aux fonctions cérébrales et présentant la possibilité d'apprendre dans quelques essais avec une représentation sensorielle bien adaptée.