Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours explore la différence entre lapprentissage de renforcement basé sur un modèle et lapprentissage sans modèle, en se concentrant sur la façon dont lagent sadapte lorsque lobjectif change, la définition de chaque approche et les avantages de la RL basée sur un modèle, tels que la capacité de se réadapter pour récompenser les changements et planifier les actions futures dans lesprit. La séance de cours traite également de la mise en œuvre de Chess and Go en tant que systèmes basés sur des modèles sans avoir besoin d'apprendre le modèle.