Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours de l'instructeur aborde le thème des agents d'apprentissage profond dans l'apprentissage du renforcement. Il s'articule autour de concepts tels que l'apprentissage en profondeur du renforcement, l'apprentissage hors politique, l'apprentissage multi-agents du renforcement et les défis auxquels sont confrontés les agents de formation. La séance de cours traite de l'utilisation des réseaux neuraux pour rapprocher les tables Q, les valeurs et les politiques, ce qui permet de renforcer l'apprentissage sans modèle. Il explore l'architecture acteur-critique, l'apprentissage multitâche et l'optimisation de la politique proximale. L'importance de la généralisation pour l'apprentissage dans des états et des actions invisibles est soulignée, ainsi que la complexité des contextes multiactifs et les faiblesses potentielles des simulations de formation.