Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours introduit le concept d'espaces d'état et d'action continus dans le renforcement de l'apprentissage, en mettant l'accent sur les méthodes de transfert des techniques des espaces discrets aux espaces continus. Les sujets abordés comprennent l'approximation paramétrique, l'algorithme SARSA, les traces d'admissibilité et les résultats de la tâche de voiture de montagne.