Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre la relation entre les algorithmes de gradient de politique et les valeurs V, expliquant comment les valeurs V peuvent être utilisées pour accélérer la convergence des algorithmes à travers des réseaux de critiques actifs. Il traite également du calcul des valeurs V dans un réseau séparé et du partage potentiel des neurones avec le réseau réel.