Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre le concept de règles à trois facteurs dans les algorithmes de gradient de politique, expliquant comment les traces d'éligibilité sont mises à jour en fonction de l'activité des neurones communs et proportionnelles à la récompense. Il traite également de la mise en œuvre de ces règles dans les systèmes biologiques et matériels.