Séance de cours

Règles à trois facteurs: DeepRL1.5A

Description

Cette séance de cours couvre le concept de règles à trois facteurs dans les algorithmes de gradient de politique, expliquant comment les traces d'éligibilité sont mises à jour en fonction de l'activité des neurones communs et proportionnelles à la récompense. Il traite également de la mise en œuvre de ces règles dans les systèmes biologiques et matériels.

À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.