Séance de cours

Mini-bateaux dans l'apprentissage de renforcement profond sur-et-hors-politique

Description

Cette séance de cours couvre l'importance des mini-batches dans l'apprentissage par renforcement profond, expliquant comment éviter la corrélation de données en utilisant des tampons de relecture ou plusieurs acteurs. Il aborde les méthodes on-policy et off-policy, telles que Q-Learning et Advantage Actor-Critic, ainsi que les avantages et les inconvénients de chaque approche.

À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.