Séance de cours

Modélisation de l'espace d'entrée

Description

Cette séance de cours traite des défis de la représentation des espaces d'entrée dans l'apprentissage par renforcement, où les méthodes tabulaires deviennent impraticables en raison du grand nombre d'états. L'instructeur explique comment les réseaux de neurones et les réseaux radiaux peuvent être utilisés pour modéliser des espaces d'entrée continus, en utilisant des exemples tels que Backgammon et Mountain Car. La séance de cours couvre la transition de l'apprentissage TD tabulaire aux représentations de réseau neuronal, y compris l'utilisation de fonctions d'erreur et de gradients. Diverses variantes d'algorithmes d'apprentissage TD sont explorées, soulignant l'importance d'utiliser des réseaux de neurones pour généraliser les valeurs Q dans les espaces continus.

À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.