Séance de cours

Renforcement de l'apprentissage pour Pacman

Description

Cette séance de cours couvre l'application de l'apprentissage du renforcement pour enseigner à Pacman à jouer de manière autonome par essai et erreur, en mettant l'accent sur les méthodes de gradient de politique, les processus de décision Markov, et les défis rencontrés dans l'optimisation de l'espace de paramètre pour un apprentissage efficace.

À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.