Séance de cours

Renforcement de l'apprentissage pour Pacman

Description

Cette séance de cours porte sur l'application de l'apprentissage du renforcement pour enseigner à Pacman à jouer de manière autonome, en mettant l'accent sur les méthodes de gradient politique et les processus de décision Markov. Il examine les défis à relever, comme l'espace grand paramètre, et propose des solutions comme la paramétrisation linéaire logarithmique et la vectorisation.

À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.