Séance de cours
Cette séance de cours couvre l'application de l'apprentissage du renforcement pour enseigner à Pacman à jouer de manière autonome par essai et erreur, en mettant l'accent sur les méthodes de gradient de politique, les processus de décision Markov, et les défis rencontrés dans l'optimisation de l'espace de paramètre pour un apprentissage efficace.
Cette vidéo est disponible exclusivement sur Mediaspace pour un public restreint. Veuillez vous connecter à Mediaspace pour y accéder si vous disposez des autorisations nécessaires.
Regarder sur Mediaspace