Explore les sujets d'apprentissage avancés du renforcement, y compris les politiques, les fonctions de valeur, la récursion de Bellman et le contrôle de la TD sur les politiques.
Introduit l'apprentissage par renforcement, couvrant ses définitions, ses applications et ses fondements théoriques, tout en décrivant la structure et les objectifs du cours.
Explore l'application de l'apprentissage de renforcement pour enseigner à Pacman à jouer de façon autonome en utilisant les méthodes de gradient de politique et les processus de décision Markov.