Explore l'apprentissage par renforcement profond basé sur des modèles, en se concentrant sur Monte Carlo Tree Search et ses applications dans les stratégies de jeu et les processus décisionnels.
Explore la perspective historique et le développement de l'algorithme AlphaGo, en se concentrant sur l'apprentissage automatique et les stratégies de jeu.
Introduit Q-Learning, Deep Q-Learning, l'algorithme REINFORCE et Monte-Carlo Tree Search dans l'apprentissage par renforcement, aboutissant à AlphaGo Zero.
Couvre la classification des images, le clustering et les techniques d'apprentissage automatique telles que la réduction de la dimensionnalité et l'apprentissage par renforcement.
Couvre les bases de l'apprentissage du renforcement, y compris les processus décisionnels de Markov et les méthodes de gradient des politiques, et explore les applications du monde réel et les avancées récentes.