Couvre les fondamentaux de l'apprentissage automatique avancé, mettant l'accent sur les applications pratiques par des exercices et des projets interactifs.
Introduit Q-Learning, Deep Q-Learning, l'algorithme REINFORCE et Monte-Carlo Tree Search dans l'apprentissage par renforcement, aboutissant à AlphaGo Zero.
Explore les progrès de l'apprentissage robot pour l'autonomie à l'échelle, couvrant les défis de l'apprentissage profond, l'architecture efficace, les résultats d'analyse comparative et les implications sociétales.
Couvre les bases de l'apprentissage de renforcement, y compris l'apprentissage d'essai et d'erreur, l'apprentissage Q, le RL profond, et les applications dans le jeu et la planification.
Explore la perspective historique et le développement de l'algorithme AlphaGo, en se concentrant sur l'apprentissage automatique et les stratégies de jeu.
Discute des méthodes d'apprentissage par renforcement profond, en se concentrant sur les mini-batchs et les implications des techniques de formation on-policy et off-policy.
Introduit BulletArm, un référentiel de manipulation robotique open source et un cadre d'apprentissage couvrant les objectifs de conception, les tâches de référence et les algorithmes d'apprentissage.