Introduit les bases de la science des données, couvrant les arbres de décision, les progrès de l'apprentissage automatique et l'apprentissage par renforcement profond.
Discute des techniques avancées d'apprentissage par renforcement, en se concentrant sur des méthodes profondes et robustes, y compris des cadres d'acteur-critique et des stratégies d'apprentissage contradictoire.
Couvre les bases de l'apprentissage de renforcement, y compris l'apprentissage d'essai et d'erreur, l'apprentissage Q, le RL profond, et les applications dans le jeu et la planification.
Introduit Q-Learning, Deep Q-Learning, l'algorithme REINFORCE et Monte-Carlo Tree Search dans l'apprentissage par renforcement, aboutissant à AlphaGo Zero.
Explore les défis de l'apprentissage profond pour les véhicules autonomes, en mettant l'accent sur la modélisation du comportement social et la prévision de trajectoire réalisable.