Discute des techniques avancées d'apprentissage par renforcement, en se concentrant sur des méthodes profondes et robustes, y compris des cadres d'acteur-critique et des stratégies d'apprentissage contradictoire.
Explore les sujets d'apprentissage avancés du renforcement, y compris les politiques, les fonctions de valeur, la récursion de Bellman et le contrôle de la TD sur les politiques.
Explore la perception dans l'apprentissage profond pour les véhicules autonomes, couvrant la classification d'image, les méthodes d'optimisation, et le rôle de la représentation dans l'apprentissage automatique.
Discute de la navigation par quadritor en utilisant l'apprentissage de renforcement profond et le contrôle de bas niveau, en mettant l'accent sur l'intelligence visuelle et la robustesse du modèle de regard.
Couvre les techniques d'apprentissage par renforcement profond pour un contrôle continu, en se concentrant sur les méthodes d'optimisation des politiques proximales et leurs avantages par rapport aux approches de gradient de politique standard.
Couvre les méthodes de gradient de politique, en mettant l'accent sur l'apprentissage par l'action directe et l'optimisation des récompenses dans l'apprentissage par renforcement.
Introduit les bases de la science des données, couvrant les arbres de décision, les progrès de l'apprentissage automatique et l'apprentissage par renforcement profond.
Couvre les méthodes de prédiction sans modèle dans l'apprentissage par renforcement, en se concentrant sur Monte Carlo et les différences temporelles pour estimer les fonctions de valeur sans connaissance de la dynamique de transition.
Explore les robots d'entraînement en renforçant l'apprentissage et l'apprentissage de la démonstration, mettant en évidence les défis de l'interaction homme-robot et de la collecte de données.