Séance de cours

Mini-bateaux dans l'apprentissage de renforcement profond sur-et-hors-politique

Séances de cours associées (30)

Concepts d'apprentissage par renforcement

Couvre les concepts clés de l'apprentissage par renforcement, des réseaux neuronaux, du clustering et de l'apprentissage non supervisé, en mettant l'accent sur leurs applications et leurs défis.

Apprentissage profond pour les véhicules autonomes: Apprentissage

Explore l'apprentissage en apprentissage profond pour les véhicules autonomes, couvrant les modèles prédictifs, RNN, ImageNet, et l'apprentissage de transfert.

Deep Learning: Réseaux convolutionnels

Explore les réseaux neuronaux convolutionnels, la rétropropagation et la descente stochastique en gradient dans l'apprentissage profond.

Acquérir des données pour l'apprentissage : approches et défis modernes

Explore les approches et les défis modernes en matière d'acquisition de données pour l'apprentissage de contrôleurs optimaux au moyen de démonstrations et de méthodes axées sur les données.

Réseaux profonds et convolutifs : généralisation et optimisation

Explore les réseaux profonds et convolutifs, couvrant la généralisation, l'optimisation et les applications pratiques dans l'apprentissage automatique.

Raisonnement du programme d'aide à l'apprentissage

Explore la recherche de bugs, la vérification et l'utilisation d'approches aidées à l'apprentissage dans le raisonnement de programme, montrant des exemples comme le bug Heartbleed et le raisonnement bayésien différentiel.

Apprentissage par renforcement profond: techniques d'optimisation des politiques proximales

Couvre les techniques d'apprentissage par renforcement profond pour un contrôle continu, en se concentrant sur les méthodes d'optimisation des politiques proximales et leurs avantages par rapport aux approches de gradient de politique standard.

Navigation par Quadrotor basée sur la vision

Discute de la navigation par quadritor en utilisant l'apprentissage de renforcement profond et le contrôle de bas niveau, en mettant l'accent sur l'intelligence visuelle et la robustesse du modèle de regard.

Prédiction sans modèle dans l'apprentissage par renforcement: méthodes clés

Couvre les méthodes de prédiction sans modèle dans l'apprentissage par renforcement, en se concentrant sur Monte Carlo et les différences temporelles pour estimer les fonctions de valeur sans connaissance de la dynamique de transition.

Apprentissage par renforcement: Diagrammes de sauvegarde

Présente le diagramme de sauvegarde en tant que représentation graphique clé dans l'apprentissage par renforcement.