Séances de cours associées à Relation de l'équation de SARSA et de Bellman

Apprentissage par renforcement : TD Learning et les variantes de la LEP

Discute de l'apprentissage par renforcement, en se concentrant sur l'apprentissage par différence temporelle et les variations de l'algorithme SARSA.

Mini-bateaux dans l'apprentissage de renforcement profond sur-et-hors-politique

Explique l'importance des mini-lots dans l'apprentissage par renforcement profond et les différences entre les méthodes on-policy et off-policy.

Séance de cours interactive : Apprentissage du renforcement

Explore les sujets d'apprentissage avancés du renforcement, y compris les politiques, les fonctions de valeur, la récursion de Bellman et le contrôle de la TD sur les politiques.

Apprentissage par renforcement profond: mini-bateaux et méthodes politiques

Discute des méthodes d'apprentissage par renforcement profond, en se concentrant sur les mini-batchs et les implications des techniques de formation on-policy et off-policy.

Introduction à l'apprentissage par renforcement: concepts et applications

Introduit l'apprentissage par renforcement, couvrant ses concepts, ses applications et ses algorithmes clés.

Renforcement de l'apprentissage : Q-Learning

Couvre l'apprentissage Q en renforçant l'apprentissage, en explorant les valeurs d'action, les politiques et l'impact sociétal des algorithmes.

Descente progressive

Couvre le concept de descente de gradient dans les cas scalaires, en se concentrant sur la recherche du minimum d'une fonction en se déplaçant itérativement dans la direction du gradient négatif.

Évolution de la politique migratoire: analyse et évaluation

Couvre les missions de suivi de l'évolution de la politique migratoire et d'évaluation de son impact.

Prédiction sans modèle dans l'apprentissage par renforcement: méthodes clés

Couvre les méthodes de prédiction sans modèle dans l'apprentissage par renforcement, en se concentrant sur Monte Carlo et les différences temporelles pour estimer les fonctions de valeur sans connaissance de la dynamique de transition.

Renforcement de l'apprentissage : bases et applications

Couvre les bases de l'apprentissage de renforcement, y compris l'apprentissage d'essai et d'erreur, l'apprentissage Q, le RL profond, et les applications dans le jeu et la planification.

Exposé de recherche : Évolution des politiques en matière de gouvernance des migrations

Explique la mission de recherche du deuxième semestre sur l'analyse de l'évolution des politiques en matière de gouvernance des migrations.

Bandits multibras : exploration vs exploitation

Explore l'équilibre entre l'exploration et l'exploitation dans les algorithmes de bandit multi-bras.

Politique, personnes, technologie: l'avenir de la mobilité

Explore l'avenir de la mobilité par le biais des politiques, des personnes et de la technologie.

Gouvernance innovante des grands systèmes urbains

S'engager dans la gouvernance des grands systèmes urbains et l'avenir de la mobilité, en s'attaquant aux défis et aux nouveaux modèles d'affaires.

Vers des composites durables

Explore des solutions composites durables, y compris le recyclage, les stratégies de fin de vie et le stockage de l'hydrogène.

Exécution multi-requêtes évolutive : approche d'apprentissage du renforcement

Présente une nouvelle approche pour l'exécution scalable multi-query en utilisant l'apprentissage du renforcement.

Programmation dynamique : contrôle optimal

Explore la programmation dynamique pour un contrôle optimal, en se concentrant sur la stabilité, la politique stationnaire et les solutions récursives.

Deep Learning pour les véhicules autonomes

Explore l'apprentissage profond pour les véhicules autonomes, couvrant la perception, l'action et les prévisions sociales dans le contexte des technologies de capteurs et des considérations éthiques.

Apprentissage profond pour les véhicules autonomes: Apprentissage

Explore l'apprentissage en apprentissage profond pour les véhicules autonomes, couvrant les modèles prédictifs, RNN, ImageNet, et l'apprentissage de transfert.

Agents d'apprentissage profond : Renforcement de l'apprentissage

Explore les agents d'apprentissage profond dans l'apprentissage du renforcement, en mettant l'accent sur les approximations du réseau neuronal et les défis dans la formation des systèmes multiactifs.