TD Learning : Apprentissage par différence temporelle

À propos
Confidentialité
Mentions légales

Graph Chatbot

Séances de cours associées (30)

Page 3 sur 3

Apprentissage automatique avancé : apprentissage par renforcement discret

Présente les bases de l'apprentissage par renforcement, couvrant les états discrets, les actions, les politiques, les fonctions de valeur, les PDM et les politiques optimales.

Principes fondamentaux de l'apprentissage par renforcement

Plongez dans les bases de l'apprentissage par renforcement, en discutant des états, des actions, des récompenses, des politiques et des applications de réseaux neuronaux.

Exposé de recherche : Évolution des politiques en matière de gouvernance des migrations

Explique la mission de recherche du deuxième semestre sur l'analyse de l'évolution des politiques en matière de gouvernance des migrations.

Bandits multibras : exploration vs exploitation

Explore l'équilibre entre l'exploration et l'exploitation dans les algorithmes de bandit multi-bras.

Problèmes d'horizon infini : formulation et complexité

Couvre les problèmes d'horizon infini dans les processus de probabilité appliquée et stochastiques.

Apprentissage par renforcement: Diagrammes de sauvegarde

Présente le diagramme de sauvegarde en tant que représentation graphique clé dans l'apprentissage par renforcement.

Politique, personnes, technologie: l'avenir de la mobilité

Explore l'avenir de la mobilité par le biais des politiques, des personnes et de la technologie.

Gouvernance innovante des grands systèmes urbains

S'engager dans la gouvernance des grands systèmes urbains et l'avenir de la mobilité, en s'attaquant aux défis et aux nouveaux modèles d'affaires.

Vers des composites durables

Explore des solutions composites durables, y compris le recyclage, les stratégies de fin de vie et le stockage de l'hydrogène.

Concepts d'apprentissage par renforcement

Couvre les concepts clés de l'apprentissage par renforcement, des réseaux neuronaux, du clustering et de l'apprentissage non supervisé, en mettant l'accent sur leurs applications et leurs défis.