Séance de cours

Apprentissage des différences temporelles

Renforcement de l'apprentissage : Q-Learning

Couvre Q-Learning, un algorithme d'apprentissage par renforcement sans modèle, et son application à Tic-Tac-Toe avec des exemples et des quiz.

Comparaison des traces de SARSA et d'admissibilité

Présente un quiz comparant l'algorithme SARSA en n-étape avec SARSA en utilisant des traces d'admissibilité.

Théorie du contrôle optimal : les bases

Couvre les principes fondamentaux de la théorie du contrôle optimal, en se concentrant sur la définition des OCP, l'existence de solutions, les critères de performance, les contraintes physiques et le principe d'optimalité.

Agents d'apprentissage: Tradeoff Exploration-Exploitation

Explore le compromis exploration-exploitation dans l'apprentissage des effets inconnus des actions en utilisant des bandits multi-armés et Q-learning.

Dynamique de l'apprentissage collectif : Exploitation de la similitude

S'insère dans la dynamique de l'apprentissage collectif avec exploitation de la similitude, couvrant l'apprentissage structuré, les cadres d'adaptation, la modélisation, la simulation et les résultats expérimentaux.

Premiers pas vers l’apprentissage par renforcement profond

Explore le passage à l'apprentissage par renforcement profond à travers les réseaux neuronaux pour l'apprentissage direct des politiques, en contournant les valeurs Q et V.

Acquérir des données pour l'apprentissage : approches et défis modernes

Explore les approches et les défis modernes en matière d'acquisition de données pour l'apprentissage de contrôleurs optimaux au moyen de démonstrations et de méthodes axées sur les données.

Éléments du renforcement de l'apprentissage

Introduit les éléments fondamentaux de l'apprentissage du renforcement et démontre leur application avec le système Acrobot.

Apprentissage et contrôle en toute sécurité

Explore l'apprentissage sûr, le contrôle, la coordination multi-agents, et la convergence d'équilibre Nash dans les systèmes intelligents.

Renforcement de l'apprentissage : bases et applications

Couvre les bases de l'apprentissage de renforcement, y compris l'apprentissage d'essai et d'erreur, l'apprentissage Q, le RL profond, et les applications dans le jeu et la planification.