Introduction à l'apprentissage par renforcement: concepts et applications clés

À propos
Confidentialité
Mentions légales

Graph Chatbot

Séances de cours associées (28)

Page 3 sur 3

Dégradation des politiques et méthodes critiques pour les acteurs : les traces de l’admissibilité expliquées

Discute du gradient des politiques et des méthodes acteurs-critiques, en se concentrant sur les traces d'éligibilité et leur application dans les tâches d'apprentissage de renforcement.

Apprentissage par projet dans les communications et la robotique

Introduit un cours basé sur des projets en communication et en robotique, mettant l'accent sur des projets pratiques et un apprentissage indépendant pour préparer les étudiants à relever des défis du monde réel.

Problème de vente d'actifs

Explore le problème de la vente d'actifs pour maximiser la récompense à long terme sans délai.

Apprentissage du modèle de mélange gaussien cohérent sur le plan physique

Explore les modèles de mélange gaussien compatibles physiques pour le contrôle des robots et l'apprentissage de la trajectoire.

Renforcement de l'apprentissage pour Pacman

Explore l'application de l'apprentissage de renforcement pour enseigner à Pacman à jouer de façon autonome en utilisant les méthodes de gradient de politique et les processus de décision Markov.

Agents d'apprentissage: Tradeoff Exploration-Exploitation

Explore le compromis exploration-exploitation dans l'apprentissage des effets inconnus des actions en utilisant des bandits multi-armés et Q-learning.

Optimisation avec contraintes : théorie et applications

Couvre la théorie et les applications de l'optimisation avec des contraintes, y compris les concepts clés et les méthodes numériques.

Agents d'apprentissage profond : Renforcement de l'apprentissage

Explore les agents d'apprentissage profond dans l'apprentissage du renforcement, en mettant l'accent sur les approximations du réseau neuronal et les défis dans la formation des systèmes multiactifs.