Concept

Multi-agent reinforcement learning

Séances de cours associées (25)

Apprentissage par renforcement : TD Learning et les variantes de la LEP

Discute de l'apprentissage par renforcement, en se concentrant sur l'apprentissage par différence temporelle et les variations de l'algorithme SARSA.

Apprentissage par renforcement profond: techniques d'optimisation des politiques proximales

Couvre les techniques d'apprentissage par renforcement profond pour un contrôle continu, en se concentrant sur les méthodes d'optimisation des politiques proximales et leurs avantages par rapport aux approches de gradient de politique standard.

Q-Learning profond: DeepRL1.1

Couvre le Q-learning profond dans les réseaux neuronaux profonds, son application dans les jeux, la rétropropagation, les valeurs Q et les valeurs V.

Premiers pas vers l’apprentissage par renforcement profond

Explore le passage à l'apprentissage par renforcement profond à travers les réseaux neuronaux pour l'apprentissage direct des politiques, en contournant les valeurs Q et V.

Introduction à l'apprentissage par renforcement: concepts et applications

Introduit l'apprentissage par renforcement, couvrant ses concepts, ses applications et ses algorithmes clés.