Acteur-Critique Architecture et Avantage-Acteur-Critique

À propos
Confidentialité
Mentions légales

Graph Chatbot

Séances de cours associées (29)

Page 3 sur 3

Introduction à l'apprentissage par renforcement: concepts et applications clés

Introduit l'apprentissage par renforcement, couvrant ses définitions, ses applications et ses fondements théoriques, tout en décrivant la structure et les objectifs du cours.

Mathématiques des données : modèles et apprentissage

Explore les modèles, les paradigmes d'apprentissage et les applications en mathématiques des données.

Tricks stochastiques Softmax

Explore les astuces stochastiques softmax, la reparamétrisation et l'argmax, en abordant les défis dans l'estimation des attentes et la variance des gradients.

Séance de cours interactive : Apprentissage du renforcement

Explore les sujets d'apprentissage avancés du renforcement, y compris les politiques, les fonctions de valeur, la récursion de Bellman et le contrôle de la TD sur les politiques.

Apprentissage par renforcement: Diagrammes de sauvegarde

Présente le diagramme de sauvegarde en tant que représentation graphique clé dans l'apprentissage par renforcement.

Structures dans l'optimisation non convexe

Couvre l'optimisation non convexe, les problèmes d'apprentissage profond, la descente stochastique des gradients, les méthodes d'adaptation et les architectures réseau neuronales.

Renforcement de l'apprentissage : bases et applications

Couvre les bases de l'apprentissage de renforcement, y compris l'apprentissage d'essai et d'erreur, l'apprentissage Q, le RL profond, et les applications dans le jeu et la planification.

Principes fondamentaux de l'apprentissage par renforcement

Plongez dans les bases de l'apprentissage par renforcement, en discutant des états, des actions, des récompenses, des politiques et des applications de réseaux neuronaux.

Deep Learning : généralisation et optimisation

Plongez dans les défis et les avantages de l'apprentissage profond, en soulignant la transition vers les réseaux neuronaux convolutifs et l'impact de la largeur du réseau sur le paysage des pertes.