Séance de cours

Renforcement de l'apprentissage : Q-Learning

Dans cours

EE-411: Fundamentals of inference and learning

This is an introductory course in the theory of statistics, inference, and machine learning, with an emphasis on theoretical understanding & practical exercises. The course will combine, and alternat

Description

Cette séance de cours couvre le concept de Q-Learning, qui consiste à trouver la politique optimale en mettant à jour itérativement une table Q basée sur des récompenses. Il explique comment représenter la table Q, définir la fonction de coût et apprendre les valeurs Q optimales en utilisant la descente de gradient. La séance de cours se penche également sur Deep Q-Learning, où un réseau de neurones se rapproche des valeurs Q, et explore les défis de la gestion de grands espaces d'état dans des jeux comme Atari. En outre, il discute de l'algorithme REINFORCE pour les méthodes de gradient de politique et Monte-Carlo Tree Search pour la prise de décision. La présentation se termine par un aperçu d’AlphaGo Zero, une étape importante dans l’apprentissage du renforcement. Divers concepts tels que l'équation de Bellman, les réseaux de valeur et les réseaux de politiques sont élucidés.

Enseignant

Florent Gérard Krzakala

Source officielle

Séances de cours associées (29)

Apprentissage par renforcement profond basé sur des modèles: Monte Carlo Tree Search

Explore l'apprentissage par renforcement profond basé sur des modèles, en se concentrant sur Monte Carlo Tree Search et ses applications dans les stratégies de jeu et les processus décisionnels.

Perception : Approches fondées sur les données

Explore la perception dans l'apprentissage profond pour les véhicules autonomes, couvrant la classification d'image, les méthodes d'optimisation, et le rôle de la représentation dans l'apprentissage automatique.

Les principes fondamentaux de l'apprentissage profond

Couvre les fondamentaux de l'apprentissage profond, des neurones artificiels aux réseaux modernes.

Les neurosciences et l'IA : combler l'écart

Explore l'écart entre l'intelligence artificielle et l'intelligence humaine grâce à des modèles et des algorithmes inspirés par les neurosciences.

Systèmes de connaissances non conceptuels

Plonge dans l'impact de l'apprentissage profond sur les systèmes de connaissances non conceptuels et les progrès dans les transformateurs et les réseaux antagonistes génératifs.

Afficher plus