Passer au contenu principal

Recherche

Afficher tous les résultats pour

Accueil

Séance de cours

Renforcement de l'apprentissage : Q-Learning

À propos
Confidentialité
Mentions légales

Copyright © 2026 EPFL, tous droits réservés

Graph Chatbot

Description

Cette séance de cours couvre Q-Learning, un algorithme d'apprentissage par renforcement sans modèle. Il explique comment Q-Learning estime les valeurs d'action, s'arrête à la convergence et se compare à Monte Carlo Estimation. L'application à Tic-Tac-Toe est discutée avec des exemples et des quiz.

Cette vidéo est disponible exclusivement sur Mediaspace pour un public restreint. Veuillez vous connecter à Mediaspace pour y accéder si vous disposez des autorisations nécessaires.

Regarder sur Mediaspace

Source officielle

https://mediaspace.epfl.ch/media/0_r1ynys4u

À propos de ce résultat

Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.

Séances de cours associées (29)

Agents d'apprentissage: Tradeoff Exploration-Exploitation

Explore le compromis exploration-exploitation dans l'apprentissage des effets inconnus des actions en utilisant des bandits multi-armés et Q-learning.

Agents d'apprentissage profond : Renforcement de l'apprentissage

Explore les agents d'apprentissage profond dans l'apprentissage du renforcement, en mettant l'accent sur les approximations du réseau neuronal et les défis dans la formation des systèmes multiactifs.

Véhicules autonomes: renseignement et perception

Explore l'intelligence, la perception et les applications de l'IA dans les véhicules autonomes, en mettant l'accent sur la pensée rationnelle et l'intelligence sociale.

Dynamique de l'apprentissage collectif : Exploitation de la similitude

S'insère dans la dynamique de l'apprentissage collectif avec exploitation de la similitude, couvrant l'apprentissage structuré, les cadres d'adaptation, la modélisation, la simulation et les résultats expérimentaux.

Perception : Approches fondées sur les données

Explore la perception dans l'apprentissage profond pour les véhicules autonomes, couvrant la classification d'image, les méthodes d'optimisation, et le rôle de la représentation dans l'apprentissage automatique.