Séance de cours

Exploration et exploitation

Séances de cours associées (24)

Graph Chatbot

Chattez avec Graph Search

Posez n’importe quelle question sur les cours, conférences, exercices, recherches, actualités, etc. de l’EPFL ou essayez les exemples de questions ci-dessous.

AVERTISSEMENT : Le chatbot Graph n'est pas programmé pour fournir des réponses explicites ou catégoriques à vos questions. Il transforme plutôt vos questions en demandes API qui sont distribuées aux différents services informatiques officiellement administrés par l'EPFL. Son but est uniquement de collecter et de recommander des références pertinentes à des contenus que vous pouvez explorer pour vous aider à répondre à vos questions.

Connectez-vous pour utiliser Chat avec Graph Search

Agents d'apprentissage profond : Renforcement de l'apprentissage

Explore les agents d'apprentissage profond dans l'apprentissage du renforcement, en mettant l'accent sur les approximations du réseau neuronal et les défis dans la formation des systèmes multiactifs.

Renforcement de l'apprentissage : Q-Learning

Couvre l'apprentissage Q en renforçant l'apprentissage, en explorant les valeurs d'action, les politiques et l'impact sociétal des algorithmes.

TD Learning : Apprentissage par différence temporelle

Couvre l'apprentissage par différence temporelle, les valeurs V, les valeurs d'état et les méthodes TD dans l'apprentissage par renforcement.

Apprentissage par renforcement: Diagrammes de sauvegarde

Présente le diagramme de sauvegarde en tant que représentation graphique clé dans l'apprentissage par renforcement.

Renforcement de l'apprentissage : bases et applications

Couvre les bases de l'apprentissage du renforcement, y compris les processus décisionnels de Markov et les méthodes de gradient des politiques, et explore les applications du monde réel et les avancées récentes.

Renforcement de l'apprentissage : bases et applications

Couvre les bases de l'apprentissage de renforcement, y compris l'apprentissage d'essai et d'erreur, l'apprentissage Q, le RL profond, et les applications dans le jeu et la planification.

Renforcement de l'apprentissage : Q-Learning

Couvre Q-Learning, un algorithme d'apprentissage par renforcement sans modèle, et son application à Tic-Tac-Toe avec des exemples et des quiz.

Apprentissage continu du renforcement : apprentissage automatique avancé

Explore les défis d'apprentissage en renforcement continu de l'état, l'estimation de la fonction de valeur, les gradients des politiques et l'apprentissage des politiques par l'exploration pondérée.

Apprentissage des différences temporelles MOOC: Neuro Robotics

Couvertures Renforcement Théorie de l'apprentissage, Q-Learning, et horizons multi-étapes.

Apprendre à trouver un objectif

Plonge dans une version biologiquement inspirée de l'apprentissage par renforcement, en se concentrant sur la navigation dans le labyrinthe et la mise en œuvre des neurones de stimulation.