Séance de cours

Bases d'apprentissage de renforcement

Séances de cours associées (40)

Graph Chatbot

Chattez avec Graph Search

Posez n’importe quelle question sur les cours, conférences, exercices, recherches, actualités, etc. de l’EPFL ou essayez les exemples de questions ci-dessous.

AVERTISSEMENT : Le chatbot Graph n'est pas programmé pour fournir des réponses explicites ou catégoriques à vos questions. Il transforme plutôt vos questions en demandes API qui sont distribuées aux différents services informatiques officiellement administrés par l'EPFL. Son but est uniquement de collecter et de recommander des références pertinentes à des contenus que vous pouvez explorer pour vous aider à répondre à vos questions.

Connectez-vous pour utiliser Chat avec Graph Search

Apprentissage profond pour les véhicules autonomes: Apprentissage

Explore l'apprentissage en apprentissage profond pour les véhicules autonomes, couvrant les modèles prédictifs, RNN, ImageNet, et l'apprentissage de transfert.

Renforcement de l'apprentissage pour Pacman

Explore l'application de l'apprentissage de renforcement pour enseigner à Pacman à jouer de façon autonome en utilisant les méthodes de gradient de politique et les processus de décision Markov.

Stratégies d'exploration des robots de longue durée

Explore les stratégies d'exploration de robots à longue distance dans des espaces d'action continue pour la recherche multi-objets.

TD Learning : Apprentissage par différence temporelle

Couvre l'apprentissage par différence temporelle, les valeurs V, les valeurs d'état et les méthodes TD dans l'apprentissage par renforcement.

Agents intelligents : caractéristiques et applications

Couvre les caractéristiques, les applications et les défis des agents intelligents dans les systèmes logiciels, en mettant l'accent sur leur rôle dans la prise de décisions autonomes et la coordination avec d'autres agents.

Apprentissage par renforcement basé sur un modèle ou sans modèle

Compare l'apprentissage par renforcement basé sur un modèle et sans modèle, en soulignant les avantages du premier pour s'adapter aux changements de récompense et planifier les actions futures.

Apprentissage par renforcement : algorithme SARSA

Explore l'algorithme SARSA pour l'apprentissage par renforcement, en mettant l'accent sur la mise à jour des valeurs Q et l'importance de l'exploration dans l'apprentissage par récompenses.

Méthodes Monte-Carlo pour l'apprentissage par renforcement

Explore les méthodes de Monte-Carlo pour l'apprentissage par renforcement, en les comparant avec les méthodes TD et en mettant l'accent sur l'efficacité des méthodes TD dans la propagation de l'information.

Exploration et exploitation MOOC: Neuro Robotics

Couvre la théorie du renforcement de l'apprentissage, en mettant l'accent sur le dilemme de l'exploration et de l'exploitation et sur les stratégies visant à équilibrer l'exploration et l'exploitation.

Quiz : méthodes de gradient de politique

Présente un quiz discutant des revendications liées aux algorithmes d'apprentissage par renforcement.