Séance de cours

Apprentissage par renforcement basé sur un modèle ou sans modèle

Dans cours
DEMO: labore nulla enim ipsum
Eiusmod magna eu sunt nisi laborum dolore nisi et et. Officia consectetur reprehenderit consectetur aliqua nulla. Proident tempor nostrud eiusmod et proident sunt nostrud officia excepteur tempor nostrud aliqua.
Connectez-vous pour voir cette section
Description

Cette séance de cours explore la différence entre lapprentissage de renforcement basé sur un modèle et lapprentissage sans modèle, en se concentrant sur la façon dont lagent sadapte lorsque lobjectif change, la définition de chaque approche et les avantages de la RL basée sur un modèle, tels que la capacité de se réadapter pour récompenser les changements et planifier les actions futures dans lesprit. La séance de cours traite également de la mise en œuvre de Chess and Go en tant que systèmes basés sur des modèles sans avoir besoin d'apprendre le modèle.

Enseignant
aliqua ea
Fugiat ipsum consequat minim exercitation minim id minim et labore commodo proident ipsum. Nostrud magna nulla ex qui enim qui. Culpa laborum laborum dolore in consectetur magna pariatur.
Connectez-vous pour voir cette section
À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.
Séances de cours associées (31)
Agents intelligents : prendre des décisions et planifier
Couvre les agents intelligents, la prise de décision, la planification, l'apprentissage automatique et la théorie des jeux.
Systèmes multiagents distribués : coordination et apprentissage
Explore la coordination et l'apprentissage dans des systèmes multiagents distribués, couvrant les lois sociales, l'échange de tâches, la satisfaction des contraintes et les algorithmes de coordination.
Systèmes multiagents : planification et coordination
Explore l'utilisation de systèmes multi-agents pour la planification, la coordination et l'attribution de tâches entre des agents hétérogènes.
Agents d'apprentissage: Tradeoff Exploration-Exploitation
Explore le compromis exploration-exploitation dans l'apprentissage des effets inconnus des actions en utilisant des bandits multi-armés et Q-learning.
Agents réactifs : processus de décision
Explore les agents réactifs et les processus décisionnels, couvrant des sujets tels que les processus décisionnels de Markov et les agents en temps réel.
Afficher plus

Graph Chatbot

Chattez avec Graph Search

Posez n’importe quelle question sur les cours, conférences, exercices, recherches, actualités, etc. de l’EPFL ou essayez les exemples de questions ci-dessous.

AVERTISSEMENT : Le chatbot Graph n'est pas programmé pour fournir des réponses explicites ou catégoriques à vos questions. Il transforme plutôt vos questions en demandes API qui sont distribuées aux différents services informatiques officiellement administrés par l'EPFL. Son but est uniquement de collecter et de recommander des références pertinentes à des contenus que vous pouvez explorer pour vous aider à répondre à vos questions.