Séance de cours

Apprentissage automatique avancé : apprentissage par renforcement discret

Dans cours

Consectetur exercitation reprehenderit amet labore. Velit labore sint aliquip do occaecat in. Reprehenderit minim dolor pariatur incididunt aliqua. Magna mollit velit sint sit elit culpa aute nulla laborum. Aliquip dolore exercitation ex qui.

Description

Cette séance de cours couvre les bases de l'apprentissage par renforcement (RL) en tant que problème de décision séquentiel, en se concentrant sur les états et les actions discrets, les politiques, les fonctions de valeur, les processus décisionnels de Markov (MDP), les équations de Bellman et les méthodes pour trouver des politiques optimales. L'instructeur explique les concepts de programmation dynamique, d'échantillonnage Monte-Carlo et d'apprentissage de la différence temporelle pour estimer les fonctions de valeur. La séance de cours explore également l'équation d'optimisation Bellman, les stratégies de contrôle et le processus itératif d'apprentissage de la politique optimale. Les inconvénients de la RL standard, tels que la malédiction de la dimensionnalité et les défis de la gestion des espaces d'état et d'action continus, sont discutés.

Connectez-vous pour regarder la vidéo

Enseignant

occaecat ad

Ad adipisicing aute ut in laboris excepteur laboris. Est enim pariatur aliqua magna pariatur. Minim ut non non laboris excepteur quis non velit ex sunt do cupidatat aliqua. Dolore cupidatat aliquip commodo nisi nisi magna tempor nulla.

Connectez-vous pour voir cette section

Source officielle

https://mediaspace.epfl.ch/media/0_bm5eo7kx

À propos de ce résultat

Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.

Séances de cours associées (31)

Graph Chatbot

Chattez avec Graph Search

Posez n’importe quelle question sur les cours, conférences, exercices, recherches, actualités, etc. de l’EPFL ou essayez les exemples de questions ci-dessous.

AVERTISSEMENT : Le chatbot Graph n'est pas programmé pour fournir des réponses explicites ou catégoriques à vos questions. Il transforme plutôt vos questions en demandes API qui sont distribuées aux différents services informatiques officiellement administrés par l'EPFL. Son but est uniquement de collecter et de recommander des références pertinentes à des contenus que vous pouvez explorer pour vous aider à répondre à vos questions.

Connectez-vous pour utiliser Chat avec Graph Search