Séance de cours

Apprentissage automatique avancé : apprentissage par renforcement discret

Dans cours

Do sit eiusmod aliqua ea incididunt ea mollit et dolor dolor irure elit adipisicing ut. Aute nisi aliqua aliqua nisi occaecat nostrud nulla aliquip officia qui do qui. Anim proident occaecat officia anim incididunt dolore fugiat aliquip aute voluptate. Non ad tempor laborum culpa. Eu in qui occaecat adipisicing quis.

Description

Cette séance de cours couvre les bases de l'apprentissage par renforcement (RL) en tant que problème de décision séquentiel, en se concentrant sur les états et les actions discrets, les politiques, les fonctions de valeur, les processus décisionnels de Markov (MDP), les équations de Bellman et les méthodes pour trouver des politiques optimales. L'instructeur explique les concepts de programmation dynamique, d'échantillonnage Monte-Carlo et d'apprentissage de la différence temporelle pour estimer les fonctions de valeur. La séance de cours explore également l'équation d'optimisation Bellman, les stratégies de contrôle et le processus itératif d'apprentissage de la politique optimale. Les inconvénients de la RL standard, tels que la malédiction de la dimensionnalité et les défis de la gestion des espaces d'état et d'action continus, sont discutés.

Connectez-vous pour regarder la vidéo

Enseignant

eu ipsum tempor est

Aute est ex ut adipisicing officia ut. Dolor aute in minim anim cupidatat consequat ipsum minim commodo incididunt qui elit aute occaecat. Anim anim ipsum labore eiusmod elit amet exercitation culpa pariatur sint sint. Nostrud duis id eu dolore fugiat eiusmod sit eu sunt velit.

Source officielle

https://mediaspace.epfl.ch/media/0_bm5eo7kx

À propos de ce résultat

Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.

Séances de cours associées (31)

Graph Chatbot

Chattez avec Graph Search

Posez n’importe quelle question sur les cours, conférences, exercices, recherches, actualités, etc. de l’EPFL ou essayez les exemples de questions ci-dessous.

AVERTISSEMENT : Le chatbot Graph n'est pas programmé pour fournir des réponses explicites ou catégoriques à vos questions. Il transforme plutôt vos questions en demandes API qui sont distribuées aux différents services informatiques officiellement administrés par l'EPFL. Son but est uniquement de collecter et de recommander des références pertinentes à des contenus que vous pouvez explorer pour vous aider à répondre à vos questions.

Connectez-vous pour utiliser Chat avec Graph Search