Séance de cours

TD Learning : Apprentissage par différence temporelle

Dans cours

Amet consequat incididunt dolor eu amet nisi dolor commodo non sint Lorem magna quis commodo. Sunt nostrud reprehenderit anim mollit anim quis officia fugiat aliqua non anim incididunt esse. Ullamco veniam exercitation amet occaecat sunt quis nostrud anim. Est laboris enim nisi enim anim officia voluptate cupidatat do reprehenderit aute. Aliqua velit ipsum minim anim ut incididunt Lorem. Aliqua laborum nulla reprehenderit velit culpa pariatur et dolore veniam consequat est qui anim. Labore eu dolor laboris proident et nulla.

Description

Cette séance de cours présente l'apprentissage par différence temporelle (TD learning) et l'algorithme standard TD(0) pour estimer les valeurs dans l'apprentissage par renforcement. Il couvre le concept de valeurs V, les valeurs d'état et l'équation de Bellman pour la cohérence des valeurs des états voisins. La séance de cours explique également comment les méthodes TD explorent le graphique au fil du temps, comparent les valeurs aux pas de temps voisins et mettent à jour les valeurs en fonction de la «différence temporelle».

Connectez-vous pour regarder la vidéo

Enseignant

quis commodo

Elit mollit reprehenderit duis velit exercitation laboris occaecat et et ad magna aliqua. Excepteur voluptate excepteur ut ad irure sit do sunt velit excepteur excepteur incididunt dolor excepteur. Laboris in aliquip ut sit in ex sit esse cupidatat. Non aliqua ad irure Lorem sit irure quis fugiat exercitation voluptate. Dolor eiusmod officia enim qui ullamco eu elit eiusmod veniam veniam. Eu commodo amet quis irure minim aliquip nisi. Deserunt nulla fugiat sit sint officia pariatur id sunt reprehenderit laboris pariatur eu sunt id.

Source officielle

https://mediaspace.epfl.ch/media/0_eehycr7q

À propos de ce résultat

Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.

Séances de cours associées (36)

Graph Chatbot

Chattez avec Graph Search

Posez n’importe quelle question sur les cours, conférences, exercices, recherches, actualités, etc. de l’EPFL ou essayez les exemples de questions ci-dessous.

AVERTISSEMENT : Le chatbot Graph n'est pas programmé pour fournir des réponses explicites ou catégoriques à vos questions. Il transforme plutôt vos questions en demandes API qui sont distribuées aux différents services informatiques officiellement administrés par l'EPFL. Son but est uniquement de collecter et de recommander des références pertinentes à des contenus que vous pouvez explorer pour vous aider à répondre à vos questions.

Connectez-vous pour utiliser Chat avec Graph Search