Séance de cours

Apprentissage par renforcement: problèmes de bandits

Dans cours

Aliqua nisi ex amet do do ad ex. Sint ullamco consectetur laborum id sint quis Lorem fugiat elit. Non ullamco velit Lorem voluptate voluptate consequat ea mollit fugiat.

Description

Cette séance de cours couvre une preuve en deux lignes de la convergence dans l'attente de la règle d'apprentissage utilisée dans l'apprentissage par renforcement avec un horizon en 1 étape, démontrant que l'estimation empirique de la valeur Q converge vers la valeur Q réelle.

Connectez-vous pour regarder la vidéo

Enseignant

non commodo velit elit

Nulla ullamco ullamco cupidatat veniam cupidatat nulla nulla eiusmod anim culpa. Ipsum aliqua esse nisi sunt culpa sunt Lorem sunt proident. Duis mollit sunt veniam ea incididunt duis deserunt amet quis laborum ex. Irure mollit velit sunt ex officia veniam qui eu pariatur velit aliquip eu exercitation. Laborum eu ad Lorem consequat reprehenderit. Ut consectetur culpa aute nisi in labore.

Source officielle

https://mediaspace.epfl.ch/media/0_zbydbzir

À propos de ce résultat

Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.

Séances de cours associées (32)

Graph Chatbot

Chattez avec Graph Search

Posez n’importe quelle question sur les cours, conférences, exercices, recherches, actualités, etc. de l’EPFL ou essayez les exemples de questions ci-dessous.

AVERTISSEMENT : Le chatbot Graph n'est pas programmé pour fournir des réponses explicites ou catégoriques à vos questions. Il transforme plutôt vos questions en demandes API qui sont distribuées aux différents services informatiques officiellement administrés par l'EPFL. Son but est uniquement de collecter et de recommander des références pertinentes à des contenus que vous pouvez explorer pour vous aider à répondre à vos questions.

Connectez-vous pour utiliser Chat avec Graph Search