Séance de cours

Bandits à bras multiples: Limite supérieure de confiance

Description

Cette séance de cours couvre le concept de bandits multi-bras, en se concentrant sur l'algorithme Upper Confidence Bound pour équilibrer l'exploration et l'exploitation. Les sujets abordés comprennent les intervalles de confiance, l'analyse des regrets et le compromis entre l'exploration et l'exploitation.

À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.