Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre le concept de bandits multibras, en se concentrant sur le dilemme exploration vs exploitation et l'algorithme Upper Confidence Bound. Il explique comment équilibrer entre essayer différentes options et exploiter la meilleure en fonction des données historiques, dans le but de minimiser les regrets et de maximiser les récompenses.