Cours

CS-303: Principles of online decision-making

Résumé

This course provides a mathematical treatment of online decision-making. It covers bandits (multi-armed, contextual, structured), Markov Decision Processes (MDPs), and related topics. Key concepts include exploration-exploitation, UCB, Thompson sampling, and tools to derive regret bounds. ...

Séances de cours

Enseignant

Matthias Grossglauser

Source officielle

https://edu.epfl.ch/coursebook/fr/principles-of-online-decision-making-CS-303

Page Moodle

http://go.epfl.ch/CS-303

À propos de ce résultat

Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.