Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours présente un quiz sur la mise en œuvre des méthodes de Monte-Carlo, en mettant l’accent sur l’estimation du rendement total dans un réseau de mille états et quatre choix d’action dans chaque état, y compris un seul état terminal. Le quiz met le public au défi de déterminer le nombre de variables de retour à ouvrir et à allouer dans un épisode, en mettant l'accent sur l'exploration du graphique pour estimer de nouvelles variables de retour en cours de route.