Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre le problème de la vente d'actifs, où une personne veut vendre un actif sans délai pour maximiser la récompense à long terme. L'instructeur explique la dynamique du problème, la valeur et les algorithmes d'itération de politique, et la convergence de l'itération de politique. L’objectif est de trouver la politique optimale pour vendre l’actif. Divers concepts tels que l'équation de Bellman, l'itération de la valeur et l'évaluation des politiques sont discutés en détail.