Stratégie de pari optimale | EPFL Graph Search

Cette séance de cours traite de la formulation d'un problème de jeu en tant que tâche de programmation dynamique, en mettant l'accent sur la maximisation du logarithme attendu du capital terminal. Il couvre l'horizon de planification, l'espace d'état, l'espace d'action et le coût du terminal. La séance de cours explique le processus de la solution de programmation dynamique, y compris l'initialisation et l'induction en arrière. Il présente la politique de pari optimale pour chaque tour et la richesse finale attendue dans le cadre de cette politique. La séance de cours explore également l'impact des différentes fonctions d'utilité sur la stratégie de pari optimale, soulignant l'importance de la préférence de risque dans la prise de décision.