Séance de cours

Stratégie de pari optimale

Description

Cette séance de cours traite de la formulation d'un problème de jeu en tant que tâche de programmation dynamique, en mettant l'accent sur la maximisation du logarithme attendu du capital terminal. Il couvre l'horizon de planification, l'espace d'état, l'espace d'action et le coût du terminal. La séance de cours explique le processus de la solution de programmation dynamique, y compris l'initialisation et l'induction en arrière. Il présente la politique de pari optimale pour chaque tour et la richesse finale attendue dans le cadre de cette politique. La séance de cours explore également l'impact des différentes fonctions d'utilité sur la stratégie de pari optimale, soulignant l'importance de la préférence de risque dans la prise de décision.

À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.