Séance de cours

Récapitulatif de la programmation dynamique

Séances de cours associées (31)

Explore la stratégie de pari optimale dans un problème de jeu de programmation dynamique, en mettant l'accent sur l'impact des préférences de risque.

Iteration des politiques et programmation linéaire dans les MDP

Discute de l'itération des politiques et des méthodes de programmation linéaire pour résoudre les processus décisionnels de Markov.

Prédiction sans modèle dans l'apprentissage par renforcement: méthodes clés

Couvre les méthodes de prédiction sans modèle dans l'apprentissage par renforcement, en se concentrant sur Monte Carlo et les différences temporelles pour estimer les fonctions de valeur sans connaissance de la dynamique de transition.

Programmation dynamique : prise de décision optimale

Explore la programmation dynamique pour optimiser les processus de prise de décision au fil du temps, en utilisant des exemples concrets tels que l'extraction de pétrole et la négociation d'actions.

L'holographie en Gravité Classique

Explore des relents d'holographie dans la thermodynamique classique du trou noir.

Processus de décision de Markov: fondements de l'apprentissage par renforcement

Couvre les processus décisionnels de Markov, leur structure et leur rôle dans l'apprentissage par renforcement.

Analyse numérique: Stabilité dans les ODE

Couvre l'analyse de stabilité des ODE à l'aide de méthodes numériques et discute des conditions de stabilité.

Contrôle quadratique linéaire (LQ) : preuve de théorème

Couvre la preuve de la formule récursive pour les gains optimaux dans le contrôle LQ sur un horizon fini.

Problème de vente d'actifs

Explore le problème de la vente d'actifs pour maximiser la récompense à long terme sans délai.

Problèmes de vente d'actifs

Discute des problèmes de vente d'actifs et des politiques de vente optimales basées sur les conditions du marché et les états de résiliation.

Inflation et cosmologie

Explore l'inflation, les fluctuations quantiques, les champs scalaires et leur impact sur la formation de la structure de l'univers.

Sans titre

Jeux dynamiques : Induction arrière et équilibres de Nash

Couvre des jeux dynamiques, en se concentrant sur l'induction en arrière et en trouvant des équilibres de Nash dans des scénarios à deux joueurs.

Contrôle optimal stochastique: Théorème de Martingale

Explore le contrôle optimal stochastique, mettant l'accent sur la consommation et l'investissement optimaux, le théorème de représentation de Martingale et le théorème de vérification.

Stabilité : pôles, zéros et contrôle

Couvre la stabilité, les pôles, les zéros et le contrôle dans les systèmes dynamiques, en soulignant l'importance de l'observabilité.

Gravitationnel Red-Shift et Escape Velocity

Couvre la découverte des intégrales du mouvement et l'analyse de la vitesse d'échappement et du décalage gravitationnel vers le rouge.

Observabilité et contrôlabilité

Explore l'observabilité et la contrôlabilité dans les systèmes linéaires, en soulignant l'importance du découplage des entrées pour l'observabilité.

Programmation dynamique : contrôle optimal

Explore la programmation dynamique pour un contrôle optimal, couvrant le remplacement de la machine, les chaînes de Markov, les politiques de contrôle et les problèmes quadratiques linéaires.

Équilibre des carbonates

Explore l'équilibre dans les systèmes de carbonate, y compris les espèces comme H2CO3 et HCO3, avec des exemples et des exercices.

Lois stables et théorèmes de limitation

Explore les lois stables, les théorèmes limites et les propriétés de variables aléatoires.