Concept

Bellman equation

Séances de cours associées (32)

Explore le problème de la vente d'actifs pour maximiser la récompense à long terme sans délai.

Couvre les principes fondamentaux de la théorie du contrôle optimal, en se concentrant sur la définition des OCP, l'existence de solutions, les critères de performance, les contraintes physiques et le principe d'optimalité.

Problèmes d'horizon infini : formulation et complexité

Couvre les problèmes d'horizon infini dans les processus de probabilité appliquée et stochastiques.

Contrôle optimal stochastique: Théorème de Martingale

Explore le contrôle optimal stochastique, mettant l'accent sur la consommation et l'investissement optimaux, le théorème de représentation de Martingale et le théorème de vérification.

Apprentissage automatique avancé : apprentissage par renforcement discret

Présente les bases de l'apprentissage par renforcement, couvrant les états discrets, les actions, les politiques, les fonctions de valeur, les PDM et les politiques optimales.

Techniques de programmation linéaire dans l'apprentissage par renforcement

Couvre l'approche de programmation linéaire de l'apprentissage par renforcement, en se concentrant sur ses applications et ses avantages dans la résolution des processus décisionnels de Markov.

Vente d'actifs: Politique de revenus optimale

Explore la dynamique de vente d'actifs, la politique de revenus optimale, les seuils d'acceptation et l'impact sur les prix des produits de base.

Séance de cours interactive : Apprentissage du renforcement

Explore les sujets d'apprentissage avancés du renforcement, y compris les politiques, les fonctions de valeur, la récursion de Bellman et le contrôle de la TD sur les politiques.

Équation de Bellman : Cohérence de la valeur et actions optimales

Couvre l'équation de Bellman, les valeurs Q, le facteur de réduction et les actions optimales.

Attribution optimale du portefeuille : Équation d'Euler et programmation dynamique

Couvre l'équation d'Euler, la programmation dynamique et la consommation optimale dans l'allocation de portefeuille.

Stratégie marketing optimale

Couvre la prise de décision dans le marketing basé sur le comportement du client pour des stratégies optimales.

Problèmes de vente d'actifs

Discute des problèmes de vente d'actifs et des politiques de vente optimales basées sur les conditions du marché et les états de résiliation.

Simulation numérique des SDE : Monte Carlo et contrôle optimal

Couvre les méthodes Monte Carlo, la réduction de la variance et le contrôle optimal stochastique, explorant les techniques de simulation, l'efficacité et la dynamique d'investissement.

Programmation dynamique : contrôle optimal

Explore la programmation dynamique pour un contrôle optimal, en se concentrant sur la stabilité, la politique stationnaire et les solutions récursives.

Programmation dynamique : contrôle optimal

Explore la programmation dynamique pour un contrôle optimal, couvrant le remplacement de la machine, les chaînes de Markov, les politiques de contrôle et les problèmes quadratiques linéaires.

Équation de Hamilton-Jacobi : Champs exacts

Explore l'équation de Hamilton-Jacobi, le contrôle optimal et le principe de Bellman dans des champs exacts.

Apprentissage des différences temporelles

Couvertures Renforcement Théorie de l'apprentissage, Q-Learning, et horizons multi-étapes.

Contrôle optimal: OCPs

Couvre les problèmes de contrôle optimal en se concentrant sur les conditions nécessaires, l'existence de contrôles optimaux et les solutions numériques.

Méthode de Newton sur les variétés riemanniennes

Couvre la méthode de Newton sur les variétés riemanniennes, en se concentrant sur les conditions d'optimalité du second ordre et la convergence quadratique.

Descente riemannienne gradient

Explore la descente de gradient riemannienne, couvrant les expansions de Taylor, les conditions d'optimalité, les modèles d'algorithmes, la recherche de lignes et les points critiques.