Hyperbolic discounting

Sciences sociales
Économie (discipline)
Économie appliquée
Économie comportementale

À propos
Confidentialité
Mentions légales

Graph Chatbot

Séances de cours associées (18)

Connectez-vous pour filtrer par séance de cours

Page 2 sur 2

Méthodes de dégradé de politique: plusieurs étapes temporelles

Explore les méthodes de dégradé de politique sur plusieurs étapes temporelles, en mettant l'accent sur la mise à jour des paramètres de politique pour maximiser les récompenses.

Comparaison des traces de SARSA et d'admissibilité

Présente un quiz comparant l'algorithme SARSA en n-étape avec SARSA en utilisant des traces d'admissibilité.

Équation de Bellman : Cohérence de la valeur et actions optimales

Couvre l'équation de Bellman, les valeurs Q, le facteur de réduction et les actions optimales.

Principes de la finance : flux de trésorerie et bénéfices

Explore les principes fondamentaux de la finance, en se concentrant sur les flux de trésorerie, les bénéfices et les mesures comptables.

Estimation de la valeur du capital

Explique l'actualisation des paiements futurs pour déterminer la valeur actuelle et estimer la valeur en capital en fonction des flux de revenus et des évaluations des ressources.

Principes de la finance : Taux d’intérêt et évaluation des obligations

Explore les principes financiers, les taux d'intérêt, l'évaluation des obligations et l'investissement durable.

Comprendre les taux d’escompte : Implications de l’investissement public

Examine l’impact des taux d’actualisation sur les décisions d’investissement public et leurs implications pour les générations futures.

Processus de décision de Markov: Techniques de programmation dynamique

Discute des processus décisionnels de Markov et des techniques de programmation dynamique pour résoudre des politiques optimales dans divers scénarios.