Séances de cours associées à Policy studies

Évolution de la politique migratoire: analyse et évaluation

Couvre les missions de suivi de l'évolution de la politique migratoire et d'évaluation de son impact.

Bandits multibras : exploration vs exploitation

Explore l'équilibre entre l'exploration et l'exploitation dans les algorithmes de bandit multi-bras.

Politique, personnes, technologie: l'avenir de la mobilité

Explore l'avenir de la mobilité par le biais des politiques, des personnes et de la technologie.

Gouvernance innovante des grands systèmes urbains

S'engager dans la gouvernance des grands systèmes urbains et l'avenir de la mobilité, en s'attaquant aux défis et aux nouveaux modèles d'affaires.

Exposé de recherche : Évolution des politiques en matière de gouvernance des migrations

Explique la mission de recherche du deuxième semestre sur l'analyse de l'évolution des politiques en matière de gouvernance des migrations.

Vers des composites durables

Explore des solutions composites durables, y compris le recyclage, les stratégies de fin de vie et le stockage de l'hydrogène.

Relation de l'équation de SARSA et de Bellman

Explore la relation entre la fluctuation des valeurs Q dans le SARSA et l'équation de Bellman par le biais des attentes et de la constance des politiques.

Recherche mécanique sur les étagères : mise en place et destruction efficaces

Discute de l'optimisation de la récupération d'objets dans des environnements encombrés à l'aide de techniques efficaces de gerbage et de destacking.

Planification du premier projet

Couvre les exigences de base de la première ébauche et guide les étudiants sur la planification du projet et les techniques de description.

Programmation dynamique : contrôle optimal

Explore la programmation dynamique pour un contrôle optimal, en se concentrant sur la stabilité, la politique stationnaire et les solutions récursives.

Exposition cachée : Mesure de la fiabilité de la chaîne d'approvisionnement américaine

Explore l'exposition cachée des chaînes d'approvisionnement américaines aux fournisseurs étrangers et l'importance de simplifier les réalités complexes au moyen de modèles mentaux.

Gestion des stocks

Couvre le modèle d'inventaire (s,s), les chaînes de Markov stationnaires, la propriété d'inversion de temps et la condition d'équilibre détaillée.

Conséquences imprévues de la technologie dans les pays du Sud

Examine les impacts négatifs involontaires de la technologie dans le développement durable, en abordant les défis et les conséquences dans les pays du Sud.

Apprentissage par renforcement : TD Learning et les variantes de la LEP

Discute de l'apprentissage par renforcement, en se concentrant sur l'apprentissage par différence temporelle et les variations de l'algorithme SARSA.

Exécution multi-requêtes évolutive : approche d'apprentissage du renforcement

Présente une nouvelle approche pour l'exécution scalable multi-query en utilisant l'apprentissage du renforcement.

Biodiversité et infrastructures: écoservices

Se consacre à la biodiversité, aux services écosystémiques, à l'évaluation économique et aux politiques d'infrastructure durables.

Leviers technologiques pour la durabilité: énergie et politique

Couvre l’impact des leviers technologiques sur la durabilité, en se concentrant sur la consommation d’énergie et le changement climatique.

Systèmes énergétiques urbains intelligents

Couvre la conceptualisation des systèmes énergétiques urbains intelligents et de leurs trois couches.

Prédiction sans modèle dans l'apprentissage par renforcement: méthodes clés

Couvre les méthodes de prédiction sans modèle dans l'apprentissage par renforcement, en se concentrant sur Monte Carlo et les différences temporelles pour estimer les fonctions de valeur sans connaissance de la dynamique de transition.

Analyse de la politique monétaire

Couvre l'analyse des réponses de la politique monétaire à l'accumulation de la dette publique et comprend un projet sur l'évaluation des politiques alternatives.