Explore les sujets d'apprentissage avancés du renforcement, y compris les politiques, les fonctions de valeur, la récursion de Bellman et le contrôle de la TD sur les politiques.
Couvre l'analyse des flux de matériaux pour l'élaboration des politiques, reliant le MAE aux méthodes des sciences sociales, et des exemples de la Colombie et de la Suisse.
Discute des méthodes d'apprentissage par renforcement profond, en se concentrant sur les mini-batchs et les implications des techniques de formation on-policy et off-policy.
Couvre la première réunion en personne de l'initiative conjointe ReCLEAN, axée sur l'impact environnemental de l'azote réactif et les efforts de collaboration futurs.