Posez n’importe quelle question sur les cours, conférences, exercices, recherches, actualités, etc. de l’EPFL ou essayez les exemples de questions ci-dessous.
AVERTISSEMENT : Le chatbot Graph n'est pas programmé pour fournir des réponses explicites ou catégoriques à vos questions. Il transforme plutôt vos questions en demandes API qui sont distribuées aux différents services informatiques officiellement administrés par l'EPFL. Son but est uniquement de collecter et de recommander des références pertinentes à des contenus que vous pouvez explorer pour vous aider à répondre à vos questions.
Explore les agents d'apprentissage profond dans l'apprentissage du renforcement, en mettant l'accent sur les approximations du réseau neuronal et les défis dans la formation des systèmes multiactifs.
Explore l'algorithme SARSA pour l'apprentissage par renforcement, en mettant l'accent sur la mise à jour des valeurs Q et l'importance de l'exploration dans l'apprentissage par récompenses.
Couvre le calcul de la fonction de coût pour les systèmes de commande multivariables en utilisant le cadre LQR et en appliquant la descente de gradient pour améliorer le contrôleur.
Introduit l'apprentissage par renforcement, couvrant ses définitions, ses applications et ses fondements théoriques, tout en décrivant la structure et les objectifs du cours.
Explore l'évaluation du gradient des politiques avec un horizon en 1 étape, met à jour les règles, les comparaisons avec Perceptron et la biologie, et les techniques de généralisation.
Couvre l’apprentissage par renforcement d’horizons finis, les politiques non stationnaires et la variante optimiste de l’Optimisation Proximale des Politiques (OPPO).
Explore la gestion intégrée des risques dans le génie civil, y compris les politiques gouvernementales, les processus décisionnels et une étude de cas controversée sur l'analyse des risques.