Posez n’importe quelle question sur les cours, conférences, exercices, recherches, actualités, etc. de l’EPFL ou essayez les exemples de questions ci-dessous.
AVERTISSEMENT : Le chatbot Graph n'est pas programmé pour fournir des réponses explicites ou catégoriques à vos questions. Il transforme plutôt vos questions en demandes API qui sont distribuées aux différents services informatiques officiellement administrés par l'EPFL. Son but est uniquement de collecter et de recommander des références pertinentes à des contenus que vous pouvez explorer pour vous aider à répondre à vos questions.
Explore l'apprentissage en apprentissage profond pour les véhicules autonomes, couvrant les modèles prédictifs, RNN, ImageNet, et l'apprentissage de transfert.
Explore l'application de l'apprentissage de renforcement pour enseigner à Pacman à jouer de façon autonome en utilisant les méthodes de gradient de politique et les processus de décision Markov.
Couvre les caractéristiques, les applications et les défis des agents intelligents dans les systèmes logiciels, en mettant l'accent sur leur rôle dans la prise de décisions autonomes et la coordination avec d'autres agents.
Compare l'apprentissage par renforcement basé sur un modèle et sans modèle, en soulignant les avantages du premier pour s'adapter aux changements de récompense et planifier les actions futures.
Explore l'algorithme SARSA pour l'apprentissage par renforcement, en mettant l'accent sur la mise à jour des valeurs Q et l'importance de l'exploration dans l'apprentissage par récompenses.
Explore les méthodes de Monte-Carlo pour l'apprentissage par renforcement, en les comparant avec les méthodes TD et en mettant l'accent sur l'efficacité des méthodes TD dans la propagation de l'information.
Couvre la théorie du renforcement de l'apprentissage, en mettant l'accent sur le dilemme de l'exploration et de l'exploitation et sur les stratégies visant à équilibrer l'exploration et l'exploitation.