Apprentissage par renforcement: Exploration, Attribution de crédit, TRPO, PPO
Graph Chatbot
Chattez avec Graph Search
Posez n’importe quelle question sur les cours, conférences, exercices, recherches, actualités, etc. de l’EPFL ou essayez les exemples de questions ci-dessous.
AVERTISSEMENT : Le chatbot Graph n'est pas programmé pour fournir des réponses explicites ou catégoriques à vos questions. Il transforme plutôt vos questions en demandes API qui sont distribuées aux différents services informatiques officiellement administrés par l'EPFL. Son but est uniquement de collecter et de recommander des références pertinentes à des contenus que vous pouvez explorer pour vous aider à répondre à vos questions.
Couvre les bases de l'apprentissage automatique, les défis en matière de déploiement, les attaques contradictoires et les préoccupations en matière de protection de la vie privée.
Explore les méthodes de descente de gradient pour l'entraînement des réseaux de neurones artificiels, couvrant l'apprentissage supervisé, les réseaux monocouches et les règles modernes de descente de gradient.
Explore la perspective historique et le développement de l'algorithme AlphaGo, en se concentrant sur l'apprentissage automatique et les stratégies de jeu.
Introduit des réseaux neuronaux convolutionnels (RCN) pour les véhicules autonomes, couvrant l'architecture, les applications et les techniques de régularisation.
Intensifier l'apprentissage avec la rétroaction humaine, discuter de la convergence des estimateurs et introduire une approche pessimiste pour améliorer les performances.
Couvre les bases de l'apprentissage de renforcement, y compris l'apprentissage d'essai et d'erreur, l'apprentissage Q, le RL profond, et les applications dans le jeu et la planification.
Couvre les défis de classification d'images, les concepts d'apprentissage automatique, la régression linéaire et l'approche voisine la plus proche dans les véhicules autonomes.
Introduit l'apprentissage supervisé, couvrant la classification, la régression, l'optimisation des modèles, le surajustement, et les méthodes du noyau.
Explore les courbes de double descente et la surparamétrisation dans les modèles d'apprentissage automatique, en soulignant les risques et les avantages.