Comprendre l'apprentissage automatique : des modèles parfaitement solubles
Séances de cours associées (172)
Graph Chatbot
Chattez avec Graph Search
Posez n’importe quelle question sur les cours, conférences, exercices, recherches, actualités, etc. de l’EPFL ou essayez les exemples de questions ci-dessous.
AVERTISSEMENT : Le chatbot Graph n'est pas programmé pour fournir des réponses explicites ou catégoriques à vos questions. Il transforme plutôt vos questions en demandes API qui sont distribuées aux différents services informatiques officiellement administrés par l'EPFL. Son but est uniquement de collecter et de recommander des références pertinentes à des contenus que vous pouvez explorer pour vous aider à répondre à vos questions.
Introduit Q-Learning, Deep Q-Learning, l'algorithme REINFORCE et Monte-Carlo Tree Search dans l'apprentissage par renforcement, aboutissant à AlphaGo Zero.
Explore les progrès de l'IA générative et de l'apprentissage par renforcement, en se concentrant sur leurs applications, leur sécurité et leurs futures orientations de recherche.
Explique le gradient de politique pour un neurone unique, y compris la politique d'écriture, l'utilisation de la fonction logistique, et le calcul du gradient.
Explore les simulations moléculaires, les techniques d'échantillonnage améliorées, les coordonnées des réactions et les méthodes d'échantillonnage d'événements rares dans des systèmes complexes.