Passer au contenu principal
Graph
Search
fr
en
Se Connecter
Recherche
Tous
Catégories
Concepts
Cours
Séances de cours
MOOCs
Personnes
Exercices
Publications
Start-ups
Unités
Afficher tous les résultats pour
Accueil
Concept
Reinforcement learning from human feedback
Graph Chatbot
Séances de cours associées (24)
Connectez-vous pour filtrer par séance de cours
Connectez-vous pour filtrer par séance de cours
Réinitialiser
Précédent
Page 3 sur 3
Suivant
Apprentissage par renforcement : TD Learning et les variantes de la LEP
Discute de l'apprentissage par renforcement, en se concentrant sur l'apprentissage par différence temporelle et les variations de l'algorithme SARSA.
Premiers pas vers l’apprentissage par renforcement profond
Explore le passage à l'apprentissage par renforcement profond à travers les réseaux neuronaux pour l'apprentissage direct des politiques, en contournant les valeurs Q et V.
Introduction générale aux réseaux de neurones artificiels: partie 3
Couvre l'apprentissage par des récompenses dans l'apprentissage par renforcement profond sans détails mathématiques.
Q-Learning profond: DeepRL1.1
Couvre le Q-learning profond dans les réseaux neuronaux profonds, son application dans les jeux, la rétropropagation, les valeurs Q et les valeurs V.