Méthodes de gradient de politique: Techniques d'apprentissage par renforcement

À propos
Confidentialité
Mentions légales

Graph Chatbot

Séances de cours associées (31)

Page 3 sur 4

Prédiction sans modèle dans l'apprentissage par renforcement: méthodes clés

Couvre les méthodes de prédiction sans modèle dans l'apprentissage par renforcement, en se concentrant sur Monte Carlo et les différences temporelles pour estimer les fonctions de valeur sans connaissance de la dynamique de transition.

Réseaux d'approvisionnement en énergie

Introduit des réseaux de flux, couvrant la structure du réseau neuronal, la formation, les fonctions d'activation et l'optimisation, avec des applications en prévision et finance.

Les principes fondamentaux de l'apprentissage profond

Couvre les fondamentaux de l'apprentissage profond, des neurones artificiels aux réseaux modernes.

Cours intensif sur le deep learning

Couvre un cours intensif sur l'apprentissage profond, y compris le Mark I Perceptron, les réseaux neuronaux, les algorithmes d'optimisation et les aspects de formation pratique.

Réseaux neuronaux : Algorithme du modèle Perceptron et de la rétropropagation

Couvre le modèle perceptron et l'algorithme de rétropropagation dans les réseaux neuronaux.

Réseaux neuronaux : régression et classification

Explore les réseaux neuronaux pour les tâches de régression et de classification, couvrant la formation, la régularisation et des exemples pratiques.

Paysage et généralisation dans l'apprentissage profond

Explore les défis et les points de vue de l'apprentissage profond, en mettant l'accent sur le paysage des pertes, la généralisation et l'apprentissage caractéristique.

Optimisation des réseaux neuraux

Explore l'optimisation des réseaux neuronaux, y compris la rétropropagation, la normalisation des lots, l'initialisation du poids et les stratégies de recherche d'hyperparamètres.

Réseaux neuronaux profonds : formation et optimisation

Explore l'entraînement, l'optimisation, la prévention des surajustements et différentes architectures de réseau.

Apprentissage par renforcement profond basé sur des modèles: Monte Carlo Tree Search

Explore l'apprentissage par renforcement profond basé sur des modèles, en se concentrant sur Monte Carlo Tree Search et ses applications dans les stratégies de jeu et les processus décisionnels.