Variations du SARSA : apprentissage prévu du SARSA et du Q

À propos
Confidentialité
Mentions légales

Graph Chatbot

Séances de cours associées (29)

Perception : Approches fondées sur les données

Explore la perception dans l'apprentissage profond pour les véhicules autonomes, couvrant la classification d'image, les méthodes d'optimisation, et le rôle de la représentation dans l'apprentissage automatique.

Agents d'apprentissage profond : Renforcement de l'apprentissage

Explore les agents d'apprentissage profond dans l'apprentissage du renforcement, en mettant l'accent sur les approximations du réseau neuronal et les défis dans la formation des systèmes multiactifs.

Apprentissage par renforcement: gradient de politique et méthodes critiques pour les acteurs

Fournit une vue d'ensemble de l'apprentissage par renforcement, en se concentrant sur le gradient de politique et les méthodes critiques des acteurs pour les réseaux de neurones artificiels profonds.

Le paysage d'optimisation de Convex caché des réseaux neuronaux profonds

Explore le paysage d'optimisation convexe caché des réseaux neuronaux profonds, montrant la transition des modèles non convexes aux modèles convexes.

Physique statistique dans l'apprentissage automatique: Comprendre l'apprentissage profond

Explore l'application de la physique statistique à la compréhension de l'apprentissage profond en mettant l'accent sur les réseaux neuronaux et les défis de l'apprentissage automatique.

Introduction à l'apprentissage par renforcement: concepts et applications

Introduit l'apprentissage par renforcement, couvrant ses concepts, ses applications et ses algorithmes clés.

Fondements de l'apprentissage profond: Aperçu de l'architecture transformatrice

Couvre les concepts fondamentaux de l'apprentissage profond et de l'architecture Transformer, en se concentrant sur les réseaux neuronaux, les mécanismes d'attention et leurs applications dans les tâches de modélisation de séquence.

Renforcement de l’apprentissage : l’apprentissage basé sur la récompense

Explore les réseaux neuronaux artificiels, les informations sur les récompenses dans le cerveau, le conditionnement animal, l'apprentissage par renforcement profond et un quiz sur les récompenses.

Optimisation des réseaux neuraux

Explore l'optimisation des réseaux neuronaux, y compris la rétropropagation, la normalisation des lots, l'initialisation du poids et les stratégies de recherche d'hyperparamètres.

Modélisation de l'espace d'entrée

Explore la modélisation d'espaces d'entrée continus dans l'apprentissage par renforcement à l'aide de réseaux de neurones et de fonctions de base radiales.

Analyse des séries chronologiques financières

Couvre les faits stylisés du rendement des actifs, des statistiques sommaires, des tests de la normalité, des placettes Q-Q et des hypothèses de marché efficaces.

Concepts d'apprentissage par renforcement

Couvre les concepts clés de l'apprentissage par renforcement, des réseaux neuronaux, du clustering et de l'apprentissage non supervisé, en mettant l'accent sur leurs applications et leurs défis.

Renforcement de l'apprentissage : Q-Learning

Introduit Q-Learning, Deep Q-Learning, l'algorithme REINFORCE et Monte-Carlo Tree Search dans l'apprentissage par renforcement, aboutissant à AlphaGo Zero.

Machine Learning for Solving PDEs: Méthode de caractéristiques aléatoires

Explore la méthode de fonction aléatoire pour résoudre les PDE à l'aide d'algorithmes d'apprentissage automatique pour approximer efficacement les fonctions à haute dimension.

Méthodes de dégradé de politique: exemple dacteur binaire

Introduit des méthodes de gradient de politique en utilisant un exemple simple d'un seul neurone avec une sortie binaire.

Joueur IA : D4

Explore l'apprentissage par renforcement dans l'IA pour maîtriser les jeux à l'aide de réseaux neuronaux.

Réseaux neuronaux : Réseaux neuronaux profonds

Explore les bases des réseaux neuraux, en mettant l'accent sur les réseaux neuraux profonds, leur architecture et leur formation.

Les neurosciences et l'IA : combler l'écart

Explore l'écart entre l'intelligence artificielle et l'intelligence humaine grâce à des modèles et des algorithmes inspirés par les neurosciences.

Réseaux neuronaux profonds

Couvre l'algorithme de rétro-propagation pour les réseaux neuronaux profonds et l'importance de la localité dans CNN.

Deep Learning: Représentations de données et réseaux neuraux

Explore les représentations de données, les histogrammes, les réseaux neuronaux et les concepts d'apprentissage profond.

Page 1 sur 2