Apprentissage par renforcement basé sur un modèle ou sans modèle

À propos
Confidentialité
Mentions légales

Graph Chatbot

Séances de cours associées (30)

Page 3 sur 3

Méthodes de gradient de politique: apprentissage par l'action directe dans l'apprentissage par renforcement

Couvre les méthodes de gradient de politique, en mettant l'accent sur l'apprentissage par l'action directe et l'optimisation des récompenses dans l'apprentissage par renforcement.

Séance de cours interactive : Apprentissage du renforcement

Explore les sujets d'apprentissage avancés du renforcement, y compris les politiques, les fonctions de valeur, la récursion de Bellman et le contrôle de la TD sur les politiques.

Mémoire spatiale dans les agents RL

Se penche sur l'utilisation de la mémoire spatiale dans les agents RL pour les tâches de navigation labyrinthe, montrant des performances améliorées avec des repères visuels, mais des résultats incohérents dans le choix du chemin.

Apprentissage automatique avancé : apprentissage par renforcement discret

Présente les bases de l'apprentissage par renforcement, couvrant les états discrets, les actions, les politiques, les fonctions de valeur, les PDM et les politiques optimales.

La robotique perceptuelle : intégration de la vision et de l’action

Couvre l'intégration de la perception visuelle et des actions robotiques dans l'IA incarnée.

Curiosité et récompense: Neurosciences à l'IA

S'insère dans la motivation intrinsèque, l'IA incarnée, la demande d'information, la nouveauté et la curiosité dans la prise de décision.

Agents délibératifs : planification et stratégies

Couvre la planification avec des adversaires, des algorithmes de recherche heuristique et des stratégies pour les jeux avec le hasard, en soulignant l'importance des agents délibératifs.

La modélisation perceptuelle : comprendre la pensée spatiale et la vision

Examine la modélisation perceptuelle et la pensée spatiale dans l'intelligence visuelle, explorant les théories, les cartes cognitives et l'interaction entre le traitement ascendant et descendant.

Apprentissage par projet dans les communications et la robotique

Introduit un cours basé sur des projets en communication et en robotique, mettant l'accent sur des projets pratiques et un apprentissage indépendant pour préparer les étudiants à relever des défis du monde réel.

Les neurosciences et l'IA : combler l'écart

Explore l'écart entre l'intelligence artificielle et l'intelligence humaine grâce à des modèles et des algorithmes inspirés par les neurosciences.