Séance de cours

Mémoire spatiale dans les agents RL

Description

Cette séance de cours explore l'utilisation de la mémoire spatiale et des motifs dans les agents d'apprentissage de renforcement à travers des tâches de navigation labyrinthe. L'approche consiste à concevoir des labyrinthes de plus en plus complexes pour tester l'orientation spatiale et les capacités de choix du chemin. L'agent RL est basé sur une architecture Dueling Network avec Double Q-learning pour les mises à jour d'état. Les résultats montrent que l'augmentation des repères visuels améliore les performances des agents dans l'orientation spatiale, tandis que le choix du chemin reste incohérent. Les limites comprennent le manque de construction de cartes de l'environnement et la nécessité de meilleures fonctions de récompense. Les extensions possibles consistent à affiner les points de départ et les orientations.

Cette vidéo est disponible exclusivement sur Mediaspace pour un public restreint. Veuillez vous connecter à Mediaspace pour y accéder si vous disposez des autorisations nécessaires.

Regarder sur Mediaspace
À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.