Séance de cours

Injection de perturbations bayésiennes : Imitation robuste

Description

Cette séance de cours de l'instructeur se concentre sur l'injection de perturbations bayésiennes pour une imitation robuste dans l'apprentissage des robots. La présentation porte sur le développement d'algorithmes d'apprentissage de renforcement efficaces pour les applications du monde réel, les défis de l'apprentissage d'essai et d'erreur dans les environnements industriels et l'application de l'apprentissage d'imitation dans des environnements complexes. La séance de cours présente l'approche de l'injection de perturbations bayésiennes (IDB), qui intègre la modélisation probabiliste des politiques, l'injection de perturbations et l'ajustement au niveau des perturbations afin d'améliorer la robustesse des politiques. Des résultats expérimentaux sur des tâches telles que le balayage de table et la réalisation d'objectifs avec des obstacles démontrent l'efficacité de l'IDB dans la réduction des erreurs et la réalisation de tâches élevées. La séance de cours se termine par une discussion sur l'injection de perturbations pondérées de la réalisation des tâches (TAW-DI) pour aborder les limitations dans l'apprentissage de l'imitation.

À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.