Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours de l'instructeur se concentre sur l'injection de perturbations bayésiennes pour une imitation robuste dans l'apprentissage des robots. La présentation porte sur le développement d'algorithmes d'apprentissage de renforcement efficaces pour les applications du monde réel, les défis de l'apprentissage d'essai et d'erreur dans les environnements industriels et l'application de l'apprentissage d'imitation dans des environnements complexes. La séance de cours présente l'approche de l'injection de perturbations bayésiennes (IDB), qui intègre la modélisation probabiliste des politiques, l'injection de perturbations et l'ajustement au niveau des perturbations afin d'améliorer la robustesse des politiques. Des résultats expérimentaux sur des tâches telles que le balayage de table et la réalisation d'objectifs avec des obstacles démontrent l'efficacité de l'IDB dans la réduction des erreurs et la réalisation de tâches élevées. La séance de cours se termine par une discussion sur l'injection de perturbations pondérées de la réalisation des tâches (TAW-DI) pour aborder les limitations dans l'apprentissage de l'imitation.