Séance de cours

Transformateur de vision robuste: Embeddings par lots et blocs RVT

Description

Cette séance de cours présente les présentations finales du projet CS-503 sur l'intelligence visuelle, en mettant l'accent sur la navigation robotique neuromorphe bio-inspirée, les réseaux convolutionnels graphiques et la comparaison des performances de différentes architectures pour les transformateurs de vision robustes. Les étudiants proposent un réseau d'attractions d'anneau pour la navigation, la mise au point de réseaux préformés et l'évaluation des résultats par rapport au niveau de référence. Ils discutent des travaux connexes sur les attracteurs des anneaux, présentent les résultats sur les différentes architectures et concluent avec des limitations et des extensions possibles pour les travaux futurs.

Cette vidéo est disponible exclusivement sur Mediaspace pour un public restreint. Veuillez vous connecter à Mediaspace pour y accéder si vous disposez des autorisations nécessaires.

Regarder sur Mediaspace
À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.