Séance de cours

Transformateurs dans la vision

Description

Cette séance de cours couvre le concept de Transformateurs dans la vision informatique, en mettant l'accent sur l'architecture 'Attention est tout ce dont vous avez besoin'. Il explique l'encodeur et le décodeur de transformateurs, l'auto-attention multi-têtes, l'encodage positionnel et l'utilisation de transformateurs pour les tâches d'intelligence visuelle. La séance de cours traite également de l'application des transformateurs dans les tâches de vision, comme la reconnaissance de l'image et la prédiction dense. Différents types de transformateurs, y compris les transformateurs de vision (ViT), les transformateurs de prévision de sens (DPT) et le pré-formation BERT des transformateurs d'images (BEIT), sont explorés. En outre, il se décline dans les concepts de codeurs automatiques masqués, de décodage parallèle, et le rôle des transformateurs dans la synthèse d'images haute résolution.

Cette vidéo est disponible exclusivement sur Mediaspace pour un public restreint. Veuillez vous connecter à Mediaspace pour y accéder si vous disposez des autorisations nécessaires.

Regarder sur Mediaspace

Source officielle

Séances de cours associées (29)

Transformers en vision : applications et architectures

Couvre l'impact des transformateurs dans la vision par ordinateur, en discutant de leur architecture, de leurs applications et de leurs progrès dans diverses tâches.

Transformers: Unifier les communautés d'apprentissage automatique

Couvre le rôle des transformateurs dans l'unification de divers domaines d'apprentissage automatique.

Intelligence visuelle: Machines et esprits

Explore l'intelligence visuelle, la formation d'images, la vision par ordinateur et la compréhension de la représentation dans les machines et les esprits.

Architecture des transformateurs : le X Gomega

Déplacez-vous dans l'architecture Transformer, l'auto-attention et les stratégies de formation pour la traduction automatique et la reconnaissance d'image.

Transformateurs dans la vision

Explore l'évolution des modèles d'intelligence visuelle, en mettant l'accent sur les Transformateurs et leurs applications dans la vision informatique et le traitement du langage naturel.

Afficher plus