Explore des systèmes d'images basés sur des concepts, basés sur des entités et basés sur des connexions en perspective, en mettant l'accent sur l'analyse des relations graphiques et visuelles entre les images.
Explore l'application des transformateurs dans les tâches de vision, en se concentrant sur les ViT et les architectures de transformateurs innovantes pour les entrées et les sorties structurées.
Couvre l'impact des transformateurs dans la vision par ordinateur, en discutant de leur architecture, de leurs applications et de leurs progrès dans diverses tâches.