Couvre l'impact des transformateurs dans la vision par ordinateur, en discutant de leur architecture, de leurs applications et de leurs progrès dans diverses tâches.
Explore l'intelligence visuelle, la formation d'images, la vision par ordinateur et la compréhension de la représentation dans les machines et les esprits.
Couvre l'utilisation de transformateurs en robotique, en se concentrant sur la perception incarnée et les applications innovantes dans la locomotion humanoïde et l'apprentissage du renforcement.
Couvre les principes fondamentaux de l'apprentissage profond, y compris les données, l'architecture et les considérations éthiques dans le déploiement de modèles.