Cette séance de cours explore l'importance de la représentation de l'image, en commençant par l'évolution des résultats d'ImageNet et l'utilisation de la préformation pour les tâches en aval. Il se penche sur les défis de l'apprentissage supervisé, le coût de la supervision et les avantages des stratégies d'apprentissage auto-supervisées comme les puzzles RotNet et Jigsaw. L'orateur discute de l'efficacité des différentes approches d'apprentissage autosupervisées, des méthodes d'évaluation et des progrès récents en SSL, y compris la fonction de coût SSL et l'utilisation du sous-espace dans l'apprentissage profond. La séance de cours se termine par des idées sur l'auto-expression, les mécanismes d'attention et l'application de l'apprentissage multitâche basé sur les transformateurs dans la représentation d'images.