Fournit un aperçu des théories classiques de la vision, explorant comment la perception est façonnée par des facteurs psychologiques et environnementaux.
Couvre les architectures de transformateurs avancées en apprentissage profond, en se concentrant sur les modèles Swin, HUBERT et Flamingo pour les applications multimodales.
Explore la vision humaine de la rétine au cortex visuel, couvrant des sujets tels que la vision des couleurs, la sensibilité aux différentes longueurs d'onde et la comparaison des processus de vision humaine et de vision par ordinateur.