Couvre l'impact des transformateurs dans la vision par ordinateur, en discutant de leur architecture, de leurs applications et de leurs progrès dans diverses tâches.
Couvre les architectures de transformateurs avancées en apprentissage profond, en se concentrant sur les modèles Swin, HUBERT et Flamingo pour les applications multimodales.
Couvre les réseaux neuronaux convolutifs, les architectures standard, les techniques de formation et les exemples contradictoires en apprentissage profond.
Explore l'IA socialement consciente pour la mobilité des derniers milles, se concentrant sur la compréhension des étiquettes sociales, l'anticipation des comportements et la prévision des mouvements de foule.
Couvre les techniques de récupération d'informations de forme 3D à partir d'images 2D à l'aide de modèles d'ombrage et d'approches modernes d'apprentissage profond.
Explore les défis et les points de vue de l'apprentissage profond, en mettant l'accent sur le paysage des pertes, la généralisation et l'apprentissage caractéristique.
Explore l'apprentissage autosupervisé pour les véhicules autonomes, en dérivant des étiquettes de données elles-mêmes et en discutant de ses applications et de ses défis.