Séance de cours

Compréhension automatique du monde visuel

Description

Cette séance de cours de l'instructeur se concentre sur la perception visuelle de la machine, couvrant des sujets tels que les difficultés de perception visuelle de la machine, les applications comme la détection du visage, l'apprentissage avec des étiquettes bruyantes, et l'utilisation de données synthétiques pour la reconnaissance d'action. La séance de cours se penche également sur la formation faiblement supervisée, le modèle Speech2Action et l'approche Zero-Shot VideoQA. L'instructeur discute des défis et des avantages de l'apprentissage faiblement supervisé, de l'impact de l'étendue temporelle sur les convolutions 3D et du modèle VectorNet pour la prédiction du comportement dans les voitures. La séance de cours se termine par des réflexions sur les orientations futures de la recherche vers des systèmes intelligents, y compris l'analyse des données multimodales et l'interaction avec le monde.

À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.