Séance de cours

Compréhension automatique du monde visuel

Description

Cette séance de cours de l'instructeur se concentre sur la perception visuelle de la machine, couvrant des sujets tels que les difficultés de perception visuelle de la machine, les applications comme la détection du visage, l'apprentissage avec des étiquettes bruyantes, et l'utilisation de données synthétiques pour la reconnaissance d'action. La séance de cours se penche également sur la formation faiblement supervisée, le modèle Speech2Action et l'approche Zero-Shot VideoQA. L'instructeur discute des défis et des avantages de l'apprentissage faiblement supervisé, de l'impact de l'étendue temporelle sur les convolutions 3D et du modèle VectorNet pour la prédiction du comportement dans les voitures. La séance de cours se termine par des réflexions sur les orientations futures de la recherche vers des systèmes intelligents, y compris l'analyse des données multimodales et l'interaction avec le monde.

À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.

Graph Chatbot

Chattez avec Graph Search

Posez n’importe quelle question sur les cours, conférences, exercices, recherches, actualités, etc. de l’EPFL ou essayez les exemples de questions ci-dessous.

AVERTISSEMENT : Le chatbot Graph n'est pas programmé pour fournir des réponses explicites ou catégoriques à vos questions. Il transforme plutôt vos questions en demandes API qui sont distribuées aux différents services informatiques officiellement administrés par l'EPFL. Son but est uniquement de collecter et de recommander des références pertinentes à des contenus que vous pouvez explorer pour vous aider à répondre à vos questions.