Séance de cours

Transformers en vision : applications et architectures

Séances de cours associées (29)

Transformers: Unifier les communautés d'apprentissage automatique

Couvre le rôle des transformateurs dans l'unification de divers domaines d'apprentissage automatique.

Traitement du langage naturel: comprendre les transformateurs et la tokenisation

Fournit un aperçu du traitement du langage naturel, en se concentrant sur les transformateurs, la tokenisation et les mécanismes d'auto-attention pour une analyse et une synthèse efficaces du langage.

Transformateurs dans la vision

Explore Transformers dans la vision informatique, se concentrant sur l'architecture 'Attention est tout ce dont vous avez besoin' et ses applications dans les tâches visuelles.

Perception : Approches fondées sur les données

Explore la perception dans l'apprentissage profond pour les véhicules autonomes, couvrant la classification d'image, les méthodes d'optimisation, et le rôle de la représentation dans l'apprentissage automatique.

Deep Learning: Explorer la vision et les transformateurs de langage

Couvre les architectures de transformateurs avancées en apprentissage profond, en se concentrant sur les modèles Swin, HUBERT et Flamingo pour les applications multimodales.

La robotique perceptuelle : intégration de la vision et de l’action

Couvre l'intégration de la perception visuelle et des actions robotiques dans l'IA incarnée.

Apprentissage automatique: Techniques d'apprentissage supervisé et non supervisé

Couvre les techniques d'apprentissage supervisées et non supervisées dans l'apprentissage automatique, en mettant en évidence leurs applications dans la finance et l'analyse environnementale.

Deep Learning: Présentation des graphiques et des transformateurs

Couvre les concepts d'apprentissage profond, en se concentrant sur les graphiques, les transformateurs et leurs applications dans le traitement des données multimodales.

Modèles de séquence de préformation: BART et T5

Couvre la préformation des modèles séquence à séquence, en se concentrant sur les architectures BART et T5.

Transformers: Techniques de pré-entraînement et de décodage

Couvre les concepts avancés de transformateur, en se concentrant sur les techniques de pré-formation et de décodage en PNL.

Intelligence visuelle: Machines et esprits

Explore l'intelligence visuelle, la formation d'images, la vision par ordinateur et la compréhension de la représentation dans les machines et les esprits.

Deep Learning : principes et applications

Couvre les principes fondamentaux de l'apprentissage profond, y compris les données, l'architecture et les considérations éthiques dans le déploiement de modèles.

Séquence à modèles de séquence: vue d'ensemble et applications

Couvre les modèles de séquence à séquence, leur architecture, leurs applications et le rôle des mécanismes d'attention dans l'amélioration des performances.

Modèles Vision-Langue-Action : Formation et applications

Se penche sur la formation et les applications des modèles Vision-Language-Action, en mettant l'accent sur le rôle des grands modèles linguistiques dans le contrôle robotique et le transfert des connaissances web. Les résultats des expériences et les orientations futures de la recherche sont mis en évidence.

Vision par ordinateur: aperçus historiques et inspirations de projets

Explore le développement historique de la vision par ordinateur et inspire des idées de projet innovantes.

Fondements de l'apprentissage automatique

Couvre les concepts fondamentaux de l'apprentissage automatique, y compris la classification, les algorithmes, l'optimisation, l'apprentissage supervisé, l'apprentissage par renforcement et diverses tâches telles que la reconnaissance d'images et la génération de texte.

Introduction à l'apprentissage automatique

Fournit un aperçu de l'apprentissage automatique, y compris le contexte historique, les tâches clés, et les applications du monde réel.

Deep Learning : réseaux neuronaux convolutifs

Couvre les réseaux neuronaux convolutifs, les architectures standard, les techniques de formation et les exemples contradictoires en apprentissage profond.

Manipuler des objets avec des robots : intégration vision-langage

Explique comment les robots manipulent des objets en utilisant des instructions en langage naturel et intègre des modèles de langage de vision pour améliorer les performances.

Réseaux neuronaux pour la PNL

Couvre les approches modernes du réseau neuronal en matière de PNL, en mettant l'accent sur l'intégration de mots, les réseaux neuronaux pour les tâches de PNL et les futures techniques d'apprentissage par transfert.