Séance de cours

De l'attention aux transformateurs

Séances de cours associées (31)

Représentations contextuelles : ELMO et BERT Vue d'ensemble

Couvre les représentations contextuelles en PNL, en se concentrant sur les architectures ELMO et BERT et leurs applications dans diverses tâches.

Préformation: Transformateurs et modèles

Explore les modèles de préformation comme BERT, T5 et GPT, en discutant de leurs objectifs de formation et de leurs applications dans le traitement des langues naturelles.

Pré-entraînement : BiLSTM et Transformateur

Plongez dans les modèles BiLSTM et Transformer de pré-formation pour les tâches NLP, en démontrant leur efficacité et leurs applications.

Réseaux neuronaux pour la PNL

Couvre les approches modernes du réseau neuronal en matière de PNL, en mettant l'accent sur l'intégration de mots, les réseaux neuronaux pour les tâches de PNL et les futures techniques d'apprentissage par transfert.

Cartes cognitives chez les rats et les hommes

Explore les cartes cognitives, les systèmes de récompense, l'apprentissage latent, les mécanismes d'attention et les transformateurs de l'intelligence visuelle et de l'apprentissage automatique.

Réseaux neuronaux : Réseau neuronal à deux couches

Couvre les bases des réseaux neuraux, en mettant l'accent sur le développement des réseaux neuraux de deux couches vers les réseaux neuraux profonds.

Réseaux de neurones récurrents: formation et défis

Discute des réseaux neuronaux récurrents, de leurs défis de formation et de solutions telles que les LSTM et les GRU.

Transformateurs Graph-to-Graph : Encodage graphique sensible à la syntaxe

Introduit l'architecture Graph-to-Graph Transformer sensible à la syntaxe pour un conditionnement efficace sur les graphes de dépendance syntaxiques.

Architecture des transformateurs : mécanismes d'attention subquadratiques

Couvre l'architecture du transformateur, en se concentrant sur les modèles codeurs-décodeurs et les mécanismes d'attention subquadratiques pour un traitement efficace des séquences d'entrée.

Réactions chimiques : Architecture des transformateurs

Explore la cartographie des atomes dans les réactions chimiques et la transition vers la grammaire réactionnelle à l'aide de l'architecture du transformateur.

Modèles de séquence de préformation: BART et T5

Couvre la préformation des modèles séquence à séquence, en se concentrant sur les architectures BART et T5.