Séance de cours

Modèles de séquence à séquence: BART + T5

Prédiction de réaction chimique : Transformateur moléculaire

Explore la prédiction des réactions chimiques à l'aide de modèles générateurs et de transformateurs moléculaires, soulignant l'importance du traitement du langage moléculaire et de la stéréochimie.

Annotation des données : collecte et biais dans la PNL

Aborde la collecte de données, les processus d'annotation et les biais dans le traitement du langage naturel.

Fondements de l'apprentissage profond: Aperçu de l'architecture transformatrice

Couvre les concepts fondamentaux de l'apprentissage profond et de l'architecture Transformer, en se concentrant sur les réseaux neuronaux, les mécanismes d'attention et leurs applications dans les tâches de modélisation de séquence.

Transformateurs: Vue d'ensemble et auto-attention

Fournit un aperçu des Transformateurs, de l'auto-attention, de l'attention multi-têtes, et du décodeur et de l'encodeur Transformateur.

Pré-entraînement : BiLSTM et Transformateur

Plongez dans les modèles BiLSTM et Transformer de pré-formation pour les tâches NLP, en démontrant leur efficacité et leurs applications.

Modèles génériques : auto-attention et transformateurs

Couvre les modèles générateurs en mettant l'accent sur l'auto-attention et les transformateurs, en discutant des méthodes d'échantillonnage et des moyens empiriques.

Représentations contextuelles: ELMo & BERT

Explore le développement d'intégrations contextuelles dans le NLP, en mettant l'accent sur les progrès réalisés par ELMo et BERT et son impact sur les tâches du NLP.

Architecture des transformateurs : le X Gomega

Déplacez-vous dans l'architecture Transformer, l'auto-attention et les stratégies de formation pour la traduction automatique et la reconnaissance d'image.

Résolution de coréférence : Modèles et évaluation

Explore les modèles de résolution de coréférence, les défis dans les échelles de notation, les techniques de raffinement des graphiques, les résultats de pointe et l'impact des transformateurs préentraînés.

Modèles de langage: De la théorie à l'informatique

Explore les mathématiques des modèles de langues, couvrant la conception de l'architecture, la pré-formation et l'ajustement fin, soulignant l'importance de la pré-formation et de l'ajustement fin pour diverses tâches.