Séance de cours

Prétraitement PNL: Tokenization, Stop Words, Lemmatization

Dans cours

EE-608: Deep Learning For Natural Language Processing

The Deep Learning for NLP course provides an overview of neural network based methods applied to text. The focus is on models particularly suited to the properties of human language, such as categori

Description

Cette séance de cours couvre les étapes de prétraitement pour les tâches de traitement du langage naturel, en se concentrant sur la tokenisation, l'élimination des mots d'arrêt et la lemmatisation. L'instructeur guide à travers le processus de préparation de données textuelles pour l'analyse des sentiments à l'aide de bibliothèques Python comme NLTK et Spacy. La séance de cours comprend des exemples pratiques de tokenisation du texte, de suppression des mots d'arrêt et de réduction des mots à leur forme de base. Les étudiants apprendront à mettre en œuvre ces techniques étape par étape et à comprendre leur importance dans les tâches d'analyse de texte.

Enseignant

James Henderson

Source officielle

Séances de cours associées (32)

Formation des classificateurs de sentiments binaires

Couvre la formation d'un classificateur de sentiment binaire à l'aide d'un RNN.

Réseaux neuronaux pour la PNL

Couvre les approches modernes du réseau neuronal en matière de PNL, en mettant l'accent sur l'intégration de mots, les réseaux neuronaux pour les tâches de PNL et les futures techniques d'apprentissage par transfert.

Traitement du langage naturel: comprendre les transformateurs et la tokenisation

Fournit un aperçu du traitement du langage naturel, en se concentrant sur les transformateurs, la tokenisation et les mécanismes d'auto-attention pour une analyse et une synthèse efficaces du langage.

Deep Learning pour le NLP

Introduit des concepts d'apprentissage profond pour les NLP, couvrant l'intégration de mots, les RNN et les Transformateurs, mettant l'accent sur l'auto-attention et l'attention multi-têtes.

Introduction au traitement du langage naturel moderne

Introduit le cours sur le traitement du langage naturel moderne, couvrant son importance, ses applications, ses défis et les progrès de la technologie.

Afficher plus