Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre les étapes de prétraitement pour les tâches de traitement du langage naturel, en se concentrant sur la tokenisation, l'élimination des mots d'arrêt et la lemmatisation. L'instructeur guide à travers le processus de préparation de données textuelles pour l'analyse des sentiments à l'aide de bibliothèques Python comme NLTK et Spacy. La séance de cours comprend des exemples pratiques de tokenisation du texte, de suppression des mots d'arrêt et de réduction des mots à leur forme de base. Les étudiants apprendront à mettre en œuvre ces techniques étape par étape et à comprendre leur importance dans les tâches d'analyse de texte.