Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre les techniques de traitement de texte pour l'analyse de données, y compris le nettoyage de texte, la tokenisation, la ramification et la lemmatisation. Il traite également des étapes de prétraitement de texte courantes telles que la suppression de mots d'arrêt et les méthodes de vectorisation telles que Bag of Words et TF-IDF.