Présente les bases du traitement de données textuelles, couvrant la récupération de documents, la classification, l'analyse des sentiments et la détection de sujets.
Explore le traitement des données texte, en dérivant des ensembles de données propres à partir de textes non structurés, et diverses techniques d'analyse de texte.
Couvre les concepts de base de la récupération d'informations textuelles et la façon dont les documents sont indexés et récupérés en fonction des requêtes des utilisateurs.
Explore la gestion des fichiers et les exceptions dans la programmation Python, couvrant la lecture, l'écriture et les stratégies de gestion des erreurs.
Explore la recherche de documents, la classification, l'analyse des sentiments, les matrices TF-IDF, les méthodes de voisinage les plus proches, la factorisation matricielle, la régularisation, LDA, les vecteurs de mots contextualisés et BERT.
Couvre les bases de Python telles que la syntaxe, les variables et les fonctions, en introduisant la plate-forme Renku pour la science collaborative des données.