Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre les bases de l'analyse des données textuelles, en se concentrant sur les méthodes de classification et les techniques de réduction de la dimensionnalité. Il commence par une introduction aux objectifs et aux cadres de l'analyse, en approfondissant la complexité de la classification et les méthodes telles que les Bayes naïves, la régression logistique et les voisins les plus proches. La séance de cours explore également les matrices de dissemblance, les mesures habituelles et l'évaluation de la classification. En outre, il traite des cadres de réduction de dimensionnalité tels que l'analyse en composantes principales et l'échelle multidimensionnelle, soulignant l'importance de choisir les bonnes méthodes de classification. La présentation se termine par des points clés sur les critères d'optimisation des méthodes de classification et l'importance de la visualisation dans la compréhension des résultats de classification et de regroupement.