Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre les concepts de similarité Jaccard, de minhashing et de hachage sensible à la localité pour la synthèse des données. Il explique comment trouver des éléments similaires en utilisant la similarité Jaccard et les vecteurs de bits, et comment réduire les faux positifs et les négatifs dans la détection de similarité. La séance de cours se penche également sur la construction des fonctions de hachage et l'application de la distance cosinus pour la similarité des documents.