Séance de cours

Exercice de dénonymisation

Description

Cette séance de cours couvre le processus de déanonymisation à l'aide de deux ensembles de données publics : l'un anonymisé et publié par Netflix, et l'autre non anonymisé. Les ensembles de données sont chargés et affichés, contenant des noms aléatoires et des évaluations. L'exercice consiste à faire correspondre les utilisateurs entre les ensembles de données, à trier par notation et à trouver des films manquants. La séance de cours progresse pour traiter des ensembles de données plus importants, évaluer les correspondances des utilisateurs et relever les défis des bases de données du monde réel. On discute des techniques telles que l'évaluation des fréquences et les corrélations probabilistes, en mettant l'accent sur la complexité de l'appariement précis et la nécessité d'approches probabilistes.

À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.