Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours porte sur les concepts d'anonymat K, de sanitisation des bases de données et de l-Diversité dans le contexte de la publication de données de préservation de la vie privée. Il examine les défis de l'anonymat k, les faiblesses de cette approche, et introduit l-Diversité comme solution. La présentation se penche sur les limites de la diversité f et de la diversité l, soulignant l'importance de considérer la distribution globale et la sémantique des valeurs sensibles. Des exemples réels, comme la publication de l'ensemble de données Netflix, illustrent les échecs des méthodes naïves de dé-identification et les risques associés à la rareté des données à haute dimension. La séance de cours conclut en examinant le cas des efforts d'Airbnb en matière de confidentialité des données et les vulnérabilités potentielles de leur approche.