Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours porte sur le concept de perturbation des données en tant que méthode de protection de la vie privée dans les systèmes de bases de données. Il explique comment les bases de données randomisées peuvent être utilisées pour introduire le bruit, en mettant l'accent sur les perturbations de rétention-replacement. L'instructeur discute des mécanismes de perturbation des données, comme la production de valeurs à partir de la distribution des probabilités d'une colonne et le remplacement ou le maintien en fonction des probabilités. La séance de cours traite également de la reconstruction d'agrégats sur des données perturbées, de l'estimation des valeurs originales et de la reconstruction des requêtes multicolonnes. En outre, il explore l'application de perturbations des données dans les modèles de formation pour l'extraction de données tout en préservant la vie privée. Le compromis entre les garanties de confidentialité et les taux d'erreur est mis en évidence, ainsi que les implications de la perturbation des données sur l'intégrité des données.