Séance de cours

Data Lakes : structure et optimisation

Description

Cette séance de cours traite du concept des lacs de données en tant que référentiels centraux pour diverses sources de données, en soulignant leurs différences par rapport aux entrepôts de données en termes de flexibilité et d'outils de nettoyage des données. Il explore la structure des données, en distinguant les données structurées, semi-structurées et non structurées, et souligne l'importance de la découverte de la structure pour une interrogation efficace des données. L'instructeur explique également l'objectif des lacs de données pour éliminer le besoin de processus ETL avant l'ingestion de données, ce qui permet un traitement flexible des données et une compatibilité logicielle.

À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.