Cette séance de cours traite du concept des lacs de données en tant que référentiels centraux pour diverses sources de données, en soulignant leurs différences par rapport aux entrepôts de données en termes de flexibilité et d'outils de nettoyage des données. Il explore la structure des données, en distinguant les données structurées, semi-structurées et non structurées, et souligne l'importance de la découverte de la structure pour une interrogation efficace des données. L'instructeur explique également l'objectif des lacs de données pour éliminer le besoin de processus ETL avant l'ingestion de données, ce qui permet un traitement flexible des données et une compatibilité logicielle.
Cette vidéo est disponible exclusivement sur Mediaspace pour un public restreint. Veuillez vous connecter à Mediaspace pour y accéder si vous disposez des autorisations nécessaires.
Regarder sur Mediaspace