Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur GraphSearch.
Cette séance de cours traite du concept des lacs de données en tant que référentiels centraux pour diverses sources de données, en soulignant leurs différences par rapport aux entrepôts de données en termes de flexibilité et d'outils de nettoyage des données. Il explore la structure des données, en distinguant les données structurées, semi-structurées et non structurées, et souligne l'importance de la découverte de la structure pour une interrogation efficace des données. L'instructeur explique également l'objectif des lacs de données pour éliminer le besoin de processus ETL avant l'ingestion de données, ce qui permet un traitement flexible des données et une compatibilité logicielle.