Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre le concept de stockage de table dans les lacs de données, en mettant l'accent sur des technologies comme Delta Lake, Iceberg et Hudi. Il explique comment ces systèmes supportent les mises à jour des dossiers et l'historique de leur développement. L'instructeur discute de la conception du stockage de table pour les mises à jour de mini-lots, de la séparation des données et des journaux incrémentaux, et de l'importance de l'isolement des instantanés. Différentes approches pour enregistrer les mises à jour dans Delta Lake, Iceberg et Hudi sont comparées, mettant en évidence leur efficacité pour différents cas d'utilisation.
Cette vidéo est disponible exclusivement sur Mediaspace pour un public restreint. Veuillez vous connecter à Mediaspace pour y accéder si vous disposez des autorisations nécessaires.
Regarder sur Mediaspace