Séance de cours

Entreposage de tableaux dans les lacs de données

Description

Cette séance de cours couvre le concept de stockage de table dans les lacs de données, en mettant l'accent sur des technologies comme Delta Lake, Iceberg et Hudi. Il explique comment ces systèmes supportent les mises à jour des dossiers et l'historique de leur développement. L'instructeur discute de la conception du stockage de table pour les mises à jour de mini-lots, de la séparation des données et des journaux incrémentaux, et de l'importance de l'isolement des instantanés. Différentes approches pour enregistrer les mises à jour dans Delta Lake, Iceberg et Hudi sont comparées, mettant en évidence leur efficacité pour différents cas d'utilisation.

Cette vidéo est disponible exclusivement sur Mediaspace pour un public restreint. Veuillez vous connecter à Mediaspace pour y accéder si vous disposez des autorisations nécessaires.

Regarder sur Mediaspace
À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.