Concept

Lac de données

Résumé
Un lac de données (en anglais data lake) est une méthode de stockage de données massives utilisée par le big data (mégadonnées en français). Ces données sont gardées dans leurs formats originaux ou sont très peu transformées. Le lac de données donne la priorité au stockage rapide et volumineux de données hétérogènes en adoptant une architecture en cluster. Il n'est pas optimisé pour les requêtes SQL comme les SGBD relationnels classiques, et s'écarte des Propriétés ACID traditionnelles. On parle depuis 2010 de SGBD NoSQL. Big Data On trouve donc dans un lac de données des données de natures et de sources différentes, telles que :
  • des données structurées issues notamment de bases de données relationnelles (lignes et colonnes) ;
  • des données variées issues de bases NoSQL ;
  • des données semi-structurées (fichiers CSV, journaux, XML, JSON...) ;
  • des données non structurées (emails, documents, PDF) ;
  • des fichiers de type blob (images, audio, vidéo notamment).
Ces données sont c
À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.
Publications associées

Chargement

Personnes associées

Chargement

Unités associées

Chargement

Concepts associés

Chargement

Cours associés

Chargement

Séances de cours associées

Chargement