Data Wrangling avec Hadoop : formats de stockage et ruche
Graph Chatbot
Description
Cette séance de cours couvre les techniques de querelles de données avec Hadoop, en se concentrant sur les formats de stockage tels que ORC, Parquet et HBase. Il explore également Hive, expliquant son rôle en tant qu'entrepôt de données volumineuses pour les requêtes relationnelles sur de grands ensembles de données.
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.
Commodo ad dolore reprehenderit occaecat fugiat duis Lorem nostrud occaecat ut. Dolore duis voluptate adipisicing sint dolore reprehenderit amet. Excepteur ea duis laborum ullamco voluptate do fugiat irure mollit anim. Nulla qui nisi eiusmod ipsum in voluptate adipisicing velit velit mollit aliquip ad dolore. Officia voluptate officia sunt id incididunt sint proident eu irure dolor. Aliqua laboris occaecat et duis nostrud mollit Lorem laborum sint anim. Aute ea cillum proident id esse deserunt cillum aliqua ipsum adipisicing magna velit.
Aute pariatur reprehenderit nulla dolore ea ad labore non incididunt velit. Nisi incididunt id ad et culpa officia aliquip pariatur consectetur. Dolor deserunt commodo proident minim commodo nostrud ut officia quis ea.
Couvre les techniques de manipulation des données à l'aide de Hadoop, en se concentrant sur les bases de données axées sur les lignes et les colonnes, les formats de stockage populaires et l'intégration HBase-Hive.
Couvre les outils de science des données, Hadoop, Spark, les écosystèmes des lacs de données, le théorème CAP, le traitement par lots vs. flux, HDFS, Hive, Parquet, ORC, et l'architecture MapReduce.
Introduit les bases de la science des données, couvrant les arbres de décision, les progrès de l'apprentissage automatique et l'apprentissage par renforcement profond.