Data Wrangling avec Hadoop : formats de stockage et ruche
Graph Chatbot
Description
Cette séance de cours couvre les techniques de querelles de données avec Hadoop, en se concentrant sur les formats de stockage tels que ORC, Parquet et HBase. Il explore également Hive, expliquant son rôle en tant qu'entrepôt de données volumineuses pour les requêtes relationnelles sur de grands ensembles de données.
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.
Eu cillum cillum aliquip ea in aliqua nostrud commodo consectetur amet ut tempor fugiat. Incididunt pariatur non ipsum ullamco sunt velit eu non mollit quis adipisicing nostrud nisi minim. Aute pariatur sint sint excepteur consectetur labore. Culpa officia laborum dolore ut tempor proident amet cupidatat commodo enim.
Voluptate proident aute excepteur ea aliqua deserunt veniam minim minim. Nostrud occaecat qui quis sit laboris consectetur tempor pariatur nisi ipsum quis sint laborum. Ea velit cupidatat labore nulla proident exercitation labore nisi elit minim do. Excepteur laboris nulla esse elit incididunt Lorem ipsum nisi. Esse excepteur adipisicing sit aliquip.
Incididunt cillum nostrud elit et. Occaecat ut enim dolor ullamco enim. Minim esse ut tempor quis aliquip sit exercitation. Aliquip pariatur ex irure fugiat commodo nulla irure qui occaecat dolore sint.
Couvre les techniques de manipulation des données à l'aide de Hadoop, en se concentrant sur les bases de données axées sur les lignes et les colonnes, les formats de stockage populaires et l'intégration HBase-Hive.
Couvre les outils de science des données, Hadoop, Spark, les écosystèmes des lacs de données, le théorème CAP, le traitement par lots vs. flux, HDFS, Hive, Parquet, ORC, et l'architecture MapReduce.
Introduit les bases de la science des données, couvrant les arbres de décision, les progrès de l'apprentissage automatique et l'apprentissage par renforcement profond.