Séance de cours

Défis du Big Data : l'expansion vers des données massives

Dans cours
DEMO: cupidatat proident ipsum
Adipisicing amet incididunt deserunt id ad est laboris laborum deserunt anim aliquip occaecat. Ad mollit minim sunt fugiat duis tempor eiusmod eu. Laboris eiusmod occaecat labore enim velit pariatur ut id consectetur et. Proident velit voluptate Lorem adipisicing consectetur aliquip non ea incididunt reprehenderit commodo elit eu pariatur.
Connectez-vous pour voir cette section
Description

Cette séance de cours de l'instructeur couvre les défis de la manipulation massive des données à l'ère du big data. En commençant par les limites du traitement de l'information par une seule machine, la séance de cours se penche sur les sources de données croissantes et sur la nécessité de l'informatique distribuée. Il explore des exemples de grands ensembles de données provenant d'entreprises comme Facebook et Google, soulignant la nécessité de stockage et de traitement de données distribués. La séance de cours traite de la distribution des données en droit de l'énergie et des exigences matérielles pour le traitement des mégadonnées. Il introduit des concepts comme MapReduce et Spark comme solutions pour le traitement des données distribuées, mettant en évidence leur architecture et leurs caractéristiques clés. La séance de cours aborde également des concepts comme l'exécution paresseuse, les transformations, les actions, les variables de diffusion, les accumulateurs, la persistance de la DDR et les Spark DataFrames.

Enseignant
anim minim incididunt quis
Dolore tempor officia dolor et culpa aute voluptate anim deserunt nulla. Anim voluptate Lorem elit labore. Deserunt sint cupidatat mollit est non cupidatat in enim consectetur reprehenderit ullamco officia velit fugiat. Exercitation velit exercitation ad esse eiusmod laboris nisi amet culpa consectetur sunt aliquip. Dolore ea quis anim velit ut mollit Lorem non. Ea incididunt enim exercitation laboris culpa id culpa proident dolore sit exercitation Lorem. Minim commodo nostrud aute enim sunt velit sint amet irure cillum.
Connectez-vous pour voir cette section
À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.
Séances de cours associées (40)
Introduction générale aux données massives
Couvre les outils de science des données, Hadoop, Spark, les écosystèmes des lacs de données, le théorème CAP, le traitement par lots vs. flux, HDFS, Hive, Parquet, ORC, et l'architecture MapReduce.
Big Data: Meilleures pratiques et lignes directrices
Couvre les meilleures pratiques et les lignes directrices pour les mégadonnées, y compris les lacs de données, l'architecture, les défis et les technologies comme Hadoop et Hive.
Cadres de données Spark
Couvre les cadres de données Spark, les collections distribuées de données organisées en colonnes nommées, et les avantages de les utiliser sur les DDR.
Régression logistique : prédiction de la végétation
Explore la régression logistique pour prédire les proportions de la végétation dans la région amazonienne grâce à l'analyse des données de télédétection.
L'échange de données avec Hadoop
Couvre les techniques de manipulation des données à l'aide de Hadoop, en se concentrant sur les bases de données axées sur les lignes et les colonnes, les formats de stockage populaires et l'intégration HBase-Hive.
Afficher plus

Graph Chatbot

Chattez avec Graph Search

Posez n’importe quelle question sur les cours, conférences, exercices, recherches, actualités, etc. de l’EPFL ou essayez les exemples de questions ci-dessous.

AVERTISSEMENT : Le chatbot Graph n'est pas programmé pour fournir des réponses explicites ou catégoriques à vos questions. Il transforme plutôt vos questions en demandes API qui sont distribuées aux différents services informatiques officiellement administrés par l'EPFL. Son but est uniquement de collecter et de recommander des références pertinentes à des contenus que vous pouvez explorer pour vous aider à répondre à vos questions.