Séance de cours

Évoluer vers des données massives: Fondements de l'étincelle

Description

Cette séance de cours couvre les fondamentaux de l'échelle vers des données massives à l'aide de Spark, en mettant l'accent sur les DDR, les transformations, les actions, l'architecture Spark, et la boîte à outils d'apprentissage automatique de Spark. Il explique les défis du big data, le matériel nécessaire et les solutions fournies par Spark. La séance de cours présente également Spark SQL et Spark Machine Learning Toolkit (MLlib), des exemples de régression logistique. Il met l'accent sur l'importance de comprendre les DDR et les cadres de données et donne des renseignements sur les capacités de Spark à traiter les données à grande échelle.

À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.