Séance de cours

Cadres de données Spark: Vue d'ensemble et analyse des performances

Description

Cette séance de cours présente Spark Data Frames, en discutant de leur origine, des avantages de performance par rapport aux DDR, et quand les utiliser. Il couvre le Catalyst Optimizer, l'intégration de PySpark et la transition vers DataSets. L'instructeur explore également l'analyse du corpus Gutenberg à l'aide de Spark.

À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.