Séance de cours

Optimisations et partitionnement avancés des sparks

Description

Cette séance de cours couvre les optimisations avancées de Spark et les techniques de partitionnement, y compris la gestion des données asymétriques, des déséquilibres et l'utilisation de la persistance. Il traite également d'une liste de contrôle d'optimisation, des meilleures pratiques et de l'utilisation des niveaux de persistance. En outre, il explore Spark MLlib pour les tâches d'apprentissage automatique, telles que la classification, la régression logistique, le clustering, et fournit des références utiles pour l'apprentissage ultérieur.

À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.