Explore les sujets avancés de Spark comme les stratégies de partitionnement, l'optimisation de la mémoire et les opérations de shuffle pour une exécution efficace des tâches.
Couvre les champs d'application, les lambdas et les pandas en science des données avec Python, y compris les déclarations imbriquées, la détermination de la portée, les affectations et la manipulation des pandas.
Couvre les cadres de données Spark, les collections distribuées de données organisées en colonnes nommées, et les avantages de les utiliser sur les DDR.