Cette séance de cours présente Spark Data Frames, en discutant de leur origine, des avantages de performance par rapport aux DDR, et quand les utiliser. Il couvre le Catalyst Optimizer, l'intégration de PySpark et la transition vers DataSets. L'instructeur explore également l'analyse du corpus Gutenberg à l'aide de Spark.