Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours présente Spark Data Frames, en discutant de leur origine, des avantages de performance par rapport aux DDR, et quand les utiliser. Il couvre le Catalyst Optimizer, l'intégration de PySpark et la transition vers DataSets. L'instructeur explore également l'analyse du corpus Gutenberg à l'aide de Spark.