Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre les fondamentaux de l'échelle vers des données massives à l'aide de Spark, en mettant l'accent sur les DDR, les transformations, les actions, l'architecture Spark, et la boîte à outils d'apprentissage automatique de Spark. Il explique les défis du big data, le matériel nécessaire et les solutions fournies par Spark. La séance de cours présente également Spark SQL et Spark Machine Learning Toolkit (MLlib), des exemples de régression logistique. Il met l'accent sur l'importance de comprendre les DDR et les cadres de données et donne des renseignements sur les capacités de Spark à traiter les données à grande échelle.