Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre la gestion des ressources dans Spark, en se concentrant sur les choix architecturaux, la tolérance aux pannes, la sécurité des données, la récupération des tâches et les limites de vanille Spark. Il explore également Spark SQL, les trames de données, les opérateurs DataFrame, les fonctions définies par l'utilisateur et les principes d'optimisation.