Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre des concepts avancés dans le traitement des flux de données, en se concentrant sur des sujets tels que le traitement des flux avec Apache Kafka, Spark stream, les fenêtres de flux de données dans Spark et les pipelines d'analyse Kafka-Spark de bout en bout. Il se penche également sur les opérations telles que les jointures, les jointures de flux et la gestion des données en retard / hors commande. L'instructeur fournit des informations sur le temps d'événement par rapport au temps de traitement, le filigrane dans Spark Streaming et des exercices pratiques avec Spark Streaming. Les étudiants sont guidés sur la façon de modéliser l'infrastructure de transport public pour la planification des itinéraires, de construire des modèles prédictifs, de mettre en œuvre des algorithmes robustes et de valider les résultats. La séance de cours souligne l'importance du travail d'équipe, de la reproductibilité et d'une communication efficace grâce à des présentations vidéo.