Séance de cours

Concepts avancés de traitement du flux de données

Description

Cette séance de cours couvre des concepts avancés dans le traitement des flux de données, en se concentrant sur des sujets tels que le traitement des flux avec Apache Kafka, Spark stream, les fenêtres de flux de données dans Spark et les pipelines d'analyse Kafka-Spark de bout en bout. Il se penche également sur les opérations telles que les jointures, les jointures de flux et la gestion des données en retard / hors commande. L'instructeur fournit des informations sur le temps d'événement par rapport au temps de traitement, le filigrane dans Spark Streaming et des exercices pratiques avec Spark Streaming. Les étudiants sont guidés sur la façon de modéliser l'infrastructure de transport public pour la planification des itinéraires, de construire des modèles prédictifs, de mettre en œuvre des algorithmes robustes et de valider les résultats. La séance de cours souligne l'importance du travail d'équipe, de la reproductibilité et d'une communication efficace grâce à des présentations vidéo.

À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.