Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre les concepts de traitement des flux et de tolérance aux défauts dans l'analyse des mégadonnées. Il traite de la mesure du temps dans les flux de données, des techniques de gestion des flux efficaces, des plates-formes de mise à l'échelle comme Spark Streaming et Apache Flink, des stratégies de tolérance aux défauts telles que la réplication et la sauvegarde en amont, et de l'utilisation de DStreams pour le traitement des flux discrétés. L'instructeur explique les techniques de tolérance aux défauts pour les systèmes de traitement des flux, y compris le cloisonnement d'état et les tâches immuables. Des exemples d'opérations de nombre de mots en streaming et de fenêtres coulissantes sont fournis, montrant la combinaison de calculs par lots et de calculs en streaming. La séance de cours se termine par une vision d'unifier les modèles de traitement par lots et par flux dans une seule pile.
Cette vidéo est disponible exclusivement sur Mediaspace pour un public restreint. Veuillez vous connecter à Mediaspace pour y accéder si vous disposez des autorisations nécessaires.
Regarder sur Mediaspace