Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours porte sur l'évolution des systèmes de traitement de flux, des systèmes centralisés en mémoire aux systèmes de flux de données distribués comme MapReduce, Spark Streaming et Flink. Il explique le concept d'état dans le traitement des flux, y compris les fenêtres, les agrégats et les variables définies par l'utilisateur. La séance de cours traite également de questions de gestion de l'état telles que l'évolutivité, la persistance et la cohérence, et explore différentes approches de la gestion de l'état, y compris l'utilisation de synopses, l'état défini par l'utilisateur et géré par le système. Des exemples de manipulation d'état dans les systèmes de traitement des flux sont fournis, soulignant l'importance de l'état dans l'expression des opérateurs et les compromis entre l'état géré par système et l'état défini par l'utilisateur.