Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours traite des défis de l'analyse évolutive sur les Big Data hétérogènes et des limites des plateformes existantes comme Spark. Il présente SmartDataLake, une plate-forme visant à gérer efficacement les données brutes et hétérogènes en exploitant les plateformes existantes et en les étendant pour soutenir la manipulation native et l'analyse distribuée. La séance de cours porte sur des sujets tels que la distribution des données, l'ordonnancement adaptatif, le prétraitement des données et l'échelonnement automatisé du stockage. La conception de SmartDataLake est axée sur l'optimisation de la distribution des tâches, l'allocation des ressources et l'exécution des requêtes afin d'améliorer les performances et de réduire la latence. La séance de cours souligne également l'importance de l'échelonnement du stockage, de l'analyse approximative et du potentiel d'évolutivité économique. Diverses normes de référence de l'industrie seront utilisées pour valider les capacités de SmartDataLake.
Cette vidéo est disponible exclusivement sur Mediaspace pour un public restreint. Veuillez vous connecter à Mediaspace pour y accéder si vous disposez des autorisations nécessaires.
Regarder sur Mediaspace