Cette séance de cours couvre l'évolution des modèles d'exécution pour l'informatique distribuée, en se concentrant sur la 2ème génération. Il traite des limites de MapReduce, de l'introduction de Spark et du concept des ensembles de données résilients distribués (RDD). La séance de cours explore les choix architecturaux de Spark, les avantages des DDR sur Hadoop HDFS, et les principes de conception des systèmes de big data. Il se consacre également à la gestion des ressources dans les environnements distribués, aux stratégies de tolérance aux défauts et aux mécanismes de rétablissement de l'emploi à Spark.
Cette vidéo est disponible exclusivement sur Mediaspace pour un public restreint. Veuillez vous connecter à Mediaspace pour y accéder si vous disposez des autorisations nécessaires.
Regarder sur Mediaspace