Cette séance de cours couvre les choix de conception des systèmes Big Data, en mettant l'accent sur la couche de stockage, le modèle de programmation, le moteur d'exécution, la gestion des ressources et la tolérance aux défauts. Il explique comment des systèmes comme Yarn permettent à plusieurs cadres de coexister, les décisions de granularités variables dans la gestion des ressources, les choix architecturaux de Spark, et l'importance de la tolérance aux défauts face aux défaillances du matériel/logiciel. La séance de cours traite également de la sécurité des données, de la reprise de l'emploi à Spark et de l'impact des échecs sur la performance.
Cette vidéo est disponible exclusivement sur Mediaspace pour un public restreint. Veuillez vous connecter à Mediaspace pour y accéder si vous disposez des autorisations nécessaires.
Regarder sur Mediaspace