Cette séance de cours couvre l'écosystème Spark, en mettant l'accent sur les choix architecturaux et l'interface Spark SQL. Il examine les limites de MapReduce, introduit le concept de données distribuées résilientes (DDR), et compare les DDR avec Hadoop HDFS. La séance de cours explique également la couche de stockage dans Spark, en mettant l'accent sur l'abstraction fournie par les DDR et l'utilisation de RAM distribuée.
Cette vidéo est disponible exclusivement sur Mediaspace pour un public restreint. Veuillez vous connecter à Mediaspace pour y accéder si vous disposez des autorisations nécessaires.
Regarder sur Mediaspace