Explore la signification de la mémoire cache par rapport à la localisation spatiale et temporelle, en mettant l'accent sur l'efficacité du cache en fonction des caractéristiques du programme.
Couvre les outils de science des données, Hadoop, Spark, les écosystèmes des lacs de données, le théorème CAP, le traitement par lots vs. flux, HDFS, Hive, Parquet, ORC, et l'architecture MapReduce.
Introduit les bases de la cohérence du cache, couvrant l'organisation du cache, les protocoles de cohérence et les défis dans les hiérarchies de cache à plusieurs niveaux.