Couvre les outils de science des données, Hadoop, Spark, les écosystèmes des lacs de données, le théorème CAP, le traitement par lots vs. flux, HDFS, Hive, Parquet, ORC, et l'architecture MapReduce.
Fournit un guide de survie pour OpenShift, couvrant la configuration des nœuds, la gestion des services, la gestion de la configuration et le dépannage des problèmes.