Explore l'organisation des fichiers, les méthodes d'indexation et la conception du stockage des bases de données, y compris les formats d'enregistrement, les formats de page et la classification des index.
Explore l'organisation des fichiers, les techniques d'indexation et les métadonnées dans les bases de données, soulignant l'importance de choisir la bonne clé de recherche.
Couvre les outils de science des données, Hadoop, Spark, les écosystèmes des lacs de données, le théorème CAP, le traitement par lots vs. flux, HDFS, Hive, Parquet, ORC, et l'architecture MapReduce.
Discute du stockage des données dans les systèmes de base de données, en mettant l'accent sur l'efficacité et les temps d'accès pour différents types de stockage.