Couvre les techniques de manipulation des données à l'aide de Hadoop, en se concentrant sur les bases de données axées sur les lignes et les colonnes, les formats de stockage populaires et l'intégration HBase-Hive.
Explore les défis et les solutions pour les mises à jour en temps réel sur les grands magasins de colonnes sur disque, en mettant l'accent sur l'isolation des instantanés et la performance de la requête.
Couvre l'intégration du stockage de données évolutives et de la carte réduisent le traitement à l'aide de Hadoop, y compris HDFS, Hive, Parquet, ORC, Spark et HBase.
Explore les perspectives historiques et les mécanismes de la mémoire transactionnelle, en soulignant l'importance et les défis de sa mise en œuvre dans les systèmes informatiques modernes.
Explore l'organisation des fichiers, les méthodes d'indexation et la conception du stockage des bases de données, y compris les formats d'enregistrement, les formats de page et la classification des index.