Couvre les techniques de manipulation des données à l'aide de Hadoop, en se concentrant sur les bases de données axées sur les lignes et les colonnes, les formats de stockage populaires et l'intégration HBase-Hive.
Couvre les fondements des systèmes de base de données, y compris la modélisation des données, le traitement de l'information et les défis de la gestion d'importants volumes de données.
Discute des systèmes de fichiers, en mettant l'accent sur l'organisation des données, les techniques d'indexation et leur impact sur les performances de la base de données.
Introduit des concepts de modélisation de données, l'utilisation de SQL et des applications de bibliothèque Pandas pour un traitement efficace des données.
Discute des opérateurs de requête avancés, en se concentrant sur les techniques de jointure et leurs méthodes de traitement dans les bases de données relationnelles.