Couvre l'optimisation des requêtes relationnelles, y compris les plans de requêtes logiques et physiques, l'estimation des coûts, les équivalences et la stratégie du système R.
Explore l'omniprésence des graphiques dans les données et les analyses modernes, en mettant l'accent sur le changement dans la perception des organisations des technologies graphiques.
Introduit des concepts de modélisation de données, l'utilisation de SQL et des applications de bibliothèque Pandas pour un traitement efficace des données.
Explore le débat historique entre les modèles de données relationnels et non relationnels, en couvrant les caractéristiques clés et les exemples de chacun.
Explore le traitement des requêtes par blocs dans les bases de données, mettant l'accent sur les défis de matérialisation et l'exécution optimisée pour les applications à forte intensité de données.
Couvre l'intégration du stockage de données évolutives et de la carte réduisent le traitement à l'aide de Hadoop, y compris HDFS, Hive, Parquet, ORC, Spark et HBase.