Couvre les bases de données relationnelles et spatiales, y compris le stockage, les systèmes de gestion, les propriétés ACID, les typologies historiques, les clés primaires et étrangères et les fonctions spatiales.
Couvre les outils de science des données, Hadoop, Spark, les écosystèmes des lacs de données, le théorème CAP, le traitement par lots vs. flux, HDFS, Hive, Parquet, ORC, et l'architecture MapReduce.
Couvre les bases de données relationnelles, les transactions et la cohérence des données dans le contexte des typologies historiques des bases de données.
Explore l'analyse micro-architecturale de DBMS moderne, en mettant l'accent sur l'optimisation des performances et l'atténuation du décrochage des caches de données.
Explore la motivation et les avantages de l'utilisation des GPU pour le calcul, en se concentrant sur leurs performances et leur programmation via CUDA.
Explore Apache Hive pour l'entreposage de données, les formats de données et la partition, avec des exercices pratiques dans la requête et la connexion à Hive.
Explore l'élégance et les défis des transactions, y compris les propriétés ACID et les avantages de la mémoire transactionnelle dans la programmation simultanée.
Introduit des concepts de modélisation de données, l'utilisation de SQL et des applications de bibliothèque Pandas pour un traitement efficace des données.