Introduit le modèle relationnel et l'algèbre, essentiels pour comprendre les systèmes à forte intensité de données et la gestion efficace des bases de données.
Introduit la modélisation sémantique par le biais de données tabulaires et de RDF, couvrant les bases de données relationnelles, la migration de schémas, les schémas à l'épreuve du temps, l'interrogation SPARQL et les limitations de métaconnaissance.
Couvre les cadres de données Spark, les collections distribuées de données organisées en colonnes nommées, et les avantages de les utiliser sur les DDR.
Explore l'appariement des patrons de mise à l'échelle dans les grands graphiques et optimise l'exécution des requêtes sous des contraintes de mémoire en utilisant le partage de travail et le traitement par lots.
Discute de la modélisation des systèmes hydrologiques, en mettant l'accent sur le routage et la rétention des inondations à l'aide d'une nouvelle base de données.