Examine les éléments fondamentaux de la gestion des données, y compris les modèles, les sources et les querelles, en soulignant l'importance de comprendre et de résoudre les problèmes de données.
Explore l'utilisation d'interconnexions rapides pour le co-traitement évolutif avec les GPU dans les bases de données, soulignant l'importance de surmonter le goulot d'étranglement du transfert et de réévaluer les hypothèses d'amélioration des performances.
Couvre l'intégration de l'apprentissage automatique avec la microscopie à sonde à balayage pour une automatisation et une efficacité améliorées dans les flux de travail scientifiques.
Présentation d'Apache Spark, couvrant son architecture, ses RDD, ses transformations, ses actions, sa tolérance aux pannes, ses options de déploiement et ses exercices pratiques dans les blocs-notes Jupyter.
Discute de la modélisation des systèmes hydrologiques, en mettant l'accent sur le routage et la rétention des inondations à l'aide d'une nouvelle base de données.
Explore l'analyse micro-architecturale de DBMS moderne, en mettant l'accent sur l'optimisation des performances et l'atténuation du décrochage des caches de données.