Couvre les fondamentaux des écosystèmes de big data, en se concentrant sur les technologies, les défis et les exercices pratiques avec le HDFS d'Hadoop.
Introduit des outils collaboratifs de science des données comme Git et Docker, en mettant l'accent sur le travail d'équipe et les exercices pratiques pour un apprentissage efficace.
Renku est une plate-forme pour la science des données collaborative permettant la reproductibilité et la promotion de la réutilisation du code et des données.
Explore les caractéristiques de la turbulence, les méthodes de simulation et les défis de modélisation, fournissant des lignes directrices pour le choix et la validation des modèles de turbulence.
Présente des outils collaboratifs de science des données comme les carnets Jupyter, Docker et Git, mettant l'accent sur la version des données et la conteneurisation.
Explore la gestion des fichiers et les exceptions dans la programmation Python, couvrant la lecture, l'écriture et les stratégies de gestion des erreurs.