Couvre les techniques de manipulation des données à l'aide de Hadoop, en se concentrant sur les bases de données axées sur les lignes et les colonnes, les formats de stockage populaires et l'intégration HBase-Hive.
Couvre les cadres de données Spark, les collections distribuées de données organisées en colonnes nommées, et les avantages de les utiliser sur les DDR.
Explore l'hydraulique fluviale, la modélisation et l'étalonnage en utilisant une approche semi-distribuée pour des prévisions précises et la gestion des ressources en eau.
Explore la convergence, les pathologies numériques et les études de convergence de maillage dans les discrétisations d'éléments finis.
Explore Apache Hive pour l'entreposage de données, les formats de données et la partition, avec des exercices pratiques dans la requête et la connexion à Hive.
Explore la création de tableaux de bord dans ServiceNow, en mettant l'accent sur les avantages, la transition des pages d'accueil et des concepts importants comme les tâches et les incidents.
Couvre les bases de l'analyse des données Excel et des techniques de prévision.
Couvre les outils de science des données, Hadoop, Spark, les écosystèmes des lacs de données, le théorème CAP, le traitement par lots vs. flux, HDFS, Hive, Parquet, ORC, et l'architecture MapReduce.
Explore les concepts de modélisation de données, les implémentations SQL et les applications pratiques dans la gestion des données manquantes.
Couvre l'analyse des données sur la pollution atmosphérique, en se concentrant sur les bases de R, en visualisant des séries chronologiques et en créant des résumés des concentrations de polluants.