Couvre l'essentiel de la science des données, y compris le traitement, la visualisation et l'analyse des données, en mettant l'accent sur les compétences pratiques et l'engagement actif.
Introduit l'apprentissage non supervisé en cluster avec les moyennes K et la réduction de dimensionnalité à l'aide de PCA, ainsi que des exemples pratiques.
Fournit une vue d'ensemble des techniques de hachage et de tri dans les systèmes de gestion de bases de données, en mettant l'accent sur leur mise en œuvre et l'optimisation des performances.
Couvre l'analyse des données sur la pollution atmosphérique, en se concentrant sur les bases de R, en visualisant des séries chronologiques et en créant des résumés des concentrations de polluants.
Explore l'optimisation des requêtes récursives dans les systèmes de bases de données à l'aide de Datalog et semi-rings, en discutant des défis et des solutions dans l'analyse des données.
Couvre les fondamentaux des écosystèmes de big data, en se concentrant sur les technologies, les défis et les exercices pratiques avec le HDFS d'Hadoop.