Introduit les bases de Numpy, une bibliothèque de calcul numérique en Python, couvrant les avantages, la disposition de la mémoire, les opérations et les fonctions d'algèbre linéaire.
Introduit le cours d'analyse des données appliquées à l'EPFL, couvrant un large éventail de sujets d'analyse des données et mettant l'accent sur l'apprentissage continu en sciences des données.
Couvre les meilleures pratiques et les lignes directrices pour les mégadonnées, y compris les lacs de données, l'architecture, les défis et les technologies comme Hadoop et Hive.
Couvre l'essentiel de la science des données, y compris le traitement, la visualisation et l'analyse des données, en mettant l'accent sur les compétences pratiques et l'engagement actif.
Couvre les tableaux NumPy et leurs représentations graphiques à l'aide de Matplotlib, en se concentrant sur les techniques de création, de manipulation et de visualisation des tableaux.
Couvre les fondamentaux des écosystèmes de big data, en se concentrant sur les technologies, les défis et les exercices pratiques avec le HDFS d'Hadoop.
Couvre l'analyse des données sur la pollution atmosphérique, en se concentrant sur les bases de R, en visualisant des séries chronologiques et en créant des résumés des concentrations de polluants.
Couvre les champs d'application, les lambdas et les pandas en science des données avec Python, y compris les déclarations imbriquées, la détermination de la portée, les affectations et la manipulation des pandas.