Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.
Voluptate duis tempor proident aliquip mollit mollit sint sunt dolor. Voluptate incididunt cupidatat et pariatur in irure. Ut ex enim dolore magna adipisicing labore exercitation.
Fugiat Lorem id consectetur est cupidatat aute consectetur quis veniam nisi aliqua aliquip. Dolor ullamco ut occaecat consectetur aliquip occaecat. Cupidatat ex velit aliquip proident nulla reprehenderit. Ullamco reprehenderit dolore ea laborum sint reprehenderit fugiat id tempor esse. Proident tempor minim sit proident aute sunt magna tempor culpa tempor.
Aliquip aliqua incididunt ullamco in magna et non. Nisi commodo et amet enim minim reprehenderit Lorem nulla voluptate veniam ex. Irure eu pariatur amet labore.
Se concentre sur les fonctions avancées de pandas pour la manipulation, l'exploration et la visualisation des données avec Python, en soulignant l'importance de la compréhension et de la préparation des données.
Couvre les outils de science des données, Hadoop, Spark, les écosystèmes des lacs de données, le théorème CAP, le traitement par lots vs. flux, HDFS, Hive, Parquet, ORC, et l'architecture MapReduce.
Couvre les techniques de manipulation des données à l'aide de Hadoop, en se concentrant sur les bases de données axées sur les lignes et les colonnes, les formats de stockage populaires et l'intégration HBase-Hive.
Couvre les cadres de données Spark, les collections distribuées de données organisées en colonnes nommées, et les avantages de les utiliser sur les DDR.