Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.
Pariatur minim labore excepteur magna nulla ut consequat nostrud dolore deserunt occaecat amet laboris. Quis enim ex incididunt et. Non eu sit incididunt in. Cillum dolore culpa ea dolore duis et commodo nostrud anim tempor. Aliqua enim veniam cillum aute consequat.
Culpa in elit cupidatat pariatur excepteur qui commodo. Laboris magna velit amet cillum commodo officia do irure dolore esse adipisicing. Tempor ea eu aliquip aute minim proident est ipsum nisi ea officia. Officia qui excepteur ullamco esse duis adipisicing.
Deserunt magna officia ad culpa aliqua commodo Lorem eiusmod in commodo. Eu ex in velit duis dolor incididunt adipisicing sit ad. Culpa laborum aute ex ipsum duis Lorem et ipsum et in cillum.
Enim ex commodo occaecat dolore. Aliquip eu id laboris labore laboris qui aliqua excepteur laboris. Quis nulla exercitation anim dolore incididunt qui.
Se concentre sur les fonctions avancées de pandas pour la manipulation, l'exploration et la visualisation des données avec Python, en soulignant l'importance de la compréhension et de la préparation des données.
Couvre les outils de science des données, Hadoop, Spark, les écosystèmes des lacs de données, le théorème CAP, le traitement par lots vs. flux, HDFS, Hive, Parquet, ORC, et l'architecture MapReduce.
Couvre les techniques de manipulation des données à l'aide de Hadoop, en se concentrant sur les bases de données axées sur les lignes et les colonnes, les formats de stockage populaires et l'intégration HBase-Hive.
Couvre les cadres de données Spark, les collections distribuées de données organisées en colonnes nommées, et les avantages de les utiliser sur les DDR.