Séance de cours

Applications et systèmes intensifs de données: Aperçu

Séances de cours associées (32)

Écosystèmes Big Data : technologies et défis

Couvre les fondamentaux des écosystèmes de big data, en se concentrant sur les technologies, les défis et les exercices pratiques avec le HDFS d'Hadoop.

Science collaborative des données : outils et techniques

Introduit des outils collaboratifs de science des données comme Git et Docker, en mettant l'accent sur le travail d'équipe et les exercices pratiques pour un apprentissage efficace.

Entrepôts de données : introduction et défis

Couvre l'introduction et les défis des entrepôts de données, y compris l'intégration des données, la gestion des métadonnées et l'optimisation des performances des requêtes.

Introduction à l'analyse des données appliquées

Introduit le cours d'analyse des données appliquées à l'EPFL, couvrant un large éventail de sujets d'analyse des données et mettant l'accent sur l'apprentissage continu en sciences des données.

Innovations dans le domaine des sciences des données : perspectives, défis et avenir

Explore les progrès de la science des données, en mettant l'accent sur des idées rapides, la variété des données et les systèmes de données intelligents en temps réel.

Accélérer l’analyse des données : les innovations de l’ère post-Moore

Couvre les progrès des systèmes d'analyse de données et le rôle de la co-conception matériel-logiciel dans l'amélioration des performances à l'ère post-Moore.

Démo virtualisation des données : SmartDataLake

Présente une démo sur la virtualisation adaptative des données dans SmartDataLake, mettant l'accent sur l'assemblage de profils d'entreprise et l'exécution de requêtes de joint à travers les ensembles de données.

Fondamentaux de la science des données

Couvre les principes fondamentaux de la science des données, l'évolution des méthodes scientifiques, le rôle d'un data scientist et l'importance des données en tant que nouveau pétrole.

Gêne de données: Transformer les données pour l'analyse

Couvre le processus de collecte de données, en mettant l'accent sur la transformation et la préparation des données pour l'analyse.

Introduction générale aux données massives

Couvre les outils de science des données, Hadoop, Spark, les écosystèmes des lacs de données, le théorème CAP, le traitement par lots vs. flux, HDFS, Hive, Parquet, ORC, et l'architecture MapReduce.

Interactions et analyse des données

Couvre une mission de travail sur les données de querelle et d'analyse à l'aide de la bibliothèque de pandas de Python pour les ensembles de données du monde réel.

Nettoyage à la demande: Contraintes de refus

Explore les techniques de nettoyage axées sur les requêtes pour les contraintes de déni dans les bases de données, en mettant l'accent sur les stratégies de relaxation et l'efficacité de nettoyage.