Séance de cours

Sans titre

Séances de cours associées (32)

Data Wrangling avec Hive : gérer efficacement le Big Data

Couvre les techniques de querelles de données en utilisant Apache Hive pour une gestion efficace des big data.

Explore la représentation des données, les bases de données, le cloud computing et les défis dans l'environnement cloud.

Manipulation des données : Intro vers Pandas

Introduit les principes fondamentaux du traitement des données, soulignant l'importance des Pandas et de la modélisation des données pour une analyse efficace.

Big Data: Meilleures pratiques et lignes directrices

Couvre les meilleures pratiques et les lignes directrices pour les mégadonnées, y compris les lacs de données, l'architecture, les défis et les technologies comme Hadoop et Hive.

Introduction à l'analyse des données appliquées

Introduit le cours d'analyse des données appliquées à l'EPFL, couvrant un large éventail de sujets d'analyse des données et mettant l'accent sur l'apprentissage continu en sciences des données.

Systèmes d'information distribués : aperçu et modèles

Couvre les systèmes d'information distribués, les tâches clés, les méthodes, les projets, l'évaluation et le soutien aux examens.

Data Wrangling avec Hadoop : formats de stockage et ruche

Explore les querelles de données avec Hadoop, en mettant l'accent sur les formats de stockage et Hive pour le traitement des données volumineuses.

Représentation des connaissances : sémantique et structures de données

Explore la représentation des connaissances, les structures de données, la sémantique et les défis de la recherche de données sur le Web.

L'échange de données avec Hadoop

Couvre les techniques de manipulation des données à l'aide de Hadoop, en se concentrant sur les bases de données axées sur les lignes et les colonnes, les formats de stockage populaires et l'intégration HBase-Hive.

Introduction générale aux données massives

Couvre les outils de science des données, Hadoop, Spark, les écosystèmes des lacs de données, le théorème CAP, le traitement par lots vs. flux, HDFS, Hive, Parquet, ORC, et l'architecture MapReduce.

Manipulation des données : modèles de données et embrouillement

Examine les éléments fondamentaux de la gestion des données, y compris les modèles, les sources et les querelles, en soulignant l'importance de comprendre et de résoudre les problèmes de données.

Introduction aux systèmes de bases de données

Couvre les fondements des systèmes de base de données, y compris la modélisation des données, le traitement de l'information et les défis de la gestion d'importants volumes de données.

L'essentiel de la science des données

Couvre l'essentiel de la science des données, y compris le traitement, la visualisation et l'analyse des données, en mettant l'accent sur les compétences pratiques et l'engagement actif.

Introduction à la programmation R pour la génétique et la génomique

Introduit un cours sur la génétique et la génomique, en se concentrant sur la programmation R avec des exercices interactifs.

Modélisation des données : concepts et applications

Introduit des concepts de modélisation de données, l'utilisation de SQL et des applications de bibliothèque Pandas pour un traitement efficace des données.

Données : Nuages et choses

Couvre les fondamentaux des données, du stockage en nuage et de l'Internet des objets.

Stockage et transmission des données 1: introduction; besoin de structure

Discute de l'importance de structurer les données pour un stockage et une recherche efficaces.

Analyse des données à l'IA et au ML, Médias sociaux

Explore l'évolution de l'analyse des données à l'IA et au ML, en mettant l'accent sur les mégadonnées, l'apprentissage automatique et l'interaction avec les médias sociaux.

Apprentissage automatique: Physique et Données

Déplacez-vous dans l'intersection de la physique et des données dans les modèles d'apprentissage automatique, couvrant des sujets tels que les champs d'expansion des grappes atomiques et l'apprentissage non supervisé.

Introduction à la science des données

Introduit les bases de la science des données, couvrant les arbres de décision, les progrès de l'apprentissage automatique et l'apprentissage par renforcement profond.