Séance de cours

Préparation des données pour l'apprentissage automatique: Données catégoriques et numériques

Séances de cours associées (32)

Introduction à l'analyse des données appliquées

Introduit le cours d'analyse des données appliquées à l'EPFL, couvrant un large éventail de sujets d'analyse des données et mettant l'accent sur l'apprentissage continu en sciences des données.

Data Wrangling avec Hive : gérer efficacement le Big Data

Couvre les techniques de querelles de données en utilisant Apache Hive pour une gestion efficace des big data.

Introduction au traitement des flux de données: concepts et applications

Couvre les principes du traitement des flux de données et de ses applications dans l'analyse de données en temps réel.

Big Data: Meilleures pratiques et lignes directrices

Couvre les meilleures pratiques et les lignes directrices pour les mégadonnées, y compris les lacs de données, l'architecture, les défis et les technologies comme Hadoop et Hive.

L'essentiel de la science des données

Couvre l'essentiel de la science des données, y compris le traitement, la visualisation et l'analyse des données, en mettant l'accent sur les compétences pratiques et l'engagement actif.

Introduction à l'apprentissage automatique: Aperçu du cours et bases

Présente la structure du cours et les concepts fondamentaux de l'apprentissage automatique, y compris l'apprentissage supervisé et la régression linéaire.

Historique numérique et presse numérique

Déplacez-vous dans le « virage numérique » de l'histoire, en examinant la recherche historique à l'aide de journaux numérisés et en explorant la réutilisation du texte, l'intégration des mots et la visualisation des données.

Techniques de gestion des données : HBase et Hive Integration

Couvre les techniques de querelles de données utilisant HBase et Hive, en se concentrant sur l'intégration et les applications pratiques.

Bases de l'apprentissage automatique

Introduit les bases de l'apprentissage automatique, couvrant l'apprentissage supervisé et non supervisé, la régression linéaire et la compréhension des données.

Introduction à l'architecture Spark Runtime

Présentation d'Apache Spark, couvrant son architecture, ses RDD, ses transformations, ses actions, sa tolérance aux pannes, ses options de déploiement et ses exercices pratiques dans les blocs-notes Jupyter.

Transformation numérique : solutions et données

Explore les possibilités de transformation numérique, les mégadonnées, l'analyse et les innovations technologiques dans le domaine des affaires et de la recherche.

Analyse des données: Concentrations de KMnO4

Couvre l'analyse des concentrations de KMnO4 à l'aide de données provenant d'un fichier CSV.

Introduction à l'apprentissage automatique

Couvre les bases de l'apprentissage automatique, y compris l'apprentissage supervisé et non supervisé, la régression linéaire et la classification.

Analyse du métabolisme urbain

Explore l'évaluation environnementale systémique, l'analyse nationale des flux de matériaux et le développement d'un tableau de bord du métabolisme urbain pour Zurich à l'aide de données ouvertes.

Analyse des données sur la pollution atmosphérique

Couvre l'analyse des données sur la pollution atmosphérique, en se concentrant sur les bases de R, en visualisant des séries chronologiques et en créant des résumés des concentrations de polluants.

Règlements : chiffres des règlements

Couvre l'analyse des données de fréquence cardiaque ECG et des mesures de débit respiratoire à l'aide d'Excel.

Biomécanique : Analyse de la vélocité

Explore l'analyse des données de vélocité en biomécanique à l'aide d'Excel pour la visualisation et l'interprétation.

Apprentissage non supervisé : réduction de la dimensionnalité et regroupement

Couvre l'apprentissage non supervisé, en mettant l'accent sur la réduction de la dimensionnalité et le regroupement, en expliquant comment il aide à trouver des modèles dans les données sans étiquettes.

Science des données pour les ingénieurs: Partie 2

Explore la manipulation, l'exploration et la visualisation de données dans des projets de science des données en utilisant Python.

Introduction à l'architecture Spark Runtime

Couvre l'architecture d'exécution Spark, y compris les RDD, les transformations, les actions et la mise en cache pour l'optimisation des performances.