Séance de cours

Données, big data, nuages et IoT

Séances de cours associées (32)

Couvre les fondamentaux des données, du stockage en nuage et de l'Internet des objets.

Data Wrangling avec Hive : gérer efficacement le Big Data

Couvre les techniques de querelles de données en utilisant Apache Hive pour une gestion efficace des big data.

Systèmes d'information distribués : aperçu et modèles

Couvre les systèmes d'information distribués, les tâches clés, les méthodes, les projets, l'évaluation et le soutien aux examens.

Introduction aux systèmes de bases de données

Couvre les bases des systèmes de base de données, y compris la modélisation des données, le SGBD, l'indépendance des données et l'aperçu du cours.

L'échange de données avec Hadoop

Couvre les techniques de manipulation des données à l'aide de Hadoop, en se concentrant sur les bases de données axées sur les lignes et les colonnes, les formats de stockage populaires et l'intégration HBase-Hive.

Représentation du modèle : Structures et fonctions

Couvre la représentation des modèles mathématiques, des fonctions et des structures de données dans les systèmes d'information.

Introduction générale aux données massives

Couvre les outils de science des données, Hadoop, Spark, les écosystèmes des lacs de données, le théorème CAP, le traitement par lots vs. flux, HDFS, Hive, Parquet, ORC, et l'architecture MapReduce.

Modélisation des données : concepts et applications

Introduit des concepts de modélisation de données, l'utilisation de SQL et des applications de bibliothèque Pandas pour un traitement efficace des données.

Représentation des connaissances : sémantique et structures de données

Explore la représentation des connaissances, les structures de données, la sémantique et les défis de la recherche de données sur le Web.

Protection de la vie privée : modélisation des menaces et protection de la vie privée différentielle

Explore l'importance de la protection de la vie privée, les risques de publicité ciblée et le concept de protection de la vie privée différentielle.

Modélisation hydrologique: Système de routage

Couvre la modélisation des systèmes hydrologiques, en mettant l'accent sur la rétention des inondations et l'exemple du système de routage.

Défis en matière de sécurité informatique

Explore les défis de sécurité informatique, les systèmes de stockage d'objets, la transition de gestion du site, le déploiement de la sécurité du réseau et la gestion de portefeuilles de projets à l'EPFL.

Introduction aux systèmes de bases de données

Couvre les fondements des systèmes de base de données, y compris la modélisation des données, le traitement de l'information et les défis de la gestion d'importants volumes de données.

Ingénierie des logiciels Fondements

Introduit les fondamentaux de l'ingénierie logicielle, couvrant le traitement de l'instruction, les algorithmes, les langages de programmation, les abstractions, les tests, la sécurité et l'open source.

Manipulation des données : Intro vers Pandas

Introduit les principes fondamentaux du traitement des données, soulignant l'importance des Pandas et de la modélisation des données pour une analyse efficace.

Gestion des données : Aperçu

Présente les concepts fondamentaux de la gestion des données, y compris les modèles de données, les bases de données et les tâches clés.

Bugs de programmation : Compréhension, réparation et prévention

Explore les défis de programmation, les techniques de débogage, les tests de logiciels et les pratiques de sécurité dans le développement de logiciels.

Inférence réseau à partir de preuves textuelles

Déplacez-vous dans l'inférence réseau à partir de preuves textuelles, explorant la propagation de l'information, la traduction et l'attention multi-inputs.

L'apprentissage automatique en philanthropie et sans but lucratif

Se penche sur l'application de l'apprentissage automatique à l'amélioration de la documentation relative aux droits de l'homme et aux activités de plaidoyer à l'intention d'organisations telles que HURIDOCS.

Sans titre