Concept

Lac de données

Virtualisation des données : SmartDataLake

Explore la virtualisation des données dans le projet SmartDataLake, couvrant l'optimisation des requêtes, le niveau de stockage et les défis dans le traitement de données hétérogènes.

Entreposage des données et aide à la décision

Explore l'entreposage des données, les systèmes d'aide à la décision et l'importance des statistiques dans l'analyse des données.

Data Wrangling: Processus ETL et questions de querelles

Explore le processus ETL, les étapes de querelles de données et les problèmes courants.

Introduction au traitement des flux de données: concepts et applications

Couvre les principes du traitement des flux de données et de ses applications dans l'analyse de données en temps réel.

Introduction générale aux données massives

Couvre les outils de science des données, Hadoop, Spark, les écosystèmes des lacs de données, le théorème CAP, le traitement par lots vs. flux, HDFS, Hive, Parquet, ORC, et l'architecture MapReduce.

Introduction au traitement des flux de données: concepts et applications

Couvre les concepts de traitement de flux de données, en se concentrant sur l'intégration Apache Kafka et Spark Streaming, la gestion du temps des événements et les directives de mise en œuvre du projet.

Introduction au traitement du flux de données

Couvre les bases du traitement des flux de données, y compris des outils comme Apache Storm et Kafka, des concepts clés tels que le temps d'événement et les opérations de fenêtre, et les défis du traitement des flux.

Entrepôts de données : introduction et défis

Couvre l'introduction et les défis des entrepôts de données, y compris l'intégration des données, la gestion des métadonnées et l'optimisation des performances des requêtes.

Mobilités à travers le Big Data

Discute de l'influence de Big Data sur la planification et l'optimisation de la mobilité, explorant ses promesses et ses limites.

Calcul des taux de croissance moyens

Il étudie le calcul des taux de croissance moyens et la sensibilité des taux de croissance à des périodes différentes.