Séance de cours

Optimisations et partitionnement avancés des sparks

Introduction à l'architecture Spark Runtime

Présentation d'Apache Spark, couvrant son architecture, ses RDD, ses transformations, ses actions, sa tolérance aux pannes, ses options de déploiement et ses exercices pratiques dans les blocs-notes Jupyter.

Défis Big Data : Computing distribué avec Spark

Explore les défis du Big Data, l'informatique distribuée avec Spark, les RDD, la configuration matérielle requise, MapReduce, les transformations et Spark DataFrames.

Apprentissage automatique: Physique et Données

Déplacez-vous dans l'intersection de la physique et des données dans les modèles d'apprentissage automatique, couvrant des sujets tels que les champs d'expansion des grappes atomiques et l'apprentissage non supervisé.

Introduction à la programmation LabVIEW

Présente la programmation LabVIEW, couvrant la gestion de la mémoire, les types de données et les concepts de programmation parallèle, avec des démonstrations pratiques.

Gestion du stockage dans SmartDataLake

Explore les défis de gestion du stockage dans la transition vers les lacs de données, en abordant l'hétérogénéité des logiciels et du matériel, la conception unifiée du stockage et l'optimisation des performances.

Mise à jour Excel: Fonctions avancées et analyse de données

Couvre les fonctions avancées Excel et les techniques d'analyse de données, y compris l'enregistrement automatique et l'utilisation de Solver.

Consommation d'eau à Genève

Explore les données sur la consommation d'eau à Genève, y compris les graphiques sur la consommation et les pertes, les ensembles de données disponibles et les phases de traitement des données.

Data Wrangling avec Hadoop : Techniques avancées

Couvre les techniques avancées de disputes de données à l'aide d'Hadoop, en se concentrant sur l'intégration de Hive et HBase.

Intégrer le stockage de données évolutives et la carte Réduire le traitement avec Hadoop

Couvre l'intégration du stockage de données évolutives et de la carte réduisent le traitement à l'aide de Hadoop, y compris HDFS, Hive, Parquet, ORC, Spark et HBase.

L'échange de données avec Hadoop

Couvre les techniques de manipulation des données à l'aide de Hadoop, en se concentrant sur les bases de données axées sur les lignes et les colonnes, les formats de stockage populaires et l'intégration HBase-Hive.