Concept

Apache Spark

Séances de cours associées (32)

Concepts avancés de traitement du flux de données

Explore le temps de l'événement par rapport au temps de traitement, les opérations de traitement de flux, les jointures de flux et le traitement des données en retard ou hors-commande dans le traitement de flux de données.

Analyse des données au repos et des données en mouvement

Explore la combinaison de données au repos avec des données en mouvement, en mettant l'accent sur les complexités de l'architecture Lambda et l'évaluation de la qualité des flux et des lots.

Sans titre

Introduction à l'architecture Spark Runtime

Présentation d'Apache Spark, couvrant son architecture, ses RDD, ses transformations, ses actions, sa tolérance aux pannes, ses options de déploiement et ses exercices pratiques dans les blocs-notes Jupyter.

Introduction au traitement du flux de données

Couvre les fondamentaux du traitement des flux de données, y compris les informations en temps réel, les applications de l'industrie, et les exercices pratiques sur Kafka et Spark Streaming.

La collaboration dans le domaine de la science des données

Couvre les outils collaboratifs de science des données, les concepts de big data, Spark, et le traitement du flux de données, avec des conseils pour le projet final.

Sans titre

Spark DataFrames : bases et optimisation

Couvre les bases de Spark DataFrames, leurs avantages, la comparaison des performances avec les RDD et les démonstrations pratiques.

Introduction à l'architecture d'exécution Spark

Présente Apache Spark, qui couvre ses principales caractéristiques, son histoire, ses RDD, son architecture et son framework informatique distribué.

Cadres de données Spark

Couvre les cadres de données Spark, les collections distribuées de données organisées en colonnes nommées, et les avantages de les utiliser sur les DDR.

Instructions d'examen: Types de questions et classement de code

Couvre les instructions d'examen, les types de questions et la notation du code pour comprendre les concepts et le codage.

Modèles de programmation : aperçu et exemples

Explore les modèles de programmation pour le traitement des mégadonnées, y compris les RDD de Spark et les optimisations.

Séances de cours associées (32)

Concepts avancés de traitement du flux de données

Analyse des données au repos et des données en mouvement

Explore la combinaison de données au repos avec des données en mouvement, en mettant l'accent sur les complexités de l'architecture Lambda et l'évaluation de la qualité des flux et des lots.

Sans titre

Introduction à l'architecture Spark Runtime

Introduction au traitement du flux de données

Couvre les fondamentaux du traitement des flux de données, y compris les informations en temps réel, les applications de l'industrie, et les exercices pratiques sur Kafka et Spark Streaming.

La collaboration dans le domaine de la science des données

Couvre les outils collaboratifs de science des données, les concepts de big data, Spark, et le traitement du flux de données, avec des conseils pour le projet final.

Sans titre

Spark DataFrames : bases et optimisation

Couvre les bases de Spark DataFrames, leurs avantages, la comparaison des performances avec les RDD et les démonstrations pratiques.

Introduction à l'architecture d'exécution Spark

Présente Apache Spark, qui couvre ses principales caractéristiques, son histoire, ses RDD, son architecture et son framework informatique distribué.

Cadres de données Spark

Couvre les cadres de données Spark, les collections distribuées de données organisées en colonnes nommées, et les avantages de les utiliser sur les DDR.

Instructions d'examen: Types de questions et classement de code

Couvre les instructions d'examen, les types de questions et la notation du code pour comprendre les concepts et le codage.

Modèles de programmation : aperçu et exemples

Explore les modèles de programmation pour le traitement des mégadonnées, y compris les RDD de Spark et les optimisations.