Séance de cours

Organisation du fichier : Gestion du stockage et du cache

Systèmes de fichiers: Techniques d'organisation et d'indexation

Discute des systèmes de fichiers, en mettant l'accent sur l'organisation des données, les techniques d'indexation et leur impact sur les performances de la base de données.

Organisation et indexation des fichiers

Explore l'organisation des fichiers, les méthodes d'indexation et les formats de pages alternatifs pour un accès efficace aux données.

L'échange de données avec Hadoop

Couvre les techniques de manipulation des données à l'aide de Hadoop, en se concentrant sur les bases de données axées sur les lignes et les colonnes, les formats de stockage populaires et l'intégration HBase-Hive.

Abstraction du système de fichiers: Comprendre les fichiers et les répertoires

Explique l'abstraction du système de fichiers, en se concentrant sur les fichiers, les répertoires et leur gestion au sein d'un système informatique.

Technologies de stockage: Hiérarchie de la mémoire et stockage de disque

Explore la hiérarchie de mémoire, les caches CPU, SSD, HDD et l'anatomie de stockage de disque.

Entrée/sortie en C++ (bases)

Couvre les bases des opérations d'entrée/sortie en C++, y compris l'interaction avec le monde par des entrées clavier/écran, des opérations de fichiers et le formatage des données d'entrée/sortie.

Big Data: Meilleures pratiques et lignes directrices

Couvre les meilleures pratiques et les lignes directrices pour les mégadonnées, y compris les lacs de données, l'architecture, les défis et les technologies comme Hadoop et Hive.

Introduction générale aux données massives

Couvre les outils de science des données, Hadoop, Spark, les écosystèmes des lacs de données, le théorème CAP, le traitement par lots vs. flux, HDFS, Hive, Parquet, ORC, et l'architecture MapReduce.

Introduction aux systèmes de bases de données

Couvre les fondements des systèmes de base de données, y compris la modélisation des données, le traitement de l'information et les défis de la gestion d'importants volumes de données.

Bases de données NoSQL

Couvre les origines, les propriétés et les types de bases de données NoSQL, en mettant l'accent sur MongoDB et le théorème CAP.