Discute de la représentation des données au moyen de modèles et de systèmes, couvrant les modèles mathématiques, les structures de données, les niveaux de modélisation et la gestion des données.
Introduit le cours sur les systèmes d'information, couvrant sa structure, ses objectifs et ses concepts fondamentaux essentiels à la compréhension de la gestion des données et de la prise de décision.
Couvre les défis des systèmes d'information distribués, y compris l'autonomie, l'hétérogénéité, l'évaluation de la confiance et la protection de la vie privée.
Introduit des concepts de modélisation de données, l'utilisation de SQL et des applications de bibliothèque Pandas pour un traitement efficace des données.
Explore la combinaison de données au repos avec des données en mouvement, en mettant l'accent sur les complexités de l'architecture Lambda et l'évaluation de la qualité des flux et des lots.
Examine les éléments fondamentaux de la gestion des données, y compris les modèles, les sources et les querelles, en soulignant l'importance de comprendre et de résoudre les problèmes de données.
Couvre les techniques de manipulation des données à l'aide de Hadoop, en se concentrant sur les bases de données axées sur les lignes et les colonnes, les formats de stockage populaires et l'intégration HBase-Hive.