Explore la pratique de l'histoire à l'aide de sources numérisées et numériques nées, heuristique, critique, synthèse et big data pour l'analyse historique.
Explore les archives historiques des journaux grâce à la qualité de l'OCR, aux entités nommées, à la modélisation des sujets et à l'analyse de la réutilisation du texte.
Introduit le cours sur les systèmes d'information distribués, en mettant l'accent sur les concepts clés et les outils pratiques pour le traitement des données.
Déplacez-vous dans l'intersection de la physique et des données dans les modèles d'apprentissage automatique, couvrant des sujets tels que les champs d'expansion des grappes atomiques et l'apprentissage non supervisé.
Couvre les techniques de manipulation des données à l'aide de Hadoop, en se concentrant sur les bases de données axées sur les lignes et les colonnes, les formats de stockage populaires et l'intégration HBase-Hive.
Examine les défis que posent les hypothèses de données, les biais et d'autres aspects de la recherche, y compris les écritures incomplètes et les frustrations des nouveaux arrivants.