Se concentre sur les fonctions avancées de pandas pour la manipulation, l'exploration et la visualisation des données avec Python, en soulignant l'importance de la compréhension et de la préparation des données.
Présente la structure du cours et les concepts fondamentaux de l'apprentissage automatique, y compris l'apprentissage supervisé et la régression linéaire.
Présentation d'Apache Spark, couvrant son architecture, ses RDD, ses transformations, ses actions, sa tolérance aux pannes, ses options de déploiement et ses exercices pratiques dans les blocs-notes Jupyter.
Couvre l'utilisation pratique de QGIS pour l'analyse et la visualisation des données spatiales, y compris le géoréférencement des cartes historiques et la manipulation des données vectorielles.
Discute des techniques de visualisation des données, en mettant l'accent sur leurs applications et leurs principes pour une communication efficace d'informations complexes.