Offre une introduction complète à la science des données, couvrant Python, Numpy, Pandas, Matplotlib et Scikit-learn, en mettant l'accent sur les exercices pratiques et le travail collaboratif.
Se penche sur les techniques avancées de prétraitement des données, qui couvrent l'encodage catégorique, le traitement des données manquantes et les ensembles de données déséquilibrés, en mettant l'accent sur les mesures des performances et la comparaison des classificateurs.
Explore les techniques de regroupement de comportement et de réduction de dimensionnalité non supervisées, couvrant des algorithmes comme K-Means, DBSCAN et Gaussian Mixture Model.
Explore la réduction des dimensions linéaires grâce à la PCA, à la maximisation de la variance et à des applications réelles telles que l'analyse des données médicales.
Explore Kernel K- signifie regroupement, interprétation des solutions, traitement des données manquantes, et sélection des ensembles de données pour l'apprentissage automatique.
Explore les fondamentaux de régression logistique, y compris les fonctions de coût, la régularisation et les limites de classification, avec des exemples pratiques utilisant scikit-learn.