Couvre les fondamentaux et les algorithmes du classement basé sur les liens, y compris l'indexation de texte d'ancrage, PageRank, HITS, et les implémentations pratiques.
Discute de l'influence sociale, des paramètres en ligne, du classement des pages et de l'impact de l'argent.
Explore l'extraction de graphes dans les réseaux sociaux, couvrant les algorithmes de modularité et la détection communautaire.
Explore les méthodes de classification des documents, y compris k-Nearest-Neighbors, Naïve Bayes Classifier, les modèles de transformateurs, et l'attention multi-têtes.
Explore les techniques de classement et d'extraction de graphiques basées sur des liens pour une analyse efficace des graphiques Web.
Explore le classement basé sur les liens en mettant l'accent sur l'algorithme PageRank et son application pratique dans les moteurs de recherche Web.
Couvre le modèle Random Walker, l'algorithme PageRank et la détection communautaire dans les réseaux.
Couvre les cadres de données Spark, les collections distribuées de données organisées en colonnes nommées, et les avantages de les utiliser sur les DDR.
Couvre les outils de science des données, Hadoop, Spark, les écosystèmes des lacs de données, le théorème CAP, le traitement par lots vs. flux, HDFS, Hive, Parquet, ORC, et l'architecture MapReduce.
Couvre la manipulation et l'exploration de données à l'aide de Python en mettant l'accent sur les techniques de visualisation.