Couvre la caractérisation des méthodes de récupération de données A-D et en temps réel de Leptazolines, le grattage Web, l'ingénierie inverse et les défis de données intraday.
Explore la représentation des connaissances, l'extraction de l'information et la vision du Web sémantique, en mettant l'accent sur la normalisation, la cartographie et les ontologies dans la structuration des données.
Explore le classement basé sur les liens grâce à des algorithmes PageRank et HITS, couvrant des exemples pratiques et des défis dans les méthodes de recherche et de classement sur le Web.