Explore les techniques de résolution d'entités, la déduplication des données, les métriques de similitude, le coût de calcul, les techniques de blocage et l'échelle des jointures de similarité.
Couvre les flux de données, le calcul de la mémoire sous-linéaire, la similarité des documents et les techniques de réduction des dimensions randomisées pour gérer efficacement les défis «Big Data».