Cette séance de cours couvre le modèle Vector Space, l'indexation, la fonction de représentation, la similarité et la recherche d'information. Il s'inscrit dans le modèle Bag of Words, les schémas de pondération tf-idf, la similarité cosine, Okapi BM25, et Précision et Rappel. On discute également des limites du modèle Vector Space, des modèles thématiques, des ancrages de mots et de l'évolution du NLP.