Explore les mots, les jetons, les n-grammes et les modèles linguistiques, en mettant l'accent sur les approches probabilistes pour l'identification des langues et la correction des erreurs d'orthographe.
Introduit les types de variables, la distribution multinomiale, les caractéristiques des données, les formes des densités, la corrélation et les méthodes de visualisation des données.