Couvre les bases du traitement du langage naturel, y compris la tokenisation, le marquage en partie de la parole et l'intégration, et explore des applications pratiques comme l'analyse du sentiment.
Explore les lexiques, les n-grammes et les modèles de langage, soulignant leur importance dans la reconnaissance des mots et l'efficacité des n-grammes pour diverses tâches.
Explore l'optimisation des modèles d'intégration de mots, y compris la minimisation de la fonction de perte et la descente de gradient, et introduit des techniques comme Fasttext et Byte Pair Encoding.