Séance de cours

Mots, jetons, n-grammes et modèles linguistiques

Description

Cette séance de cours couvre les concepts de mots, de jetons, de n-grammes et de modèles de langage. Il commence par discuter de l'ambiguïté de la définition des mots et des jetons, puis se décline en modèles n-gram et leurs applications dans l'identification de la langue et la correction d'erreurs d'orthographe. La séance de cours souligne l'importance de comprendre l'approche probabiliste, y compris le lissage additif et les antécédents de Dirichlet. Parmi les points clés, mentionnons les défis posés par les formes non-vocabulaires et l'approche probabiliste de correction des erreurs d'orthographe.

À propos de ce résultat
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.