Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre l'importance des formes hors vocabulaire, y compris les fautes d'orthographe, les néologismes et les emprunts, qui sont difficiles à lexicaliser. Il explique la modélisation des fautes d'orthographe et des néologismes en utilisant les transformations et la distance d'édition. L'approche probabiliste pour la correction et le calcul de la distance d'édition sont discutés. La séance de cours se penche également sur l'utilisation des automates à états finis pour la correction des erreurs d'orthographe et la distance d'édition pondérée. Divers exemples et méthodes de calcul sont présentés, mettant l'accent sur la mise en œuvre pratique d'algorithmes de correction. Les contraintes de cohérence et les transformations pondérées sont explorées pour assurer l'intégrité sémantique dans la correction d'erreurs.
Cette vidéo est disponible exclusivement sur Mediaspace pour un public restreint. Veuillez vous connecter à Mediaspace pour y accéder si vous disposez des autorisations nécessaires.
Regarder sur Mediaspace