Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours porte sur l'évaluation des modèles de génération de langage naturel, en mettant l'accent sur les paramètres de chevauchement du contenu, les paramètres fondés sur les modèles et les évaluations humaines. L'instructeur discute des défis que pose l'évaluation de la qualité du texte généré, des limites du contenu qui se chevauchent et de l'importance des jugements humains dans l'évaluation des faits et de l'exactitude. Diverses mesures telles que BLEU, ROUGE et BERTScore sont expliquées, ainsi que leurs applications dans différentes tâches NLP. La séance de cours souligne la nécessité d'améliorer les méthodes d'évaluation et souligne le rôle des humains dans l'évaluation des systèmes de production de texte.