Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre les défis de la génération de langage naturel, en se concentrant sur les algorithmes de décodage tels que le décodage avide, la recherche de faisceaux, et les méthodes d'échantillonnage comme top-k et top-p. L'instructeur, Antoine Bosselut, explique les défis de l'entraînement, y compris le biais d'exposition et le renforcement de l'apprentissage. Diverses solutions pour améliorer le décodage, telles que le rééquilibrage des distributions et la reclassification des séquences, sont discutées. La séance de cours souligne l'importance de la génération de textes divers et de l'utilisation de fonctions de récompense pour renforcer l'apprentissage. Différentes mesures d'estimation de récompense comme BLEU et ROUGE sont explorées, ainsi que des comportements liés à des récompenses comme la consistance de la modalité croisée et la politesse d'expression.