Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours porte sur les concepts d'incitation et d'alignement dans le contexte des modèles linguistiques. Il explore l'utilisation de modèles linguistiques plus larges pour les tâches de traitement du langage naturel, en discutant des avantages et des défis de l'expansion des modèles. La séance de cours se penche sur l'émergence de capacités d'apprentissage nulles et peu nombreuses dans des modèles comme GPT-2 et GPT-3, mettant en évidence leurs capacités dans diverses tâches. Il examine également les limites de l'incitation à des tâches complexes et la nécessité de renforcer l'apprentissage de la rétroaction humaine. La séance de cours se termine par une discussion sur les progrès réalisés dans la formation de modèles linguistiques pour l'assistance multitâches et les orientations futures sur le terrain.