Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre l'évolution du traitement moderne du langage naturel (NLP) de GPT-2 à GPT-3, en mettant l'accent sur l'échelle, le comportement émergent, l'apprentissage en contexte, le raisonnement de la chaîne de pensée et le développement de ChatGPT. Il traite de la transition de l'apprentissage traditionnel à l'apprentissage en contexte, de l'importance des modèles linguistiques à grande échelle et de l'impact d'un ingénierie rapide et d'un alignement rapide. L'instructeur met l'accent sur l'émergence de nouvelles méthodes efficaces d'adaptation des modèles à diverses tâches, y compris l'utilisation de l'apprentissage du renforcement pour l'enseignement. La séance de cours explore également la mise en œuvre d'algorithmes d'apprentissage de renforcement comme Proximal Policy Optimization (PPO) pour l'optimisation des modèles.