Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours porte sur les méthodes de gradients adaptatifs, qui permettent d'ajuster les taux d'apprentissage et de mettre à jour les orientations en fonction des données afin d'améliorer la performance en matière de convergence. L'instructeur décrit diverses méthodes de gradient adaptatif, comme AdaGrad, ADAM et RMSprop, et explique leur impact sur les scénarios d'optimisation. La séance de cours se penche également sur la motivation des taux d'apprentissage adaptatifs et sur l'importance des vecteurs de gradient d'échelle. En outre, il explore les concepts d'accélération de l'impulsion et les méthodes de gradient accélérées de Nesterov pour améliorer la convergence et réduire les oscillations dans les problèmes d'optimisation non convexe.