Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre les principes de la descente de gradient, en se concentrant sur son application dans la formation des réseaux de neurones artificiels. En commençant par les bases de l'apprentissage supervisé et des réseaux monocouches, l'instructeur explique les limites des perceptrons simples et introduit le concept de réseaux multicouches. La séance de cours se penche sur les défis de la formation des réseaux profonds, y compris les questions de suréquipement et de généralisation. Les méthodes modernes de descente par gradient telles que les règles par lots, en ligne et minibatch sont discutées, ainsi que leurs propriétés et leurs critères de convergence. La session se termine par un quiz pour tester la compréhension du matériel.