Couvre l'optimisation dans l'apprentissage automatique, en mettant l'accent sur la descente par gradient pour la régression linéaire et logistique, la descente par gradient stochastique et des considérations pratiques.
Explore des méthodes d'optimisation telles que la descente de gradient et les sous-gradients pour la formation de modèles d'apprentissage automatique, y compris des techniques avancées telles que l'optimisation d'Adam.
Discute de la descente de gradient stochastique et de son application dans l'optimisation non convexe, en se concentrant sur les taux de convergence et les défis de l'apprentissage automatique.
Explore l'optimisation des réseaux neuronaux en utilisant la descente de gradient stochastique (SGD) et le concept de risque double par rapport au risque empirique.
Introduit des bases d'optimisation, couvrant la régression logistique, les dérivés, les fonctions convexes, la descente de gradient et les méthodes de second ordre.
Explore coordonner les stratégies d'optimisation de descente, en mettant l'accent sur la simplicité dans l'optimisation grâce à des mises à jour coordonnées et en discutant des implications des différentes approches.