Couvre la probabilité maximale d'estimation dans l'inférence statistique, en discutant des propriétés MLE, des exemples et de l'unicité dans les familles exponentielles.
S'inscrit dans les limites fondamentales de l'apprentissage par gradient sur les réseaux neuronaux, couvrant des sujets tels que le théorème binôme, les séries exponentielles et les fonctions génératrices de moments.
Couvre le concept de la famille exponentielle et discute des cartes en avant et en arrière, des calculs coûteux, des paramètres, des fonctions et de la convexité.