Cette séance de cours se décline dans des tours de softmax stochastiques, se concentrant sur le tour de reparamétrisation et le tour d'argmax stochastique. Il explore les défis de l'estimation des attentes et fournit des exemples d'optimisation des chemins dans différents scénarios. La séance de cours traite également de la forte variance dans l'estimation des gradients et de l'utilisation d'estimateurs détendus pour la réduire.