Cette séance de cours couvre la transition de l'apprentissage par lots à l'apprentissage en ligne, en mettant l'accent sur le maintien du poids statistique correct pendant le processus. Le tour de log-vraisemblance est présenté comme une solution à ce problème, assurant des mises à jour précises des paramètres pour maximiser la récompense moyenne.