Couvre les modèles d'estimation statistique, les estimateurs de ML, les machines d'apprentissage, les problèmes pratiques et les défis de l'estimation.
Couvre les bandits multi-armes dans l'apprentissage du renforcement, explorant le compromis entre l'exploration et l'exploitation pour minimiser les regrets.