Cette séance de cours couvre l'entraînement des réseaux neuronaux en utilisant la descente de gradient stochastique, les règles de chaîne pour la propagation vers l'avant et vers l'arrière, le calcul des gradients en ce qui concerne les paramètres, la décroissance du poids et le concept d'abandon pour prévenir les surajustements en déposant aléatoirement des sous-ensembles d'unités dans le réseau.