Explore les techniques de compression des modèles dans les NLP, en discutant de la taille, de la quantification, de la factorisation du poids, de la distillation des connaissances et des mécanismes d'attention.
Couvre les bases des réseaux neuronaux, des fonctions d'activation, de la formation, du traitement d'image, des CNN, de la régularisation et des méthodes de réduction de dimensionnalité.