Compression du modèle: Techniques pour des modèles NLP efficaces
Graph Chatbot
Chattez avec Graph Search
Posez n’importe quelle question sur les cours, conférences, exercices, recherches, actualités, etc. de l’EPFL ou essayez les exemples de questions ci-dessous.
AVERTISSEMENT : Le chatbot Graph n'est pas programmé pour fournir des réponses explicites ou catégoriques à vos questions. Il transforme plutôt vos questions en demandes API qui sont distribuées aux différents services informatiques officiellement administrés par l'EPFL. Son but est uniquement de collecter et de recommander des références pertinentes à des contenus que vous pouvez explorer pour vous aider à répondre à vos questions.
Couvre les fondamentaux des réseaux neuronaux multicouches et de l'apprentissage profond, y compris la propagation arrière et les architectures réseau comme LeNet, AlexNet et VGG-16.
Explore l'encodage MP3, en mettant l'accent sur la réduction des bits par compression perdue et en utilisant des modèles psycho-acoustiques pour un filtrage et une quantification efficaces.
Explore les stratégies d'optimisation pour les accélérateurs d'apprentissage en profondeur, en mettant l'accent sur la réduction des mouvements de données grâce au batching, à l'optimisation des flux de données et à la compression.
Couvre l'analyse causale des données d'observation, des pièges, des outils permettant de tirer des conclusions valables et d'aborder les variables confusionnelles.
Explore la compression d'image à travers diverses approches telles que la compression de pixel et de niveau de bloc, Discret Cosine Transform, quantification et codage entropie.
Explore le décodage à partir de modèles neuronaux dans le NLP moderne, couvrant les modèles encodeurs-décodeurs, les algorithmes de décodage, les problèmes avec le décodage argmax, et l'impact de la taille du faisceau.