Couvre les bases de l'apprentissage profond, y compris les représentations de données, le sac de mots, le prétraitement des données, les réseaux de neurones artificiels et les réseaux de neurones convolutifs.
Se penche sur la formation et les applications des modèles Vision-Language-Action, en mettant l'accent sur le rôle des grands modèles linguistiques dans le contrôle robotique et le transfert des connaissances web. Les résultats des expériences et les orientations futures de la recherche sont mis en évidence.
Explore les modèles de diffusion, en mettant l'accent sur la production d'échantillons provenant d'une distribution et l'importance de la dénigrement dans le processus.
Introduit des réseaux neuronaux convolutifs, couvrant les couches entièrement connectées, les convolutions, la mise en commun, les traductions PyTorch et des applications telles que l'estimation de pose à la main et l'estimation de tubalité.
Introduit un apprentissage profond, de la régression logistique aux réseaux neuraux, soulignant la nécessité de traiter des données non linéairement séparables.