Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre la hiérarchie de la mémoire GPU, y compris la mémoire globale, locale, partagée et les caches. Il explique les défis de l'exécution SIMT, tels que la mémoire partagée stockée et l'accès à la mémoire mondiale inefficace. Les stratégies d'optimisation sont discutées, en mettant l'accent sur la fusion des accès mémoire, la réduction des conflits bancaires, l'élimination des divergences de chaîne et la minimisation des instructions excédentaires.