Êtes-vous un étudiant de l'EPFL à la recherche d'un projet de semestre?
Travaillez avec nous sur des projets en science des données et en visualisation, et déployez votre projet sous forme d'application sur Graph Search.
Cette séance de cours couvre la hiérarchie de la mémoire GPU, y compris la mémoire globale, locale, partagée et les caches. Il explique le flux de traitement CUDA, les optimisations GPU et la divergence des flux de contrôle. L'instructeur discute des stratégies pour optimiser les algorithmes pour les GPU, exploiter la mémoire partagée et fusionner les accès à la mémoire. Diverses techniques pour utiliser efficacement le parallélisme et les ressources sur les GPU sont explorées, telles que les opérations de réduction et la résolution des conflits bancaires. La séance de cours se termine par un accent sur l'évolutivité avec la taille du tableau et un résumé de l'optimisation du code pour les GPU.