Séance de cours

Hiérarchie des mémoires GPU : Optimisation

Explore la visibilité dans la proximité, les modèles de mémoire, la mémoire partagée et les optimisations matérielles.

Modèles de cohérence de la mémoire: impact sur les performances et calcul parallèle

Couvre les modèles de cohérence de la mémoire, l'informatique parallèle, les sous-programmes atomiques, l'architecture GPU et le multithreading.

Introduction à l'architecture multiprocesseur

Introduit les fondamentaux de l'architecture multiprocesseur, couvrant les serveurs post-Moore, les datacenters durables, la programmation parallèle et l'utilisation du GPU.

GPUs: Introduction à la CUDA

Présente les bases des GPU, de la programmation CUDA et de la synchronisation des threads pour les applications de calcul parallèles.

Hiérarchie de la mémoire et performance de cache

Explore la mémoire virtuelle, les tables de pages, le TLB et la mémoire cache dans les systèmes informatiques.

Principes de la cache mémoire

Explore les principes de cache mémoire, en mettant l'accent sur la localisation spatiale, l'impact de la latence et les stratégies d'efficacité du cache.

Bases de la devises: Fil et synchronisation

Couvre les bases de la concurrence, se concentrant sur les threads et la synchronisation, y compris l'assemblage des threads et les défis de l'exécution non déterministe.

Présentation du GPU : Performances et Programmation

Explore la motivation et les avantages de l'utilisation des GPU pour le calcul, en se concentrant sur leurs performances et leur programmation via CUDA.

Cohérence de Cache

Couvre la cohérence des caches dans les systèmes multiprocesseurs et les défis du maintien de la cohérence et de la cohérence dans les processeurs modernes.

Les défis de la synthèse de haut niveau : optimiser les constructions de boucles

Releve les défis de la synthèse de haut niveau et de l'optimisation des constructions de boucles en utilisant le modèle polyédrique pour améliorer les performances et la planification.