L'architecture Kepler a été développée par NVidia pour ses cartes graphiques. Elle est censée doubler les performances par watt par rapport à Fermi, l'architecture précédente, ce qui permet de l'utiliser dans des cartes graphiques mobiles. La première carte graphique utilisant cette architecture est la GTX 680, utilisant le processeur graphique GK 104.
sortie de la GTX 680, première carte graphique à utiliser l'architecture Kepler
sortie de la GTX 690, première carte graphique utilisant deux puces Kepler
sortie des Tesla K20 et K20X, premières cartes à utiliser le GK 110
sortie de la GeForce Titan, première carte graphique grand public à utiliser le GK 110
Sortie de la Geforce GTX 780
Sortie de la GeForce GTX 780 Ti, première carte grand public à utiliser un GK 110 complet.
Sortie de la GeForce GTX Titan Black Edition, évolution de la GTX Titan avec toutes ses unités de calculs actives.
Sortie de la GeForce GTX Titan Z, première carte graphique à utiliser deux GK 110 complets.
Elle reprend à peu près l'architecture Fermi, c'est donc une puce divisée en plusieurs GPC ou Graphics Processing Cluster qui sont les équivalents d'un cœur de microprocesseur sauf qu'ils sont dépourvus de mémoire cache, ils sont constitués d'un, deux ou trois SMX et ils contiennent 8 unités de ROP. Pour soutenir les cœurs CUDA, qui sont les unités de calculs, la puce propose deux niveaux de mémoire cache (L1 et L2). La puce est dotée de 512 Ko de mémoire cache L2, avec un débit revu à la hausse par rapport à Fermi.
Un SMX, est la grande nouveauté introduite par Kepler, c'est le remplaçant des SM de Fermi. Il peut contenir jusqu'à 192 cœurs CUDA, ou unités de calculs, dans la version la plus évoluée contre 32 cœurs CUDA avec les SM de Fermi. Par contre, le SMX abandonne le système de double cadencement de Fermi qui multipliait par deux la fréquence SM et donc des unités de calculs. Chaque SMX dispose de 64 ko de mémoire partagée et 16 unités de textures.
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.
Multiprocessors are a core component in all types of computing infrastructure, from phones to datacenters. This course will build on the prerequisites of processor design and concurrency to introduce
This course provides insight into a broad variety of High Performance Computing (HPC) concepts and the majority of modern HPC architectures. Moreover, the student will learn to have a feeling about wh
,
Fermi est le nom de code d'une architecture de carte graphique de la société NVidia. Les premières cartes, gravées en , sont sorties en mars 2010 et comportent plus de de transistors, soit plus qu'un micro-processeur courant. Certaines GeForce M disposent de processeurs gravés en au lieu de . NVidia sort la GTX 480, la première carte graphique à utiliser l'architecture Fermi avec le GF 100. Même si la carte est la plus puissante du moment elle souffre d'une surconsommation, de températures très élevées, tout en étant bruyante.
En programmation, à l'origine en traitement numérique du signal, l'opération combinée multiply–accumulate (MAC) ou multiply-add (MAD) est une instruction-machine qui calcule le produit de deux nombres et agrège le résultat au contenu d'un accumulateur. Le circuit électronique qui réalise cette opération est appelé « multiplieur-accumulateur » ; l'opération elle-même est souvent abrégée en MAC ou « opération MAC.
Tesla est une gamme de cartes accélératrices utilisant des processeurs graphiques faisant office de GPGPU produits par NVIDIA et dont le but est d'assister le processeur central pour les calculs grâce à la bibliothèque logicielle Compute Unified Device Architecture (CUDA). Son nom lui vient de Nikola Tesla, inventeur et ingénieur. Se basant sur les premiers travaux accomplis avec le GeForce 8800 autour de CUDA, l'API logicielle permet d'exploiter via le langage C la puce graphique C870 comme un coprocesseur arithmétique.
Couvre l'architecture multiprocesseur avancée, discutant de la logistique des cours, des composants, du classement et des tendances des systèmes informatiques modernes.
Timely insights lead to business growth and scientific breakthroughs but require analytical engines that cope with the ever-increasing data processing needs. Analytical engines relied on rapid CPU improvements, yet the end of Dennard scaling stopped the fr ...
EPFL2022
,
Strong gravitational lensing is a powerful probe of cosmology and the dark matter distribution. Efficient lensing software is already a necessity to fully use its potential and the performance demands will only increase with the upcoming generation of tele ...
Using the GKEngine code which simulates an electrostatic plasma with adiabatic electron response under a sheared-slab geometry, an attempt at developing a hybrid approach between the delta-f and full-f schemes to describe plasma profiles exhibiting high fl ...