Concept

Renommage de registres

En architecture des ordinateurs, on appelle renommage de registres le fait qu'une microarchitecture alloue dynamiquement les registres architecturaux à un ensemble plus vaste de registres physiques au cours de l'exécution d'un programme. Une architecture externe de processeur définit un ensemble de registres, dits architecturaux, que peuvent manipuler les programmes en langage machine. Dans une microarchitecture superscalaire, le processeur essaie d'exécuter en parallèle plusieurs instructions. Il analyse donc localement le programme afin d'y déceler les dépendances entre instructions, et réordonne ces dernières en conséquence, de façon à tirer parti du parallélisme tout en n'introduisant pas d'erreur. Or les dépendances entre instructions machine limitent les performances de l'exécution dans le désordre, car il arrive régulièrement que plusieurs instructions soient en compétition pour l'utilisation du même registre en raison du parallélisme qui a été introduit. Il faut alors bloquer l'une des instructions en attendant que la ressource se libère. Cependant, dans de nombreux cas, ces dépendances n'apparaissent qu'au niveau des registres, mais ne reflètent pas de réelles dépendances dans les flux de données traités par le programme. Ce problème est d'ailleurs d'autant plus prégnant que le compilateur a effectué des optimisations basées sur l'utilisation des registres. Une solution consiste donc à dupliquer les ressources : les registres architecturaux ne correspondent plus à des registres physiques dans la microarchitecture, mais sont alloués dynamiquement à un ensemble plus grand de registres physiques, ce qui permet d'éliminer une partie des dépendances introduites artificiellement par le nombre restreint de registres. Par exemple, l'architecture IA-32 définit 16 registres architecturaux. Le Pentium dispose de 128 registres physiques et effectue du renommage de registres. Considérons par exemple le code suivant :

R1 ← mem[1]
R1 ← R1 + 1
mem[1] ← R1
R1 ← mem[10]
R1 ← R1 + 4

Source officielle

https://fr.wikipedia.org/wiki/Renommage_de_registres

À propos de ce résultat

Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.

Cours associés (4)

CS-470: Advanced computer architecture

The course studies techniques to exploit Instruction-Level Parallelism (ILP) statically and dynamically. It also addresses some aspects of the design of domain-specific accelerators. Finally, it explo

CS-200: Computer architecture

This course completes the overview of computer architecture started on the first year (CS-173 DSD).

CS-471: Advanced multiprocessor architecture

Multiprocessors are basic building blocks for all computer systems. This course covers the architecture and organization of modern multiprocessors, prevalent accelerators (e.g., GPU, TPU), and datacen

Afficher plus

Publications associées (20)

Afficher plus

Personnes associées (1)

David Atienza Alonso

MOOCs associés (4)

Logic Circuits for Embedded Systems part B

Digital Design in Embedded Systems part A

Digital Design in Embedded Systems part B

Afficher plus

R1 ← mem[1]
R1 ← R1 + 1
mem[1] ← R1
R1 ← mem[10]
R1 ← R1 + 4

Source officielle

https://fr.wikipedia.org/wiki/Renommage_de_registres

À propos de ce résultat

Cours associés (4)

CS-470: Advanced computer architecture

CS-200: Computer architecture

This course completes the overview of computer architecture started on the first year (CS-173 DSD).

CS-471: Advanced multiprocessor architecture

Afficher plus

Séances de cours associées (17)

Publications associées (20)

VWR2A: A Very-Wide-Register Reconfigurable-Array Architecture for Low-Power Embedded Devices

David Atienza Alonso, Miguel Peon Quiros, Benoît Walter Denkinger

Edge-computing requires high-performance energy-efficient embedded systems. Fixed-function or custom accelerators, such as FFT or FIR filter engines, are very efficient at implementing a particular functionality for a given set of constraints. However, the ...

ASSOC COMPUTING MACHINERY2022

Exploiting Flow Graph of System of ODEs to Accelerate the Simulation of Biologically-Detailed Neural Networks

Felix Schürmann, Michael Lee Hines, Bruno Ricardo Da Cunha Magalhães

Exposing parallelism in scientific applications has become a core requirement for efficiently running on modern distributed multicore SIMD compute architectures. The granularity of parallelism that can be attained is a key determinant for the achievable ac ...

IEEE2019

LTRF: Enabling High-Capacity Register Files for GPUs via Hardware/Software Cooperative Register Prefetching

Babak Falsafi, Mario Paulo Drumond Lages De Oliveira, Hamid Sarbazi-Azad, Seyed Borna Ehsani

Graphics Processing Units (GPUs) employ large register files to accommodate all active threads and accelerate context switching. Unfortunately, register files are a scalability bottleneck for future GPUs due to long access latency, high power consumption, ...

2018

Afficher plus

Personnes associées (1)

David Atienza Alonso

Unités associées (2)

Concepts associés (14)

MOOCs associés (4)

Logic Circuits for Embedded Systems part B

Digital Design in Embedded Systems part A

Digital Design in Embedded Systems part B

Afficher plus