Big5 ou Big-5 est une méthode de codage de caractères, principalement utilisée à Taïwan et à Hong Kong, permettant de saisir les caractères chinois traditionnels. Son équivalent pour les caractères chinois simplifiés est le codage GB, utilisé en République populaire de Chine.
Le nom chinois Big5 五大碼 (pinyin : wǔdàmǎ) signifie « Codage des Cinq Grands ». Ce nom fait référence au but originel de supporter les cinq principaux paquetages utilisés à Taïwan à cette époque, ou aux cinq principales compagnies informatiques à Taïwan : Acer 宏碁, MiTAC 神通, JiaJia 佳佳, Zero One 零壹 et FIC 大眾, qui ont collaboré à l'élaboration de ce code.
La méthode d'encodage Big5 a été défini par l'Institut de l’Information Industrielle de Taïwan (財團法人資訊工業策進會) en 1984. D'après certaines sources, le codage Big5 fut popularisé par son adoption dans différents paquetages commerciaux, et tout particulièrement, par le système chinois ET qui fonctionnait sous MS-DOS.
Le gouvernement de la République de Chine le déclare comme son standard au milieu des années 1980 alors que Big5 était déjà un standard de fait.
Hong Kong a aussi adopté le codage de caractères Big5. Cependant, le cantonais, langue officielle de cette région, utilise beaucoup de caractères chinois archaïques qui ne sont pas disponibles dans ce jeu de caractères. Pour régler ce problème, le gouvernement de Hong Kong créa l'extension « Government Chinese Character Set » en 1995 puis « Hong Kong Supplementary Character Set » (HKSCS) en 1999. Les extensions de Hong Kong sont distribuées habituellement sous forme de patch.
La table de caractères originale Big5 est classée premièrement par la fréquence d'usage, puis par le nombre de traits et enfin par les radicaux Kangxi.
Dans ce premier jeu de caractères, il y manquait des sinogrammes pourtant fréquemment utilisés. C'est pourquoi, chaque fournisseur développa sa propre extension. Ainsi, l'extension ETen devint partie intégrante du standard Big5 actuel grâce à sa popularité.
Cette page est générée automatiquement et peut contenir des informations qui ne sont pas correctes, complètes, à jour ou pertinentes par rapport à votre recherche. Il en va de même pour toutes les autres pages de ce site. Veillez à vérifier les informations auprès des sources officielles de l'EPFL.
thumb|La Wikipédia en japonais encodé en UTF-8, affiché avec l’encodage Windows-1252. est un emprunt lexical au japonais qui signifie que les caractères affichés à l'écran d'un logiciel informatique ne s'affichent pas correctement, à cause d'un problème de codage. En langage courant et face à élément illisible le français dira . Ce concept est similaire au concept de krakozyabry (кракозя́бры). Les problèmes d'encodage de caractères sont apparus dès que des encodages EBCDIC et ASCII sont apparus dans les .
Windows code pages are sets of characters or code pages (known as character encodings in other operating systems) used in Microsoft Windows from the 1980s and 1990s. Windows code pages were gradually superseded when Unicode was implemented in Windows, although they are still supported both within Windows and other platforms, and still apply when Alt code shortcuts are used. There are two groups of system code pages in Windows systems: OEM and Windows-native ("ANSI") code pages. (ANSI is the American National Standards Institute.
UTF-8 (abréviation de l'anglais Universal Character Set Transformation Format - ) est un codage de caractères informatiques conçu pour coder l’ensemble des caractères du « répertoire universel de caractères codés », initialement développé par l’ISO dans la norme internationale ISO/CEI 10646, aujourd’hui totalement compatible avec le standard Unicode, en restant compatible avec la norme ASCII limitée à l'anglais de base, mais très largement répandue depuis des décennies.
We study two encodings of the asynchronous pi-calculus with input-guarded choice into its choice-free fragment. One encoding is divergence-free, but refines the atomic commitment of choice into gradual commitment. The other preserves atomicity, but introdu ...