国家标准中文交换码,编号为CNS 11643,是台湾为资讯交换而制定的标准编码方案。1980年中国台湾的"行政院国家科学委员会"集合专家学者请"行政院"核定国家中文资讯标准交换码编码原则,于1986年公布。
中文名称 | 国家标准中文交换码 | 公 布 | 1986年 |
---|---|---|---|
编 号 | CNS 11643 | 地 点 | 台湾 |
2004年版CNS 11643字面配置如下:
第一字面:字码区间4421至7D4B,共编入中文字5,401个;字集来源除教育部“常用国字标准字体表”所列4,808字外,并优先收编国中、国小教科书中常用字587字及异体字6字。
第二字面:字码区间由2121至7244,故编入中文字7,650个;字集来源除教育部“次常用国字标准字体表”所列6,330字外,并筛选编入教育部“罕用国字标准字体表”表中使用频率较高之1,320字。
第三字面:字码区间2121至6246,共编入中文字6,148个;字集来源为77年6月行政院主计处电子处理资料中心暂编之使用者加字区第14字面前段。
第四字面:字码区间2121至6E5C,共编入中文字7,298个;字集来源除77年6月行政院主计处电子处理资料中心暂编之使用者加字区第14字面后段171字外,并加入户役政及其他使用单位、ISO 10646第2版汉字集、资讯业次常用字7,127字。
第五字面:字码区间2121至7C51,目前编入中文字8,603个字;字集来源为未编入前4个字面之教育部罕用字。
第六字面:字码区间2121至647A,共编入中文字6,388个;字集来源为未编入前5个字面,且笔画在14画(含)以下之教育部异体字。
第七字面:字码区间2121至6655,共编入中文字6,539个;字集来源为未编入前6个字面,且笔画在15画(含)以上之教育部异体字。
第十五字面:字码区间2121至6D39,共编入中文字6,831个;字集来源为户役政作业第十五字面。
其余部分保留供未来使用。
1980年9月行政院国家科学委员会集合国内编码专家、学者在溪头举行会议并达成初步原则,并据此请行政院核定国家中文资讯标准交换码编码原则。经过多次会商,在1986年8月4日正式由中央标准局公布,取名“通用汉字标准交换码”,简称“通用码”(UCS)。
当时的内容包括第一字面、第二字面共13,051字,经过多年的使用意见及反映,于1992年扩编至第七字面,共48,027字,并改称“中文标准交换码”(CSIC, Chinese Standard Interchange Code)。此后陆续充实内容,1992年版一共十六字面,使用至第七字面;2004年版一共六十字面,使用至第十五字面。
原先此码冀以替代业界采用的大五码 (Big5)。但由于通用码需要3个字节来记录一个汉字,以当时内存的发展并不允许,在程序兼容性产生许多的困难。结果除了主要采用大型电脑和迷你电脑的户政役系统采用以外,一般民间乏人问津。
国家标准硬度转换 表 里 氏 H L D 洛 氏 HR C 洛 氏 H RB 维 氏 H V 布 氏 HB [ 1 ] 布 氏 H B [ 2 ] 肖 氏 H S D 里 氏 H L D 洛 氏 HR C 洛 氏 H R B 维 氏 H V 布 氏 H B [ 1 ] 布 氏 H B [ 2 ] 肖 氏 H S D 3 0 0 8 3 5 9 6 3 3 . 9 3 2 2 3 1 4 3 1 5 4 6 . 3 3 0 2 8 4 5 9 8 3 4 . 2 3 2 5 3 1 6 3 1 8 4 6 . 6 3 0 4 8 5 6 0 0 3 4 . 5 3 2 8 3 1 9 3 2 0 4 6 . 9 3 0 6 8 5 6 0 2 3 4 . 8 3 3 0 3 2 2 3 2 3 4 7 . 2 3 0 8 8 6 6 0 4 3 5 . 1 3 3 3 3 2 4 3 2 5
1 国家标准硬度 HRC/HB/HL/HV/HS转换表 HLD HRC HRB HV HB[1] HB[2] HSD HLD HRC HRB HV HB[1] HB[2] HSD 300 83 596 33.9 322 314 315 46.3 302 84 598 34.2 325 316 318 46.6 304 85 600 34.5 328 319 320 46.9 306 85 602 34.8 330 322 323 47.2 308 86 604 35.1 333 324 325 47.5 310 87 606 35.4 336 327 328 47.8 312 87 608 35.7 338 330 331 48.2 314 88 610 35.9 341 332 333 48.5 316 89 612 36.2 344 335 336 48.8 31
国家汉字标准代码
较常见的国家汉字标准代码列表
GB 2312 - 80
信息交换用汉字编码字符集 基本集(又称为GB0)
GB 13000 - 93
信息技术 通用多八位编码字符集(UCS)第一部分
GB 18030 - 2000
信息技术 信息交换用汉字编码字符集 基本集的扩充
其他中华人民共和国发布有关汉字标准代码列表:
GB/T 12345 - 90
信息交换用汉字编码字符集 第一辅助集(又称为GB1)
GB/T 7589 - 87
信息交换用汉字编码字符集 第二辅助集(又称为GB2)
GB 13131 - 91
信息交换用汉字编码字符集 第三辅助集(又称为GB3)
GB/T 7590 - 87
信息交换用汉字编码字符集 第四辅助集(又称为GB4)
GB 13132 - 91
信息交换用汉字编码字符集 第五辅助集(又称为GB5)
GB/T 16500 - 1998
信息交换用汉字编码字符集 第七辅助集
国家推荐标准以 "/T" 来表示并非强制执行。
由于GB 2312-80只收录了6763个汉字,未能覆盖繁体中文字、部分人名、方言、古汉语等方面出现的罕用字,所以发布了以上的辅助集。
其中,GB/T 12345-90辅助集是GB 2312-80基本集的繁体字版本;GB 13131-91是GB/T 7589-87的繁体字版本;GB 13132-91是GB/T 7590-87的繁体字版本。而GB/T 16500-1998是繁体字版本,它并无对应的简体字版本。
鉴于第二辅助集及第四辅助集,有不少汉字均是“类推简化汉字”,实用性不高,因而较少人采用。
中华人民共和国国家标准总局于2000年推出强制性的GB 18030-2000标准。于2001年8月31日后发布或出厂的产品,必须符合GB 18030-2000的相关要求。
相关标准列表(按首次出版时间排列)
标准号 |
名称 |
别名 |
汉字数 |
备注 |
GB 2312-80 |
信息交换用汉字编码字符集 基本集 |
GB /GB0 |
6763 |
GB 6345.1-86 等字模集有附录对 GB 2312-80 之修订,但 GB 2312 本身一直未有更新,详见 GB 2312 条目 |
GB/T 7589-87 |
信息交换用汉字编码字符集 第二辅助集 |
GB2 |
7237 |
向 ISO 10646 提交时使用繁体字版本 |
GB/T 7590-87 |
信息交换用汉字编码字符集 第四辅助集 |
GB4 |
7039 |
向 ISO 10646 提交时使用繁体字版本 |
GB 8565.2-88 |
信息处理文本通讯用编码字符集 第二部分 |
无 |
636 |
主要用于电讯;GB2汉字520个、GB4汉字92个、来自《第一批异体字整理表》之异体字23个及“啰”字。此字符集补充了 GB 2312,使之能包括整个《现代汉语通用字表》 |
GB/T 12345-90 |
信息交换用汉字编码字符集 第一辅助集 |
GB1 |
6866 |
GB 2312 繁体版,增补103字 |
GB 13131-91 |
信息交换用汉字编码字符集 第三辅助集 |
GB3 |
7237 |
GB/T 7589 繁体版 |
GB 13132-91 |
信息交换用汉字编码字符集 第五辅助集 |
GB5 |
7039 |
GB/T 7590 繁体版 |
ISO-IR-165 |
通讯用中文多字节字符集 |
8464 |
集合 GB 2312-80(包括 GB 6345.1-86 新增之字符及调整)及 GB 8565.2-88 |
|
GB 13000.1-93 |
信息技术 通用多八位编码字符集(UCS)第一部分 |
20902 |
另有302个兼容汉字(当中十二个:U FA0E, U FA0F, U FA11, U FA13, U FA14, U FA1F, U FA21, U FA23, U FA24, U FA27, U FA28 及 U FA29 有独立形音义,统一码联盟建议不要视之为兼容汉字 |
|
GBK |
汉字扩展内码规范 |
21003 |
除了来自 ISO 10646-1 / GB 13000.1 之20902字,另有 ISO 10646-1 / GB 13000.1 中21个兼容汉字(包括上述十二个有独立形音义兼容字),以方便和 Big5、CNS11643、JIS 及 IBM 文件双向转换、未收入 ISO 10646 的《简化字总表》汉字52个、《康熙字典》及《辞海》汉字部件28个;后80字暂时对应 Unicode 编码之私人使用区(Private Use Area),新版 Unicode 已全部收纳。Microsoft Code Page 936 收入21个兼容汉字,未收后80字 |
|
GB/T 15564-1995 |
图文电视广播用汉字编码字符集 香港子集 |
111 |
所有字皆来自 GB 13000.1 |
|
GB/T 16500-1998 |
信息交换用汉字编码字符集 第七辅助集 |
3778 |
其他 GB 未收录之 GB13000.1 汉字 |
|
GB 18030-2005 |
信息技术 中文编码字符集 |
70244 |
首版本 GB 18030-2000 |
参考
中华人民共和国国家标准
ISO/IEC 2022
注释
^ ISO 10646 收录的是其非简化形式(unsimplified forms),见中日韩统一表意文字#字源
^ 向 ISO 10646 提交汉字时称为 G8
^ 一说8443(Ken Lunde, CJKV Information Processing, 1999, O'Reilly & Associates, Inc., P.82)
^ 4.0 4.1 简体中文版 Windows 95 “GBK 内码输入法”帮助文件,1995年
^ 在 ISO 10646 文件中称为 GE;本应称为“GB7”,但中国向 ISO 10646 提交汉字时将《现代汉语通用字表》称为 G7
^ 在 ISO 10646 文件中称为 G9
信息处理国标码
下表是一些与信息处理相关的一些国家标准。国家标准强制标准冠以“GB”。推荐标准冠以“GB/T”。
标准号 |
采用程度 |
中文名称 |
强制标准 |
||
GB 2312-80 |
信息交换用汉字编码字符集 基本集 |
|
GB 3100-93 |
EQV ISO 1000:1992 |
国际单位制及其应用 |
GB 3101-93 |
EQV ISO 31-0:1992 |
有关量、单位和符号的一般原则 |
GB 3259-92 |
中文书刊名称汉语拼音拼写法 |
|
GB 3304-91 |
中国各民族名称的罗马字母拼写法和代码 |
|
GB 5768-1999 |
道路交通标志和标线 |
|
GB 6513-86 |
文献书目信息交换用数学字符编码字符集 |
|
GB 8045-87 |
信息交换用蒙古文七位编码和八位编码字符集 |
|
GB 12050-89 |
信息处理 信息交换用维吾尔文编码图形字符集 |
|
GB 12052-89 |
信息交换用朝鲜文字编码字符集 |
|
GB 12200.1-90 |
汉语信息处理词汇 01部分:基本术语 |
|
GB 12345-90 |
信息交换用汉字编码字符集 第一辅助集 |
|
GB 13000.1-93 |
IDT ISO/IEC 10646.1:1993 |
信息技术 通用多八位编码字符集(UCS)第一部分:体系结构与基本多文种平面 |
GB 14887-2003 |
道路交通信号灯 |
|
GB 16959-1997 |
信息技术 信息交换用藏文编码字符集 基本集 |
|
GB 18030-2005 |
信息技术 信息交换用汉字编码字符集 基本集的扩充 |
|
GB 21669-2008 |
信息技术 维吾尔文、哈萨克文、柯尔克孜文编码字符集 |
|
推荐标准 |
||
GB/T 148-1997 |
NEQ ISO 216:1975 |
印刷、书写和绘图纸幅面尺寸 |
GB/T 1988-1998 |
EQV ISO/IEC 646:1991 |
信息技术 信息交换用七位编码字符集 |
GB/T 2311-2000 |
IDT ISO/IEC 2022:1994 |
信息技术 字符代码结构与扩充技术 |
GB/T 2260-1999 |
中华人民共和国行政区划代码 |
|
GB/T 2260-2002 |
中华人民共和国行政区划代码 |
|
GB/T 2261-80 |
无,但与ISO 5218类似 |
人的性别代码 |
GB/T 2659-2000 |
EQV ISO 3166-1:1997 |
世界各国和地区名称代码 |
GB/T 4880-91 |
EQV ISO 639:1988 |
语种名称代码 |
GB/T 4880.2-2000 |
EQV ISO 639-2:1998 |
语种名称代码 第2部分:3字母代码 |
GB/T 4881-85 |
中国语种代码 |
|
GB/T 5795-2002 |
EQV ISO 2108:1992 |
中国标准书号 |
GB/T 7408-94 |
EQV ISO 8601:1988 |
数据元和交换格式 信息交换 日期和时间表示法 |
GB/T 7589-87 |
信息交换用汉字编码字符集 第二辅助集 |
|
GB/T 7590-87 |
信息交换用汉字编码字符集 第四辅助集 |
|
GB 10001-94 |
NEQ ISO 7001:1990 |
公共信息标志用图形符号 |
GB/T 12200.2-94 |
汉语信息处理词汇 02部分:汉语和汉字 |
|
GB/T 12406-1996 |
IDT ISO 4217:1990 |
表示货币和资金的代码 |
GB/T 12406-2008 |
IDT ISO 4217 : 2001 |
表示货币和资金的代码 |
GB/T 13131-91 |
信息交换用汉字编码字符集 第三辅助集 |
|
GB/T 13132-91 |
信息交换用汉字编码字符集 第五辅助集 |
|
GB/T 13134-91 |
信息交换用彝文编码字符集 |
|
GB/T 15273 |
IDT ISO/IEC 8859 |
信息处理 八位单字节编码图形字符集 |
GB/T 15834-1995 |
标点符号用法 |
|
GB/T 15835-1995 |
出版物上数字用法的规定 |
|
GB/T 16159-1996 |
汉语拼音正词法基本规则 |
|
GB/T 16831-1997 |
IDT ISO 6709:1983 |
地理点位置的纬度、经度和高程的标准表示法 |
GB/T 16683-1996 |
信息交换用彝文字符24×24点阵字模集及数据集.rar |
|
GB/T 19000-2000 |
IDT ISO 9000:2000 |
质量管理体系 基础和术语 |
GB/T 24001-1996 |
IDT ISO 14001:1996 |
环境管理体系 规范及使用指南 |
国家标准强制标准冠以“GB”。推荐标准冠以“GB/T”。与很多ISO国际标准相比,很多国家标准等同采用(IDT,identical to 其他标准)、修改采用(MOD,modified in relation to 其他标准;2000年以前称作“等效采用,EQV, equivalent to 其他标准)或非等效采用(NEQ,not equivalent to 其他标准)。
现时中华人民共和国官方强制使用GB 18030标准,但较旧的计算机仍然使用GB 2312。
“GB”在计算机领域中常常表示GB 2312-80或GB 18030-2005。两者是汉语编码系统的标准,在中国大陆和新加坡用于简体中文。
“GB”在计算机领域中常常表示GB 2312-80或GB 18030-2000。两者是汉语编码系统的标准,在中国大陆和新加坡用于简体中文。详见:国家标准代码。