GBK里的字符在UNICODE里都有吗?

答案:是的。

一开始有些字在Unicode里没有,后来Unicode版本升级后把它们加进去了。

见wikipedia:

事实上比较起来, GBK 定义之字符较 CP936 多出95字(15个非汉字及80个汉字),皆为其时未收入 ISO 10646 / Unicode 之符号:非汉字包括异体字符号[2]、十二个表意文字描述字符(Ideographic Description Characters)[3]及 GB 5007.1-85《信息交换用汉字 24×24 点阵字模集》附录对 GB 2312 增加,但 Unicode 未收之拼音符号“ḿ”和“ǹ”[4][5];汉字包括未收入 ISO 10646 的《简化字总表》汉字52个、《康熙字典》及《辞海》汉字部件28个[4]。CP936中的这95字分配到了Unicode的私有区域[6][7],现已全部收于新版 Unicode。

[编辑]

Leave a Comment

Your email address will not be published.

This site uses Akismet to reduce spam. Learn how your comment data is processed.