有关汉字字符标准的说明 GB2312编码大约包含6000多汉字(不包括特殊字符),编码范围为第一位b0-f7,第二位编码范围为a1-fe(第一位为cf时,第二位为a1-d3),计算一下汉字个数为6762个汉字。当然还有其他的字符。包括控制键和其他字符大约7573个字符编码。 gbk编码是对gb2312编码的扩充,容纳的汉字更多,但仅仅是扩充,没有质的变化。保留了所有gb2312编码,在此基础上进行编码范围的扩充.容纳(包含特殊字符)共22014个字符编码. gb18030编码是在gbk编码基础上的扩充,因为汉字更多,仅仅使用两位编码已经不能 容纳要求的汉字,所以采用了24位混和的办法,可以支持更多的汉字编码。并且保留了原有的gbk 2字节编码兼容gb2312和gbk编码的文件。大概容纳55657个编码(包含特殊字符) unicode编码(也就是UTF编码):俗称万国码,致力于使用统一的编码准则表达各国的文字。 为表达更多的文字,utf-8采用2/3混编的方式。目前容纳的汉字范围小于gbk编码。并且以 3字节的方式处理中文,带来了兼容性的问题,原有的gbk,gb2312,gb18030编码文件都不能正常的处理,还有很长的路要走。 到底是用UTF-8还是GB2312 倾向于 gb2312 我 现在用的是英文 2000,可除了界面的“开始”变成“Start”这样的微小变化外其他东西用起来没有感到任何差别,刚装完 2000 的时候随便去一个国内网站他就会问你是否要装简体中文,点了是,安一下,连 IE 都不用重新打开就可以直接看中文了,英文系统看中文是如此简单,换成繁体系统看简体应该没有任何差别的,不可能会出现看不了或者乱码的情况。 UTF-8 的同屏显示多语种确实是个很有意思的新玩意,不过毕竟是后来的,只要用就得成天考虑兼容问题,况且很少需要 UTF-8 的特性:我用简体中文写东西,看的人一般系统里只有简体中文或者安个简体中文就可以看了,永远不会出现一个倭文或者韩文,那么 UTF-8 还有用的必要了吗? XML 和 DVD 这些非常好的东西,推行了很多年也无法成为“缺省配置”,恩,对,GB2312 之于 UTF-8,正如同 VCD 之于 DVD:DVD 好是好,可目前几乎所有的软件还都是用 650MB 的光盘发行,一台家用电脑可以读不了 DVD,但绝对不可以读不了普通的光盘