“gbk编码:GBK和UTF”
今天我们来谈谈gbk代码。 gbk和utf-8复制编码有什么不同? 这里简单介绍一下gbk代码。 gbk和utf-8复制编码有什么不同? 希望能帮到大家。
gbk和utf-8复制代码的优点:
gbk的拷贝代码用2字节表示。 也就是说,中、英文的符号都用2字节表示。 但是,为了区别中文,将其最高位设为1。
utf-8编码是用于处理国际字符的多字节编码,英语编码为8位,中文编码为24位,3字节。 在英语情况较多的论坛中,用utf-8节省空之间的时间。
gbk和utf-8的复制代码的差异:
gbk包含了所有的中文案;
utf-8包含世界上所有国家必须使用的文字。
gbk是根据国家标准gb2312扩展后,与gb2312兼容的标准; (似乎还没有国家标准)
可以在各国各种支持utf8字符集的浏览器中显示utf-8编码的副本。
例如,如果是utf8编码,外国人的英语ie也会显示中文,不需要下载ie的中文语言支持包。
因此,在英语较多的论坛中,采用gbk时各字符占2字节,而采用utf-8英语时只占1字节。
观察:
utf-8版本具有良好的国际兼容性,但中文比gbk/big5版本需要多50%的数据库存储空。 由于不建议这样做,因此只有对国际兼容性有特殊要求的客户才会采用。
总结:
gbk是指在你离开帖子的同时,一个汉字占用2个字节。 外国人看了就会乱码。 这是我中华为自己的汉字代码做的处理方案。
utf8在留着你的帖子的同时,一个汉字占用了3个字节。 但是,在外国人看来不会乱码。 这是西方人为了处理多字节文字而制定的处理方案。
ascii(iso-8859-1 )是鼻祖,是最简单的方法,字节的前0位。
gb2312,gbk,gb18030,这些是中文编码方法,向下兼容。 gb2312包含7000多个汉字和文字,gbk包含21000个以上,gb18030更是达到27000个以上。 他们都用2字节表示汉字。 与ascii有什么区别? 高字节的上位为1 (即高字节大于127 )时,表示是汉字,低字节没有明显的特征。
unicode是统一代码,确立了世界上统一的代码表。 的所有副本在这个代码表中是唯一的。
utf-8是unicode的存储、传输方法。 整个unicode代码表分为三个部分。
0000 - 007f这一部分是第一个ascii部分,遵循原来的保存方法,即0xxxxxxx。
0080 - 07ff此部分保存为110xxxxx 10xxxxxx。
0800 - ffff此部分保存为1110xxxx 10xxxxxx 10xxxxxx。
因此,一个汉字为什么会被保存,是因为需要查看unicode代码表,然后根据代码表的位置进行计算。 例如,电子字符在代码表中为3575,如果计算为utf8,则为e794b5,而在gb2312的代码表中为b5e7。
utf-8的利益:与ascii兼容,存储英语文件都是1字节,文件很小。 当然,以存储中文为主的话会变成3字节码,比gb系列还要大! 如何注明一个文件是utf8风格? 这个标记是可选的。 英国广播公司。 例如,如果在windows附带的记事本中创建utf8样式的文件,则会进行此标记。 但是,如果在ultraedit中创建utf8文件,则不会添加此标记。 这个标记有BOM (字节标记)这个术语。 不带bom的utf8文件和gb2312文件如何区分? 我也不知道。 唯一能想到的方法是先试一个,乱码发生后再试一个。
简单来说,gbk编码方法的编码是根据中国国情制作的,国际兼容性很差。 因此,大部分网页采用的不是gbk,而是utf-8编码。
gbk代码: gbk和utf-8拷贝代码有什么不同,我相信这个拷贝对你有帮助。 和好朋友分享的时候,也欢迎感兴趣的朋友们一起探讨。
本文:《“gbk编码:GBK和UTF”》
免责声明:雪球目录网免费收录各个行业的优秀中文网站,提供网站分类目录检索与关键字搜索等服务,本篇文章是在网络上转载的,本站不为其真实性负责,只为传播网络信息为目的,非商业用途,如有异议请及时联系btr2031@163.com,本站的工作人员将予以删除。