最新消息:发现真没时间折腾VPS,最近又换了个空间。呵呵

字符编码知识:UTF16

UTF16在最初时的设计想法是定长(2Byte)字符编码。在Unicode编码为U+0000到U+FFFF之前,它和Unicode编码是一样的,也就是说那个时候UTF16和Unicode是完全一样的。

但2002年之后,Unicode编码扩展到了U+10FFFF,UTF16对于超过U+FFFF的部分就无法用2Byte来表示U+10000到U+10FFFF的字符了,幸好Unicode编码没有定义从U+D800到U+DFFF的码位,于是UTF16就用4Byte来表示U+10000到U+10FFFF的字符。并用D8到DF来表示这是4Byte字符。具体方法如下:

UTF-16解码

lead trail

DC00

DC01

DFFF

D800

1000010001103FF

D801

1040010401107FF

DBFF

10FC0010FC0110FFFF

转载请注明:宇托的狗窝 » 字符编码知识:UTF16

发表我的评论
取消评论

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址