[问题] 一种网址转换码

楼主: home0303 (Blue night)   2016-01-21 09:38:50
(若是和其他不同软件互动之问题 请记得一并填写)
软件:
版本:
例如http://tw.websaru.com/display.php?action=search&word=%E5%BE%AE%E8%BB%9F
其实后面的 %E5%BE%AE%E8%BB%9F
在原本的网址上显示是【微软】
而且类似的查询都会这样 原本显示为中文字
经过复制贴上后就变成这种有%符号的字码
请问这是什么 转换逻辑又是如何
谢谢
作者: soyoso (我是耀宗)   2016-01-21 10:30:00
可google iso-8859-1,是国际标准化的字符集
作者: POWERPC (PPC)   2016-01-21 10:48:00
那叫UTF-8,只要是UTF-8用在网址上,每个BYTE前都加上 %除了标准的英文字不加;空格也会(空格是20所以是%20,HEX值
作者: soyoso (我是耀宗)   2016-01-21 10:59:00
请问p大,那"微软"转为%E5%BE%AE%E8%BB%9F和UTF-8的编码有一致吗?因为用"微软"转为utf-8为http://imgur.com/s2TXpr4查了一下以http://codex.wiki/post/108593-677提供方式来测试,http://imgur.com/CL3eo8z 以strlen来判断时中文字为使用三个bytes编码,再以ord()函数转以ascii值
作者: POWERPC (PPC)   2016-01-21 15:59:00
微:UTF16=5FAE;UTF8=E5 BE AE;BIG5=B74C软:UTF16=8EDF;UTF8=E8 BB 9F;BIG5=B36E所以你的第1图是UTF16码,汉字使用UTF8表示,通常是3BYTES而CJK EXT-B,C,D,E的UTF8是用4BYTES表示的
作者: soyoso (我是耀宗)   2016-01-21 16:03:00
转换上是否可查询的地方
作者: POWERPC (PPC)   2016-01-21 16:09:00
找一下 Babel Pad程式来用就很强大了
作者: soyoso (我是耀宗)   2016-01-21 16:10:00
另外第1图上面虽然写的是转UTF-8但确为是UTF16的意思吗?
作者: POWERPC (PPC)   2016-01-21 16:18:00
是的,可能是设定上问题
作者: soyoso (我是耀宗)   2016-01-21 16:20:00
已下载,从转换→utf代码→统一码转换成utf-8代码处转换http://imgur.com/TfXeHiQp大的为正确,请原po忽略我的回复
楼主: home0303 (Blue night)   2016-01-21 17:19:00
感谢指教

Links booklink

Contact Us: admin [ a t ] ucptt.com