楼主:
tnsshnews (tnsshnews)
2015-01-26 09:30:51Dear all,
小弟想去某个网站自动crawler资料, 观察某网站的网址, 是要用Big5编码URL,
但用java内建的URLEncoder编码出来的又不一样, 是编码有两套吗?
无意间找到这个网站
http://www.mytju.com/classCode/tools/urlencode_big5.asp
它的URL encoding刚好跟我要抓的网站一样, 但用java内建的encoder却产生不出一样的,
举例说明一下, 例如http://sss.xxxx.aaa.vvv?text=编码
编码的部分拿 "林" 这个中文字来举例, 在无意见中找到的转码网站结果如下,
字符 编码10进制 编码16进制 URL编码
林 43596 AA4C %AAL
java内建的URLEncoder产生出来的是16进位码 %AA%4C
但网站要吃的却是%AAL
有人知道这是哪种Big5编码吗
感激不尽
楼主:
tnsshnews (tnsshnews)
2015-01-26 13:27:00不好意思, 是我太天兵了, 这个规则就是java Encoder做的结果, 是我搞错了, 谢谢大家帮忙