[问题] lxml.html 中文 URL 的乱码问题

楼主: ggirls (哥)   2016-10-07 21:48:31
import lxml.html
e = lxml.html.fromstring('<a name="中文">什么</a>')
print(lxml.html.tostring(e, encoding='unicode'))
结果
<a name="%E4%B8%AD%E6%96%87">什么</a>
URL 的部分都被转码了。虽然这应该是符合规格。
可办法叫他不要转吗?
作者: longlongint (华哥尔)   2016-10-08 01:00:00
如果你不会用到HTTP 就不用转
作者: s860134 (s860134)   2016-10-08 01:00:00
urllib.parse.unquote(result) 好险你用 python3如果你用 python2 你会有点恼地抄一段 \Lib\urlparse.py

Links booklink

Contact Us: admin [ a t ] ucptt.com