[问题] lxml.html 中文 URL 的乱码问题 ggirls PTT批踢踢实业坊

[问题] lxml.html 中文 URL 的乱码问题

楼主: ggirls (哥) 2016-10-07 21:48:31

import lxml.html
e = lxml.html.fromstring('<a name="中文">什么</a>')
print(lxml.html.tostring(e, encoding='unicode'))
结果
<a name="%E4%B8%AD%E6%96%87">什么</a>
URL 的部分都被转码了。虽然这应该是符合规格。
可办法叫他不要转吗？

作者: longlongint (华哥尔) 2016-10-08 01:00:00

如果你不会用到HTTP 就不用转

作者: s860134 (s860134) 2016-10-08 01:00:00

urllib.parse.unquote(result) 好险你用 python3如果你用 python2 你会有点恼地抄一段 \Lib\urlparse.py

继续阅读

基础语法解惑dinoptt1993 [问题] 互动模式但是之前的程式码被执行Esh [问题] 中型csv档汇入数据库Aroeman [问题] 三维矩阵资料读入lance8537 [讨论] 叶难 python程式设计入门练习题解答交流CaptPlanet Re: [问题] 巢状字典的问题kimball [问题] [求救]无法开启python！遗失api-ms-win-ckowaltes Re: [问题] 如何在ubuntu下，安装numpyLeon [问题] Django Postgresql 写入资料停滞BlgAtlfans [问题] 爬网页一直出现的错误讯息！koshi0413