PTT
Submit
Submit
选择语言
正體中文
简体中文
PTT
Python
[问题] Beautifulsoup的get_text()问题
楼主:
peace9527
(谢谢你9527)
2016-01-30 10:45:15
昨天用BeautifulSoup(BS)的get_text()成功抓取网页资料
但是问题出现了
我抓的网站是简体字网站
但是用get_text()抓出来的是像这样的资料:
b'/x56/x34/x49/x04'
我查看了一下他的资料型态是bytes
网页的编码是UTF-8 我电脑的默认编码也是UTF-8
我想把这个资料转成用原本的简体字显示 请问有办法吗?
感谢各位大神的帮忙!
作者: ocean5566 (煙大屌熟男)
2016-01-30 17:47:00
decode
楼主:
peace9527
(谢谢你9527)
2016-01-30 21:42:00
不过他内容前面有个b 需要把他变成u再decode吗?
作者:
ccwang002
(亮)
2016-01-31 02:12:00
b'...' 表示是 bytes,就直接 decode 不用什么 u
继续阅读
[问题] 从网页抓取资料
bbsx
[问题] Scipy 极大化限制式写法求解
horby
Re: [问题] 关于字典以及序列的排序问题
MOONY135
[问题] 关于字典以及序列的排序问题
allan5411
[资讯] Django学习过程直播
stupidgod08
Re: [问题] urllib.quote处理中文,结果与浏览器不同
ResolaQQ
[问题] urllib.quote处理中文,结果与浏览器不同
Serenity9078
Re: [问题] 爬取弹出视窗内容
jeijei
[问题] python进阶书籍推荐
amigcamel
[问题] 爬取弹出视窗内容
jeijei
Links
booklink
Contact Us: admin [ a t ] ucptt.com