[问题] Beautifulsoup的get_text()问题 peace9527 PTT批踢踢实业坊

[问题] Beautifulsoup的get_text()问题

楼主: peace9527 (谢谢你9527) 2016-01-30 10:45:15

昨天用BeautifulSoup(BS)的get_text()成功抓取网页资料
但是问题出现了
我抓的网站是简体字网站
但是用get_text()抓出来的是像这样的资料：
b'/x56/x34/x49/x04'
我查看了一下他的资料型态是bytes
网页的编码是UTF-8 我电脑的默认编码也是UTF-8
我想把这个资料转成用原本的简体字显示请问有办法吗？
感谢各位大神的帮忙！

作者: ocean5566 (ç…™å¤§å±Œç†Ÿç”·) 2016-01-30 17:47:00

decode

楼主: peace9527 (谢谢你9527) 2016-01-30 21:42:00

不过他内容前面有个b 需要把他变成u再decode吗？

作者: ccwang002 (亮) 2016-01-31 02:12:00

b'...' 表示是 bytes，就直接 decode 不用什么 u

继续阅读

[问题] 从网页抓取资料bbsx [问题] Scipy 极大化限制式写法求解horby Re: [问题] 关于字典以及序列的排序问题MOONY135 [问题] 关于字典以及序列的排序问题allan5411 [资讯] Django学习过程直播stupidgod08 Re: [问题] urllib.quote处理中文，结果与浏览器不同ResolaQQ [问题] urllib.quote处理中文，结果与浏览器不同Serenity9078 Re: [问题] 爬取弹出视窗内容jeijei [问题] python进阶书籍推荐amigcamel [问题] 爬取弹出视窗内容jeijei