[问题] Beautifulsoup的get_text()问题

楼主: peace9527 (谢谢你9527)   2016-01-30 10:45:15
昨天用BeautifulSoup(BS)的get_text()成功抓取网页资料
但是问题出现了
我抓的网站是简体字网站
但是用get_text()抓出来的是像这样的资料:
b'/x56/x34/x49/x04'
我查看了一下他的资料型态是bytes
网页的编码是UTF-8 我电脑的默认编码也是UTF-8
我想把这个资料转成用原本的简体字显示 请问有办法吗?
感谢各位大神的帮忙!
作者: ocean5566 (煙大屌熟男)   2016-01-30 17:47:00
decode
楼主: peace9527 (谢谢你9527)   2016-01-30 21:42:00
不过他内容前面有个b 需要把他变成u再decode吗?
作者: ccwang002 (亮)   2016-01-31 02:12:00
b'...' 表示是 bytes,就直接 decode 不用什么 u

Links booklink

Contact Us: admin [ a t ] ucptt.com