Re: [问题] Unicode Decode Error

楼主: suhang (suhang)   2014-10-30 15:00:36
※ 引述《suhang (suhang)》之铭言:
: 标题: [问题] Unicode Decode Error
: 时间: Wed Oct 29 13:28:18 2014
:
: 我写了一个crawler爬网页
: 按照view page source <meta content="text/html; charset=Big5">
: 我用Big5 解码回传的 byte string
: Python却回应某些byte无法解码
: UnicodeDecodeError: illegal multibyte sequence
:
: 1
: 浏览器也是设定Big5解码
: 那为什么浏览器可以正确的显现所有内容?
:
: 2
: 我试着用utf8瞎猜去解码,一样有error
: 请问我该如何处理这个错误而能显示我所抓下来的网页?
:
:
作者: mmis1000 (秋月恋枫)   2014-10-30 15:38:00
http://goo.gl/JP8a7J 请爱用 google 跟 stackoverflowbtw 大部分软件跟浏览器的标准行为,是把不认识的字替换成 http://goo.gl/Vy1nZI (ptt打不出来)
作者: LPH66 (-6.2598534e+18f)   2014-10-30 16:00:00
还有一个可能是其实浏览器是认得某些内容的也就是浏览器使用的解码表跟你用的解码表不一样(这也是原 PO 的问题) 这种解法一般是自己去找份解码表来用例如 PCMan 就是自己准备解码表的

Links booklink

Contact Us: admin [ a t ] ucptt.com