大家好
我最近在爬虫一个网站
使用的版本是python 3.4
在编码上面遇到一个奇怪的问题
首先先request url
url = 'http://lvyou.baidu.com/taibei/'
res = requests.get(url)
res.encoding = 'utf-8'
res.text里面有一段感觉是JavaScript用的json
if(false == "0"){
define('besttime',{text:"10\u6708-11\u6708\u662f\u6e38\u53f0\u5317\u7684\u6700\u4f73\u65f6\u95f4\uff0c\u6b64\u65f6\u6c14\u6e29\u572822\u2103\u201424\u2103"});
}
10\u6708-11 一直编码不出来,原文是简体中文
可是奇怪的是
我在下面另个变量等于他
aa = '10\u6708-11'
print(aa)
>> 10月-11
这样就可以显示了
请问为什么网页爬下来的编码不成,另存变量却可以?
谢谢大家