最近在写一只爬虫程式
遇到有些网站是采用gzip压缩后再传送资料
如果用python3 开启
cj = Http_Cok.CookieJar()
opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cj))
res = urllib.request.Request(html,headers = Header_data())
data = opener.open(res).read()
print(data)
都是十六进制的编码,到网络上google 好像是要先解压缩
否则beautifulsoup也无法解读,毕竟不是utf-8 格式
网络上的解法试了也没用大部分都是介绍pyton2的解法
不知道有人知道python3要如何解吗??