[问题] requests.get中文网址出现 BadStatusLine

楼主: tides (monet)   2019-01-27 21:03:36
新人刚接触 Crawler
想要爬中文网址的 url
(e.g. https://dictionary.cambridge.org/zht/词典/英语-汉语-繁体/tuple)
使用下面的方式处理 UTF-5
但会碰到 http.client.BadStatusLine 的问题
不知道有什么可能的解决方向?
底下是示范码:
import requests
# import sys
from safeprint import print
import urllib
url1 = "https://dictionary.cambridge.org/zht/词典/英语-汉语-繁体/tuple"
url5 = "https://dictionary.cambridge.org/zht/%E8%A9%9E%E5%85%B8/%E8%8B%B1%E8%AA%9E-%E6%BC%A2%E8%AA%9E-%E7%B9%81%E9%AB%94/tuple"
url6a = "https://dictionary.cambridge.org/zht/"
url6b = urllib.parse.quote("词典/英语-汉语-繁体")
url6c = "/tuple"
url6 = url6a + url6b + url6c # url6 = url5
print(url6)
print(url5)
r = requests.get(url5) # get error here
r.encoding='utf-8'
print(r.text)
作者: nini200 (200妮妮)   2019-01-31 05:51:00
这网站你要的是什么??

Links booklink

Contact Us: admin [ a t ] ucptt.com