[问题] requests.get中文网址出现 BadStatusLine tides PTT批踢踢实业坊

[问题] requests.get中文网址出现 BadStatusLine

楼主: tides (monet) 2019-01-27 21:03:36

新人刚接触 Crawler
想要爬中文网址的 url
(e.g. https://dictionary.cambridge.org/zht/词典/英语-汉语-繁体/tuple)
使用下面的方式处理 UTF-5
但会碰到 http.client.BadStatusLine 的问题
不知道有什么可能的解决方向？
底下是示范码:
import requests
# import sys
from safeprint import print
import urllib
url1 = "https://dictionary.cambridge.org/zht/词典/英语-汉语-繁体/tuple"
url5 = "https://dictionary.cambridge.org/zht/%E8%A9%9E%E5%85%B8/%E8%8B%B1%E8%AA%9E-%E6%BC%A2%E8%AA%9E-%E7%B9%81%E9%AB%94/tuple"
url6a = "https://dictionary.cambridge.org/zht/"
url6b = urllib.parse.quote("词典/英语-汉语-繁体")
url6c = "/tuple"
url6 = url6a + url6b + url6c # url6 = url5
print(url6)
print(url5)
r = requests.get(url5) # get error here
r.encoding='utf-8'
print(r.text)

作者: nini200 (200妮妮) 2019-01-31 05:51:00

这网站你要的是什么??

继续阅读

[问题] Python Selenium抓国旅卡网站资讯乱码threeSecGun [问题] 如何避免执行遇错时console视窗闪退？shala [心得] 用selenium爬网页时.click()失效的解法utap2001 [问题] heroku收费方式vi000246 [问题] Python 抓钜亨网台股历史资料日期问题xyz66217 Re: [问题] 用c#当UI，python当后端MasterChang [问题] 用c#当UI，python当后端ponwar87123 [问题] Pycharm 中使用Anaconda的问题metsuan [问题]某资料夹下某特定副档名的档案数计算yimean [问题] 关于Django一些问题firstlovesky