[问题] 用循环request网站无法取得资料 drmexro PTT批踢踢实业坊

[问题] 用循环request网站无法取得资料

楼主: drmexro (丝瓜瓜瓜) 2017-06-04 13:33:59

前阵子刚开始试着用python捞公开数据库的资料
程式码如下
import requests
from bs4 import BeautifulSoup as soup
payload={
"accountingyear":"",
"item":"00",
"crop":"001",
"city":"00",
"btnSend":"(unable to decode value)"
}
accountingyear=["100","101"]
for y in accountingyear:
payload['accountingyear']=y
print(payload)
r=requests.post("http://agr.afa.gov.tw/afa/pgcropcity.jsp",data=payload)
print(r)
soup=soup(r.text.encode('utf-8'),'html.parser')
print(soup)
原本预期会得到100年, 101年的资料
可是结果是
{'accountingyear': '100', 'item': '00', 'crop': '001', 'city': '00',
'btnSend': '(unable to decode value)'}
<Response [200]>
<html><head>......</html>
{'accountingyear': '101', 'item': '00', 'crop': '001', 'city': '00',
'btnSend': '(unable to decode value)'}
<Response [200]>
[]
结果变成只有得到100年的资料，101年的资料只有[]
想知道是要如何解决
谢谢

作者: neil987 (R5大小姐-EX人品崩坏) 2017-06-04 16:04:00

btnsend是有数值的请用decode看看是什么说错=>encode...

" target="_blank" rel="nofollow">

然后好玩的一点是 request得到的text是正常的是丢进去soup的地方坏掉了你可以试试看print r.text为什么坏掉看看你前面import soup 又用soup作为变量所以把soup这个名称改掉就会正常了

楼主: drmexro (丝瓜瓜瓜) 2017-06-04 18:01:00

原来如此居然是在这种地方错误…谢谢

继续阅读

[问题] simplecv 使用手机当作ip camny397789 [问题] 抓取脸书资料限定日期范围p2p8ppp [问题] Python3.4.3有升级的必要吗？yimean [问题] Selenium 撷取跳出视窗ntumath [问题] PTT爬虫请问如何送出 end?CodingMan [问题] opencv 取得座标之后的截图问题neil987 [问题] 字串切割问题LessonWang [问题] 新手爬虫遇到Refresh如何解决？jakeasa123 [问题][已解决] python 新手发问yaochi [问题] 关于online judge使用者多行输入的问题LessonWang