爬虫网址:
https://fe.xuanen.com.tw/fe02.aspx?module=login_page&files=login&PT=1
小弟尝试获取运动中心场地资讯
由于登入的验证码是由asp产生的
因此我的想法是先建一个session
再将asp产生的验证码图片存下来后
再用人工辨识(之后再想办法用自动辨识)
接着将帐号/密码/验证码以post送出
若登入成功就能顺利得到场地资讯
但尝试以下程式码仍无法顺利登入成功
目前不知道该从哪方面debug起
还请版上高手赐教
程式码:
url_login =
"https://fe.xuanen.com.tw/fe02.aspx?Module=login_page&files=login"
url_book =
"https://fe.xuanen.com.tw/fe02.aspx?module=net_booking&files=booking_place&StepFlag=2&PT=1&D=%s&D2=%s"%(date,section)
url_cap = "https://fe.xuanen.com.tw/NewCaptcha.aspx"
#build session
session = requests.session()
response=session.get(url_login)
#get captcha
valcode = session.get(url_cap)
file.write(valcode.content)
file.close()
img = Image.open('cap.png')
img.show()
verify_code = input("Please enter verification code:")
#send login info
post_headers = {
'Accept': '*/*',
'Accept-Encoding': 'gzip, deflate, br',
'Accept-Language': 'zh-TW,zh;q=0.9,en-US;q=0.8,en;q=0.7',
'Connection': 'keep-alive',
'Content-Length': '347',
'Referer':
'https://fe.xuanen.com.tw/fe02.aspx?module=login_page&files=login&PT=1',
'Content-Type': 'multipart/form-data;
boundary=