[问题] AJAX网络爬虫 stanleychao PTT批踢踢实业坊

[问题] AJAX网络爬虫

楼主: stanleychao 2019-05-31 22:57:30

之前都是用scrapy搭配selenium爬虫，不过遇到动态网页就会慢很多
最近爬文得知可以用AJAX方式去把所需要资料读出来，不过无法跟网络教学一样读出json格式
以下是我要资料流程
EX:
import requests
import json
url = 'https://fb.oddsportal.com/feed/match/1-6-E5R55yD8-3-1-yj4d1.dat'
response = requests.get(url)
response.text
问题就如下打response.text时会出现以下，而不是像chrome工具显示后面还有一大串json
"globals.jsonpCallback('/feed/match/1-6-E5R55yD8-3-1-yj4d1.dat', {'e':'404'});"
请问这是为什么呢？
谢谢

作者: q79236 (昕翔) 2019-06-01 01:19:00

试试看把header设定的跟google chrome一样看看

作者: a11780922 (萝卜特务) 2019-06-01 20:03:00

header 要给参数

作者: utdsml (阿边肥) 2019-06-11 11:58:00

scrapy可以用splash处理AJAX

继续阅读

无法找到程序输入点caron0225 [问题] 我这样架构方向正确吗? (新手)ccu516 [闲聊] Py.Taipei 五月月会a9202507 [问卷]资讯人员学习新程式语言的动机意图vivian1725 [问题] 如何读取crystal report 的RPT档案blacknate [问题] 关于两个功能只能执行一个Kuoluky [问题] 利用python网络爬虫登入A601B8 [问题] GUI选择v00623 2019第24届大专校院资讯应用服务创新竞赛opal0425 [问题] 新手询问找不到project interpreterpigers