PTT
Submit
Submit
选择语言
正體中文
简体中文
PTT
Python
[问题] 如果爬回来的response部分内容有加密?
楼主:
bckkt
(bckkt)
2018-03-03 22:25:11
如题
拿到response之后,做了一次URL decode才看到json的结构
直接贴到json editor online,有报错
后来丢到dirtymarkup,发现有些地方长得如下
每个response都会有3~4处长这样,json格式会被破坏,似乎网站会随机找几处来加密
请问有没有大大遇过这种的ORZ,被加密的资料占了要爬的资料很大一部分
因为爬的是篮球比赛即时的分数,所以能不用selenium就不用
作者:
ckc1ark
(伪物)
2018-03-03 23:05:00
就看他怎么解的照做囉
楼主:
bckkt
(bckkt)
2018-03-03 23:14:00
谢谢回应,大大的意思是说把网站载下来,看网站的.js来找?
作者:
s860134
(s860134)
2018-03-04 12:44:00
看起来还是 json format? 通常这个是 base64import base64;base64.b64decode
作者:
WunoW
(WunoW)
2018-03-04 20:13:00
你去宫庙找人帮你通灵比较快
继续阅读
[资讯] 大陆(python大全)教学资源
alen84204
[资讯] 101 个 numpy 小测验
aaaba
[问题] 问一个excel写档的蠢问题
bckkt
[问题] 从判决书中匹配法条
goofi0211
[问题] 关于schedule同步问题
phoenixcx
[问题] pyserial delete 0x7f变成backspace 0x08
subset
[问题] 如何将GUI中的内容写入网页表单
XperiaZ6C
[问题] def f(*arg) 不指定变量请教(已解决)
znmkhxrw
[问题] 零基础新手自学网络课程请益
ethan5566
[问题] bs4 爬虫疑惑请求指引
thomasflee
Links
booklink
Contact Us: admin [ a t ] ucptt.com