[问题] 如果爬回来的response部分内容有加密?

楼主: bckkt (bckkt)   2018-03-03 22:25:11
如题
拿到response之后,做了一次URL decode才看到json的结构
直接贴到json editor online,有报错
后来丢到dirtymarkup,发现有些地方长得如下
https://imgur.com/VA6hn8u
https://imgur.com/4OVZkFh
每个response都会有3~4处长这样,json格式会被破坏,似乎网站会随机找几处来加密
请问有没有大大遇过这种的ORZ,被加密的资料占了要爬的资料很大一部分
因为爬的是篮球比赛即时的分数,所以能不用selenium就不用
作者: ckc1ark (伪物)   2018-03-03 23:05:00
就看他怎么解的照做囉
楼主: bckkt (bckkt)   2018-03-03 23:14:00
谢谢回应,大大的意思是说把网站载下来,看网站的.js来找?
作者: s860134 (s860134)   2018-03-04 12:44:00
看起来还是 json format? 通常这个是 base64import base64;base64.b64decode
作者: WunoW (WunoW)   2018-03-04 20:13:00
你去宫庙找人帮你通灵比较快

Links booklink

Contact Us: admin [ a t ] ucptt.com