Re: [问题] 在学习程式语言,如何做到有效率的学习

楼主: jamesxxx1997 (黄~)   2018-01-03 22:26:57
感谢大家的回应~在下没有明确的指出问题爬虫问题,是因为我想爬的网页是付费网页
(我是付费会员),有点怕被吉,所以用马赛克马了一部份,不好意思~
以下是在下的步骤
1. 登入"登入"页面>>>https://imgur.com/a/oHQIY
2. 在网页的上半部点选其中一个选项>>>https://imgur.com/a/p9Nj9
3. 在网页的下半部会重新加载资料,同样点选其中一个选项>>>https://imgur.com/a/CFQFO
4. 进入页面>>>碰到有"点击下载的连结时"就不会有问题(selenium),不然就会卡住~
>>>https://imgur.com/a/GHQ7C
4-1. 检查元素,检查不到影片网址>>>https://imgur.com/a/pmZKx
4-2. 在network里面看不到档案类型为media的file>>>https://imgur.com/a/qP6FV
4-1与4-2就是我所碰到的问题的总结
谢谢各位
作者: f496328mm (为什么会流泪)   2018-01-03 22:53:00
这图也太小了.......
作者: ckc1ark (伪物)   2018-01-03 23:40:00
m4s就是了吧 content type是video/mp4或audio/mp4
作者: vi000246 (Vi)   2018-01-04 00:11:00
这个网站我爬过 请去我的github挖宝吧提示:vimeo
作者: Kazimir (Kazimir)   2018-01-04 00:17:00
要不然就是先找到影片seg网址的list是什么时候送过来的否则就是看看能不能直接对seg的网址丢request
楼主: jamesxxx1997 (黄~)   2018-01-04 21:33:00
谢谢v大~真的太赞啦!不过从code看起来,我还有很多要学XDK大~请问什么是seg?
作者: Kazimir (Kazimir)   2018-01-05 01:13:00
在拨放器已经执行的时候不是有segment-1.m4s吗我之前爬过一个串流是用m3u8装所有segment的网址先传过来然后拨放器再按照顺序去下载这些分割 所以一种方式就是先去找到那个list在哪 解析以后就有所有的网址了另一种假设他的segment完全没加密网址有规律 干脆直接改网址就好

Links booklink

Contact Us: admin [ a t ] ucptt.com