[问题] 爬网页抓影片的疑问

楼主: DearYoyoDon (yoshito)   2016-04-21 18:15:32
各位板友好,
最近看youtube教学
练习用Python抓图片、影片、分析网站
import requests
res = requests.get('
http://www.maplestage.com/episode/139279/%E4%B8%80%E8%A2%8B%E5%A5%B3%E7%8E%8B+20160420+%E9%81%93%E9%AB%98%E4%B8%80%E5%B0%BA+%E9%AD%94%E9%AB%98%E4%B8%80%E4%B8%88+%E5%A4%AB%E5%A6%BB%E7%94%9F%E6%B4%BB%E8%AB%9C%E5%B0%8D%E8%AB%9C!/')
print res.text
我是找maplestage练习抓上面的影片
像上面的影片是dailymotion的
可是在res.text里面内容找不到相关的影片连结
小弟不太懂网页里面语言
所以试了很就可是还是无法成功
所以想知道是不是有方法找到影片的连结来下载
作者: busystudent (busystudent)   2016-04-21 18:21:00
几个问题希望你回答,你这网页里有许多影片,请问你要抓哪支影片?所以你目标是抓影片联结还是下载影片?
楼主: DearYoyoDon (yoshito)   2016-04-21 18:35:00
希望能直接抓下影片,例如能下载某个节目某一集
作者: aweimeow (喵喵喵喵 ヽ( ・∀・)ノ)   2016-04-21 20:10:00
影片网址是这个吗?http://goo.gl/okaoP4ptt站方不给贴 ppt.cc 只好贴 goo.gl 的 orz
楼主: DearYoyoDon (yoshito)   2016-04-21 20:10:00
存取遭到拒绝耶@@?!
作者: aweimeow (喵喵喵喵 ヽ( ・∀・)ノ)   2016-04-21 20:12:00
http://pastebin.com/7yqGJCWv 我把影片网址贴这呃,我知道原因了我换了个 IP 再去存取这个网址是 403他那个网址是只能让我的 IP 存取,所以你才会 forbidden总之,他把影片网址藏在这段 " target="_blank" rel="nofollow">
你找看看囉,找的到影片网址下载就容易了
楼主: DearYoyoDon (yoshito)   2016-04-21 20:37:00
那用什么解析这些网址,这是能转换的吗?你图片里上面那一行的网址里面的HTML就可以只接找到mp4的连结
作者: aweimeow (喵喵喵喵 ヽ( ・∀・)ノ)   2016-04-21 20:45:00
可以试试 lxml 然后用 xpath 来找到你要的东西BeautifulSoup 好像也可以,但是我没有用过
楼主: DearYoyoDon (yoshito)   2016-04-21 20:55:00
非常感谢,我一开始试soup但是总觉得好像转换后有些找不到,不过我现在是先从网站里面找到.../embed/..的影片连结,再从新的网站去找下载连结有点麻烦,但是先这样做,希望版友能指点 :)

Links booklink

Contact Us: admin [ a t ] ucptt.com