[问题] 有没有高手可以直接教我爬抓资料2000p

楼主: wwman (记忆拼图)   2020-07-14 09:37:38
想要找某网站的影片资料 希望有高手大可以帮我 如果可以的话
若不嫌弃 愿意以2000P币 表达感谢(若难度真的很大 愿意加倍p币 4000p)
希望有高手大大可以直接教我 怎么爬抓资料
因为不太可能学程式 但又想抓取某网站的全部资料
但是网站应该是采 以下这两种网址的格式的范例
(先说明https://v1.abcde.com/ 并非我要找的网站 但网址不方便公开写出来
所以用abcde代替掉原本的英文字)
(大概还有两三百个类似的网址的影片 但是我因为不知道数字规律是什么
所以无法观看 或下载下来)
第1种
https://v1.abcde.com/u/video_url/2020/0318/1584535407176.mp4
https://v1.abcde.com/u/video_url/2020/0318/1584535618170.mp4
第2种
https://v1.abcde.com/micro-course/u/2020/0703/160954788558.mp4
https://v1.abcde.com/micro-course/u/2020/0702/150101129441.mp4
https://v1.abcde.com/micro-course/u/2020/0702/131029435944.mp4
https://v1.abcde.com/micro-course/u/2020/0702/150753855576.mp4
https://v1.abcde.com/micro-course/u/2020/0702/150921758347.mp4
abcde是我乱打 打成别的英文字 来代替原本我要找的那个网站的5个英文字
因为不方便公开 如果有哪个高手大大愿意帮助我 我在私信那个网址
因为我点开原来的 https://v1.abcde.com 开头的主网址 只会显示
This XML file does not appear to have any style information associated with
it. The document tree is shown below.
<Error>
<Code>AccessDenied</Code>
<Message>The bucket you access does not belong to you.</Message>
这个网站 因为不会直接显示出可以点取的物件
我要找的那些影片网址 都是未知的随机数字组成 然后藏在以上这两个网址规律
的子目录下
顶多能从2020得知是年份的规律 和 几月几日
后面档名 真的看不出什么规律 但是我已知的就是都是mp4的档案
因为是未知网址 所以大概要用爬虫设定慢慢找这样
大概我也知道 爬抓也可能会被防御被抓到是爬虫的ip而ban掉对吧
但是看过程式教学 觉得还是太高深 没时间花两个月以上去研究这个程式
所以想请问有哪个高手大 可以直接帮我 或教我怎么爬抓
如果难度很大 本人愿意在更多加倍p币交换 当作答谢 再请麻烦私信我~
作者: ddavid (谎言接线生)   2020-07-14 10:03:00
你不如直接出钱委托还比较实在迅速XD
作者: Pieteacher (pieteacher)   2020-07-14 12:21:00
p币实在让人不心动
作者: s860134 (s860134)   2020-07-14 12:34:00
P币能干嘛 消费券?
作者: bugbug777 (sil)   2020-07-14 13:06:00
哈哈
作者: andy19960407 (258698)   2020-07-14 13:47:00
是要要爬a片吗 网络上的影片有什么好不公开的==
作者: sherees (ShaunTheSheep)   2020-07-14 15:08:00
P币…
楼主: wwman (记忆拼图)   2020-07-14 18:12:00
本人目前回归穷学生状态 可能只能出得起P币 对不起要帮我的人了 或者再以运动类技能交换 (台中市~
作者: rs6000 (正义的胖虎)   2020-07-14 18:45:00
直接把网址秀出来搞不好就有人闲闲没事帮你写?
作者: qwerasdft (小夜)   2020-07-14 19:29:00
说说网址阿
作者: alvinlin (林矜业)   2020-07-14 19:29:00
回你了。可以用https://github.com/ytdl-org/youtube-dl里面有程式码给你参考。也有做好的执行档
作者: TuCH (谬客)   2020-07-14 19:33:00
看错误讯息起来是AWS S3的 API 没有索引有点难搞看看有没有办法从其他地方找到索引吧
楼主: wwman (记忆拼图)   2020-07-14 20:18:00
楼上alvinlin大 好像误会我的意思了 就已知的网址 我都可以下载 但是就是想要知道未知字串的网址 只知道大概的规律所以想请教 有没有能直接爬出所有藏在主网址下面所有网址的影片我有用直接复制整个网站的程式 但好像无法复制不过还是谢谢alvinlin大和tuch大 跟楼上几位
作者: alvinlin (林矜业)   2020-07-14 22:24:00
不客气^^。没帮上什么忙另外FYI就是后面的网址看起来是timestamp,到毫秒。但我觉得还是没什么帮助。
作者: Jekk (Lestrade)   2020-07-14 22:52:00
捐个血就可以拿到5000p币 你给个4000p真没吸引力
作者: refusekkk (另类3k)   2020-07-15 12:15:00
你不如干脆一点讲清楚是哪个网站,搞不好就有高手回你了

Links booklink

Contact Us: admin [ a t ] ucptt.com