[问题] 使用爬虫抓图的问题

楼主: friendever (hi~)   2014-07-26 19:15:39
不确定这样的问题要怎么分类
我想写个小程式可以固定去抓某个网页的某张图
那个图的位置是固定的
只是内容会随着每次refresh改变
那边的html程式大改长得像这样
<img src="XXimg.php?str=code">
那个code看起来是一组hash code,就是今天的日期加上一些乱数
看起来是每次加载网页的时候
会去跟server的一段php code要一张图,回传过来
这样子的图要怎么抓呢?
因为网络上教的方法都是去抓“固定的一张图”
像这种来源的图档要怎么抓呢?
谢谢大家
作者: ssccg (23)   2014-07-26 21:05:00
抓网页,找到网址,抓图
作者: Y78 (Y78)   2014-07-26 22:55:00
regexp
作者: PTT007 ( )   2014-07-27 00:07:00
用程式模拟浏览器,当它网页加载完以后,再用regular抓图
作者: lolikung (干么查我?)   2014-07-27 02:22:00
PHP Simple HTML DOM Parser可能是 php 页面会重新导向到图片网址,所以抓到的其实是 header?
作者: ssccg (23)   2014-07-27 03:08:00
你先看看那个图片网址回来的response内容是什么是直接content type就是图,还是http 302还是别的东西server端php还什么都不重要,你只要管回来的是什么
作者: hschao (SugarGreen)   2014-08-03 22:23:00
照抓呀 content-type 应该也还是image

Links booklink

Contact Us: admin [ a t ] ucptt.com