[请益] 请教php爬虫爬分页的方式

楼主: sbox1000 (Su River)   2017-04-01 18:47:06
想撷取图片的网址为http://www.bsobs.com.tw/photos/index/y/2017/m//page/
目前这支程式可以跑出第一页的图片结果
如果要跑出所有分页的结果我应该怎么写呢呜呜呜
跪求高手救援,小弟只是新手阿阿~~~
<?php
//引入套件
require('C:\snoopy\Snoopy.class.php');
require('C:\phpquery\phpQuery\phpQuery.php');
//download url
$url = "http://www.bsobs.com.tw/photos/index/y/2017/m//page/";
//模仿正常人
$snoopy->agent = "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_2)
AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.118 Safari/537.36";
$snoopy->referer = "http://www.bsobs.com.tw/photos/index/y/2017/m//page/";
//撷取HTML
$snoopy = new Snoopy();
$html = $snoopy->fetch($url)->getResults();
//筛选img class
phpQuery::newDocumentHTML($html);
$images = pq('.photos_mobile img');
foreach($images as $image){
preg_match_all("#(http://images/babyphoto/\w+.JPG)#", $html,
$matches);//套用原图网址
echo $image->getAttribute('src') ."<br>";
}
?>
作者: JustGame (JustGame)   2017-04-01 19:41:00
2017/m//page/12017/m//page/2以此类推应该就结束了吧
楼主: sbox1000 (Su River)   2017-04-02 01:43:00
我知道啊啊啊啊,但就是不知道怎么写呜呜呜呜
作者: hareion08 (巨蟹)   2017-04-02 07:55:00
先在列表页抓分页那个标签看最大值多少再用for循环跑分页或while 要抓的内容=空时终止记得要sleep...

Links booklink

Contact Us: admin [ a t ] ucptt.com