[请益] 多网页parse

楼主: woominin (没事就好)   2014-10-02 17:37:10
不好意思,又要请教有关于parse的问题
想请问 在parse完后
我得到了
名称 + 网址
名称 + 网址
名称 + 网址
这样很多个网址
要怎么去把这一堆网址再丢去 第二层做multi url parse呢 ??
看simple dom 的范例都是单独一个网址
// Create a DOM object from a URL
$html = file_get_html('http://www.google.com/');
那像我上面那样 第一次parse后,一堆网址怎么再去塞第二次再爬虫呢
总不能手动一笔一笔丢吧 XDDDDDDDDDDDDDDDD
不好意思,请前辈们解惑
作者: hit1205 (帮你把勇气装满)   2014-10-02 21:16:00
为什么要手动呢 XD? 用 foreach 一个个丢?
作者: KawasumiMai (さあ、死ぬがいい)   2014-10-03 14:42:00
递回记得设定深度,还有重复判断,否则没完没了通常这种应该是深度优先,广度优先很占内存

Links booklink

Contact Us: admin [ a t ] ucptt.com