※ 引述《woominin (没事就好)》之铭言:
: 不好意思,小弟刚接触php不久
: 有关于parser的问题想要询问一下
: 比方说,我有一个网页想要parser
: http://house.ilantravel.com.tw/
: 而这个网页最下方有一堆民宿的文字超链结
: 请问我要怎么parser这些超链结的文字部份呢
: 检查了原始码,比方说
: <td><span class="s1">.</span></td>
: <td><font size="2">
: <a href="bnb/kite.htm" target="_blank">风筝小木屋民宿</a></font></td>
: 这是其中一个
: 我要怎么parser出来 风筝小木屋民宿 这串文字呢 ??
: 我有用 simple_html_dom.php
: $dom = file_get_html('http://house.ilantravel.com.tw/');
: $result = $dom->find('a');
: foreach($result as $v) {echo $v->href . '<br>';}
: 这样只能parser出超链结,但无法辨认,哪个链结是谁
: 麻烦前辈解惑,谢谢
<?php
include '/var/www/html/inc/simplehtmldom/simple_html_dom.php';
$dom = file_get_html('http://house.ilantravel.com.tw/');
$result = $dom->find('a');
foreach($result as $v) {
$title = $v->innertext; // 用这个直接抓 <a xxx>这里的内容</a>
echo "(" . $title .")" . $v->href . "\n";
}
(关于我们)aboutus.htm
(宜兰民宿)http://bnb.icsp.com.tw
(宜兰住宿)http://www.goez.tw
(宜兰民宿)http://house.ilantravel.com.tw
(花莲民宿)http://house.netete.com
(台东民宿资讯网)http://www.ttbnb.com.tw
(宜兰民宿 )http://www.ilanbnb.tw
(花莲民宿)http://www.bnb.idv.tw
(宜兰民宿)http://www.ilanbnb.com.tw
(台东民宿)http://www.travel123.com.tw
(宜兰美食)http://www.399.com.tw
(礁溪温泉)http://jiaoxi.ilantravel.tw
(罗东夜市 )http://luodong.ilantravel.tw
(宜兰包栋民宿 )http://www.goyilan.com
(童玩节)http://child.ilantravel.com.tw/
(宜兰生活)http://life.goez.tw/
(罗东住宿)http://lotong.yilanminsu.com.tw/
大概会长这样吧~