PTT
Submit
Submit
选择语言
正體中文
简体中文
PTT
PHP
[请益] 如果我想要手动抓下一个网站要如何开始?
楼主:
oiolong
(龙龙龙)
2017-07-13 10:08:11
请问一下
我想要把一个网站里面的所有资讯拿下来到数据库里面
我要怎么开始呢?
google 过有很多 github 的 source code
但由于是初学者,想要自己造轮子
我的构思大概是这样
1 用 curl 去拿到 sourcecode
2 用 php 去分析内容 (regular expression or xpath or .... ?)
3 存入db
目前卡在2 的选型上面,
想请教版上的大大们
哪种方式比较好呢?
作者:
MOONRAKER
(㊣牛鹤鳗毛人)
2017-07-13 10:30:00
以2而言,弄一个HTML parser应该比较方便
作者:
shadowjohn
(转角遇到爱)
2017-07-13 11:04:00
2 有 simplehtmldom、phpquery 可以用,re稍累简单的用getBetween就好了,php manual满多人分享
继续阅读
[请益] 请问有人使用过问卷系统LimeSurvey吗
Ohgogogo
[请益] 继承的练习 跑不出来
james733s
[请益] 正规表达式能使用变量吗?
q10242
[请益] 参数物件的使用
DongFeng
[请益] mac xampp Xampp-vm 用途
chiang0514
[请益] 如何呼叫另一个程式
davidroman
Re: [请益] line Messaging API 开发
lovemba
Re: [闲聊] 新手学 PHP 不要从 Laravel 开始
Neisseria
Re: [闲聊] 新手学 PHP 不要从 Laravel 开始
JYHuang
[闲聊] 新手学 PHP 不要从 Laravel 开始
GALINE
Links
booklink
Contact Us: admin [ a t ] ucptt.com