[分享] 最近完成的防爬虫 PHP library

楼主: terryshin (温暖的小太阳)   2019-06-10 14:35:28
最近完成的 library,主要用在自己网站
大约问市约一个月。
设计动机:
因为盗文农场 (例如 xx 头条) 之类的爬虫实在很多
由其中国那边很流行用镜像对映的方式盗人全站放广告
让我觉得很不爽。因为才会做这个。
做好之后稍微整理一下分享出来。
https://github.com/terrylinooo/shieldon
文件:
https://shield-on-php.github.io/
使用遇到问题欢迎到GitHub开 Issue 给我。
作者: holishing   2019-06-10 17:00:00
先推分享
作者: tgenie (你看不到我)   2019-06-11 08:22:00
推一个
作者: ice831107 (沁雨)   2019-06-11 19:10:00
推大大分享
作者: bakedgrass (蒙古烤小草)   2019-06-12 04:26:00
这样是不是也牺牲了SEO?
作者: MoMoShota (正太控)   2019-06-12 09:43:00
回4楼,这个可以设定白名单给指定的 bot
作者: hareion08 (巨蟹)   2019-06-12 13:47:00
作者: alian954 (PhantasyStaR)   2019-06-14 13:24:00
作者: cph911 (911_cph)   2019-06-18 08:24:00
设白名单的话爬虫不是也能伪装吗?
作者: teli (You Are)   2019-06-25 15:49:00
分享有推
作者: vi000246 (Vi)   2019-07-02 15:06:00
是用RDNS去判断是否白名单的 应该不能伪装吧
作者: powyo (光子郎)   2019-07-08 13:34:00
这有办法防headless吗
作者: harry8736968 (HiSunday)   2019-07-19 12:37:00
推分享
作者: swallowcc (guest)   2019-08-13 10:13:00
推,赞赞
作者: Edison4ever (叫我阿希就好)   2018-01-04 09:22:00
之前都用python爬 http://bit.ly/2QKPf4V看到这么完整的repo会想要重新回去玩PHP 谢分享~
作者: yuiweq1999 (imre2009)   2018-02-06 08:41:00

Links booklink

Contact Us: admin [ a t ] ucptt.com