Re: [爆卦] 网军分析系统上线

楼主: andy199113 (Andy)   2018-10-02 10:22:41
※ 引述《kuo1102 (昨天已过去)》之铭言:
: 2. 数据哪来的 ?
: 通常这种多是从数据库里捞数据然后交给程式统计, 一般如公共汽车 APP, 不是向
: 各公家机关要求数据库读取权限,不然就是从某些不能说的方法捞到资料。
: 最后的方法是向官方网页捞资料,或用 GOOGLE 的搜寻找某个网站 SITE 里的
: 关键字和关键 ID 捞到资料后来统计。
: 以上只是猜测。一般用在网页数据库统计中用最多的是 ASP 或 PHP。
: 自己建数据库。我猜不太可能。资料量太大,而且要用很多空间来装。
就是捞PTT资料阿,写程式机器人去抓阿
http://www.yousee.cc/ 已死
http://ptt-8g-class.appspot.com 已死
http://share.youthwant.com.tw/reader/ 半废
以前还有那个王XX的爱po吧和几个小站用Google服务抓
目前大概就是 ucptt、pttdata等等之类的备份站
最近几年的大多网站在PttAntiBot都有纪录
早期都靠注册大量的PTT ID,登入后去一篇一篇抓取,再放上网络
自从有了WEB版的PTT,抓取变得很简单,一般人就能抓了
光是Google就把文章都捞光了,那些砍站的网站也不用担心PTT ID被BAN掉了
这个网站只要砍完八卦板和政黑板的大多数文章,
期间从8月2日到10月1日短短两个月,
有了整篇内文再透过过滤,滤出IP成为数据库
PTT进化速度过慢,导致带风向太容易,随便注册个帐号,
或是花钱买个帐号,就能操弄舆论...
像是中国大陆学术移出到商业站的BBS、日本5ch、美国4chan、reddit等系统,
做的都比PTT好很多,可以BAN IP网段,可以直接封掉Proxy和VPN所有IP,
中国大陆的BBS更是可以同步在telnet和web接口发文修文删文,
而且很早就有这些好用的功能,不必再靠手动慢慢操作
PTT被网军攻占,站方可以说没有什么办法束手无策,
就算这个查询网站的出现也不会改变什么东西,
PTT站方有更完整的登入IP和时间可以查阅,
但就是抓不完恶意想要乱搞乱带风向的分身假帐号,
只能放任绿色网军继续乱搞
作者: pollux945 (已经变老谢了)   2018-10-02 10:55:00
真的 网军都绿色的很烦

Links booklink

Contact Us: admin [ a t ] ucptt.com