※ 引述《yjjia (天桥底下说书人)》之铭言:
: 我觉得你用时间来分析爆文是有问题的
: 爆文跟标题有很大的关系
: 惊悚、夸大、八卦、joke...等等的标题
: 会影响到爆文的速度
: 还有就是PO文的时间也是一个参考点
: 清晨爆文跟白天的爆文速度本来就不一样了
: 平常时间的爆文跟接近选举时间的爆文也会不一样
: 我是觉得用IP异常来监测比较合理
IP这篇就有了 #1RuTlWzk
包括PO文的Soyud12全都卡神分身
你应该是没看懂他拿KKC来对照干嘛。KKC就是正常的网红被推爆,而且文章
样本大得多,也就是拿来对照告诉你一个正常的爆文数据应该长怎样
但看KKC达到速推门槛的比例跟厂工文根本天差地远,再来ID部分KKC那个几
百篇里的样本重复ID推文还比不上厂工10篇文的统计。简单说就是厂工分身
洗推文根本明显到不行,阿反正都是卡神自PO自推要不明显也难啦XD
还是一句话,只有白痴蠢猴才会被骗到
: ※ 引述《clothg34569 (提拉米苏冰淇淋)》之铭言:
: : 一样,东西放在GIT
: : https://github.com/Daniel34569/PTTCrawler
: : 然后使用方式和介绍前面两篇有了就不赘述:
: : https://www.ptt.cc/bbs/Gossiping/M.1541499806.A.EB8.html
: : https://www.ptt.cc/bbs/Gossiping/M.1541510766.A.2BE.html
: : 首先这次改版主要是新增了ID统计功能
: : 简单来说,异常爆文中(定义看前篇),N推内的ID会被记录起来,N为自定义参数
: : 再跑完目标范围(可以为指定篇数,EX:770000~780000;或者特定ID发的文)之后
: : 会统计出每个ID的出现频率
: : 如果要找网军的话,我是建议可以搭配之前那个i'Analyseur使用效果更好XD
: : 另外也建议要翻一下那篇文章中特定ID发了什么言再比对
: : 不过共通盲点应该是找不出政治废人和网军的差别
: : 接下来会以Soyud12和Kingkingcold的发文当作范围来作为范例
: : 使用这两个的原因是,刚好两个不同立场,而且都有大量爆文可以作为分析使用
: : 不得不说,八卦版真的是练习资料分析的好地方,八十万笔公开资料可以使用
: : 格式又很整齐漂亮
: : 首先是Soyud12
: : 参数与运行结果(因为只有11篇所就全贴了)
: : 这次参数门槛为,第25篇推文与发文间隔<10分钟...
: : 虽然Soyud的就算用5分钟也只会少一篇
: : https://i.imgur.com/XApSb4B.png
: : 符合设定门槛的10篇的前25则推文,总共250则推文
: : 其中的每个ID推文次数
: : https://i.imgur.com/CRayU9A.png
: : 前50则推文,共500则
: : 每个ID推文次数
: : https://i.imgur.com/lZfHNLK.png
: : 再来是KKC
: : 参数同Soyud12
: : https://i.imgur.com/8vTkNB2.png
: : 撷取前25则推文
: : 只有一张的原因是因为KKC两百多篇,跑两次好累= =
: : 结论:
: : 其实单从这个结果来看,我会认为KKC的文章似乎比较少受到网军影响
: : 而且他过门槛的比例也低很多(191篇中81篇过)
: : 然后重复ID推文数也少很多
: : 而Soyud12,我觉得已经可以接近网军分析的范本了
: : 虽然Vner那个更夸张,但是Vner发文量太少所以就分析Soyud12的
: : 14篇文章中,11篇文为爆文(剩下三篇非政治),其中10篇过门槛
: : 甚至有9篇过5分钟的门槛
: : 然后重复ID推文比例,10篇中可以和KKC 81篇相比
: : 就我自己而言,我觉得这是意外的机率有点低啦
: : 应该可以合理推测,这是网军的机率还蛮高的
: : PS:rorobus我不知道是政治狂热还是网军
: :