Re: [爆卦] i'Analyseur 新工具 爆文警示器

楼主: orze04 (orz)   2018-11-15 20:49:41
※ 引述《ckckcck5577 (一堆神经病)》之铭言:
: ※ [本文转录自 HatePolitics 看板 #1RxKzk1K ]
: 作者: pohor (pohor) 看板: HatePolitics
: 标题: [爆卦] i'Analyseur 新工具 爆文警示器
: 时间: Thu Nov 15 18:50:18 2018
: 安 打给后
: 阿肥我又来了 这次带来新的分析工具
: ★㊣↙ i'Analyseur a 爆文警示器 ↗㊣☆
: https://www.ianalyseur.org/trend/
: 阿肥一直在想,从推文有没有办法系统化的找出带风向的端倪呢?
: 经过7749天的辛苦研发,终于让阿肥顿悟啦
: 直接讲案例
: 请看 http://bit.ly/2A3ZwRJ
: 如果你不想开google drive 以下是部分截图
: https://i.imgur.com/MYVObpe.png
: 简单说,这里列出四篇文章
: 里面有超过10个帐号,在发文的20分钟之内,用几乎一样的顺序推文
: 要知道八卦版这一年内有发文推嘘文的帐号共有约12万个
: 要出现相同10个帐号用一样的顺序推文的机率约是12万的10次方,比中100次大乐透还难
: 更何况是有超过4篇的文章有这种现象 ( 有兴趣的网友可以自己查查看,远超过四篇)
帮补充下...这边机率错蛮大的
推文顺序一样的机率会跟总文章数有关
国中应该都算过班上人数超过多少时,有50%机率至少有两人生日一样
随便抓10个帐号,他们在N篇文章中至少两篇文章中推文顺序相同的机率
P(在N篇文章中至少有两篇文章中推文顺序相同)
= 1-P(在N篇文章中所有推文顺序相异)
10个帐号有3628800种排列组合方式
= 1-(1 * 3628799/3628800 * 3628798/3628800......(3628800-(N-1)/3628800) )
= 1-( (3628800!/(3628800-N)!/3628800N)
假设N=2000
= 1-0.5767
= 0.42
特定10个ID,在2000篇文章中42%机率顺序会一样
不过大前提是他们都有在这2000篇中出现
光是会出现推文就是一个重大意义,就算某C开头的柯黑也没有每篇都出现
时间邻近程度、议题接近才是最重要的指标
: 还是在发文20分钟之内
: 以机率来说这非常不合理
: 在google drive的那个sheet共列出4篇文章
: 我保留了该段区间的其他推文者,避免又被说阿肥我造假了
: 如果原文被砍,别担心还有备份站都帮您准备好了
: 异常的推文用橘色标注,并标上编号
: 以第一篇来说
: 编号 1 是 kopak0910,下一个推的是 k418026 但是他是插花的,所以没有标橘色
: 再往下编号 2 是 lim15015,... 依此类推 总共有 13个标橘色的可疑帐号参与
: 第二篇也可以看到 kopak0910 -> lim15015 -> jason31831…
: 同样的顺序只是中间插花的人不同
: 第三篇也维持一样的顺序,但是编号8的 B0091309 这次没有参与
: 第四篇编号4, 6 的顺序稍微有点乱,其余则维持原来的顺序
: 这么低的机率,都发生在某个特定的议题上
: 这不是带风向,那什么才是带风向呢?
其实这个问题网军以后只要增加僵尸帐号数量就好
ex: 网军数量增加5倍 C(100,10) -> C(500,10)
重复机率就从等比级数下降了
直接实名制,ban掉非台湾使用者就好

Links booklink

Contact Us: admin [ a t ] ucptt.com