小弟刚刚读书读累了,闲来无聊想到一个东西
就是应该有一些人投票的时候会从一号二号一路看下去
但是要一路看到一百多号也是很累的
所以应该不少人都会中途而废
这样看起来号次很前面的可能会有一些票数上的优势
坐而言不如起而行
坐在这边想不如实际上看看数据
于是小弟就从 shouko 大的票数变化图(https://zaka46.github.io/tpe48-votelog/graph.html)
提供的 Github 连结(https://github.com/zaka46/tpe48-votelog)找到了最近期的资料
我用的是 20171206.csv 里面 1512493501 的那笔数据
先来个 disclaimer:统计的手法总是会有盲点,而且我也没有跑任何 test,所以我在这边没有打算下任何结论
为了做一些应该比较有效的分析
我将所有征选成员每十号 group 在一起,但是把台研拿掉
也就是所有人理论上都是“素人”的身份(不过 112 的数据我懒得拿掉就是了)
这样就可以假设每个组平均实力都一样强,当然实际上强弱应该会差很多
上一下表格:
算术平均:32873.5 标准差:19011.7 标准差 / 平均: 0.58 [1~10]
算术平均:21700.9 标准差:10538.6 标准差 / 平均: 0.49 [11~20]
算术平均:13225.1 标准差:9792.5 标准差 / 平均: 0.74 [21~30]
算术平均:14041.7 标准差:15017.1 标准差 / 平均: 1.07 [31~41]
算术平均:12999.8 标准差:13906.9 标准差 / 平均: 1.07 [42~52]
算术平均:9995.9 标准差:12802.7 标准差 / 平均: 1.28 [53~62]
算术平均:15694.8 标准差:9912.4 标准差 / 平均: 0.63 [63~72]
算术平均:15695.4 标准差:13400.7 标准差 / 平均: 0.85 [73~82]
算术平均:10721.2 标准差:7142.7 标准差 / 平均: 0.67 [84~94]
算术平均:14533.6 标准差:21322.5 标准差 / 平均: 1.47 [95~104]
算术平均:29764.8 标准差:25228.7 标准差 / 平均: 0.85 [106~116]
算术平均:12894.0 标准差:10615.7 标准差 / 平均: 0.82 [117~126]
算术平均:20163.1 标准差:16206.2 标准差 / 平均: 0.8 [127~136]
算术平均:17919.2 标准差:14282.5 标准差 / 平均: 0.8 [137~146]
算术平均:6522.5 标准差:4548.8 标准差 / 平均: 0.7 [147~148]
除了平均我还算了标准差跟正规化后的标准差,
第三栏“标准差除以平均”越大代表组内票数多寡的差异越大,
可以看到有很多组别大概在 0.8 上下,超过 0.8 很多的组内应该都找得到票数很高的征选成员
第一组跟第二组则是最小的两组,代表两组组内的票数相对平均
从这份数据可以说,前两组的票数普遍高而平均,
或许跟号次有关,当然也很有可能是前两组的成员有比较容易吸引到很多人的魅力点
P.S. 表格的 gist 版在这:https://gist.github.com/qitar888/5df0155f490c08b6c40bf88958213776
P.P.S. 分析的原始码的在这: https://gist.github.com/qitar888/027047cccde259081dabf9213d051832
P.P.P.S. 看完这篇文请不要起争议,候补生们都很努力才走到这一步,虽然 48G 的风格好像就是要起一下争议(?)