[闲聊] 了解hsreplay可能的数据偏差

楼主: Jotarun (forever)   2018-04-24 22:46:15
最近常常逛hsreplay 对里面很多资料来源准确度有很困惑的地方
今天刚好reddit有个统计学教授发文 https://redd.it/8ejtxd
他提到的跟我想的不谋而合 借机整理一下重点给大家:
有兴趣的可以点进去读他的全文
因为记牌器 只有你的牌组 对面的要打了才知道 所以
1. 理论上 如果装记牌器的人是随机选择 则不会影响胜率
但实际上会装的人多半比较在意胜率 或者是实况主
应该算是偏向比较会玩炉石的人
所以可能会让一些热门牌组胜率比实际高
所以你去decks那边看的胜率常常比去meta那边看的高
2. meta那边的胜率应该有包含对手的胜率
hsreplay没有公开他们的演算方法
但是 对手牌还没打完的时候 很有可能无法判断对手牌型
像是任务或者奇偶系列很好判断 但例如西瓜跟控术就不容易了
这就是为什么在meta那边有这么多 其他术士 其他圣骑士
这种选择性的偏差可能导致20%左右的误差 而且数据再多也不会修正
3. VSdata 是把记牌方胜率跟对面胜率平均 加上他们牌型辨识相对严谨
这种误差相对就小了不少
作者: studentccccc   2018-04-24 23:55:00
MingZ 说的是
作者: madeinheaven   2018-04-25 11:21:00
记得暴雪之前说过这种统计网站误差都满大的

Links booklink

Contact Us: admin [ a t ] ucptt.com