看到板上今年因为成绩好得太夸张
常常出现了战古今文
但又因为跨年度的数据难以进行比较
特别请教一下版上各位专业人才
在下对统计不太熟悉
究竟该如何比较跨年度的数据呢?
一点想法 希望能抛砖引玉
以打者为例
将过去三年皆有稳定出赛(*1),并且PA数在一定量以上的打者数据做为参考对象,观
察他们这几年表现变化并以此做成指数(index)。因为或许个别打者有爆发年。但整
个联盟的爆发年那想必是系统性因素引响(*2),而个别打者的爆发对于整体影响应该
不大。而在我们算出这指数之后,便可以借由削去系统性因素造成的影响将跨年度的
表现折算为同一标准,在比较各项数据诸如AVG、OBP、SLG、OPS与OPS+等等。
当然这方法还是存在许多问题,中华职棒球队数量并不多,而且有才华的新人辈出,
因此符合条件的球员制作出的指数代表性未必足够显著;各项数据在调整后是否会失
真也是个问题,还有调整的比例在前段球员与后段球员是否有差也应该要考虑进去,
或许已MLB的数据处理这些问题并不难,但回到中华职棒就会出现些问题了。
终归一句,给我第五第六队啊!!!
*1:过去几年该有稳定出赛才能当作标准是可以讨论的,只是举个例
*2:系统性因素系指对所有打者都造成影响的因素,无法避免,例:球。
当然若是打者都不打球那.......