[闲聊] 进阶数据RAPM简介(二): PM and APM

楼主: f820203 (frankkao)   2021-10-14 20:22:39
前面已经说明PER不能确实反映球员对球队获胜机率的影响
因此一个直觉的方法就是直接看球员在场上球队会领先还是落后
正负值(Plus Minus, PM)还蛮简单明了的
就是特定球员在场上的时候,(球队-对手得分)是变大还是缩小
数值越大代表对球队帮助越多,负值就是伤害球队
但是PM会有几个大问题
1. 大部分球员无法单独控制比赛走向。
Ex. 对面如果狂下三分雨,你的正负值就会崩盘
2. 没有针对队友和对手强度调整。
举例来说,你跟LBJ同时上场正负值就会偏高
若在另一边则可能会很难看
这样正负值显示的是LBJ的影响不是你的影响
3. 样本数低之下噪声偏高。
如果你这场正负值是+10,但湖人陷入苦战LBJ正负值只有+5
这样代表你打得比LBJ好吗
恐怕不见然
为了解决前两项问题,有人提出了Adjusted Plus Minus (APM)
APM的基本想法就是考量队友以及对手的强度,把正负值分配到适合的球员身上
计算方法(*为了表达方便经过简化)就是解不同阵容的多项式
举例来说
X1= (A1+A2+A3+A4+A5)-(B1+B2+B3+B4+B5)
X2= (A1+A4+A5+A6+A8)-(B3+B4+B5+B7+B10)
X3= (A2+A3+A5+A7+A9)-(B1+B3+B4+B5+B8)
……
其中X为每百回合得分差
A为我方球员 B为敌对球员
透过套入矩阵解多项式
就能得到A1, A2, A3, B1, B2, B3等个别球员对球队的贡献
由于矩阵并非方阵
因此利用拟反矩阵(Pseudo Inverse Matrix)来近似反矩阵
并用最小平方法估计不同球员的贡献值
APM听起来好像很理想
能把球队贡献分配到个别球员
但是也有3个问题
1. 最小平方法是用估计的
会遇到变异数巨大的问题
2. 教练喜欢把特定几位球员一起放上场
导致贡献很难有效区分
3. 部分球员一起上场时间很少
导致样本噪声偏高
缺乏统计意义
第二和第三个问题比较难克服
总不能强迫教练不用固定阵容 让大家随机上场
但第一个问题就是Regularized Adjusted Plus-Minus (RAPM)想要解决的
下回待续
作者: ray997 (accunmh)   2021-10-15 12:25:00
作者: spursgdppop   2021-10-17 12:00:00

Links booklink

Contact Us: admin [ a t ] ucptt.com