Regularized Adjusted Plus-Minus (RAPM)
由于APM只用误差最小平方法进行估算
若有球员表现呈高度相关性
则会出现多重共线性的问题
导致不同球员估算的正负值有剧烈的浮动
有的绝对值十分巨大 有的则趋近于0
此时可以在误差最小平方合的矩阵外
额外加入λx正负值反矩阵x正负值矩阵
(可以想像成λx正负值平方和)
利用惩罚项λ让正负值不会出现绝对值异常大的情况
这种作法称为岭回归(ridge regression)
这也是RAPM以及许多新的篮球数据模型的基本方式
除了ridge regression之外
还可以加入幸运值的影响(luck-adjusted RAPM)
举例来说队友和对手罚球命中率不会受个别球员能力影响
但不同的命中率会影响球员的正负值
这个也能透过luck-adjust调整
小结
自从PER问世以来 进阶数据已随着资料科学的进步蓬勃发展。
除了引用基本数据做为公式之外
新的进阶数据更像是透过新数据不断修正的模型
有的主打动态数据 有的加入幸运值 有的则是能预测未来发展
甚至还有利用机器学习建立的模型
今天介绍的RAPM是很多先进模型会引用的
其实进阶数据背后有很多数学以及原理
若能稍加研究
就能推断出各个数据的优缺点以及适用范围
个人觉得比起纯粹比数字大小有趣多了XD
延伸阅读
RAPM介绍
https://reurl.cc/Mk4Qyp
Ridge Regression (youtube 影片)
https://reurl.cc/V5NxNy
Luck-adjusted ratings
https://reurl.cc/OkGNGy