Re: [心得] 认识正负值(Plus/Minus)- RAPTOR

楼主: IBIZA (温一壶月光作酒)   2020-05-08 12:16:17
※ 引述《driftcreator (北美漂流中)》之铭言:
这篇的介绍大概有30%是错的, 但错的还蛮关键的
: 正负值(+/-)可说是篮球数据界的殿堂名驹,现今你能拿来直接做球员比对的all in one数据,多带有正负值血统。其血统表如下:
: ・第一代“原始数据”:正负值(+/-)、官网RTG系列
RTG不是+/-系列数据, RTG是基于Points Produced的进阶数据
: ・第二代“回归分析修正”:APM → RAPM
: ・第三代“混合传统数据”:ESPN RPM(2013年版)
: ・第四代“混合动态追踪数据”:ESPN RPM(2019年版)、RAPTOR
: 个人当前较推荐使用RAPTOR。逻辑透明且能追朔至2013赛季。
: 新版ESPN RPM因为是黑盒子的关系,所以无从介绍验证。目前RPM的产出结果,与其他版本(RAPTOR、BPM2.0、PIPM)存在较大的差异性。
ESPN得到RAPM授权之后, 推出了RPM
就RPM的说明, RPM是以RAPM为基底, 加上数据做调整, 但一直没说明调整的方式
所以上面关于ESPN RPM的说明没问题
但就RAPTOR的说明, 他并不是和ESPN一样, 以RAPM为基础加上数据做调整
而是直接用传统数据+动态追踪数据, 透过回归分析去追踪RAPM
这一点和BPM的做法类似, RAPTOR在网页上也直说是由BPM得到灵感
为什么BPM跟RAPTOR会这样做?
RAPM的模型自从推出后就广被推崇
但RAPM最大的问题, 就是需要够大的回合数才能得到有效的数字
这边的回合数在一开始RAPM的网页中被定义为20000回合
但其实一整季都打不到这个数字
最操劳的球员都要三季才能得到20000回合数, 遑论有很多球员一辈子可能都达不到
因为RAPM计算不便, 又有短期效度问题
所以就有人尝试以传统数据用回归分析, 去追踪长期RAPM
这种做法的想法就是
以长期RAPM作为应变项, 为每个挑出来的数据跑回归分析, 找出权重
这样找出来的所有权重*数据之后加起来, 就会近似于长期RAPM
那么之后我们就可以直接把权重*数据当作长期RAPM
最初是2011年的ASPM
ASPM用传统数据透过回归分析去追踪八年(2003-2011)的RAPM数据
ASPM后来授权给BR网站, 因为他是用传统数据, 也就是Box Stats去追踪RAPM
所以被取名为BPM
RAPTOR则是BPM的新一代版本
RAPTOR在传统数据之外, 加上了官网在近六年提供的动态追踪数据
简单讲, ESPN RPM是RPM的混合版本, 他仍然是基于原本的RPM模型, 但加上数据做调整
但BPM跟RAPTOR则是RPM的追踪版本, 用回归分析去追踪某段长时间的RAPM, 以此产生公式
虽然都基于RAPM, 但他们是完全不同的东西
把他们列为不同代的数据是不适合的
要比喻的话
ESPN RPM是RAPM+其他数据生的小孩
而BPM跟RAPTOR则是透过整形把自己整得像某一段时间的RAPM
:
作者: jonathan8907 (Skrillaxs)   2020-05-08 13:30:00

Links booklink

Contact Us: admin [ a t ] ucptt.com