Re: [心得] 认识正负值(Plus/Minus)- RAPTOR

楼主: IBIZA (温一壶月光作酒)   2020-05-08 21:16:31
※ 引述《driftcreator (北美漂流中)》之铭言:
: ※ 引述《IBIZA (温一壶月光作酒)》之铭言:
: : 这篇的介绍大概有30%是错的, 但错的还蛮关键的
: : RTG不是+/-系列数据, RTG是基于Points Produced的进阶数据
: 官网的RTG系列是把球员在场上时,球队的得失分做百回合量化,跟+/-值一样属于结果数据,因此我把他们放在同一个类型下。
用百回合量化方式呈现的数据很多
但是否属于+/-系列数据, 跟用百回合量化毫无关系
事实上原始的+/-数据就不是百回合量化
: : 关于ESPM RPM
: 以下是没有放上来的原文内容
: 正负值的核心问题是样本不足的情况下准确度很差。RAPM具效性的样本通
: 说是三年起跳;也因此半季不到就能产出内容的正负值数据中,公开资料
: 都是以高比例的BPM为基底,否则无法有效反应球员的当季表现。RPM虽为
: 黑盒子,但普遍认为ESPN也是以相同的方式产出数据。
: RPM对于box score的使用相当吃重是公认的,当然不一定是像RAPTOR这样
: 直接BPM系跟RAPM系两组数据调比重混合出结果,但我个人不觉得只靠RAPM
: 基底调参数就能让结果敏感反应,特别在你2.0 matchup又多了更多小样本
: 参数的框框下。
: 因此在RPM真的公布细节之前,我还是会把它跟有使用到+/-的数据放在同一类。
ESPN RPM有使用到box stats, 这没问题, 说明就有说了
但不能说有用到box stats就跟BPM是用相同方式产出数据
另外, RAPTOR并不是用“BPM系跟RAPM系两组数据调比重混合出结果”
RAPTOR基本上是用BPM的的方式做计算, 只是使用的变量不同
BPM只用了基础数据作为变量, RAPTOR加上了动态追踪作为变量
他们两个都没有使用到RAPM数据, 也没有什么调和比重问题
BPM跟RAPTOR和RPM的关联只是, 他们建立公式的目地
都是要使它们的公式能追踪长期RPM
: : 这边的说明是错误的
: : RAPM并没有默认球员表现稳定,不存在定位或化学反应
: : 相反的, RAPM利用大数据去分析lineup与lineup的对抗
: : 这是RAPM被推崇的主要原因
: : 但也是RAPM的问题, 因为很多lineup的回合数不足以消除偏差
: : RAPM知道定位跟化学反应的影响, 尝试用大数据去分析lineup的影响
: : 你可以说他受限于数据做的不够好, 但不能说他没这样做
: 基底APM是把结果lineup拉矩阵去求个别球员的独立值,因此APM的假设前提
: 就是样本中球员每分钟的表现恒定,不管是跟谁搭配。
APM拿lineup去拉矩阵的目的是求一个球员在每个lineup下的平均值
而不是假定他在每个lineup的表现都一样
事实上就是每个lineup表现不一样, 才需要每个lineup去拉
如果假定在每个lineup表现都一样, 其实我只要拉一个lineup出来就好了吧XD
: : 这边错了, 网页上85%跟21%指的是Total RAPTOR=85% BOX RAPTOR+21% On/Off RAPTOR
: : 跟BPM和RAPM无关
: 这边是我的用语不够精准,主要是想表达前者基于BPM结构,后者基于RAPM结构
On/Off RAPTOR也不能说基于RAPM结构
On/Off RAPTOR最主要是使用
自己的ORTG/DRTG、场上队友的平均ORTG/DRTG、场上队友的场上队友的平均ORTG/DRTG
这三个数据去计算球员的On/Off RAPTOR
或许在原始概念和RAPM有点像(因为都牵涉到On/Off的概念)
但这并非RAPM结构
作者: driftcreator (小雷)   2020-05-08 21:29:00
你是对的, RAPTOR的on/off的确是BPM架构我的原文有许多需要调整的地方, 先砍掉找时间重编辑
作者: ginopun10477 (大腿牌)   2020-05-09 00:07:00
文组 :
作者: driftcreator (小雷)   2020-05-09 05:09:00
我错的是说明书没读好这种很基本的错误, 文章留着误导读者没什么意思

Links booklink

Contact Us: admin [ a t ] ucptt.com