Re: [心得] 认识正负值(Plus/Minus)- RAPTOR

楼主: driftcreator (小雷)   2020-05-08 19:17:10
※ 引述《IBIZA (温一壶月光作酒)》之铭言:
: 这篇的介绍大概有30%是错的, 但错的还蛮关键的
: : 正负值(+/-)可说是篮球数据界的殿堂名驹,现今你能拿来直接做球员比对的all in one数据,多带有正负值血统。其血统表如下:
: : ・第一代“原始数据”:正负值(+/-)、官网RTG系列
: RTG不是+/-系列数据, RTG是基于Points Produced的进阶数据
官网的RTG系列是把球员在场上时,球队的得失分做百回合量化,跟+/-值一样属于结果数据,因此我把他们放在同一个类型下。
: 关于ESPM RPM
以下是没有放上来的原文内容
正负值的核心问题是样本不足的情况下准确度很差。RAPM具效性的样本通说是三年起跳;也因此半季不到就能产出内容的正负值数据中,公开资料都是以高比例的BPM为基底,否则无法有效反应球员的当季表现。RPM虽为黑盒子,但普遍认为ESPN也是以相同的方式产出数据。
RPM对于box score的使用相当吃重是公认的,当然不一定是像RAPTOR这样直接BPM系跟RAPM系两组数据调比重混合出结果,但我个人不觉得只靠RAPM基底调参数就能让结果敏感反应,特别在你2.0 matchup又多了更多小样本参数的框框下。
因此在RPM真的公布细节之前,我还是会把它跟有使用到+/-的数据放在同一类。
: 这边的说明是错误的
: RAPM并没有默认球员表现稳定,不存在定位或化学反应
: 相反的, RAPM利用大数据去分析lineup与lineup的对抗
: 这是RAPM被推崇的主要原因
: 但也是RAPM的问题, 因为很多lineup的回合数不足以消除偏差
: RAPM知道定位跟化学反应的影响, 尝试用大数据去分析lineup的影响
: 你可以说他受限于数据做的不够好, 但不能说他没这样做
基底APM是把结果lineup拉矩阵去求个别球员的独立值,因此APM的假设前提就是样本中球员每分钟的表现恒定,不管是跟谁搭配。
: 这边错了, 网页上85%跟21%指的是Total RAPTOR=85% BOX RAPTOR+21% On/Off RAPTOR
: 跟BPM和RAPM无关
这边是我的用语不够精准,主要是想表达前者基于BPM结构,后者基于RAPM结构

Links booklink

Contact Us: admin [ a t ] ucptt.com