https://reurl.cc/lNVzxj
作者:篮圈即是原点
每天都刷BBE的朋友可能已经发现了,BBE首页的一体化数据页面做了一些小调整,主要是
为了应对这赛季EPM的彻底改版。
EPM在这赛季的早些时候上了个全新的版本,这次变化不是简单的算法优化更新,而是让E
PM完全变成了另一个数据。过去的单赛季EPM是根据当赛季数据计算的球员赛季表现。根
据作者的意图,它既是一种面向未来的前瞻性数据,也是一种对当赛季已经完成了的比赛
中球员表现的解释性或者总结性数据,但是新EPM则是完全的前瞻性数据,提供一种近未
来的球员表现预测。
新EPM的含义和思路基本上和Kostya Medvedovsky创建的DARKO一致。之前我聊过一次几个
常见一体化数据的对比,当时单独撇开了DARKO系统中的DPM,就是因为DARKO是思路最特
殊,意图也完全不同的数据。新EPM和DARKO都采用了机器学习,并且根据球员整个职业生
涯到目前为止的表现,来估算当下这个时间节点下,球员在下一场比赛最有可能打出的表
现,所以他们都是每日滚动更新的。
在DARKO系统中,最核心的其实是对球员面板数据的预测,DPM反倒是个顺便产生的数据,
它最初的目的在于回答“当一个球员打出了某种数据,我们该认为这是随机性带来的噪音
,还是具有长期意义的水平变化”这个问题。它把球员整个职业生涯的数据都纳入计算范
围,并且给每一项数据设置了一个在0-1之间的参数,并附带一个和时间轴相关的指数模
型,即越近的比赛在计算中会拥有越高的权重。不同的数据项目会有不同的参数来应对这
项数据本身的稳定性,比如三分命中率远期数据权重就会比篮下命中率的要高,因为三分
命中率本身的随机性更大,长期表现更可靠。
DARKP和新EPM通过这种方式把球员的进步或衰退动态地体现在数据中,获得更好的预测效
果。所以,如果一个球员在新赛季开赛后有一个爆发式的进步,模型在一开始并不会立刻
反映这一点,而是会基于生涯数据对这种进步只给出谨慎地评估,但随着赛季的进行,球
员持续保持这种水平,近期的比赛数据就会把它视作长期的水平变化反映在预测系统中。
例如Garland在开赛首周后的O-EPM只有+0.8,更接近于他上赛季的表现,两周后就上升到
了+1.8,现在上升到了+2.8。在旧EPM,LEBRON等xRAPM数据,包括基于面板数据计算的BP
M,PIPM等一体化数据中,我们在赛季初期可能会看到一些很夸张的数值,之后才会因为
样本增大,数据逐渐趋向稳定(所以他们经常要开赛一两个月后才公布,BPM的小样本爆
炸则很容易看到)。
与DARKO的面板数据预测一样,伴随新EPM一起上线了Estimated Skills系统,它也给出了
球员面板数据的预测,我个人不玩FBA,不知道DARKO和EPM的这种预测对玩FBA有没有帮助
,但DARKO的作者声称它的系统在FBA游戏中的预测表现很不粗,至少肯定强于此前市面上
一些网站的表现。
EPM的这次更新对很多pvp玩家来说,价值暴跌,毕竟不再是单赛季的表现综述了,对线的
时候用起来很不方便,描述本赛季表现得时候并不合适,之前发开赛影响力数据图得时候
我也用了LEBRON而不是新EPM。不过无论是新EPM还是DARKO本身仍然是非常有价值的,NBA
业内人士有不少也都认可DARKO这种思路,EPM现在也往这个方向上走,或许正说明了这是
一体化数据未来发展的趋势,所以BBE就借这个机会也把这两项摆上去方便大家看。比较
遗憾是这类数据的动态变化部分BBE的框架没法展示。
最近因为更新,可能会连带出一些bug,有遇到的话可以给我留言或者私信。