[MLB] 介绍xwOBA与延伸探讨

楼主: Hakase5566 (G8咖哩鸟)   2022-05-29 23:42:33
在各式Statcast数据已经普及的现在,xwOBA堪称是新一代进阶数据里面最具有代表性的指
标,其特性能把打者所有击球的品质量化,在传统的出局/安打或是垒打数的框架中走出一
片以期望值概念为基底的蓝海。然而Baseball Savant只考虑击球初速(EV)和击球仰角(L
A)的做法,也时常惹来质疑,毕竟两个相同EV & LA的组合的球,打在左外野和中外野可能
就是全垒打和出局的差别;而xwOBA未考虑推拉角度(Spray Angle),难免有低估极端的推
打者和拉打者之嫌。我们将会透过一系列的文章,探讨xwOBA在使用上常见的盲点,或是普
遍被认为是盲点但实际上可以使用的部分。
首先我们要介绍xwOBA的做法,在这之前我们要先搞懂什么是wOBA,而下图是wOBA的计算公
式:
https://i.imgur.com/0stg1fg.png
我们可以发现,事实上这一串分母就是打者的有效PA(也扣掉了想打都没得打的IBB),而
分子则是在这些有效PA下,打者累积的“价值”。这边可以代入长打率的概念:在长打率的
世界里面,一支一垒安打的价值是1、二垒安打是2、三垒安打是3,而全垒打是4,这样的计
分方式虽然非常直观,但也反映了一种价值观——那就是一支三垒安打的价值是一垒安打的
三倍、一支全垒打的价值是各一支的三垒安打和一垒安打、四支一垒安打等值于一支全垒打
,但真的可以这样换算吗?经常看球的球迷恐怕很难接受这样的设定。
棒球统计家解决这个困境的作法是去计算每一种产出带来的价值,如上面的公式所示,一垒
安打是0.89、二垒安打是1.27、全垒打是2.1,而出局是0(接杀和三振都一样)。可以注意
这里没有提到单位,原因是为了让wOBA更靠近大家习惯的上垒率,这一串系数都是经过调整
的,所以实际上wOBA是没有单位的,纯粹是一个“综合评估上垒和长打”的指标。所以使用
wOBA的时候,完全可以沿用你对上垒率的感觉——如果你知道一个上垒率高于四成的打者是
上垒机器,那一个wOBA > 0.4的打者同样是相同等级的进攻机器。
知道了wOBA的意义之后,下一个问题是xwOBA又是什么?
在上面我们已经知道wOBA是把打者在球场上的产出(二垒安打、全垒打等等)换算成价值,
但这又可以延伸出下一个问题:相同的产出价值就会一样吗?擦到球皮的内野安打和打得扎
实的平飞安打都是一垒安打、射墙的飞球和不营养的飞球都会形成二垒安打,还有330和380
英尺的球可能分别形成全垒打和接杀,难道场上发生的结果就能代表打者的强度吗?显然是
不行,自从用球棒把球打出去后,打者就已经完成自己的打击工作,剩下无论是防守者的表
现或是球场风向,都不是打者的能力,因此用wOBA衡量他们的实力恐怕不够周全。
Baseball Savant想到的做法是还原打者的击球强度,这的确是聪明的想法,在wOBA或其他
传统数据的框架底下,打者打了一颗深远的飞球,本该得到奖励,却落得打者时常会因为防
守者的超常发挥还反过来要被扣分。xwOBA直接以EV & LA比对过去所有类似的击球结果,透
过模型运算(*注1)出各种结果的发生机率,假如一颗95mph & 25度仰角的飞球有10%会出
局、10%会形成一垒安打、40%会形成二垒安打、5%会形成三垒安打、35%会形成全垒打,那
就把它算作0.1支一垒安打、0.4支二垒安打、0.05支三垒安打、0.35支全垒打,透过这种作
法,我们再也不用去讨论:“这球本来应该会飞出去,不然至少也是二垒安打,可惜被接杀
”,把打者该得到的价值还给他们,这就是xwOBA的核心理念。而这些形成一垒安打、二垒
安打、…、全垒打的机率,我们就在前面加上一个x,写作x1B, x2B, …, xHR,并用他们构
筑出一个充满期望值概念的变种wOBA,xwOBA。
这样的想法非常直觉,但聪明的读者应该也想到了——只用EV & LA真的没问题吗?100mph
& 25度仰角的球打在中外野可能在警戒区被接杀,但95mph & 25度仰角的球打在左外野可能
就飞出去了,不考虑Spray Angle做出来的模型真的能有效量化击球的强度吗?下一篇文章
,我们将会讨论各类打者的推拉打性质,配合他们xwOBA和wOBA偏离的程度,来探讨xwOBA是
否会低估特定类型的打者。
*注1:
根据MLB Technology Blog的解释,他们在计算各种产出的机率时,结合了两种数学模型。
针对滚地球、弱击球、内野小飞球,会使用广义加法模型。
针对平飞球和飞球,则是使用k-NN模型。关于k-NN模型,最白话的说法就是找到条件最接近
的几颗球,再去统计他们的结果——例如今天我们要预测一颗90mph & 20度的球形成各种产
出的机率,我们会去找和它最接近(平面座标上距离最短,大家还记得国中数学吗)的100
颗球,发现其中有20颗出局、50颗一垒安打、20颗二垒安打、10颗三垒安打、0颗全垒打,
那我们就认定这样的球形成出局、一垒安打、二垒安打、三垒安打、全垒打的比例(定义上
不全然是机率)分别是20%, 50%, 20%, 10%, 0%,再代回一开始的公式就可以知道这颗球的
xwOBA值多少了。
https://reurl.cc/q5Y753
================================
这作者蛮厉害的耶
难得看到有人能把进阶数据写的这么浅显易懂
作者: r5588801 (etrava0224)   2022-05-29 23:45:00
棒球进阶数据越来越复杂 我都看不懂惹==
作者: phil10048196 (Manstein)   2022-05-29 23:50:00
反正数据仅供参考,实际结果打了才知道,但我满喜欢看这种介绍进阶数据的文章

Links booklink

Contact Us: admin [ a t ] ucptt.com