前言:
我是一个普通的棒球迷,完全没有棒球相关或数据分析方面的工作经验
本文只是我在今年中职季赛结束之后,对一个感兴趣的主题进行的个人分析
如果要只用一个数字,衡量一名打者站在打击区的破坏力,有两种常见的方式:
1. OPS,即OBP(上垒率)和SLG(长打率)直接相加,简单无脑但是好用
2. wOBA,通常称为“加权上垒率”,实际上是全面评估打击能力,需要用参数计算
OPS的无脑到底有多无脑?它的缺点是什么?
中职2024年每队各打120场,取120打席作为门槛
120打席以上的所有打者数据,与本文想要讨论的内容均列于此文件中:
https://shorturl.at/4SQ3T
资料来源:野球革命
https://shorturl.at/ojntf
今天假设你手上有一群打者的传统数据,包含OPS(就算没有你也能自己加)
但你暂时查不到wOBA,那你应该会用OPS的排序来大致衡量打者的优劣
由于OPS大致上还是很好用,所以它应该会和wOBA有较为接近的线性关系
以wOBA作为目标值,OPS作为变量,进行线性回归求最小误差参数
得到的参数为 mOPS=0.3977351213,b=0.03464669432
这代表简略地使用 0.3977351213 x OPS + 0.03464669432
就大致可以估计中职打者在2024年的wOBA(如果你刚好查不到的话)
估计的平均方根差为0.006,误差其实还不会太大
不过用OPS逼近wOBA其实没什么意义(线性关系的大小的顺序并不会改变)
这个分析的重点在于找出“为什么OPS有时候会不太准确”
已知wOBA是评量打者攻击表现的较准确数据
如果用OPS线性估算得到的数据更高,代表OPS可能高估了实际表现
反之,代表OPS不足以完全反应这个打者的打击贡献
当然这边的高估低估与打者本身过不过誉无关,纯粹是数据上的意义
数据被高估的打者:
打席 OBP SLG OPS wOBA OPS转wOBA 误差
魔鹰 493 0.367 0.567 0.934 0.388 0.406 +0.018
林承飞 220 0.257 0.368 0.625 0.268 0.283 +0.015
数据被低估的打者:
打席 OBP SLG OPS wOBA OPS转wOBA 误差
林哲瑄 173 0.304 0.219 0.523 0.257 0.243 -0.014
李凯威 495 0.398 0.371 0.770 0.353 0.341 -0.012
邱智呈 530 0.418 0.427 0.845 0.381 0.371 -0.010
陈杰宪 472 0.421 0.416 0.837 0.378 0.368 -0.010
陈品捷 150 0.306 0.240 0.546 0.262 0.252 -0.010
可以发现,SLG表现比OBP好的打者,OPS容易被高估,反之亦同
这与常常被提到的一种观念相符:
OBP是非常有价值的属性,但OPS将其直接相加却淡化了它的价值
所以,更好的做法是拿OBP和SLG作为两个变量,同时估计线性参数
得到的参数为 mOBP=0.5898237600,mSLG=0.2873139236,b=0.01149955973
也就是用 0.5898237600 x OBP + 0.2873139236 x SLG + 0.01149955973 来估计wOBA
这种估计的平均方根差只有0.002,高估低估的情况也相对不明显
数据被高估的打者:
打席 OBP SLG wOBA OBP/SLG转wOBA 误差
许基宏 387 0.368 0.446 0.353 0.357 +0.004
王正棠 354 0.375 0.463 0.362 0.366 +0.004
张政禹 244 0.298 0.363 0.288 0.292 +0.004
张育成 182 0.445 0.540 0.425 0.429 +0.004
数据被低估的打者:
打席 OBP SLG wOBA OBP/SLG转wOBA 误差
张志豪 201 0.308 0.429 0.321 0.316 -0.005
岳东华 442 0.326 0.317 0.298 0.295 -0.003
陈子豪 344 0.355 0.515 0.372 0.369 -0.003
高国麟 247 0.332 0.332 0.306 0.303 -0.003
林哲瑄 173 0.304 0.219 0.257 0.254 -0.003
郭阜林 144 0.292 0.328 0.281 0.278 -0.003
由于wOBA的参数种类多(BB/HBP/1B/2B/3B/HR)
因此也无法简单推断高估与低估的主要原因
然而,差距小到这种程度后,其实问题也不是多大
真的想要精确的话,直接打开野球革命查询wOBA不就好了
最后一个重点,则是OBP到底比SLG重要多少
过往我曾经听过“OBP有SLG的1.8倍重要”这个说法
现在既然连线性参数都有了,那直接拿两个参数相除就好了:
0.5898237600 / 0.2873139236 = 2.0528895802
这个比值代表,在中职2024年季赛中,OBP的重要性至少是SLG的两倍以上
也就是说你可以用 OBP x 2.053 + SLG 来大致排序打者的进攻能力
虽然得到的数值和线性逼近的结果不同,但是大小顺序还是相符的
最后的最后,部长真的好强,0.425的wOBA是什么鬼啦