大家好,我也是潜水已久的乡民啦。
刚好对棒球有一些接触,打过一点球,做过几次国家队情蒐(大家可以到运动视界看看我
的分享,压制后来在大联盟两年WRC+都超过116的Jake Cronenworth就是爽啦)
看到我们的合伙人littleshin出来发文,当然是要相挺一下。很高兴大家对电子好球带和
数
个没有走错。
看takuro1026说的一点错都没有,台湾真的是不缺人才。我们的努力就是要突破这个大家
认为的限制,好不容易找到资金和团队组织起来。可以说台湾的鹰眼系统真的不是梦想了
,已经是一个持续在优化的现在进行式了。现在不只有棒球情蒐方面的专业,团队里也有
数据处理、机器学习、影像辨识、影像串流、美术设计、软件网站开发的专长了。刚好趁
这个机会和大家分享一下了。
不过首先,因为顾及球队对战资讯,我们无法公开数据的选手姓名。而场次也是乱数抽样
的出来,不是一整季的成绩。另外,电子好球带不可能是百分之百的精准,不过我可以说
有littleshin在维护,我们应该是有相当程度的准确。
那接下来就进入正题啦~
裁判:
裁判的议题一直是大家很热烈讨论的重点
原本其实我们都会有好像裁判都捡太小的感觉,但是若是如下图依照美国statscast系统
的好球带设定,样本里中职裁判的准确度是86%。
(准确度的定义 Zone内判好球+O-Zone判坏球的比例)
https://i.imgur.com/48PISnW.jpg
其实实务上,看美国设定好球带下缘是18英吋是有一点低,应该是为了刚好满足1.5-3.5
英尺的数字,那往往都在膝盖下缘。照台湾通常都是捡提高一颗球的高度的话,以20英吋
做下缘,准确率就会提高到89%。
不过不同的主审的确会有相当明显不一样的好球带。
这边跟大家分享两个不同的主审的几场比赛的好球带,把好球带下缘提高到20英吋,很明
显还是有各自主审的主观因素在。
https://i.imgur.com/mut2RCw.png
(绿色:Zone内判好球 白色:Zone内判坏球 黄色:O-Zone判好球)
偷好球:
再来我们来讲讲捕手的Framing。我们把边边角角的球分成不能区域看被接成好球的机率
有多少。为了跟美国的数据保持一致,我们维持好球带下缘18英吋的设定,也因此反而中
职捕手在好球带靠把手套往上接的部分也还是难以偷到好球,反而是外角接得好的会明显
有接捕优势。
https://i.imgur.com/D7a76bm.gif
这GIF是一颗进垒点21英吋高的球 被接成坏球
以这个前提来看,中职Framing 最好的捕手跟最差的捕手 在边角的球接成的好球率的差
距却其实非常大。大家应该可以猜的到,黄色球衣的捕手有一个接球很顺畅的边角球接成
好球的比例有到60.5%,而最差的捕手则是不到40%。其中有一队比较明显的平均Framing
的能力就较差一点了。
https://i.imgur.com/zJWK2OO.jpg
接下来讲一讲进阶数据
现在美国都比较多以击球类别来看,也就是分成
Barrel (完全击中球心,约为击球初速98+击球仰角26-31)
Solid (强击球)
Burner and Flare (强劲平飞和小飞球)
Top (击中上缘,几乎都是滚地)
Under (击中下缘,几乎都是飞球)
Weak (弱击球)
这边是一张在样本内,某队的击球型态
https://i.imgur.com/Eyx0VZ0.jpg
大联盟的Barrel比例大概是6-7%,在强劲的击球部分中华职棒是还有成长空间的。虽然这
也有可能是小样本的关系,不过看完后其实觉得可能这些数值可能都要针对台湾的环境再
做修正。
我们都知道 Barrel基本上就是全垒打,但之前一直不知的是其实Burner and Flare的打
击率是次高的,在大联盟的统计大概是0.659。因此我也好奇台湾同类型的击球打击率会
是多少。结果发现中职的Burner and Flare也是打击率第二高的,而且高达0.752。这可
能跟守备范围和布阵的拦截有一些关系。
击球强度的数据在长期统计下来,也可以当作是用球弹性系数改变的参考,可能可以追踪
选手的成长或老化,甚至透过筛选季节时间也可以做为探究球场因素的参数。
当然,最基本就是用这些数据来评估一个选手的型态。下面这张图就是中职一个有名的腿
哥五次先发的击出球。
https://i.imgur.com/j16DADZ.jpg
这边可以看到他这12个击出球里面没有一球击球初速达到 HardHit (击球初速超过98 英
里) 而SweetSpot% (击球仰角8-32度)的比例也远低于平均值。
中职的Hardhit%约在24%,而大联盟约在38.8%,中职的SweetSpot%平均值大约在40%左右
,而大联盟约在33%。
球场因素:
我们另外可以来看中华职棒的球场因素,不过因为只计算今年度,各球场的场次并不算多
,容易受到极端值影响。这边还是可以比较明显感受出桃园球场是比较偏向打者的球场。
https://i.imgur.com/4Qd00tA.png
场地因素不只可以看得分,也可以看全垒打或是二、三垒安打数等等。也许刚刚那个腿哥
就适合在二三垒安打系数较高的球场出赛。
这一个数据的用处在,有了长期下来稳定的场地因素系数,我们可以把不同球队的选手放
在一个公平的基准上,去看假设依照所有球场联盟的平均值,这些选手会打出什么样的成
绩。这本身可以做出一个较公平的成绩预测,也方便做选手估值的讨论。
Pitch Value:
我们觉得有一个数据- Pitch Value,也是非常重要。他基本上就是根据长期数据的平均
得失分,给每个情境、球数状况等等给上一个分数价值,例如0好0坏时投一个好球的价值
就是0.125分。因为我们累积的数据并不足,还没办法计算属于中华职棒的Pitch Value,
我们暂时先套用大联盟的Pitch Value数值。今年度本土左投表现都不太好,我就列出其
中一个左投手各球种每100球的价值 (Runs above average per 100 pitch)。(这里正负
颠倒,所以省下越多分的球种,价值会是较高的正数,反之被打得较惨的就会是较高的负
分)
wFA/C (直球): 0.3256
wSI/C(滑球): -0.694
wCU/C(曲球): 0.111
wCH/C(变速): -0.017
透过像是Pitch Value这一类的数据处理,我们不只可以得到投手球路的数据评价,也可
以去计算很多不同情境下换算成得分数的价值贡献。下面这边再举几个例子:
垒上有人的得分预期值
捕手的接球帮球队省下的分数
主审判决对比赛的影响
投手在关键时刻的表现
得到这些数值后,又可以进而去做战术的考量。例如依照不同垒上的得分预期值(或是得
分机率)去决定是否适合做触击或是盗垒的选择,或是依照裁判的判决喜好去搭配更能把
特定位置接捕成好球的捕手等等。
数据里有无限的可能,可以不断的做沙盘推演。一个好的投手,也许对球队有着上千万的
价值,但是我们也许可以开玩笑的说,如果真的用Run Value来计算,搞不好一套情蒐系
统一年能帮球队省下的分数可能还更多呢XDD。
我们的系统不只可以搭配自主开发的电子好球带和鹰眼系统,另外其实也和Trackman数据
是相容的,是可以直接倒进数据库跑出分析的。所以我们也能拿有前几年资料的球团手上
的进阶数据,直接重建过去的分析。
此外,我们的系统也不只是服务职业球队的。为了把逐球纪录和比赛成绩整合在同一个系
统纪录,我们已经费尽心思开发一套IPad记录系统。
这么大费周章的原因就是因为有太多特殊状况的时候,逐球纪录是没办法直接做成绩的归
属。比如说高飞牺牲打如果外野手接球失误,他还是算是一只牺飞,打者不记打数。或者
说打席间如果已经两好球了,换打者代打被三振,打席成绩归属是属于前一位被换掉的打
者。为此,我们的工程师可是没有停歇地加倍工期呢(只有我是最头晕的…..) 况且还有
守备成绩,跑垒成绩等之后搭配鹰眼时会使用到的。比如说,把跑者离垒距离和起跑速度
和盗垒的成绩对应起来,或是外野手的位置移动。
在过去的一年里,我们已经从现在大家在电视上看得到的基础大幅往前跨进一步了。而且
更好的消息是,未来这个纪录APP是打算直接开放给大众下载使用,所以不管是职棒比赛
还是学校的系队比赛,之后都可以透过自己纪录上传到云端做分析跑出属于自己棒球生涯
独一无二的数据分析。未来大家上PTT笔战的时候,吵起架来都可以是有凭有据。
https://i.imgur.com/xAdBQnq.jpg
我想我们能做的还有很多,包括把学生比赛数据电子化做长期追踪,又或者把国家队情蒐
组常设化、从小追踪国外重点选手,甚至是一般业余比赛包含假日组、学生组纪录电子化
,或者是和学校单位合作做棒球数据研究等等。我们一直坚信,我们做的事情是可以帮助
台湾棒球的,尤其现在就是这个转型的时间点。这种事等别人来做,不如就直接自己动手
做吧。
梦想总是很大,就看看接下来有什么样的机运发展啦,也欢迎有兴趣的人来和我们联络。
很高兴大家都对这个议题有兴趣,每次看到有关数据的讨论,心中都会燃起一把火。在没
有体育署、科技部等大型计画的补助下,我们还能走到这一步。我自己绝对是一个棒球傻
子,从我建筑师不当决定跑去挑战职棒开始,棒球…就是一条不归路啦…..也还好还有一
群一样是棒球傻子的人陪我一起才能走到现在。
如果大家真的很有兴趣的话,那我们会来开个粉丝专页,定期跟大家分享一些进阶的棒球
数据,希望明年球季时就能和大家见面了。
直到那之前,我们就下次见啦。