前言:
大联盟三十支球队有各式各样的主场,这些主场又因各种理由被球迷区分成打者球场、中性球场、投手球场
为了提供客观依据,数据网站也提供Park Factor作为球迷的参考,然而Park Factor在计算过程上的过于简化为人所诟病
我们认为一个球场是否对打者友善由球场尺寸与击球飞行环境两大因素构成——球场尺寸很直觉,大的球场一定比较难击出全垒打,而各队主场的规格在网络上也相当容易取得
但是击球飞行环境就很模糊了,或许我们听说过Coors Field空气稀薄、Chase Field处于干燥的沙漠(已于17-18年休赛期间安装加湿系统)、Petco Park有从外野吹向内野的海风,却从未将其量化
本文想借由batted ball的建模讨论各球场于击球飞行环境上的差异,以观察各球场在尺寸之外对打者的友善程度
无广告部落格好读版:https://goo.gl/tteHry
正文:
整篇文章以一个核心思想贯穿:以相同初速(EV)、相同仰角(LA)击出的两个batted ball,必定会有相同的理想飞行距离(Hit_Distance),这是我们在高中物理的斜抛单元学到的事情。但现实不如理想那么简单,两个batted ball即使有相同的(EV,LA),也会基于空气阻力、风向、风速等因素落于截然不同的点上。这时候我们反向思考:如果我们持有一定的样本数,我们就可以从同样(EV,LA)的batted ball在不同的球场的飞行距离,得知各球场是否有助于球的飞行
举个例子的话就是假设(EV,LA)=(100,25)的飞球在Coors Field平均可以飞行400ft,却只能在Petco Park飞350ft,不就等同用数字证明了Coors Field比Petco Park更助于球的飞行吗?不过也不是球飞得远的球场就一定偏向打者——回到第一段所说的,一个球场好不好打不外乎尺寸和飞行环境;球比较会飞的小型球场当然是打者球场、比较不会飞的大型球场当然是投手球场,剩下的两种情况(球会飞的大型球场/球不会飞的小型球场)就只能看矛盾大对决的结果了
回到飞行距离,由于牵扯到固定(EV,LA)时总免不了建模,但我们想要在建模前大概暸解一下各球场的飞行距离,所以先取出各球场飞行距离的平均值。问题是batted ball包含的种类实在太多,全部加在一起实在不能提供什么资讯,所以我们只留下barrel这种已经经过EV和LA筛选的击球类型,看看barrel在各球场的平均飞行距离——下图是2018年的barrel在各球场的平均飞行距离(由短到长排序)
https://imgur.com/b6kdYxp
上表列出的distance_hat即是平均飞行距离,其实有另外一种提供更多资讯的呈现方式——画成95%信赖区间的图
https://imgur.com/ub4W2N0
由表和图我们可以发现多数的球场在飞行距离方面都相差不远,中间二十支球队的差距甚至在10ft以内,甚至某支球队的barrel比别人凶一点可能就前进好几名了
值得一提的是barrel飞行距离最短的Fenway Park,其实是因为Green Monster这堵高墙的存在挡下了很多球,大大减少了飞球的距离,出现在这个榜上根本算是作弊
第二名的AT&T Park有著名的海风助攻,出现在后段班也是预料中的结果
Barrel飞行距离最远的几个球场也是出了名的偏打者,像是干燥的Globe Life Park in Arlington和高海拔的Coors Field,尤其Coors Field的飞行距离真是juice到不行…
这边要注意的是上面选用barrel来做初步的资料观察,理由是barrel经过了一定程度的筛选,batted ball之间的差距不会太大,但是差异还是存在的——搞不好巨人队的打者打的barrel就是刚好过门槛、落矶队打者打的barrel都是barrel之王,作为简单的观察还可以,直接拿来断定各球场的差距就太武断了,所以为了看出各球场真正的差异,我们还是要建模
在建模前我们必须了解资料特性:
(1)只有飞球和平飞球会受到风、气候影响而飞得更远,所以我们只能剔除滚地球和pop up,留下这两种batted ball(这篇文章后面所有batted ball指的都是经过筛选的飞球和平飞球)
(2)LA并不是可以丢进线性模型里的变量,我们都知道65度和5度的仰角都没有25度飞得远,如果我们直接把EV、LA、球场丢进线性模型里,得到的模型肯定是垃圾进垃圾出
这时候我们会使用到广义相加模型(Generalized additive model,GAM),它能够帮我们正确地解释掉LA对飞行距离的影响,白话文就是无视LA的复杂趋势,直接固定住LA,把解释力留给球场和EV(已知线性)
这种做法在统计理论上有一个问题,就是虽然我们成功固定住LA,但是LA会变得很难解释——不过我们现在的case刚好没有打算要解释LA,所以GAM的副作用没有对我们造成任何伤害
而在建立广义相加模型了解30座球场和飞球距离的关系前,我们必须先找出一座“基准球场”作为所有球场的比较对象
这里我们选择光芒的Tropicana Field当作基准球场,因为这是一座室内球场,而且不像其他巨蛋球场开开关关,是终日关闭的,受到气候的影响理当最小
https://imgur.com/wRAxfxS
上表就是其他29座球场之于Tropicana Field的飞行距离表——Estimate代表相同的LA下,各球场和Tropicana Field的平均飞行距离差距、Significant代表显著程度,一样是星星越多代表越明显
举例来说同样(EV,LA)的两个球,打在巨人队的主场平均会比打在Tropicana Field少飞5.68ft,差距十分显著(三颗星)
此外可以注意到倒数第二个项目launch_speed,代表固定LA下、增加1mph的EV平均可以增加4.46ft的飞行距离,用EV来分析飞行距离,想当然是显著
从上表我们可以看出很多资讯,以下提供几个观察:
(1)SD主场Petco Park在落成之前,当时的老板曾经亲口告诉媒体自己正在盖一座超级投手球场
这个球场过去也确实被认为幅员广阔,又有海风干扰球的飞行,是全联盟最极端的投手球场
目前看起来Petco也不是最难飞行的球场,加上数次移墙之后Petco早就不如当年那么严苛,或许现在的Petco依然是投手球场,但早就不是过去那个打者坟场了
(2)从SF和OAK可以发现Bay Area真不是盖的,尤其AT&T Park有421英呎的中右外野,伟哉Barry Bonds
(3)和前面的barrel版本相同,BOS的Green Monster挡球吃掉一些飞行距离
(4)虽然数字上比Tropicana有助于飞行(Estimate>0)的球场共有7座,但真正显著的只有两座(TEX和COL)
这代表的是剩下五座球场和Tropicana的差距尚在可能是误差的范围内,不足以拿来宣称他们比Tropicana更利于飞行
(5)共有15座球场显著比无风的Tropicana不利于飞行、12座无显著特性、2座显著更利于飞行
这可能代表风带给球的坏处大过好处
(6)TEX的阿灵顿球场气候干燥有利于球的飞行,18年同样条件的飞球相较无风的Tropicana会多飞2.95ft
今年加湿的Chase Field(响尾蛇主场)是0.97ft,在16年和Tropicana的差距是3ft、17年是2.02ft——有加湿真的有差
(7)COL真的超猛,18年同样条件的球从和Tropicana到山上平均多飞11.16ft,在2016年同样的球比起Tropicana甚至多飞15.06ft,差距有多大问问2016年转队的Jake McGee最清楚
同时Coors Field也是唯一影响比增加1mph EV剧烈的球场——同样(EV,LA)的球在Coors和Tropicana飞行,Coors所增加的飞行距离相当于增加2.5mph的EV带来的飞行距离
也就是在Coors打出的97.5mph飞球飞行距离会相当于同样角度、且在Tropicana击出的100mph飞球
(8)上一点听起来不够恐怖吗?
那再加码2016年时,同样(EV,LA)的球Coors Field平均比AT&T Park多飞22ft,这简直是接杀跟全垒打的差别了
(补充)同样LA=20度、EV=110mph的球,2016年在Tropicana的平均飞行距离是387.03ft、2017年是390.77ft、2018年是384.53ft
Tropicana没有风,不要牵拖气候变迁 #没有换球,哦齁!
如果觉得我们的文章还算有趣,欢迎追踪我们的脸书专页:https://goo.gl/Eh2vuD