原文
http://www.economist.com/blogs/gametheory/2015/03/baseball-statistics
翻译
http://mlkj24.pixnet.net/blog/post/30733030
是篇长文不太好翻,里面有许多统计术语,如果不通顺或是翻错请指教。
原文跟翻译里面都有许多连结,有兴趣可以点进去看。
原文作者是经济学人的运动编辑Dan Rosenheck,他在MIT Sloan商学院的
运动分析研讨会的主题。
Economist Mar 4th 2015
美国东北部仍在下雪,不过两个季节交换的仪式已在3月3日开始了。其一是为棒球季打开
序幕,在佛罗里达州、亚历桑那州两地,展开为期一个月之久的春训。但没有改变的是,
伴随着欢迎球棒清脆声响(译按:原文用的是crack of the bat,在棒球术语中,指的是
“球棒接触到球的那瞬间”,经济学人这句话有双关意)的,是一些棒球统计学家的推特
或部落格,先发制人地想打消某些天真球迷(对春训比赛)的有害观念。这个观念是,这些
春训比赛中,可能藏有一滴滴的有用资讯。
棒球统计的各领域里,很少比“春训数据无用论”,更能取得棒球计量学家的共鸣了,因
为选手在这个阶段基本上只是练练生锈的身手,恢复身材,而不是试着赢球。Baseball
Prospectus的Joe Sheehan曾在2008年写说“春训数据是没有意义的”。Fangraphs的
Dave Cameron在2010年,再度重申了这个观念。“每年三月最要记在心上的”,就是“春
训数字不代表任何事。”自那时起,这样的传统观念就没有被撼动过。的确,那些没办法
真正下场打球的球迷,他们找到一个最恶劣的例子,就是那些“处在人生最佳状态”,在
春训时把球猛力挥击到变形的大联盟选手,等到例行赛真正开始时又无可避免地原形毕露
。
毫无疑问,春训的对决跟真正的棒球比赛天差地远。半数春训比赛举办的地点在海拔高、
又干燥的亚历桑那,这种情况下球很容易飞出场;另一半的比赛则在靠海、潮湿的佛罗里
达,溼气重会让可能的全垒打,变成毫无杀伤力的外野飞球。而球员的状况也大有不同:
有些在休赛期间钓鱼、做日光浴,而有些人却去拉丁美洲的冬季联盟打拼,以球季中的状
况现身。投手通常会用春训来试验新球路;有些球员拿来练新的守备位置。而竞争强度也
差很多,从菜味十足的年轻新星,到已经养成的超级球星都有。而春训的时间,也没有长
到能让表现稳健输出:通常一位打者仅会有50-100个打席,投手也仅面对50-100位打者,
跟正常球季一位打者有600个打席、投手要面对800位打者比起来,只是很小的一部分。
但即使有这些变量,认为春训数字无用的说法,是错误的。不是只有一点错,也不是可争
论的错误 — 而是毫无疑问、决定性的错误。可以肯定的是,这些数据会很杂乱。但它们
仍传达了某种讯号。2月27日、28日于波士顿举行的MIT史隆商学院运动数据分析研讨会上
,我发表了一份研究,解释要如何从烦杂的数据库中,萃取出黄金;也上了几堂课,让这
个例子可在体育计量研究上,更能够被广泛地使用。
很容易看出,为何春训数据无用论,会有如此高的共识。在最常被引用的几个项目中,比
如说打击率或是防御率,春训数据跟当年度例行赛数据的相关性,是难以察觉地弱:三月
春训时在排行榜领先的选手,只有很小一部分还能在六个月后真正的排行榜上独领风骚。
但在这些项目上,本季例行赛跟次季例行赛成绩的相关性,也没高多少:当某年的打击王
在隔年度的打击率只有联盟平均时(比如说Chipper Jones在2008年的打击率高达.364,但
隔年仅有普通的.264),或是投手在某年ERA+领先(如2011年的Roy Halladay),却在隔年
连解决打者都很困难时,并没有什么人会感到惊讶。这就是棒球。(提供一个资讯给在意
定量化的读者,2013至14年间,符合资格的选手,在统计学上连续两年度的表现相关性来
说,防御率是.25、打击率则是.4。统计学家间一个古老的笑话是这样说的,“这个世界
的相关性是.3”:意指这样微弱的相关性并没有什么意义。)
对于这些数据的预测能力之低,有很好的解释。打击率会因为打者把球击到防守者正前面
,或防守者的空档间,而天差地远 — 凯文科斯纳在电影“百万金臂”中的角色,就是说
明这个现象的好例子。而防御率主要是看一名投手,是否会被连续击出八支安打,或是在
整场比赛中,以安全的间隔解决打者。但棒球总是提供了许多另外的数据,来反映球员的
真正的技巧,比如说他们被三振、四坏的频率,或是他们击中(被击中)的球,是在天空飞
还是在地上滚。这些“外围”数据(peripheral statistics),会比较快就稳定下来:以
2013-14年打者三振数的年间相关性来看,高达.9。也很可以确定,春训跟当季例行赛的
这些数据有高度相关性。