图文影音版 http://www.sportsv.net/articles/6576
这篇主要是介绍美国大联盟先进媒体 (以下简称 MLBAM) 已经发表近一年的新技术:新的
场上追踪技术,以下简称 Statcast。
MLBAM 成立于 2000 年,是大联盟各队出资成立的机构,最主要的服务为大家熟知的
MLB.TV,还有兴起近十年的新技术,PITCHf/x。PITCHf/x 初期问世时造成棒球界相当大
的震撼,投手投出去的每一颗球都能被加以量化,包括初速、末速、出手点、相对位移、
球体转速、落球点和球种等数据,过去只有少数球队拥有的技术如今大剌剌地曝光在所有
球迷面前,不过它并非没有缺点,一来初期有球种分类的各种归类技术问题,二来它很难
上手,对于刚入门的球迷朋友是一大挑战,即便后来这些资料被整理到 GameDay 或某些
特定转播画面做呈现,以及某些私人网站帮忙整理了每场球赛产生的数据,但对于初学者
来说想窥其一二还是有很大的困难。
2014 年初,MLBAM 大手笔宣布他们将推出更新一层的技术,Statcast。新的场上追踪技
术能直接在转播画面上呈现各式各样可以量化的资料,投、打、守和跑等资料一应俱全,
搭配转播画面,就算是刚入门的球迷,也能看得很专业。
来看看 Statcast 实际运作的画面
各种名词解释:
Batted ball speed
球被打出去瞬间的速度。
Launch angle
球被打出去瞬间的角度。
Distance
飞行距离
Hang time
飞行时间
Release velocity
球被投出的初速
Effective velocity
我不知道要怎么翻比较传神,这边姑且叫它有效速度,和落球点、反应时间有关,内角高
球对打者来说需要提早出棒,有效速度比较快,反之外角低球的有效速度就比较慢。后期
Statcast 比较常用 perceived velocity 呈现,这个直翻就很好想像,叫做感知速度,
和放球点、内外角以及球距离打者眼睛的远近有绝对关系。
Spin rate
球的转速
Extension
投手投球的延展,延展越多 perceived velocity 就越快。
Top speed
跑垒过程中最快瞬间的速度。
Distance
实际跑垒距离。
Shortest
跑垒路程的最短路径。
Efficiency
=最短路径/实际跑垒距离。
Lead
跑者”质心”和垒包的距离。
Total distance
实际跑距
First step
启动时间
Acceleration
加速度
Max speed
最快瞬间速度
Route efficiency
=最短路径/实际跑距
系统运作原理
Alan Nathan 教授的比喻相当到位,过去都普勒雷达用于追踪球的轨迹和动态,而影像摄
影传输科技应用在追踪场上的每一个动作细节,两种科技合在一起就是相当够力的场上追
踪技术,Statcast 的运作构想就是这样。
它的原理很好理解,两组摄影机阵列,每组各有 3~6 个不等平均分散的摄影器材,安装
在球场的每个适当角落,就好像人的眼睛或是 3D 逆向扫描系统,你必须有两个 (组) 可
接收影像的眼睛 (镜头),方能判断视景深浅、建构 3D 影像。
建构出来 3D 影像后,再赋予每个球员、裁判、球一组独立的 ID 方便系统计算,搭配都
普勒系统追踪球的轨迹,就形成华丽的 Statcast 系统。Baseballprospectus 网站上的
这篇文章甚至有系统运作图示,碍于版权烦请自行点阅详读。
缺点、抓错
上述的那篇文章就抓出系统的三大缺点。
第一是球员的追踪永远是以质心 (canter of mass) 为基准来运算,白话文就是 “电脑
中” 球员身体的中心点,这造成几个显而易见的问题,就是跑者的离垒距离和被 tag
out 时距离垒包的远近,MLBAM 受访时承认运用 canter of mass 做运算是因为电脑运算
和判断的问题,但他们也表示可以搭配影像做判断修正。后期的 Statcast 影片的呈现方
式就是用高亮度的圆圈显示距离垒包最近的脚或是身体的某个和垒包最接近的部位,但修
正方式不详。
第二是影像重叠。当两个不同 ID 的球员在影像中 “不幸” 重叠时,会造成电脑误判,
可能 A 球员的数据资料会误植到 B 球员身上,MLBAM 声称他们开发了一套程式解决了这
个问题,正确率可达 80~90 个百分比,当操作者发现电脑最后还是误植到不对的球员身
上时,可以手动校正错误的部分。
第三是资料量实在是太庞大了,每场球会产生 7TB 的资料数据,管理上会是个棘手问题
。
我相信第二、三点是 Statcast 系统没办法在比赛中即时呈现的主要原因之一。
下面则是几个各大论坛最常被提出来讨论的问题:
加速度 (Acceleration)。非常令人困惑,我们不清楚它的加速度是某段时间内的平均加
速度或是某个瞬时加速度,到后期 MLBAM 还用了更妙的呈现方式:在 N 秒时达到最大速
度 X。Tango 提出的质问是,假设某球员 6 秒后达到 12.30m/s、7 秒后达到 12.25m/s
,然后 8 秒后达到 12.35m/s,事实上 6~8 秒时都可以算是该球员的最高速度区间,但
系统只会显示 8 秒后达到最高速度 12.35m/s,而不是 6 秒后达到 12.30m/s,而且球迷
们缺乏比较基准,怎样的加速度算优于平均?更严重的问题是,Statcast 系统似乎很乐
于呈现加速度数据给球迷看,但是很多时候特定的 case 球员们并不会全力冲刺,比方说
准备接杀一颗墙前的高飞球。我们很难理解 Statcast 系统呈现加速度数据的用意是?
另一个问题是 out by “x” seconds。Statcast 系统的逻辑是这样,假设今天 Todd 起
跑盗向二垒,捕手立刻精准地接传给进位的二垒手,二垒手早先一步把 Todd tag 出局,
这时 Statcast 系统就会显示 Todd out by 0.12 seconds,意思是 Todd 先被 tag 到而
0.12 秒后碰触到二垒垒包。看起来很合理很刺激,是吧?但是今天换成另一种 case,
Todd 准备盗垒,起跑时机很不幸晚了一些,捕手的接传依旧十分完美,在 Todd 距离二
垒垒包还有两步的距离,进位的二垒手就接到来自捕手的完美传球了,二垒手从容不迫地
将 Todd tag 出局,Todd 象征性地碰了一下二垒垒包就摸摸鼻子走回休息室去了,此时
Statcast 系统会显示 Todd out by 0.12 seconds、或是其它 0.12 秒左右的秒数,只
看数据看起来似乎又是一次接近刺激的 play,但事实是这样吗?
另外,Statcast 系统看起来把防守评估又做得更高级更准确了,但老话一句,棒球防守
一方面是个人能力的展现,另一方面则是团队合作,我认为,现阶段所有人似乎都把守备
评估聚焦在个人能力的估算,后者则完全被忽略,比赛前、比赛中相邻野手之间的沟通非
常、极度重要,那会影响到防守数据的展现,相邻野手间彼此个人能力的强弱会有不一样
的搭配方式,有些选手个人能力特强但沟通能力超烂,我认为这也是防守的一环;另一个
则是防守补位,即便是 MLB 的层级也常发生补位不到位造成失分的案例。人们对于防守
评估,即便是 Statcast 问世,仍有好大一段路要走。
展望未来
我很讨厌把巨量资料、大数据这些词挂在嘴边,全世界人口那么多、大脑那么多颗,每个
人都为了更好的生活品质在做努力,巨量资料、大数据真的没什么了不起的,真正要在意
的是,给你 100% 的资料,你能分辨哪些是垃圾讯息或噪声吗?就像 Statcast 系统,每
场球会产生 7TB 的资料数据,看起来很屌很酷,但是,真正有用的资讯有多少?有多少
讯息是 MLBAM “刻意制造”的刺激假象?
Statcast 系统肯定会持续精进的,就好像当初 PITCHf/x 刚出来时也是问题一大堆,但
后来修正得还算不错,MLBAM 最后会在收视率和专业度上取得平衡。
MLBAM 说经过 2014 年实验性地测试 Statcast 系统的能耐后,2015 年会在每个球场全
面启动这套系统,有些人说,传统球探开始要紧张了,Statcast 系统会取代传统球探成
为新一代的球员评估工具,是真的吗?我认为不会。球探们最后只是会以另一种型态的身
分存在在棒球界中。Statcast 系统一定会改变棒球生态,但肯定不会是最终章,球员们
跟一般上班族一样,知道考绩和分数怎么打,就能努力 (作弊??) 争取更高的层次,届时
球员们的绩效标准要如何评定,思考出发点和现在就会大大不同,人们会进而创造更高层
次的评估工具。