April 06, 2010
How Do Experts Make Their Predictions?
By Sky Andrecheck
http://baseballanalysts.com/archives/2010/04/how_the_experts.php
昨天,我们在Baseball Analysts 网站上公布了我们的“专家”预测*。既然打赢棒
球赛牵涉到这么多的运气成分,在开幕战当天做预测基本上也就是傻瓜闹著玩。但大家还
是喜欢做。今年我很荣幸能第一次在这里和运动画刊网站(SI.com)发表我的拣选结果。
*http://baseballanalysts.com/archives/2010/04/get_your_2010_r.php
但我得承认,在被要求发表我的季前预测结果时,我其实有些天人交战。这些拣选的
目的究竟是什么?我只要选出那些我自认为最有机会赢得分区、联盟、世界冠军等等的球
队吗?或者,我要选的是那些我以为被其他人低估,但却不一定是我赌上性命打包票的球
队?一般的体育记者会怎么做?他们做预测是为了宣示立场、自炫聪明,还是真的跟定了
那些他们确信是最强的球队?
放在更符合经济学的脉络下看,大多数体育记者使用的报酬函数(payoff function)
是什么?可能方法之一很简单,目的纯粹就是要尽可能做最多正确选择。如果是为了这个
,最好的方法就是只选那些获胜可能性最大的球队。这个方法的问题在于没有太多发挥创
意的空间。你认为马林鱼是支被低估的球队,很有机会拿下分区吗?或许你会在国联东区
作让分:费城 33%、亚特兰大 32%、佛罗里达 30%。这应该比大多数人所预期的更有利于
马林鱼队,同时不利于费城人队。但在这种方法之下,你还是只能和所有其他人一样,随
大众看法预测费城费城人队拿下东区。
这个方法的另一缺点在于,当你看一群“专家”的预测结果时,你在这些专家之间没
什么选择余地。在运动画刊网站上,所有13个专家,包括在下本人,都认定费城人会赢得
东区。你在这些专家之中没什么选择余地,而作为球迷,这样的预测也无法说明费城人赢
得分区的机率究竟有多大。假设记者们是用这种方法做预测的,那就只意味着他们每个人
都认为费城人最有机会赢得东区。至于机率到底是30%、50%、80%还是99%,只有天知道。
然而,有证据显示,并不是每个专家都是这样做预测的。Jim Caple在 ESPN预测巨人
队会在世界大赛打败双城队。运动画刊的Tom Verducci预测双城队赢得美联冠军。运动画
刊的Albert Chen 则认为光芒队会拿下世界冠军。这些都有可能发生吗?当然,这里的每
一支球队都有夺冠的潜力。但我无法想像这些经验老到的棒球记者,会有任何一个真的对
这些选择赌上性命打包票。这些专家更有可能是想点出被低估的队伍。要是巨人队好死不
死真的打败双城队赢得世界大赛,Jim Caple 看来会像个天才;要是洋基队如我所料的打
败了费城人,那我只不过是在传达大众看法。这么说来,让人跌破眼镜的选择也有其动机
。
反映这种思维的报酬函数让专家们获得赞扬的程度,正与作出同一种选择的其他人数
量成反比例。因此,要是有60% 的人选择费城人队赢得东区,你也选了费城人,而他们真
的胜出,那你就会得到1.67分的“信用”点数(1/0.6 = 1.67);要是只有5%的人选马林
鱼队,你作出的正确选择则会换来20分的信用点数(1/0.05)。这就让相信马林鱼队被低
估的人有了动机去选他们,即使未必认为他们真是最有机会胜出的队伍。
事实上,要是每一个专家都运用这种型态的报酬函数,结果会形成一个高效率的市场
,记者们在其中每一个拣选的机率,正好符应于每一支球队胜出的实际可能性。这种状况
发生是因为达成了均势,而在其中,依据市场法则,选择任何球队的期望报酬都会相等。
推而广之,你就必须不选那些你以为最有机会胜出的球队,而是选那些你以为被其他人低
估的球队。要是专家们能在看到别人的选择之后改变自己的选择,这个方法就真的会很有
效,因为它会形成一种均势,没有任何专家能藉著改变选择而得利。以下的虚拟模型是由
十位记者分派给美联东区各队赢得分区的机率:
A B C D E F G H I J 平均机率
NYY 60% 80% 50% 70% 60% 90% 50% 40% 75% 60% 64%
BOS 30% 10% 30% 15% 20% 6% 40% 50% 10% 15% 23%
TBR 10% 5% 15% 10% 20% 2% 3% 7% 15% 15% 10%
TOR 0% 3% 3% 1% 0% 2% 5% 2% 0& 5% 2%
BAL 0% 2% 2% 4% 0% 0% 2% 1% 0% 5% 2%
选择 NYY NYY BOS NYY TBR NYY BOS BOS NYY NYY
尽管记者G认为洋基队比红袜队更有机会,但他对红袜队的评价比其他人更高,因此有了
选红袜而不选洋基的动机。C记者也是一样,E记者对光芒队也是如此。结果是没有一个
记者有改变选择的动机,从而形成了六个记者选洋基、三个记者选红袜、一个记者选光芒
的均势,大致对应于各队赢得美联东区的共识可能性(如果做预测的不只十人,结果必定
更精确)。这个结果比每个作家只选自认为最有可能胜出的队伍更耐人寻味;按照那种选
法,这十个人只有一个不会选洋基──和分区实际上的共识让分情况相去甚远。
假如预测真是这样作成的,它实际上就能带给球迷一些绝妙的资讯;获得专家集体推
估的成功可能性不仅很有趣,而且很有帮助。不幸的是,记者们看来也不是用这种方法拣
选球队的。ESPN或运动画刊的49位记者,没有一个押印地安人或运动家赢得分区。这两队
当然不是热门队伍,但他们胜出的机率也绝对高于四十九分之一。如果专家是用上述方法
作预测,至少有些人会押这几支黑马球队。同样的,运动画刊每一个记者都预估费城人队
胜出;但费城人队赢得分区的机率却远非百分百。假如报酬是以上述的方式分布,有不少
记者(包括本人)都会改押勇士队、甚至马林鱼或大都会。因此,专家们很显然也不是想
著这种报酬作预测的。
那么,如果专家们用的报酬函数既不是这种也不是那种,他们到底是怎么选球队的?
好问题。对大多数人而言,可能是两者折衷。我会说,大多数人可能都会押最有可能赢的
球队,但在实力接近时,他们可能会选个黑马,不照大众看法出牌。至少这是我的预感。
一般体育记者脑袋里到底在想些什么,实在很难说。就我个人而言,我唯一冒险的一区是
押老虎队赢得美联中区。要是我必须选对才能活命,我可能会选别队,但看到这种趋近于
四队大冒险的局面,我还是选了底特律,因为他们是别人不见得会押的好球队。总而言之
,人们做决定的各种不同方式,当然,还有伴随着任何一个大联盟球季的不确定性,都让
季前预估几乎毫无用处。但我还是很想看看记者们在参与一个如上所述,报酬与作同样选
择的专家人数成反比的系统时会怎么回应。那样一来,至少我们能从他们身上蒐集到一些
有趣的资讯。