[心得] 《噪声》决策判断的隐形缺陷和解决方法

楼主: wackynoteis (Wacky)   2021-11-08 16:22:13
《噪声》读后心得:决策判断的隐形缺陷和解决方法
诺贝尔奖得主《快思慢想》作者丹尼尔康纳曼,酝酿十年的精采之作
图文好读 https://readingoutpost.com/noise/
人类做出判断时的“缺陷”会造成很多不公平的对待。像是不同法官对同一个案件有截然
不同的判决,不同医师对同一个病人的诊断有很大的差异,不同面试官对同一个求职者的
意见也可能南辕北辙。这些做出判断的缺陷是怎么来的?我们可以避免这些缺陷吗?
这本书在说什么?
《噪声》的共同作者是三位知名学者,分别是诺贝尔经济学奖得主和畅销书《快思慢想》
的作者丹尼尔.康纳曼(Daniel Kahneman)、巴黎商学院的商业政策教授奥利维.席波
尼(Olivier Sibony)、律师暨畅销书《推出你的影响力》的作者凯斯.桑思汀(Cass
R. Sunstein)。在这本书里面他们探讨一个鲜为人知的现象:“人类只要做出判断,就
会有噪声。这些噪声比我们以为的还多”。
举凡任何人类做出的决策和判断,跟正确的答案之间都一定有“误差”,也就是所谓判断
的缺陷。误差则是由偏误和噪声两者的总合。“偏误”比较广为人知,例如损失趋避、锚
定效应和从众效应…等;“噪声”则不容易被人察觉,像是不同的专家对同一件事情意见
分歧的程度,远超过人们常理的预测程度。但是,噪声却无处不在,影响也不比偏误小,
只有使用统计学来观察的时候能让它现形。
这本书就是一本探讨“噪声”的专书。作者们分析造成噪声背后的原因,以及噪声的组成
成份。我们认识噪声之后,可以采取一些降低噪声的方法,作者们称这套方法叫“决策保
健”,用来进一步提升我们做决策判断时的“准确度”。这些方法将可以带来更公平的判
决、更精准的预算评估、更有效的人才招募,降低噪声,就能够提高我们做决策的品质。
偏误与噪声
书中举了一个很简单的例子来说明误差、偏误、和噪声这三件事情的关系。你可以想像,
一群人要做出判断的时候,就像是在“打靶”,他们总是希望打中靶心。而他们真正击中
的弹痕跟靶心之间的距离,就是“误差”。这个误差,代表了他们的做出判断时的缺陷。
如果把这群人分成四个队伍,每个队伍有五个人,同队的人共用一支步枪,每人射出一发
,最后得到下图的四种结果。
噪声和偏误:https://imgur.com/D1W4KFH
图片来源:远见杂志文章〈康纳曼团队破解决策盲点,“噪声”才是防疫最大破口?〉
A队伍,准确。射击非常准确,全部打在靶心上。这时候,这个队伍几乎“没有误差”。
B队伍,有偏误。五发全部没有射中靶心,但是五个人的落点都集中在靶纸的左下角。这
时候,表示整个队伍都有“偏误”,一起偏向了左下方。
C队伍,有噪声。五发的落点都很分散,但是落点平均地分散在靶心的周围。这时候,表
示这个队伍充满了“噪声”,彼此的方向非常分歧。
D队伍,有偏误又有噪声。五发落点全部偏在左下角,而且非常散乱,这个时候队伍里面
既有“偏误”,又有“噪声”。
在这本《噪声》书中重于“噪声”的讨论,也就是队伍C和D的情形。虽然噪声和偏误彼
此是独立的因素,但是若我们能降低噪声,就能提升准确度。如果你对于如何降低“偏误
”有兴趣,可以参考作者之一的丹尼尔.康纳曼在前一本心理学大作《快思慢想》曾探讨
过人类“思考偏误”的相关问题。
决策判断的缺陷
总体误差
这本书以统计学的方式,来描述人类的决策和判断。举凡我们做出的判断有两种。第一种
是“预测性判断”,例如一个药品的药效、一个选举的结果,是有标准答案可循的判断。
第二种是“评估性判断”,例如歌唱比赛的名次、对罪犯判刑的程度,是没有标准答案可
循的判断。
但是,无论是哪一种判断,我们都会希望不同的人所做出的判断,其分歧的范围在一定的
程度之内。如果人们做出的判断,跟实际的答案或者期望中的答案有差距的时候,这个差
距就被称为总体误差(total error)。而造成“总体误差”的因素就是“偏误”和“杂
讯”。
人类决策判断的缺陷 https://imgur.com/ozlnKsm
图片来源:阅读前哨站
作者们以统计学的均方差(MSE: mean square error)概念来解释误差、偏误和噪声三者
之间的关系。他们特别画直角三角形来示意,是为了解释一个非常重要的观念:“误差之
间不会彼此抵消”。就像是一个保险业承保项目的估价,估价太高,客户会跑掉;估价太
低,公司会亏钱。因此误差不论是正、是负,取平方之后就造成了更大的误差。这些误差
就是我们最不乐见的。
偏误:明显的缺陷
“偏误”(bias)指的是人们“偏向同一个方向的平均误差”,也是心理学上面最广为人
知的研究领域。例如“规划谬误”偏误,就是指人们总是低估完成一件事情所需要的时间
,像是经理人总是低估专案完成的时间。“从众效应”偏误,就是指人们倾向相信很多人
相信的事,像是董事会讨论一个并购案的时候,董事们会被比较多数人相信的事影响了最
后的决定。从事后诸葛的角度,偏误很明显可以用因果的方式来解释。
噪声:隐形的缺陷
“噪声”(noise)指的是人们“彼此判断的方向不同、意见分歧的程度”,但只有从统
计学的角度才看得到噪声。像是一般的专业人士,例如经验资深的保险核保人员,往往对
自己的判断很有信心,也不会去质疑同事的判断跟自己有很大的差异。但是一旦把统计的
资料摊在桌上,才会发现这些判断的差异不但很大,甚至常常有不同的专业人士对同一件
事情有完全相反的判断。
|在因果关系里,噪声不见踪迹;在统计世界里,噪声无所不在。
水准噪声
噪声的第一个组成是“水准噪声”(level),指的是“不同个体平均判断的差异”,像
是有些法官比较严厉,判刑平均都会判比较重;有些法官比较宽容,判刑平均就比较轻。
或者有些股票分析师就是倾向看坏市场,有些分析师则倾向看好市场。
稳定型态噪声
噪声的第二个组成是“稳定型态噪声”(pattern),指的是“判断者个人的独特性”,
像是某一位法官对窃案的判刑都很严厉,但是他对交通违规的判刑就很宽容。这种稳定型
态不会随时间改变,代表了同一个判断者他本身的独特性,在面对不同类型的案例时,他
所表现出来的差异。
场合噪声
噪声的第三个组成是“场合噪声”(occasion),指的是“跟案例不相干的暂时成分”,
就像是一位医师在不同日子(天气、心情)对于同一个诊疗案件的诊断不同。或者是某一
位法官他支持的球队昨天获胜了,所以今天的判刑变得比较宽容。这种噪声会随着时间和
场合改变。
|人们认为自己在做判断时,展现出思考的复杂性,并增添细微的考量。但这种复杂性和
|微妙性只会弄巧成拙,不会提高简单模型的准确性。
降低噪声的方法
作者们说:“以总体误差而言,噪声和偏误是互相独立的。不管偏误有多少,减少噪声的
好处都是一样的。”所以在书中,他们提出了一套叫做“决策保健”的六个步骤,让我们
可以降低噪声。这个方法就像洗手一样,你虽然不容易察觉你避免了什么细菌(噪声),
但是等到你被细菌感染之后(造成误差)才求医治疗就已经太迟。降低噪声的方法就跟卫
生保健一样,预防胜于治疗。
判断的目标是准确,而非个人特质的表现。为了避免稳定型态噪声,让不同的专业人士对
同一件事情有相近的判断,我们可以把要判断的程度先定义清楚,而不是给一张空白画布
让人随意发挥。最激进的做法是利用电脑算法,以规则来代替判断,但这个做法的接受
度普遍还不高。
要有统计思维,用外部观点来看待案件。把我们要判断的事情,当成是一群类似案件里面
的其中一个案件,而非每次都把案件当作全新的事件。当我们引入外部的数值,例如评估
一个执行长的留任期间长短,就要先看业界平均期间是多少,再对目前的判断做出调整。
将判断结构化,拆解成几个部分。因为当不同的人看到不同的条件,都会在心里编织起自
己的故事。就像是不同的面试官可能会给同一个面试者截然不同的评价。这个方式可以打
破人们过度追求连贯性的心理机制,在过程中针对各个独立的特质进行评分,而不是等到
一连串的评估结束后才一口气评分做判断。
抗拒太早出现的直觉。如果我们在第一时间就用直觉来判断事情,那么后续我们找的资料
跟佐证,很可能都只是为了证明我们自己的观点,落入了对自己过度自信的幻觉。好的做
法是延续上一步,把各自独立的评估都进行完成之后,然后才使用直觉进行最终判断。
从多位判断者取得独立判断,然后考虑将这些判断总合起来。作者们透过许多实验说明,
将独立的判断加以平均,可以保证系统噪声减少。因为不同的判断者各自的技能和观点会
互补,增加资料的样本数可以提高准确性,例如 Google 在招募人才就会参考四位面试者
的判断。
偏向相对判断与相对尺度。人类在绝对值上面的判断,都有各自截然不同的解读。例如我
们要替一个团队打绩效,不同的主管给每个员工的绝对分数,差异一定很大。但如果改成
用排序的方式,不同的主管给出的排序反而都非常相近。采取案例量表来做判断,会比给
绝对分数来得好。
综观这些方法,我发现跟职场当中一个非常实用的工具“基准比较”(benchmark)有很
强烈的呼应。具体的用法我会在这本书的 Podcast 说书节目的尾声跟大家详细分享。
后记:降低影响公平的噪声
《噪声》是一本带给我很多新颖观念的书,最有趣的就是凸显了我们常常难以察觉、看似
隐形的噪声。这本书除了用统计学去说明这个理论之外,也提供了很多法学界、医界、教
育界、法医鉴识、职场招募方面的案例,并且提供了一套我们可以应用的方法,来让我们
降低噪声,提高做决策的品质。
值得一提的是,这本书打破了我认为只要看“平均值”就好的旧观念,当噪声会对判断的
结果造成极端的影响,就代表了某个人被“不公平对待”了。而这种不公平对待,该检讨
的不是个人,而是个人所身处的“系统”。
如同作者们对于偏误和噪声的解读,两者之间的差异在于:“偏误是一个人对件事常有的
各种偏见,犯错是在个人;而噪声却是错在系统,系统没有调控机制,导致一群专家,会
针对同一件事,做出截然不同的判断。”我们只有正视噪声的存在,致力于改善系统,才
能朝向一个决策更正确、更公平、更健康的社会。
作者: Doralice   2021-11-09 10:13:00
去年的“打开算法黑箱”对于人类缺陷与如何用演应用算法协作的优缺点描述更为全面,采用的例证也比本书更广泛有趣。 goodreads的低分相当合理

Links booklink

Contact Us: admin [ a t ] ucptt.com