[心得] 卧底经济学家的10堂数据侦探课

楼主: joowei (瓜g)   2024-10-27 22:05:07
网志图文版:
https://reurl.cc/MjlNEL
卧底经济学家的10堂数据侦探课
资讯大混乱的时代,更需要辨别真伪的技能
作者:Tim Harford
推荐指数:☆☆☆☆☆
想像一个十年才出版一次的报纸跟现在每天出版的报纸,上面的头条跟数据反应的是“现
象”还是“事实”?
人类还是情绪组成的动物
周杰伦演唱会、猎人X麦当劳联名卡包,你各位上车了吗?这几天最红的事件莫过于这两
件事,但当你阅读到新闻内容时,你的第一反应是什么?失望、难过、愤慨,还是很兴奋
自己抢到了但一堆人没有呢?不管是哪一种,情绪都会是影响你看到事情的第一个东西,
也因此很容易让你失去用理性思考去判断事情的真伪。
这种事情发生在政治立场不一样的时候更容易被激起,试想当初台湾全民公投时,要不要
废核四这一题你投下的神圣一票是什么?但不管你本来的立场是什么,你是否强烈地受到
你偏好的政党所传送的讯息给影响了?反核的人看到支持自己论点的文章,连深入了解文
章来源跟数据都懒得做就会转贴了,反之看到支持核能的文章则直接视而不见,即使那篇
文章可能来自相对公正的第三方。因此这里第一点要讲的是,看到文章跟数据时,请放下
情绪跟偏见先去仔细看一下内容再去决定跟判断其真实跟准确性是非常重要的第一步。
数据的角度跟自身看法
好了,你放下情绪了,但你看到的数据跟你自身体验却相差十万八千里,这不禁让你怀疑
到底谁对谁错。我用台北捷运2023年的资料算了一下,数据显示全线平均每一班车的载客
量大约800人。这数字对你来讲合理吗?此时若我们用问卷去调查每个人对这数字的想法
,得到的结果可能是“也太少了吧?”、“我觉得我那一节车厢就有800人了”等可能和
数据结果不符的结果。但其实数据没有问题、旅客也没问题,其中的差异是来自于若进行
随机抽样,其旅客会有较多是在尖峰时刻搭乘捷运,他们的感受自然会跟800人有差距,
反之要抽样到离峰时搭乘的人机率会比较低。因此,若我们想知道自己去搭捷运时会不会
有很多人,光看800人这件事是不够的,还要参考周遭朋友的反馈去了解尖离峰的时间才
能有更全面的知识。
别急着解读数字
“10/24号公布的最新失业率为3.43%,终止了连三个月上升的纪录。”
请问这则讯息带给你什么样的事实呢?3.43%听起来不高?总算下滑了代表就业市场好转
?如果是,那你跟我就是一样的人了,但其实我们该做的是先去了解失业率的官方定义是
什么。以下为劳动部对失业者、失业率以及非劳动力的定义:
失业者是指在资料标准周内年满15岁同时具有下列条件者:(1)无工作;(2)随时可以工作
;(3)正在寻找工作或已找工作在等待结果。此外,尚包括等待恢复工作者及找到职业而
未开始工作亦无报酬者。
失业率是指失业者占劳动力之比率。其计算方法如下:
月失业率:资料标准周之失业者 资料标准周之劳动力 휠 100。
年失业率:全年平均失业者 全年平均劳动力 휠 100。
非劳动力是指在资料标准周内,年满15岁不属于劳动力之民间人口,包括因就学、料理家
务、高龄、身心障碍、想工作而未找工作及其他原因等而未工作亦未找工作者。
看完定义以后,我们再去想一下官方定义是否跟你认知的失业率是一样的,接着才去判断
3.43%是否是一个可以接受的数字。毕竟我也是看了定义才知道失业率代表的是“正在找
工作的人”除以“劳动力”,但劳动力不包含那些“有能力”工作但没在找工作的人。不
过合不合理就又是另外一则故事了。
数字的意义是什么呢?
让我们回到刚刚失业率的问题,要怎么去解读3.43%代表什么?若我们对这数字没有想法
的话,很难去想像它是高是低,但接着标题有写“结束连三个月的走升”,于是你心里有
一个想法,失业率可能稳定一点了。但我们再看更仔细一点,2023年平均失业率为3.48%
,今年一直到九月的平均失业率为3.39%,这时候你有更多概念了,原来今年的失业率平
均都比去年低,但九月的在今年还是相对算高,不过看起来台湾失业率都维持在3.4%上下
...等等。
我们获得了数字之后除了要了解其定义之外,我们也需要去了解这数字带给我们什么样的
资讯,不然光是知道3.43%这个数字我们无法有更多的想法,它是高是低、它在往上升还
是下降,没有比较跟背景的话,这样的数字其实没有太大的意义。
冰山一角
募资平台Kickstarter曾在2012年帮助智慧手表Pepple募得1,000万美元,更在2014年帮助
Coolest Cooler保冷箱募得1,300万美元。2015年Pepple卷土重来以更高阶的款式再度募
得了2,000万美元。但全部里头最有名的案例莫过于Zack "Danger" Brown在Kickstarter
提出的制作马铃薯沙拉专案,他的目标是筹得10美元,但最终共募得了55,492美元的可怕
纪录。
这个故事告诉我们什么?Kickstarter真厉害,大家都可以在网站上筹得必要的资金,就
算点子早就有人想过或是一看就知道在胡搞也可以。可惜的是这就是标准幸存者偏误的故
事,之后多的是有人效仿Zack提出怪点子但一毛钱都没筹到,而这些失败的人数远远大于
成功的人数,这都是我们看不到的。
我相信大家多少都读过也了解幸存者偏误的可怕,而书中提到的一点有关许多学术研究期
刊的偏误也令人省思。知名试验棉花糖故事、选择越多容易导致选择困难并降低偏好、姿
势决定你是谁等结果其实在后续很多人做类似实验时都无法成功复制。并不是说当初这些
学者的实验有问题,而是当我们在看期刊时很难看到那些没有发表的论文,因为“没办法
证明”有新现象的论文通常都不会被发表。这也是为何有越来越多Meta analysis的期刊
,借由分析多个类似实验的研究来推导假设是否合理的论文。当你很兴奋地找到一个现象
时,请务必想一下他是否只是昙花一现,很多事情其实只是冰山一角而已。
确保抽样的准确性
接下来我们来聊聊选举民调吧。我相信大家应该都满疑惑为何有时候电视做的民调可以和
结果差那么多,觉得统计果然就是一坨屎。但其实很可能的结果只是抽样的方式有问题而
已。想想看若有一家媒体的调查方式是“电话民调”且是家用电话,这样的结果所抽到的
样本是否会非常不准?那如果改用email/ 短信,总会比较准了吧?还是应该在信义区百
货战区按照年龄分配抽取相同比例的样本?答案是,以上方式都会有随机偏误的问题,家
用电话民调直接筛掉现在大部分没有家用电话的人口;email/ 短信相对排除了不太会使
用3C产品的老人家;信义区路上随机调查排除了大部分非台北市的人口。
没错,民调很难准,但我相信媒体们都有在努力想办法,或许综合上述办法再结合更多不
同的抽样就能更精准?你要记得的是,不管是怎样的抽样,在解读数据的同时也要了解其
来源是否有漏掉特定的人口,而这些人应该也要被列入计算的,不然结果绝对只会和你想
的不一样。
开放与好奇的心态
讲了这么多准则,你是否心里在想“谁记得了那么多?”,那请你务必记得这一段就好。
我现在的工作,有一个项目是需要去预测当年车市挂牌的总量,想当然,一年当中的预测
可能会要调整个几次。但预测要怎么做才会比较准呢?视接受到的资讯,“随时”并“开
放”的做调整。举例来说,上半年MG可观的交车量使得我们在第二季调整了数字,并对LU
XGEN的目标持保留的态度,但随着政府新的政策,我们也必须马上随之调整;同样的,若
本来年初很看好TESLA的交车量,因为平价版MODEL 3即将上市,但随着看到的交车数量好
像不如预期,就要跟着调整。不要觉得这很简单,人很容易被锚定跟不喜欢认错,保持开
放的心态是很重要的。
再来是好奇心,这个其实很多书籍都有讨论过,好奇心能使人成长、能获得成就感、能不
让你感到无聊。没有好奇心,我不会了解失业率的定义、也不会知道台北捷运的平均每班
载客人数。好奇心使人懂得用心、懂得探索、懂得放下偏见追求真相。就让我们保持开放
与好奇的心回到孩童时期对所有事情都感到有趣吧!
作者: timonting (满满)   2024-10-27 23:02:00
推这篇好跟时事结合的心得XD
作者: psion (psion)   2024-10-28 07:44:00
强烈推!!尤其是开放与好奇的心态 很不幸 极少人能持续拥抱诚恳认错这件事大概在台湾快绝迹了
作者: lionadon (inside out)   2024-10-28 14:50:00
推心得
作者: melancholy07 (雾雨)   2024-10-29 14:45:00
推心得XD

Links booklink

Contact Us: admin [ a t ] ucptt.com