我觉得要充分了解各方面的议题,对统计常识需要有一定的了解。
所谓的公民议题大部分都和统计息息相关,
例如核能、经济、社会问题、薪资、物价、教育、选举、政治等等,
随口就可以说出一大堆。
然而统计这玩意很恐怖的,不仔细思考的话,容易掉入各种不同的陷阱和谬误中,
就算是高知识分子也很容易被骗被误导。
(或者最恐怖的是,被骗的人丝毫没有意识到自己被骗了)
所以我认为假如有空的话,加强一些这方面的基本功是好事。
我是打算尽量不提什么太高深艰难的名词和原理,(太专业的东西我也不见得懂)
只举一些较生活化的例子,谈谈较容易理解的那些谬误。
(注1)
这篇的主题就谈谈这个吧!
“相关不等于因果关系” (correlation does not imply causation) (注2)
简单来说,即使两件事情有很大的相关,也不一定代表他们之间有因果关系。
举个例子好了:
某某研究发现,冰淇淋销量高的时候,森林大火发生的次数也比较多。
那么,冰淇淋销量和森林大火频率是正相关吗?是的。
但是如果说他们有因果关系,听起来就很荒谬。
那么,这个现象的解释是什么?
一个合理的解释是,气温高的时候冰淇淋销量高,气温高的时候森林大火的次数较多。
也就是说,A和B之间有相关,但没有因果关系,而是有另一个C导致A,C也导致B。
所以如果有人因为这个理由,提出“拒买冰淇淋,救救大森林”之类的主张,
就是犯了这个谬误。
事实上,如果告诉你A和B两件事情有相关,那么大概可能是以下几种情况:
(1)A导致B
(2)B导致A
(3)AB无因果关系,而是其他原因所导致的结果
(4)巧合
好了,以下提供一些简单的随堂练习,希望大家可以想一想然后讨论一下对于这些
现象的看法、解读是什么?不要只说“这就错的嘛”“荒谬”,尽量找出到底有问题
的地方在哪里。 (应该都是蛮有名的例子,看过的人就抱歉囉)
(1) 某某研究指出,美国加州的肺结核患者比例比其他州份为高。
(2) 某某研究发现,脚掌较大的小孩比较聪明。
(3) 某某研究惊爆!长期吸烟人士患帕金森氏症的比例较非吸烟人士为低!
(4) 住居屋顶上有比较多鸟类栖息的家庭通常有比较多的小孩。
(5) 没脱鞋就睡觉的人起床时比较容易头痛。
(6) 自从1950年代开始,大气中的二氧化碳含量和全球的肥胖人数就迅速上升。
(7) 晚上开灯睡觉的小孩比较容易近视。
(8) 这一百多年来,海盗的数量逐渐减少,而全球气温逐渐上升。
注1: 事实上我也碰过专门走这行的跟我在很简单的问题上跳针还叫我机率要重修....
最后对方才自己发现搞笑了Orz
注2: 好像通常翻译成“相关不蕴涵因果”,这说法应该更精确一点