Re: [讨论] 常见统计谬误

楼主: Django (Cython)   2014-07-10 23:10:51
首先必须说,这些东西很难说有标准答案,可能好几个说法都说的通。
重要的是思考的过程。
: (1) 某某研究指出,美国加州的肺结核患者比例比其他州份为高。
这第一个例子可能就让人觉得没头没尾,莫名其妙。
加州的肺结核患者比例比其他州份为高,所以咧....?要表达什么?
可是,有些新闻就是类似这种写法。
写这句话,真的完全没有要传达或是偷渡什么讯息?那你写了干嘛?
是不是有些人看完之后就会自己脑补说“喔所以住在加州比较容易得肺结核”
(然后就算你去抗议说新闻造谣他们也可以名正言顺的推掉,因为他们真的没有写啊)
要不被偷渡思想,还是得靠自己。
回到原题,那我们修改一下命题吧
美国加州的肺结核患者比例比其他州份为高,所以住在加州比较容易得肺结核
这句话对不对?
首先,必须先判断加州的肺结核患者比例和其他州是不是有显著差异。
因为本来肺结核就一定有些州比较多有些州比较低,可能只是随机分布然后加州刚好
比较高。
(类似的笑话:某校长表示本校有50%学生成绩低于平均,令人忧心...)
再来,假设加州的肺结核患者的确显著的比较多,那也不一定代表题目的因果关系成立。
假如要让这个说法有说服力一点,那应该要试着找出一些已知会造成肺结核的原因,
然后看加州有没有这个因子。在还没找到以前,这最多就只是一个猜想。
最后,这其实是倒果为因的例子,因为加州空气比较干净,所以肺结核患者才会移居
加州....
: (2) 某某研究发现,脚掌较大的小孩比较聪明。
其实就是年纪比较大的小孩脚掌比较大,然后年纪大的小孩比较聪明些。
(七岁比一岁聪明不奇怪吧?)
不过,原本的研究可是说“脚掌较大的人比较聪明”唷。
这个用词又更令人迷惑....
: (3) 某某研究惊爆!长期吸烟人士患帕金森氏症的比例较非吸烟人士为低!
长期吸烟人士整体而言寿命较短,所以活不到帕金森氏症发病的时候。
所以坦白说,这个可以算是间接的因果关系,但是漏掉了中间的那一个环节。
长期吸烟
作者: lamda (钢琴加吉他)   2014-07-10 23:13:00
看统计数据的时候得要特别小心 其实不只是统记数据应该说被扭曲的数据都有欺骗的空间先不论有无造假 光错误引用就有可能造成误导
作者: yommy1108 (chiakila)   2014-07-10 23:18:00
这话题很有意义
作者: hgfx123 (泥沼浮花)   2014-07-10 23:40:00
推荐 逻辑即战力、问对问题,找答案 这两本书
作者: timshan (仲轩)   2014-07-10 23:44:00
第一个例子可能有很多种解释,因为该例子只提供盛行率所以你可能是新发个案比其他州要多,也可能治疗的情况比较差,当然前面推文有人提到这些人也可是发病后才移居的外来人口。
作者: chx64 (雪人)   2014-07-10 23:46:00
...这跟统计谬误都无关阿 全都是逻辑谬误阿 或滑坡谬误统计你可以稍微分为统计前、中、后三个部分去探讨不同时期有不同的地方不同的手段去"做手脚"目的只有一个 最终结果能够辅助自己的论述期望 END总之我想说的是虽然错误的因果关系被归类在统计误用但是别忽略了要能够量化为前提
作者: timshan (仲轩)   2014-07-10 23:52:00
他这里举出的范例都是能够量化研究的类型..
作者: uka123ily (NUNCA MAS)   2014-07-10 23:52:00
滑坡谬误跟这个有何关系?
作者: timshan (仲轩)   2014-07-10 23:53:00
不知道。
作者: uka123ily (NUNCA MAS)   2014-07-10 23:54:00
没有类比其他类型,单一事件因果推论好像不能构成吧==
楼主: Django (Cython)   2014-07-10 23:54:00
这里面有哪些是滑坡谬误?
作者: timshan (仲轩)   2014-07-10 23:56:00
不过比较需要被大众知道的,我想代表性的问题,可比较性的问题,还有过度推论可能会是比较重要的部分。
作者: chx64 (雪人)   2014-07-10 23:57:00
很多都滑坡谬误阿 随便看ㄧ个 3就是阿别忘了 不恰当的问题也是归类于统计误用
作者: timshan (仲轩)   2014-07-10 23:58:00
3最好是滑坡谬误XDDDD
作者: chx64 (雪人)   2014-07-10 23:58:00
其实没关系啦 我的重点只是想告诉你在"量化的过程"
作者: timshan (仲轩)   2014-07-11 00:00:00
控制母群体为样本数→请问这是啥?
楼主: Django (Cython)   2014-07-11 00:01:00
3是真的有间接因果关系啊,哪是滑坡谬误
作者: chx64 (雪人)   2014-07-11 00:02:00
长期吸烟=>寿命短=>患帕金森氏症比例低 没滑坡?
作者: uka123ily (NUNCA MAS)   2014-07-11 00:02:00
我也不懂,统计没这样教过,书也没写。
楼主: Django (Cython)   2014-07-11 00:03:00
问题是这是的确成立的啊=.=
作者: uka123ily (NUNCA MAS)   2014-07-11 00:03:00
滑坡是不同事件的类比,不是探讨单一事件==
作者: chx64 (雪人)   2014-07-11 00:03:00
怎么会成立? 那不然统计干么搞个信赖区间?
作者: timshan (仲轩)   2014-07-11 00:04:00
滑坡谬论是推论因果关系只是可能而非必然...
作者: chx64 (雪人)   2014-07-11 00:04:00
那三个都是不同事件阿 有事嘛?
作者: timshan (仲轩)   2014-07-11 00:05:00
但这个案例是你控制住年龄,你盛行率的差异就完全消失噜..
作者: chx64 (雪人)   2014-07-11 00:06:00
所以我说过了阿 你得要有量化为前提才能产生统计误用 没错阿
作者: timshan (仲轩)   2014-07-11 00:06:00
三的案例很明显量化了阿...
作者: uka123ily (NUNCA MAS)   2014-07-11 00:06:00
我的意思是他讨论三个变量观察的的因果关系为何。但是他得将因果关系形式逻辑套用才成立。那个例子是讨论中介变量,怎么会是套用因果关系?
作者: lyu0001 (乡民1号)   2014-07-11 00:41:00
垃圾等级的研究,统计也没意义
作者: timshan (仲轩)   2014-07-11 00:46:00
喔。
作者: lamda (钢琴加吉他)   2014-07-11 07:35:00
深入讨论可左转统计板...XD Statistics
作者: mnopq (Could you let me win?)   2014-07-11 09:16:00

Links booklink

Contact Us: admin [ a t ] ucptt.com