Re: [请益] 如何教大家"正确"解释统计数据呢?

楼主: wayne0824 (莱恩)   2017-09-26 04:15:12
原文恕删,就算被台大事件的风波盖掉新闻,我也还是要上来回一下
本人没有念台大也没有什么高就,就是个说书的而已
接下来就用我所知道的数学来回应一下这个问题~
开始囉!
https://imgur.com/dbas0XO
这个问题的引爆点大致可以归功于统计数据,所以让我们先看看数字:
https://imgur.com/eN2QWqR
*注2:数据参考卫服部网站:https://goo.gl/5M9iVq,数据为1984年至2014年之总和
其中5,321人为异性恋不安全性行为中男性人数与女性人数总和;
男性4,441人、女性880人,共计5,321人。
(另外先有注2是因为作图的时候先做了别张XD
真正写文章的时候发现这张放前面才有个前因后果)
https://imgur.com/HGtkv9T
好好停停停停!
数据上确实是写着男男间不安全性行为人数比异性恋人数还多呀!
赖清德那样说,到底错在哪里?
https://imgur.com/aS5SqP3
(其实也没有用到很高深的统计,因为我也不会:P)
为什么赖清德那样的说法是错误的?其实关键就在只看“人数”其实不准。
这样讲好了,我们先把大家做一点分类:
https://imgur.com/pK0U03Z
*注1:事实上同性恋与异性恋并不适合分开来讨论,因为人的性向其实是一片光谱,
也就是大家所熟知的性别光谱。但是因为后续的数学讨论需要,
所以我才把同性恋跟异性恋切开,因为数学上定义的分割(Partition)严格指
的是两个集合交集为空,但联集为整个宇集。
(本部分注的部分,若数学看不懂则可以忽略,不是重点XD)
https://imgur.com/m03QQAI
事实上,若只看人数的数字是没有意义的。除了未知的人数真的不知道有多少人以外,
扣掉筛检HIV结果呈现阳性者的人数以后,还必须知道“到底有多少人去筛检?”
如果你不是很懂的话,让我举个例子给你看:
这是男男间不安全性行为与异性恋不安全性行为的人数:
https://imgur.com/eN2QWqR
但是,如果真实的受试者人数长成这个样子呢?
https://imgur.com/pDFEb8Z
*注3:此处的受检人数为假设数字,并不代表真的数字。我只是要让你看出来,
受检人数的多少其实才是真正影响这个统计数字的关键。
你问我为什么不把真的数字写出来,要写我假设的数字?
当然是因为每个人去筛检的时候,他没事才不会问你是不是同性恋咧。
所以我们只知道到底有多少人“玩过这个筛检”,但却不知道这些接受筛检
的人之中,同性恋与异性恋的占比。
从比例来看的话,不管是同性恋或者是异性恋,筛检人数:爱滋病人数都接近2:1耶!
如果真实的筛检数字正常这样的话,那我就可以跟你说,爱滋病的主因跟同性恋完全
无关!从数学上来看的话,两事件若为独立事件,则族群数量与事件的发生成比例。
(单纯就是数学上对于独立事件的定义,也就是说两件事情无直接关联)
其实在生活中也不难看见这件事情。大部分的同志相较于异性恋来的更有筛检的概念,
因此造成同性恋的受试者人数较异性恋多,这也是可以被接受的。
你说,可是我们也不知道真正各族群的筛检人数是多少啊!
我说,就是因为不知道各族群筛检的人数是多少,所以赖清德才无法说爱滋病的主因
是男同性恋之间危险性行为!就是因为数字并不知道,你讲话要有凭有据,如果不是事实
的事,那你就不能乱说!
这时候如果你不服气,想要帮赖神护航,那我来告诉你怎样的数据叫做爱滋病的主因
就是男同性恋吧!
https://imgur.com/iJfCXla
或者请看下面这张图:
https://imgur.com/iyuWM3N
如果有办法从卫服部的数据中,证明以下的不等号成立:
https://imgur.com/eFTvAXS
那至少你就可以说爱滋病与男同性恋者有关,即男同性恋为爱滋病的主因之一!
呼~写到这里本来想继续用数学写下去的,不过我觉得这样解释应该大部分的人都懂
了,如果还想了解更深入者,欢迎Google贝氏定理(Bayes' Theorem)。
接着我想写一些不论是新闻媒体或是院长本人都应该理解的事情:
事实:在HIV+患者当中,男同性恋占的比例较高。 (这是客观的事实)
推论:HIV+的主因是男同性恋之间的不安全性行为。 (这是主观的推论)
从事实→推论其实过程没有那么简单,并且此推论必须要负严格的举证责任,
也就是你必须证明。(上面提过了,现有的数据并不构成此推论)
至于院长道不道歉我也无所谓了,洋洋洒洒熬夜写了这么多也只是希望大家
可以少点对同志的污名。一路从去年十月开始的婚姻平权小蜜蜂走来,
这条路并不好走,除了婚权以外,我们要的更是平权。
身为一个说书的,也总是希望台下的呆瓜们可以听懂我想表达什么,
从减少歧视、反霸凌到反污名化,让这个世界更美好。
希望大家有看懂,也诚恳的请版上高手,如果有错麻烦鞭大力一点,恳请不吝指教!
莱恩
作者: pipi21th (阿丹)   2017-09-26 06:39:00
真是用心,帮你推一个
作者: peter080808 (peter)   2017-09-26 07:30:00
讲了半天 还是"爱滋黑数"这烂招
作者: scelerisque (scelerisque)   2017-09-26 07:31:00
推分析
作者: peter080808 (peter)   2017-09-26 07:32:00
得爱滋迟不筛检 早晚会发病的 到最后还是会回到统计中就算有潜伏期 但也只是延后而已 对新增病率的统计影像不大台湾不是第三世界国家医疗覆蓋率低落不可能你爱滋发病 还不会进入医疗体系中不被统计到是有少部分人带原hiv不吃药也永远不会发病,那是少数有特殊基因的欧裔东亚裔哦 不吃药控制就等发病吧
作者: arcelab (乌梨)   2017-09-26 07:42:00
我们可不可以因为发生家暴的家庭多数是异性恋,所以宣称异性恋成家是导致家暴的主因呢?答案肯定是不行的。 任何抽样统计要推论到全体,都有以管窥豹之嫌。
作者: peter080808 (peter)   2017-09-26 07:44:00
你试图用统计交集创造一个伪论"同志高是同志筛检人多"但却忘了爱滋不是真的"小感冒" 没补助给带原者吃药早晚会发病 还是会被医疗机构纪录到爱滋黑数只是解释了为何有新增病率暴增的原因黑数在被检测出来前依然持续危险性行为 造成新病历但黑数在台湾早晚会回到总统计中 对族群病率推估影响不大事实上 如果假设黑数是造成新增病历的主因 那新增病历一直成长的男同 才可能是黑数最高的族群我是默认男同确定带原后 就不会做危险性行为了没有异性恋有大量黑数 但新增病历却下降的可能用国高中的统计 就想推翻防疫专家统计的结论 ..........唉
作者: Sinreigensou (神灵幻想)   2017-09-26 08:13:00
推嘘文的那位,黑数在医疗覆蓋率高的状况下不合理除非每个发病都不给医院治疗,关在家等死才有黑数
作者: peter080808 (peter)   2017-09-26 08:17:00
是会有黑数啦 但黑数在台湾对病率推算引响不大,因为迟早会被统计到探讨"黑数" 主要是探讨黑数造成新病历但新病历最多的是哪个族群我不讲了
作者: wiiwiinccu (wiiwii)   2017-09-26 09:03:00
母体数跟抽样数应该不同喔觉得原po的逻辑满好的,推的都是符合统计学的解释,其实就社会公开发言这件事而言,本就该有多少证据说多少话吧
作者: uka123ily (NUNCA MAS)   2017-09-26 09:42:00
目前黑数影响不大?黑人问号更正一下,统计没有事实喔。你说的那是统计“分析”或“总结”。
作者: ksng1092 (ron)   2017-09-26 09:55:00
统计有趣的地方是同一笔资料在不同人手上可以得到很不一样的结论XD
作者: prokey (小矮)   2017-09-26 12:17:00
作者: sorawang   2017-09-26 12:58:00
如果都是用真的'统计学'来解释一份数据,结果应该不会相差太远,怕就是有人看百分比率,完全没有拿数据跑test就直接下结论,而且还是下因果推论XDD
作者: foolwind (废人...废样...)   2017-09-26 19:06:00
用药全额补助,白痴才当黑数,讲三小黑数前,先用脑袋想想
作者: lili300 (膝盖中了一箭)   2017-09-26 19:24:00
去看下面les大那篇吧 黑数什么的别再说了 根本站不住脚
作者: wowowg (Isn't it?)   2017-09-26 21:46:00
不要再给我看到 黑数 这种烂理由
作者: jengjye (建)   2017-09-26 21:49:00
推楼上...本篇文的压缩率一定超高的...

Links booklink

Contact Us: admin [ a t ] ucptt.com