※ 引述《heinztzeng (亚利安)》之铭言:
: 1.媒体来源:
: 联合报
: 2.记者署名:
: 郑媁
: 3.完整新闻标题:
: 协商有强调是“正负” 朱立伦:柯文哲一定记得很清楚
: 4.完整新闻内文:
:
: 朱立伦表示,他有点教授性格,他把统计误差与公式,都背给大家听,1068份样本数,误
: 差范围是正负3个百分点;2000份样本是正负2.2个百分点,3000份就是正负1.75个百分点
: ;若要到柯所主张的正负1.5个百分点,那要4250份。现在统统不要讲百分之几,全部回
: 到统计误差,每份民调都有很明确的统计误差。
: 朱立伦说,协商会后,他们请各方幕僚进来,把会议记录写得非常清楚,尊重学者专家的
: 认定。昨天民众党代表有意见,他认为还是要尊重学术专业,统计误差不能朱立伦、柯文
: 哲讲了算,这些学者教授讲了才算,如果按照专家所讲,9份民调如果都算,结果是八比
: 一,民众党对其中三份有意见,就变成五比一,如果缩小变成正负1.5,也就是订一个人
: 工误差,就变成3比3,所以现在有点卡关。
: 朱立伦指出,还好柯文哲昨天说蓝白必须合,大家持续协商,他随时准备好,幕僚之间保
: 持沟通,也许周三中常会要来确认蓝白合所有工作。
: 5.完整新闻连结 (或短网址)不可用YAHOO、LINE、MSN等转载媒体:
: https://udn.com/news/story/123307/7584102
最厉害的谎言就是在谎话里加入一些实话
而且脸不红气不喘,把大家搞混后
就没人知道真相是什么
毕竟也不是每个人都学过统计
朱立伦说的统计误差是怎么算的
在统计学里有分型Ⅰ误差α和型Ⅱ误差β
因为犯型Ⅰ误差的后果较严重
所以我们抽样时会给定型Ⅰ误差,通常设为0.05
再推算出样本数n为多少
配合母体参数(此案例指的是柯侯或侯柯的真实支持度,设为P)
求得样本的标准差s=开根号(P*(1-P)/n)
进而得出统计误差(设为d,不考虑非抽样误差)
公式:统计误差 = 查表值*标准差
信赖区间 = 估计值+/-统计误差
此处估计值是指柯侯或侯柯的样本支持度
因为母体参数P未知,所以通常以0.5估计
n=1068,d=1.96*开根号(0.5*0.5/1068)=0.03
n=2000,d=0.0219
n=3000,d=0.0179
n=4250,d=0.015
到这朱立伦说的是事实
所以吵统计误差是3%、6%或1.5%根本没有意义
因为一开始就由型Ⅰ误差决定
也没有人在说让统计误差的
因为你改了统计误差会造成型Ⅰ和型Ⅱ误差变动
那一开始设型Ⅰ误差是订爽的喔
再来匪夷所思的就是每份民调用两组信赖区间是否重叠来检定
不论是用信赖区间检定、Z检定、p-value
统计意义都是相同,只是表现方法不同
但我才疏学浅就是没看过用信赖区间是否重叠来检定的
我觉得朱主席应该发表论文来教育大家
然后民众党大概被带偏了,整个懵了
一直陷在1.5%或3%
那根本不是问题,问题是检定方法就错了
其实依照柯文哲的意思
应该是柯侯的样本支持度p1-侯柯的样本支持度p2
若大于3%且落于信赖区间内
则算侯柯胜
虚无假设H0:P1-P2 <= 3%
对立假设H1:P1-P2 > 3%
至于协议书写的在统计误差范围内
指的是若p1-p2落于信赖区间内
则不拒绝H0
意即在信赖水准95%(1-α)的情况下
柯侯的支持度没有显著超过侯柯的支持度3%
算侯柯胜
而且这明明就是单尾检定
误差界限就只有一边
朱立伦一直强调正负是三小
我不相信堂堂台大教授会不懂基本的统计
结论:
以上的分析都是垃圾
因为前述检定有个重要的前提
所有样本值必须独立且服从相同的常态分配
这些民调一开始就不是要用来做柯侯对比侯柯的支持度是否有显著差异
所以实验设计是采配对样本
也就违反样本值必须独立的假设
根本没办法拿来做比较
如果硬要用来分析
我认为McNemar检定还比较适合些
当然还是有些疑义啦
其实最好的办法就是一开始就直接办民调XD