首先 抽样误差是在统计学上本来就会有的限制
只是用机率的形式来展现
拿抽样误差3%6%来说要让几% 根本就在乱用
到底指的是民调数字让3%?让抽样误差?
还是只要没有统计上的显著差异就让?
讲的不清不楚
更别说两党在比的东西不一样吵的东西也不一样
一边比差距的差距,一边比柯侯-侯柯
一个是相对数字一个是绝对数字
两边所谓的3%6%指的根本就不是同一件事
到底在吵什么,也完全是看不懂
假设有效样本数1068 在95%信心水准下
误差就是+-3%,举例来说就是100的正负3
但这只能用在计算单一统计值的时候
蓝白是把一个民调里面的两个统计值拿来相比
下面就直接节录一些脸书上教授写的文
支持率的差异不一定要超过两倍的抽样误差(柯文哲说的6%)才会达到统计显著
第一因为3%是保守最大值的估计,实际上的“抽样误差”通常会比3%小。
再者信赖区间有重叠也不代表没有达到统计显著
第二,两个人的对比支持率是同一个民调做出来的,不是独立样本,不能忽略相关性。
———————————————————————
以下是同一民调不同问题得出的支持度应该怎么比较:
https://i.imgur.com/4sM2ya6.jpg
以汇流为例,样本数n = 2046,(1) 柯侯48.3%对比(2)赖萧 39.2%,所以(1)-(2) = (3)
两个统计量的差异的标准误差是这样算的 https://i.imgur.com/50DV1iY.jpg
sqrt( { p1*(1-p1) + p2*(1-p2) + 2*p1*p2} /n )
=
sqrt( (0.483*(1-0.483) + (0.392)*(1-0.392) + 2* 0.483*0.392)/2046)
= 0.021
因为柯侯: 赖萧 是在同一个问题问的,支持柯侯就不会支持赖萧 (互斥)
所以这两个支持率的相关性是负数,这就是为什么公式后面为什么会多出2*p1*p2。
所以柯侯对比赖萧的支持率要超过1.96*2.1% = 4.1%,才有统计上的差异。
同样的方式可以算出(4)-(5)=(6),两个统计量的差距的标准误差是0.0207。
所以侯柯对比赖萧的支持率也是超过1.96*2.07% = 4.1%,才有统计上的差异。
但是如果要直接比较柯侯对侯柯的支持度,就得考量到这是两个不同问题得到的
而且支持柯侯的人也会比较倾向侯柯,所以相关性为正。
而(1)-(4)的标准误差会长得像这样
sqrt( ( p1*(1-p1) + p2*(1-p2) - 2*v ) /n )
=
sqrt( (0.483*(1-0.483) + (0.461)*(1-0.461) - 2* v)/2046)
= ???
v 是柯侯跟侯柯在两个问题的共变异数,得用原始资料去估计。
没有v就算不下去
也就是说,不论是(3)-(6)=(7)还是(1)-(4)=(8)只要没有原始数据
都算不出来应该怎么决定有统计意义的差距。差距的误差就不是抽样误差。
结论:
再怎么说 蓝白合民调比拼绝对不是拿两个数字来相减然后说
喔你看在6%内然后另一边说才不是明明是3%
这是需要民调专家学者去运算的
都已经找来两个专业的来当裁判
原始数据都在这些人手上
明明是一翻两瞪眼的东西结果演成这样
所以我也看不懂朱立伦记者会到底在说什么
至于柯说什么3% 纯粹是以为误差值是固定3%