Re: [问卦] 有没有三方的统计学都超级烂的八卦

楼主: brian900530 (LmWAng9)   2023-11-19 06:54:22
首先 抽样误差是在统计学上本来就会有的限制

只是用机率的形式来展现

拿抽样误差3%6%来说要让几% 根本就在乱用

到底指的是民调数字让3%?让抽样误差?

还是只要没有统计上的显著差异就让?

讲的不清不楚

更别说两党在比的东西不一样吵的东西也不一样

一边比差距的差距,一边比柯侯-侯柯

一个是相对数字一个是绝对数字

两边所谓的3%6%指的根本就不是同一件事

到底在吵什么,也完全是看不懂



假设有效样本数1068 在95%信心水准下

误差就是+-3%,举例来说就是100的正负3

但这只能用在计算单一统计值的时候



蓝白是把一个民调里面的两个统计值拿来相比



下面就直接节录一些脸书上教授写的文



支持率的差异不一定要超过两倍的抽样误差(柯文哲说的6%)才会达到统计显著

第一因为3%是保守最大值的估计,实际上的“抽样误差”通常会比3%小。

再者信赖区间有重叠也不代表没有达到统计显著

第二,两个人的对比支持率是同一个民调做出来的,不是独立样本,不能忽略相关性。



———————————————————————

以下是同一民调不同问题得出的支持度应该怎么比较:

https://i.imgur.com/4sM2ya6.jpg

以汇流为例,样本数n = 2046,(1) 柯侯48.3%对比(2)赖萧 39.2%,所以(1)-(2) = (3)



两个统计量的差异的标准误差是这样算的 https://i.imgur.com/50DV1iY.jpg



sqrt( { p1*(1-p1) + p2*(1-p2) + 2*p1*p2} /n )

=

sqrt( (0.483*(1-0.483) + (0.392)*(1-0.392) + 2* 0.483*0.392)/2046)

= 0.021



因为柯侯: 赖萧 是在同一个问题问的,支持柯侯就不会支持赖萧 (互斥)

所以这两个支持率的相关性是负数,这就是为什么公式后面为什么会多出2*p1*p2。



所以柯侯对比赖萧的支持率要超过1.96*2.1% = 4.1%,才有统计上的差异。



同样的方式可以算出(4)-(5)=(6),两个统计量的差距的标准误差是0.0207。

所以侯柯对比赖萧的支持率也是超过1.96*2.07% = 4.1%,才有统计上的差异。



但是如果要直接比较柯侯对侯柯的支持度,就得考量到这是两个不同问题得到的

而且支持柯侯的人也会比较倾向侯柯,所以相关性为正。



而(1)-(4)的标准误差会长得像这样

sqrt( ( p1*(1-p1) + p2*(1-p2) - 2*v ) /n )

=

sqrt( (0.483*(1-0.483) + (0.461)*(1-0.461) - 2* v)/2046)

= ???



v 是柯侯跟侯柯在两个问题的共变异数,得用原始资料去估计。



没有v就算不下去



也就是说,不论是(3)-(6)=(7)还是(1)-(4)=(8)只要没有原始数据

都算不出来应该怎么决定有统计意义的差距。差距的误差就不是抽样误差。



结论:

再怎么说 蓝白合民调比拼绝对不是拿两个数字来相减然后说

喔你看在6%内然后另一边说才不是明明是3%

这是需要民调专家学者去运算的
都已经找来两个专业的来当裁判

原始数据都在这些人手上

明明是一翻两瞪眼的东西结果演成这样

所以我也看不懂朱立伦记者会到底在说什么

至于柯说什么3% 纯粹是以为误差值是固定3%

Links booklink

Contact Us: admin [ a t ] ucptt.com