Re: [问卦] 有没有三方的统计学都超级烂的八卦 brian900530 PTT批踢踢实业坊

Re: [问卦] 有没有三方的统计学都超级烂的八卦

楼主: brian900530 (LmWAng9) 2023-11-19 06:54:22

首先抽样误差是在统计学上本来就会有的限制

只是用机率的形式来展现

拿抽样误差3%6%来说要让几% 根本就在乱用

到底指的是民调数字让3%？让抽样误差？

还是只要没有统计上的显著差异就让？

讲的不清不楚

更别说两党在比的东西不一样吵的东西也不一样

一边比差距的差距，一边比柯侯-侯柯

一个是相对数字一个是绝对数字

两边所谓的3%6%指的根本就不是同一件事

到底在吵什么，也完全是看不懂

假设有效样本数1068 在95%信心水准下

误差就是+-3%，举例来说就是100的正负3

但这只能用在计算单一统计值的时候

蓝白是把一个民调里面的两个统计值拿来相比

下面就直接节录一些脸书上教授写的文

支持率的差异不一定要超过两倍的抽样误差（柯文哲说的6%）才会达到统计显著

第一因为3%是保守最大值的估计，实际上的“抽样误差”通常会比3%小。

再者信赖区间有重叠也不代表没有达到统计显著

第二，两个人的对比支持率是同一个民调做出来的，不是独立样本，不能忽略相关性。

———————————————————————

以下是同一民调不同问题得出的支持度应该怎么比较:

https://i.imgur.com/4sM2ya6.jpg

以汇流为例，样本数n = 2046，(1) 柯侯48.3%对比(2)赖萧 39.2%，所以(1)-(2) = (3)

两个统计量的差异的标准误差是这样算的 https://i.imgur.com/50DV1iY.jpg

sqrt( { p1*(1-p1) + p2*(1-p2) + 2*p1*p2} /n )

=

sqrt( (0.483*(1-0.483) + (0.392)*(1-0.392) + 2* 0.483*0.392)/2046)

= 0.021

因为柯侯: 赖萧是在同一个问题问的，支持柯侯就不会支持赖萧 (互斥)

所以这两个支持率的相关性是负数，这就是为什么公式后面为什么会多出2*p1*p2。

所以柯侯对比赖萧的支持率要超过1.96*2.1% = 4.1%，才有统计上的差异。

同样的方式可以算出(4)-(5)=(6)，两个统计量的差距的标准误差是0.0207。

所以侯柯对比赖萧的支持率也是超过1.96*2.07% = 4.1%，才有统计上的差异。

但是如果要直接比较柯侯对侯柯的支持度，就得考量到这是两个不同问题得到的

而且支持柯侯的人也会比较倾向侯柯，所以相关性为正。

而(1)-(4)的标准误差会长得像这样

sqrt( ( p1*(1-p1) + p2*(1-p2) - 2*v ) /n )

=

sqrt( (0.483*(1-0.483) + (0.461)*(1-0.461) - 2* v)/2046)

= ???

v 是柯侯跟侯柯在两个问题的共变异数，得用原始资料去估计。

没有v就算不下去

也就是说，不论是(3)-(6)=(7)还是(1)-(4)=(8)只要没有原始数据

都算不出来应该怎么决定有统计意义的差距。差距的误差就不是抽样误差。

结论：

再怎么说蓝白合民调比拼绝对不是拿两个数字来相减然后说

喔你看在6%内然后另一边说才不是明明是3%

这是需要民调专家学者去运算的
都已经找来两个专业的来当裁判

原始数据都在这些人手上

明明是一翻两瞪眼的东西结果演成这样

所以我也看不懂朱立伦记者会到底在说什么

至于柯说什么3% 纯粹是以为误差值是固定3%

继续阅读

Re: [问卦] 朱博士说正负3％是6%我该相信吗??Dawsen Re: [问卦] 诈骗短信增多了laptic [问卦] 衬衫套上毛衣是不是就很好看？zxc17893 Re: [新闻] 新闻眼／纵有委屈柯别忘对民意的庄kensmile Re: [问卦] 咸酥鸡提味要加九层塔,大蒜还是洋葱?ayasesayuki Re: [问卦] 台湾的监狱到底够不够会不会影响判决jobintan Re: [问卦] 朱博士说正负3％是6%我该相信吗??jason0925 [问卦] 这里有谁修过统计学？Ericz7000 Re: [问卦] 说好正负3％又不认帐是不是很没诚信ShotOnWall [问卦] 鬼岛有没有PFAS污染badbadook