Re: [问卦] 为什么统计学这种盖棺论定的事也能吵

楼主: kh749 (ReturnTo)   2023-11-20 16:51:37
※ 引述《SRadiant (Radiant)》之铭言:
: https://i.imgur.com/5L8v7Ta.jpg
: 我是真的不知道这机构算不算中立
: 咕狗翻译是说
: https://i.imgur.com/XXshtth.jpg
: 需要领先 6 个百分点或更多,我们才能确信领先不仅仅是抽样误差的结果。
难得统计在这次扮演这么重要的角色,
我作为这个圈子的nobody, 感觉也应该尽点心力
p是支持率
Var(p)大约是p(1-p)/n, 开根号再乘以1.96就是抽样误差
为求让大家都看得懂,
一般把p=0.5求粗估值, (0.5*0.5和0.4*0.6也差不多).
当n=1068时, 根号(var(p))*1.96 = 3%
比较两位候选人得票率p1,p2
Var(p1-p2) = Var(p1)+Var(p2) - 2*r*根号(var(p1)*var(p2))
如果粗估p1=p2=p, 那么var(p1)=var(p2)
var(p1-p2) = 2*var(p) - 2*r*var(p)
r是大家高中都学过的相关系数-1<r<1
(1)当r=-1时,
也就是假设一个人投给国民党的人就不投给民进党, 完全负相关
var(p1-p2)=4*var(p), 开根号之后发现误差范围是原本的2倍
这个假设有一个小缺陷就是一个人还有第三种选择,
那就是投票日当天选择出去玩, 不投票,
所以真正的 r = -0.5, 中度负相关
var(p1-p2) = 3*var(p), 开根号之后是原本的1.75倍, 也差不多2倍了
所以文章的内容大致是正确的.
(2)现在p1=柯侯,p2=侯柯
这两个数字并非是负相关, 反而是高度正相关,
投给柯侯的人有很高的机会也投给侯柯
如果r=0.8
var(p1-p2) = 0.4*(var(p)), 开根号后是原本的0.65倍, 不但没增加, 还缩小了
当n=1068时, 这个误差是3%*0.65 = 2%左右 <-不是国民党说的5.X%
这个含意是:
"如果柯侯和侯柯的正相关性高达0.8,
那么民调之中柯侯只要领先侯柯超过2%,
统计上就代表柯侯显著胜过侯柯"
备注:
统计学博士费鸿泰还是有水平的,
虽然他上节目说的我没怎么听懂,
但是他总归答对了这个问题
我不晓得签上名的两位政大和文大两位教授怎么看这个问题?

Links booklink

Contact Us: admin [ a t ] ucptt.com