[闲聊] 统计

楼主: kuromu (kuromu)   2023-11-19 01:35:39
有统计老师说 要比较民调是否在误差范围
要用McNemar检定, 假设
KH对决L的支持人数分别为a和c
HK对决L的支持人数分别为d和b
而要用来做检定的统计量就是(a-d)^2/(a+d)
这个统计量遵从自由度为1的χ^2分布
其标准差和自由度有关 和常态分布蛮不同的
这个检定方法的来源是
KH支持度和HK支持度不是独立的
所以做检定时 标准差部分要算进共变异数
可以看成是三项式分布p1 ,p2 ,1-p1-p2
计算共变异数时可以用补项的技巧或是MGF
或者用另一个等效的分布:
f(1)=p1,f(-1)=p2,f(0)=1-p1-p2
也可算出一样平均数和标准差
然后在样本数够多的情况 可用常态分布近似
再利用常态分布和χ^2分布的某种关系
还有虚无假设 可得到目标检定量
而这个过程本质上跟另一个检定方法(χ^2检定)相似
都会得到(a-d)^2/(a+d)
(a-d)^2/(a+d)可以写成相依常态分布随机变量的平方和
这个平方和可以写成矩阵形式
将矩阵对角化 可改成独立常态分布随机变量的平方和
可知自由度为1
作者: tibo96033 (鲤鱼)   2023-11-19 01:36:00
太复杂了,本文组看不懂

Links booklink

Contact Us: admin [ a t ] ucptt.com