Re: [爆卦] 庄伯仲教授的回信

楼主: ultimachen   2023-11-25 16:18:00
虽然火车开走了,还是有人在带风向。以下说明及程式由chatgpt产生,人工修改。
中央极限定理(Central Limit Theorem,CLT)是统计学中的一个基本概念,它描述了在
一定条件下,大量相互独立、具有相同分布的随机变量的平均值(或总和)的分布趋向于
正态分布,即使原始随机变量的分布不一定是正态分布。
信心水准的计算与统计推断中的置信区间密切相关。一个信心水准通常以百分比形式表示
,常见的有95%、90%、99%等。信心水准描述了对估计参数真实值的信心程度,并用来构
建置信区间。
**信心水准为95%的例子:** 如果我们使用95%的信心水准进行估计,我们可以说,在
一系列相似的实验或研究中,我们预期有95%的情况下真实参数值会落在我们计算的置信
区间内。换句话说,我们对我们的估计感到相当有信心,但也承认有5%的机会我们的估计
是不准确的。
根据以上两点,假设做10000次相同的民调,信心水准为95%,支持度会呈现正态分布,
标准差为0.03/1.96。
误差范围指的是在这个范围内统计不显著,超过这个范围为统计显著。
柯侯 vs. 赖萧,做10000次民调,柯侯支持率的分布为set1。
侯柯 vs. 赖萧,做10000次民调,侯柯支持率的分布为set2。
在信心水准95%的情形下,柯侯支持率大于侯柯支持率的差距需为多少?
先说结论,相关系数为[0.8, 0,5, 0.0]的情形下,差距大于[1.61%, 2.54%, 3.62%]
即为统计显著。
import numpy as np
def genSets(mean, delta, corr, samples):
std_dev = 0.03/1.96
covariance_matrix = np.array([[std_dev**2, corr * std_dev**2],
[corr * std_dev**2, std_dev**2]])
data = np.random.multivariate_normal([mean, mean-delta],
covariance_matrix, samples).T
return data[0], data[1]
for delta in np.linspace(0.01,0.06,501):
set1, set2 = genSets(0.5, delta, 0.8, 10000)
if np.sum(set2>set1) > 500:
print(delta)

Links booklink

Contact Us: admin [ a t ] ucptt.com