Re: [爆卦] 庄伯仲教授的回信 ultimachen PTT批踢踢实业坊

Re: [爆卦] 庄伯仲教授的回信

楼主: ultimachen 2023-11-25 16:18:00

虽然火车开走了，还是有人在带风向。以下说明及程式由chatgpt产生，人工修改。
中央极限定理（Central Limit Theorem，CLT）是统计学中的一个基本概念，它描述了在
一定条件下，大量相互独立、具有相同分布的随机变量的平均值（或总和）的分布趋向于
正态分布，即使原始随机变量的分布不一定是正态分布。
信心水准的计算与统计推断中的置信区间密切相关。一个信心水准通常以百分比形式表示
，常见的有95%、90%、99%等。信心水准描述了对估计参数真实值的信心程度，并用来构
建置信区间。
**信心水准为95%的例子：** 如果我们使用95%的信心水准进行估计，我们可以说，在
一系列相似的实验或研究中，我们预期有95%的情况下真实参数值会落在我们计算的置信
区间内。换句话说，我们对我们的估计感到相当有信心，但也承认有5%的机会我们的估计
是不准确的。
根据以上两点，假设做10000次相同的民调，信心水准为95%，支持度会呈现正态分布，
标准差为0.03/1.96。
误差范围指的是在这个范围内统计不显著，超过这个范围为统计显著。
柯侯 vs. 赖萧，做10000次民调，柯侯支持率的分布为set1。
侯柯 vs. 赖萧，做10000次民调，侯柯支持率的分布为set2。
在信心水准95%的情形下，柯侯支持率大于侯柯支持率的差距需为多少?
先说结论，相关系数为[0.8, 0,5, 0.0]的情形下，差距大于[1.61%, 2.54%, 3.62%]
即为统计显著。
import numpy as np
def genSets(mean, delta, corr, samples):
std_dev = 0.03/1.96
covariance_matrix = np.array([[std_dev**2, corr * std_dev**2],
[corr * std_dev**2, std_dev**2]])
data = np.random.multivariate_normal([mean, mean-delta],
covariance_matrix, samples).T
return data[0], data[1]
for delta in np.linspace(0.01,0.06,501):
set1, set2 = genSets(0.5, delta, 0.8, 10000)
if np.sum(set2>set1) > 500:
print(delta)

继续阅读

Re: [爆卦] 民众党潮水退了，党员退党了linwuno [问卦] 阿北都没放弃了你们放弃什么? 绝不放弃!OPPAISuki Re: [问卦] 猫猫走了要多久才会释怀？k44754 [问卦] 中国这么多病不管习近平不怕被传染？wwwson1256 [问卦] 泡裸汤大众池会偷瞄别人下体吗？chin700908 Re: [新闻] 赵少康：把柯文哲打到20%以下国民党jerrylin Re: [新闻] 赵少康：把柯文哲打到20%以下国民党lunsun [问卦] 臭嘴女仆songgood [问卦] 急！机车机油1000不马上换会怎样？MatheFuck Re: [问卦] 吃素比较环保？yuan55226