Re: [问题] 模拟考和学测 参考试卷

楼主: vasily0908 (农化王炳忠)   2018-01-01 23:51:12
※ 引述《purin3 (进化成胖可丁了)》之铭言:
: 直接用统计结果来显示 网络上有几份最后一次北模VS学测成绩的比较表
: 用EXCEL下去跑回归曲线 顺便计算几个基本的统计量关系
: 1、预测准确程度:第三次北模>第二次北模>第一次北模(以前北模有三次)
: (这个满好理解的,范围比较大、时间比较晚都会比较准确)
: 2、最后一次北模(A)与学测成绩(B)差异
: (1)平均来说,B-A=1.4,也就是学测会比最后一次北模高一些。
: (2)但这与你所在的级分位置有关,
: 如果你在50级分上下,平均约进步3.5级分,
: 如果在70级分上下,平均约进步0.3级分。
: (3)A与B呈现高度正相关,决定系数为0.7929;
: 也就是八成已经决定了!剩下两成的努力空间。
: (4)MAX(B-A)=33;MIN(B-A)=-23。
: 3、这份统计资料来自植物园高中,102最后一次北模与学测成绩比较,
: 是否能推论到其他学校与其他年度,也有待确定。
: (另外一个方式说,用贵校去年的资料,会相对准确一些)
敝人不才,看到以上这个分析,
就让我手痒想来检测看看平均而言差1.4级分在统计上到底算不算显著
所以我用R Studio下去跑学生t检定,跑的资料就是这份102年的统计资料
我的假设如下:
H0(虚无假设):学测成绩平均级分小于等于北模成绩平均
上面这句话的意思代表两件事情:
1. 你在最后三十天的努力是没用的甚至更惨
2. 你老师只是在安慰你。
Ha(对立假设,要是H0被拒绝则用这条):学测成绩平均大于北模成绩平均
这句话就代表你的努力是有意义的。
程式码附在下面
> dat = read.csv("北模学测成绩比较.csv")
##我先把档案换成csv档,不然不能用
> before = dat$模考
> after = dat$学测
> t.test(after, before, alternative = "greater", paired = TRUE, conf.level=0.95 )
##抱歉上面这行有点长,自己复制的时候注意一下
最后得到的结果如下
paired t-test
t=11.777 df=1233 p-value<2.2E-16
t在df=1233下的临界值大概是1.64,老实说这已经很接近常态分布
但是这不是重点,来检验吧!
在做t检定的时候,我们的t值要是大于临界值
我们就会拒绝虚无假设(Reject H0)
同时,要是我们的p值小于我们的显著水准
我们也会拒绝虚无假设
在这个例子里面,我们的信心水准定95%,也就是显著水准0.05
显然t值11.777是大于1.64的,
故以t值检验,我们会拒绝H0
又,我们的p-value小于2.2*10^-16,
故以p-value检验,我们一样会拒绝H0
所以采用Ha的结果就是,
我们在最后几天努力还是有意义的!(洒花)
可喜可贺,可喜可贺。
※Reference:
沈明来,《生物统计学入门》第六版(九州图书,2016.9)
白经济,〈统计术语小教室:你说的是真的吗?〉
网址:https://talkecon.com/statistics101/
作者: whitejason05   2018-01-01 23:55:00
感觉像是复杂的干话
作者: takeyourtime (钟点战)   2018-01-07 00:32:00
推这篇认真!4楼对干话最有研究

Links booklink

Contact Us: admin [ a t ] ucptt.com