林定香老师书中的分层抽样例题:
从美国四年制的大专院校,入学人数与师资大小的名单中,想估计平均的入学率
(在1986-1987的学年)。因为私立院校多半比公立院校小,所以以此来分层。
尽管资料中有大专院校的型态编码,但是名单中并没有各校的入学资料。
因此,可以很快获得大专院要的型态(公立或私立),但是入学资料就很难处理。
一组大专院校型态以10取1选取的系统样本来蒐集资讯。
结果如下:
私立(n'_1)=84
公立(n'_2)=57
全部(n')=141
以下是11所私立院校和12所公立院校的次样本入学资料和师资大小。
(师资资料将在之后使用。)请估计美国大专院校在1986-1987年的平均入学人数。
私立,n1=11 公立,n2=12
入学 师资 入学 师资
1618 122 7332 452 a'_1=84/141=0.6
1140 88 2356 131 a'_2=57/141=0.4
1000 65 21879 996 y_bar_1=(1681+1140+...+1050)/11=1681
1225 55 935 50 y_bar_2=(7332+2356+...+5380)/12=5853
791 79 1293 106 (s_1)^2=[sum(yi-1681)^2]/10=3143529
1600 79 5894 326 (s_2)^2=[sum(yi-5853)^2]/11=34257609
746 40 8500 506
1701 75 6491 371
701 32 781 108
6918 428 7255 298
1050 110 2136 128
5380 280
平均入学人数(y'_bar)=0.6*1681+0.4*5853=3349.8
**林定香老师的计算是假设n'大到足以忽略 a'_i/n' 的情况,所以变异数估计值会变成
sum{a_i'^2*s_i^2/n_i+a'_i*(y_bar_i-y'_bar)^2/n'}
平均入学人数变异数=0.6*0.6*3143529/11+0.4*0.4*34257609/12
+[0.6*(1681+3349.8)^2+0.4*(5853-3349.8)^2]/141
=545708.05+29626.52
=575334.57
PS:
但是补习班老师的资讯是不忽略 a'_i/n'
所以整个变异数的估计有很大的出入,请问该依照哪位的计算比较恰当?
由于数学不意表达,若造成大大观看上有不方便,请见谅。