[请益] 样本问题

楼主: weareyoung (weareyoung)   2015-11-05 15:38:20
ABC三个学生跑数据库抓精神疾病
A的总样本是全部的人50几万,有精神疾病的人是44%
B总样本数没A多但应该有几十万,精神疾病41%
(老师说差不多)
C总样本是A的样本中撷取有职业伤害的人,样本数三万多,精神疾病20几%而已。
会差那么多是因为总样本人数C比较少的关系吗?还是跟总样本无关,是比例问题?
也就是说C虽然3万多人但应该也要跟A,B一样是40几%
作者: blence ( )   2015-11-05 16:11:00
在考虑是不是也40%之前,已经排除职业伤害的影响了吗
作者: milk0925 (废物是种尊称)   2015-11-06 15:05:00
以下说明只是我个人浅见,略供参酌。假如A和B皆是用近乎随机取样的方式进行抽样(毕竟现实上是很难做到完美的随机取样),那么接下来我会想到的是,C多设定了一个条件:“有职业伤害的人”,我不知道C是怎么定义这个职业伤害的,因为"通常"如果疾病状况比较严重的话,可能也因此在工作的部分会有一些困难,意思也就是在临床上通常他们比较少是有工作的,所以当C多设定了“有职业伤害的人”这个条件时,可能就有机会把一部份确诊,而且相对状况比较严重的病人筛选掉了。因此我会疑惑的是,C的“有职业伤害的人”这个条件,是不是也同时代表着这些人在抽样当时是有工作的?

Links booklink

Contact Us: admin [ a t ] ucptt.com