楼主:
social (社会化动物)
2021-05-17 21:45:08课程名称︰心理测验
课程性质︰必修
课程教师︰翁俪祯 姚开屏 合授
开课学院:理学院
开课系所︰心理学系
考试日期(年月日)︰109.11.23
考试时限(分钟):120 分钟
试题 :
1. 姚老师设计了一个修习统计态度量表,里面有八个题目 (I1~I8),所有题目都设计为
正向陈述句,量尺采用:“非常不同意=1,不同意=2,没意见=3,同意=4,非常同意
=5”。她想检验这个量表题目的心理计量特质,看是否可以删除不好的题目,因此将
此些题目施测在12名心理系修统计的学生身上 (S1~S12),得到下面的结果:
https://imgur.com/a/0MgQ3Gk
(1) 光从以上的资料,你会怎么筛选题目,请说明理由(使用的筛选标准)?
(2) 说明如何看题目的困难度 (difficulty) 及鉴别度 (discrimination)?(不用计
算)
(3) 计算各题目的信度 (item reliability)?
(4) 使用这样的题目数与学生数有没有什么问题?请说明。
(5) 假如要删减两题(剩下六题),你会删减哪两题?为什么(说明理由)?
2. 如果上面的度量资料转换成“非常不同意=0,不同意=0,没意见=0,同意=1,非常同
意=1”:
(1) 与第一大题比较(采 Likert scale),请问这样的度量方法可能有什么问题?请
说明。
(2) 请计算每个题目的平均数与变异数?以及 total test score mean?
(3) 利用这样的资料(0与1),你会怎么筛选题目,请说明理由(使用的筛选标准)?
(4) 计算各题目的困难度及鉴别度?(取高低分组时,可将所有样本总分平分成三部
分)根据计算的结果,判定有没有不好的题目。
(5) 画出 I2 题的 item characteristic curve (ICC)。
3. 比较古典测验理论 (CTT) 以及现代测验理论(如:项目反应理论、IRT)的优缺点。
4. 设计一个用到 multistage sampling 的研究,其中能包含使用多个random sampling
方法在里面。说明你的研究问题、母群、样本、随机抽样方法等。
5. 谈一谈 Likert-typed rating scale 的假设。
6. 设计一个测量工具在考虑所使用的量尺度量时,请谈一谈该怎么考虑要用几点量尺?
谈一谈是使用奇数点还是偶数点好?
7. 回答下面的问题:
(1) Sampling frame 与 population 有什么不同?
(2) 什么是 DIF (differential item functioning)? DIF 与 biased item 的差别?
加分题:
1. 续第一大题,若这八题的总内部一致性系数 (Cronbach's alpha) 为 0.69,你觉得应
该要删除哪些题目比较好,为什么(说明理由)?
2. 支持 1-p 及 2-p/3-p IRT 模式的研究者意见不同,他们到底在吵什么?(他们有哪
些不同的观点)