天才一秒记住【畅想小说网】地址:http://www.cxtra.net
1.G研究结果
如前所述,运用多元概化理论的研究包括G研究和D研究。
作为第一步,G研究包括设计、数据收集以及在设计情境下评估相关的方差分量。
[21]一旦所有数据来源的方差分量被估算出来,这些可以用于D研究中制订未来的测评方案。
在本研究中,多元概化理论的分析采用的是mGENOVA软件。
[22]
表5-1给出了G研究的结果,包括《量表》8个维度(子量表)所有方差分量(对角元素)和协方差分量(即子量表之间的协方差)。
每个方差分量表示在托幼机构教育质量的特定维度上不同班级“真实得分”
(σc2)之间的方差估计值。
[23]研究结果显示,在第一个子量表“空间与设施”
上,方差分量最大;其次是子量表“保育”
和“家长与教师”
。
而方差分量最小的子量表是“语言推理”
。
这些信息表明,相对而言,幼儿园班级在空间与设施质量上差异最大,但在语言推理教育质量上差异最小。
子量表之间的相关系数最低为0.65,这表明《量表》的8个质量维度之间密切相关,构成一个复杂量表的基础。
评分员嵌套于班级效应的方差分量(σ2rc,e)理论上由两部分组成:一部分是评分员效应的方差分量(σ2r),它使评分员和班级之间交互作用的方差变量模糊;第二部分是残差(σ2rc,e)。
在G研究中,嵌套设计(即评分员和班级的嵌套)使这两个成分相互混淆并且无法分离。
表5-1G研究方差和协方差分量估计值
续表
2.D研究结果
一旦G研究结果的方差分量是可用的,那么它同样适用于D研究中如何设计一个更好的测评方案。
[24]例如,可以通过增加或减少评分员的数量、增加或减少评价项目的数量等修改测评方案。
这些修改能够影响测量的可靠性,这样,可以对“最佳”
测评方案进行规划。
接下来,我们将从两个方面讨论结果:(1)原来的测评方案;(2)在嵌套设计中,通过改变评分员的数量形成新的测评方案。
(1)测量情境条件不变的D研究结果
表5-2显示了在用于G研究的测量情境不变的情况下D研究结果,也就是说,每个班级都由两个评分员进行评分,将评分员嵌套在班级里。
在《量表》中,每个子量表(维度)的评分代表了幼儿园班级的质量水平,高分的班级质量高于低分的班级质量。
正因如此,在测量信度的估算中仅仅通过考虑评分员评分排序的相对一致性是不够的,与评分员在实际评估得分中的一致性也是相关的。
基于这些考虑,对于绝对决断来说,概化系数(φ)是一种适当形式的信度系数:
本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!