三基于项目反应理论多侧面Rasch模型的分析28（第1页）

天才一秒记住【畅想小说网】地址：http://www.cxtra.net

三、基于项目反应理论多侧面Rasch模型的分析[28]

banner"

（一）研究目的

本研究采用多侧面Rasch模型，对28位评分员在运用《量表》进行托幼机构教育质量评价中的评分员偏差进行了分析，一来为培训评分员、修订项目、提高测评的科学性提供佐证；二来为使用项目反应理论（IRT）探讨托幼机构教育质量评价的测量学属性（psyetricproperty）拓展思路。

（二）概念框架

经典Rasch模型考虑被评价对象和评价项目两个变量对测评结果的影响。

[29]多侧面Rasch模型[30]认为除这两个影响因素外，还受评分员等测评情景变量的影响。

多侧面Rasch模型将这些影响因素或变量称为测量侧面。

多侧面Rasch模型的一般表达式为：

Pnijk是受评者n在项目i上被评委j评定为k等的概率；

Bn是受评者n的能力参数（n=1，2，…，N）；

Di是项目i的难度参数（i=1，2，…，L）；

Cj是评委j的宽严程度（j=1，2，…，J）；

Fk是分部评分模型（PartialCreditModel）中被试得分从k-1到k的等级难度，每个项目均有K级评分（k=1，2，…，K）。

多侧面Rasch模型提供每个测量侧面的参数估计值，估计标准误和fit值等。

fit值用于描述实际测评值与模型估计值差异的统计量。

具体而言，fit统计量包括infit和outfit，它们的计算公式分别为：

Z2ni表示受评者n在项目i上的标准化残差的平方；Wni为权重，其大小为项目i的方差；infit考虑了项目方差，受极端值影响小；fit值范围为（0，+∞）。

如果多名评分员对受评者测评结果相差很大或是过于一致性，fit值都会呈现这种差异。

实际测评时，不同评分员对同一受评者的评价意见不可能完全一致，总是会有一定的差异。

MFRM认为只要这个差异在某个正常范围内即可。

实际工作中，fit值具体采用哪个取值范围通常根据测评目的和需要来确定。

此外，多侧面Rasch模型还可以进行偏差分析，即估计两侧面间的交互作用是否存在显著偏离模型估计值的评分，以此来分析评分员在各侧面的评分差异问题。

例如评分员与班级的偏差分析，指分析评分员与班级的交互作用是否存在显著偏离模型估计值的评分，以此来判断评分员对班级的评分差异。

MFRM软件提供Z值进行判断，Z值为模型期望值与实际观测值间差异的logits值除以估计标准误。

当Z的绝对值大于2时，则认为差异显著，[31]说明评价结果存在较大分歧。

多侧面Rasch模型相比CTT和GT具有一些独特的优势，比如，它可从评分员层面对评分员宽严程度、评价一致性以及各侧面间的交互作用等进行分析。

[32]鉴于此，我们尝试用多侧面Rasch模型对托幼机构教育质量评价的评分员偏差进行相关分析。

（三）研究方法

1.样本

抽样幼儿园班级来自我国东部某省。

本章未完，请点击下一章继续阅读！若浏览器显示没有新章节了，请尝试点击右上角↗️或右下角↘️的菜单，退出阅读模式即可，谢谢！