云题海 - 专业文章范例文档资料分享平台

当前位置:首页 > 基于GPCM模型的按a分层法的CAT终止规则比较(第三稿)改

基于GPCM模型的按a分层法的CAT终止规则比较(第三稿)改

  • 62 次阅读
  • 3 次下载
  • 2025/7/1 13:43:07

相同,更能体现测验的公平性,测验的效率更高。

对于以上两种CAT终止规则,各有优缺点,我们下面为这两种CAT的测验在a分层下分别设置不同的各层结束规则。 2.6.1 定长CAT各层的终止规则

对于定长测验,由于测验长度固定,如果采用按a分层法作为CAT的选题策略,则对各层选择的题数如何确定呢?常采用的办法是各层的选取的项目数相同。如在本文中假设测验长度固定为20,按a分层时将题库分成4层,则每层的选择的题目数都为5题,简记各层调用题数的比例为1:1:1:1。

2009年,程莹、张华华等对a分层法选题时,分别对各层选择的题目数不相等时进行比较,结果发现,当各层选择的项目数逐渐增加时,测验效率会增加,但项目曝光率更不平衡;当各层选择的项目数逐渐减少时,测验效率降低,但项目曝光更加平衡。当然,程莹、等采用模型是在0-1双岐模型下得到的,对于多级模型下,特别是对于GPCM模型下该方法的效果如何,将是本文主要要讨论的。

所以,我们也在GPCM模型下,对于按a分层下各层选择的项目数也取不同的值。

①各层项目选取的数量按逐层增加,还是取固定长度20,分4层,则第一~第四层选取的项目数分别为2、4、6、8,简记各层调用题数的比例为2:4:6:8;

②各层项目选取的数量按逐层减少,还是取固定长度20,分4层,则第一~第四层选取的项目数分别为8、6、4、2,简记各层调用题数的比例为8:6:4:2。

2.6.2 不定长CAT各层的终止规则

对于不定长的CAT测验,主要是根据被试达到测验精度来结束,常用用的办法是根据测验信息量达一定值来结束(常取25)。在按a分层法中,实施题库分层后CAT的各层终止规则如何制定呢?文剑冰、侯杰泰分别对各层完成的信息量的比例为1:1:1:1、1:2:3:4和4:3:2:1

13

进行的比较,结果发现4:3:2:1效果更好。 因为验测信息量受a值的平方值的影响较大,所以各层的信息量应是不均匀的,当前大多按a分层法对各层的终止规则大多常用如下方法。 2.6.2.1 常用的各层信息量划分方法(简称不定长a-STR终止规则1) 因为验测信息量受a值的平方值的影响较大,所以各层的信息量应是不均匀的。若假设累计到第K层的的信息量为Ik,它应是K的二次函数,将被分的层数做为自变量,为了保证测验最终达到信息量,信息量的划分还应与测验信息总量的大小有关。假设测验信息量共分为T层,则各层的累计信息量可用如下公式: [4]Ik?I总?kT? (2-4) 2假设将信息量设为25(即标准误控制在0.2之内),层数设为4层时,即试题库中a值介于[0.2-0.775]的设为第一层,试题库中a值介于(0.775-1.35]的设为第二层,试题库中a值介于(1.35-1.925]的设为第三层, 试题库中a值介于(1.925-2.5]的设为第四层。再根据公式(4-1)可计算出各层的累计信息量如下: I1?1.5625,I2?6.25,I3?14.0625,I4?25 在被试做答过程中,开始选择第1层的项目做答,在当前的被试估计能力的累计的信息量大于1.5625后,则开始选择第2层的项目做答;当估计被试能力的累计信息量大于6.25后,则开始选择第3层的试题;以此类推,当累计信息量大于或等于25时,结束被试做答,以这时得到的能力值做为最终的估计能力。 2.6.2.2 新的各层信息量比例划分方法(简称不定长a-STR终止规则2)

14

所以本文中提出了以下各层信息量划分方法,该方法除了考虑区分度的平方对信息量的影响外,还考虑了各层项目的区分度的平方和对项目均匀性的影响,具体操作如下: 被试从第K层进入第K+1时,被试累加的信息量应达到如下式: mIk=I总·(?ai?12in)(k=1,2,…T) (2-5) 2j?aj?1其中Ik表示第k层累加的信息量,m表示从第1…k层所有的项目数,n表示题库中所有的项目总数。 3. CAT设计过程 3.1 计算机模拟程序的流程 计算机模拟程序采用Visual C编写,所产生的题库中的能力参数、步骤参数、区分度参数由matlab7.0产生并保存为.txt格式。整个模拟程序流程图如: 15

从数据文件中读出能力参数、步骤参数、区分度参数 计算分布函数F For i=1 to Nθi为被试能力真值 while选题个数<=2 Y N 随机选题 模拟作答 全为0或全为Y N 估计能力初根据选题策略选择项根据被试作答情况估计能N 是否结束当前层 Y 进入下一层选题 达到测验终止条件 保存所得的被试的能力估计值,开始下一个被试做答,直至所有被试完成计算各评价指标 16

  • 收藏
  • 违规举报
  • 版权认领
下载文档10.00 元 加入VIP免费下载
推荐下载
本文作者:...

共分享92篇相关文档

文档简介:

相同,更能体现测验的公平性,测验的效率更高。 对于以上两种CAT终止规则,各有优缺点,我们下面为这两种CAT的测验在a分层下分别设置不同的各层结束规则。 2.6.1 定长CAT各层的终止规则 对于定长测验,由于测验长度固定,如果采用按a分层法作为CAT的选题策略,则对各层选择的题数如何确定呢?常采用的办法是各层的选取的项目数相同。如在本文中假设测验长度固定为20,按a分层时将题库分成4层,则每层的选择的题目数都为5题,简记各层调用题数的比例为1:1:1:1。 2009年,程莹、张华华等对a分层法选题时,分别对各层选择的题目数不相等时进行比较,结果发现,当各层选择的项目数逐渐增加时,测验效率会增加,但项目曝光率更不平衡;当各层选择的项目数逐渐减少时,测验效率降低,但项目曝光更加平衡。当然,程莹、等采用模型是在0-1双岐模型下得到

× 游客快捷下载通道(下载后可以自由复制和排版)
单篇付费下载
限时特价:10 元/份 原价:20元
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
VIP包月下载
特价:29 元/月 原价:99元
低至 0.3 元/份 每月下载150
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信:fanwen365 QQ:370150219
Copyright © 云题海 All Rights Reserved. 苏ICP备16052595号-3 网站地图 客服QQ:370150219 邮箱:370150219@qq.com