当前位置：首页 > 基于GPCM模型的按a分层法的CAT终止规则比较（第三稿）改

基于GPCM模型的按a分层法的CAT终止规则比较（第三稿）改

62 次阅读
3 次下载
2025/7/1 13:43:07

相同，更能体现测验的公平性,测验的效率更高。

对于以上两种CAT终止规则，各有优缺点，我们下面为这两种CAT的测验在a分层下分别设置不同的各层结束规则。 2.6.1 定长CAT各层的终止规则

对于定长测验，由于测验长度固定，如果采用按a分层法作为CAT的选题策略，则对各层选择的题数如何确定呢？常采用的办法是各层的选取的项目数相同。如在本文中假设测验长度固定为20，按a分层时将题库分成4层，则每层的选择的题目数都为5题，简记各层调用题数的比例为1:1:1:1。

2009年，程莹、张华华等对a分层法选题时，分别对各层选择的题目数不相等时进行比较，结果发现，当各层选择的项目数逐渐增加时，测验效率会增加，但项目曝光率更不平衡；当各层选择的项目数逐渐减少时,测验效率降低，但项目曝光更加平衡。当然，程莹、等采用模型是在0-1双岐模型下得到的，对于多级模型下，特别是对于GPCM模型下该方法的效果如何，将是本文主要要讨论的。

所以，我们也在GPCM模型下，对于按a分层下各层选择的项目数也取不同的值。

①各层项目选取的数量按逐层增加,还是取固定长度20，分4层，则第一~第四层选取的项目数分别为2、4、6、8，简记各层调用题数的比例为2:4:6:8；

②各层项目选取的数量按逐层减少,还是取固定长度20，分4层，则第一~第四层选取的项目数分别为8、6、4、2，简记各层调用题数的比例为8:6:4:2。

2.6.2 不定长CAT各层的终止规则

对于不定长的CAT测验，主要是根据被试达到测验精度来结束，常用用的办法是根据测验信息量达一定值来结束(常取25)。在按a分层法中，实施题库分层后CAT的各层终止规则如何制定呢？文剑冰、侯杰泰分别对各层完成的信息量的比例为1:1:1:1、1:2:3:4和4:3:2:1

进行的比较，结果发现4:3:2:1效果更好。因为验测信息量受a值的平方值的影响较大，所以各层的信息量应是不均匀的，当前大多按a分层法对各层的终止规则大多常用如下方法。 2.6.2.1 常用的各层信息量划分方法（简称不定长a-STR终止规则1）因为验测信息量受a值的平方值的影响较大，所以各层的信息量应是不均匀的。若假设累计到第Ｋ层的的信息量为Ik，它应是Ｋ的二次函数，将被分的层数做为自变量，为了保证测验最终达到信息量，信息量的划分还应与测验信息总量的大小有关。假设测验信息量共分为T层，则各层的累计信息量可用如下公式： [4]Ik?I总?kT? （2-4） 2假设将信息量设为25(即标准误控制在0.2之内)，层数设为4层时，即试题库中a值介于［0.2-0.775］的设为第一层，试题库中a值介于(0.775-1.35］的设为第二层，试题库中a值介于(1.35-1.925］的设为第三层, 试题库中a值介于(1.925-2.5］的设为第四层。再根据公式（4-1）可计算出各层的累计信息量如下： I1?1.5625,I2?6.25,I3?14.0625,I4?25 在被试做答过程中,开始选择第1层的项目做答,在当前的被试估计能力的累计的信息量大于1.5625后,则开始选择第2层的项目做答;当估计被试能力的累计信息量大于6.25后,则开始选择第3层的试题;以此类推,当累计信息量大于或等于25时,结束被试做答，以这时得到的能力值做为最终的估计能力。 2.6.2.2 新的各层信息量比例划分方法(简称不定长a-STR终止规则2)

所以本文中提出了以下各层信息量划分方法，该方法除了考虑区分度的平方对信息量的影响外，还考虑了各层项目的区分度的平方和对项目均匀性的影响，具体操作如下：被试从第K层进入第K+1时，被试累加的信息量应达到如下式： mIk=I总·（?ai?12in）（k=1,2,…T） (2-5) 2j?aj?1其中Ik表示第k层累加的信息量，m表示从第1…k层所有的项目数，n表示题库中所有的项目总数。 3. CAT设计过程 3.1 计算机模拟程序的流程计算机模拟程序采用Visual C编写，所产生的题库中的能力参数、步骤参数、区分度参数由matlab7.0产生并保存为.txt格式。整个模拟程序流程图如： 15

从数据文件中读出能力参数、步骤参数、区分度参数计算分布函数F For i=1 to Nθi为被试能力真值 while选题个数<=2 Y N 随机选题模拟作答全为0或全为Y N 估计能力初根据选题策略选择项根据被试作答情况估计能N 是否结束当前层 Y 进入下一层选题达到测验终止条件保存所得的被试的能力估计值，开始下一个被试做答,直至所有被试完成计算各评价指标 16

搜索更多关于：基于GPCM模型的按a分层法的CAT终止规则比较（第三稿）改的文档

版权认领

下载文档10.00 元 加入VIP免费下载

推荐下载

本文作者：...

共分享92篇相关文档

文档简介：

相同，更能体现测验的公平性,测验的效率更高。对于以上两种CAT终止规则，各有优缺点，我们下面为这两种CAT的测验在a分层下分别设置不同的各层结束规则。 2.6.1 定长CAT各层的终止规则对于定长测验，由于测验长度固定，如果采用按a分层法作为CAT的选题策略，则对各层选择的题数如何确定呢？常采用的办法是各层的选取的项目数相同。如在本文中假设测验长度固定为20，按a分层时将题库分成4层，则每层的选择的题目数都为5题，简记各层调用题数的比例为1:1:1:1。 2009年，程莹、张华华等对a分层法选题时，分别对各层选择的题目数不相等时进行比较，结果发现，当各层选择的项目数逐渐增加时，测验效率会增加，但项目曝光率更不平衡；当各层选择的项目数逐渐减少时,测验效率降低，但项目曝光更加平衡。当然，程莹、等采用模型是在0-1双岐模型下得到

基于GPCM模型的按a分层法的CAT终止规则比较（第三稿）改

相关文档

相关推荐