计算机自适应测验

2024-09-30

计算机自适应测验(通用5篇)

计算机自适应测验 篇1

摘要:计算机自适应认知诊断测验 (computerized adaptive testing with cognitive diagnosis, CD-CAT) 是计算机自适应测验 (computerized adaptive testing, CAT) 的改进和拓展, 不仅关注对被试者整体测试评估的能力, 还关注被试者潜在的知识结构状态和技能。CD-CAT同CAT的选题策略一样, 在整个测验过程中起着至关重要的作用。

关键词:认知诊断,CD-CAT,选题策略

在相当重视教育的今天, 为了使教师、家长能够了解学生的知识结构体系和技能的掌握情况, 再制定补救措施和改进教学方法, 更好的“因材施教”。因此研究者们将认知诊断理论作为新一代测验的理论, 提出了一种更智能化的新型测验—CD-CAT, 是认知心理学、现代测量学、人工智能、模式识别及计算机科学相结合的产物。CD-CAT测验能够提供更详细的信息, 也更加符合测量的实际情况, 因此能够更好为教师教学和学生学习提供科学依据。

1 CD-CAT选题策略

选题策略的好坏不仅影响着测验最终结果的好坏, 还影响着选题速度的快慢和测验长短等问题。目前, 已经有很多研究者对选题策略进行了大量的研究, 就选题策略做如下的总结。

1.1 经典选题策略

(1) 相对熵选题策略 (Kullback-Leibler, KL) 。

KL是对两个概率分布差别的非对称性的度量, 当两个概率分布相差很大时, 得到的相对熵也越大。随着研究的深入, Xueli Xu在CD-CAT的选题策略中修改了KL信息量, 计算被试在项目上期望得分分布的相对熵, 进一步刻画项目的区分能力。而下一题的选择标准是根据得出的相对熵情况来选择信息量最大的项目, 让被试者继续作答。

KL在统计上可以有效地根据计算项目的KL值来区分被试者的真实的和估计的知识结构状态, 但是在实际情况中, KL策略是对所有属性进行计算, 并且被试者的真实知识结构状态是未知的, 因此很难确定。

(2) 香农熵选题策略 (Shannon Entropy, SHE)

香农熵是主要用来衡量随机变量不确定性的指标。香农熵的值越大, 说明随机数不确定性也就越大。SHE就是用被试后验分布的香农熵来刻画项目区分被试知识状态的能力, 并选用Shannon熵最小的项目作为下一题给被试作答。在CD-CAT的选题策略中, 对于被试通过每一步的自适应选题, 可以反应出被试的潜在特质

SHE策略的目标是选择下一个项目, 使得知识状态的后验分布的不确定性尽快减少, 然而SHE是一种只往前考虑一步的规则, 可能在选择下一题后, 其后验分布的不确定性又有所增加。

(3) 增益分数选题策略 (Utility Score)

Collins等人首先提出了一个与项目反应理论中的区分度比较类似的概念—增益分数, 并把它引用到贝叶斯网络模型中, 之后Millán等人在Collins的U值基础上进行改进, 提出了加权增益分数, 此得益分数计算的是敏感度和特异性的加权和。

Millán提出的增益分数比较适合于贝叶斯网络模型, 加权增益分数倾向选择包含不确定的属性的项目, 还可能选择仅含已经确定下来的属性的项目给被试者进行测试, 这种测试没太大的意义。

1.2 其它选题策略

除了经典的选题策略外, 还有很多, 例如, 余丹、潘奕娆等人提出了一种改进的极大化整体判别认知诊断模型信息量指标法, 这种方法既能满足属性平衡, 又能有效处理相似属性。以及汪文义在其硕士论文中提出的最大期望信息量选题策略 (MEIS) , 很好地解决了对于后验率相似的多个知识状态的选择问题。除此以外还有很多混合型策略, 比如, 杜宣宣在硕士论文中提出的, 将基于项目反应理论的极大信息量方法与基于认知诊断的香农熵选题方法相结合的混合方法, 很好地兼顾了在选题时被试者的能力估计和被试者知识状态的判断问题。

2 新选题策略的研究方向

在CD_CAT系统发展的过程中, CD_CAT选题策略也在不断的发展和改进。新选题策略的研究方向将包括以下几种情况:

(1) 测验精度与速度问题。随着各领域应用的不断扩大, 测验系统中所包含的题库数量越来越多, 如果同时使用系统的人数较多时, 会在一定程度上降低选题的速度, 进而影响被试者的心理状态, 长时间的等待容易产生焦虑、恐慌等问题, 最终有可能影响测验的精度。不但如此, 题型的丰富多样也会带来测验精度和速度的不平衡。到底该如何编制质量较高的测验项目, 来同时增加诊断测验的精度与提高选题的速度是要进一步探索的方向。

(2) 可达阵对CD-CAT选题策略的进一步探讨。丁树良等人证明了测验蓝图中包含可达阵是“使诊断测验在理想反应条件下不产生对知识状态的误判”的充要条件。但是在CD-CAT中, 到底如何有效地计算出可达阵R, 并且采取何种方法才能让每个被试接受的部分项目准确有效地对应于可达阵R中的列, 以及测验蓝图中包括多少可达阵可以使测验精度达到最高都是有待进一步探讨的问题。

(3) 认知诊断模型的选择。随着认知学的快速发展, 国内外开发出了许多用于测验的认知诊断模型, 但是选择哪一种诊断模型才能使选题策略更具有普遍性?也是值得关注的一个问题。

除了这些之外, 对于可变长的认知诊断策略还需详细深入的研究。

3 总结

本文首先总结了CD-CAT经典的选题策略, 以及一些新出现的混合策略, 并对新选题策略的研究方向进行了简述, 希望能给其他研究者带来方便和一些帮助。目前, 大多数CD-CAT还处于模拟研究阶段, 开发出真实的CD-CAT测验系统, 并投入使用还需很长的路要走, 还需要众多研究者的共同努力。

参考文献

[1]马海瑛.计算机自适应考试系统研究与实现[D].[硕士学位论文].长春:东北师范大学, 2011.

[2]余丹, 潘奕娆, 丁树良, 杨庆红.计算机化自适应诊断测验新的选题策略[J].江西师范大学学报:自然科学版, 2011, 35 (5) :548-550.

[3]杜宣宣.具有认知诊断功能的计算机自适应测验的选题策略研究[D].[硕士学位论文].江西:江西师范大学, 2010.

计算机自适应测验 篇2

表1 三个测验的描述性分析M(SD)

中小学生适应能力测验

100.11(2.67)

中学生人际交往能力测验

27.61(.67)

学习动机测验 20.82(1.10)

从表1可以看出南泉初级中学校的留守儿童整体适应能力较强,人际交往能力较好、学习动机一般,但是适应能力的分散程度很高,其次是学习动机,而人际交往能力比较集中。

表2 三个测验总分的频数分析

范围 频数 百分比

中小学生适应能力测验

90分及以下 91~120

121及以上

中学生人际交往能力测验 24及以下

25~29

30~36

学习动机测验

15及以下

16~24

25及以上 9 32.1%17 3 5 13 10 6 13 28.6% 60.7% 10.7% 17.9% 46.4% 35.7% 21.4% 46.5%

从表2 看出,南泉初级中学的留守儿学生整体适应性较好,有10.7%的留守学生具有很强的适应性;人际交往能力整体性较好,有35.7%的留守学生具有很好的人际交往能力;但是在南泉初级中学有21.4%的留守学生学习动机很弱,而有32.1%的留守学生具有很强的学习动机。

表3 三测验总分的性别差异比较M(sd)

测验 适应能力测验 人际交往测验 学习动机测验

df 26 26

t-.46-1.53-1.80

p.467.138.083

Md-2.57-2.05-3.90

98.55(13.19)101.12(15.04)26 26.36(3.80)28.41(3.22)18.45(5.32)22.35(5.75)

从表3可以知道,南泉初级中学的留守学生的适应能力、人际交往能力、学习动机在性别上没有显著的差异。

表4 三测验总分积差相关

适应能力测验 人际交往测验

.476 *

.451 *

.448 *

人际交往测验 学习动机测验

注: * 代表.05水平

计算机自适应测验 篇3

考试或测试是学校教学过程中的一个重要环节,是检验教学质量的重要手段之一,在工作及日常生活中比比皆是。考试是对社会个体掌握人类知识与发展相应能力的状态与水平进行测量的社会活动[1],是根据教育内容和目标,按照一定的方式选择有代表性的问题与内容,对应试者的技能、知识等进行测量和评价的过程[2],具有评价、诊断、补救及决策功能,也是培养和选拔人才的重要手段。随着时代的推移和社会的发展,考试的弊端逐渐显现,早期设立的考试制度或方法在许多方面已不能完全适应现在的要求。目前的考试大多数是采取同一次考试中在相同时间内完成相同内容的考试形式,即基于经典测量理论的定长考试。这种方式在实践过程中暴露出很多的缺点及不足:如对能力低的考生,如果项目的难度太大,则考生难以正确解答,因而考生只好猜题;如果将太容易的题目给能力高的考生施测,则难以准确地测出其能力水平,还有可能因疏忽大意而失分导致测量误差的扩大。随着计算机的出现和信息技术及网络技术的高速发展,考试的手段和方法发生了革命性的变化,而计算机化自适应测验就是解决上述问题的有效手段之一[3]。计算机化自适应测验(Computerized Adaptive Test,简记为CAT)是指基于项目反应理论的指导,把计算机技术与测量技术相结合的考试形式。在自适应测验中,对每个被试而言,不同能力水平的被试施测难度不同的项目,所测的项目既不太难也不过于容易,系统会根据被试的不同能力水平,选择一组最适合于测量被试个体特质水平的项目对被试进行施测,使测试结果能最大限度地反应被试的能力水平。因而能对所有特质水平上的被试能力提供相同精度的测量,由此对其能力水平进行更精确的度量,真实反映他们的实际水平。

1 CAT流程

计算机化自适应测验CAT是指在以IRT为基础建立的题库之上,不断地根据被试的反应(答题)情况及项目的各方面信息估计其能力,再从题库中选取最适合被试当前能力的项目对其进行施测,直至达到预定的测试精度要求,即可结束测试。整个测试过程分为两个阶段:

1.1 被试初始能力确定阶段

因为对被试施测的项目是根据被试的当前能力值来决定的,所以测试开始时,必须知道被试的能力值。本系统采用的是步长法。

1.2 能力精估阶段

由于能力探查阶段施测项目较少,获得的信息量也少,能力值计算粗糙,因此估计结果不准确,必须继续施测项目,以增加信息量,修正能力估计值。本系统采用的是按相应的选题策略继续施测项目,当满足预定的终止规则即结束。

2 系统选用的能力估计方法

CAT顺利施行的前提是能正确估计被试的能力。常用的方法有近似估计法、条件极大似然估计法及贝叶斯最大后验估计法,以下仅介绍本系统涉及的方法。能力精确估计可采用贝叶斯估计方法,它由贝叶斯定理得到。该方法设未知参数θ对样本X的后验分布为h(θ|X),若存在θ的一个估计值,使=E(θ|X),则称为θ的一个条件期望估计,亦称贝叶斯最大后验均值估计[4]。

式(1)中,q为结点数,BILOG推荐使用项目数量的平方根的两倍;A(Xk)是结点Xk的权。

EAPE法的优点是可以对所有作答模式进行能力估计且不需要迭代;缺点是要先获得考生能力先验分布。由于先验分布是富含信息的,如果人为地指定先验分布,可能又与真实先验不符,使被试能力均值有向先验分布均值压缩的倾向,进而导致能力估计不准确。本系统的能力精估阶段选用了该方法。

3 CAT选题策略

选题策略是指从题库中选择施测项目的方法,目前常用的选题策略有极大信息量选题法、按a分层、按b分层及按c分层选题法等方法。本文采用了朱隆尹[5]等提出的按选题系统选题法,其基本思想是:

(1)按计算题库中所有项目的选题系数;

(2)将题库中的n个项目按选题系数从小到大排序后划分为n/m(m为每个部分的项目数)个部分,即把第1(选题系数最小的题)至第m个项目划分为第一部分,第(m+1)至第(2m)个项目划为第二部分,以此类推,……,把所有项目划分成n/m个部分;

(3)将(2)中得到的各部分中的项目按区分度值重新升序排列,然后按序把每一部分的项目划分为k层。即区分度最小的m/k个项目归为题库的第1层,区分度次小的m/k个项目归为第2层,…,区分度最大的那些项目归为第k层;

(4)根据预先制定的分层终止规则,当测验进行到第i部分时,从题库的第i层中选取选题系数与被试当时能力最接近的项目对被试施测;

(5)重复步骤(4)(i=1,2,…,k)直到满足测验终止的标准为止。

特别地,当c=0(猜测度为0)时,此时θmax=bi,按选题系数分层法就变成按b分层法,也即这时按b分层可看成是按选题系数分层的一个特例。

4 终止规则

本系统使用的是陈德枝等提出的终止规则:

假定测验总信息量设定为INF,题库中所有项目分为k层(阶段或子题库),则:

其中Ik表示第k个层应完成的信息量。

5 系统的功能设计

表示层和用户界面层位于学生、教师及管理员的计算机上,事务服务层位于Web服务器及应用服务器上,数据服务层位于数据库服务器上[6,7]。这种结构有利于考试系统的开发、系统的负载平衡和系统的维护,同时也保证了信息安全。系统结构模型如图一所示:

面向对象的类设计是一种能够有效地帮助程序开发人员降低程序复杂度的设计方法,将现实世界的对象实例,提取并设计成不同的对象,转变为应用程序所要解决的问题。建立对象模型是面向对象开发方法的基本任务,也是开发软件系统的基础。使用UML中的对象图(Object Diagram)与类图(Class Diagram)可以较好地表达对象模型的静态结构,是对现实世界的一种抽象,目的在于帮助开发人员更好地开发程序,有效地建立专业领域的计算机系统对象模型。根据功能需求分析,本系统共设计了24个类,系统的所有信息管理及相关操作均由这些类来实现;采用关系模型转换为关系模型数据库表,共有15个表。系统包括的主要子系统有:

(1)用户管理子系统

此模块是系统的入口,功能是验证用户信息后用户登录,用户包括学生、教师、考务管理员及题库管理员。因为系统管理员是负责整个系统的设置及管理,所以为系统管理员设计单独的入口。

(2)考务管理子系统

考务管理员登录后,进入考务管理页面,可完成对科目信息进行维护、对教师的任课信息进行维护和设置、对班级的选课信息进行维护、安排考试信息等,完成每门科目考试时的基本设置,如允许最长考试时间、最大题数、要求的信息量等相关信息。

(3)题库管理子系统

可以完成试题导入、导出、题库组织分层及试题信息维护功能。题库是大量具有必要参数的高质量试题的有机结合,根据项目反应理论可知,它是不依赖于样本的,应具有开放性好、使用效率高及灵活性强、用户量大等特点。

(4)考试子系统

此模块是本系统的另一个重要部分,主要功能包括能力估计、选题、终止考试及审核考试信息。学生可完成能力测试,并能显示相应的考试信息,同时学生可通过此界面完成考试安排查询、学生成绩查询及个人信息维护等功能。

6 结束语

本系统以高校计算机相关课程的自适应测验为例而设计开发,实现了在线测试、用户基本信息的管理、学生成绩查询、统计及题库组织等功能,提供了一个较客观、高效的测试平台,教师可根据此结果对后续的教学进行调整及选择,为提高教学的效果起到促进作用。由于开发时间较短,所以实际应用还未进行。为了测试本系统的运行情况,也希望通过测试获取关于学生的相关特质水平数据,并与他们平时的水平做对比,以验证测试算法的正确性,因此选择了小范围即学生进行测试。测试课程为《计算机基础》,测试题量为2000题,将他们的该课程考试成绩(传统笔试)与本次测试的结果进行对比,可以看出,测试结果与学生平时的特质水平基本一致,但也有小部分的测试结果与实际学生的能力水平不相符,这主要是由于前期测试题量较少、项目参数不准确所造成的;同时也发现测试结果比原来的笔试成绩明显提高,其原因有两个:一是测试试题不相同,二是学生经过一年多的学习,知识水平有所提高。

参考文献

[1]漆书青.现代测量理论在考试中的应用[M].武汉:华中师范大学出版社,2003.

[2]黄光扬.教育测量与评价[M].上海:华东师范大学出版社,2002.

[3]李广州,等.网络中的化学自适应测验系统的研制[J].考试研究,2006,(8):46.

[4]付聪.计算机自适应测试研究进展[J].现代情报,2005,(1):61.

[5]朱隆尹,丁树良,王茜娟.不定长CAT区分度分层终止规则研究[H].心理学探新.2008,(4):80.

[6]王石.精通Visual C#2005语言基础、数据库系统开发、Web开发[M].北京:人民邮电出版社,2007.

计算机自适应测试研究进展 篇4

1 计算机自适应系统的优点

1.1 使评测过程具有灵活性

由于计算机自适应系统出题时, 是根据应试者的自身掌握的知识水平进行试卷的生成, 这就可以做到题目都是应试这能力范围之内的, 有效的避免了被应试者在考试过程中, 因为题目难度不在自己能力范围之内, 而导致答题节奏不稳, 情绪上产生较大波动影响其他题目的发挥。因为是根据应试者本身水平出题, 可以更大程度上帮助测试方了解应试者的综合水平, 在测试过程中具有相应的灵活性。

1.2 提高了测试结果的精确度

由于传统的出题方式, 并不能很好的区分题目的难易程度, 因为出题者对题目都是掌握的, 所以对题目的难易程度很难作出准确的判断, 并且调整其在试卷中的比例。这就导致了对应试者自身能力测量的一个不准确性。计算机自适应系统可以根据应试者自身水平调整难易程度, 这样无论应试者的成绩如何, 都能对其能力有一个准确的判断。是测试结果具有较高的精确度。

1.3 避免作弊情况

由于计算机自适应系统是随机出题, 考生在考试时也是随机抽题, 所以可以有效的避免, 应试者在考试过程中作弊的情况。由于应试者抽到相同试卷的概率很低, 是考场内交头接耳作弊的情况也得到了抑制。

2 计算机自适应系统的发展过程

计算机自适应系统的前身是“比内测试”, 这一种测试模式是根据被测试者的年龄来为其选择专门相对的题库, 如果被测试者完成这一题库的测试, 将会对其进行难度更大的测试, 这一个过程就是一个人工版本的子算计自适应系统。后来经过教育学家的不断研究, 并且对比内测试进行不断地分析, 终于发明了以回答问题的错误率作为标准来评判应试者水平的测试方法。

随着计算机水平的发展, 美国科学家罗德首次提出了计算机自适应系统的概念。这个观念已经提出就意味着试卷考试时代的结束。并且因其具有很多传统测试模式所不具备的优点, 迅速的得到了社会各界的认可。

经过不断地对计算机自适应系统的发展和完善, 已经从单一的了解应试者的能力演变成了一个对应试者综合能力以及各项能力指标进行评判的过程。

3 计算机自适应系统的使用现状

3.1 在国外的使用情况

目前计算机自适应系统在国外尤其是欧美国家得到了极其广泛的应用, 而且应用的范围非常广。教育测试、职业测评、人事管理等方面全都采用了计算机自适应系统用, 甚至在认证测评和职业测评中也应用了计算机自适应系统。

3.2 在国内的使用情况

由于计算机自适应系统进入我国的时间较晚, 所以我国目前对其应用的范围不如欧美国家广。我国主要研究计算机自适应系统的专家基本都在英语四六级考试委员会。目前我国对计算机自适应系统的重视程度很高, 已经将计算机自适应系统应用到了汉语水平测试当中, 随着出题的更加合理化和灵活性, 已经受到了很多业内的认可, 被应用到更广的范围只是时间问题。

3.3 在高校中的发展情况

目前计算机自适应系统在高校的发展中也取得了不小的成就, 我国部分大专院校, 对学生进行计算机能力水平测试时, 都是采用计算机自适应系统, 根据被测试者的综合水平进行出题。

4 选题策略的研究

4.1 提取法

在以前的题目区分方式上加以改进, 将题目分为两类, 即普通和难度较大两类, 如果应试者完成了较简单的一类题目, 此时才会给其提供难度较大的题目, 这样即可以避免能力不够者无法完成较难的题目, 也可以节省出题的时间和题库资源。

4.2 抽样法

抽样法是一种节约题库资源的方法, 具体抽样的过程是, 先从题库中抽取一小部分题目, 在从这一小部分中随机抽取一道难度较大的题目, 然后在从题库中抽取除这一小部分题目之外的题目, 这样可以给题目做出一种随机的组合, 可以减少题目的曝光率, 并且可以全面利用题库中所有的资源。

4.3 分离法

在出题过程中, 有些代表性较高的题目, 出现的几率过高, 导致了这些题目的曝光。如果将题目的管理过程与题目的选择过程独立的区分开来, 这样使得二者之间尽量减少联系。这样可以平衡题库中题目的曝光率, 使得部分题目曝光率过高的现象得到控制。

5 结论

计算机自适应系统的目标是建立最好的、最全面的评测方案。对被测者进行综合的、准确的评估, 达到一个人才选拔目的。这种将计算机科学技术与现实考试相结合的评测方案, 对我国的人才选拔和人才水平评估起到了至关重要的作用。对我国的教育和人才培养的发展具有划时代的重大意义。人才作为一个国家发展进步的根本动力, 其选拔制度必须是先进的、科学的, 只有将计算机自适应系统应用到我国社会的更多领域当中去, 才能做到更科学的、准确的人才选拔和培养, 才能为我国的现代化社会主义建设把好人才选拔这一大关。

参考文献

[1]路鹏.计算机自适应测试若干关键技术研究[D].东北师范大学, 2012.

[2]李俊杰.基于技能空间的计算机自适应测试的研究[D].湖南大学, 2011.

[3]王鹏.基于项目反应理论的自适应测试选题策略研究[D].沈阳师范大学, 2013.

计算机自适应考试系统分析与设计 篇5

随着计算机技术的发展,人们利用计算机考试软件来辅助教师完成考试工作,以减轻教师工作负担,提高工作效率。但大部分考试系统的基本思想基于传统的经典测量理论(CTT)。在经典测量理论下,同一批能力水平不相同的考生要接受同一批题目的测试,这样测试的结果是:对水平低的考生来说,难度高的题目根本无法作答;对水平高的考生来说,难度低的题目测不出真实水平。实践证明,如果题目难度跟考生水平相适应,测验效果最好。基于项目反应理论的计算机自适应考试是根据测试者的能力水平自动选择与其能力水平相适应题目的个性化测试,能够弥补经典测量理论下考试的不足。

2. 基于项目反应理论的计算机自适应考试系统

2.1 项目反应理论

2.1.1 项目反应理论的概念

项目反应理论是在针对经典测量理论的局限性的基础上提出来的。项目反应理论又称为潜在特质理论。潜在特质是指被试某种相对比较稳定的、支配其对应的测验作出反应,并使反应表现出一致性的内在特征[1]。特质(能力)和项目(试题)是项目反应理论的核心概念。项目反应理论认为被试对某项目的正确反映概率与其能力之间遵循一定的函数关系,这样的函数关系可以用项目反应模型来表示。

2.1.2 项目反应模型

在众多的项目反应模型中,最具代表性的是伯恩鲍姆提出的逻辑斯蒂模型。逻辑斯蒂模型根据参数的不同分为单参数模型、双参数模型和三参数的模型。三参数的模型如下:

其中:D=1.702,θ表示受测者能力值,a表示题目对考生能力的区分度,b表示题目的难度,c表示题目的猜测系数,P(θ)表示能力为θ的人答对此题目的概率[2]。

从三参数模型可以看出三个参数和考生水平的高低对答对试题概率的影响,其中考生能力水平越高,答对试题的概率越大,而随着考生能力的增强,答对概率趋于1。

2.2 计算机自适应考试(CAT)概述

2.2.1 计算机自适应考试

在计算机自适应考试过程中,将根据每一道题目的回答情况进行计算,以得到与被试能力相应的能力估计值,并根据能力估计值,在题库中挑选出最适合被试能力水平的下一道试题进行测试。这样使考生能够接受适合自己的一批难度不同的题目,考试成绩更能准确客观地反映考生的实际情况,不会因为题目的难度差异或考生的偶然失误而对成绩有太大影响。

2.2.2 计算机自适应考试的施测过程

计算机自适应考试的施测过程分为两个阶段。

第一阶段:初步探查阶段,即测验刚开始的时候,设置一批探查性的题目,用来初步估计考生能力水平。执行的过程如下:首先从题库中抽取较接近被试的能力水平项目实施测试,如答对则抽取更难的试题;如答错则抽取更易的试题;当出现既有答对又有答错的情况时,初步探查阶段停止。

第二阶段:精确估计真值阶段。这时,挑选试题的原则一般是与初试者的能力水平相适应,从题库中挑选出能提供最大信息量的试题。

计算机自适应考试中有三个重要环节:能力初值估计、选题策略、终止规则[3]。

2.3 计算机自适应考试系统

计算机自适应考试系统能够根据考生的初始能力水平,自动地在试题库中抽取个性化初始测试项目进行测试,并根据考生的答题情况进行判断,抽取测试题目难度值与考生能力水平相适应的下一道测试题目进行测试,直到最后终止考试,并最终得到反映考生真实能力水平的结果。与传统的经典测验理论下的考试相比,测试能自动适应考生能力水平的具体情况,试题的难度、数量等可根据考生的特点而灵活变通。同时,系统能实现保存试卷功能,也提高了试卷批改的准确度和速度。本系统应该具备以下功能。

2.3.1 题目管理功能

完成计算机自适应考试题库的建立及维护。教师可以录入、修改、删除试题;确定题目所属知识点,录入的题目必须有经过计算或专家估计后确定的难度、区分度、猜测系数参数;可以修改题目参数、维护题目知识点信息。

2.3.2 知识点管理

根据课程特点,对课程知识内容进行分解和分类,将知识内容分解为一系列知识单元,然后细分为各知识点。对某个知识点测试的试题类型及试题数可以有很多。知识点管理包括知识点的添加、修改、删除。

2.3.3 考试过程管理

包括验证登录信息、设置初始能力值、抽题、能力值估计、考试终止管理、二次登录管理等。所有用户登录时要求输入账号和密码,执行登录操作。

2.3.4 用户管理

在本系统中,根据功能需要,涉及三类用户:管理员、教师和学生,他们在系统中的功能不一样。学生可完成报名、登录考试,阅读考试规则、抽取试题进行考试和结束考试的功能,管理员登录后可对系统进行用户管理、系统信息管理,可以增加删除用户、修改用户信息、分配和修改用户权限。教师登录后可以进行试题管理、设置考试基本信息、设置考生信息和成绩管理。

2.3.5 考务管理

设置考试科目的相关信息:考试时间、科目、地点、监考老师等;设置考试基本参数,如考试的最大题数、最大信息量和最长考试时间等。

通过以上功能的设计与实现,本系统能够快速地根据考生能力情况使各个考生能够接受适合自己的一批难度不同的题目进行考试和评分,使考试成绩能较准确客观地反映考生的实际情况,从而体现出考试的客观性与公正性。

3. 计算机自适应考试系统的设计

系统的设计要充分考虑系统的需求和设计目标,根据前面对计算机自适应考试系统需求分析的结果,对系统进行体系结构设计、功能结构设计和数据库设计。

3.1 系统的体系结构设计

本文主要针对在学校使用计算机自适应考试系统来设计,考试在局域网环境内进行,本系统采用三层C/S结构。三层C/S结构是将应用功能分成表示层、功能层和数据层三部分,并在逻辑上独立。数据层作为DBMS独立出来,表示层和功能层分离成各自独立的程序,两层间的接口简洁明了。

3.2 系统功能结构

根据计算机自适应考试系统的需求分析,根据系统目标将系统功能模块划分如下。

3.2.1 人员管理

3.2.1. 1 管理员管理。

系统管理员拥有所有系统操作权,可对系统管理员增、删、改。

3.2.1. 2 教师管理。

对系统中的教师进行管理,教师可以进行考生的报名管理(添加考生),考试安排,试题管理以及成绩的查询。

3.2.2 试题管理

3.2.2. 1 知识点管理。

根据课程特点,对课程知识进行分解和分类,将知识分解为一系列知识单元,然后细分为各知识点,进行题目知识点的增加、删除、修改。

3.2.2. 2 试题管理。

进行题目的增加、删除、修改,修改题目的参数信息、知识点信息。

3.2.3 考务管理

3.2.3. 1 考试管理。

对考试进行管理,设置、修改和删除考试的相关信息。如考试编码、考试科目、考试时间、考试班级、考试的最大题数、最大信息量、最长考试时间等。设置、修改和删除考场信息,如考试编号、考试科目、考试班级、监考老师、考试地点等。

3.2.3. 2 考生管理。

设置考试信息后,添加、修改、删除和查询考生信息(学号、姓名、班级、身份证号等)。如输入考生考号、姓名可查询当前考生考试状态。

3.2.3. 3 实时考试管理。

实时管理考试开始,考试结束,实时处理与记录考生与考场情况。

3.2.4 在线考试

3.2.4. 1 考生登录。考生登录考试系统,进行身份验证。

3.2.4. 2 在线考试。学生进入系统阅读考试规则,获得初始能力值,系统进行抽题,考生答题,根据答题结果进行考生能力值估计,判断是否满足结束条件,同时记录该考生考试题数、测试信息量和考试时间等信息,系统保存学生考试进度,以免异常造成考试信息丢失。

3.2.5 成绩管理

学生登录后,可查询本人的成绩;教师登录后可查询班级成绩,并可导出成绩。

3.3 数据库设计

根据计算机自适应考试系统的特点,结合系统需要采集的信息,考虑数据的冗余性、一致性和程序的复杂性,本系统设计的主要数据表如下:管理员信息表Admin、考生信息表Examinee、试题知识点表ExamPKB、试题表Subject、考试信息表Exam、考试考场信息表ExaminationRoom、考生试题信息表ExamineeSubject等。以下是各表的主要数据项:

3.3.1 管理员信息表Admin

:包括人员编号、人员名称、登录名、密码、人员类型等相关信息。

3.3.2 考生信息表Examinee:

包括考号、身份证号、姓名、年龄、性别、班级、联系电话、状态、考场号、考试时间、能力值、分数等。

3.3.3 试题知识点表ExamPKB:

包括知识点编号、知识点名称、所在章、所在节等知识点。

3.3.4 试题表Subject:

包括题目编号、题目内容、选项A、选项B、选项C、选项D、标准答案、试题所属知识点编号、难度值、区分度、猜测系数、能力值、试题抽中次数等相关信息。

3.3.5 考试信息表Exam:

包括考试编号、考试名称、考试时间、最大测试项目数、最大测验信息量、考试时长、考试状态。

3.3.6 考试考场信息表ExaminationRoom:

包括考场编号、考场名称、监考老师、考试地点。

3.3.7 考生试题信息表ExamineeSubject:

包括考生编号、试题编号、答案、答题结果、能力值、测试项目数、测验信息量等。

4. 结语

本文对计算机自适应考试系统进行了分析与设计。主要介绍了计算机自适应考试系统的相关理论,并对系统进行了功能模块的设计及数据库的设计。另外,在自适应考试系统中还应该考虑考试过程中能力值计算、考试终止、选题策略等算法的选择,不同的算法对系统运行速度的影响和对网络条件的要求不一样;还要考虑试题内容的均衡问题和题目的曝光率对考试结果的影响。

摘要:本文介绍了项目反应理论及计算机自适应考试系统的相关理论, 对计算机自适应考试系统的需求进行了分析, 并设计了功能模块及数据库。

关键词:项目反应理论,计算机自适应考试系统,系统设计

参考文献

[1]叶华乔.基于IRT的计算机化自适应考试研究[J].福建电脑, 2009, (12) .

[2]朱靖华李丽娟.基于项目反应理论的计算机化自适应考试系统的研究[J].科学技术与工程, 2008, (4) .

上一篇:管井降水的构造与施工下一篇:精英文化