教育测量与评价

2024-07-11

教育测量与评价（共10篇）

教育测量与评价篇1

一、引言

考试试题质量综合评估是教育测量学的一项重要内容, 它是改革教学、实行科学化教育管理的重要工具, 教育过程中的各项教育问题, 离开对考试试题质量的评价都无从谈起。经典教育测量理论有一整套评价试题质量的方法, 常用的数量化指标就有信度、效度、区分度和难度等, 然而, 从这些评价方法或评价指标本身来看, 它至少存在两个方面的缺陷:其一是现行的试题质量评价方法重在数量的测定, 即着重以数量化的标准客观地表示考试的特质, 评价结果过分依赖考试的质量以及学生的考试成绩。只有考试成绩真实, 考试组织得当, 对几个数量化指标的测算才是可靠的, 否则是不可信的。毋庸讳言, 因考试组织及评分标准不一致等方面的原因, 考试成绩不可避免的会存在误差, 有时这些误差会超出可容许的范围。如著名教育家斯太奇就曾做过这样一个实验, 他把同一份试卷复印142份, 请142位教师评分, 结果评分为35种, 从50分到98分, 因此, 在这种情况下, 仅仅依据学生考分来评估试题质量, 难免会有失偏颇。其二是现行评价方法所依赖的几个数量化指标的测算方法, 还可以做进一步改进, 如试题内容效度评价指标作为一个数量化指标目前尚无一种科学的测算方法。因此, 无论是教育管理者还是教师都有必要重新认识和评价经典教育测量理论中的试题质量评价指标。这些评价指标包括:测验的信度、效度、难度以及区分度。

二、对测验信度的评价

教育测验虽有不同类型, 但无论哪一种教育测验, 首先要求测验的结果可靠, 在教育测量学中称为测验的信度。信度是指测验结果的准确程度或可信程度。信度是反映测验稳定性和可靠性的指标, 表明信度大小的统计量叫做信度系数, 其最大值是1。一般是以两次测验结果间的相关程度作为信度指标, 它表明一个测验在反映受试者实际水平时的可靠程度。

估计信度的传统方法很多, 这些方法的共同特点是信度系数的测定完全依据于考试所取得的分数信息, 考试的实施顺利, 评分标准客观, 所计算出的信度系数才有一定的参考价值。常见的方法主要有:

1. 再测信度:

即用同一个测验, 对同一组被试前后两次施测, 两次测验分数之间的相关程度就是再测信度。再测信度的计算所要求的条件比较苛刻, 其一要求所测量的特性必须是稳定的且遗忘与练习的效果相同, 其二是要求施测期间被试的学习效果没有差别。然而, 实际上, 由于在两次测验之间要相隔一段时间, 因此很难保证上述条件得到满足, 这种方法所产生的测量误差也就不可避免。

2. 复本信度:

根据一组被试在两个等值测验上的得分计算的相关系数即为复本信度系数。复本信度的估计方法虽然可在一定程度上避免再测法的缺点, 但由于它需要编制等值的两份试卷, 其可操作性不强。

3. 分半信度:

分半信度是按正常的程序实施测验, 然后将全部试题分成相等的两半, 被试在这两半测验上的分数之间的相关系数即为信度系数。要计算分半信度, 首先遇到的问题是如何将测验分成两半。因此, 分半的合理性决定于信度系数的计算结果, 而且, 由于分半信度系数只能表示两半试题的等值程度, 所以它不能提供时间稳定性的信息。

4. 内部一致性信度:

内部一致性也称同质性, 指的是测验内部所有题目间的一致性。其常用的估计方法有库德-理查逊法和克伦巴赫系数法等, 具体计算公式从略。内在一致性信度的突出优点是对同一组被试只要施测一次就可以求出信度系数, 但其缺点也非常明显。实测中, 将一个测验分成内容、形式、题数、平均数、标准差、测验间相关、分布形态都相等的两部分实际上是很困难的。

5. 评分者信度:

考察评分者信度的方法是随机抽取部分试卷, 由两个或多个评分者独立按评分标准打分, 然后求其间相关。评分者信度的高低在一定程度上是评分质量的反映。当通过统计方法确信评估者之间评分有较大差异时, 需要分析原因, 及时加以弥补。显然, 评分者信度与其它几种信度系数概念不同, 其它几种信度皆为测验的信度, 而评分信度反映的是评分者之间对于同一组测验结果评定的一致性程度。

显然, 不论哪一种信度系数, 其估测结果的高低直接受测量误差的影响, 被试、主试、测验内容和施测环境等均能引起测量的随机误差, 导致分数不一致, 从而降低测验的信度。另外, 评分是否客观, 对测验的信度是有影响的。因为信度系数是根据实得分数的方差计算得到的, 若考试题目都属于客观性类型, 评分的标准明确, 要求严格, 评分不易受评分者主观判断的影响, 有助于测验信度的提高。但对于论文式测验或主观性试题, 各个评分者的度量标准不统一, 易受其他心理因素的影响, 致使评分不易客观, 信度没有保障。影响信度的其它因素很多, 如测验的长度、难度及测验的同质性等, 在此不再做一一阐述。

三、对测验效度的评价

任何一种考试, 要求考试的结果必须是可靠的, 这无疑是考试必备的质量要求。但是考试应具有信度并不是唯一的要求, 若一次考试结果虽然信度很高, 可测到所要测量的特征很少, 那么, 这一考试是不成功的。教育测量学中, 把测验结果能否准确地表明所要测量的特征或功能的程度, 称为测验的效度。效度是衡量测验质量最重要的指标, 它比信度有更重要的意义, 可信的测验未必有效, 而有效的测验未必可信, 因此, 在教育测量之前, 首先应考虑到究竟在多大程度上测量到了所要测量的特性或功能的问题。

由于测验效度的计算同样依赖于学生的得分等信息, 因此测验本身、测验的实施和被试心理状态、评分标准等对测验信度有影响的因素对效度也有影响, 此外, 如测验试题的难度, 试题的编排, 测验的长度等, 都是影响效度的重要因素。可以说, 测验的效度, 不仅受到随机误差的影响, 而且还受到系统误差的影响。

考察一个测验有效程度的途径主要有三个, 相应地也就把测验的效度分为三个类型, 这就是内容效度、构想效度和效标关联效度。鉴于构想效度及效标关联效度已有成熟的估测方法, 而且内容效度又是考察一个测验效度最广泛的应用途径, 因此, 以下只对内容效度的估测方法进行述评。

内容效度是指对欲测的内容或行为范围取样的适当程度。通俗地说, 它就是一个测验的覆盖问题, 即用于测量某一范围知识和能力的一个测验, 它所采用的那些题目是否充分代表了该范围内的基本知识与基本能力。一般来说, 一个测验要具备较好的内容效度应该满足两个条件:一是要有确定好的内容范围, 并使测验的全部题目均落在此范围内;二是测验题目应是以界定的内容范围的代表性样本, 且各部分题目所占比例适当。因此, 从较好的内容效度所满足的条件来看, 这些条件均是内涵明确、外延不明确的概括性问题, 具有明显的灰色性特点, 其实测也就困难很多。实践中, 常用的估测内容效度的方法有三种, 一是用逻辑推理的方法估计效度, 这种方法是专家在对测验题目与所涉及的内容范围进行充分的符合性判断的基础上, 确定内容效度。基本上采用的是定性分析法, 这种方法有一定的合理性, 但存在的问题也较多, 其一是如何将各位专家的定性评估结论加以综合, 以转化为数量化的评价结果。其二是内容效度是来自专家的描述性判断, 缺乏数量化的依据, 因而, 难以做到完全客观、准确, 而且, 由于专家们对内容范围与教学目标要求理解上的不同, 也会造成他们对内容效度的判断产生不一致的情况。二是克伦巴赫内容效度估计法。由于这种方法需编制反映同一内容范围的两个不同测验, 而且还需要对同一组被试施测两次, 因此, 这种方法的可操作性存在问题。三是用比较两次测验结果估计效度的方法。这种方法所采用的两次测验间隔时间较长, 其可行性同样不强, 实际应用时采用的不多。

总之, 实践中, 常用的估测内容效度的好方法不多, 理论上的几种方法有的可行性不强, 有的存在这样或那样的问题。理想的估测方法应当是, 在定量分析的基础上, 依靠专家的逻辑判断来评估试题的内容效度。因此, 目前存在三个问题, 一是对内容效度的评判尚缺乏合适的数量分析方法。二是为避免专家在理解试题内容范围与教学目标上的不一致, 有必要构建评估内容效度的指标体系 (含概括性问题设计) 。三是如何将专家的定性评估结果加以综合分析。

四、对测验题目难度指标的评价

衡量测验质量的重要指标是测验试卷的信度和效度, 欲提高测验的信度和效度, 还必须采用合适的方法来分析试题的品质, 试题的品质主要是指试题的难度和区分度。以下首先对试题难度的估计方法加以述评。

传统的教育测量学理论有一整套测算客观性与非客观性试题难度的方法 (略) 。但这些公式均有其缺陷。我们知道, 在经典测验理论中, 试题难度P是以考生得分率来评定试题难易程度的指标。如那些性质上属于标准参考性考试的测验, 其特点是根据各科教学 (考试) 目标要求, 制定考试标准, 通过测验衡量考生是否达到标准, 这类考试试题难易程度的概念应当主要体现教学目标的要求, 要求高的是难题, 要求低的是易题。而得分率反映的都是考生掌握知识的实际情况, 多数考生会答的是易题, 不会答的是难题, 教学目标要求与得分率意义不尽吻合, 此外P还依赖于样本, 同一试题在不同样本中的P值通常是不同的, 因此, 至少是对于标准参考性试题的难度测定方法来说, 有必要加以重新研究。

五、对测验题目区分度指标的评价

题目的区分度是评价试题质量的又一个数量化指标。它是指题目对不同水平的被试的心理特质的区分能力。若在某道试题上得高分的被试实际能力水平也高, 得低分的被试实际能力水平也低, 那么, 该题就具有较高的区分度。区分度与难度、信度、效度等有密切的关系, 如试题难度太大或太小, 其区分度都很低。试题区分度的提高, 对于提高测验的信度与效度, 保证测验质量也有着重要的意义。

计算区分度的方法有多种, 客观性试题与论文式试题计算区分度方法也各异, 这些方法均有较强的合理性。实践中, 改进算法也较多 (限于篇幅, 本文不再一一介绍) 。应当指明的是, 同其他几个指标的测算方法一样, 经典教育测量理论中, 关于区分度的这几种算法也是完全依赖于学生的得分信息。学生的得分可靠, 评分客观, 区分度的计算结果才有参考价值, 否则是不可信的。可见, 区分度计算结果同样存在随机误差与系统误差。

综上所述, 试题的难度、区分度等因素的交互作用, 构成了整个测验的信度和效度, 其间关系复杂, 取值多少为合适, 我们也不能只孤立地根据个别指标来分析判断, 而应根据考试的目的, 在选用估计方法上也应与试卷的信度、效度及试题的难度的估计方法统一考虑。因此, 本文认为, 评估一份考试试卷的质量, 对经典教育测量理论所提出的几个数量化指标进行分析测算只是问题的一个方面, 或说是一个基础, 况且, 由于这几个指标的交互作用, 我们也难以仅就实测出的几个数量化指标值来准确评判试卷的质量。因此, 科学的估测试卷质量的方法还离不开专家的逻辑推理判断, 还应当是主、客观评价方法的有机结合, 即不仅要知其数量多少, 更要了解其发展变化过程, 这是我们在对经典教育测量理论所提出的几个评价试卷质量的数量化指标进行分析后所得出的结论。

摘要：考试试题质量评价是教育测量学的一项重要内容, 是改革教学和考试制度的重要工具。经典教育测量理论的试题质量评价指标主要包括信度、效度、区分度和难度等。研究表明, 这些评价指标虽是试题质量评价的基础, 但却难以较为准确地评判试题的质量。科学的评价试题质量的方法离不开专家的逻辑判断, 应当是主、客观评价方法的有机结合, 即不仅要知其数量多少, 更要了解其发展变化过程。

关键词：试题质量,信度,效度,难度,区分度

参考文献

[1]宋岭梅.教育测量学[M].武汉:华中师范大学出版社, 1990.

[2]薛理银.教育信息处理原理[M].北京:北京师范大学出版社, 1996.

[3]王汉澜.教育测量学[M].郑州:河南大学出版社, 1987.

[4]Michell, J., An Introduction to the Educational Measurement[M].Lawrence Erlbaum Associates, Inc., 1990.

教育测量与评价篇2

测量的定义：测量系根据法则给事物分派数字。包含三方面的特性：法则、事物、数字。测量的三个要素：单位、参照点、量表。

教育测量的涵义：教育测量是根据测量学的原理和方法对教育对象及其属性进行数量研究的过程。

教育测量误差：测量的仪器和设备；所测量的事物的一致性程度；测量者的因素。

评价的定义：评价就是根据某种价值观对事物及其属性进行判断、衡量，亦即对人或事物作出好与坏、真与假、善与恶、美与丑、优与劣等等的判断。

教育评价的定义：教育评价是根据一定的教育价值观或教育目标，运用可行的科学手段，通过系统地搜集信息、分析解释，对教育现象进行价值判断，从而为不断优化教育和教育决策提供依据的过程。

教育评价系统的结构：价值目标和标准；组织机构和人员；评价方法和技术；评价对象与评价人员的心理调控。

教育评价是种类：

根据评价的对象和范围不同，可分为宏观教育评价、中观教育评价和围观教育评价；根据评价的时间和作用不同，可分为诊断性评价、形成性评价和总结性评价；

根据评价的基准不同，可分为相对评价和绝对评价；

根据评价的性质不同，可分为需要性评价、可行性评价和配性评价；

根据评价的主客体不同，可分为自我评价和他人评价。

信度：指的是测量结果的稳定性或可靠地程度，亦即测量的结果是否真实、客观地反映了考生的实际水平。

信度的类型：稳定性系数；等值性系数；内部一致性系数；论文式测验的信度系数；评分者信度。

效度：指测量结果的准确性和有效性的程度，亦即测量是否达到了预期的目的。难度：指测验试题的难易程度。

难度对测验的影响：测验难度影响测验分数的分布心态；测验难度影响测验分数的离散程度；测验难度影响测验的鉴别能力。

影响题目难度的主要因素：考查知识点的多少；考查能力的复杂程度或层次的高低；考生对题目的熟悉程度；命题的技巧性。

区分度：指测验对考生实际水平的区分程度。

教育目标分类:

布卢姆认知领域（知识、理解、应用、分析、综合、评价）、情感领域、动作技能领域。加涅《学习的条件》认知领域（言语信息、智力技能【辨别、概念、规则、高级规则】、认知策略）、技能领域、态度领域（情感因素、认知因素、行为后果）。

梶田叡《教育评价》基础目标；提高目标；体验目标。

确定测验目标应注意的问题：深入分析课程教学目标；正确选择目标领域及其类目；正确理解各类目标之间的关系。

内容类测验目标模型（内容类维、目标层次维、两维之交合。）

内容点测验目标表；教学内容和测验目标。

数据的特点：波动性、规律性。

教育测量结果的组合方法：直觉判断、加权求和、多重选择、多重回归。

评价心理的分类：

根据心理学范畴分类：心理过程、心理状态、心理特征；

根据评价过程的阶段分类：组织过程心理、设计过程心理、实施过程心理、评价过程心理和

被评价者的准备心理、自评心理、受评过程心理、结果反馈心理；

根据评价者或被评价者的心理机制分类：意识倾向性、情意心理、认知倾向、个性心理特征。评价者对被评价者的一般心理影响：对自信心和自我概念、自我知觉的影响；对情绪稳定和不安的影响；对意向和动机的影响；对要求水平和到达目标的影响；对评价者和被评价者之间关系的影响。

评价者心理对评价过程的影响：对制定评价方案的影响；对搜集和分析评价信息的影响；对测定与评价的影响；对评价结果解释的影响。

教育测量与评价篇3

[摘要]个案研究法又称个案法、案例分析法.在数学教育中，数学测量与评价领域涉及对事物分析和资料的整理，这也正是个案研究法在各类研究中体现的价值、作用.本文通过例谈展现个案研究法在数学测量评价中的作用，以期达到合理评价的功能.

[关键词]个案研究；数学；测量；评价

【中图分类号】O13

一、引言

在实际数学教育中，数学测量与评价领域的研究有助于为教育行政部门提供相关信息、同时为教育改革、提供相关策略建议进行参考；为学校教师提供相应测量数据，科学制定教学计划，合理安排教学进程，实现因材施教.

二、个案研究法

“个案”通常又被称为“案例”，是指具有某种代表意义及特定范围的具体对象。具体到教育研究领域来说，这个对象既可以是一个人、一种课程，也可以是一个事件或一个过程等.个案研究即是通过对单一研究对象的具体特征进行深入全面的分析后，研究得出所需的结论的一种研究方法.通常，个案研究法也常被称为个案法、案例研究法[1]。

三、数学测量与评价

1.数学教育研究领域分布

依据《中国教育学会中学数学教学专业委员会科研课题分类研究选题》，通常将数学教育研究领域分为六类：教学领域、学习领域、教师专业发展领域、信息技术领域、课程与教材领域、测量与评价领域.

2.数学教育评价

美国教育家泰勒曾提出“评价的本质是一个确定课程和数学计划实际达到教育目标的程度的过程.”[2] 数学教育评价是全面搜集和处理数学课程与教学的设计与实施过程中的信息，从而作出价值判断、改进教育决策的过程.

3.个案研究法在数学测量与评价领域的作用探究

本次例谈针对贵阳市普通中学2014-1015学年度第二学期期末考试试卷第17大题，在批阅试卷过程中对学生不同答案的案例分析，力求总结学生面对初中几何形题的优点与不足，为老师日后授课提供经验借鉴.

17.（本题满分8分）已知：如图1，锐角△ABC的两条高BE，CD相交于点O，且BE=CD.求证：⑴△ABC是等腰三角形.（4分） ⑵OD=OE.（4分）

解法分析：

案例一：

证明：（1）由题知，BE，CD为△ABC的高线，

∴∠BDC=∠BEC=90°

在Rt△BDC和Rt△BEC

BE=CD，∠BDC=∠BEC=90°，BC=BC

∴Rt△BDC≌Rt△BEC（HL）则∠DBC=∠ECB

∴AB=AC故△ABC是等腰三角形

（2）由（1）知Rt△BDC≌Rt△BEC

∴DB=EC

又∠DOB=∠EOC（对顶角相等）

且∠BDC=∠BEC=90°

Rt△BOD≌Rt△COE（AAS）

即有OD=OE.

案例二：

证明：（1）如图2由题知在Rt△ADC和Rt△AEB中，

BE=CD（已知），∠BDC=∠BEC，∠A=∠A

∴Rt△ADC≌Rt△AEB（AAS）

∴AB=AC，故△ABC是等腰三角形.

（2）由（1）知Rt△ADC≌Rt△AEB（AAS），则∠1=∠2

又△ABC是等腰三角形

∴∠B=∠C

即∠B-∠1=∠C-∠2

∴∠3=∠4

∴△OBC是等腰三角形

即OB=OC

又BE=CD

BE-OB=CD-OC

∴OD=OE.

案例三：

证明：（1）证明见案例1（1）题证明.

（2）如图2，连接AO交BC于F点，

由（1）知，Rt△BDC≌Rt△BEC

∴DB=EC

又△ABC为等腰三角形

∴AB=AC则AD=AB-DB=AC-EC=AE

又∠BDC=∠BEC=90°AO=AO

∴Rt△ADO≌Rt△AEO（HL）

故OD=OE.

4.案例分析

17题作为贵阳市八年级学生数学期末考试中的几何图形大题，它必须具备普适性.从评卷过程来看，在批阅的随机抽调的50份试卷中，近30人拿到8分的满分，说明该题的难度值并不高，是八年级学生应该掌握的几何图形知识.

本文例举3份个案，望从科研方法角度实现对教学质量，教学目标的测量评价，对以后教学起到反思指导作用.

案例一：从该生卷面书写而言，8分满分，同时书写准确，思路连贯，实为标准答案典范.案例二：该生选择了与案例一中学生完全不同的解答方法，证明另一组直角三角形全等利用边相等的性质证明出等腰三角形，但在书写过程中不够完善，题目只提供了高，必须严格书写表示出直角的特征，第二问的解答单纯利用边相等的性质作差得出结论，可以拿到7分.案例三：该生在第二问中选择添加辅助线构造三角形全等，以更灵活的方式，且不局限于题目所给的条件发掘出新的三角形来证明，可以得到8分的满分.

从题目设计角度而言，该题考查到的知识点涉及的有：

①全等三角形判定定理（AAS）：两角分别相等且其中一组等角的对边相等的两个三角形全等.

②全等三角形的对应边相等、对应角相等.

③有两个角相等的三角形是等腰三角形.

④全等三角形判定定理（HL）：斜边和一条直角边分别相等的两个直角三角形全等.

三位学生在解答过程中，合理的使用了上述在八年级下册数学书中的定理判定，有力有序的展示出解答题所必需的步骤，体现出良好的数学素养，从侧面也可以肯定授课老师的能力和教学方法.

针对部分学生并未得到满分，甚至有的为0分的情况，老师也需引起重视，通过合理的个例分析，找出学生的知识方面的不足和差距，合理为其排忧解难，体现个案研究法的目的.

只有在個案研究法充分搜集、整理资料的基础上，研究者才能谨慎的得出相应结论，才能在数学测量与评价中体现出应有的作用，展现真正的价值.

参考文献

[1] 苏倍. 教育科研方法之个案研究法[J]. 海外英语（上），2012（12）.

[2] 马云鹏，孔凡哲，张春莉.数学教育测量与评价[M]. 北京：北京师范大学出版社，2009.

教育测量与评价篇4

当前素质教育的重要性已经深入人心,考试是对教师教学学生学习成果的评测,是平时师生教学工作的指挥棒、验金石,而考试质量本身如何也就很大程度了影响甚至决定了素质教育的质量,因此如何科学地对考试进行评价就是一项至关重要的工作。当前已经普遍采用考试评价系统对考试进行评价,但现有的考试评价系统主要是从单一的成绩或难易度、成绩分布等角度来对考试进行评价,缺乏对考试的整体评价,没有科学的教育测量评价理论作为支撑,导致教学考试改革成效难以有较大的突破。从素质教育的根本要求出发,以教育测量学理论为支撑,研究教育测量学理论在考试评价中的应用,在此基础上设计开发考试评价系统,对考试进行科学全面的评价,保障考试能够对师生进行更科学有效的评测,进而提高素质教育的质量。

1 教育测量学理论

教育测量学理论从成绩评价、单元评价和整体评价三个层面来对考试进行全面评价。

1.1 成绩评价

成绩评价指标主要包括最高分、最低分、平均分、标准差、标准分等。

最高分、最低分是两个极端分数指标,用来评价处于两个极端的学生。通过平均分指标则可以对试卷总体难易度进行评价,以满分100分为例,试题难度评价标准如果表1所示。

标准差:标准差是用于表示考试成绩差异或者离散程度大小的数字指标,指的是成绩与平均分之间的差异或者离散程度。标准差越大,说明成绩差异或离散程度越大。

标准差为0说明考试成绩的分布过于集中;标准差大于0时,其值的大小反映了成绩的差异或离散程度。一般认为,标准差不大于10时,考试成绩的分布比较合理。

标准分:标准分的计算方法是将原始成绩与平均分之差除以标准差所得。标准分是衡量原始成绩在所属的同批成绩中相对位置的一个标准,它基于原始成绩推算出来的相对地位量数,相对原始分数能更为合理地反映考生在所有考生中的实际能力水平。

1.2 单元评价

单元评价是指对考试的每个试题进行评价,主要有难度和区分度两项指标。

1.2.1 难度

1.2.2 区分度

区分度是学生答题情况以及试卷质量的评测指标之一。应该选择区分度良好的试卷用于选拔性考试,以体现出考试成绩之间的差距,使评价者能够更直观的区分出学生的学习效果。

根据考试目的和试题特点的不同,可以选择采用极端分组法或相关法来计算区分度[2]。试题的区分度评价标准如表2所示。

1.3 整体评价

整体评价是基于分析考试的定量计算结果,分别从试卷信度和试卷效度两个量化指标来从整体评价考试质量的一种评价方法。信度,即考试的可靠性;效度,即考试的有效性。这两项指标是全面评价考试质量的重要因素,缺一不可。

1.3.1 信度

通过试卷信度可知考生答题情况是否稳定。用同一份试卷对同一组参加考试的考生进行反复测验,每次测验所得到的结果应该是一致的。但是由于信度是理想状态下的构想模型,实际测验中只能得到信度系数的估算值,而无法得到定量的结果。实际中常用Cronbach创建的α系数公式法来进行估计。试题的信度评价标准如表3所示。

可以通过多种方式来提高试题的信度,常用方式有适当增加题目数量、控制题目难度系数、提高试题区分度等等。

1.3.2 效度

效度是指考试能测量出考试所要测量的特性或功能的程度,指考试的有效性和结果正确性的程度,即考试能在多大程度上测量到所要测验的内容。

1.3.3 信度与效度的区别与关系

信度和效度在对考试进行整体评价的时候是有区别的,信度是效度的前提和保证,信度反映了考试有随机误差的大小,而效度反映了考试有系统误差的大小。

根据考试测试目标的差别,主要有三种不同的效度测量方式,分别是内容效度、结构效度和实证效度。内容效度和结构效度的高低现在还不能够进行准确的定量测量,只能结合教育学和心理学的原理综合地进行定性评判。实证效度指的是测验分数与某一外部效标间的一致性程度,测验的结果能够代表或预测效标行为的有效性和准确性程度。效度的取值范围在0至1之间。效度系数一般在0.4~0.7之间,数值大小与效度成正比[3]。

2 考试评价系统设计

2.1 系统功能分析

系统主要需要从试卷试题隐含的信息中,根据教育测量学理论分析出其中存在的不足和问题,以便在以后的工作中能够扬长避短。系统主要是对试卷的难度、区分度、信度、效度、区分度等指标进行分析。

2.2 系统流程设计

系统的初始阶段由教学管理部门为教学管理人员设置分配帐号及权限。教学管理人员在系统中完成相关的设置,并安排授课教师完成试卷的建立[4]。具体流程如图1所示。

2.3 系统功能模块

根据系统的功能需求,把整个系统划分为5个主要功能模块[5],如图2所示。

(1)系统管理模块功能:包括对系统中各级用户管理和权限分配管理,全部考试评价处理结果的统计和备份。

(2)数据录入模块功能:包括试卷基本信息、课程信息、试题基本信息和试卷得分信息等四类信息录入功能。

(3)试卷处理模块功能:包括编制成绩分段统计分布表,计算平均分、难度、标准差、信度、效度、区分度等指标,并对成绩进行正态分布检验。

(4)考试分析模块功能:包括成绩分析、单元分析、整体分析三个方面。

(5)数据输出模块功能:能将考试评价结果使用常用文件格式word和excel输出保存。

系统中最重要的考试分析模块的功能模块包括:成绩统计分析子模块、试题分析子模块和试卷质量分析子模块。其中成绩统计分析子模块主要实现成绩平均值、标准差的计算和各分数段人数的统计。试题分析子模块主要实现试题难度和区分度的计算分析。试卷质量分析子模块主要实现试卷难度、区分度、信度和效度的计算分析。考试分析模块功能框架如图3所示。

3 结论

在总结教育测量学理论的基础上,研究如何将其应用于考试评价,进而设计了考试评价系统的工作流程,并对系统五大功能模块特别是考试分析模块功能进行了研究分析,在此基础上可以进行下一步的考试评价系统的开发和应用工作。

参考文献

[1]吴新建,张贤金.考试难度的测量学意义的探讨[J].福建教育学院学报,2011(6):63-66.

[2]王冬,陈立明.用教育测量学原理分析试题的质量及体会[J].中国现代医学杂志,2003,13(19):154-156.

[3]戴琴,冯正直,等.正性负性信息注意量表中文版测试大学生样本的效度和信度[J].中国心理卫生杂志,2015(5):395-400.

[4]周立军,张杰,等.通用科目网络在线训练与考试系统的设计与实现[J].计算机与数字工程,2015,43(5):903-906,939.

现代教育测量与评价小题目篇5

据法则给事物分派数字。此定义包含

了三个方面特性：法则、事物、法则是测量的标准，也就是测量的依

据和准则，即我们根据什么来进行测

量；事物是测量的对象，也就是对什

么进行测量；数字是测量结果的表现

形式。

2教育测量的单位不能直接加减乘

除）；参照点（计算的起点，有绝对

零点和相零点）；量表（测量工具）。

3、将量表从低级到高级排列主要有

四种量表水平：类别量表水平、顺序

量表水平、等距量表水平、比率量表

水平。

4、教育测量是根据测量学的原理和

方法对教育现象及其属性进行数量

化研究的过程。它主要包括对学生的内在精神属性的测量，教育测量主要

是一种间接的测量。

5、教育测量对象的复杂性：首先它

是内在的，不能直接测量；其次它是

多变的；另外有些主客观因素也会影

响测量的结果。

6、哲学史上三种价值观：客观主义

价值观；主观主义价值观；辩证唯物

主义价值观。

7、信度：是测量结果的稳定性或可

靠的程度，即测量的结果是否真实、客观地反映了考生的实际水平。可从

三方面理解：实测值与真值相差程

度；统计量与参数之间接近程度；两

次重复测量或等值测量之间的关联

程度。信度系数以多大为宜：对于学

科测验，信度系数要达到0.9以上，智力测验要达到0.8以上，品德测验

要达到0.6以上。

8、校标关联效度：又叫经验效度和

统计效度，是以测验分数和校标之间的相关系数来表示测验的效度的高

低的。

9记载中国在西周实行了教育考评；②

1702年英国剑桥大学首先用笔试代

替口试；③1845年美国在初等教育

中以笔试代替口试；④1864年英国

费舍收集学生成绩样本汇成《量表

集》开启了标准化测量的萌芽；⑤

1897年莱斯的拼字测验推动教育测

验的发展；⑥冯特的测量方法和高尔

顿的统计方法对教育测量产生重大

影响；⑦1905年法国比纳-西蒙智力

量表具有经典型；⑧1904年美国的桑代克为教育测量之父，其名言：“凡

是存在的东西都有数量，凡是有数量的东西都可以测量”。1904桑代克发

表的《精神与社会测验学导论》，标

志着教育测验运动的开始；⑨美国的教育测验运动分为三个时期：

1904-1915开拓期，1915-1930兴盛

期，1930-1940批判期。①1931年

塞蒙兹主张人格测量应用评定法、问

卷法、交谈法、轶事记录法等。②泰

勒主持了课程设置和成绩测试的“八

年研究”（1933-1940），首次提出“教

育评价”的概念，并发表了《史密斯-

泰勒报告》，此报告誉为“划时代的教

育评价宣言”，泰勒被称为“教育评价之

父”。③1963年克龙巴赫发表了《通

过评价改革课程》；1967年斯克里芬发表了《评价方法论》第一次对形成可靠，是信得过的资料，这些资料所40、瑟斯顿智力群因素论中七因素：指标体系确立的依据：依据社会的需性和终结性评价等不同类型的评价反映的情况完全符合客观实际。时限空间、数量、知觉、言语、言语流畅要；依据德育大纲；依据品德结构；之间做了区分。性指严格按照评价工作所规定的时性、记忆、推理。依据学生年龄特征。

10、难度：是测验试题的难易程度，限去采集评价信息。

41、智力结构论：1967年美国心理

53、语意分析法：由奥古斯丁和同事是试题对学生知识和能力水平的适

24、处理评价信息的方法：定性分析学家吉尔福特提出了智力的三维结创立的，目的是测量和比较概念的意合程度的指标。公式：P=R/N；P表描述法（包括等级评定、评语鉴定、构论，他用内容、操作、成果三个变义。行为测验法：是一种有目的有计示难度指标，N表示参加考试的总人写实分析法），定量评定法（包括统项构成的立体模型来描述智力结构。划地考察学生思想行为的方法。有自数，R表示答对某道客观题的人数。计分析评判法、模糊综合评判法）。

42、多维智力论：受（吉尔福特）的然观察法、实验观察法、情景观察在常模参照性测验中要求试题难度

25、教育评价中应用较多的统计分析智力结构论的影响，美国哈佛大学心法、跟踪观测法、时间样本法。适中，即大多数题目的难度在0.3-0.7是平均数、标准差、标准分数、T分理学教授（嘉德纳）

54、教师评价的主体：①教育行政部之间，整个试卷平均难度在0.5 数、参数估计、统计检验。他强调人类的智力至少包括以下7门、学校、教师参评；②学生参评；

11、区分度：指测验对考生实际水平

26、教育评价过程是评价者依据某种种：言语智力、数理逻辑智力、空间③家长参评，④教师自评。的区分程度。公式：D=PH-PL；D代标准对被评价者有关方面情况进行智力、音乐智力、体能智力、人际智

55、教师评价的三种指标体系：教师表区分度，Ph代表高分组的难度；评判的过程。力、自知智力。素质指标；教师职责指标；教师绩效Pl表示低分组的难度，D>0为正区

27、评价心理指评价者和被评价者对

43、三重智力理论：美国耶鲁大学心指标。分，D<0为负区分，D=0为零区。评价过程的实践活动和评价过程的理学教授（斯滕伯格）提出，这一理

56、备课评价的内容：评价教师课前

12、提高区分度的方法：使题目的难各种关系、交往等现实活动的反应。论从主体的内部世界、现实的外部世所做的思想备课工作和三种备课形度适中，使整个考试的难度适中；着

28、评价准备过程中的心理现象包括界以及联系内外经验世界这三个角式。对四项备课工作评价的内容：钻重考察复杂的学习效果。角色心理、心理定势、新情感、时尚度着手来分析智力，并与之对应提出研教材的评价内容；了解学生的评价

13、测验目标：测验所要达到的某种效应、期望效应。角色心理指身份的了三类不同的智力：成分智力、情境内容；选择教法的评价内容；准备教具体目的，它明确规定测验所要达到自我意识及潜意识的表现的一种心智力、经验智力。具的评价内容。对三项备课形式的评的预期结果或标准。是编制测验的出理学现象，是特定的职业责任、道德

44、智力测验的先驱者是英国的遗传价内容：对学期备课评价的内容；对发点和依据。规范、行为习惯、学家高尔顿和美国心理学家卡特尔。单元备课评价的内容；对课时备课评

14、布鲁姆把教育目标分为认知领心理定势是指有一定的心理活动所高尔顿首先使用等地评定量表和问价的内容。域、情感领域、形成的准备状态，影响或决定同类后卷法作为测验的辅助工具。卡特尔于

57、上课评价的内容：①教学目的明他把认知领域的教育目标分为知识、继心理活动趋势的一种心理现象。时1890年发表论文《心理测验与测量》确，完成任务好；②教学内容正确、应用、理解、分析、综合、评价。1964尚效应指对新颖、时髦事物的向往和首先使用了“心理测验”这个术语。充实，抓住重点、难点、关键；③教年，布鲁姆等人发表了《教育目标分崇拜的一种心理现象。

45、韦克斯勒智力量表包括语言、操学方法适合，教师善“启”善“导”④上课类学：第二分册：情感学习领域》。

29、标准分数是将原始分数与其平均作两部分，语言分常识、理解、组织得好，具有教学机智性；⑤教学15、1977数之差除以标准差所得的商数，标准类似、词汇、数字广度；操作由数字基本功扎实；⑥教学效果好。的第三版中将认知领域分为言语信分数又叫Z分数。符号、图像完成、积木设计、58、学生学业成绩考评的种类：①诊息、智力技能、认知策略三种。智力30、评价实施前，对评价的期望主要拼图、迷津组成。其测验结果有言语断性评价（指在教育、教学活动开始技能分为辨别、概念、规则、高级规表现有三种形式：积极期望、消极期智商、操作智商、全量表智商三种。之前，为使计划更有效地实施而进行则四类。学习的结果分为智力技能、望、中性期望。

46、德国心理学家斯腾于1913年提的预测性、摸底性评价）②形成性评认知策略、言语信息、运动技能、态

31、施评过程心理包括自尊心理、首出了心智商数的概念；推孟将心智商价（指在教育、教学活动计划实施的度五种。日本的梶田叡一在他的《教因效应、近因效应、晕轮效应、参照数乘以100，提出了智商的概念，也过程中，对计划、方案执行情况进行育评价》分为三大目标：基础目标、效应、理想效应、顺序效应、趋中心称为比率智商。智商公式：比率智商的评价）③终结性评价。提高目标、体验目标。里、成见效应、宽大效应、附和权威（IQ）=智龄（MA）/实龄（CA）*100%

59、目标评价模式的提出者是泰勒

16、测验题型可分为封闭式、心理。泰勒在“八年研究”期间正式提出了课（教育评价之父），他将课程评价分

17、测验编制中，设计试卷的蓝图是

32、被评价者过程心理现象包括自卫程评价的概念。认为“评价过程本质上为四阶段：确定教育目标，选择学习命题双向细目表。进行教育测验的编心理、迎合心理、应付心理。被评价是一个确定课程与教学计划实际达经验，组织学习经验，评价学习效果。制时，一套试题中的客观题约60%，者结果反馈中的心理现象有：敏感心到教育目标程度的过程”。CIIP模式：即背景评价、输入评价、主观题约40%，测验试题难度的掌握理（表现在分数敏感、47、学生评价的类型：①定位性评价过程评价、结果评价。最早由斯塔弗一般情况下，较容易的试题占20%左公正敏感），护短心理，嫉妒心理，（安置性），在特定的教学活动之前毕姆、格林、古巴提出。外观评价模右。对评价进行评价心理。

33、单字测验判定学生的前期准备；②形成性评式：最早由斯太克提出，1967年发

18、教育评价指标从达标水平去考的三种类型：回忆、自由联想、随机价，是评价的结果能够指导以后的教表《教育评价的全貌》，文中提出了察，可分为必达指标和期望指标。教取样。学与学习的评价；③诊断性评价，是外观评价模式，强调两方面的操作过育评价指标从精确度去考察，可分为

34、语文成绩测验的种类：为了使教学适合与学习者的需要和程：描述和判断。回应模式：1973硬指标和软指标两种。硬指标指“硬单字测验，词语测验，阅读测验，作背景而在一门课程和一个学习单元年斯太克在《方案的评价：特别是回件”，是固定的精确的指标。软指标指文测验，语文综合测验。开始之前对学习者所具有的认知、情应性评价》中提出的。“软件”，是伸缩性较大，35、作文测验的五种方法：分析法、感和技能方面的条件进行的评价。60、中小学校评价的指标：基础性指

19、社会标准：以社会对教育的现象多段短文测量法、评定量表法、预料

48、学生评价的原则：发展性、多元标、发展性指标、学校特色发展指标、要求为依据，要求达标过程社会化规后果法，确定要旨法、化、全息性、差异性原则。根据评价教育效益指标。范化。

36、影响作文评分的三个因素：作文主体的不同，学生评价可以分为学生61、中小学师资水平评价六项内容：20、科学标准：根据客观规定和原则题目类型及评分标准、被试者主观方自我评价、学生小组评价、教师对学教师队伍建设；教学质量评价；教师为依据，要求符合教育的客观规律。面的因素、评分者方面的因素。生的评价。品德修养的评价；教育科研能力的评

21、行为目标评价法：指采用可观测

37、常用的作文评分误差控制方法：

49、教师评价学生的一般方法：学业价；教师身体素质的评价；教师心理的行为目标作为评价的依据的一种2人评分法、表格评分法、正态分布成绩测验、观察与调查法、评语评价素质的评价。评价方法。行为目标的表达要注意两评分法、电脑控制评分法。法、表现性评价法、档案袋评价法。62、发展性的中小学学校评价的方点：应设立可能观察行为的场合；应

38、西周有数学教育，隋唐出现数学档案评价法：根据学生的反映，以及法：①内部评价和外部评价相结合；容易表示出行动的程度或阶段。考试，科举制有“算学”。现阶段，中学教师的评价、观察、考查、成绩测验②形成性评价和终结性评价相结合；

22、加权平均法：是通过自评、专家数学教学目的包括数学基础知识，基等，得出有关学生进步和发展的系统③定性评价和定量评价相结合。组评、社会群众等不同方面的评价，本技能和数学能力。中学数学教学大而持续的记录。63、教育评价中应用较多的统计分析或者学生、教师、领导等不同阶层的纲对数学能力的规定：运算能力目50、表现性评价方法的构成：有一个是平均数、标准差、标准分数、T分评价者的评价来综合评定被评者的标、空间想象能力目标、逻辑思维能表现性任务、有一个评价标准、有一数、参数估计和统计检验。分数。力目标、分析问题解决实际问题能力个或几个好的评价者。64、标准分数是将原始分数与其平均

23、评价信息收集的标准主要有准确目标。数学竞赛题的三个特点：命题

51、表现性评价的主要形式：演示、数之差除以标准差所得的商数。标准性、可靠性、时限性。准确性指收集背景；对已知结果的逻辑改造；着眼口头表述、模拟表现任务、实验分数又叫Z分数。到的信息与评价目标的一致性，只采于解题的数学思想方法。与调查、作品选集、完成研究项目。集到的材料是评价目标真正需要的39、标准化考试中的四种常模：

教学技能训练中的视频测量与评价篇6

摘要：基于数字化的微格教学系统目前在教学技能的训练中发挥着越来越重要的作用, 如何在网络环境下对教学技能训练的视频进行评价是很多人关注的问题, 本文从形成性评价方面着手, 就评价指标、评价方式和方法, 阐述了在网络环境下对教学技能训练视频的评价策略以及评价的实施。

关键词：网络环境,教学评价,评价策略

参考文献

[1]吴志华等.简论微格教学评价标准的建立.教育科学, 2003 (6) .

[2]邓双喜.微格教学评价标准构建的策略及其思考.当代教育论坛 (学科教育研究) , 2008 (7) .

[3]郑卡莉.高职院校的教师评价体系研究.浙江工业大学, 2007.

[4]赵建功等.微格教学中形成性评价策略探究.河北科技师范学院学报, 2005 (5) .

教育测量与评价篇7

一、背景

(一) 当前课程测量与评价领域存在问题

作为一场课程文化的博弈, 新课程在成长过程中既获得了认可, 又遭受着质疑。对于新课程的认可, 源自其在课程理念、目标、内容、结构、评价、管理方面作出的超越。对于新课程的质疑, 则主要源于“理念是理想的, 评价是残酷的”这样一种认识。许多教师坚定认为“高考不改革, 新课程无法推行”。这样的认识和言论虽未必正确, 却向我们传达了这样一个信息:当前我国课程测量与评价领域存在着诸多问题, 而这些问题存在的主要原因之一是课程测量与评价的非专业化。

华东师范大学课程与教学研究所所长崔允漷教授在实践研究中发现, 当前我国听评课存在着“三无”现象———听课无合作、评课无证据、听评课无研究。崔教授认为, 这种听评课在某种程度上反映了我国课程测量与评价领域的去专业化现象。华东师大课程与教学研究所杨向东博士指出, 虽然在整体设计思路上我国大规模考试与国际同类测验相似, 但在具体环节实施上存在诸多非专业化操作与行为, 这直接影响到测验目的的达成和测验结果的质量。华东师大课程与教学研究所柯政博士认为, 在衡量评价政策的政策辩论问题上, 多数人囿于表面的政策辩论而忽略政策辩论的深层问题, 这是认识上缺失专业性的表现。

(二) 课程测量与评价的专业化诉求

课程评价应该怎样改革?课程评价应该秉持怎样的理念与取向?与会者对此各抒己见、众说纷纭。通过异议中的对话以及对话中的协商终于达成共识, 即课程测量与评价应该指向专业化。在为期三天的“课程评价国际研讨会”上, 与会专家一致认为, 无论是课程理论建设的需要, 还是课程实践发展的需要, 改革我国当前的课程测量与评价制度, 并呼唤专业化的课程测量与评价已经刻不容缓。

课程改革的关键在于评价改革, 评价改革的关键在于课程评价的专业化, 然而怎样的课程评价才是指向于专业化的评价呢?经过高端研讨和对话, 与会者一致认为, 专业化的课程评价应该基于专业思维、基于标准、基于过程、基于证据、基于推论。

二、课程测量与评价专业化的路径

课程测量与评价应基于专业思维。我国基础教育的评价思维, 一直指向于行政而非专业。其实, 评价问题是具有专业特质的课程问题, 坚持用行政思维来审视抑或干预课程评价, 其结果必然使课程评价误入歧途。据此, 上海市教育考试院副院长雷新勇认为, 我国学业水平考试存在诸多问题的主要原因之一是“我国现行的教育行政机制制约了考试的科学化发展”。故在学生学业水平考试的问题上, 应施行“行政思维”向“专业思维”的转换。华东师范大学崔允漷教授认为, 针对我国当前听评课存在的“去专业化”现象, 我们亟需扭转听评课范式的转型, 转变思维方式, 构建一种强调合作、证据、研究的兼具理论品质与实践成效的“课堂观察LICC模式”。教育部考试中心马世晔主任亦指出, 考试评价应从“功能控制”这样一种工具性思维转向“为学生服务”这样一种本体性专业思维。

课程测量与评价应基于标准。没有规矩, 不成方圆;没有课程标准, 课程改革无法施行;没有课程评价标准, 课程评价亦无所适从。从这个意义上来说, 与会者认为课程评价不仅应基于课程标准而且应基于课程评价标准。教育部亦明确规定, 课程标准是教材编写的依据, 是指导课堂教学的指南, 也是考试评价的依据。故雷新勇副院长认为, 新课程改革本质上是基于标准的教育改革。基础教育体系中的教材、课堂教学、考试评价等要素, 必须与课程标准保持一致。如果不一致, 那么这些要素就需要进行调整, 以达到诸要素与课程标准一致的要求。也有学者认为, 探究学业评价与课程标准一致性问题已经提升到认识日程。我国学业评价的实践诉求, 亟需课程研究者给予一致性分析策略与方法的应答。

课程测量与评价应基于过程。仅仅将评价依据细化为课程目标而忽略课堂的复杂丰富性, 这是线性单一评价理念的表现。与会者一致认为, 课堂教学是一个蕴含师生生命活力和生命信仰的空间, 而这种生命活力和信仰通过“过程”而生成。故, 关注过程, 关注教师教的过程, 关注学生学的过程, 关注课堂教学生命韵律的过程, 应该是课程评价的重要内容和指标。然而, 我们当前的教学评价存在着去背景化、去时间化、去个性化、去系统化现象。对此, 西南大学教育学院张瑞博士提出应建立“情境适应性课堂教学评价”, 这种评价彰显了评价的情景性与真实性、及时性与连续性、个体性与系统性, 充分体现了课堂教学的情境意蕴和过程意蕴。教育部课程教材研究所丁朝蓬博士亦指出, 传统静态的测验在某种程度上阻碍了学生的发展, 应倡导一种关注过程、关注学生元认知因素和非智力因素发展的动态评价。

课程测量与评价应基于证据。问题解决, 需要依托专业思维方式, 而专业思维方式的运转过程, 即基于证据进行推论的过程。从这个意义上来说, 任何评价结论的得出均需要基于证据。崔允漷教授认为, 听评课的过程即收集证据的过程;课堂观察的过程, 即收集证据的过程;评价的过程, 即基于证据进行推论的过程。正是对评价与证据关系的辩证认识, 崔教授把复杂的课堂解构为“4维度20视角68观察点”。对不同维度不同观察点的观察, 即是收集观察证据的过程。基于这些观察证据, 我们可以在课后会议上更全面、准确地评价教学。江苏省锡山高级中学佟柠老师亦提出, 课堂教学和评价应该基于标准;获得学生学业进步的证据是有效评价的关键。

课程测量与评价应基于推论。评价过程, 亦即依据证据进行推论的过程。缺失证据的评价, 是信度缺乏的评价;而摒弃推论的评价, 则是效度缺乏的评价。从这个意义上而言, 证据和推理是评价的充要元素, 前者阐释了评价的外在依据, 后者彰显了评价的应然本质。然而, 在现实教学中存在着以摒弃证据和推论为特征的、简单线性的课堂评价结果处理。华东师大课程与教学研究所刘辉博士认为, 这主要源于评价结果使用的管理主义倾向、评价结果处理中缺乏学生的主动参与、评价结果的分析与反馈不当、评价结果的报告与交流低效、缺少进一步改进与干预措施等。应该看到, 基于推论的评价隐含着评价的本质属性, 而评价的本质属性更多地体现在过程与表现之中。

三、需要进一步研究的问题

这是一次富有成效与影响力的国际研讨会, 然而由于时间限制, 会议在如下问题上尚未进行深度研讨, 如怎样提升教师的专业思维?当标准和目标本身的准确性和科学性值得商榷时, 测量与评价应该作出怎样的选择?教师如何在动态的课堂中准确把握学生的表现?如何倡导过程性评价理念?教师如何进行基于证据推论的评价?我们相信, 对这些议题的进一步研究和探讨, 不仅有助于课程测量与评价理论的构建, 更能够促进专业化的课程测量与评价的实施。

摘要：2009年11月6日8日, “课程评价国际研讨会”在华东师范大学召开。与会代表基于我国当前评价领域存在的诸多非专业化问题, 指出课程评价改革的方向是课程测量与评价的专业化。专业化的课程评价, 应该基于专业思维、基于标准、基于过程、基于证据、基于推论。

教育测量与评价篇8

一、噪声的概述

1. 噪声的定义

噪声是一种主观评价标准, 即一切影响他人的声音均为噪声, 无论是音乐或者机械声等等。从环境保护的角度看, 凡是影响人们正常学习、工作和休息的声音, 凡是人们在某些场合“不需要的声音”, 都统称为噪声。如机器的轰鸣声, 各种交通工具的马达声、鸣笛声, 人的嘈杂声及各种突发的声响等, 均称为噪声。

2. 噪声的来源

现代城市中环境噪声有四种主要来源:交通噪声、工业噪声、建筑施工噪声、社会生活噪声、发动机噪声。

3. 噪声的危害

噪声具有局部性、暂时性和多发性的特点。噪声不仅会影响听力, 而且还对人的心血管系统、神经系统、内分泌系统产生不利影响, 所以有人称噪声为“致人死命的慢性毒药”。噪声给人带来生理上和心理上的危害主要有以下几方面:干扰休息和睡眠、影响工作效率;损伤听觉、视觉器官;对人体的生理影响。

二、噪声的测量

1. 测量仪器和测量条件

根据声环境质量标准 (GB3096-2008) 中的检测方法进行测量。测量仪器为

2. 测点布置

根据长安大学雁塔校区的平面布置图, 按照功能分区和噪声敏感点进行布点。布点如下:食堂、教学区、学生宿舍、运动区、东门。

3. 测量原理:

由于城市环境噪声是随时间而起伏变化的非稳态噪声, 因此主要采用等效[连续A]声级Leq的监测方法。等效[连续A]声级相当于用一个稳定的连续噪声来等效起伏噪声, 其二者在观测时间内能量相等。计算公式如下:

式中Leq——等效声级, d B (A) ;

LAi——每次测得的A声级, d B (A) ;

n——读取噪声A声级的总次数。

4. 测量方法

监测时间为2013年6月16日, 测量时段为:上午8:00-12:00;下午15:00-19:00;晚上21:00以后。测量时, 每个测点每隔5s读取一个瞬时A声级, 连续读取100个数据, 同时记录主要噪声来源。

三、测量结果与分析

1. 测量结果

各测点不同时段的LAeq数据列于表1。

2. 测量结果评价

根据《城市区域环境噪声标准》 (GB 3096-2008) 可知, 对于文教机关为主的区域应执行Ι类标准, 即昼间噪声限值为55d B, 夜间噪声限值为45d B。

从表1中的数据分析得出:食堂测点属于生活区, 学生就餐时段比较集中, 时间集中在中午11:00~13:00和下午17:00~19:00。在此时间段, 大部分师生均在此就餐, 故人流量很大, 加上食堂的餐具都是金属制品, 收拾餐具的声音也很大, 使得噪声较大。教学区东边紧邻运动场, 除了交通和行人的噪声影响外, 人群在操场上活动时产生的噪声对教学区也有一定的影响。学生宿舍主要受到交通、行人谈话、人群喧哗、学生生活噪声等的影响。运动区包括足球场、篮球场和网球场, 其噪声测量值较大是由于人群集中加上活动较多, 其主要噪声来自于学生的体育活动。校区的东大门外紧邻西安市的主干道雁塔南路, 噪声主要来自于交通噪声。

四、结论与建议

从整体上来看, 长安大学雁塔校区声环境质量状况优良, 除了食堂和东门外的噪声情况未达标外, 其余区域均达到标准。从测量结果分析来看, 主要噪声声源有:交通噪声、生活噪声。

为了更好地改善声环境质量, 提出几点建议: (1) 普及噪声知识, 增强人们的声环境保护意识, 注意行人谈话影响, 禁止人群喧哗, 让保护校园环境成为人们的自觉行为。 (2) 合理选址和规划也很重要, 在进行校园选址和校园内分区时应根据城市的噪声情况预先进行声环境分析和预测, 避免选择噪声污染严重的区域, 降低校外噪声对校内的影响。 (3) 加强校园周围绿化, 增加植物层次可有效减少噪声污染, 从而改善校园噪声环境质量。

参考文献

武博, 赵冬梅, 任永霞;噪声污染危害与控制;黑龙江环境通报;2004年02期

张猛;噪声控制技术的现状及发展;科技信息 (科学教研) ;2007年22期

陆凤华、叶小兰、籍仙蓉、王伟;学校办公建筑声环境设计的探讨;第十届全国噪声与振动控制工程学术会议论文集[C];2005年

彭小云;生态高校校园声环境探讨;工业建筑;2004年09期

教育测量与评价篇9

以前, 我们测量工程技术专业的教学一直存在“黑板加粉笔”的影子, 偏重理论知识的系统性、完整性, 加上部分专业教师由学校到学校缺乏实践经验, 各门课程实践教学大纲、内容及教学计划的制订没有很好地协调、递进与衔接, 造成理论教学与实践教学相脱节。教学中, 教师对实践和技能训练方面重视不够, 因此评价与考核学生的方式很单一, 往往通过一学期课堂表现, 课后作业, 及期中和期末考试综合评定, 各环节所占比例分别为10%, 10%, 30%和50%, 任课老师对学生的成绩评定掌握着绝对的主动权。成绩并不能真实反映能力, 这种重理论, 轻实践, 重知识, 轻技能的教育模式培养出来的学生很难适应社会的需要。为此, 我们在进行大量市场调研的基础上, 围绕提高学生的职业能力、技能水平, 对测量工程技术专业的教学计划进行调整, 相应地在教学模式和教学方法上也进行了积极的探索和实践, 对学生的技能培养方面更是制定了更详细的考核。

1.根据企业对技能型人才的需求状况和基本要求, 分析和确定本专业学生应具备的职业能力和基本技能目标。

2.围绕所确定的职业能力要求设置课程模块, 并结合职业技能鉴定考核大纲, 对课程内容进行整合, 开发出应用性的实用课程。在课程的难度和广度方面, 遵循“实用为先、够用为度”的原则。

3.加大技能训练课时量, 理论与实习课的教学组织形式采取专职教师负责制。

4.将技能训练分为三个阶段, 即基本仪器操作训练阶段、单项作业训练阶段和强化技能训练阶段, 每个阶段都制定了明确的学习目标和考核方案。

二、加强实习实训工作, 建立和完善考核制度

高职教育强调, “以就业为导向, 以能力教育为本位”, 工学结合人才培养模式是高职教育改革与发展的方向。工学结合人才培养模式, 应体现“三化”、“四个结合”。即能力培养的专业化、教学环境企业化、教学内容的职业化。教学培养目标、教学计划制定与质量评价标准的制定要企业与学校的结合;教学过程要理论学习与实践操作结合;学生的角色要与企业员工的角色相结合;学习的内容要与职业岗位的内容相结合。加强实践性教学环节、突出技能训练, 是实行工学结合人才培养模式, 提高学生职业技能的重要保证。

实践教学质量的评价体系的建立原则:培养动手能力, 与实际岗位零距离衔接, 并且达到职业岗位资格证书的规范要求。实行与工学结合人才培养模式相适应的学分制, 制定各单项实习内容的操作细则及实习成绩评价规则, 学生综合能力评价标准, 生产实习岗位业绩评价标准, 毕业设计 (论文) 评价标准等。

实习实训考核制度的建立原则是:

1.系统性。考核的实训项目要成为体系, 要满足专业教学培养目标的要求。满足学生未来在不同企业、不同岗位的主观和客观的心理预期的要求。实训内容要全, 使学生掌握系统的工作技能。

2.仿真性。要模拟真实的生产任务, 转变学生身份以企业员工角色在一定的时间内完成任务, 上交合格成果, 提高工作效率。体验企业对质量要求的定位, 有助于培养学生认真负责的工作作风, 有效提高学生的解决实际问题的能力。

3.超前性。教育的功能在于满足现实性需求, 更在于满足潜在性需求。在思想观念、思维方法、操作技巧方面的评价要适当超前, 善于变通, 鼓励学生的差异化和个性化发展。

三、打造校企联合育人机制

根据测量工程技术专业的特点, 学生在校两年半, 完成基本理论学习和相应实习实训后, 在最后半年到相关企业, 生产单位进行技能的强化训练, 也就是顶岗实习或生产实习。此时的学生具有学生和企业员工的双重身份, 对他们的管理不仅有学校的老师, 还有企业的领导和师傅。而企业主要关心的是经济效益, 考虑的是学生能否顶岗, 能发挥多大的作用, 常常忽视学校的教学要求。学校在这一阶段的组织和开展工学结合时必有充分考虑企业生产经营的规律性, 按规律办事, 尽量保护企业生产经营的正常进行。学生在“做中学”, 学会做人, 学会做事, 强化自身的职业能力。

校企联合进行规范化的管理和严格考核制度, 是工学结合取得实效的保障。建立了由校企领导、项目负责人和带队教师、一线师傅组成的三级管理小组, 对校企联合育人进行统筹规划、统一管理。项目负责人和带队教师负责给学生安排生产任务和技能训练课题等日常协调、管理工作;生产一线岗位的师傅和带队教师共同承担对学生的技术指导和质量考核工作。在教学的具体实施过程中, 我们始终要求结合企业生产实际做到“六定”, 即定计划、定内容、定时间、定岗位、定师傅、定目标, 并在实习结束时对学生进行全面考核, 对学生的考核必须以企业为主, 学校为辅。考核贯彻合理、精简、高效原则。所谓合理就是必须紧扣教学目标, 准确度高;所谓精简就是应该选择少数几个核心指标, 力求简明;所谓高效就是操作过程仅需极少时间就可完成。

测量工程技术专业采用的二、四、四制, 经实践检验, 效果良好, 即第一项职业素质主要考核指标包括遵章守纪、爱护仪器设备, 吃苦耐劳, 尊重师傅、文明礼貌, 熟悉岗位、安全生产, 动手能力强等, 合计占20%, 由项目负责人和师傅共同确定成绩;第二项工作业绩以企业下达的任务为基准, 完成指标的为良好, 超额完成指标10%以上的为优秀, 完成指标80% (含80%) 以上的为中等, 完成指标60% (含60%) 以上的为及格, 低于60%的为不及格, 此项指标占40%, 由师傅确定成绩;第三项教学业绩, 包括综合报告或成果图表等 (占10%) 、毕业论文 (占30%) , 此项指标占40%, 由学校指导教师确定成绩。

四、结束语

目前, 各地高职教育对工学结合人才培养模式都在进行着积极的探索与实践, 工学结合的人才培养模式的实现方案, 管理体系的建立与运行仁者见仁, 智者见智。然而, 我们更应重视工学结合评价体系的建立与实施, 没有评价, 就没有管理。学生是工学结合的参与者, 我们对学生的评价是对工学结合的绩效的评价, 对工学结合的质量的评价。学校要树立工学结合质量意识与全面质量管理观念, 建立工学结合质量检查考核制度, 制定全面的、可操作的工学结合质量标准与评估体系, 形成工学结合质量分析、评价与反馈制度, 在一定程度上促进工学结合更深入、有效、持久地实施。

摘要：工学结合是当前高职教育改革与发展的方向, 它以增强学生的实践动手能力为突破口, 提高学生职业素质, 最终达到提高就业水平和就业质工量学为结目合的。培新养的模课式程体评系价与体人系才培养方案的构建, 依赖于评价体系与管理体系的建立与支持。

关键词：工学结合,培养模式,评价体系

参考文献

[1]孙文学.以就业为导向的高职学生职业能力培养[J].职业技术教育, 2005, (4) :20.

[2]李进, 丁晓东.产学合作教育研究与探索[C].上海:上海交通大学出版社, 2004.

教育测量与评价篇10

关键词：虚拟仪器,农业机械,手传振动,Labwindows

0 引言

随着农业科技的发展,将逐步实现农业生产的精确化、机械化、自动化和数字化,它将极大地解放农业生产力,改变农村作业模式,实现农业生产质的飞跃。我国是农业大国,农村人口仍然占多数,农业的发展关系着国家的进步。目前,我国农业已经从传统农业向现代农业转变,现代农业是以农机装备为基础的农业,为了降低农民的劳动强度、提高效率,手持式自动化农业器具得到了广泛使用。长期使用这类手持农业工具会引起操作者手和前臂系统的末梢循环障碍和神经、骨关节、肌肉和结缔组织的损伤,并成为一种重要的职业危害—振动病[1]。手传振动工具的振动危害性因此越来越受到人们的关注。

我国实现农业信息化跨越发展的突破口是将工业可控生产和计算机辅助设计的思想引入农业,把信息技术作为农业生产力的重要要素,参与到农业各个环节中[2]。而虚拟仪器技术是当今测量和控制领域中最流行的技术手段之一,其特色是基于计算机平台,将软件作为测量仪器的一部分,与硬件配合用于取代传统测试仪器系统。所以,将虚拟仪器应用在现代农业,充分体现了数字化农业与测试技术的紧密结合,代表了现代农业的发展方向。

1 相关标准

国际协会在1978年制定了“机械振动—人体接触手传振动的测量和评价指南”(IS0-5349),它适用于手持式动力工具及用手操作着机器的振动测试与评价。该标准已被许多国家采用,我国也利用此标准制定了GB/T 14790。本文中设计的测评系统主要依据GB/T 14790.1-2009/ISO 5349-1:2001。下面就标准中的测试以及评价方法做一简要介绍。

标准中规定用来描述振动幅值的基本参量是频率加速度的均方根,由6.3～1250Hz的1/3倍频带频率构成基本频率范围;考虑到人手对不同频率处的振感差异,对整个频率段(6.3～1250Hz)内的各分频加速度值进行加权处理。利用式(l)把1/3倍频程分析结果估算成对应的加权加速度的大小。有

$a_{h w} = \sqrt{\sum_{i} (w_{h i} a_{h i})^{2}}$ (1)

式中 whi—标准规定的第i个l/3倍频程的计权因子[4];

ahi—第i个11/3倍频带测得的均方根加速度(m/s2);

i一所用的1/3倍频带数。

振动暴露的评价是基于全部3个轴向综合的量,该量称为振动总值ahv,即

$a_{h v} = \sqrt{a_{h w x}^{2} + a_{h w y}^{2} + a_{h w z}^{2}}$ (2)

其中,ahwx,ahwy,ahwz分别为x,y,z轴的计权加速度均方根值,单位为m/s2[5]。

日振动暴露量由振动幅值(振动总值)和日暴露时间得出。为了对不同时间的日暴露量间进行比较,日振动暴露量应采用8h等能量频率计权振动总值ahv(eq,8h)表示,如式(3)所示,即

$a_{h v (e q, 8 h)} = a_{h v} \sqrt{\frac{Τ}{Τ_{0}}}$ (3)

式中 T—相对于振动ahv的日暴露总时间;

T0—8h的参考时间。

人手承受振动程度则以发生振动病前人体承受的时间来表示,可根据公式(4)计算出承受时间。有

$C = [\frac{a_{h w (e q, 8 h)} \cdot Τ_{F}}{95}]^{2}$ (4)

式中 C—预期发生脉管异常的受暴露人员的分布百分数,范围10%～50%;

TF—手指发白前的暴露时间,范围1～25n。

2 测评系统的设计

本虚拟仪器测试系统的主要硬件包括振动传感器、电荷放大器、数据采集卡等;软件开发平台选用Labwindows,充分发挥了软件的强大功能来完成农业机械测评要求,不但节省了硬件成本,且容易操作,同时也大大缩短了整个测试周期[6]。系统框图,如图1所示。

测评系统的工作流程是:三向加速度传感器将被测振动信号转换为电量信号;再经电荷放大器的信号调理电路将电量信号进行放大、滤波转换为标准信号;然后,数据采集卡将电压信号转换为计算机可以处理的数字信号;最后,将数字信号送入计算机,在LabWindows/CVI平台下,调用编写的应用程序,得到计算结果,将结果输出到虚拟仪器的面板上。

2.1 开发平台Labwindows介绍

编程软件采用Labwindows开发平台。LabWindows 是NI 公司推出的交互式C 语言开发平台,将功能强大、使用灵活的C 语言平台与用于数据采集分析和显示的测控专业工具有机地结合起来,利用它的集成化开发环境、交互式编程方法、函数面板和丰富的库函数大大增强了C 语言的功能,为熟悉C 语言的开发设计人员编写检测系统、自动测试环境、数据采集系统、过程监控系统等应用软件提供了一个理想的软件开发环境。本测评系统采用模块化和结构化的设计思想,先设计启动界面,然后进入主控界面,点击各个分模块进入分界面,可实现以下功能:

1)手臂X,Y,Z3个方向振动加速度信号的采集、存储与实时显示;

2)X,Y,Z三维振动加速度信号中心频率从6.3Hz到1 250Hz的1/3倍频程带下频谱的数据存储与图形显示;

3)频率加权网络的存储与显示;

4)手传振动暴露的评价。

软件流程图如图2所示。

开发平台的主界面如图3所示。

2.2 数据采集模块的设计

数据采集为人体接触手传振动虚拟仪器测试系统提供数据源,是本虚拟仪器的基本组成部分。数据采集模块主要是控制振动信号的拾取,根据选择好的数据采集卡、采集通道,在数据采集前设置采样频率、点数。采集的数据通过一个数字滤波器进行滤波, 滤波器的类型、低截止频率、高截止频率、阶次都在软件中设置为可选。数据采集模块包括数据采集面板的设计和程序编写,采集的信号可直接显示在图中,并用不同的曲线标出,曲线的颜色、线型等也可以在前面板中设置,并且将采集到的数据自动保存到指定的文件中;程序是面板的后方支援,使用库函数和回调函数来实现面板的每一个功能,编写程序实现数据的实时监测、存储和显示的功能。数据采集界面,如图4所示。

2.3 频谱分析模块和加权模块的设计

频谱分析模块和加权模块共同为采集到的信号做分析处理,包括面板设计和程序编写,是本测试系统的重要组成部分。根据式(1)和式(2),设计1/3倍频程滤波器,完成对数据的1/3倍频程谱分析;并依照加权因子表进行加权处理,最终结果将以数据表和图的形式表示,并实现存储和显示的功能。

2.3.1 1/3倍频程谱分析

滤波器的通频带宽度为f2～f1即在f1～f2的频率范围内的信号全部通过,中心频率为fc=(f2·f1)/2。滤波带的分割和中心频率值也有规定,一般规定几种“n”倍频程带滤波器,n的定义由下式确定,即

f2/f1=2n (5)

当n=1时,f2/f1=2,这样的频率比值所确定的频程称1/1倍频程,通常称倍频程,类此,n=1/3时,f2/f1=21/3,这样的频率比值所确定的频程称1/3倍频程。在此频带(f2～fl)的频谱,称1/3倍频程谱。

对于农业机械手传振动来讲,由于1/3倍频程谱能够很好地体现整个频率带宽的分布情况。因此,对中心频率为6.3～1 250Hz 进行1/3倍频程谱分析尤为重要。本设计中,设计1/3倍频程滤波器,根据1/3倍频程谱分析得到各频带振动的能量分布,为振动控制提供参考,采取合理的措施,达到保护农民操作者免受振动危害和有助于开发新的手操作农业机械器具的目的。1/3倍频程是一种等比带宽的滤波器,在本设计中也体现出了它的优点。

2.3.2 加权网络

加权网络包括加权因子表和加权结果两部分,频率计权反应的是不同频率产生对手伤害时假定的重要性,为了平衡不同频率处的振感差异,对整个频率段(6.3～1 250Hz)内的各分频加速度值进行加权处理。频率加权应与频谱分析同步进行,通过计算得到加权结果,作为振动评价的数据来源。

2.4 评价模块的设计

评价模块包括评价标准和评价结果两部分,是本测试系统的关键部分,需要进行面板设计和程序编写。根据式(3)和式(4)计算的结果,对照评价标准,可得到白指病发前的暴露时间和预期发生脉管异常的受暴露人员的分布百分数,此为本测评系统的最终结论。

3 实例应用

为了验证本系统的可行性与实用性,将此系统应用在剪羊毛机的手柄振动上,系统中手传振动测量传感器采用BK4374型三向加速度传感器,利用其特制的夹具BK4392型Hand-Arm Vibration Set在不影响操作者工作的前提下,直接感应和接收手臂承受的振动信号;选用NI SCXI-1523型电荷放大模块,将传感器产生的电荷信号转换为易于传输、处理的电压量信号;数据采集卡采用了Nl公司的6024E型多功能数据采集卡,它有12位A/D转换精度,采样率最大为20kHz,将采集到的模拟信号转换为数字信号,输入计算机。

基于以上实验装置,按照本测评系统的设计,采集到所需要的数据,进行频谱分析,参照评价标准,做出评价结果,每一过程都能进行存储和显示。由此可以看到:本系统操作简单,根据相应的提示可完成操作,而且测试效率高,在很短的时间内就可以完成整个测试与分析过程。

4 结论

本文设计的基于Labwindows软件平台的手臂振动测量与评价系统可用于直接测量手臂接受的振动量,并对暴露在振动中的手臂做出评价。测试与评价结果显示直观,面板设计人性友好、操作简便,不仅克服了传统测评方法计算繁琐、误差大、耗时长、投资大的缺点,而且提高了测试效率,加大了灵活性,很好地满足数字农业领域农业机械测量与评价的需要。

参考文献

[1]肖建民,凡颖.手传振动的危害及防护[J].中国安全科学学报,1998,8(1):48-51.

[2]建农.数字农业自主创新引人瞩目[J].农业装备技术,2007,33(2):29.

[3]陈俊强,张瑞洋,姚会玲.基于虚拟仪器的振动测试系统设计[J].粮食与食品工业,2011,18(3):42-44.

[4]ISO-5349,Prineiple for the measurement and evaluation ofhuman exposure to vibration transmitted to the hand[S].2001.

[5]GB/T14790.1-2009,机械振动—人体接触手传振动的测量和评价指南[S].2009.

【教育测量与评价】推荐阅读：

教育测量与评价10-12

教育心理学章节习题第十四章教学测量和评价08-09

【在线】17春北航《教育统计与测量》在线作业05-12

控制测量与测量方法07-15

工程测量实训英文自我评价10-19