软件测试评价

2025-01-18

软件测试评价（精选12篇）

软件测试评价篇1

随着软件规模和应用范围的不断扩大, 软件设计的复杂程度不断提高, 软件开发中出现错误或缺陷的机会也越来越多。同时, 人们对软件质量的要求也越来越高, 而银行业务软件的质量也备受关注。软件测试作为软件质量保证的重要手段之一, 正越来越受到重视。银行业务软件因为高复杂性、高安全性、高准确性的特点, 为软件测试带来一系列难度。尤其在测试评价方面, 还比较初级, 常见的方法有缺陷走势图、缺陷严重程度分布图等。这些方法可以看出软件缺陷的走向和分布情况, 对于测试评价也有一定的帮助。但是这些方法存在一定的缺点, 比如:指标不够量化, 评价指标过于单一, 不利于重复操作, 在实际应用中对测试评价人员的要求比较高, 由此影响最终的评价效果。

在本文中, 运用系统工程方法对工行个人金融业务考核系统的测试建立一个指标体系, 用户层次分析法确定各指标的权重, 并计算各项指标的满意度, 最后通过计算综合满意度对软件作出定量与定性的综合评价。

1、确定评价指标系统

按照系统工程方法的流程, 要进行系统评价, 必须建立评价的指标体系。

参照个人金融业务考核系统的需求分析, 共有27个功能模块, 各个模块有不同的优先级别, 分别是:"红色:优先级别最高", "绿色:优先级别次高", "黄色:优先级别最末", 不同模块产生的问题的后果是不一样的, 比如最末优先级别可能对系统影响不大, 而最高优先级别却可能使系统产生无法弥补的错误。考虑整个系统的满意度, 先分别考虑各模板的满意度, 再加权求和。

除了模块的重要程度外, 程序测试时的问题数比例、新增比例、关闭率也是很好的评价指标。问题数比例=测试中发现的问题数÷测试用例数, 反映了程序开发的正确性。新增比=新增问题数量÷己发现错误总数, 在软件测试过程中, 正常情况下错误的新增数量是递减的, 随着己发现错误数量的增加, 新增的错误数量将会减少。关闭率=100×关闭数量÷问题总数, 由于发现的问题经过修改后, 在新的一轮测试中如果此问题现象不再存在, 则认为此问题关闭。所以问题关闭的数量直接反映了问题修改的速度和质量。

根据上述分析结果, 将个人金融业务考核系统满意度确定为评价的总体目标 (O) , 将模块作为一级指标 (即准则层A) , 然后进一步分解细化, 构造出一个评价指标目标树, 如图1-1:

除了定出指标外, 还需要为这些指标定义满意度范围。这可以通过历史数据统计和开发人员、测试人员估计来确定。比如, 某一测试期间新增程序错误数量如果控制在5个以内, 则是完全满意;20个则是满意度的下限。那么这个指标的满意度表示如下式:

由实际情况确定个人金融业务考核系统中各指标的满意范围, 得表1-1:

2、指标权重的确定

本文采用层次分析法来确定各指标的权重。

2.1 建立判断矩阵

通过测试与开发人员对目标树同层次各项指标, 按其在上一层指标中的重要性, 进行两两间重要程度比较并按下述标准打分来建立判断矩阵:

对表1-1中各指标的相对重要程度做比较后得出判断矩阵如下:

2.2 指标权重的计算

采取求和法对表2-2, 表2-3, 表2-4, 表2-5计算, 得到各一级指标, 二级指标所占的权重, 结果如下:

3、满意度计算

首先根据已经收集的测试数据对最底层指标计算满意度。例如, 对于出现问题数比例, 评价该指标的满意范围为[0.1, 0.5], 且满意度递减, 那么这个指标的满意度表示如下式:

经测试得最高优先级别的问题数比例是6/26=0.2308, 那么满意度为:

表3-1列出了各二级指标的满意度计算

将二级的各评价指标的满意度计算加权和, 得到一级评价指标的满意度数值。例如对于最末优先级别, 其子层评价指标的加权满意度分别为0, 0.3445, 0.521, 则一级满意度指标为它们的和是0.8655。

综合满意度Q=0.0811+0.1008+05549=0.7368

4、评价分析

经过满意度计算后, 评价指标树中各层评价指标都会有其满意度值。可以直接通过判断目标层的满意度, 来判断对本次测试的结果是否满意。由表3-2, 综合满意度为0.7368, 不是很满意, 则从上至下逐层检查是哪些指标导致总体满意度偏低。

从一级指标的满意度可以看出:指标A1和A3是比较满意的, 高于85%, 而指标A2满意度不足35%, 所以重点分析是什么原因导致指标A2, 即次高优先级别的模块满意度太低。

由表3-1可以看出, 影响指标A2的三个二级指标满意度都不太理想, 分别为0.4523, 0, 0.4168。

先看指标B21 (问题数比例) , 本次测试在这个A2单元共采用了94个测试用例, 发现了30个问题, 比例为32%, 说明开发过程中存在较多的遗漏和错误, 同时, 由于测试的不完全性, 很多潜在的问题可能没有被发现, 可以考虑增加测试轮数。

再看指标B22 (新增比) , 其满意度为0, 需要重点注意。在测试后又发现了18个问题, 说明对己经发现的错误的修改不太成功, 或者第一轮测试未发现的问题较多, 间接反映了潜在问题的严重性。

指标B23 (关闭率) 为37%, 说明问题的修改速度较慢, 不能及时得完善程序, 可能会对后续的测试工作造成影响。

综合上述三个二级指标的分析, 可以得出结论:现在最大的问题就在于次高优先级别模块的开发与修改上, 一是开发质量不高, 存在着大量的问题。二是修改不够全面, 从而导致修改后产生了很多的问题;三是修改不及时, 不能保证在下一轮测试之前完成一定数量的问题的修改。

摘要：本文以工行个人金融业务考核系统的软件测试为例, 根据测试的结果, 建立了以相应的数学模型计算为基础的满意度评价体系, 从而判断该系统的性能。

关键词：软件测试评价,满意度,层次分析法

参考文献

[1]白勇军.银行业务软件测试评价研究.武汉:中国水运 (学术版) .2006 (06) .

[2]何克清.计算机软件工程方法.武汉:武汉大学出版社.1989.

[3]普雷斯曼 (美) .软件工程:实践者的研究方法.北京:机械工业出版社.2004.

软件测试评价篇2

在平凡的学习、工作、生活中，我们总免不了要写自我评价，自我评价是自我诊断、自我调节、自我完善的过程。怎么写自我评价才能避免踩雷呢？以下是小编精心整理的软件测试简历的自我评价范文（精选5篇），欢迎大家借鉴与参考，希望对大家有所帮助。

软件测试简历的自我评价1

热爱软件测试工作，可以胜任重复性工作，工作细致认真、积极主动、有耐心、严谨。

有较强的沟通技巧及团队合作精神，组织协调能力，较强的责任感及进取精神。

时间观念超强，能根据任务安排及时完成，承受较大的工作压力，能适应加班及出差工作。积极上进，不耻下问，具有发现问题并分析、解决应用问题的能力。

能与开发人员以及客户很好地进行沟通和交流，能与客户成为最为友好的朋友，最终与团队共同创造价值。具备良好的身体素质及心理素质，爱好爬山、徒步、骑自行车。

在今后工作中不断的积累经验，拓展自己各方面的知识

软件测试简历的自我评价2

1.对待工作认真负责，善于沟通、协调，有较强的组织能力与团队精神。

2.活泼开朗、乐观上进、有爱心。

3．具有很强的团队精神，有良好的组织、协调和沟通能力，有强烈的`集体荣誉感。

4．自学能力强，喜欢钻研新技术，敢于面对和克服困难。

5．有比较强的动手能力，勇于面对困难和挑战，有很好的分析问题与解决问题的能力。

软件测试简历的自我评价3

工作内容，奠定了本人具有较强缜密的issue洞察能力，在配合RDdebugissue的过程中让我具备了发散性思维和逻辑分析能力，造就基本代码读写和重构能力的基础；工作性质，让我具备较强的沟通能力、文档编写能力、以及对工作极强的责任心；由于公司性质，工作mail全部用英文沟通，让我具备一定的英文读写能力。生活中本人性格乐观开朗，抗压能力强，敢于挑战自己和勇于创新，拥有极强的学习能力和环境适应能力。

软件测试简历的自我评价4

本人性格开朗、稳重、有活力，待人热情、真诚;工作认真负责，积极主动，能吃苦耐劳，用于承受压力，勇于创新;有很强的组织能力和团队协作精神，具有较强的适应能力;纪律性强，工作积极配合;意志坚强，具有较强的无私奉献精神。

软件测试简历的自我评价5

初中英语非测试性评价的运用篇3

[关键词]非测试性评价;概念界定;意义;运用

中学英语教学中的非测试性评价，包括下列五个方面的主要内容：评价中学生在课内外英语学习过程中的态度、评价中学生学习英语的方法和策略、评价中学生学习英语时的学习行为、评价中学生的英语学习潜能和评价中学生英语学习的综合运用能力。在英语教学中，运用非测试性评价，可以从多个角度、多个层面评价中学生的英语学习状况。

一、非测试性评价的概念界定

十多年来，由于受中考指挥棒的负面影响，学校乃至整个社会都关注学生的期中考试、期末考试、升学考试，通过上述各种各样的考试来评价学生英语学习的效果。通过上述规范性极强的英语考试实现的学生英语学习效果评价，习惯性称之为英语测试性评价。而英语非测试性评价就是对中学生的英语学习进行下列五个方面的评价：评价中学生在课内外英语学习过程中的态度、评价中学生学习英语的学习方法和学习策略、评价中学生学习英语时的学习行为、评价中学生的英语学习潜能和评价中学生英语学习的综合运用能力。换句话说，就是英语教师在中学英语教学中对学生进行的一种量化评定与定性描述相结合的评价机制，是对中学英语教学中一贯采用的测试性评价机制的重要补充。

二、实施初中英语教学非测试性评价的重要意义

1.挖掘了学生英语学习的潜能。近年来，随着素质教育的开展和社会对不同层次人才的需求，广大英语教师逐渐认识到下列问题：（1）仅仅通过纸笔考试来考查学生学习英语的效果，会严重限制中学生英语人才的成长;（2）教学过程中，既要密切关注学生英语学业的成绩，又要密切关注学生学习英语的主动性和自觉性、英语口语交际能力、英语学习创新能力和英语学习合作探究精神等方面的发展。而初中英语教学非测试性评价机制的引入正是基于上述诸多方面，尤其是考虑最大限度地发挥学生学习英语的潜能，全面培养具有不同特点的英语人才。

2.进一步完善了评价机制。中学英语教学过程中，完善的教学质量评价机制必须包括测试性评价（即终结性评价）和非测试性评价（即形成性评价）。从某种意义上而言，英语形成性评价把人们此前单一的只关注重大考试的量化评价逐步转向将其与关注英语教学过程中质的把握与分析紧密结合起来，从而构建多维度的评价机制。需要强调的是英语非测试性评价在本质上是并不排斥量化的评价。它常常把某一项等级的评定、某些标准的量化、某一过程的描述性评定结果等整合应用。这种定性描述与量化评定相结合的非测试性评价手段，更有利于清晰、准确地评价学生学习英语的进展情况和某一单项能力提高的情况。所以，自从引入了英语形成性评价机制，终结性评价机制也得到了进一步的完善。如此，学生在密切关注中考的同时，也密切关注了英语学习的过程，不断调整了英语学习的策略，不断体验到了英语学习进步与成功的喜悦，不断促进了自己英语口语交际能力的发展和英语综合能力的发展。与此同时，由于引入了英语形成性评价机制，不仅提高了教师在英语教学中的科研能力，还有效推动和促进了“三化”，即教师英语教学过程设计的最优化、教师英语教育理论实践的经常化和教师英语教学成果的最大化。

3.促进了学生课外英语学习的自主性和自觉性。英语形成性评价包括了学生课内外英语学习态度的评价、学生课内外英语学习行为的评价和学生课内外英语学习效果的评价。学生为了在上述评价中有良好的表现，势必在课外去图书馆、借助网络等查阅英语学习资料，参与班级或者学校举办的英语课外活动，亲身参与和多维体验英语学习的过程。这些课外英语学习活动包括参与英语角、组织英语沙龙、编排英语小报、模拟设计英语广告、编排英语小节目、表演英语戏曲、英语歌咏比赛、英语辩论、英语演讲比赛、英语志愿者活动等。这些活动的开展与及时评价，推动了学生英语课外活动的开展，促进了课外学生自主学习能力的提高。

三、非测试性评价的运用

1.评价课堂学习为主，兼顾评价课后学习。在进行中学生英语学习非测试性评价时，教师必须根据英语听说读写的特点和英语量化表的细则要求，针对某个英语学习项目进行具体评价。以非测试性评价学生英语的听说能力为例，根据评价量化表的细则要求，必须对学生进行下列12个方面的综合性评价：（1）对听说题型的把握;（2）对预测内容的判断;（3）对文章体裁的判断;（4）对听说信息的获取;（5）口语交际时语调的自然度;（6）口语交际时吐字的清晰度;（7）口语交际时单词发音的准确度;（8）口语交际时语速的适中度;（9）复述听力材料的准确度;（10）复述课文内容的准确度;（11）背诵课文的准确流畅度;（12）完成书面表达的能力等。而对学生课后的评价主要通过教师对学生布置的听说读写材料进行检查交流去完成。如：教师利用听说课的时间播放部分学生的自我录音材料，各小组对此讨论评价，教师作点评等。

2.评价指定学习材料为主，兼顾评价自选学习材料。

学生英语指定学习材料的内涵为：（1）经过英语教材编写专家严格审定编写的英语教材;（2）英语学习中的同步指导用书;（3）教师为学生精选后指定的英语网络电子用书;（4）与英语学习相关的英语电视讲座等。评价时，上述学习材料是主要的评价主体。

以非测试性评价学生英语学习中的写作能力为例。因为学生听说读能力的形成是构建学生英语书面表达能力的前提，所以，教师首先得评价学生的英语听说读能力。在现行初中英语教材中，几乎在每个单元的导入部分都配备了2—3幅图片。这是学生课前预习时极好的资源。因此，教师必须引导学生仔细观察图片的内容，引导学生用英语写出每幅图的关键词，或用英语准确完整地表达图画的意思，或者2人一组轮流描述图画的主要内容等。然后，教师推荐优秀的英语描述代表上讲台作示范性描述，其间对之插入说、写的评价机制，以此提高学生的英语口语交际能力和英语书面表达能力。

评价学生英语学习过程中的自选学习材料，主要是指评价每位学生每个学期中自购的英语学习辅导材料。通常情况下，评价内容为学生每学期必须自购一套英语同步学习资料，其中包括评价学生在课外使用的英语学习有声影视资料等。

3.以他人评价学习情况为主，兼顾学生评价自我学习情况。通常情况下，非测试性评价学生英语听说能力往往是通过他人评价来完成的，不过，也要兼顾学生的自我评价。当然，无论是他评还是自评，教师都要制定评价的细则。比如，在评价学生的听说能力时，如果学生能够对某一材料的基本要点进行准确流畅的描述，就应该给多少分，如果描述得有欠准确和流畅，应该给多少分等。此外，家长通过在学生评价单中签字等形式，可以准确评价学生在家里时的英语学习态度。

在初中英语教学中，建立并运用非测试性评价机制，能使教师更全面地分析、把握与调控学生的英语学习情况，从而使学生的英语能力得以不断提高。因此，教师要合理运用非测试性评价机制，更好地促进英语教学水平的提升。

参考文献

[1]陈瑾.非测试性评价在中学英语听说教学中的应用[J].山东师范大学外国语学院学报（基础英语教育）.2009，（04）.

[2]管群.浅谈改革中学英语教育评价体系的策略[J].中学英语之友（下旬）.2010，（06）.

[3]李芳.形成性评价在中学英语教学中的实施策略及意义[J].考试周刊.2008，（37）.

[4]乔学琴.中学英语教学评价中存在的问题及应对策略[J].中学教学参考.2011，（22）.

[5]郑旺全，陆锡钦.从测试的发展看能力目标在英语评价中的作用[J].课程·教材·教法.2009，（11）.

“双向评价评价系统”的软件架构篇4

关键词：双向评价,软件,架构

1 引言

所谓软件构架,是指软件开发人员根据用户提供的理论构想,专门设计的技术流程。软件架构不但决定着开发人员采用何种技术手段实现用户所提出的理论构想,而且也关系到所开发软件实现方式的可行性、先进性、实用性和可操作性[1,2,3]。因此,一部理想软件的开发,必须从建立软件构架入手,只有做到这一点,才能实现所开发软件的预期目标。本文结合“双向评价系统”的开发,就此问题谈一些具体做法,供大家参考借鉴。

2 软件系统概述

2.1 软件系统架构模式

“双向评价系统”是基于校园信息系统(Campus-Wide Information Systems,CWISs)平台的浏览器/服务器(Browser/Server)结构的管理信息系统(Management Information System,MIS)。它利用校园网提供的Web服务,使用简单、一致的浏览器接口,实现评价数据的采集、汇总和共享。与Windows 2000 Advanced Server同时提供的因特网信息服务(Internet Information Server,IIS)就是功能强大的Web服务器。IIS提供对动态网页(Active Server Pages,ASP)的支持。“双向评价系统”主要由ASP页面及数据库管理系统组成。系统客户端配置Windows XP+IE 6作为基本运行支持环境。

2.2 数据库选用

可供选择的数据库管理系统较多,如Access、SQL Server等。根据该系统的应用需要并考虑到数据库维护等的问题,我们选用了功能强大而又易于维护的Access数据库系统。

2.3 ASP页面开发

ASP包含服务器脚本(主要使用Java Script,VBScript)、对象和组件。目前流行的网页开发工具,如Front Page 2003等,均支持ASP开发。使用Front Page,利用脚本语言和内建的对象、组件,可以非常有效地实现对评估数据的访问和更新,也可以得到较友好的用户界面。有条件的可以使用微软的Visual Inter Dev,它提供创建和维护Web站点的开发环境,并且与SQL Server紧密集成,可以直接设计和修改数据库的数据表。评价系统中使用到的内建对象主要有:

1)Application Object-这个对象表示的信息可以与ASP应用程序的所有用户进行共享。

2)Request Object-表示由浏览器发向服务器的所有信息,包括表单变量和查询字符串。

3)Response Object-表示由服务器发向浏览器的所有信息,包括由ASP网页发送的HTML内容。

4)Server Object-用于启用服务器上不同的工具函数。

5)Session Object-表示有关特定用户会话的信息。比如登录系统的用户、用户单位及用户角色等,见图1。

3 评价系统主要功能及角色划分

3.1 评价系统功能设置

评价系统可对各类人员,如学员、教员(同行)、专家、领导所作评价数据的采集。并按指定方式,进行数据汇总,生成各类汇总结果。主要适用于平常教学不同方面的水平衡量、所设立教学优胜奖的最终结果统计和对8个方面的满意度进行汇总。同时,系统还可以进行各种评价意见和建议的汇总,得到来自各个层面的合理建议和需要解决的问题,便于教学管理部门及时发现问题。

3.2 用户角色划分及功能

根据系统登录用户在教学评价中担负的任务,将用户划分为4种不同的角色,并对不同的角色授予不同的功能或权限。包括:

1)学员:参与教学评价,包括课堂理论教学、实验教学、教学课件,参与满意度评价。

2)教员:主要指讲师和助教,作为同行参与课堂理论教学、实验教学、教案质量、教学课件质量等评价,参与满意度评价,参与对本教研室承担课程进行维护,参与在教研室范围内对上述项目进行自查自评。

3)专家:主要指教授和副教授,作为专家进行课堂理论教学、实验教学、教案质量、教学课件质量等教学质量评价,参与满意度评价,参与对本教研室承担课程进行维护,参与在教研室范围内对上述项目进行自查自评。

4)领导:包括校领导、部(处)领导、训练部(处)机关参谋和学员队管理干部。作为领导对课堂理论教学、实验教学、教案质量、教学课件质量等教学质量进行评价,负责对评价结果、评价意见建议进行通报和总结讲评,如果需要经系统管理员许可,也可以参与满意度评价。

3.3 系统管理员主要任务

系统管理员作为超级用户应指定专人担任,专门负责评价系统后台数据的管理。包括数据备份、系统设置、系统用户角色称谓维护、专业管理、部门管理、用户管理、课程管理、ABCD等级系数维护、设置教学评价项目、设置各教学评价项目指标体系、设立教学优胜奖项目、设置满意度评价项目、设置满意度评价内容等。也可以发布系统广播、撰写规范制度。原则上,系统管理员不参与教学评价及满意度评价,如系统授权许可,也可以参与相关测评。

4 系统数据库结构

系统采用了Microsoft Access数据库。根据系统功能要求,设计了16个数据表。

1)ABCD等级系数abcd,见图2。

2)教学质量评价项目aspect,见图3。

3)满意度评价项目asp2,见图4。

4)教学质量评价结果erecord,见图5。

5)教学优胜奖winner,见图6。

6)教学质量评价指标idx,见图7。

7)满意度评价项目idx2,见图8。

8)课程名称lessons,见图9。

9)专业名称major,见图10。

10)满意度评价记录satisfaction,见图11。

11)系统广播news,见图12。

12)用户角色roles,见图13。

13)制度规范rules,见图14。

14)系统设置systemsetting,见图15。

15)部门列表units,见图16。

16)用户列表users,见图17。

参考文献

[1]董剑利,黄应堂,李小明,等.数据库网站技术的发展和应用[J].甘肃教育学院学报,2000,14(3):54-57.

[2]姚亚军,黄应堂.试卷分析计算机应用软件的研究与开发[J].甘肃教育学院学报,2002,16(1):33-35.

软件评价指标篇5

● 定制的软件可能难于理解，难于修改，在维护期间，企业的维护费用大幅度增加；

● 企业对外购的软件质量存在怀疑，企业评价软件质量没有一个恰当的指标，对软件可靠性和功能性指标了解不足；

● 软件开发商缺乏历史数据作为指南，所有关于进度和成本的估算都是粗略的。因为没有切实的生产率指标，没有过去关于软件开发过程的数据，企业无法精确评价开发商的工作质量。

为此，有必要先了解软件的质量评价体系。美国的B.W.Ｂoehm和R.Brown 先后提出了三层次的评价度量模型：软件质量要素、准则、度量。随后G.Mruine提出了自己的软件质量度量SQM技术，波音公司在软件开发过程中采用了SQM技术，日本的NEC公司也提出了自己的SQM工具，即SQMAT，并且在成本控制和进度安排方面取得了良好的效果。

第一层是软件质量要素，软件质量可分解成六个要素，这六个要素是软件的基本特征：

1.功能性：软件所实现的功能满足用户需求的程度．功能性反映了所开发的软件满足用户称述的或蕴涵的需求的程度，即用户要求的功能是否全部实现了。

2.可靠性：在规定的时间和条件下，软件所能维持其性能水平的程度。可靠性对某些软件是重要的质量要求，它除了反映软件满足用户需求正常运行的程度，且反映了在故障发生时能继续运行的程度。

3.易使用性：对于一个软件，用户学习、操作、准备输入和理解输出时，所做努力的程度。易使用性反映了与用户的友善性，即用户在使用本软件时是否方便。

4.效率：在指定的条件下，用软件实现某种功能所需的计算机资源（包括时间）的有效程度。效率反映了在完成功能要求时，有没有浪费资源，此外＂资源"这个术语有比较广泛的含义，它包括了内存、外存的使用，通道能力及处理时间。5.可维修性：在一个可运行软件中，为了满足用户需求、环境改变或软件错误发生时，进行相应修改所做的努力程度。可维修性反映了在用户需求改变或软件环境发生变更时，对软件系统进行相应修改的容易程度。一个易于维护的软件系统也是一个易理解、易测试和易修改的软件，以便纠正或增加新的功能，或允许在不同软件环境上进行操作。

6.可移植性：从一个计算机系统或环境转移到另一个计算机系统或环境的容易程度。

第二层是评价准则，可分成22点。包括精确性（在计算和输出时所需精度的软件属性）；健壮性（在发生意外时，能继续执行和恢复系统的软件属性）；安全性（防止软件受到意外或蓄意的存取、使用、修改、毁坏或泄密的软件属性）；以及通信有效性、处理有效性、设备有效性、可操作性、培训性、完备性、一致性、可追踪性、可见性、硬件系统无关性、软件系统无关性、可扩充性、公用性、模块性、清晰性、自描述性、简单性、结构性、产品文件完备性。评价准则的一定组合将反映某一软件质量要素，软件质量要素与评价准则间的关系如下图：

第三层是度量：根据软件的需求分析、概要设计、详细设计、实现、组装测试、确认测试和维护与使用七个阶段，制定了针对每一个阶段的问卷表，以此实现软件开发过程的质量控制。对于企业来说，不管是定制，还是外购软件后的二次开发，了解和监控软件开发过程每一个环节的进展情况、产品水平都是至关重要的，因为软件质量的高低，很大程度上取决于用户的参与程度。

这里需要说明几点：

（1）对于不同类型的软件，系统软件、控制软件、管理软件、CAD软件、教育软件、网络软件及不同规模的软件，对于质量要求、评价准则、度量问题的侧重点有所不同应加以区别。比如：

软件质量保证和评价活动有其不同的侧重点。在需求分析，、概要设计、详细设计及其实现阶段，主要评价软件需求是否完备，设计是否完全反映了需求以及编码是否简洁、清晰。而且，每一个阶段都存在一份特定的度量工作表，它由特定的度量元组成，根据度量元的得分就可逐步得到度量准则，要素的得分，并在此基础上做出评价。这一点很适用于同软件开发商合作开发的企业。

（2）对软件质量各阶段都进行度量的根本目的是以此控制成本、进度，改善软件开发的效率和质量，但是，目前大规模的软件公司在我国并不多，大多数软件开发单位都缺乏软件质量保证与软件质量评价的专门部门，因而企业可以委托专业机构参与帮助软件质量控制与保证。如美国的METRTQS公司就是专门从事软件质量评价的公司，而日本的NEC公司是由公司内部的软件质量保证组织进行。

（3）企业选择软件供应商、开发商，需要考察该公司是否建立起自己的软件质量度量和评价数据，数据库中是否存有与本企业所在行业相关的软件，是否具有相关的开发经验。

软件在企业中的应用越来越广泛，获取软件的途径有四种，自行开发，直接外购，外购再二次开发，与软件开发商合作开发。而其中又以合作开发最为普遍，因为这种方式更能满足企业独特的业务流程，更有针对性。合作开发的软件是否好用，质量如何，就需要用到上文中的质量衡量标准。目前有一些比较好的软件质量评价平台，如上海计算机软件评测重点实验室的SQTF，就是根据被测软件的类型和特点，针对软件六大质量特性，21项子特性，选择不同的度量元，形成的评价体系，以此为依据，对被测软件进行定性、定量、独立的技术测试，注重的是用数字说话，更具科学性。例如，企业选购财务软件，首先是要满足功能性，其次是可靠性。软件可靠性的依据不是软件已经过多少周的测试、调试，而是在可靠性预测模型中，定量的估计出软件中每千行代码尚存在多少个错误没有被消除，即KLOC的大小。更进一步，通过软件质量测量，用户知道该财务软件在今后使用中的平均失效前工作时间（MTTF）和平均失效间隔时间（MTBF），这样，企业评价一套软件，就有据可依了。

谈小学英语的评价和测试篇6

关键词：重要保障；信息反馈；督促；评价内容广泛

G623.31

教师的整个教学工作的基本环节包括备课、上课、课外作业的布置和批改、课外辅导、学生成绩的评定五大块。五大块之间相辅相成，缺一不可。在此，我结合10多年来的教学经验，谈一谈其中的一块——评价。

一、评价的意义

科学的评价是实现课程标准的重要保障。一方面，对教师而言，经过一段时间或一个学期的教学工作，对学生的学业进行测试与评估，可以获取英语教学的反馈信息，即检查自己的教学计划和教学方法是否适合学生，以便及时地总结经验，作适当调整，它既能改进教学工作，又能促进教师不断提高教育教学水平；另一方面，对学生而言，他们非常希望得到老师和长辈们的认可、赞许，评价与测试可以督促他们复习功课，了解自己的掌握程度，了解自己的薄弱点、薄弱环节，可以促使学生在以后的时间多加重视，提醒学生改进自己的学习方法。同时，学生从老师那里得到自己一段时间学习以来的评价，可使他们获得学习成就感，从而增加其学习英语的兴趣和自信心。再次，对家长而言，评估与测试可使他们充分了解自己子女近段时间的学习情况，以便及时给予子女正确的引导、帮助，或者鼓舞、表扬，甚至批评，从而督促等等。测试与评估是学校教学工作中的一个重要环节。

二、评价内容以其种类

小学英语评价的内容极其广泛，不仅包括语言知识、语言技能和实际交际能力，还应包括学生在学习过程中所表现出来的学习态度。评价还可分为测试型评价和非测试型评价两种形式。非测试型评价即形成性评价。小学英语的主要目的之一即通过一系列的教育教学活动激发学生学习英语的兴趣，养成良好的学习习惯。由此不难看出，教学评价不仅要注重学生学习的结果，而且更需注重学生学习的过程。形成性评价在整个教学过程中应该占主导地位。

三、评价的多样化

（1）操作对象的多样化

A教师。教师评价特别强调教师对学生学习过程的培养和观察。教师在进行评价时，须考虑评价的实际效果，应注意评价语言及形式的多样性和灵活性。教师要注意根据学生的年龄特征和个性差异采取不同的评价方式，不能以评价为目标而进行教学。特别是课堂中教师的口头评价。评价应该对学生的学习产生一种激励、鼓舞的作用，即评价应以正面为主。教师必须密切关注学生，对他们的学习情况作出及时、有效、全面性的评价，使学生在英语的学习过程中不断体验成功与进步。如果学生答对了，要给予肯定、赞扬；如果学生在回答时出现语音、语调、语法等方面的错误时，不要注重纠错。教学固然要严谨，但“纠错”其实也是对学生的一种评价。B.口试评价。口试评价可以考查学生运用语言进行实际交际的能力，可看出学生语言的熟练程度。口试的重点应落在语言的标准、语调的自然、语速的流利及语言的运用、语言的即兴反应上。口试可分为听、做、说、读、唱、玩几个模块。我一般是采取这样的形式口试：

听、做：a.听听做做：如stand up， point to…， Polly says “close your eye.”…等。b.听音模仿：听录音，根据录音说出正确的句子。

说：a.日常用语，如Whats your name？ How old are you？不用说Whats your telephone number？（numbers） Can you spell your Chinese name？（letters） .b. 看图说话：如Where is the …？ How many … can you see？ What color is it？等。

c. 看图说话：看图作简单描述或作出评论，适合高段

d. 会话（1）根据所给题目即兴会话，如talk about your family（适合高段，去年六年级口试时本人曾采用过，稍难，但因为平时上课就有即兴扩展性会话，学生能行）。

e. 会话（2）：根据所给情景即兴编演对话，如borrowing things， making a telephone call等。

读：a. 读单词 b. 读课文 c .读音标 d. 读音标组合 e. 读课外段落（生词注音标）

唱：a. 唱儿歌 b. 唱歌谣

演：a. 可以是课文对话的表演，自编对话的表演 b. 可以是儿童剧、课本剧的表演，如PEP中的story time，如人教版Book 4的the cock and the fox等。

C.笔试评价。因小学英语大纲的要求是听说领先，所以笔试的形式应以听说为主，题型要适合儿童心理，简单易懂且花样又多，如listen and match， listen and tick or cross， listen and color， listen and circle， listen and write （ letters）， listen and number， listen and draw， listen and connect the dots （ letters ， numbers）， look and match等。听力的速度不宜过快，要以培养学生良好应试心理素质为重点，逐步、逐年加速。特别是涂色题，要给学生以充分的完成时间，以免引起急躁心理，影响下面听力考试，影响成绩，进而影响其学习英语的积极性；题目要清楚，特别是有图的，要一看就能看懂的那种，不时是似是而非的那种。

三、评价注意点

1.注意以奖为主，以惩为副

儿童在学习活动中不断取得成就并受到奖励，有利于培养乐观、进取和勤奋的人格；反之，儿童则容易形成自卑。因此，在反馈、评价学生时，教师需时刻注意以表扬、奖励为主，批评、惩罚为副。不过。这并不意味着教师可以滥用表扬、批评或者可以對学生的错误睁一只眼，闭一只眼。奖励作为外部强化的手段虽然能增强学生的学习动机，但使用不当也可能会降低学生的学习动机，因此要注意使用的分寸。

2.注意尽量以“高分”评价。皮格玛利翁效应及教学实践明，让每位学生都能得高分，都有机会得高分，能让学生感受到自我的价值，体验成功的喜悦，可以激发其学习英语的兴趣，提高学习的积极性。比如规定满分为100分或者5星，实际操作时可以超过100分或5星。有时对于一个自己非常了解的学生，甚至在某些环节，如朗读，可以采取免考的方法，以此为赏识与赞美，使其充分感受被完全信任的喜悦，从而更加坚定信念：只要平时学得好，老师一定会给一个好的评价。无论是学生还是家长，此举反馈都较好。

3.注意评价形式的新鲜感。如在星级评价时，可用不同形式代表不同等级，可有代换式，如依次向上的顺序为：奖励一次得1颗星星，得两颗星星换一颗红星，得五颗红星换一面红旗，得五面红旗换一朵红花或笑脸；也可每表现好一次，得五角星中的一角，直到得满五角，奖励其一颗纸星星。星星评价法较为实用，一则是因为操作简单，二则是因为它的独特之处：全面性和全程性。它为每一个学生提供了获得成功的机会。

4.注意将评价坚持到底，为学生建立一份学习档案，将每期学生的自评、互评、教师评价、家长评价汇总并做出学期综合性评价。

软件测试评价篇7

近年来航天事业飞速发展, 航天测控软件的规模和复杂程度不断增加, 该类软件质量也面临着巨大的考验, 需要对软件的质量进行客观、定量的评价。使用传统的定量分析方法难以对软件质量进行合理、全面的评价[1,2], 文章结合一个航天测控软件方面的应用实例介绍了一种可操作性强、实用的软件质量评价方法。

1软件质量度量体系

软件质量为“软件特性的总和, 软件满足规定或潜在用户需求的能力”[3]。要对软件的质量进行定量分析, 需要建立待评价软件的质量度量体系。

软件质量度量体系一般分为软件内部质量和外部质量度量体系、软件使用质量度量体系。

1.1软件内部质量和外部质量度量体系

软件内部质量和外部质量度量体系如图1所示。

外部质量和内部质量度量体系将软件质量属性划分为6个特性, 并进一步细分为若干个子特性。软件的这些特性和子特性最大可能地涵盖了其他早期质量度量体系中所有的因素, 而且彼此交叉最小。质量特性和质量子特性可以通过包含该软件的系统所提供的能力的程度从外部来测量, 可操作性强, 一般软件的评价也是基于软件的内部质量和外部质量体系。

1.2软件使用质量的度量体系

软件的使用质量包括:软件的有效性、生产率、安全性和满意度。

软件的使用质量是从用户角度看待的质量, 其度量是在真实的系统环境下进行的。由用户在特定的使用环境中测量软件产品是否达到用户要求的有效性、生产率、安全性和满意度等具体目标。

现基于软件的内部质量和外部质量体系展开对软件评价方法的介绍。

2软件质量评价方法

2.1软件质量评价原则

软件产品质量评价包括对软件 (可执行程序) 质量的评价和对相关文档的评价。

软件 (可执行程序) 的评价按照以下原则:首先按照软件测试问题的错误等级为软件的每个子特性赋值, 再按照子特性的重要程度分别加权, 得到软件的特性值, 根据软件的特性重要程度加权得到软件的量化评价结果。

相关文档的评价原则:每个文档包含若干特性, 首先根据每个特性的重要程度加权得到该文档的量化评价结果, 再根据每个文档的重要程度加权得到所有文档的总量化评价成绩。

软件产品综合质量评价:根据软件和文档的重要程度加权得到软件产品的综合量化结果。评价方法规定一个软件产品最高的质量评价结果满分为10分, 其中软件 (可执行程序) 占的比重为60%, 相关文档占的比重为40%。

2.2软件的质量评价方法

2.2.1 软件 (可执行程序) 的评价方法

将软件 (可执行程序) 的测试问题按照严重程度分为3个级别:一级错误、二级错误和三级错误。

① 软件测试量化赋值表:

软件的质量体系有若干个特性, 某特性又有若干子特性。设:

A=在评价中检测某错误级别的子特性功能数;

B=评价的某子特性功能数;

X=1-A/B其中, 0.0≤X≤1.0。

从公式可以看出, X越接近1.0, 说明软件某子特性越好。

软件测试量化赋值对照表如表1、表2、表3所示。

式中, p为某特性的权重;g为某子特性的量化测试结果。

各个软件重视的某特性的子特性不同, 有些软件只涉及功能性的某个子特性, 那些不涉及的子特性权值就设为0, 同时可以根据软件的实际应用特点对其他子特性的权值进行调整。

② 软件测试成绩:

软件测试往往要进行测试、回归测试, 重要的软件甚至要进行多轮回归测试。

设软件的单轮测试量化结果为:

G软件质量=0.4×G功能性+0.2×G可靠性+0.1×G效率性+0.1×G易用性+0.1×G维护性+0.1×G可移植性。 (3)

根据软件的不同, 以上质量特性的权值可以进行适当调整。则定义被评价软件的测试量化结果为:

$Ρ_{s} = \sum_{i = 1}^{Τ} \frac{λ + 1}{λ + i} \times (Ρ_{i} - Ρ_{i - 1})$ 。 (4)

式中, P0=0;T为软件的测试次 (轮) 数;λ为常数, 此处设定为3, 指通常情况下规定的测试次 (轮) 数。

③ 遗留问题量化:

在测试的过程中有时会出现无法修改的遗留问题, 为了完善评价体系, 增加修正因子, 即遗留问题对软件的影响。规定每个问题扣0.1分, 则遗留问题对软件量化结果的影响:

Py=0.1×遗留问题数。 (5)

④ 软件总量化结果为:

P软件=Ps-Py。 (6)

2.2.2 技术文档的质量评价方法

文档是软件的一个重要组成部分。文档的评价不仅仅是对文字的校对, 还可以辅助找到更多的程序错误, 例如软件功能实现的错误、易用性不好、用户手册与程序实现不吻合等问题。在介绍的评价技术中, 主要关注软件需求说明书、软件概要设计说明书和软件操作手册。

将所有独立软件对应的软件需求说明书、软件概要设计说明书、软件的用户手册分别定义为3个集合:S1、S2、S3。

设Si中审查员j所对应的子集为Aij, dijm为审查员j对Aij中的第m个文档的打分成绩, 该审查员对Aij打分的量化结果为:

$Ρ_{i j} = \frac{1}{Κ} \sum_{m = 1}^{k} d_{i j m}$ 。 (7)

式中, dijm∈[0, 10];k为Aij中文档的数量。则Si类技术文档质量评价量化定义为:

$D_{i} = \frac{1}{n} \sum_{i = 1}^{n} Ρ_{i j}$ 。 (8)

因为软件需求说明书最重要, 所以规定技术文档的质量评价定义为:

F文档=0.4×D1+0.3× (D2+D3) 。 (9)

2.2.3 软件产品综合质量评价方法

根据软件 (可执行程序) 和文档的重要程度加权得到软件产品的综合量化结果。

软件产品质量评价总量化结果定义为:

P产品=0.6×P软件+0.4×F文档。 (10)

在实际应用中, 可以根据用户需求和软件产品的应用领域等实际情况, 考虑对各加权建议值进行调整, 以得到更加客观的软件评价量化结果。

3在航天测控软件中的应用

将本评价方法应用于某航天测控应用软件, 由于待评价软件本身的重要性, 进行了1次测试、2次回归测试共3次测试。

基于航天软件的特点, 该类软件最注重软件功能性的准确性和安全保密性, 一个计算结果的小偏差有可能引起卫星轨迹的大距离偏离轨道, 从而造成不可估量的损失;而且航天软件属于国防软件, 要求向卫星发送的测控数据和回传数据的准确性高、安全保密性强, 软件与外部硬件之间的接口准确性和保密性要求极高。其次还有功能性的适合性、互操作性以及软件的其他质量特性。

3.1软件评价量化结果

3.1.1 第1次测试。

发现5个上传卫星指令错误, 在测控专业, 上传卫星指令错误被认为是很严重的错误, 所以定为一级错误, 则依据式 (1) 得到g准确性=5。

第1轮测试中, 发现3个界面元素错误, 但不影响软件功能, 定为三级错误, 根据式 (1) 得到g适合性=9。

没有发现安全保密性、互操作性和功能性的依从性错误, 所以依据式 (1) 得到:

g安全保密性=10;g互操作性=10;g功能性的依从性=10。

依据式 (2) , 则

G功能性=0.3×5+0.3×10+0.2×10+0.1×

9+0.1×10=8.4。

同理根据该过程得到软件的其他质量特性为:

G可靠性=10;G效率性=10;G易用性=10;

G维护性=10;G可移动性=10。

根据式 (3) 得到软件的质量为:

G软件质量=0.4×8.4+0.2×10+0.1×10+0.1×10+

0.1×10+0.1×10=9.36。

3.1.2 第1次回归测试。

只发现1个界面元素错误, 但不影响软件功能, 定为三级错误, 则根据式 (1) 得到:G适合性=9。

没有发现准确性、安全保密性、互操作性和功能性的依从性错误, 所以依据式 (1) 得到:

g准确性=10;g安全保密性=10;g互操作性=10;

g功能性的依从性=10。

依据式 (2) , 则

G功能性=0.3×10+0.3×10+0.2×10+0.1×9+0.1×10=9.9。

同理根据该过程得到软件的其他质量特性:

G可靠性=10;G效率性=10;G易用性=10;

G维护性=10;G可移植性=10。

根据式 (3) 则得到软件质量:

G软件质量=0.4×9.9+0.2×10+0.1×10+0.1×10+0.1×10=9.96。

3.1.3 第2次回归测试

没有发现准确性、安全保密性、适合性、互操作性和功能性的依从性错误, 所以依据式 (1) 得:

g适合性=10;g准确性=10;g安全保密性=10;

g互操作性=10;g功能性的依从性=10。

依据式 (2) , 则

G功能性=0.3×10+0.3×10+0.2×10+0.1×10+0.1×10=10。

同理根据该过程得到软件的其他质量特性为:

G可靠性=10;G效率性=10;G易用性=10;

G维护性=10;G可移植性=10。

根据式 (3) 得到软件质量:

G软件质量=0.4×10+0.2×10+0.1×10+0.1×10+0.1×10+0.1×10=10。

3.1.4 被评价软件的成绩

根据式 (4) 得到被测软件的评价成绩为:

Ps=9.87。

式中, P1=9.36;P2=9.96;P3=10。

软件没有遗留问题, 所以依据式 (6) 得:

P软件=Ps=9.87

3.2技术文档质量和软件产品综合质量评价结果

软件需求说明书评审成绩D1=8.3;

软件概要设计说明书D2=9.2;

软件的用户手册D3=7.0。

根据式 (9) 得到技术文档质量评价结果:

F文档=0.4×8.3+0.3× (9.2+7.0) =8.18。

根据式 (10) 得到软件产品综合质量评价结果:

P产品=0.6×9.87+0.4×8.18=9.2。

4结束语

航天测控软件由于行业的特殊性, 其测控数据的准确性和安全保密性要求高, 而软件质量评价方法是一个重要而又较困难的新兴研究领域。结合作者在航天测控软件中的实际应用给出了一个简单实用的评价方法, 通过1次测试、2次回归测试, 从量化的角度对软件进行了评价, 从而提高了软件的使用质量。

摘要：针对航天测控软件的特点, 行业的特殊性、测控数据的准确性和安全保密性, 介绍了对软件质量进行客观评价的量化分析方法, 包括软件 (可执行程序) 的质量评价方法、技术文档的质量评价方法和软件综合质量评价方法。论述了软件内部质量和外部质量体系、软件使用质量体系。结合实例阐述了航天测控软件的评价过程。

关键词：软件质量,质量体系,质量评价,功能性,准确性,安全保密性

参考文献

[1]黄锡滋.软件可靠性、安全性与质量保证[M].北京:电子工业出版社, 2002.

[2]MUSAJ D.Software Reliability Engineering[M].北京:机械工业出版社, 2003.

[3]柳纯露, 黄子河, 陈渌萍.软件评测师教程[M].北京:清华大学出版社, 2005.

[4]GJBZ141-2004.军用软件测试指南[S].

整车抛负载测试与评价篇8

汽车行驶工况的复杂性,造成汽车电器件的工作环境比较恶劣,因此要求汽车电器件应有足够的抗冲击和抗干扰能力[1],特别是在整车环境下易出现的典型电压脉冲,如抛负载脉冲;本文主要是针对汽车抛负载脉冲在实车环境下的测试、评价和预防等方面的内容进行叙述[2]。

1.抛负载产生的原因

传统汽车大多采用带硅整流器的三相同步交流发电机,发电机在正常工作时,若负载突然减小或完全无负载,会引起发电机输出电流急剧下降,由于发电机内部的定子绕组和励磁绕组受电磁感应的影响[3],在发电机电枢绕组上产生正向瞬变过电压,这种现象叫做发电机抛负载,产生的正向瞬变脉冲称为抛负载脉冲。

2.抛负载的危害

汽车出现抛负载现象时,几乎所有直接与蓄电池相连的电子电器都要承受抛负载电压的冲击,若正向脉冲的峰值过大,很可能造成电器设备尤其是电子设备的损坏,严重时直接影响汽车安全[4];同时抛负载现象严重影响发电机的寿命,容易击穿发电机整流器的关键器件,影响汽车供电系统的稳定性。

车辆的行驶环境比较恶劣,车辆保养及维护不及时,在发电机运转时容易出现蓄电池端子松动或脱落既产生抛负载现象;抛负载会对整车电源网络造成瞬态脉冲干扰,必须对发电机产生的抛负载瞬态脉冲进行限制,以保障电源网络的稳定性;同时又要求关键电子器件具备一定的抗抛负载电压脉冲的能力。

因此在车辆的研发阶段,主机厂应在实车环境下,制造极端工况或条件,验证发电机在出现抛负载现象时产生的瞬态脉冲是否符合相关标准,验证关键电子器件对抛负载脉冲的抵抗能力是否满足要求。

3.抛负载测试

在实车状态下,模拟发电机抛负载现象,主要测试情况分为以下两种:

a在发电机不同运转状态下,断开蓄电池(要求蓄电池的SOC小于50%)

b去掉蓄电池,在发电机不同运转状态下,断开大功率的用电负载

如图1所示,为某款车型,在发动机转速为2000时,断开蓄电池(SOC为30%)时产生的抛负载脉冲波形。

4.抛负载测试评价

实车环境下的抛负载测试,目前国家无明确的标准规定,在实际测试中,可参照相关的标准(如ISO 16750-2、ISO 7637-2)和整车厂的具体EMC试验标准,具体评价参数及参考波形可参照图2所示。

汽车发电机对产生的抛负载脉冲分为带抑制功能和不带抑制功能,如图2所示,测试时可根据发电机的种类对比不同的参考波形进行测试脉冲的评价;参考波形的具体参数值(表(1)需参考与零部件相关的EMC测试脉冲参数或与相关的供应商共同协商制定。

除对具体的测试波形进行评价外,在每次的测试完成后,需对整车的功能进行检查,以验证关键电子器件的实车抗脉冲冲击能力,若抗冲击能力低,将会导致电子元件被击穿或被烧毁,直接影响整车的功能。

5.总结

在整车环境下,对在车辆实际使用过程中,容易出现的一些极端状态,应进行必要的试验验证,以保障车辆在使用过程的安全性;特别是对于整车厂而言,在车辆的研发阶段,必须进行整车抛负载试验,验证发电机的性能在实车环境下是否满足性能指标,验证电器件的抗干扰能力是否满足要求。

同时整车厂的设计人员可以从以下几个方面采取措施,达到在车辆使用过程中减少抛负载现象的产生或在出现抛负载情况时,减少对整车的危害,有助于汽车的稳定性及整体性能的提升。

(1)提高发电机性能:改进交流发电机整流电路的设计后提升整流电路元器件的稳定性,使抛负载脉冲波形的波峰得到有效的抑制。

(2)蓄电池正、负极柱牢固性:使用新型端子或对端子进行防松设计,避免蓄电池极柱脱落情况的出现。

(3)提升电子器件的抗扰能力:增加或提高零部件抛负载电压脉冲的测试等级,应对越来越复杂的实车环境。

摘要：本文主要介绍整车环境下的抛负载测试,如何对发电机的抛负载现象进行测试与评价,并提出了几条合理性建议,以改进和提升整车电气性能。

关键词：汽车电器,抛负载,测试与评价

参考文献

[1]赵志刚.车用发电机抛负载的保护设计[J].汽车电器.2013.10.5-6

[2]孙正明.汽车抛负载瞬态传导抗扰性试验和分析.电子质量.2010年10月期

[3]姚亚夫.汽车抛负载电压的理论与试验研究[J].汽车工程2002.24(5).451-454

工业锅炉能效测试结果评价篇9

陕西省共有在用工业锅炉1100余台,截至2011年底全省共完成280余台燃煤锅炉和100余台燃气锅炉热工测试工作。通过对测试结果统计分析,总结出在用工业锅炉运行热效率远低于TSG G0002-2010《锅炉节能技术监督管理规程》中附件A中热效率限定值、目标值及GB/T 17954-2007《工业锅炉经济运行》中锅炉经济运行级别要求。图1所示为在用工业锅炉热效率测试值与标准值比较(图中每组六列从左到右依次为:目标值、限定值、测试值、三级运行、二级运行、一级运行)。可见,锅炉节能空间大,重要性高。

1 能效测试结果分析

1.1 燃煤锅炉

对全省燃煤锅炉测试结果统计计算,运行平均热效率为67.179%。燃煤锅炉五项热损失中,平均排烟热损失q2为16.948%,占总热损失的52.6%;平均气体未完全燃烧热损失q3为0.253%,占总热损失的0.8%;平均固体未完全燃烧热损失q4为11.07%,占总热损失的34.3%;平均散热损失q5为3.284%,占总热损失的10.2%;平均灰渣物理热损失q6为0.676%,占总热损失的2.1%。各热损失占总热损失的比例如图2所示,其中排烟热损失和固体未完全热损失之和占总热损失的85%以上。

不同蒸发量或热功率下锅炉热效率和各项热损失所占总热损失的比例不同,如表1所示。

由表1可看出,锅炉容量在1t/h

1.2 燃油气锅炉

燃油气工业锅炉平均热效率为88.13%,其中蒸汽锅炉平均热效率为87.03%,热水锅炉平均热效率为89.24%。燃油气锅炉的热损失中,平均排烟热损失为7.8%,占总热损失的66%;平均气体未完全燃烧热损失为0.2%,占总热损失的2%;平均散热损失为3.82%,占总热损失的32%。其中q2排烟热损失和q4固体未完全燃烧热损失占总热损失的98%。

1.3 省内外制造单位生产的锅炉测试结果

统计分析,由陕西省省内锅炉制造单位生产的锅炉平均运行热效率为62.77%,由陕西省外锅炉制造单位生产的锅炉的平均运行热效率为69.944%。各热损失所占比例分别如图3、图4所示。

由图3和图4对比分析,省外制造的锅炉的平均热效率高于省内制造的锅炉,省内制造锅炉排烟热损失q2和固体未完全燃烧热损失q4占总热损失的比例远高于省外制造单位。

2 能效测试结果评价

2.1 结果评价

1)工业锅炉各项热损失占全部热损失的比例大小依次为排烟热损失q2、固体未完全燃烧热损失q4、散热损失q5、灰渣物理热损失q6、气体未完全燃烧热损失q3,其中q2和q4占了全部热损失的80%以上;

2)锅炉的运行热效率值低于《规程》限定值和设计热效率值;

3)锅炉容量不同,运行效率不同;

4)由省内制造单位生产的锅炉平均热效率低于省外制造单位生产的锅炉。

2.2 原因分析

1)出力不匹配,“大马拉小车”现象严重。

测试过程中发现一部分企业考虑到后续扩大生产的需要选用大容量的锅炉;一部分企业在锅炉运行过程中由于生产的需要,用气量不稳定,负荷时大时小。

2)监控仪表配备不齐全,不能实时监控运行情况。

绝大部分在用锅炉并未完全按照《锅炉节能技术监督管理规程》配置仪表,致使在运行过程中无法实时监控运行情况。

3)鼓、引风机调节方式不合理。

在用锅炉大多采用挡风板调节方式,此方式靠司炉工人工调节,调节合适风量困难,致使锅炉运行过程中出现过量空气系数大、燃料燃烧不充分等情况。

4)使用燃料与设计燃料存在较大差别。

由于煤样化验工作周期长,且煤场和锅炉使用单位无煤样化验条件,致使使用的燃料和设计燃料成分、发热量存在较大差别。

5)设计、制造、安装环节不节能。

a.设计环节:存在设计热效率、过量空气系数、排烟温度、水质要求、受热面布置、炉墙和炉顶保温结构等不符合《规程》设计要求。

b.制造环节:制造单位情况良莠不齐,大的制造单位管理制度严格,而绝大部分小的制造单位管理落后,未严格按照审核过的设计图纸和相关制造标准进行生产。

c.安装环节:存在仪表安装不齐全,保温材料偷工减料,连接处未采取有效密封致使漏风现象严重等。

6)锅炉使用单位运行管理落后。

全省锅炉使用单位参差不齐,大部分小型锅炉使用单位运行管理落后,未设置水处理设备,司炉工未经过锅炉运行节能管理培训、缺乏相关的专业知识,而大型锅炉使用单位监控设备齐全,人员专业水平高,锅炉运行效率高于小型单位。测试结果表明D>20 t/h的锅炉运行效率达到三级,这就是因为运行热负荷稳定,使用单位运行管理先进。

3 节能建议

1)对新投入使用锅炉。

a.从设计环节把关:严格对锅炉设计文件进行节能审查,尤其是节能审查要求中的A类项目;

b.严把制造关:对制造单位人员进行节能管理培训,严格要求其按照进行过节能审查的设计图纸、文件和有关标准生产锅炉,并进行现场监督;

c.监督安装关:锅炉检验人员在锅炉安装监检过程中,监督和现场指导安装。

d.指导运行关:对锅炉使用司炉工、水处理人员等进行节能知识培训,提高节能操作水平,并鼓励其建立能效考核制度。

2)对正在运行使用锅炉。

a.锅炉节能改造:对运行效率明显低于文献[7]和[8]的高耗能锅炉,指导其使用单位进行节能改造,提高锅炉使用效率。

b.加强水质监测管理:对监测水质不符合GB/T1576-2001《工业锅炉水质要求》的单位要求其进行整改,对无水处理设备的单位要求其安装设备。

c.建立能效考核体系:对锅炉使用单位进行定期能效测试,对不达标的锅炉要求整改,整改后仍不达标的淘汰;同时进行测试结果比对,公布比对结果,实行奖惩制度。

参考文献

[1]李斌东,魏保扬.浅析工业锅炉的能效测试[J].化工装备技术,2011,(3):32-34.

[2]程学明,杨军.在用工业锅炉能效测试结果分析与改进措施[J].质量探索,2011,(12):47-48.

[3]查建国,杨生龙,周鹏.在用工业锅炉能效测试结果分析及节能建议[J].特种设备安全技术,2011,(6):33-35.

[4]李茂龙,黎华,钟志强.工业锅炉能耗现状分析与节能措施[J].石油化工设备,2009,(7):19-20.

[5]GB/T10180-2003,工业锅炉热工性能试验规程[S].

[6]TSGG0003-2010,工业锅炉能效测试与评价规则[S].

[7]TSGG0002-2010,锅炉节能技术监督管理规程[S].

土壤养分测试方法及其优劣评价篇10

一、常规分析法

在我国, 传统土壤碱解氮一般是用NaOH 水解、康威皿扩散测定, 硝态氮是用硫酸钾作为提取剂, 按水土比5:1浸提, 振荡15min过滤, 滤液用硝酸银电极法测定;土壤有效磷常用Olsen法 (0.5 mol/L NaCO3) 、Bray-1法 (0.03 mol/L NH4F–0.025 mol/L HCl) 和Mehlich-3法 (0.2 mol/L CH3COOH + 0.25 mol/L NH4NO3+ 0.015mol/L NH4F+0.013mol/L HNO3 + 0.001 mol/L EDTA) 作为提取剂, 钼锑抗比色法测定;有效钾的测定一般用 1 mol/ L 中性醋酸铵提取, 火焰分光光度计测定;土壤有效Mn采用DTPA提取剂 (0.005mol/L DTPA+ 0.01mol/L CaCl2 + 0.1mol/L TEA, pH =7.30) ;土壤有效Zn、Cu, pH <7.3时用0.1mol/L HCl作提取剂, pH >7.3 时用上述提取有效Mn的DTPA提取剂同时浸提Zn、Cu、K、Mn皆用原子吸收分光光度计测定。

这些方法各有其优点和缺点, 如氮的测定, 这些方法快速简便, 但由于对易矿化氮的了解不够, 浸提剂的选择往往缺乏理论依据, 测出来的结果与作物生长的相关性较差。Olsen法测定土壤有效磷, 这种方法主要用于测定钙质土壤有效磷的常规方法, 但该法也适用于酸性到中性土壤, 但浸提Fe-P、Al-P 的能力不高, Bray-1 和Mehlich-3 法都适用于中度到高度风化的酸性到中性土壤, Mehlich-3 且被作为通用提取剂从土壤中同时提取多种养分元素, 在酸性到中性土壤上的应用有越来越广泛的趋势。1mol/L中性NH4OAC 法测钾可将交换性钾和非交换性钾截然分开, 其结果准确度和重现性好, 与作物吸收钾量相关性好, 利于火焰光度计测钾, 但其一次只能提取K、Na 和交换性Mn等。

总的来说, 这些常规化学分析法对每一种养分元素分别采用不同的提取剂, 每一提取剂较能适合待测成分的释放, 相对准确度高, 在田间施肥中有一定的指导意义。但这些方法同时存在以下不足:化学浸提剂提取的元素单一、操作手续和分析过程繁琐、不能实现系列化操作, 因而分析速度慢, 分析结果难于及时应用, 常常使测土推荐施肥不能真正实行。

二、速测法

土壤养分速测是多年来国内外应用得较为广泛的一种分析方法, 也是当前科教兴农进行群众性科学种田的一种手段, 土壤养分速测是一种相对于常规分析, 速度更快捷, 成本更低廉, 测试设备更简便, 而测试精度能满足测土施肥要求的土壤养分测试技术与装备。所谓速测法, 是把有效养分常规的分析方法加以简化, 如减少浸提液体积、缩短浸提时间、简化浸提和测定步骤、改用目测比色等, 使操作快速简便, 测定结果有一定的精度, 容易被群众掌握, 因速测采用比较简捷的浸提方法, 使某些养分不能完全提取出来, 测得的养分数量一般低于常规分析。而土壤分析最大的工作量在于前处理, 要提高测定速度, 必须实现多种养分的同时快速浸提。可以说联合浸提技术是速测法的基础。近年来, 国内研究用得比较多的是Mehlich-3 联合提取剂、氯化钙提取剂及ASI联合浸提剂。

(一) Mehlich-3。

Mehlich-3 (0.2 mol/L CH3COOH + 0.25 mol/L NH4NO3 + 0.015 mol/L NH4F + 0.013 mol/L HNO3 + 0.001 mol/L EDTA) 可能是目前应用最广泛的多元素联合提取剂。适合各类酸性和中性土壤, 在一定范围内也可以用于碱性和石灰性土壤中多种有效大量和微量元素的浸提;测定值与植物生长反应有很好的相关性;性质很稳定, 便于配置和长期储存;浸提时间短, 在室温振荡5分钟即可完成;容易取得清亮的浸出液;可用于现代仪器的分析等。但此浸提液用于石灰性土壤时, 浸出液的pH 会上升。

(二) 氯化钙提取剂。

氯化钙提取剂即浓度为0.01 mol/L CaCl2 水溶液。可测定多种土壤成分 (总溶解有机C、总溶解N、硝酸根、铵、正磷酸盐、总溶解P、K、Na、S、重金属等) 的含量;适用于水溶性磷含量高且固磷能力弱的各种土壤;用0.01mol/ L CaCl2 作为测定土壤pH、Na 、K、Mg、Mn、P 以及不同氮素形态取得了满意的结果。对于氮素, 0.01mol/ L CaCl2 除了提取无机NO-32N 和NH+42N 外, 还能同时提取活性有机态N 用0.01mol/ L CaCl2作浸提剂在规定平衡时间内可以获得足够的清亮溶液。总的来说, 0.01mol/L CaCl2 提取剂是一种提取能力较弱的提取剂, 适用于养分含量较高的土壤, 土壤提取液适合于检出限较低的仪器分析, 而不适合手动分析。

(三) ASI法联合浸提剂。

ASI法对土壤有效P、K、Zn、Cu、Mn的测定:采用联合浸提剂, 即0.25mol/LNaHCO3-0.01mol/L EDTA-0.01mol/L NH4F溶液。P用钼锑抗比色法测定, 通过稀释分样器和带抽吸泵的比色计实现高效快速的系列化操作。测P的溶液在比色前用原子吸收分光光度计测K、Cu、Mn、Zn用原子吸收分光光度计测定。

研究表明ASI联合浸提剂对土壤有效P、K、Zn、Cu、Mn 的提取, 与我国常规化学方法之间具有良好的相关性, 并适合酸性、中性及石灰性等各类土壤, 且分析效率高、速度快。测定土壤磷、钾与作物对这两种营养元素的反应有着良好的相关性。同时, ASI法还能提取土壤有效Cu、Zn、Mn 、Fe等微量元素, 是一种有效的联合浸提剂。

三、离子汇集法

离子汇集法具有一个吸附待测离子的表面, 这种方法能从土壤中吸附并收集待测离子。主要可分为离子交换树脂和氧化铁试纸法, 其中离子交换树脂又可分为离子交换树脂小珠、离子交换树脂袋及离子交换树脂膜等方法。

(一) 离子交换树脂小珠。

离子交换树脂首次应用于土壤研究时, 采用的是这种型式:将树脂小珠与土壤悬液一起振荡一定时间, 树脂小珠吸附土壤中的待测离子, 然后将树脂小珠过滤出来, 在稀的介质溶液 (如0.5 mol/L HCl) 中将被吸附的待测离子解吸出来后进行测定。

采用树脂小珠振荡法有一个局限性, 就是要将树脂小珠从土壤悬液中分离出来进行被吸附离子的解吸比较费时。因此, 有人建议将树脂缝在多孔尼龙小袋中与土壤悬液共同振荡, 或配制一定浓度的溶液使其密度介于土壤与树脂之间, 用离心法分离。也有人提出将土壤研磨得十分细, 使之在提取后用筛子过筛以分离树脂。总之, 将树脂小珠从土壤悬液中分离出来是比较繁琐和费时的。

(二) 离子交换树脂袋。

鉴于用分散的离子交换树脂小珠提取土壤养分的缺点, Sibbesen于1977年成功地把树脂小珠缝合在多孔尼龙小袋中做成树脂袋提取土壤磷。这种方法是用多孔尼龙小袋、筛网或半透膜把离子交换树脂颗粒包起来, 做成离子交换树脂袋, 浸提时把离子交换树脂袋埋在土壤中或和土壤一起振荡或放入盛有水样的容器中, 一定时间后取出树脂, 把吸附在树脂袋中的养分离子交换或洗脱下来即可测定。

此后, 这方面的研究报道逐渐增多。Aarnio等用树脂袋研究了芬兰酸性森林土施用缓释和快释磷、钾和镁肥对养分移动及有效性的影响, 发现快速释放肥料 (过磷酸钙、氯化钾、硫酸镁) 可立即提高有机土和矿质土中的可溶性磷、交换性钾、交换性镁含量和树脂袋对这些养分的吸附量。利用这种方法综合测定了土壤钾素状况以及控制钾素转化和扩散速率的因素, 它可以灵敏地反映过去的施肥历史, 即钾库的积累或耗竭, 比静态土壤测试方法更好地预测NP和NPK处理中K的总吸收量 (R2=0.82 ) 。传统的土壤测试方法只提供了特定养分库瞬间的养分状况, 而对库间转化的动力学和养分向成长中的根表面的潜在养分供应速率没有考虑。但此法存在树脂袋易磨损 (影响使用寿命) 、树脂袋表面常粘附一些不易分离的根毛影响测定结果的准确程度、吸附过程慢提取时间长等缺点。

(三) 氧化铁试纸法。

氧化铁试纸法是20世纪80年代出现的土壤有效磷测定方法, 该法从土壤中提取磷的原理与阴离子交换树脂法相同, 适用于各种土壤, 但比阴离子交换树脂法简单和方便, 对磷酸根离子的专性吸附也比树脂强。与各种化学提取剂法相比, 该法更接近于植物或藻类从土壤或水体中吸收磷的真实情况, 也更能说明土壤或水体磷的有效性。此法的商业利用价值低, 一张氧化铁试纸只能利用一次且在振荡时容易受到微小土粒的污染, 与常规提取法相比, 该法仍较费时和复杂, 目前主要应用于环境方面的研究。

(四) 离子交换树脂膜。

离子交换树脂膜是离子交换树脂经与粘合剂 (如聚乙烯) 、润滑剂 (如硬脂酸钙) 反复混炼均匀, 进行铺压拉片而成的一种膜。

离子交换树脂膜有三种类型:阳离子交换树脂膜、阴离子交换树脂膜和阴阳离子混合膜 (也称双极膜) 。1964 年Saunder 首次用离子交换树脂膜研究土壤中的有效磷, 结果表明其与树脂颗粒一样能用来提取土壤中的有效养分, 而且膜法省时省工。树脂膜的应用也经历了与土壤悬浮液一起振荡和埋置两个阶段, 最近的研究大多采用埋置法。Schoeunau 和Huang (1991) 首次报道了用阴离子交换树脂膜测定土壤中的有效磷, 结果表明树脂膜法测定值与常规化学方法测定值间具有极显著的相关性。树脂膜法克服了树脂小珠及树脂袋法的缺点, 不许称土、过滤, 具有简单、快速、准确和成本低的特点。而且不易磨损, 可以反复使用。有关资料显示, 阴离子交换树脂膜可用50～500次直到丧失提取能力或结构受到损害为止。

四、土壤养分系统研究法

土壤养分状况系统研究法是多年来国际上土壤测试和推荐施肥研究的基础上逐步发展形成的。美国佛罗里达的国际农化服务中心 (Agro Services International Inc) 的Hunter在总结了前人土壤测试工作的基础上, 于1980年提出了一套用于土壤养分状况评价的实验室分析和盆栽实验方法, 并于1984年正式出版。1988年, 加拿大钾磷研究所的Portch对此方法稍加修改, 后开始应用在与中国的合作项目中。

土壤养分系统研究法是一套技术的集成, 包括五个部分:土壤样品的采集和处理;实验室化验分析;土壤对养分的吸附试验;温室或网室盆栽试验;田间试验。

土壤养分状况系统研究法的特点:一是全面考虑土壤中大、中、微量元素状况及平衡。通过对土壤中11种营养元素有效含量及p H、有机质、活性酸的测定, 可以全面评价土壤肥力状况, 找出土壤养分限制因子, 从而提出合理的推荐施肥建议。二是采用联合浸提剂, 提高了工作效率。土壤养分状况系统研究法养分化学分析利用的联合浸提剂主要包括:A S I溶液 (0.25 mol/L Na HCO3-0.01mol/L EDTA-0.01mol/L NH4F) 同时浸提P、K、Cu、Fe、Mn、Zn 6种营养元素、0.08 mol/L Ca (H2PO4) 2溶液同时浸提S、B两种营养元素、1mol/L KCl溶液—NH4-N、活性酸 (AA) 、Ca、M g、Na联合浸提。用该方法测定的土壤有效养分在多数土壤上与作物生长反应具有良好的相关性。三是高效、快速的分析测试过程, 使测土推荐施肥能真正实施。采用实验室系列测试设备, 使土壤样品的前处理及测定过程如取样、加液、浸提、稀释、洗涤、比色等实现系列化操作。同时采用美国、加拿大等国测土施肥中已广泛流行的体积计量法, 以容量为基础进行土壤养分的测定, 既快捷又简便, 大大提高了工作效率。四是在全面考虑土壤中大、中、微量元素状况及平衡的同时, 考虑主要营养元素如P、K、S、B、Cu、Mn、Zn在土壤中的吸附固定特点。五是通过室内分析和盆栽试验我们基本能够了解土壤的养分状况, 以及肥料施入土壤后的某些反应。这可使我们在设计试验时避免盲目性, 节省人力、物力。在田间研究中, 能够达到最高产量目标, 并制订出合理的平衡施肥计划, 实现真正意义上的平衡施肥。

该方法仍存在着不足:一是该方法环节多, 比较复杂。二是土壤基础肥力分析和吸附试验要求的仪器设备较高, 手段也较特殊, 盆钵试验要求的设备也较特殊, 在基层农业部门较难推广。

摘要：土壤养分测试方法很多, 主要可分为常规分析法、速测法、离子汇集法及土壤养分系统研究法。常规分析准确度高, 但分析速度慢;速测法速度快, 主要运用联合浸提剂技术, 但测出来的量要比常规法的要低;离子汇集法能模拟根系吸收土壤的养分, 准确测定土壤的有效养分, 但也存在操作速度慢, 标准不统一等缺点;养分系统研究法测出来的有效养分与作物生长相关性很好, 但难于基层的推广。

软件测试评价篇11

关键词：PISA；信息技术课程；评价

中图分类号：G434 文献标志码：B 文章编号：1673-8454（2016）06-0057-03

一、引言

PISA（Program for International Student Assessment）中文译名“国际学生评价项目”，该项目由经济合作与发展组织（OECD）于1997年发起并推动，旨在对成员国的教育质量进行监测和诊断。目前，该项目已推广至全球70多个国家和地区，我国已经参加了PISA2009和PISA2012，引起了很大的反响，PISA2015的测试工作也刚刚结束。PISA主要对学生的数学素养、科学素养以及阅读素养进行测评，其测评理念、测评内容、测评形式以及测评结果分析都有较大创新。从当前的研究成果来看，基础教育课程在评价方式、评价内容、评价工具设计上都在积极借鉴PISA的做法。

二、PISA测试的内涵和特征

1.PISA测试的内涵

PISA对即将完成基础教育的15岁左右的学生进行测评，测量学生参与社会所需知识与技能的储备情况，主要涉及学生数学素养、科学素养和阅读素养三个方面。

此处的“素养”与以往我们所熟知的含义并不一致，PISA所鉴定的素养为“学生将在学校教育和生活环境中获得的主要学科知识和技能，应用到对实际生活中遇到的现象进行分析、推理和有效沟通，以及在不同情境中解释问题和解决问题的能力” 。[1]PISA所阐述的素养实质上是学生的高阶思维能力，而高阶思维能力则是信息化社会对人才能力的具体要求。

2.PISA测试的特征

（1）PISA的评价理念

PISA强调学生在真实情景下发现问题、解决问题和反思问题的能力，注重知识的生活应用。对学生的学业成就评价不只是单维的分数评价，也会结合调查问卷，以多维客观的视角来评价学生的学业成就，保证评价的公平、公正、全面。从本质上讲，PISA不是一种竞争性测试，而是一种诊断性测试。

（2）PISA的测量工具

传统教学更多关注于从纸笔测试的角度对学生的学习状况进行分析，这种形式对学生知识识记的测评有较好的效度，但无法了解学生的情感态度、学习动机等内在心理倾向，会造成评价的片面单一。PISA则通过试卷和调查问卷两种形式将学生的学习态度、学习动机以及学习成效的分析有机统一起来，为全面客观评价学生的学业成就提供了有效支持，这一方式也被认为是一种有效的教学评价模式（李志河，2010）。

（3）PISA的评价模型

不同时间段、不同群体的成绩可比性，是当前考试评价的关注热点。项目反应理论（IRT， Item Response Theory）也在这样的背景下应运而生，PISA采用的Rasch测量模型是IRT经典的测量模型之一，该模型可以建立一个客观的等距测评工作，不同难度、不同维度、不同考生之间的成绩在该模型下具有完全的可比性。这为多维度、多视角、多群体、多时间段学生的学业成就比较提供了技术上的可行性。

三、信息技术课程评价的现状

1.新课程背景下的信息技术课程评价

新课改背景下对信息技术课程评价的要求是“强调评价对教学的激励、诊断和促进作用；发挥教师在评价中的主导作用，创造条件实现评价主体的多元化；评价要关注学生的个体差异，鼓励学生的创造实践”。[2]在新课标的背景下，信息技术课程评价追求的是发展性、诊断性的评价，关注的是学生能力的发展，特别是批判能力、反思能力、创新能力和决策能力的培养。

2.信息技术课程评价的现状

（1）信息技术课程评价的实践现状

当前中小学信息技术课程评价功能单一，注重评价的选拔功能而忽视评价的反馈和促进功能；评价标准片面，注重学生的知识和基本操作技能的掌握而忽视信息素养的提升，忽视学生个体差异；评价手段和形式单一，注重总结性评价而忽视过程性评价，教师评价占整个评价的绝大部分，学生难以参与到课程评价中，学生的学习积极性无法得到保证。这些问题已经给信息技术课程的发展带来了负面的影响，甚至将会影响整个信息技术学科的发展。

（2）信息技术课程评价的研究现状

信息技术课程评价中存在的种种问题已经引起学者专家的注意，并开展了相关的研究，取得了一定的成果。李志河将发展性评价的概念引入信息技术课程评价中，通过实验研究表明“发展性评价应用于中学信息技术课程学习活动中，在明确学习目标、培养多种思维能力、自我反思和提高课堂效率等方面都具有积极的影响”。 [3]甄宗武等通过将总结性评价和形成性评价相结合的方式，设计了多种评价量规并阐述了具体使用方法和注意事项。[4] 李呈林在借鉴多元智能理论的基础上，提出了基于项目学习的课程评价方法，以达到全面评价学生的目的。[5]

可以看到，当前信息技术课程评价实践现状不容乐观，而研究层面更多的是局部性的探索，偏向于理论性的研究，实践中的应用成效有待进一步考察。在学业评价上，信息技术课程具有较强的独特性，学习内容强调原理方法的理解以及技能的形成与熟练，学习过程注重认知活动与技术活动的内在统一，培养目标则倡导原理知识、操作技能、技术文化、人文修养等多方面的统筹发展。[6] PISA在评价理念上与信息技术课程评价要求高度一致，而且PISA经过多年在全球范围内的推广已经比较成熟，那么信息技术课程评价会从PISA中获取哪些“营养”呢？

四、PISA对信息技术课程评价的启示和借鉴

信息技术课程评价要为提高学生的信息素养服务，要为提高学生解决问题、发展创新能力服务。PISA在评价方面的理念和技术将给“重操作轻原理、重知识轻应用、重技能轻文化”的信息技术课程带来别样的冲击。

1.改变评价理念，突出能力应用

信息技术课程考试是评测学生信息能力的重要手段之一，以往测试的目的更多的是甄别，测试题目怪、难、偏的现象屡见不鲜，其根本原因在于评价理念与现实测评需求相矛盾。PISA测评突出能力应用，考察学生在具体情境中运用所学知识去分析、解决问题的能力。测评题目以情境性问题为主，拒绝脱离现实生活高度抽象的命题方式。如PISA2012数学的“USB随身碟”这道题目，该题只需基本的数学运算能力即可作答，但不一定能获取满分，因为存在最优的组合法。这类题目将具体的问题隐含在生活化的情境中，即强化了学生的知识迁移能力和决策能力，也培养了学生运用知识解决问题的意识，而后者比学习知识本身更为重要。在信息技术课程评价中，要根据课程评价的需要充分发挥情景化问题的魅力，充分培养学生信息意识和信息能力。

2.融汇评价方式，着重全面施评

传统的信息技术课程评价一般采用测试考核的方式，考察的内容主要是信息技术知识基础和信息技术基本操作能力。显然，这种评价方式并不能满足信息技术课程独特的评价要求。PISA在评价学生学业成就的时候，采用考试和调查问卷相结合的形式，通过考试来分析学生对知识掌握和运用的能力，而依据调查问卷可以了解学生的个人基本特征、学习动机、学习态度，甚至是学习策略。这一评价方式给信息技术课程评价带来广阔的思路，信息技术课程的学习过程中，学生将留下大量的学习活动数据，可以通过对数据进行关联、聚类等挖掘分析，用作评价学生个人学习成就的有效信息，为学生的学业诊断、行为诊断甚至是认知策略的分析提供有效的支持。

3.创新评价模型，实现多维可比

考试数据的可比性一直是考试研究领域重要的研究内容，也是急需突破的难点。当前，考试统计和测评主要采用经典测量理论（CTT， Classical Test Theory）作为其理论依据，CTT指导下的统计和测评方法简单易懂、操作方便，一时间成为统计与测评领域的主要理论基础。但CTT本身具有不可避免的缺陷，其中样本依赖性和数据非等距性最为突出，直接限制了测量结果的准确性和可比性，缩小了理论应用的范围和指导意义。在这样的背景下，IRT便引起了学界的注意，其中IRT的Rasch测量模型受到了关注。Rasch测量模型为建立一个具备等距量尺、涵盖完整难易度、可进行横向和纵向比较的多维度测评量表提供了可行性。[7]这种新的评价模型为大规模、长时间、不同群体的客观等距评价提供了可能，借鉴这种测量模型可以扩大信息技术课程评价的广度和深度。

4.创建信息环境，提升信息素养

PISA2012开始引入数字化阅读，对数字环境下的阅读能力进行评价，这一做法也顺应了网络时代对阅读能力的新要求。在测评学生的阅读素养中，推出了非连续性超文本这一种新的阅读材料形式，旨在为学生搭建一个数字化的阅读环境。所谓非连续性超文本是指阅读材料是由不同类型（主要有文本、图形、表格、视频等）的有一定关联的阅读材料组成阅读内容，而且各材料之间存在超链接。非连续性超文本阅读在增加学生阅读信息的同时，考察了学生对信息的鉴别、分析、推理和关联的能力。在信息技术课程考核中，可以应用此类考试形式代替传统的纸笔考试，作为测评学习信息检索、信息甄别、信息应用能力的重要手段。

PISA测试对突破当前的测评理论和技术瓶颈带来了新的希望，也给正处于探索期的信息技术课程评价带来新的理念。在提高学生信息素养的大背景下，PISA为信息技术课程评价带来了理念更新、内容更新、工具更新，为完善和发展信息技术评价提供了有效的依据，我们也相信将有更多的研究成果问世。

参考文献：

[1]OECD.PISA2009 Results： Executive Summary[DB/OL].http：//www.oecd.org/pisa/pisaproducts/46619703.pdf.2012-12-07.

[2][4]甄宗武，冯玲玉，谢斌.新课改背景下高中信息技术课程评价方案分析与设计[J].电化教育研究，2013（12）：93-97.

[3]李志河.发展性评价在中学信息技术课程中的应用研究[J].电化教育研究，2010（4）：54-57.

[5]李呈林.从多元智力视角反思高中信息技术课程教学及其评价[J].电化教育研究，2011（3）：116-120.

[6]董玉琦，黄宇星，谢琪等.信息技术课程与教学[M].北京：电子工业出版社，2009：137-145.

[7]王蕾，景安磊.我们从PISA学习到了什么——基于PISA中国试测的研究[J].北京大学教育评论，2013（1）：172-180.

教育软件量化评价标准研究篇12

1 教育软件

市场上的教育软件种类很多,但基本上可以划分为教育管理软件、教学软件和辅助工具软件三大类。

教育管理软件是学校和教育主管机构进行管理、信息收集、信息交流的辅助工具。教育管理软件,具备学籍管理、人事管理、教学管理、安全管理、财产管理等多种功能。如排课系统、学籍管理系统、成绩管理系统、教材管理系统、考务管理与成绩分析系统、图书馆管理系统、人事档案管理系统等。

教学软件是辅助教师进行备课、研究、课堂授课、复习考试等教学活动的工具。是为进行教学活动而设计的计算机软件。它包括教师和学生使用的程序学习课本、专门设计的有关学科的课程单元、用于控制和进行教学活动的程序及帮助开发维护程序的资料。按教学活动方式分,辅助教学软件有操作与练习型教学软件、指导型教学软件、咨询或对话型教学软件、模拟型教学软件、游戏型教学软件和问题求解型教学软件。

辅助工具软件主要作为一种特定工具,为教师、学生、学生家长或教育管理人员等提供某种帮助,如校园网即时通讯系统,主要作为教师、学生在校园网内沟通的辅助工具;再如课程制作工具,主要为教师制作电子课件提供帮助。

为了更好的了解这三类软件的具体需求和使用情况,笔者收集了山东省2008-2012五个学年的中小学电教软件的数据,并对其进行了统计分析,发现五个学年的教育软件中教学软件占的百分比均在60%以上,可见教学软件是教育软件的主要部分,其他软件是教学软件的辅助部分,可以将教学软件理解为狭义的教育软件,而包括教育管理软件和辅助工具软件在内的所有跟教育相关的软件理解为广义的教育软件。正因为教学软件在教育软件中所占比重最大,对教学工作影响也最大,目前所有的教育软件的量化评价工作也主要是针对教学软件,所以在教育软件的标准化工作中也是重点研究教学软件的质量标准。

2 教育软件存在的问题

随着国家现代远程教育等项目地实施,使得教育软件的需求急剧增加,并同时对教育软件的质量提出新的更高的要求。但是由于教育软件所涉及的学科、课程门类以及学时进度等的不同,其形式千差万别,纵然有一些软件内容新颖、特色鲜明,但是大多数仍存在很多问题,从而限制教育软件效益的正常发挥。

2.1 低水平重复,同质化严重

很多教育软件厂商缺乏对教育的了解,在开发产品方面缺乏合理地规划,研究团队的研究力量薄弱,缺乏理论和创新,加之教育主管部门和许多学校教育工作者没有受过专门信息技术教育与培训,信息认知能力差,缺乏对教育信息需求和组织信息需求的认识,缺少信息形态转化的必备技能,这种情形导致现有的教育软件产品正一步步走向困境,这个困境就是低水平重复,同质化严重,产品大同小异。

2.2 过分强调直观,弱化学生思维训练

教育软件的使用者大多是深谙课程特点、重点和难点,了解学生需要和困惑的一线教师,所以,他们从学生的需求出发考虑问题,以“图文并茂,动画补充”的生动形象向学生充分展示,使难点不难,一看就明白,让学生的认识迅速地从感性提高到理性,从具体上升到抽象。但是,这种让学生轻而易举地获得结果的方式减弱了学生积极思考和钻研问题、探索与寻找答案的乐趣,反而不利于启迪学生的主动思维。

2.3 书本程式化严重,减低教学效果

为了适应多媒体教学手段,有些教育软件制作时间紧,往往仓促投入使用。因此,从文字到图形,教学软件的整个内容几乎书本搬家,没有反映出设计者自己的教学特色和个性。这样因教学内容的信息量过高,信息密度过大,无法让学生有足够时间思考,将会出现现代媒体下新的“填鸭式”或“满堂灌”现象。另外,由于缺乏软件工程思想的指导,加上出于安全性考虑,教学软件大多是预先设计好,已经是成品化的,内容固定、封闭,很难被再更改补充,更不能被其他使用者编辑修改。这样就易使教师讲课受教学软件固有的内容和顺序限制而刻板单一,教师讲课千篇一律,缺乏个性特点。

2.4 教育软件与其它形式的教育资源整合不够

许多教育资源并不符合实际的教学需求,并且许多教师在使用这些资源时却发现将这些资源整合到已有的教育软件中并不容易,还需要二次加工,这无疑大大限制了资源的利用率。另外目前的教育资源大多仅仅按照文本、图形图像、动画、音频、视频等文件格式进行分类,功能服务也仅仅局限于搜索、查询等最简单的数据检索功能,并未实现对资源的有效整合。加上,现有的教育软件很多都是各家自成一体,相互不能沟通、实现不了兼容,设计的时候只顾短期的的需要,自产自销,完全不考虑软件的中长期效益,为同行共享、为别人补充内容提供方便,这就造成了教育软件缺乏软件应有的开放性和共享性而影响推广传播。

教育信息资源的共享,是信息化的根本原则和重要目标,我们必须打破部门壁垒,联合行动、相互协调、分工合作,发挥整体优势,只有这样才能促进教育信息化的健康发展。因此教育软件的评价必须有章可循,杜绝其随意性,必须加紧教育软件质量评价标准的研究,加快教育软件量化评价的标准化步伐。

3 教育软件评价标准的现状

目前国内有40多家关于软件质量的第三方检测机构可以出具对教育软件的评测报告,对于软件产品质量的评测标准声称都依照国际标准ISO/IEC 9126:1991和国家标准GB/T 16260。实际上,ISO 9126及GB/T 16260是对软件的整体质量要求,不同类型的软件,譬如教育软件、信息系统、数据库、中间件、办公套件等都应该在ISO 9126及GB/T 16260的框架下形成各类软件的质量标准。正是由于目前存在的质量标准和检测规范方面的问题,例如,没有针对教育软件具体的质量标准和规范,造成不同的第三方检测机构都是按照自己的理解在ISO 9126、GB/T 16260、ISO/IEC 14598上做剪裁,形成各自的检测规范,并造成了不同的软件检测机构出具的检测报告,在检测内容、质量度量、评价标准上有很大的差别,影响到对教育软件量化评价的客观性和公正性。

缺乏统一的检测规范以及标准的约束,国内不同的检测机构在给客户出具检测报告时,在检测项目、检测数据、数据分析报告方面难免存在良莠不齐的局面。举例来说,同样是对于同一个教学软件的测试,有的检测机构出具的检测报告在几十页到上百页纸,而有的检测机构出具的检测报告却只有区区几页纸。甚至个别检测机构为了争取客户,单纯追求经济利益而丧失第三方检测机构公正的立场,极力满足客户的要求而出具不负责任的检测报告。这就造成了检测报告在检测内容、检测方法和质量数据支持上的很大差别,更是无法客观、公正、准确地反应软件质量的真实水平。

我国的教育软件评价和研究工作起步较晚,目前还没有强制实施的关于教育软件相关的技术标准,尚没有规范和系统的关于如何科学评价教育软件的综合评价指标体系和方法。但是我国政府对教育信息化技术标准建设工作很重视,教育部在2000年组织国内有关专家开展教育信息化技术标准的研制工作,开发了一组教育信息化的国际标准,即中国网络教育技术标准(Chinese E-Learning Technology Standards, CELTS),这组标准主要从技术层面来设计和开发,包括总标准、教学资源的相关标准、学习者相关标准、教学环境相关标准、教育服务质量标准、本地化标准。由此而颁布了十几项相关标准与规范,如《学习对象元数据规范》、《教育资源建设技术规范》、《教育管理信息系统数据规范》、《GB/T 21644-2008 网络远程教育平台总体要求》、《GB/T 21364-2008 信息技术学习、教育和培训基于规则的XML绑定技术》、《GB/T 21365-2008 信息技术学习、教育和培训学习对象元数据》、《GB/T 21366-2008 信息技术学习、教育和培训参与者标识符》等。

国内的许多专家和学者也从部分方面对教育软件进行了评测的研究工作,如北京师范大学的安宝生等从组织体系、政策体系、技术支撑、培训体系四大方面来构造软件指标体系,包括二级指标、指标内容、评价方式;华中师范大学王磊从评价理论入手,设计教育信息化的评价指标体系,详解教育信息化评估指标体系的基本元素;广州大学的曹卫真提出了构建教育信息化评价标准的原则及评价指标构建的方法。同时,在实践方面,越来越多的关于教育信息化的导向的评估研究正在开展,其目的是为了提高教育信息化资源投入的应用效果,推动教育软件整体进步。这些工作都为教育软件评价标准的研究提供了强有力的技术支撑。

4 教学软件质量标准制定建议

由于教育软件隶属于软件范畴,因此教学软件评价标准与普通软件的相关标准类似,可以借鉴,然后加上教学软件独具的教学质量特性,综上教育软件和评价标准的分析,笔者就教育软件质量评价标准的内容提出粗浅的建议。

教育软件的评价是一项非常复杂的工作,为了使复杂繁琐的评价工作标准化、简便化,不妨在教育软件评价标准中构建一个科学的、通用的教育软件评价模型,建议结合教育软件产品的常见特点,对GB/T 16260.2-2006《软件工程产品质量第2部分:外部度量》中的质量特性进行选择或调整,得到教育软件的质量评价参考模型。对教育软件产品质量评价时,再结合被评价软件的关注重点,确定相应的质量特性、子特性和度量属性的权重,构建针对被评价软件的具体质量模型,根据相应的量化处理方法得出被评价软件的量化分值,完成整个教育软件的量化评价工作。

摘要：教育软件的评价对提高教学效益和教学效果有建设性意义。本文针对当前教育软件存在的问题和教育软件量化评价标准的现状,尝试性给出教育软件量化评价标准的制定建议。

关键词：教育软件,评价标准,标准化

参考文献

[1]袁立新.构建教育软件评价指标要注重“三结合”.潍坊教育学院学报,2002年第4期

[2]徐绪堪,赵中强等.基于模糊理论的教学软件质量评估模型.计算机工程,2005年第18期

[3]方海光.基于ESVUM模型的教育软件价值评测框架的研究.现代教育技术,2008年第9期

[4]姚志红,薛理银等.教学软件评价指标体系设计.中国电化教育,2000.12,(167)

【软件测试评价】推荐阅读：

软件测试满意度评价12-16

测试软件测试11-17

软件质量与软件测试05-30

软件测试中回归测试08-18