多指标评价论文

2024-12-04

多指标评价论文(精选12篇)

多指标评价论文 篇1

0 引言

基础模型数据质量是影响智能电网调度控制系统各类应用实用化水平的关键因素。电力系统状态估计作为能量管理系统的基础模块,是反映和提升基础数据质量的重要手段,为电网在线分析和辅助决策软件提供比遥测数据更准确、完整和合理的电网实时运行状态,状态估计结果的准确性对其他应用有着很大的影响[1],对电力系统状态估计结果的评价是反映电网基础模型数据质量的重要手段。

国内外在提高状态估计结果精度方面做了一些研究[2,3,4,5,6,7,8],如不良数据的检测和辨识、抗差状态估计、参数辨识与估计、PMU混合状态估计等。但实际上由于无法知道设备的测量真值,如何对状态估计结果进行合理评价,是进行状态估计研究和完善状态估计应用要解决的问题。

当前对于状态估计结果评价的研究不是很多, 文献[9-10]基于测量不确定度理论,提出了在真值未知情况下状态估计结果的评价指标;文献[11]提出了一种基于交叉熵和零注入失配量的状态估计精度评价准则;文献[12]针对给定的系统,提出了线性函数、平方函数、平方和函数、平方和对数函数、平方和指数函数等不同的评价函数;文献[8]中,状态估计误差的协方差矩阵的对角元素为状态估计误差的方差,用来衡量状态估计的精度;文献[13]用估计误差方差与测量误差方差相比较,当估计值误差方差小于原始测量误差方差时,说明状态估计起到了滤波的效果。以上研究只是针对状态估计的某一方面所做的研究,而影响状态估计结果准确性有很多因素,如电网模型(拓扑关系、设备参数、模型完整性)、量测数据(遥信、量测坏数据、数据时间不同步、测量精度、冲击性负荷)等,当前缺少对状态估计结果的综合评价方法的研究。

本文分析了当前状态估计结果评价的现状,以影响状态估计结果准确性的因素为基础,提出状态估计多指标综合评价方法,以选择的四个典型的指标为例,并通过实际电网系统的案例,说明了多指标综合评价方法能够反映电网模型数据存在的问题, 并指导电网模型数据的完善。

1 状态估计评价现状

国家电力调度控制中心颁布的《智能电网调度控制系统实用化要求(试行)》[14]和《智能电网调度控制系统实用化验收办法(试行)》[15]中规定了考核状态估计的两个指标:遥测估计合格率和电压残差平均值。2013年国家电网公司将状态估计遥测合格率作为同业对标考核的一项指标,该指标主要由估计值和量测值的残差、量测类型基准值、合格门槛 (有功功率≤2%,无功功率≤3%,电压≤0.5%)决定的,这一评价准则具有一定的合理性,对国、分、省三级调度的基础数据和基础模型的整治起到了很好的指导作用,提高了智能电网调度控制系统的运行和应用水平。现在国家调度控制中心的状态估计遥测合格率数值已经很高,某些省调在某个断面数据质量比较好时,实时状态估计遥测合格率能够达到100%。

理论上评估状态估计值的合格率和精度,应该用状态估计值与真值的误差,但量测真值无法获得, 实际上,只要在没有坏数据和模型错误的情况下,用正确的状态估计方法在计算收敛时,所得到的状态估计值就是可信且可以使用的[16]。

实际上,影响状态 估计结果 精度有很 多因素[17],如电网模型(拓扑关系、设备参数、模型完整性)、量测数据(遥信、量测坏数据、数据时间不同步、测量精度、冲击性负荷)等。因此单一的状态估计遥测合格率评价指标可能会导致出现合格率指标很高但估计结果却严重偏离系统真实状态的情况[11],不能完全满足后续应用对状态估计结果多方面的需求,不具备对合格的数据再进行细化区别的作用,无法反映出电网基础数据所存在的问题。因此在一定程度上,状态估计遥测合格率更多反映的是状态估计对电网模型和电网数据错误的粗纠偏功能。

本文通过状态估计多指标综合评价方法的研究,说明了多指标评价方法能够反映出电网存在的模型数据问题,为完善电网基础模型数据和提升状态估计结果实用可靠性提供理论支持。

2 多指标综合评价方法

状态估计多指标综合评价是从影响状态估计结果精度的因素出发,从多个角度对状态估计计算结果的精度做出全局性、整体性的评价,即按照给定的目标,对状态估计计算结果的精度进行全面的分类和排序的过程[18]。

2.1 综合评价的指标选择

与以往的只单一考虑状态估计遥测合格率的评价相比,综合评价指标方法的优点在于综合考虑了模型完整性、参数准确性、遥测准确性、遥信动作正确性等因素对状态估计结果精度的影响,将评价目标分成不同侧面的子系统,再细分为更具体的指标, 形成多指标体系。评价子系统具有一定的独立性, 既能反映系统某一方面的特征,又能一起全面反映评价目的。

将影响计算结果精度的因素分为模型、数据、管理等类,而每一类再进行细分,如模型类有拓扑关系、模型参数、模型完整度,数据类有遥信、量测坏数据、数据时间不同步、测量精度等,管理类有调度所属关系,主要考虑外网或者模型上下级的影响。

状态估计评价层次性结构如图1所示。

2.2 综合评价指标选择原则

评价指标的优化目的是理清各指标之间的独立性和关联性,完成对单项评价指标逻辑测验和综合评价指标体系的整体性测验。

对于状态估计结果的综合性评价,主要关注以下两个基本原则:辨识性和冗余性。辨识性是指统计评价指标在区分各评价单位某一方面价值特征时的能力与效果,故又称为“区分性”,是为了能够区分不同地区的基础模型和基础数据的水平,如状态估计遥测合格率受合格率门槛的影响,容易出现多个地区具有同样的合格率,区分性就不高,而状态估计遥测准确度、区域目标函数相对状态估计遥测合格率的区分能力就高些;“冗余性”是表示综合评价指标体系内各指标之间交叉重叠程度的指标,其计算通常可采用相关系数或相似系数、关联系数等公式, 如母线功率平衡率和支路首末端功率平衡率之间就存在着一定的指标交叉重叠,冗余性越好表明各指标越独立,就能够从更多角度来反映基础模型和基础数据所存在的问题。

3 状态估计典型评价指标

3.1 状态估计遥测合格率

状态估计遥测合格率是目前国家电网公司同业对标考核的一项指标,其公式定义为:

式中:RYCGJ为状态估计遥测合格率;N为相应范围内的遥测总点数,包括坏数据;Na为遥测估计合格点数,为遥测数据估计值误差小于由量测类型决定的合格阈值的点数。

3.2 状态估计遥测不准确度

状态估计遥测不准确度表征了区域内状态估计值和量测值之间的偏差程度,状态估计遥测不准确度越低,状态估计结果越准确,其公式定义为:

式中:Ja为状态估计遥测不准确度;xi为N维状态估计值向量的元素;zi为N维量测值向量的元素; σi 为N维量测误差标准差向量的元素。

3.3 母线功率不平衡度

母线功率不平衡度为输入母线的功率与输出母线的功率之差,不仅可以反映测控装置、互感器等是否准确可靠,也是评价供电量和用电量是否平衡的重要指标。而根据基尔霍夫电流定律,状态估计严格满足母线功率平衡,因此母线功率不平衡对状态估计结果会有很大的影响。母线功率不平衡度的定义为:

式中:M为计算母线的数目;Sij n为第j条计算母线的输入功率;Sj out为第j条计算母线的输出功率;Sj N 为第j条计算母线的基准功率,由电压等级决定。

3.4 遥信动作正确率

在电网运行的过程中,会出现遥信拒动或遥信误动的现象,成为电网运行的安全隐患。遥信动作正确率反映的是远动装置、开关辅助接点、信号传输通道等方面的问题,定义为:

式中:Nrf为开关拒动次数;Nun为开关误动次数;Nop 为总的开关动作次数,为遥信正确动作与误动、拒动次数的总和。

遥信动作正确率表征了开关遥信状态和设备量测的同步性,开关遥信的拒动或误动都会造成状态估计拓扑错误,进而影响状态估计结果的准确性,遥信动作的正 确性保证 了状态估 计计算模 型的正确性。

4 指标权重设置

各指标对评价对象的影响程度不同,采用层次分析法(AHP)来确定各评价指标的权重系数[19,20]。AHP是一种定性分析和定量分析相结合的系统分析方法。该方法通过将评价指标的重要程度两两比较,形成判断矩阵P,然后求出判断P的最大特征值λmax对应的特征向量,则归一化后的特征向量即为各评价指标的权重。最后进行判断矩阵的一致性校 验,如果校验通过,则指标权重分配合理,如果校验不通过,需要重新调整判断矩阵,重新计算。

则状态估计综合评价的结果可记为:

式中:wi为根据判 断矩阵确 定的各评 价指标的 权重;yi为各评价指标的结果;n为评价指标个数;y为综合评价的结果。

另外,为了排除由于各指标的量纲不同及数值量级差别所带来的影响,需要先对评价指标做无量纲化处理。采用向量规范法[21]实现评价指标的无量纲化。

式中:j为不同的指标序号;i为每个指标下的不同地区的指标值序号;yij* 为无量纲化之后的指标值。

5 实际电网算例分析

为了更加直接地展示多指标综合评价方法在实际系统应用的情况和评价指标的合理性,本文选取了某调度中心智能电网调度控制系统的某一个状态估计结果断面进行分析,如表1所示。本节的分析主要是通过多指标综合评价方法反映出电网模型和数据所存在的问题,将所选取的各项指标的权重均取0.2。

表1中状态估计有功遥测不准确度、状态估计无功遥测不准确度、母线有功功率不平衡度为极小型指标,取值越小越好,状态估计遥测合格率和遥信动作正确率为极大型指标,取值越大越好。通过极大型一致化处理和向量规范法无量纲化处理,并根据各项指标的权重求得各区域的综合评价指标值。

通过表1的统计信息可以看出,本次状态估计结果遥测合格率中C地区最高,但是其有功遥测不准确度也是最高的,说明C地区具有比较高的遥测合格率但有功估计却是最差的。统计C地区所有有功量测点的遥测不准确度分布,如图2所示。

由图2可以看出,大部分量测的不准确度小于0.01,实际上分析不准确度发现,其中一个量测的不准确度高达474.84,此量测所在母线的有功不平衡量为87 MW,有功量测不平衡解决后,遥测合格率变化很小,但是有功遥测不准确度降到了0.005,母线有功功率不平衡度降到了2.89。

A地区状态估计遥测合格率最低,有功和无功的遥测不准确度不是最高的,但是母线有功功率不平衡度比其他地区大得多,因此A地区的问题主要集中在量测上,特别是量测导致的母线功率不平衡。将A地区比较大的几个母线功率调整平衡以后,状态估计有功遥测不准确度下降到0.015,无功遥测不准确度下降到0.003,母线有功功率不平衡度下降到10.672,说明仍有功率不平衡的母线存在。

D地区在有功遥测不准确度和母线有功功率不平衡度都比C地区好的情况下,遥测估计合格率仍然比C地区低,表明了无功估计对D地区的遥测估计合格率影响比较大,问题主要集中在无功量测和电压量测上。同时发现,从综合评价指标上来看,D地区要比C地区的数据质量水平高,但D地区的状态估计遥测合格率却比C地区低,表明了状态估计有功遥测不准确度和母线有功功率不平衡度指标在增加电网基础数据质量水平的区分度上的有效性。

综合以上分析,单纯的状态估计遥测合格率并不能完全反映出状态估计的水平和存在的问题,结合遥测不准确度、母线功率不平衡度和遥信动作正确率,为状态估计准确度的评估提供更高的区分度, 更能反映出电网的模型和数据的问题所在。

6 结语

现有的状态估计评价指标比较单一,分析结果不够全面,本文以影响状态估计结果精度的因素为基础,提出了状态估计多指标综合评价方法,指标的选取遵循辨识性和冗余性的原则。以选取的状态估计遥测合格率、状态估计遥测不准确度、母线功率不平衡度和遥信动作正确率四个典型指标为例,并通过实际电网系统的案例,说明了多指标综合评价方法在状态估计结果精度评价上的有效性,能够反映出电网所存在的模型和数据的问题,通过对电力系统状态估计结果的评价来指导对电网基础模型数据质量的提升。如何在实际应用中完善指标集以全面地反映状态估计结果精度,实现对电网基础模型数据质量的评估将是下一步研究的重点。

摘要:对电力系统状态估计结果的评价是反映电网基础模型数据质量的重要手段。结合目前状态估计评价指标存在的问题,以影响状态估计准确性的因素为基础,提出了状态估计多指标综合评价方法。该方法多角度考虑了影响状态估计的因素,所提出的评价指标需要遵循辨识性和冗余性原则。文中以选择的四个典型性指标为例,应用层次分析法确定了各指标的权重,并通过实际电网系统的案例,验证了多指标综合评价方法在状态估计结果精度评价上的有效性,能够反映出电网模型数据存在的问题。

关键词:状态估计,综合评价,基础模型数据,层次分析法,辨识性,冗余性

多指标评价论文 篇2

灰色多指标风险型决策方法研究

针对方案指标评估值为区间灰数的风险决策问题,提出了灰色多指标风险型决策的概念.将灰色系统理论的思想和方法与经典风险决策方法相融合,对风险型决策问题指标权重完全未知的且指标值为区间灰数的情况进行了探讨.利用分析技巧,建立了灰色模糊关系法及双基点法两种决策方法.在灰色模糊关系算法中,利用信息熵确定的指标权重使决策方法更符合客观要求.双基点算法在一定程度上解决了单方面基于理想点或负理想点进行决策时,未能充分利用已知信息所产生的偏差,决策更贴近于实际,应用说明了所提出的`两种决策方法的合理性和算法的有效性.

作 者:罗党 刘思峰  作者单位:南京航空航天大学经济管理学院,江苏,南京,210016 刊 名:系统工程与电子技术  ISTIC EI PKU英文刊名:SYSTEMS ENGINEERING AND ELECTRONICS 年,卷(期):2004 26(8) 分类号:C934 N945 关键词:灰色系统理论   风险型决策   灰色模糊关系   双基点方法   区间灰数   熵  

多指标评价论文 篇3

一、“多属性综合评价方法”及其可行性分析

所谓评价是指根据明确的目的来测定对象系统的属性, 并将这种属性变为客观定量的计值或者主观效用的一种行为。在客观世界中,评价的对象系统往往是具有多个不同的属性,在将它们进行比较以决定其优劣或决定取舍时,常需要先从多个不同的侧面加以评判, 然后再进行综合。

日前的综合方法较多,但在综合过程中权重的确定及价值的量化在方法上不甚完善,往往缺乏可比性,这对正确揭示评价对象系统的本质尚欠不足。为此,我们运用美国学者T.L.Saaty(萨迪)提出的层次分析法(简称AHP)和模糊数学等方法进行了研究, 提出了一种适用于多属性评价对象系统的以定量为主、定性与定量相结合的综合评价模型, 成为较为完整的辅助决策支持系统。

网络文学作品作为评价对象,具有多属性、多层次的特点,且在其诸多的属性中既有客观的定量指标,如作品点击量、下载量、销售量、获得道具数量等,也有主观的定性指标,如用户阅读评价、编辑推荐分数等。因此,使用多属性综合评价的方法对网络文学作品进行评价,在理论上具有较高的可行性和科学性。

二、多属性综合评价指标与权重设计

1.确定评价目标,建立评价因素集

本文的评价目标是对网络文学作品的质量进行综合评价。评价因素是对评价目标产生影响力、决定评价结果的因素。因素集是评价对象各个因素组成的集合。根据相关研究成果,结合出版工作的属性、网络文学作品的特性及网络文学作品出版的商业模式,从人气、获得道具、用户主管评价、作品出版销售情况等十一个方面设计一级指标。在一级指标建立的基础上,进一步细化为一系列二级指标,如表1所示。

2.确定各指标权重

权重值的确定直接影响综合评估的结果,权重值的变动可能引起被评估对象排列顺序的改变。所以,合理地确定综合评估各主要因素指标的权重,是进行综合评估能否成功的关键问题。本体系采取常用的专家打分法(即Delphi法)确定各级指标的权重,如表1所示。

表1 网络文学评价指标

三、多属性综合评价指标计算与结果确定

其测评方法主要借鉴了我国地区发展与民生指数(DLI)的测量方法,基本思路是根据每个评价指标的上、下限阈值来计算单个指标指数(即无量纲化),指数一般分布在0和100之间,再根据每个指标的权重最终合成总体综合评价指数。此种方法测算的指数不仅横向可比,而且纵向可比。

(一)指标上、下限阈值的确定

在计算单个指标指数时,首先必须对每个指标进行无量纲化处理,而进行无量纲化处理的关键是确定各指标的上、下限阈值。指标的上、下限阈值主要是参考各项指标实际数据最大值和最小值(如某作品点击量在所有作品中排名第一,那么就将其数值定为点击量上限阀值),以及指标的理论最大值和最小值(如编辑推荐指标,理论最大值既满分为10分,那么上限阀值就是10)。将 个指标记为 ,权重为 ,下限阈值和上限阈值分别为 和 ,无量纲化后的值为 。

(二)指标无量纲化

无量纲化,也叫数据的标准化,是通过数学变换来消除原始变量(指标)量纲影响的方法。

正指标无量纲化计算公式:

逆指标无量纲化计算公式:

(三)分类指数和总指数的合成

1.分类指标的合成方法

本体系由人气、获得道具、用户主管评价、作品出版销售情况等十一个分类组成。将某一类的所有指标无量纲化后的数值与其权重按公式(3)计算就得到类指数。

2.网络文学作品综合评价分数的合成方法

将网络文学评价指标体系中的27个指标无量纲化后的数值与其权重按公式(4)计算就得到网络文学作品的综合评价分数。

四、不足与展望

多属性综合评价作为一种评价方法,能够有效地解决网络文学作品评价中层次多、指标复杂等问题,可以将繁杂、主观的评价转化为客观、统一的评价,该模型的建立符合用户实际需求,在网络文学作品的评价中具有较好的应用前景。但是,任何一种评价方法都有其自身的缺点和片面性,本文研究的方法也是如此,其中凸显的问题有:

不足一:对于权重的确定,目前大多由专家凭经验主观给出,人为因素占主导,评判结果可能有出入。在实践中,可同时请几组专家对作品内容进行打分,尽可能覆盖各个用户群体进行专家选取,将各组专家的评判结果计算得出综合分值,得出对作品的最终评价。

不足二:没有进行实际数据的验证。由于各大网络文学出版网站的数据均属于商业保密范畴,因此本文的评价方法没有得到过实际应用的验证。在后续的研究中,希望可以通过项目合作研发等方式,联合出版机构进行实际验证,并将评价指标逐步优化,以得到更准确的评价结果。

综上,建立网络文学评价体系与评价标准,无论对于广大读者用户还是政府监管部门,都有着非常重要的意义与实际应用价值。笔者认为,无论采用何种手段,网络文学评价的最终目的应该是一种引导,应该以尊重网络文学创作的特点为前提,以服务最终用户为宗旨,在其本身特色的基础上,促进更多优秀作品拥有更长久的生命力。

(作者单位系中国新闻出版研究院)

多指标常用综合评价方法比较研究 篇4

综合评价是指对以多属性体系结构描述的对象系统作出全局性、整体性的评价, 即根据条件运用一定方法对评价对象全体中的每一个评价对象赋予评价值, 并排序、择优。20世纪70~80年代, 现代综合评价方法蓬勃兴起, 产生了多种评价方法。但因各评价方法的使用条件、优缺点及适用对象不同, 故文章在对多属性指标常用综合评价方法的基本思想和步骤概述的基础上, 对各评价方法优缺点及适用情况的对比, 为应用研究中的合理选择使用提供参考。

2 常用综合评价方法

2.1 层次分析法

层次分析法 (Analytic Hierarchy Process, AHP) 是20世纪70年代由著名运筹学家T.L.Saaty提出, 用于解决多因素复杂问题, 经过多年发展已成为一种较为成熟的评价方法。该方法将定性分析与定量分析相结合, 通过全面分析待评价系统的性质和影响因素将备选方案的各要素按层次分解, 构造出自下而上的递阶层次结构, 再对同层次要素比较, 判断得出重要度并排序。

AHP方法大致步骤如下: (1) 根据评价对象的性质和目标, 建立系统的递阶层次结构; (2) 对同一层次上的各要素对其上一层次的相对重要性进行两两比较, 构造判断矩阵; (3) 计算各要素的相对权重, 进行层次单排序和一致性检验; (4) 逐层合成计算每个判断矩阵各因素对目标层的相对权重, 进行层次总排序, 并对排序结果进行一致性检验。

2.2 模糊综合评价法

模糊综合评价 (Fuzzy Comprehensive Evaluation, FCE) 以模糊数学为基础, 运用模糊关系合成的原理, 针对评价对象因素的模糊性, 将边界不清晰的因素定量化, 根据多个评价因素对被评价对象隶属等级状况进行评价的一种方法。该方法依据评价条件, 对评价对象全体的每一个对象赋予一个非负实数, 据此进行排序并择优。

FCE方法的基本步骤如下: (1) 确定评价对象的因素集U和评语集V; (2) 对各因素赋予相应的权数, 得到权重集A; (3) 单因素评价, 得到模糊关系矩阵R; (4) 将A与R合成计算得到各模糊综合评价结果向量B; (5) 对B进行分析、排序和择优。

2.3 BP神经网络评价法

BP (Back Propagation) 神经网络又称为误差反向传播网络, 实现一种从输入到输出的映射关系, 由输入层、隐含层和输出层组成, 是一种典型的多层前馈网络。BP神经网络的学习过程包括信息正向传播和误差反向传播两部分, 正向传播时输入样本从输入层节点输入, 经过隐含层处理并传向输出层, 若输出层未得到期望输出, 则转入反向传播。

标准BP神经网络学习算法的步骤如下: (1) 网络初始化, 给定各连接权值、误差函数、计算精度值和最大学习次数; (2) 随机选取输入样本及对应期望输出, 计算隐含层各神经元的输入输出; (3) 计算误差函数对输出层的各神经元的偏导数; (4) 计算误差函数对隐含层各神经元的偏导数; (5) 对连接权值进行修正并计算全局误差; (6) 对计算结果进行评判。

2.4 数据包络分析法

数据包络分析 (Data Envelopment Analysis, DEA) 是美国著名运筹学家A.Charnes和W.W.Cooper等学者提出, 以相对效率概念为基础发展起来的一种综合评价方法。DEA使用数学规划模型比较决策单元 (DMU) 之间的相对效率对DMU做出评价, 不仅能对同类型DMU的相对有效性进行评定、排序, 而且能够分析其非DEA有效的原因及改进放方向。

DEA评价方法步骤如下: (1) 明确评价目标, 并围绕目标对评价对象进行分析; (2) 选择DMU, 并对其结构、层次进行分析; (3) 建立能够全面反映评价目标和评价内容的输入输出指标体系; (4) 收集并整理数据, 根据研究问题的实际背景选择DEA模型进行计算; (5) 对计算结果进行分析。

3 多指标综合评价方法比较分析

通过上述分析, 根据常用综合评价方法的特性, 归纳整理各方法的优缺点及适用情况如表1所示。

参考文献

[1]王宗军.综合评价的方法、问题及其研究[J].管理科学学报, 1998, 1 (1) :73-79.

[2]T.L.Saaty.Theory of analytical hierarchies applied to political candidacy[J].Behavioral Science, 1977, 22 (4) :237.

[3]杨纶标, 高英仪, 凌卫新.模糊数学原理及应用 (第五版) [M].广州:华南理工大学出版社, 2011.

[4]Geva Vashitz, David Shinar, Yuval Blum.In-vehicle information systems to improve traffic safetyin road tunnels[J].Transportation Research Patr F, 2008, (11) :61-74.

多指标评价论文 篇5

基于风险态度因子的不确定语言多指标决策方法

摘要:针对具有残缺不确定语言信息的多指标决策问题,提出了一种基于风险态度因子的决策分析方法.对具有残缺不确定语言决策矩阵的多指标决策问题进行了描述;以最大语言区间代替矩阵中的缺失值,得到具有完全信息的不确定语言决策矩阵并进行规范化;通过具有风险态度因子的不确定语言映射函数,将不确定语言决策矩阵转化为一定风险态度下的`二元语义决策矩阵;利用ETOWA算子,计算出每个方案的综合评价值,从而依据二元语义的比较原则,可得到所有方案的排序结果.通过给出一个算例,说明了不同风险水平下决策结果的差异性. 作者: 张尧樊治平Author: ZHANG Yao  FAN Zhi-ping 作者单位: 东北大学工商管理学院,辽宁沈阳,110819 期 刊: 东北大学学报(自然科学版)   ISTICEIPKU Journal: JOURNAL OF NORTHEASTERN UNIVERSITY(NATURAL SCIENCE) 年,卷(期): , 32(6) 分类号: C934 N945.25 关键词: 多指标决策    不确定语言信息    风险态度因子    二元语义    方案排序    机标分类号: TP3 O22 机标关键词: 风险态度因子    不确定语言    多指标决策方法    Based    Decision Making    Multiple    语言决策矩阵    决策问题    二元语义    决策分析方法    语言信息    映射函数    完全信息    排序结果    决策结果    风险水平    方案    比较原则    缺失值    评价值 基金项目: 国家创新研究群体科学基金,国家自然科学基金,中国博士后科学基金特别资助项目,中央高校基本科研业务费专项资金资助项目

多指标评价论文 篇6

【关键词】面板数据;分层因子分析;动态综合评价

【作者单位】刘岩,吉林师范大学图书馆。

【基金项目】本文系四平市社会科学基金2016年度研究项目“学术期刊综合发展评价研究”成果之一(项目编号:2016154)。

多指标面板数据是对若干个个体的多个指标变量在不同时间点进行观测而得到的数据。数据具有时间、空间及指标变量三个维度。从横截面上看,数据由若干个样本的不同指标在同一时间的截面数据构成,而从纵向上看,数据由单个样本各个指标在不同时刻的观测时间序列构成[1]。

期刊综合评价的指标众多,单个指标分析存在片面性和局限性。以体育类核心期刊为例,为了使读者全面了解体育类核心期刊的发展动态,卢石[2]等研究者主要对21种体育类期刊的9项评价指标进行了分析,从单个指标的角度进行了横向的比较,但没有对期刊进行综合评价。研究者庄亮[3]对体育类核心期刊的8项指标进行了评价研究,主要利用单个指标评价法对16种体育类核心期刊5年的发展态势进行研究,但没有综合考虑各指标的信息就对期刊进行了综合排名。截面数据的综合评价能够对期刊进行横向的比较研究,然而,一段时间内的动态综合评价更能体现期刊的发展态势[4]。因此,本文采用多指标面板数据的分层因子分析法,建立计量模型来量化各评价指标之间的内在联系,阐述多指标面板数据分层因子分析法在期刊动态综合评价中的分析过程,并应用此方法对体育类的16种核心期刊进行实证分析,探讨体育类核心期刊7年来的动态发展态势,以期为体育类期刊质量的提升提供一定的参考和借鉴。结果表明,该方法不仅能够对期刊进行较为全面和客观的分析评价,而且信息量损失较少,得到了良好的效果。

一、多指标面板数据分层因子分析方法

1. 数据的结构

令xij(t)表示第i(i =1,…, n)个个体的第 j( j =1,…, p)个指标在时刻t (t =1,…,T )的观测,则多指标面板数据的结构如表1所示。

2. 数据的标准化处理

面板数据主要包含了多个个体各个指标在不同时刻的纵向观测,为了考量纵向数据的信息,将通过数据的标准化对各个指标不同时刻的所有观测数据进行拉直来计算此指标的均值和方差,以第 j个指标为例,第 j个指标的样本均值和方差的计算公式分别为和,则标准化的数据为

(1)

3. 分层因子分析模型

(1)横截面数据的因子分析

首先,本文将对每个时间截面上的多个指标的样本数据进行因子分析。令 Z(t)=(Z1(t),…,Zp(t))T(t=1,…,T)是可观测的随机向量,均值和方差分别为E(Z(t))=μ(t),D(Z(t))=Σ(t)。且设F(t)=(F1(t),…,Fm(t)(t))T(m(t )< p)是不可观测的公因子,满足E(F(t))=0, D(F(t))=Im(t),又设误差项ε(t)=(ε1(t),…,εp(t))T与公因子F(t)互不相关,且满足E(ε(t))=0,D(ε(t))=D(t)对角阵。则正交因子模型的矩阵形式为:

Z(t)=μ(t)+A(t)F(t)+ε(t)(t =1,…,T )(2)

在各个时间截面利用方差最大旋转法选择公因子的个数m (t),使得m (t)个公因子的累计贡献率达到85%以上,以各个公因子的方差贡献率为权重构造各个截面的样本综合评价函数f (t)=u1(t)F1(t)+…+um(t)Fm(t)(t)(t =1,…,T )。其中,F1(t),…,Fm(t)(t)为第t个时间截面的m (t)个底层公因子得分,u1(t),…,um(t)(t)为第t个时间截面公因子得分F1(t),…,Fm(t)(t)的方差贡献率。因此,同一截面的所有样本的综合评价值构成该截面的评价向量f (t)=( f1(t),…, fn(t))T。

(2)面板数据的因子分析

将所有个体各个截面的评价向量构成综合评价矩阵

此矩阵可以看成是纵向的面板数据。因此,我们可以将综合评价矩阵看成是T个变量的n次观测矩阵。我们对综合评价矩阵进行检验后做顶层因子分析,可获得纵向面板数据的公因子个数m,使得m个公因子的累积贡献率达到85%以上,利用方差贡献率为权重构造纵向的综合因子得分g=v1G1+…vmGm。其中,G1,…,Gm是面板数据的顶层公因子得分,v1,…,vm是对应公因子的方差贡献率。因此,我们可以得到纵向面板数据的综合评价向量g1,…, gn,对其进行排序,进而获得样本的纵向综合排名。

分层因子分析模型主要通过因子分析法,利用横截面数据和纵向面板数据的综合信息获得样本的综合评价。分层因子分析模型的优势是不仅利用了横截面数据的信息,而且考虑了数据的纵向信息,提高了评价的可信度。

三、实证分析

1.数据来源及指标选取

本文以《中文核心期刊要目总览》[5]提供的16种体育类核心期刊为研究对象,根据2008—2014年版《中国科技期刊引证报告》(扩刊版)提供的2007—2013年的期刊評价指标,选取能够较好体现期刊学术影响力的8项指标进行分析,分别为总被引频次、影响因子、即年指标、引用刊数、学科扩散指标、被引半衰期、来源文献量和基金论文比。数据分析主要通过统计软件R实现。

nlc202309091408

2.结果分析

(1)横截面数据因子分析结果

首先,本文利用公式(1)将2007—2013年8个指标的面板数据标准化。其次,利用横截面数据的因子分析法,分析2007—2013年各年度的8个期刊评价指标数据,获得每个年度的综合因子得分,并对综合因子得分进行排序,结果见表2。 由于2009年的《中国科技期刊引证报告》(扩刊版)中未统计《首都体育学院学报》的指标信息,故此数据暂缺。

表2 2007—2013年横截面数据的综合因子得分及排序

序号期刊名称因子得分2007200820092010201120122013

1北京体育大学学报得分1.2641.0520.7591.2390.8931.1681.206

排序1221211

2成都体育学院学报得分0.035-0.1990.052-0.1590.029-0.022-0.056

排序61089978

3广州体育学院学报得分-0.162-0.336-0.332-0.286-0.323-0.383-0.464

排序11121111121314

4山东体育学院学报得分-0.429-0.604-0.790-0.633-0.732-0.426-0.395

排序13131515151413

5上海体育学院学报得分0.5330.3530.3590.2220.0900.3660.039

排序3565746

6沈阳体育学院学报得分-0.653-0.776-0.711-0.626-0.633-0.507-0.312

排序15151314141512

7首都体育学院学报得分-0.545-0.656--0.356-0.196-0.338-0.496

排序1414-12111215

8天津体育学院学报得分-0.108-0.227-0.183-0.043-0.071-0.263-0.288

排序1011108101110

9武汉体育学院学报得分0.5190.4380.3830.1960.3110.3330.436

排序4446455

10西安体育学院学报得分-0.042-0.159-0.046-0.1860.0898-0.077-0.250

排序99910899

11体育科学得分0.8901.2090.8150.9671.0240.8500.583

排序2112122

12体育文化导刊得分-0.3020.038-0.472-0.381-0.344-0.1980.552

排序128121313103

13体育学刊得分0.1870.4970.3770.4040.3610.4670.456

排序5353334

14体育与科学得分-0.0160.0640.0780.2520.119-0.050-0.302

排序77746811

15中国体育科技得分-0.0170.2040.4290.1860.3100.0070.036

排序8637567

16山东体育科技得分-1.153-0.896-0.719-0.797-0.927-0.926-0.745

排序16161416161616

从表2中可以看出,7年间16种体育类核心期刊中稳定排在前2位的期刊分别为《北京体育大学学报》和《体育科学》。《北京体育大学学报》7年间有4年居于首位,3年排在第2名,而《体育科学》仅次于前者,有3年居于首位, 4年排在第2名,这说明以上两种期刊的期刊质量较好,并且学术影响力较高,7年间呈现稳定的发展态势。《体育学刊》2007年、2009年排在第5名,2010—2012年一直稳定排在第3名,2013年排在第4名,说明《体育学刊》从2010年开始,期刊影响力在原有的基础上有所提升,呈现上升的发展态势。《武汉体育学院学报》2007—2009年3年间一直排在第4名,2010年排在第6名,2012—2013年排在第5名,说明此期刊前3年发展比较稳定,后4年在原有的基础上稍有波动,有下降的趋势,应该引起期刊领导和编辑人员的注意。但整体上,《武汉体育学院学报》在16种体育类核心期刊中,期刊质量和学术影响力排在前5名。

7年间期刊质量和学术影响力较高的期刊还有《上海体育学院学报》和《中国体育科技》。《上海体育学院学报》7年间在3—7名之间徘徊,《中国体育科技》7年间在3—8名之间徘徊,这两种期刊排名整体上呈波动趋势,发展态势不是很稳定,但仍排在前6名。

7年间排在倒数后三名的期刊为《山东体育科技》《沈阳体育学院学报》《山东体育学院学报》。《山东体育科技》较稳定地排在第16名,《沈阳体育学院学报》和《山东体育学院学报》总体基本排在12—15名之间。

(2)面板数据因子分析结果

为了考查期刊的动态发展态势,本文将16种体育类核心期刊2007—2013年的7个年度评价向量构成综合評价矩阵,利用面板数据因子分析法,对2007—2013年的综合评价矩阵进行因子分析,得到纵向面板数据的综合因子得分,进而获得纵向的综合排名。同时,笔者将纵向综合评价结果与7年平均影响因子(IF)进行了比较分析,结果见表3。

nlc202309091408

表 3 面板数据的纵向综合得分、排名及7年平均IF

序号期刊名称综合得分排名7年平均IF

1北京体育大学学报2.02918

2成都体育学院学报-0.054810

3广州体育学院学报-0.6091212

4山东体育学院学报-0.9571414

5上海体育学院学报0.64352

6沈阳体育学院学报-1.1011515

7首都体育学院学报-0.7591313

8天津体育学院学报-0.376115

9武汉体育学院学报0.71447

10西安体育学院学报-0.12699

11体育科学1.70221

12体育文化导刊-0.3441011

13体育学刊0.75634

14体育与科学-0.00673

15中国体育科技0.20266

16山东体育科技-1.7151616

从表3可以看出,16种体育类核心期刊中,纵向综合评价结果与7年平均影响因子结果完全相同的有7种期刊,占43.8%。分别为排在第6名的《中国体育科技》,排在第9名的《西安体育学院学报》,排在第12名的《广州体育学院学报》,排在第13名的《首都体育学院学报》,排在第14名的《山东体育学院学报》,排在第15名的《沈阳体育学院学报》和排在第16名的《山东体育科技》。《体育科学》期刊纵向综合排在第2名,7年平均影响因子排在第1名,这说明16种体育类核心期刊中《体育科学》期刊的学术影响力和期刊质量相对较高。两种方法排名反差较大的是《北京体育大学学报》,纵向综合排名排在第1名,而7年平均影响因子排在第8名,这说明《北京体育大学学报》的综合评价得分较高,但从7年平均影响因子单个指标来看,仍有上升空间。《天津体育学院学报》纵向综合排在第11名,而7年平均影响因子排在第5名,排名反差也较大。

由表2、表3综合来看,16种体育类核心期刊中学术影响力较强的期刊是《体育科学》和《北京体育大学学报》,排名不是很稳定的期刊有《上海体育学院学报》和《中国体育科技》。从整体上看,16种体育类核心期刊呈现均衡的发展态势。

本文主要利用多指标面板数据的分层因子分析法对16种体育类核心期刊进行了动态综合评价研究。分层因子分析法的优势是既考虑了数据的横向信息,又考虑了数据的纵向信息,从而获得纵向的综合排名。通过多指标面板数据分层因子分析法得到的综合排名,可以较为全面和客观地对某一类期刊进行动态的综合分析比较,其结果可以为期刊质量的提升提供一定的参考和借鉴。

[1]肖启华,黄硕琳,王慰. 多指標面板数据因子分析的分层模型及应用[J]. 数学的实践与认识,2015(12):86-93.

[2]卢石,杨红英,刘文娟,何峻. 中文体育类核心期刊评价指标分析——以《中文核心期刊要目总览》(2011版)为例[J]. 广州体育学院学报,2014(6):71-75.

[3]庄亮. 中文体育类核心期刊评价研究[J]. 体育文化导刊,2011(2):143-145.

[4]刘岩. 基于多维面板数据因子分析的中国图书情报学核心期刊综合发展评价研究[J]. 出版广角,2016(1):48-50.

[5]朱强. 中文核心期刊要目总览(第6版)[M]. 北京:北京大学出版社,2011.

多指标评价论文 篇7

一、时序多指标动态决策方法原理与步骤

(一) 时序多指标动态决策方法原理

时序多指标动态决策问题的原理是:已知有m个可行方案S1, S2, …Sm;n个评价指标P1, P2, …Pn;l个时间样本T1, T2, …Tl, 将各方案在不同时段的指标进行综合考虑的排序问题。

(二) 时序多指标动态决策方法步骤主要包括以下步骤:

第一步, 初始条件设置。设评价指标集为P={P1, P2, …Pn}, 相应的评价指标权向量为w= (w1, w2, …wn) T, 其中 设时间样本点为Ti (i=1, 2, …m) , 可以表示年度、季度和月份等, 相应的时间权向量为λ= (λ1, λ2, …λn) T, 其中 设被评价方案集为S=*S1, S2, …Sq, ;被评价方案Sk对应于时段Ti、评价指标Pj的指标值记为akij。指标权向量w和时间权向量λ的确定有多种方法, 如特尔菲法、层次分析法等。为了使得到的最终评价结果更好地反映动态特征, 需要综合考虑评价指标的好坏程度 (即绝对值) 和增长程度两种情况, 这里采用一种动态综合评价方法——理想矩阵法。

对于k个决策方案Sk的决策矩阵是:

对于时间样本点Ti的评价系数矩阵记为:

第二步, 决策矩阵和系数矩阵的规范化。通常, 指标有效益型、成本型、固定型和区间型之分。效益型指标是属性值愈大愈好的指标;成本型指标是属性值愈小愈好的指标;固定型指标是属性值稳定在某个固定值为最佳的指标;区间型指标是属性值以落在某个固定区间内为最佳的指标。根据指标分类的不同, 对指标集P可作如下划分, 令

式中Ωi (i=1, 2, 3, 4) 分别为效益型指标集、成本型指标集、固定型指标集和区间型指标集;Φ为空集。

考虑到不同指标的量纲可能不同, 为便于分析, 需将评价系数矩阵Ak (k=1, 2, …q) 进行规范化 (无量纲化) , 即将矩阵Ak转化为Bk。这里, 矩阵Bk中的元素bkij采用如下的规范化方法:

(1) 对于效益型指标, 令

(2) 对于成本型指标, 令

(3) 对于固定型指标, 令

式中a=ij为指标Pj针对时段Ti的最佳稳定值。

(4) 对于区间型指标, 令

式中[a1ij, a2ij]为指标Pj针对时段Ti的最佳稳定区间。

为便于反映方案指标值的动态变化情况, 将标准化处理之后的方案决策矩阵Bk转化为无量纲化后的规范化评价系数矩阵Ci, 记为Ci= (ckij) q×n (i=2, 3, …, m) , 再令

公式 (8) 中dkij表示对于时间样本点Ti的指标增长程度 (即绝对增长量) 。于是, 可构成对于时间样本点Ti的“增长”评价系数矩阵, 记为Di。

第三步, 求增长矩阵和集结矩阵。为综合考虑评价指标的好坏程度和增长程度, 可将规范化后的矩阵Ci (i=2, 3, …, m) 和增长矩阵Di (i=2, 3, …, m) 进行集成, 得“综合”评价系数矩阵为Ei= (ekij) q×n (i=2, 3, …, m) , 其中Ei中的元素为:

公式 (10) 中, α和β表示相对重要程度, 并且满足0≤α, β≤1, α+β=1, 特别当α=1, β=0时, 有ekij=ckij, 表示只考虑各指标的好坏程度;当α=0, β=1时, 有ekij=dkij, 只考虑各指标的增长程度。还需指出, 式 (10) 中dkij的意义是:dkij>0表示对指标好坏程度的一种奖励;dkij<0表示对指标好坏程度的一种惩罚。

为便于进一步分析和计算, 可将矩阵Ei转回为基于被评价方案的评价系数矩阵Ek, 即:

第四步, 构造正负理想矩阵。对于矩阵Ek (k=1, 2, …, q) , 构造正理想矩阵E+和负理想矩阵E-分别为:

其中, 矩阵E+和E-中的元素分别为:

第五步, 计算“欧氏距离”。矩阵Ek与E+、E-之间的“距离”分别是:

第六步, 计算贴近度, 方案排序。第k个被评价方案对理想解的相对贴近度为:

显然0≤gkA≤1, Ek越靠近E+而远离E-, 则gkA越大, 则相应的被评价方案应排在前面, 也就是根据gkA的大小进行排序。

二、时序多指标动态决策方法财务指数综合评价实例

(一) 评价指标体系的建立

本文应用时序多指标动态决策方法对上市公司财务状况进行综合评价。参考目前国内一些股票分析软件, 从中选取反映上市公司财务状况的典型评价指标数据, 综合考虑每个指标的好坏程度和增长程度, 得到的综合财务指数值使评价结果较好地反映了动态特征。本文选取湖北省10个上市公司为样本, 时间跨度为2006年6月30日至2007年6月30日, 时序为五个年报和季报时间点, 时段为四个季度。采用上市公司年报和季报中的指标数值。选取动态时序及上市公司研究样本如表1所示。

考虑到上市公司的自身特点, 为较全面反映上市公司财务状况, 可建立如表2所示的综合评价指标体系。

上述10个指标值均可从股票分析软件系统中得到。其中指标P1~P3, P7~P10均可看作是“效益型”指标, 即指标值愈大愈好;指标P4~P6通常可看作是“区间型”指标, 即指标值在某一最佳区间内为最好, 而最佳区间可由专家根据被评价上市公司的具体情况确定。

(二) 评价方法的应用

首先进行初始条件设置。已知评价指标集为p=p1, p2, …p10, 其中指标p4、p5、p6最佳区间分别设为[0.4, 0.5]、[1.5, 2]、[0.8, 1.3];设10个评价指标的权重均为0.1, 则权向量为ω= (0.1, 0.1, …, 0.1) T;设4个时间段的权重均为0.25, 则相应的时间权向量为λ= (0.25, 0.25, 0.25, 0.25) T。根据上市公司10个指标的实际值, 计算出5个时间样本点的评价系数矩阵。其次, 略去系数矩阵的规范化, 求增长矩阵、矩阵集结和综合系数矩阵, 构造正负理想矩阵, 计算“欧氏距离”, 得到贴近度 (评价指数) 和方案排序结果, 如表3所示。

三、时序多指标动态决策方法财务指数评价问题及应用趋势

(一) 评价方法的相关问题及改进主要包括以下几点:

一是评价指标的选取。财务评价以定量指标评价居多, 本文的研究也是以定量指标为例。但全面的财务评价也不能忽视定性指标的作用, 如财务外部环境评价、内部控制有效性评价更多地取决于定性指标。在基于时序多指标动态决策方法的财务评价中, 如涉及定性指标较多, 可将其作定量化处理再进行评价。如德尔菲专家评分的方法得到指标的实际值, 再进行动态分析和评价。此外, 评价方法只是一种工具, 要想得到科学、可靠的评价结果还有赖于评价指标选取的全面性、综合性、科学性。

二是评价指标权重确定。专家评分法和层次分析法是常用的指标权重确定方法, 但都有主观性缺陷, 在一定程度上影响评价结果的准确性和科学性。“熵值法”是一种客观赋值方法, 采用“熵值法”确定指标权重能较好地避免专家打分和层次分析法的主观性。为避免主观赋权法的主观性, 在指标体系中若各个评价对象在该指标上区别不是太大, 说明该指标对于评价对象的综合评价值的贡献不大, 那么, 赋予该指标的权重系数就不应太大;反之, 各个评价对象中资料相差很大, 则其权重系数的绝对值就应越大。各年度的原始观测数据可用%xij) (i=1, 2, …, n;j=1, 2, …, m) 来描述 (即.xij) 表示被评价对象第i年度第j项指标的原始观测值) 。用wj表示评价指标xj的权重系数, 为使评价结果客观、可比, 可将原始数据.xij) 进行标准化处理。处理后的标准数据变为.zij) , 则各年的综合评价值yi为:

具体步骤如下:

第一步, 原始数据标准化。

第二步, 将标准数据zij转化为比重值Pij, 公式如下:

第三步, 计算各指标的熵值ej, 公式如下:

第四步, 计算指标的信息效用系数 (即信息的差异性系数) dj, 公式如下:

由以上步骤可知, 指标j的实际值差异越小, 熵值越大;相反, 实际值差异越大, 则熵值越小。另一方面, 如果指标j的实际值差异大, 则表明对评价对象的作用比较大, 其权重应定得大一些;相反, 权重应定得小一些。因此, 权重与熵值应是互补关系。

第五步, 计算客观权重wj, 公式如下:

三是增长矩阵和集结矩阵的求法。本文实例中的增长矩阵采取“差值法”, 集结矩阵采取“加权求和法”。得到指标的绝对动态增长值, 对评价结果的反映具有一定局限性, 如采用相对动态增长值来进行评价则结果更合理。求相当增长矩阵和集结矩阵的方法如下:第一步, 求相对增长率矩阵。令bkti=akti′/ak (t-1) i (k=1, 2, …, m;t=2, 3, …, s;i=1, 2, …n) , bkti表示对于时间点Tt, 方案Sk的第i个指标Gi的相对增长率, 于是可得对于时间点Tt增长率系数决策矩阵, 记为Bt, 它考虑了指标的增长情况。第二步, 矩阵集结。为综合考虑指标的好坏情况和增长率情况, 可将规范化矩阵At′和增长率矩阵Bt (t=2, 3, …, s) 进行集结, 得“动态综合”决策矩阵Et= (ekti) m×n (t=2, 3, …, s) , 其中ekti= (akti′×bkti) 1/2 (k=1, 2, …, m;t=2, 3, …, s;i=1, 2, …n) 。

四是计算方法的简化。时序多指标动态决策方法的财务指数评价随时段跨度增大和指标数量增多而愈加复杂, 数据计算量十分巨大。尽管计算全部借助Excel软件完成, 仍然十分繁琐、费时费力, 这增加了评价的成本和难度。因此, 需要采用更高级的数学软件 (如Mat Lab等) 和计算方法。

(二) 评价方法的应用趋势

一是财务竞争力评价和绩效评价应用。财务竞争力评价和绩效评价在评价实质上一样, 但两者在方法应用的初始条件设置上略有差别, 如表4所示。两种评价在后续计算过程中方法基本一致, 最后采用得到的综合财务指标数值进行比较和评价。二是财务预警应用。财务预警是对企业财务状况的一种逆向评价, 其评价值越大则警情越严重。由此可见, 在评价结果上, 财务预警与财务竞争力评价、绩效评价是相对的, 即财务竞争力越强, 绩效越好, 财务预警警情越小;反之亦然。财务预警中的应用程序如表5所示。

参考文献

[1]王香柯、王金柱、周永华:《时序多指标决策问题的决策方法研究》, 《西安邮电学院学报》2004年第1期。

[2]王欣荣、樊治平:《上市公司财务状况的动态多指标综合评价方法》, 《系统工程理论与实践》2002年第4期。

[3]张旭梅、李志威:《具有动态指标偏好的多指标决策方法》, 《系统工程与电子技术》2007年第4期。

[4]戴文战、邹立华等:《一种基于奖优罚劣原则的多阶段多目标决策模型》, 《系统工程理论与实践》2000年第6期。

[5]谢丹凤、陈武、陈俊:《动态多指标决策的理想矩阵法及应用》, 《科技与管理》2005年第3期。

多指标评价论文 篇8

所谓多指标综合评价问题,是指建立了多个评价指标,并确定与权重相对应的权重系数,对评价对象进行排序或分类的问题[1,2,3]。多指标综合评价常用的方法有AHP、模糊综合评判法、理想点法、灰色关联评价法等以及这些方法的交叉综合使用[4,5,6]。显然,综合评价的结果是一个优劣的名次排序或对象的类别归属,是对对象系统做出全局性、整体性的评价[7]。如何通过对比、分析,掌握各个评价对象局部层面差异,是许多指标综合评价方法中没涉及到的。在综合评价后,进一步掌握和分析评价对象各个局部情况之间的差异,符合整体描述与局部描述相结合的原则,有利于发现、明确评价对象存在的问题, 促进决策的科学性。

技术经济分析作为系统分析中的一个重要方面,虽涉及到对产值、成本、利润等指标分析[8],但也缺少对指标值满意度的分析。麦尔斯所提出的价值工程法作为一种旨在提高所研究对象的价值的思想方法和管理技术[9],是通过对局部要素的分析,来寻求对整体问题改进的方法。但该方法缺乏对影响价值的时间因素做出考虑,主要针对成本和功能容易做出定量描述的分析对象进行研究,而在其他方面应用则受诸多限制。

俞守华等人通过借鉴价值工程的思想构建最满意区域法,对中指标发展情况的满意度进行评价[10],在指标值的满意度判别上作了可贵的探索。该研究从指标权重的角度考虑问题,将指标值满意度简单地划分为“满意”或“不满意”两种。黄灏然在俞守华研究的基础上,通过改变参数的方法进一步将指标值的满意度划分为“理想”、“次理想”和“不满意”三种,并将其用到对农产品批发市场核心竞争力的分析上[11]。这是对俞守华等人研究的进一步丰富,但参数意义不够明确,在满意度的划分上存在一定的随意性。正是由于上述研究在对多指标评价问题中的指标值满意度分析都存在这样或那样的缺陷,因此,就有必要对多指标评价问题中的指标值的满意度进行判别分析研究。本研究将尝试根据区分主次、明确差距、综合集成的思路,在构建判别规则的基础上对该问题展开研究。

2 指标值满意度判别的思路与原则

2.1 区分主次的思路

在多指标综合评价问题中,“多”指的是评价的指标至少是两个或两个以上,不同的指标对评价结果的影响程度往往各不一样。这就是说,对评价结果影响较“大”的指标,属于主要(或关键性)的因素,需给予更多的关注;而对评价结果影响较“小”的因素,则属于相对次要的因素,对其关注程度不应高于主要因素。对指标主次关系的区分可以通过权重系数的大小来判别,对权重较小的指标,其指标值达到满意程度的要求可偏低, 权重较大的则要求要高[10]。

2.2 明确差距的思路

指标值是指标发展状况的体现,要对其满意程度进行判别,就必须通过跟一个参照值进行比较,根据比较的结果来进行判别。在这里,参照值可以是指标的最优值或者指标的发展目标值。指标值和参照值之间的比较可以有两种方式:一种是从绝对差距角度衡量指标值与参照值之间的差距;另一种则是从相对差距的角度衡量。

2.3 综合集成的思路

借鉴系统工程方法论中的综合集成法的思想[12],将上述区分主次、相对差距和绝对差距的思想进行综合集成,通过综合集成,从不同的角度、多方位思考问题,以达到更加科学合理的对指标值的满意度进行有效判别的目的。

3 指标满意值判别的方法

3.1 权重-加权指标值域的表示

在多指标综合评价问题中,指标值的满意度受两个因素的影响:

一是指标值的大小。对于极大型指标(区间型和极小型指标可以通过数学变换转换成极大型),其指标值越大,其满意程度必然越高。在多指标综合评价过程中,通常需要对指标值进行数据预处理(无量纲化和归一化),处理的后的指标值可以用[0,1]区间中的一个数值进行表示。不失一般性,可用z表示。

二是指标权重大小。除了受指标值大小的影响外,指标权重的大小也是影响指标值满意度的一个重要因素。根据区分主次的思路,指标权重越大,对其要求越高;权重越小,要求越低。不失一般性,可把指标权重的大小用x表示,取值必定落在区间(0,1)上。

由于指标值的满意度受指标值z和指标权重x的影响,因此通过加权指标值的大小来衡量指标值满意度大小。不失一般性,加权指标值可用y来表示,则有y = xz 。由于z∈[0,1],因此0≤yx。这就是说,对于任何一个指标i,其加权指标值yi 的最大值不会超过指标i的权重xi ,所以xi可以看成是指标i(其权重也为xi)的最理想加权指标值。在二维坐标平面上,所有“权重-加权指标值” 点((x,y) 点),都必将落在如图1中的三角型AOE上,其中线段OA是各权重所对应的理想加权指标值的集合,∠AOE为45°。若用集合U表示所有(x,y)点的点集,则有:

U={(x,y)│0≤yx,0<x<1} (1)

3.2 判别规则构建

3.2.1 区分主次判别规则

根据区分主次思路,在指标值满意度判别的过程中,当指标权重较小时,允许加权指标值离理想线OA稍远;当权重较大时,则要求尽量靠近理想线。也就是说,对(x,y)点,当它越远离原点O,该点与理想线OA的垂直距离应该越小,即“远窄近宽”[8],如图1中曲线BF所示。

对于曲线BF中的任意一点I,Iy轴的距离IK=x,I与OA的垂直距离IH=x-y,矩形JHIK的面积SJHIK=x(x-y)。若SJHIK取特定值常数a(不妨称为主次常数),则有:

a=x(x-y) (2)

由于a为常数,所以随着x(权重)的增大,x-y(点I与理想线的垂直距离)必定减小,这就实现了“远窄近宽”的目的。因此,当任意一个指标j的“权重—加权指标值”点(xj,yj)落在区域AOFB上,则认为指标j的指标值是满意的,否则非满意。满意区域AOBF可通过式(3)进行表示,不妨称其为主次约束条件:

yx-ax,0<x<1(3)

若用集合C1来表示区域AOFB,则有:

C1={(x,y)yx-ax,0<x<1,0a1}(4)

若用集合T1表示非满意区域BFE,则有:

Τ1=C¯1=U-C1(5)

由于0< SJHIK <1,所以0<a<1。当主次常数a取不同值时,可以得到一组不同的“等满意”曲线,不妨称为主次等满意曲线簇,如图1所示。

3.2.2 相对差距判别规则

根据明确差距思路中找出相对差距的思维,对于指标i,其指标值满意度的大小可以通过其加权指标值yi与理想值xi之间相对比例关系进行判别。假设加权指标值yi达到理想值xib(0≤b≤100%)倍时,指标i是满意的,此时等满意线OD可以通过式(6)进行刻画,如图2所示。

y=bx,0<x<1 (6)

其中b为常数(不妨称为相对差距参数),取值范围为0≤b≤100%。此时,三角形AOD为满意区域,可通式(7)进行表示,不妨称之为相对约束条件:

ybx,0<x<1 (7)

若用集合C2来表示满意域AOD,则有:

C2={(x,y)│ybx,0<x<1,0≤b≤1} (8)

T2表示非满意区域ODE,则有:

Τ2=C¯2=U-C2(9)

在式(8)中,相对差距参数b的大小表示对加权指标值y达到理想值x的比例容忍度的高低,b越大,则对满意度要求越高;反之亦然。当相对差距常数b取不同值时,可以得到一组不同的“等满意”线,不妨称为相对差距“等满意”曲线簇,如图2所示。

3.2.3 绝对差距判别规则

根据明确差距思路中找出绝对差距的思维,对于指标i,其指标值满意度的大小可以通过其加权指标值yi与理想值xi之间接近程度(即| xi-yi |)进行判别。由于xiyi,这就有| xi-yi |=(xi-yi),因此xiyi之间的绝对差距可通过理想值xi与加权指标值yi之间的差进行表示。假设加权指标值与理想值之间的差距不超过c时,指标i的指标值是满意的,那么此时的等满意线NM可通过式(10)进行刻画,如图3所示。

y=x-c,0<x<1 (10)

其中c为常数(不妨称为绝对差距参数),取值范围为0≤c≤1。此时,梯角形NMAO为满意区域,可通式(11)进行表示,不妨称之为绝对约束条件:

yx-c,0<x<1 (11)

若用集合C3来表示满意区域NMAO,则:

C3={(x,y)│yx-c,0<x<1,0≤c≤1} (12)

T3表示非满意区域NME,则:

Τ3=C¯3=U-C3(13)

在式(12)中,绝对差距参数c的大小表示对加权指标值y与理想值x的差距大小,c越小,则对满意度要求越高;反之亦然。当绝对差距常数c取不同值时,可以得到一组不同的等满意线,称为绝对差距“等满意”曲线簇,如图3所示。

3.3 满意度区域划分

根据综合集成的思路,可将上文三种满意度判别规则进行合成。主次常数a、相对差距常数b、绝对差距常数c分别取特定值时,判别规则的综合集成结果如图4所示(abc取不同值时,图形各不一样)。当“权重-加权指标值” 点(x,y) 满足不同的约束组合时就构成了不同的满意度区域,具体来说可以分为以下4类区域:

(1)理想区域。在理想区域中任意一点(x,y)同时满足主次约束条件、相对约束条件和绝对约束条件,在OAE中满意度最高,如图4中区域AORQB所示。理想区域若用集合Ca表示,则有Ca=C1∩C2∩C3。

(2)劣区域。在劣区域中任意一点(x,y)同时不满足主次约束条件、相对约束条件和绝对约束条件,在OAE中满意度最低,如图4中区域FPDE。劣区域若用集合Cd表示,则有Cd=T1∩T2∩T3。

(3)次理想区域。在次理想区域中任意一点(x,y)同时满足三个约束条件中的任意两个,满意度仅次于理想区域,如图4中的ONR、RPQ、QBM区域。次理想区域若用集合Cb表示。则有Cb=(C1∩C2)∪(C1∩C3)∪(C2∩C3)-Ca

(4)次劣区域。在次劣区域中,任意一点(x,y)满足且仅满足三个约束条件中的任意一个,在OAE中满意度仅次高于劣区域,如图4中的NRPF、PQND区域。次劣区域若用集合Cc表示,则有Cc=U-Ca-Cb-Cd

3.4 指标值满意度的判别

由于任意“权重-加权指标值” 点(x,y)必定落在三角形AOE上,那么它必定落在上述4个区域中的某一个上,并对应相应的满意度。由上述满意度区间的划分方法可以知道,在满意度上各区间先后关系为:理想区域>次理想区域>次劣区域>劣区域。因此在进行局部层面问题分析时,应该着重分析落在劣区域的指标并寻求改进的方法和途径;其次为劣区域和次理想区域;对于落在理想区域的指标只需继续维持原有状态即可。

4 实例

例1(由于篇幅原因不考虑背景),某市农业信息发展水平的评价指标、权重、无量纲值、加权指标值如表1所示。根据上述对指标值满意度判别的方法,当a取0.008、b取0.7、c取0.04时,各指标的指标-加权指标值点的位置如图5所示。可知,指标f4、f6落在劣域满意度最差, f1、f2落在次劣域,f3、f5落在理想域满意度最高。因此,要提高该市农业信息化水平,应该先加强指标f4、f6方面的建设,其次再考虑指标f1、f2方面的工作。

5 结论

(1)判别规则中的主次常数a、相对差距常数b和绝对差距常数c,虽然意义比较明确,但是其具体取值必须根据实际情况进行确定,三个参数取值的大小不仅影响等满意线的位置,更是影响对指标值的满意度判别。

(2)依据系统方法论中强调不断优化学习的观点,开始时常数abc可以取较“宽”值,方便找出问题进行分析;随着问题的解决或改善,常数abc应取较“严”值,以求进一步对问题进行分析和辨别。

参考文献

[1]I A BORGULYA.A ranking method for multiple-criteria decisionmarking[J].Int.Journal of Systems Science,1997,28(9):905-912

[2]C N PAUL.How decision makers evaluate alternatives and the influ-ence of complexity[J].Management Science,1998,44(8):1148-1168

[3]郭亚军.一种新的动态综合评价方法[J].管理科学学报,2002,5(2):49-54

[4]O S VAIDYA,S KUMAR.Analytic hierarchy rocess:An overview ofapplication[J].European Journal of Operational Reration Research,2006,169(1):1-29

[5]R RAMANATHAN.Data envelopment analysis for weight derivationand aggregation in the AHP[J].Computers&Operations Research,2006,33(5):1289-1307

[6]L MIKHAILOV.A fuzzy approach to deriving priorities from intervalpair-wise comparison judegments[J].European Journal of Opera-tional Resarch,2004,159(3):687-704

[7]王宗军.综合评价的方法、问题及其研究趋势[J].管理科学学报,1998,1(1):75-79

[8]孙东川,林福永,孙凯.系统工程引论[M].北京:清华大学出版社,2009:153-158

[9]斯图尔特,邱菀华.价值工程方法基础[M].北京:机械工业出版社,2007:1-5

[10]俞守华,黄灏然,区晶莹.一种指标发展情况满意度的评价方法[J].统计与决策[J].2007(20):161-162

[11]黄灏然.农产品批发市场核心竞争力评价研究[D].广州:华南农业大学,2008:60-64

多指标评价论文 篇9

多目标性能评价指标在跟踪系统设计与评价方面具有非常重要的意义,同时,多目标跟踪性能评价也是一个非常困难的问题。多目标跟踪性能指标作为评价多目标跟踪算法性能好坏的一个量值,对于算法选择、分析和评估起着非常重要的作用。一般来说,算法的性能指标主要包括:精度、复杂度、运行时间、收敛性、鲁棒性、实时性、一致性等等。在本文中,我们重点考虑是集值估计算法精度指标问题。

对于多目标跟踪性能的评价指标,最为常见的就是均方误差(MSE)。MSE指的是真值和估计值之间的期望差值。实际上,由于期望通常很难获得。因此,直接计算MSE指标就非常困难。因此,经常使用的一个指标是均方根误差(RMSE),它利用Monte Carlo仿真的采样值来统计逼近该期望值。RMSE在多目标跟踪领域是一个最为常用的指标,但是,RMSE指标有几个不足:首先,它不是欧氏空间上的距离概念;其次,当目标个数很大的情况下,例如上百个批次,用RMSE作为多目标跟踪评价指标就显得过于冗余。实际上在大批次目标情况下,单个目标的跟踪性能指标越来越被弱化。换句话说,在这种情况下,人们更多地关注对整体目标群的跟踪性能的评价,而不再关注单个目标的跟踪性能。然而,RMSE的定义是建立在各个目标真值和其估计值之间存在明确对应关系的基础之上的。或者说,需要首先考虑关联的问题,否则,RMSE是没法直接使用的。因此,RMSE在大批次目标情况下应用是很繁琐的,也是不现实的。在这种情况下,自然会考虑目标集的跟踪评价指标,这种目标集的评价指标实际上可以抽象为集合之间的距离。Wasserstein距离就是建立在评价集合间差异的一种度量指标[1,2],并被进一步引入到多目标跟踪领域[3]。然而,Wasserstein距离对于集合元素个数的差别惩罚过重,因此,一致性比较差。为了克服这个问题,Schuhmacher等引入Optimal Subpattern Assignment(OSPA)距离[4],它是建立在Wasserstein距离基础之上,并且修正了Wasserstein距离中的不足。Circular position error probability(CPEP)把目标跟踪位置正则化到某个阈值半径的圆上[5],判断目标是否丢失,统计出目标的跟踪丢失率。本文将对这些指标进行比较分析,同时给出算例进行分析说明,指出各个指标的特点、算法实现和应用方法等。

1 随机集多目标跟踪性能指标

1.1 均方误差(MSE)和均方根误差(RMSE)

均方误差的定义如下:

其中:xk是k时刻目标真实状态值,是目标状态估计值,如前所述,上式中期望值计算比较困难。因此,通常利用RMSE来代替:

其中:M是总的Monte Carlo仿真次数,xk,i是第i次仿真数据,是相应的状态估计值,它利用样本值统计值代替真实的期望值。RMSE误差不是欧式空间上的距离,因此,其度量指标和常规距离概念有所不同。此外,在多目标情况下,RMSE需要考虑目标真实状态值和估计值之间的对应关系,也就是说首先需要先解决关联问题。否则,两个不同目标状态之间相减没有任何意义,在这种情况下计算RMSE误差就失去了参考意义,这一点也是RMSE不能用于集值估计算法的主要障碍。

1.2 圆丢失概率(CPEP)

该指标用于评价目标跟踪丢失率的情况,在最初的文献[5]中定义如下

这里是2范数,r表示圆阈值。这里“所有的”指的是所有的估计值,一般包括两类:第一类是指Monte Carlo仿真值;第二类是多个估计器的估计值。CPEP取值在[0,1]区间之间,值越大,表示跟踪丢失率越大。从式(3)可以看出,它同样需要考虑目标真实状态和估计状态之间的对应关系。文献[5]中通过Monte Carlo仿真来计算CPEP丢失率。Vo等在文献[6-7]中引入该指标,并给出了如下的公式:

其中:Hk=[I2,02],r是位置误差半径。不过,这个式子的表达容易给人造成误解:Xk是所有目标的估计状态集,并不是(3)中的所有某个目标估计值,二者具有不同含义。因此,本文建议该公式修改为

上式表示对于所有估计值并且是对应状态为xk的目标估计值。实际上,如果利用Mont Carlo仿真计算该丢失率,我们可以给出如下的计算式:

式中:M是Monte Carlo次数或者估计器个数,是k时刻所有Monte Carlo估计集值,即,表示没有丢失的目标标签,是集合中的元素个数。上式可以直接计算,不需要考虑估计和真实值之间的对应关系。

1.3 Wasserstein距离

Wasserstein距离是统计理论上的一个指标,用于度量两个密度函数之间的距离[8],p阶Wasserstein距离定义如下:

其中:µ,ν是边缘概率分布,其对应的随机变量分别是xµ,yν;G(x,y)是所有xµ,yν的联合概率分布;g是其中任意一个联合分布。Wasserstein开始主要应用在度量数字图像某些特征的相近程度,例如纹理和颜色的相近程度[9]。Oliver Drummond等把该概念用于多目标误差判断[1,2],Hoffman等给出了Lp意义上的Wasserstein距离[3],即:

其中:C={Ci,j}是一个n×m矩阵,其中的元素Ci,j和满足如下的条件

因此∑ni=1∑mj=1Ci,j=1,其中,Wasserstein距离用于评价两个集合之间的距离,两个集中任意一个为空集时,Wasserstein距离不存在。该距离不仅评价集合元素之间的差异,并且也评价集合间元素个数(集合势)的差异。

1.4 OSPA距离

Wasserstein距离对于集合之间势的差别惩罚过重,并且当集合元素和势之间同时出现误差的条件下。即使对于集合元素数值误差很小,但是由于集合势存在误差,使得评价数值出现很大的误差,这和实际的直观理解不一致。因此,Dominic Schuhmacher等提出了修正的OSPA距离[4],定义如下。

分别对应p阶和无穷大评价指标。其中的参数c是一个水平参数,其物理含义是目标状态估计误差阈值,用于调节集合势的估计误差比重。

2 误差解释及性能分析

我们主要从以下几个方面分析这几个指标数学和物理上的含义及各自的特点。

2.1 距离含义

MSE本身就是距离的概念,虽然RMSE本身和欧氏空间上的距离概念有所不同,也是向量空间中的一种范数概念。CPEP是一种概率测度上的度量指标,指的是目标在某个球面邻域内的丢失率。Wasserstein是一种集合之间距离的度量指标。它本质上可以解释为一个如下的优化问题:

即满足上述约束条件的集合X和X之间的最短距离。当两个集合势不同时,两个集合之间的Wasserstein距离会增加。这时候,由于包含集合势的误差,在这种条件下,比较Wasserstein距离是没有意义的。当两个集合势相同时,Wasserstein可以解释为两个集合之间的最小平均距离。

和Wasserstein距离有所不同,OSPA距离也可以解释成为如下的一个优化问题:

OSPA距离基本含义是单个目标的平均误差,也可以被解释为位置和集合势两部分距离:

OSPA有两个参数p和c,p是距离敏感性参数,对于任意的参数1≤p1≤p2≤∞,OSPA距离满足下面的关系:

c是一个水平调节数,用与调节集合势误差的影响。也就是说,如果我们认为距离误差比势误差更重要,那么水平数c可以选择小点。相反,c取大一些的值。对于参数1≤c1≤c2≤∞,OSPA距离满足如下的关系:

从上式(18),(19)可以看出,OSPA距离对于参数p,c是一致的。

2.2 计算实现

RMSE计算简单,这里我们重点考虑其他三个指标的计算问题。CPEP是概率测度的计算,分别根据目标的真实状态和估计状态之间的差值和阈值r之间的关系来计算,主要通过Monte Carlo仿真来实现。Wasserstein距离是一个线性优化问题,因此,我们可以通过优化程序处理包来实现。OSPA距离可以利用匈牙利算法来解决。

从上述分析也可以看出,对于基于随机集的误差评估,或者集值估计的误差评判,传统的RMSE,欧式距离,范数等等的概念很难应用。主要原因是传统的算法是一种点和点之间误差评判准则,因此,可以直接应用的范数概念来解释评价。而基于随机集的估计理论则需要对集合估计性能进行评判,它属于点集-点集之间的度量,评判起来更为复杂,点集-点集之间的评价指标至少应该满足如下的条件:

1)集合中元素的顺序不应该影响最终的评判结果,或者说,集合元素不变,顺序变化,那么评价指标结果应该一致,不发生变化。显然,传统的范数是不能直接应用的。这和范数的交换率类似,即对于任意的两个点x,y,范数d(x,y)=d(y,x)。而对于任意的两个集合X,Y,集值评价指标满足如下的两类交换性条件:

上式第一个条件对应集合元素的次序变化,其中,Li,Lj,Jm,Jn分别表示不同的排序;第二个条件对应两个评价集合位置交换,这个也是集值评价指标的基本要求。

2)从1)的要求也可以看出,集值估计的评价指标必须满足元素位置的不变性,也必须满足集合位置的不变性。这个问题似乎只能转化成为一个优化算法的最优解问题。这一点也可以从Wasserstein距离和OSPA距离定义看出来,这种最优解常常是一个最优分配问题,目前基于随机集的多目标跟踪性能评价指标都是基于这种思路的。

3)RMSE很难作为随机集多目标跟踪算法的评价指标,主要原因是RMSE要求确定目标估计状态和实际状态之间的对应关系。如前所说,在大批次目标情况下或者集值估计算法中无法直接使用。

3 算例

在这部分我们分别给出线性和非线性两个算例,来比较分析这些指标的评价效果。由于RMSE需要考虑真值和估计值之间的对应关系,我们重点分析集值估计算法的评价,因此,这里暂不考虑RMSE,只分析CPEP,Wasserstein距离和OSPA距离三个指标。

3.1 算例1:线性跟踪系统

考虑三个目标的运动,目标系统运动方程和量测方程如下

目标初始位置分别为x01,=(500,20,-500,10),x0,2=(500,25,500,-20),Qk=cov(wk,wk)=diag(25,25),Rk=cov(vk,vk)=diag(100,100)。我们利用GM-PHD滤波器跟踪目标[6]。假设采样时间为T=1 s,目标的出生强度为υγ(x)=.01N(x,x01,,P0)+.01N(x,x0,2,P0)。其中矩阵Fk-1,Gk-1定义如下:

图1是目标状态估计过程,图2分别是x,y方向目标状态的估计,图3是基于1 000次蒙特卡洛仿真(MC)的目标个数估计。可以看出,GM-PHD滤波器能很好地跟踪三个产生于不同时刻的目标,估计目标个数也能很好刻画了实际目标个数的变化过程。图4分别用三个不同指标对系统的跟踪过程进行评价,通过1 000MC仿真,可以看出,在目标个数变化的时刻,Wasserstein距离会出现很大的误差,这个误差大小不受控制。即如果目标位置都很接近,但是因为估计个数变化,会导致评价指标出现很大的误差,这个和人们直观上的感觉是不一致的。

另外一种情况是目标位置估计误差相差很大,而个数估计准确,这时候Wasserstein距离可能并不大,这个也和实际中的直觉不一致。而OSPA指标通过引入水平参数c来解决这个问题。可以看出,如果目标位置估计比较重要,而目标个数出现误差相对不太重要,那么取比较小的水平参数c,在图4中对应c取100对应的值。可以看出目标个数出现变化的地方波峰不明显,OSPA曲线整体比较平缓,主要反映的是跟踪位置误差的变化。如果目标个数估计误差比较重要,那么我们可以进一步增加c的取值,那么相应的OSPA距离也会增加。随着水平参数c值变大,评价指标也增加。在目标个数估计不正确的地方,OSPA距离会进一步增加,甚至出现一个波峰。并且c值越大,波峰越明显。因此,OSPA参数能更全面地描述集合误差的估计。这种基于集合的误差评判指标是随机集理论中必须要考虑的问题。

图4中,在第6∼9时刻之间,OSPA指标出现一个波峰,主要原因是由于目标漏检的存在,使得目标个数为零,这意味着出现空集,在这种情况下。按照OSPA定义,取最大的水平值,而这个水平值一般远大于正常的跟踪误差。这样使得第10时刻反而出现峰谷。目标出生和死亡时间如下表1所示。

图5给出的是目标丢失率曲线,可以看出目标丢失的地方都集中在目标个数发生变化的地方。分别对应目标出生,死亡的时刻。例如第10时刻目标2产生,第20个时刻目标3产生,40个时刻目标1死亡。

3.2 算例2:非线性跟踪系统

为了比较方便,假设目标的运动方程不变,量测方程为如下的角度、距离量测方程:

其中:量测协方差阵Rk=cov(vk,vk)=diag(σ2k,θ,σ2k,r),σk,θ=2π/180rad,σk,r=10005m,杂波个数还是40个,其它参数和上面的线性方程一致。

我们通过Particle-PHD滤波器获得PHD粒子分布,通过MCMC方法估计多目标状态[10]。比较线性的情况(虽然线性和非线性很难直接比较,但是从相同的运动方程,相同的杂波个数,相同的观测区域上来说,可以提供一个比较一致的参考),总体说来,非线性情况下跟踪性能有所降低。这可以从图6,图7中看出。目标个数估计也偏大,主要原因是非线性作用后,目标的状态分布变得复杂,在杂波作用下,使得虚警个数增加。同时,Wasserstein距离,OSPA距离相对比线性情况有所增加。在第10个时刻目标2产生,三个指标都出现波峰,主要原因是在非线性条件下,虽然从图8看,第10个时刻目标个数估计的平均值比较精确,但由于目标个数估计值的方差变大,使得三个指标都出现波峰。在其他目标个数变化的地方,OSPA波峰不明显,主要原因是虚警的增加,使得整个估计误差变大。在丢失率方面,在目标个数发生变化的地方,丢失率明显增加。比较图5和图10,可以看出非线性量测的丢失率要高于线性量测系统。

4 结论

本文着重分析了三种常用于随机集多目标算法性能评价指标:CPEP,Wasserstein距离和OSPA距离。可以看出CPEP主要用于判断目标丢失率,针对CPEP计算中的一些不足,本文进行了分析和修正;Wasserstein距离可以用于评价随机集估计性能,但是它在目标个数估计不正确的情况下往往会出现很大的误差,这一点和直观上的理解不一致。而OSPA距离弥补了Wasserstein距离在这方面的不足,通过一个水平参数来弥补这个不足,值越小,说明目标位置的估计误差越重要;相反,值越大,说明目标个数估计出现的误差越重要。

参考文献

[1]Drummond O E,Fridling B E.Ambiguities in evaluating performance of multiple target tracking algorithms[J].Proc.Signal Data Processing Small Targets(S0277-786X),1992,1698:326-337.

[2]Drummond O E.Performance evaluation of single target tracking in clutter[J].Proc.Signal Data Processing Small Targets(S0277-786X),1995,2468:92-104.

[3]Hoffman J,Mahler R.Multitarget miss distance via optimal assignment[J].IEEE Trans.Sys.,Man,and Cybernetics Part A(S1083-4427),2004,34(3):327-336.

[4]Schuhmacher Dominic,Vo Ba-Tuong,Vo Ba-Ngu.A Consistent Metric for Performance Evaluation of Multi-Object Filters[J].IEEE Transactions on Signal Processing(S1053-587X),2004,56(8):3447-3457.

[5]Ruan Y,Willett P.The turbo PMHT[J].IEEE Transactions on Aerospace and Electronic Systems(S0018-9251),2004,40(4):1388-1398.

[6]Vo Ba-Ngu,Ma Wing-Kin.The Gaussian Mixture Probability Hypothesis Density Filter[J].IEEE Transactions on Signal Processing(S1053-587X),2006,54(11):4091-4104.

[7]Ba-Tuong Vo,Ba-Ngu Vo,Antonio Cantoni.Analytic Implementations of the Cardinalized Probability Hypothesis Density Filter[J].IEEE Transactions on Signal Processing(S1053-587X),2007,55(7):3553-3567.

[8]Jordan Richard,Kinderlehrer David,Otto Felix.The variational formulation of the Fokker-Planck equation[J].SIAM J.Math.Anal(S0030-1410),1998,29(1):1-17.

[9]Bissacco A,Chiuso A,Soatto S.Classification and Recognition of Dynamical Models:The Role of Phase,Independent Components,Kernels and Optimal Transport[J].IEEE Transactions on Pattern Analysis and Machine Intelligence(S0162-8828),2007,29(11):1958-1972.

多指标评价论文 篇10

关键词:桔梗,海拔梯度,多指标,综合评价

桔梗(Radix platycodi)为桔梗科植物桔梗(Platycodon grandiflorum(Jacq.)A.DC.)的干燥根[1],主要用于治疗咳嗽痰多、胸闷不畅、咽痛、音哑、肺痈吐痰、疮疡脓成不溃等症[2]。桔梗作为药食两用的传统中药,具有营养、保健、防病治病等多种功能。海内外学者对桔梗中成分的药理活性研究较多[3,4,5],本课题组也从多方面对桔梗质量进行评价研究[7,8,9]。为进一步扩大重庆产桔梗资源的开发,保证商品药材及相应制剂的稳定性,本实验拟对收集的不同海拔梯度的桔梗药材进行多指标成分测定,为重庆产桔梗药材资源的合理使用及种植提供借鉴和参考。

1 实验材料

1.1 仪器

岛津LC-20A高效液相色谱仪;ELSD-LTII检测器;岛津工作站;KQ-250B型超声波清洗器(昆山市超声仪器有限公司);梅特勒ME215S十万分之一电子天平;梅特勒CP224S万分之一电子天平;紫外UV-2550(日本岛津公司);超声波清洗仪SD3200(昆山市超声仪器有限公司);LK-COOA摇摆式高速中药粉碎机。

1.2 试剂

桔梗皂苷D标准品(MUST-13082211);芦丁标准品(UV)(MUST-15091104);D(+)-无水葡萄糖(MUST-13122601)购自成都曼思特生物科技有限公司;乙腈,色谱纯;甲醇、乙醇、正丁醇、甲酸、冰醋酸、高氯酸、香草醛,分析纯(川东化工集团有限公司化学试剂厂);超纯水(自制)。

1.3 药材

本实验桔梗药材样品采自2014年开县、万州、奉节等地不同海拔高度共12批,药材采集后清洗去除泥沙,刮去根皮后干燥,即得桔梗样品,并经重庆万州食品药品检验所孟家安教授鉴定为桔梗科桔梗属植物桔梗(Platycodon grandiflorum(Jacq.)A.DC.)的根。见表1。

2 方法与结果

2.1 水分测定

按《中国药典》2010版一部附录ⅨH第一法,取不同批次的桔梗样品(过2号筛)2.0g测定;总灰分测定:精密称取桔梗粉末(过2号筛)3.0g,按《中国药典》2010版一部附录ⅨK灰分测定法测定;浸出物测定:精密称取桔梗粉末(过2号筛)2.0g,置于150mL锥形瓶中,精密加水100mL,按《中国药典》2010版一部附录X A项下醇溶性浸出物测定法的热浸法测定。

2.2 桔梗总皂苷含量测定

测定方法参照文献[6]。

2.3 桔梗总黄酮含量测定[9]

精密称取芦丁对照品15.70mg,加甲醇溶解并稀释制成浓度为0.157mg·mL-1的标准品溶液,精密称取1.0g桔梗粗粉,置于100mL锥形瓶中,加90%甲醇溶液50mL,超声提取45min,放冷过滤定容于100mL容量瓶中,作为供试品溶液。在510nm处测定吸收度,计算总黄酮的含量。

2.4 桔梗总多糖含量测定[9]

精密称取葡萄糖标准品15.23mg,加蒸馏水溶解并稀释制成0.1523mg·mL-1的标准品溶液。精密称取桔梗样品1.0g,置于100mL容量瓶,超声提取45min。精密量取续滤液20mL蒸干,加水溶解,加10mL无水乙醇放置12h,抽滤,沉淀用90%乙醇洗涤,加水溶解定容至50mL量瓶,摇匀,即得供试品溶液。在486nm处测定吸收度,计算出总多糖的含量结果见表1。

2.5 桔梗皂苷D含量测定

测定方法参照文献[8]。

2.6 各项指标测定结果分析

实验结果显示,12批桔梗样品水分和总灰分均符合现行《中国药典》规定,醇浸出物的含量为17.96%~28.66%,总多糖的含量为15.21%~31.19%,总皂苷的含量为6.72%~9.69%,总黄酮的含量为0.28%~0.57%,桔梗皂苷D的含量为0.41%~0.77%,不同海拔梯度的桔梗指标性成分含量差异明显。见表1。

(%)

2.7 相关性分析

采用SPSS19.0统计学软件对上述指标间进行相关性分析,结果显示:桔梗药材的水分、总灰分与其他指标之间无显著相关性;总多糖和浸出物之间呈极显著相关性;总皂苷和浸出物之间呈极显著相关性;总黄酮和浸出物之间呈显著相关性;桔梗皂苷D和浸出物之间呈显著相关性;总多糖和总黄酮之间呈极显著相关性,总皂苷和总黄酮之间呈极显著相关性;总皂苷和桔梗皂苷D之间呈极显著相关性;总皂苷和桔梗皂苷D间呈极显著相关性。见表2。

注:*P<0.05;**P<0.01。

2.8 主成分分析

大量研究表明,采用主成分分析和模糊数学方法建立的数学模型评价中药材质量是可行的[10,11]。本研究采用SPSS19.0软件对12批桔梗药材的水分、总灰分、醇浸出物、总黄酮、总皂苷、总多糖及桔梗皂苷D的含量等测定数据进行主成分分析。成分1、成分2的特征值占总方差的80.755%,选取了前两个因子作为主成分,代表主要的桔梗质量指标。第一主成分以醇浸出物、总黄酮、总皂苷、总多糖及桔梗皂苷D的含量贡献较大;第二主成分以水分含量贡献较大。由图2可知,距离原点较远的几个点就是主成分1和2中权重值大的成分,表明其为决定产地差异的重要因素。见图1。

综合主成分得分越高,相应的评价样本质量越优。由得分图可见不同海拔梯度的桔梗药材得分不相同,提示桔梗药材的质量可能与海拔梯度分布有关。综合得分得出6号开县关面乡海拔1 500m的桔梗药材质量最优。见图2。

3 讨论

本研究对桔梗的水分、总灰分及醇溶性浸出物进行检测,同时对总黄酮、总皂苷、总多糖以及桔梗皂苷D的含量进行测定,建立全面的桔梗药材质量评价体系,并通过该体系综合分析不同海拔梯度桔梗药材的质量差异。通过分析该体系,不同海拔梯度桔梗醇溶性浸出物均在17%以上,水分不超过15%,总灰分不超过5%,桔梗皂苷D的含量均大于0.1%,所有样品均能符合《中国药典》2015版相关标准,质量较好。

三峡库区地形特殊,更不能忽略海拔因子是影响药用植物分布及生长发育的重要环境因素。海拔梯度造成的温度、水分和土壤肥力等环境异质性可能会极大影响植物的生长,从而导致植物生理生态适应性发生变化[12]。影响桔梗体内多种成分积累的因素比较复杂,可能是多种生态因子如温度、土壤等协同作用的结果。在该研究基础上加大收集代表性桔梗样品,采用质谱等先进方法,进一步对桔梗体内代谢产物成分筛选,并结合药效、分子生物学等方面进行综合比较研究,使桔梗质量评价体系更加完善。

参考文献

[1]周荣汉.中药资源学[M].北京:中国医药科技出版社,1994:486-489.

[2]国家药典委员会.中华人民共和国药典[M].一部.北京:中国医药科技出版社,2015:277-279.

[3]CHOI J H,HWANG Y P,HAN E H,et al.Inhibition of acrolein-stimula-ted MuC5AC expression by Platycodon grandiflorum root-derived saponin in A549cells[J].Food Chem Toxicol,2011,49(9):2157-2166.

[4]KIM M S,KIM W G,CHUNG H S,et al.Improvement of atopic dermati-tis-like skin lesions by Platycodon grandiflorum fermented by Lactobacillus plantarum in NC/Nga mice[J].Biol Pharm Bull,2012,35(8):1222-1229.

[5]YU J S,KIM A K.Platycodin D induces reactive oxygen species-media-ted apoptosis signal-regulating kinase 1activation and endoplasmic reticulumstress response in human breast cancer cells[J].J Med Food,2012,15(8):691-699.

[6]黄娇,姜登军.海拔高度对重庆产桔梗皂苷含量的影响[J].亚太传统医药,2015,11(11):30-33.

[7]黄娇,姜登军.不同海拔高度桔梗药材中3种桔梗皂苷含量的测定[J].北方药学,2015,5(12):12-13.

[8]黄娇.指纹图谱和主成分分析法评价不同海拔高度的桔梗药材质量[J].食品工业科技,2015,13(36):309-320.

[9]周秀娟,桔梗的质量研究[D].合肥:安徽中医药大学,2013.

[10]汪云伟,钟恋,焦小珂,等.基于主成分及相关性分析的益母草综合质量评价[J].时珍国医国药,2014,25(7):1777-1779.

[11]安开龙,李德坤,周大铮,等.不同干燥方法对五味子药材品质的影响[J].中国中药杂志,2014,39(15):2900-2905.

高效课堂的评价指标 篇11

一、教学目标设计的合理性

教学目标的设计,一要具体化,应细化到认知、技能、情感等领域各项目标,避免过分强调知识性目标,以达到素质教育的要求;二要实际化,应在了解学生实际能力水平和特点的基础上,合理确定教学重点,使教师在课堂教学中集中力量讲清重点,从而提高教学效率;三要分层化,每个学生都是特殊的个体,教师必须将个体差异作为一种资源来开发,从而在教学目标的设计上体现出合理的层次性,促使每个学生学有所得。

二、课堂提问的启发性

教师在提问时应注重内容和方式两方面。从内容上衡量,提问应选准切入点。从方式上衡量,提问应注意艺术性。另外,也可以通过计算来量化启发性提问的有效率。

三、板书设计的网络性

首先,在“编织”板书网络过程中,教师应根据课程标准和教学目的及所教学生的实际水平,采取不同的网络结构,力求通过精心设计使其达到科学、精练、好懂、易记的要求,以提高教学效率。其次,在设计板书的网络结构时,教师还应注意整体效果,做到合理布局、主次分明,在给学生以整体美感的同时,使学生明确重点、难点,助其加强记忆。最后,板书的设计必须与教师讲解的内容紧密结合,高效的板书网络,其每一个支脉都应与教师的讲解形成纲与目的关系。设计板书还要做到确切精当、言简意赅,起到画龙点睛、指点引路的作用。

四、应用信息技术的适时性

首先,要对信息技术是否在利用其他教学手段难以完成的情况下有效地解决了教学难点、信息技术是否无缝渗透到了教学必需的环节上,提高了课堂教学的有效度等进行评价。此外,还须注意其是否产生了负面影响,如:信息技术在课堂上的过多使用是否会让学生产生视觉疲劳?信息技术带来的课堂容量增大是否脱离了学生的实际接受能力?信息技术的使用是否流于形式,导致“凑热闹”“华而不实”等现象的产生……

五、作业设计的层次性

作业设计的层次性,一是应体现在作业的目的上,应使其既顾及知识深化层面,又涵盖方法训练层面,还要考虑到学生能力提高层面;二是应体现在作业的形式上,应使其既有必要性又有典型性,从而达到以一当十、触类旁通的目的。另外,层次性还应体现在作业的要求上,教师应充分考虑不同学生的学习水平,精心设计由浅入深、由易到难的作业,并允许学生根据自己的水平选做程度适宜的习题,以便使不同层次学生的学习能力在完成作业的过程中都能得到有效的提高。

六、学生的自主性、合作性、探究性

学生能否主动地思考课堂教学中产生的问题,学生能否在实践探究中解决问题,学生能否在反思质疑中发现新的问题,学生能否在课堂学习中提高相应的能力水平?如果这一系列问题的答案都是肯定的,那么我们的课堂教学才真正由“教而获知”转变为“学而获知”,从而也就实现了高效课堂所追求的目标——让学生在自主学习、合作学习、探究学习中产生学的冲动,积极参与课堂、积极主动地思考,最终获得全面发展。

多指标评价论文 篇12

配电网规划或原有配电网改造计划首先应考虑技术、经济、可靠性等问题[7,11]。传统的配电线路供电能力评价方法主要侧重于考虑技术因素的影响, 比如考虑噪音[12]、接线模式[13]、线路容量[13]、容载比[14];有的侧重于资金投入, 但往往忽略一些技术因素和供电可靠性的影响[12]以及供电可靠性的要求。本文在考虑传统的配电线路供电能力评价方法基础上, 提出在高中压配电网配电线路规划或改造计划时, 要增加同时考虑电压质量、网损和供电可靠性的影响因素, 即多指标评价方法。

1 多指标评价方法

正常供电是指在保证电能质量及维持一定的供电可靠性和网损水平的情况下为用户负荷提供功率。配电网中110 k V、35 k V、10 k V配电线路是常见的高中低电压配电线路, 评价其供电能力主要考虑电压质量、线损率、供电可靠性等指标。

1.1 电压质量指标

评价节点电压质量就是比较节点电压实际值与额定值的大小, 可采用其比值的方法来评价, 若节点电压实际值与额定值的比值等于1, 则说明节点电压在额定值的水平上;若节点电压实际值与额定值的比值大于1, 则说明节点电压比额定值偏高;若节点电压实际值与额定值的比值小于1, 则说明节点电压比额定值偏低。对于单一节点电压, 构建的考核指标为

式中, Ui、Uni分别为节点i电压的实际值和额定值。

评价变电站变压器增容、线路长度变化、线路导线截面积变化对单一节点电压的影响, 分别构建的考核指标为:

式中:NL0、NL分别为原有线路的数量、新增线路的数量, NT0、NT分别为原有变压器的数量、新增变压器的数量, ST0i、STi分别为原有和新增变压器的容量, LT0i、LTi分别为原有和新增线路长度, AT0i、ATi分别为原有和新增线路导线截面积;kUS、kUL、kUA分别称为新增单位变电容量引起的电压偏移量、新增单位线路长度引起的电压偏移量、新增单位线路截面积引起的电压偏移量。电压偏移量可以针对最大负荷和最大电源出力的情况下进行计算, 也可以针对各种运行方式和条件进行计算。

从全网整体来看, 评价变电站变压器增容、线路长度变化、线路导线截面积变化对节点电压的影响, 分别构建的考核指标为:

式中:NN0、NN分别为原有和新建网络的节点数;kVSA、kVLA、kVAA分别为是新增单位变电容量、新增单位线路长度、新增单位线路截面积引起全网电压平均偏移量。电压偏移量取全网的平均值, 反映的是全网电压的平均变化。

1.2 网损指标

以电网中每条支路功率损耗在线路技改和新建前后的比值来评价线损率, 若比值等于1, 则说明功率损耗无变化, 若比值大于1, 则说明功率损耗变大, 若比值小于1, 则说明功率损耗变小。对于某一线路功率损耗, 构建的考核指标为

式中:PLoss0i、PLossi分别为电网进行技改和新建线路之前和之后线路i在每个节点均为最大负荷下的功率损耗。

电网建设不仅追求最好的经济和技术效果, 同时期望通过线路的技术改造和新建获得全网线损率的降低。如果期望电网建设线损率为λLEi, 那么线损率的考核指标为

变电站变压器增容、线路长度变化、线路导线截面积变化对支路功率损耗均有影响, 而且单位容量、单位线路长度、电网线路导线截面积的影响对其程度也不相同。针对这种情况, 可以分别称为新增单位变电容量引起的线损率、新增单位线路长度引起的线损率、新增单位线路截面积引起的线损率, 并可分别构建如下的考核指标来评价:

评价变电站变压器增容、线路长度变化、线路导线截面积变化对整个电网功率损耗的影响, 可用的指标为:

式中, kLoss SA、kLoss LA、kLoss AA分别反映的是新增单位变电容量、新增单位线路长度、新增单位线路截面积造成的全网总功率损耗。

1.3 供电可靠性指标

每个负荷点供电可靠性在线路技改和新建前后都会有变化, 每个负荷点供电可靠性在线路技改和新建前后比值的大小可以用来评价电网供电可靠性的变化。当比值等于1时, 则说明线路技改和新建对负荷点供电可靠性无影响, 当比值大于1时, 则说明线路技改和新建对负荷点供电可靠性增大了负荷点供电可靠性, 当比值小于1时, 则说明线路技改和新建降低了负荷点供电可靠性。对于某一负荷点供电可靠性, 构建的考核指标为

式中, λD0i、λDi分别为电网技改和新建前后负荷点i供电可靠性的实际值。

如果对供电可靠性有一种期望值λDEi, 那么供电可靠性的考核指标为

考核变电站增容、线路长度变化、线路导线截面积变化对负荷点供电可靠性影响程度, 可以分别用新增单位变电容量增大的供电可靠性、新增单位线路长度增大的供电可靠性、新增单位线路截面积增大的供电可靠性三个指标, 即

评价变电站变压器增容、线路长度变化、线路导线截面积变化对整个电网功率损耗的影响, 分别用的三个指标为:

式中:kλSA、kλLA、kλAA分别反映的是新增单位变电容量、新增单位线路长度、新增单位线路截面积形成的所有负荷点供电可靠性平均变化量。

1.4 电压质量、网损、供电可靠性综合评价指标

从全网的角度考虑所有节点电压水平、所有支路功率损耗以及所有负荷点供电可靠性相对应技改和新建前的计算值, 分别构建的考核指标为:

式中ND0、ND分别为技改和新建前后负荷点数。

考虑经济和技术效益的要求以及考核指标的约束, 构造电压质量、网损、供电可靠性综合评价模型:

2 实例计算与分析

假设10 k V、35 k V、110 k V变电站单位容量投资值为15万元/MVA、25万元/MVA、40万元/MVA, 10 k V、35 k V、110 k V线路单位长度投资值为10万元/km、20万元/km、50万元/km。在区域负荷40 MVA且导线截面积为120 mm2、300 mm2下10 k V、35 k V、110 k V线路供电能力综合评价如表1、表2所示;在区域负荷200 MVA且导线截面积为120 mm2、300 mm2下10 k V、35 k V、110 k V线路供电能力综合评价如表3、表4所示。

从表1至表4可以看出, 在30 km至60 km的线路长度范围内, 35 k V线路供电能力综合评价值均高于10 k V和110 k V线路;在一定的线路长度范围内, 10 k V线路供电能力综合评价值会高于35 k V和110 k V线路, 而35 k V线路供电能力综合评价值均高于110 k V线路。

如果输送功率相同, 在确保电压质量并实现期望的供电可靠性水平、最低网损率的情况下, 需要的110 k V线路数量小于35 k V、10 k V线路, 比如:导线截面积为300 mm2的110 k V线路在供电半径为20 km时并输送功率200M VA功率时, 110 k V线路需要4条, 35 k V线路需要12条, 10 k V线路需要135条, 可见在节省占地方面110 k V线路优势非常明显。

3 结论

1) 单纯从电压质量、供电可靠性和网损率的综合评价指标看, 在30 km至60 km的线路长度范围内35 k V线路好于10 k V、110 k V线路。

上一篇:钢管混凝土拱桥设计下一篇:我国国际贸易探究