评价数据

2024-10-10

评价数据（精选11篇）

评价数据篇1

摘要：以基于生命周期的数据质量管理框架为出发点, 提出了数据组织过程中的数据质量评价模型和方法, 包括数据质量维度、数据质量评价指标、数据质量综合评价模型以及数据质量评价方法等。该模块与方法对提高数据质量和加强数据运用具有重要意义。

关键词：数据质量,管理框架,评价指标,评价方法

0 引言

数据质量可以简单地定义为“满足最终数据用户期望的程度”[1]。数据作为重要的信息资产, 其质量高下直接影响着数据效能的发挥, 低质量的数据将给数据使用的主体带来巨大损失。Card&Payments的一项分析报告表明, 每年仅仅因为错误或重复的客户信息就使企业多付出了6千多亿美元的成本[2]。还有报告指出, 仅在2007年, 不合格的数据使保险业付出了140亿美元的成本, 使银行业付出270亿美元的运营成本[3,4]。

1 数据质量管理框架

理解生命周期 (Life Cycle) 的思想对于管理任何资源都是重要的, 这一周期是指某事物整个有用生命的变化和发展过程。Danette McGilvray将信息生命周期划分为6个阶段, 并用首字母将其命名为POSMAD, 分别是:规划 (Plan) 、获取 (Obtain) 、存储和共享 (Store and Share) 、维护 (Maintain) 、应用 (Apply) 、报废 (Dispose) , 如表1所示[5]。

数据质量的管理应该贯穿到整个数据的生命周期中, 文献[5]还基于数据质量提高周期提出了10步流程, 如图1所示。

结合表1和图1不难看出, 对数据进行质量校验和评估, 然后向用户和数据建设者沟通评估情况是提高数据质量的重要环节。

2 数据质量评价模型

数据质量维度是质量的特征, 它们为度量和管理数据质量提供了一种途径。在建立数据质量评价模型时, 首先要做的是选择数据质量维度, 然后据此建立数据质量评价指标体系, 最后基于指标体系设计评价算法。

2.1 数据质量维度

Danette McGilvray归纳出数据质量的维度有12项, 如表2所示[5]。

数据组织环节中的质量评价并不需要从表2所列的所有维度进行评估, 应该根据需要选择要评价的质量维度。选择的依据有两点: (1) 是否应该评价该维度; (2) 能否评价该维度。

数据的组织是介于数据资源建设和数据运用中间的环节, 因此数据的组织者不应以建设者的身份对数据建设规划与建设环节的相关维度进行评估, 如可维护性、数据覆盖等, 也不能以应用者的身份来评价数据的有关维护, 如及时性、可用性、易用性、可理解性、相关性和可信度等。

综合上述分析, 数据组织过程中的数据质量评价应从以下4个维度进行: (1) 数据规范性; (2) 数据完整性; (3) 数据重复性; (4) 数据准确性。

2.2 数据质量评价指标

基于上节选定的数据质量评价维度, 可建立相应的数据质量元素。数据质量元素及其评价规则如表3所示。

记S为数据库中的关系, Ai (1

定义1记录规范性 (αi, j) :设f是数据项规范性映射函数, 且fA (vi, j, cj) ∈{0, 1}, cj是第j个属性的参考规范。αi, j定义为:

定义2元组规范性:记元组ti的各数据项的正确性为αi, 1, αi, 2, …, αi, m, 则定义为:

显然, 说明ti全部规范;说明ti全部不规范;表示ti的规范程度。

定义3元组缺失率 (β1) :设ntrue表示S本应具有的元组个数, n表示S的实际元组个数, 则:

1-β1为元组完整率。

定义4记录缺失率 (β2) :设为元组ti中值为null的字段个数, 则:

定义5数据重复率 (γ) :设ntrue表示S本应具有的元组个数, n表示S的实际元组个数, 则:

1-γ表示数据重复率的反向指标, 值越大则该项质量越好。

定义6记录准确性 (δi, j) :设g是数据项规范性映射函数, 且。δi, j定义为:

如果vi, j正确, 则δi, j=1, 否则δi, j=0。

定义7元组准确率:记元组ti的各数据项的正确性为δi, 1, δi, 2, …, δi, m。定义为:

显然, 说明ti全部正确;说明ti全部不正确;表示ti的正确率。

2.3 数据质量综合评价

数据质量评价一般针对一个数据集进行, 一个数据集有多个关系。从上节的讨论可知, 每个关系有多个评价指标可以从不同方面进行评价, 一个评价指标的好坏并不能直接确定相关数据集数据质量的好坏, 综合多个评价指标进行数据质量评价时需要增加评价指标的权重, 进行综合计算。

先作如下定义: (1) DataSet是要评价的数据集; (2) R是其关系集, Ri (i

基于以上定义, 对数据进行综合质量评价可采用如下公式进行计算:

3 数据质量评价方法

数据质量评价程序是通过应用一个或多个数据质量评价方法来完成的, 数据质量评价方法可分为两个主要类别:直接评价法和间接评价法[6], 其分类结构如图2所示。

直接评价法通过将数据与内部或外部的参照信息, 如理论值等进行比对, 确定数据质量。间接评价法利用数据相关信息, 如数据志对数据源、采集方法等的描述、推断或评估数据质量。

数据组织过程中的数据质量评价目的是给出数据资源的质量状况报告, 检测出数据中存在的问题, 一方面将存在的数据质量问题反馈给数据资源的建设管理者, 作为其改进数据质量的参考依据, 另一方面将数据质量评价结果反映给数据用户, 作为其运用数据的参考依据。因此, 数据组织过程中的数据质量评价可采用如图3所示流程图中的方法, 向数据管理者反馈的评价结果主要是不符合评价标准的问题记录信息, 用于数据管理者改进数据质量的依据;增加 (修改) 描述数据集质量的元数据则是将评价结果写入数据集的描述信息中, 作为用户运用数据集时的参考依据。

4 结语

数据组织的主要工作是通过对数据进行选择、描述、加工、序化和存储等活动实现数据的有序化和优质化, 是衔接数据建设和运用的桥梁, 其主要目的是为了更好地运用数据。本文以基于生命周期的数据质量管理框架为出发点, 提出了数据组织过程中的数据质量评价模型和方法, 对于促进数据质量的提高、更好地运用数据具有重要意义。

参考文献

[1]K T HUANG, Y W LEE, R Y WANG.Quality information and knowledge management[J].Prentice Hall, 1998.

[2]KATE FITZGERALD.Weeding out bad data[R].Card&Payments, 2007.

[3]CYNTHIA SACCOCIA.Insurance industry perspectives on data governance:managing a valuable resource[R].TowerGroup, 2006.

[4]GUIL ERMOKOPP.Data Grovernance:Banks Bid for Organic Growth[R].TowerGroup, 2006.

[5]DANETTE MAGILVRAY.数据质量工程实践[M].刁兴春, 曹建军, 译.北京:电子工业出版社, 2010.

[6]戴剑伟, 吴照林, 朱明东, 等.数据工程理论与技术[M].北京:国防工业出版社, 2010.

评价数据篇2

【关键词】征信系统数据质量评价机制

一、建立征信系统数据质量评价机制的必要性和重要性

（一）有利于促进征信业的发展

目前，金融信用信息基础数据库（简称征信系统）是我国重要的金融基础设施之一，采集近10亿企业和个人的信用信息，已经成为世界上规模最大的数据库。它由中国人民银行征信中心运营和维护，接入金融机构、小额贷款公司、融资性担保公司、汽车金融公司等多种类型的机构。通过开展征信系统数据质量工作评价，有利于全面、系统、客观公正地反映和评价接入机构征信系统数据质量工作的成效，塑造金融业良好形象，促进征信业发展。

（二）有利于提高征信系统数据质量

通过开展征信系统数据质量工作评价，对接入机构及其工作人员进行激励约束，从而督促接入机构重视征信系统数据质量工作，建立提升征信系统数据质量的长效机制，提高接入机构报送征信系统数据的及时性、准确性、完整性，从而促进征信系统数据质量不断提升。

（三）有助于提升征信工作人员的积极性

在我国征信系统数据质量工作激励约束机制中，除了制度法规约束外，运用金融经济学中的“补偿原则”，引入利益分配和补偿机制，使征信系统数据质量卓有成效的机构有一定程度的获益，提高数据质量工作的主动性和创造性，为做好数据质量工作提供内在的、强大的、持久的动力。

（四）有利于减少异议或诉讼的发生

随着信用信息主体维权意识的逐步增强，信用信息主体申请征信异议或投诉的数量呈现出增长的势头。据调查，接入机构数据报送错误是引起异议或诉讼的主要原因。因此，提高信用信息的完整性、及时性和准确性，有利于减少征信异议或诉讼的发生。

二、征信系统数据质量工作现状和存在的主要问题

（一）征信系统数据质量工作重视程度不高

征信系统防范信用风险、促进信贷市场发展有着重要的意义。然后，存在一些接入机构对征信工作重视程度不高、相关制度落实不到位的情况，影响了征信系统的数据质量。

（二）对征信系统数据质量的认可度不高

根据信用信息基础数据库运行情况问卷调查显示，接入机构对数据质量的认可度较低，主要由于一些接入机构上报信用信息不真实，录入不够准确，更新不够及时等原因，导致征信系统中不能真实、全面反映个人和企业的信用情况。

（三）征信系统数据质量专业人才缺乏

由于我国征信体系建设起步较晚，高等教育也就这几年才有征信人才的培养，在全国看来，建设征信体系人才缺乏已是不争的事实。尤其是一些小额贷款公司、融资性担保公司等小型机构，征信工作的专业人才缺乏，缺少对数据质量工作的责任心，对从而影响了征信信息准确性、完整性、及时性。

（四）征信系统数据质量评价机制有待健全

目前，主要针对征信系统量化考评等个别专项工作进行激励约束，缺少对征信数据质量工作全面的评价机制。同时，征信系统数据质量的相关规章制度总体重处罚轻激励，对数据质量工作积极配合、努力尽职的机构或个人缺乏激励机制和成本补偿机制，不利于征信数据质量工作的开展。

三、征信系统数据质量评价方案设计

（一）评价原则

1.科学性。设计征信系统数据质量工作评价指标体系时，以征信系统数据质量相关制度要求、征信系统数据质量应达到的目标、开展征信系统数据质量工作等方面为指导。设计评价指标体系力求在基本概念和逻辑结构上严谨、合理，抓住征信系统数据质量工作的实质，并具有针对性。另外，采用定性、定量的相结合方法，将征信系统数据质量抽象的内容具体化。

2.可操作性。可操作性，也就是可行性和实用性，指征信系统数据质量评价指标内容客观明确，指标简化、方法简便，信息及数据易于采集且准确可靠。

3.引导性。评价指标要能引导被评价对象的行为。合理、可行的征信系统数据质量工作评价指标体系必须能对接入机构及其工作人员的行为起到一定的引导作用，接入机构及其工作人员不仅仅为了评价而评价，评价只是手段，它的最终目的应该是保证目标的实现，因此，评价指标应具有灵活、动态和全方位的特点，以此引导被评价者与组织目标保持一致。

（二）评价指标及内容

征信系统数据质量评价工作分为对接入机构征信系统数据质量评价和对接入机构征信系统数据质量工作人员评价。本文中指标体系设计的思路是根据征信系统数据质量工作内容、性质、目标要求以及完成这些工作所具备的条件等进行研究和分析，确定评价的各项要素。本文在认真分析研究影响征信系统数据质量的各种因素的基础上，建立评价指标体系。

1.接入机构征信系统数据质量工作评价内容包括三个方面：征信系统数据质量考评情况、数据质量日常监测情况和对征信中心数据质量工作配合支持情况。其中，征信系统数据质量考评情况包括评价接入机构征信系统数据的完整性、及时性、准确性。数据质量日常监测情况主要评价接入机构征信系统数据上报和加载、补报和纠改情况。对征信中心征信系统数据质量工作机制具体包括接入机构征信工作牵头部门及人员配备情况，内控制度情况，会议培训情况，工作创新情况和投诉、诉讼情况等方面。若接入机构发生征信系统数据丢失、向未经信贷征信主管部门批准建立或变相建立的信用数据库提供信用信息等对征信系统有较大负面影响的事件，则实行一票否决。

2.对于接入机构征信系统数据质量工作人员的评价以其所属接入机构质量评价结果和接入机构工作人员数据质量工作情况两方面进行考评。根据接入机构数据质量评价情况的评价得分，作为接入机构征信系统工作人员评价得分的一部分。接入机构工作人员数据质量工作情况主要评价工作人员征信系统数据日常工作、数据质量提升工作以及征信制度业务学习情况、征信系统数据质量理论研究情况工作创新情况等。若工作人员所在部门或本岗位发生数据丢失、泄密、违规查询信用报告等对征信系统有较大负面影响的事件，则实行一票否决。

（三）评价的结果划分

根据评价结果将接入机构征信系统数据质量划分为A、B、C、D四个等级。其中A级指该机构征信系统数据的完整性、准确性和及时性好，能很好的开展数据质量工作，并对征信中心数据质量工作配合力度高。B级指该机构征信系统数据的完整性、准确性和及时性较好，能较好的开展数据质量工作，并对征信中心数据质量工作配合力度较高。C级指该机构征信系统数据的完整性、准确性和及时性不高，能开展数据质量工作，但效果不明显，并对征信中心数据质量工作配合力度较低。D级指该机构征信系统数据的完整性、准确性和及时性差，数据质量工作开展较差，并对征信中心数据质量工作配合力度。同上，根据评价结果将接入机构数据质量工作人员评价成绩划分为优秀、良好、一般、较差四个等级。

（四）评价的程序

1.评价数据的采集。定量指标数据来源于征信数据量化评分、两端数据核对、征信数据日常上报、更新、纠改。定性指标根据各接入机构数据质量工作开展情况等。

2.计算各指标得分。定量分析跟据专家打分法确定权重，按照层次分析法计算出分值;定性分析按照事先制定好的接入机构评价内容及指标表进行打分。

3.综合指标得分。将定量指标与对应的权重相乘，并与定性指标得分进行加总，即得到接入机构征信数据质量工作最终得分。

4.在接入机构征信数据质量工作评价结束后，将评价结果作为对征信数据质量工作人员评价的一项重要指标。对征信数据质量工作人员评价比照接入机构征信数据质量工作评价进行。

5.评价的流程。（1）成立征信中心征信系统数据质量评价办公室（以下称评价办公室），并在各分中心成立评价小组（以下称评价小组）。全国性接入机构由评价办公室负责评价，地方性接入机构由评价办公室委托评价小组评价。

（2）评价工作开始前，由评价办公室启动评价工作，如图1所示。评价办公室制定评价计划，下发数据质量工作评价标准。接入机构报送评价对象的征信系统数据质量工作情况自查报告和自查表，并说明理由。其中全国性接入机构将材料报评价办公室，地方性接入机构将材料报当地评价小组。评价办公室和评价小组根据接入机构报送资料及掌握的相关资料进行打分。

（3）评价小组汇总各类得分，计算最终得分，并进行初步等级判定，将本地区评价结果报评价办公室审批。

（4）评价办公室汇总评价结果，将初评结果发送至各接入机构。

（5）被评价对象收到评价结果后，如有异议，可以在5个工作日内将申诉意见反馈至评价办公室或当地评价小组。评价办公室或当地评价小组收到申诉意见后5个工作日内，应给予答复。

（6）评价办公室以正式文件形式下发被评价对象的征信系统数据质量工作的评价结果。

四、建立健全征信系统数据质量评价机制的措施

（一）提高对征信系统数据质量工作重要性的认识

“征信系统数据质量是征信系统的生命线。”做好征信系统数据质量工作是落实科学发展观，坚持以人为本的根本要求;保障征信业健康发展，维护金融稳定的客观需要;塑造金融业良好形象，维护正常金融秩序的有效举措;促进社会公平正义，建设和谐社会的重要内容。因此，接入机构提高对征信系统数据质量工作重要性的认识，积极主动做好征信系统数据质量工作。

（二）加强对征信系统数据质量评价机制的宣传

目前执行的征信系统数据质量方面的文件都强调了接入机构征信系统数据质量工作的职责义务，却没有涉及激励机制问题。因此，在推行征信系统数据质量评价机制中，应加强宣传，使接入机构及其工作人员了解征信系统数据质量激励及约束机制的目的、内容等，促使接入机构认真履行征信系统数据质量工作义务，并使征信系统数据质量卓有成效的机构有一定程度的获益，提高数据质量工作的积极性。

（三）明确征信系统数据质量评价工作的程序

建议征信中心制定征信系统数据质量评价工作的方案，并明确征信系统数据质量评价工作的程序。围绕个征信系统数据质量评价的制度规范、工作流程、方式方法等内容，组织对分中心及接入机构工作人员开展培训。为了确保评价工作顺利，可以根据量化考评掌握接入机构的数据质量情况，在全国部分分中心选择不同机构类型、数据质量在不同层次的接入机构开展征信系统数据质量评价试点工作，对发现的问题进行研究分析和解决，总结试点地区进行征信系统数据质量评价的工作做法和先进经验，并在全国推广。

参考文献

[1]胡燕.商业银行征信监管影响因素探析——基于《征信业管理条例》的视角[J].征信，2013，（12）：23-27.

[2]刘霏.完善商业银行员工激励的对策研究[M].企业导报，2011，（7）：206-207.

[3]孙艳丽.完善我国国有商业银行绩效考核机制的思考[J].科学之友，2011，（1）.111-112.

水质分析数据评价方法探讨篇3

关键词：水质分析,质量控制,数据评价

引言

检测过程是实验室质量体系运行的主要过程, 影响检测过程的因素很多, 包括人员、设备、环境、检测方法等。检测结果的正确与否, 是质量体系运行中各因素控制好坏的综合反映, 为确保检测结果的有效性, 实验室应制定应有的质量控制程序和质量控制计划, 并按计划组织实施。为了整合资源、节资耗材实验室可以将仪器期间核查、标准物质验证、质量控制结合在一起进行质控, 这样可以达到事半功倍的效果, 现就实验室内、外部质量控制及水质分析数据正确性进行探讨。

1 质量控制的方法

检测结果质量是实验室始终关注的重点, 检测过程是检测机构的质量体系运行的主要过程。为确保检测结果的准确有效, 实验室应有质量控制程序和质量控制计划, 以监控检测工作的全过程。因此, 实验室应经常利用内部手段, 如平行样的测定、空白样品的测定、密码样检测、人员比对、方法比对、仪器比对等验证检测工作的可靠性, 并借助外部力量验证检测能力。在检测过程中, 不是不允许出现问题, 需要发现问题并控制它, 找出原因, 针对原因采取改进措施, 从而提高实验室检测数据的可靠性、稳定性和准确性。

2 常规的质控

常规的质控程序的主要目的是控制测试数据的准确度和精密度。在实验室常用的程序有以下几种。

2.1 平行样品的测定。

平行样又称平行双样, 是指在环境监测和样品分析中, 只包括两个相同子样的样品。采集和测定平行样是实施质量控制的一项有效措施。平行样的测定结果在一定程度上反映了测试的精密度水平。在环境监测中, 采集和测定平行样的百分比应根据样品的批量、测定的难易程度、有无质量控制等进行确定, 测定过程无法避免随机误差, 要减少测定中的随机误差, 增加同一样品的测定次数是非常有效的措施。一般分析通常要求对样品进行平行双样测定。每批水样抽取样品数的10%-20%, 其结果应符合要求。

2.2 空白样品的测定。

空白样品的测定是很重要的, 它可以估计纯水、试剂及每个分析步骤可能带来的问题等。空白为溶剂空白、试剂空白和样品空白。试剂空白是指用纯水代替样品外, 其所加试剂和操作步骤与样品测定的操作步骤完全相同。但试剂空白不能消除样品中可能存在干扰物质的干扰, 所以有时还要制备样品的空白。针对于微生物检测过程中应进行培养基的空白实验

2.3 回收率试验。

加标回收率主要表示分析的准确度。在进行加标回收测定时首先要注意的是加标物质的形态应与待测物质的形态相同。加标样品和样品中待测物浓度应控制在精密度相等的范围内。加标量一般为样品含量的二倍, 如果样品含量已超过校准曲线的中间浓度, 则加标量为样品含量的一半, 加标后总浓度应小于方法测定上线的0.9倍。半微量和微量元素回收率分别应控制在90%~110%和80%~120%之间。

2.4 密码样分析。

密码平行样的密码加标样分析, 在所需分析的样品中, 随机抽取10%~20%的样品, 编为密码平行样或加标样, 这些样品对分析者本人均是未知样品。

2.5 人员比对试验。

用同一方法对同一试样在相同条件下 (包括相同操作、相同仪器、同一实验室和相近时间进行分析) 相继测定结果相互接近的程度。而再现性的定义是同一方法对同一试样在不同条件下 (操作者不同、另一台仪器、不同的实验室和相隔较长时间分析结果) 测定单个结果之间相互接近的程度, 使用再现性进行判断。

2.6 方法比对试验。

除了上述几种校对和检查方法外, 还有方法比较分析;室内互检、外检;质量控制图的绘制等等。

2.7 仪器比对试验。

仪器比对试验效果是一个实验室技术管理水准和操作水平能力的综合体现。可采用标准物质验证、标准曲线的制作、回收率的测量等方法, 针对于两台或两台以上的仪器进行比对。

3 水质分析数据正确性分析

水中各种离子处于相互联系、相互制约的平衡状态中, 利用化学平衡理论如电荷平衡、沉淀平衡等, 对实验结果的有效性分析, 采用此方法进行质控简便快捷、能够及时发现分析中存在的误差和失误。

3.1 溶解总固体和电导率的关系

电导是水溶液电阻的倒数, 水样中可溶性离子越多, 电阻就越小, 电导就越大, 因此水样的电导率和总溶解固体存在一定的相关关系。

3.2 溶解总固体和总硬度的关系。

由于水中主要离子有八种, 其中就含有Ca2+和Mg2+, 因此水样的总硬度<总溶解固体。

3.3 总硬度与钙、镁总量的关系。

总硬度实为钙、镁总摩尔浓度, 但由于其它离子也与EDTA络合, 所以当其它离子浓度较大时, 测得的总硬度应大于钙、镁摩尔浓度之和, 当其它离子很少时, 测得的总硬度近似等于钙、镁摩尔浓度之和。

3.4 水中阴、阳离子摩尔浓度的关系。

由于水中阴、阳离子始终处于一种相互联系、相互制约的关系, 欲要保持水溶液中阴、阳离子电荷平衡, 那么阴、阳离子摩尔浓度总和应大致相等。

4 结论

实验室质量控制绝不仅仅是检测过程的控制, 而是贯穿实验室全部质量活动的始终, 我们在这里探讨的仅仅是针对于实验室内部质控和水质数据正确性的分析, 通过分析可以及时进行自检自查, 发现问题, 以便及时进行整改。

参考文献

[1]O'Hanlon K, Ebdon L, Foulhes M, Jounal of Analytical Atomic spectrometry, 1996, 11 (4) :234-238

[2]Ramsey M.Thompson M.Jounal of Analytical Atomic Spectrometry, 1997, 2 (3) :22-29.

[3]Greenfielcl S, Bisop E, Ebdon L.Analytical Proceedings, 1998, 12 (1) :101-110.

[4]Mermet J.M.Analytica Chimica Acta, 1991, 250 (1) :65-74.

[5]实验室资质认定评审准则[M].北京:中国计量出版社 (2006) .

评价数据篇4

摘要：介绍了数据采集系统通道间串扰的成因。根据JJF1048-1995《数据采集系统校准规范》分别对直流信号对直流通道、交流信号对直流通道以及交流信号对交流通道的串扰能力进行测试、计算和评价，对实验结果进行了分析和总结。研究结果表明了对数据采集系统通道间串扰评价的重要性。

关键词：数据采集系统;通道间串扰;评价方法

引言

多路数据采集系统(模块)能够通过不同的传感器将相应的测量信号转为电信号[1]，从而实现对温度、电信号、压力、位移等参数的测量和处理，是连接模拟世界和数字世界的桥梁。所以，对数据采集系统的定期校准是必不可少的。目前，国内对数据采集系统的检测项目一般包括电压、电流等信号的示值误差。随着工业设备的不断升级和改造，数据采集系统的采集通道数量也在不断增加，这将不可避免地引起通道间串扰。例如在功率测量过程中，电流和电压通道之间产生的串扰会影响功率计算的准确性[2]。

所以，在一定的情况下，有必要对数据采集系统的通道间串扰能力进行评价。现行的JJF1048-1995《数据采集系统校准规范》[3]对数据采集系统的通道间串扰提供了校准依据。它描述了利用直流电压源作为干扰信号源，对相邻通道的读数进行测量的方法，并以串扰抑制比SCRR作为评价结果。然而，数据采集系统的应用范围并非局限于直流信号，例如，传统功率测量就需要采集50Hz/60Hz的交流信号。所以，在数据采集系统通道串扰项目的校准中，仅仅考虑直流信号对直流通道产生的串扰是不全面的。本文首先介绍通道间串扰产生的原因和影响，再扩展JJF1048-1995中的要求，对不同信号产生的通道间串扰进行测量和计算，并对结果进行分析和总结。

1通道间串扰产生的原因

数据采集系统通常采用多路模拟开关按照一定的时序对各个通道进行循环采集，再通过时分复用的方式进行量化。然而，由于集成化程度的不断提高，与多路模拟开关输入端相连接的相邻导线或引脚之间必然存在寄生电容。电容具有通交流阻直流、通高频阻低频的特点，所以对于交流信号，必定会通过寄生电容对相邻通道产生干扰。而对于直流信号，在模拟开关的循环切换过程中，切换动作会引起一定时间内的电压抖动。由于该抖动为交流信号，所以也会通过寄生电容影响相邻通道[4]。

2通道间串扰的影响

大型设备由于接入数据采集系统的信号数量和类型较多，更容易产生通道间串扰，如焓差试验台中的直流电压和电阻信号，风洞试验中的交流电压和直流电压等。由于寄生电容的作用，干扰信号会与采样信号发生叠加，从而产生不必要的.噪声，这在一定程度上影响采样信号的准确性。这种情况在干扰源频率较高时尤为明显。另外，对于直流信号而言，由多路模拟开关的切换产生的电压抖动虽然会在短时间内恢复，但在高采样频率条件下，如果受到串扰的信号没有在A/D转换器采样之前恢复，势必会影响采样而造成转换误差[5]，降低数据采集系统的准确度。

3通道间串扰的评价

3.1测试方法参照JJF1048-1995，采用如图1的接线方法，就数据采集系统直流信号对直流通道、交流信号对直流通道和交流信号对交流通道的通道串扰能力进行实验。将通道CHn与多功能校准器相连接，将相邻通道CHn+1与1kΩ标准电阻R0相连接。此外，干扰通道选取最大量程，相邻的采样通道选取最小量程，参照JJF1048-1995中第12节的要求进行试验。

3.2直流信号对直流通道的串扰能力干扰信号源采用多功能校准器输出标准直流电压，干扰通道和采样通道都按照各自量程切换为直流电压测量模式。测量结果如表1所示。

3.3交流信号对直流通道的串扰能力干扰信号源采用多功能校准器输出不同频率的标准交流电压，干扰通道和采样通道都按照各自量程分别切换为交流电压测量模式和直流电压测量模式。这里参考JJF1048-1995中12.6节公式(29)的形式进行评价。交流电压信号“零位”幅值选取为0.1V，按照式(1)计算通道间串扰抑制比SCRR。

3.4交流信号对交流通道的串扰能力干扰信号源采用多功能校准器输出不同频率的标准交流电压，干扰通道和采样通道都按照各自量程分别切换为交流电压测量模式。根据式(1)计算串扰抑制比SCRR，结果如表3所示。

4结果分析

理想情况下，干扰通道和采样通道的信号互不干扰。然而，由于数据采集系统本身设计的局限性以及导线分布的影响，通道间串扰不可避免。通过对比，直流通道对直流信号的串扰抑制能力最强，因为在这种情况下，串扰主要原因是模拟多路开关切换造成的电压抖动，而电压抖动本身能量较小，持续时间也较短，所以通道串扰能力最小。直流通道对交流信号的串扰抑制能力其次，虽然交流信号本身能够通过寄生电容对相邻通道产生影响，但由于直流通道本身对交流信号具有抑制能力，所以该情况下的通道串扰增大得并不明显。

最后，交流通道对交流信号的串扰抑制能力最差，这是因为采样通道本身采集的就是交流信号，所以会接收大部分的干扰信号，从而严重降低串扰抑制能力，此时的串扰噪声较大。而在干扰源同为交流电压信号的情况下，随着频率的增加，通道串扰抑制比降低，这说明高频信号更容易对相邻通道产生串扰。所以在高频场合使用的数据采集系统应该视情况对通道间串扰进行评价和检测。

5结语

特色数据库系统建设评价指标分析篇5

关键词：特色数据库；系统建设；评价指标

中图分类号：TP312

随着互联网的普及，网络为广大用户提供了一个广阔自由且方便的信息平台，由此，数字图书馆也发展起来，由于图书馆丰富资源的特色化和数字化，提高了网络数据库的开放度和共享性，信息容量大且具很强的学术性，参考价值也比较高。特色数据库作为一种信息汇总，能够充分反映自身的资源特色，具有鲜明的地方文化特色、区域经济特色、专业学科特色和馆藏特色等[1-2]。为有效利用自身特色资源，达到资源共享，为读者更好的提供深层次服务，建设特色数据库系统，加强质量控制并结合相关评价指标进行科学评价，以提高其整体效益，是目前高校图书馆特色数据库系统建设面临的重要问题。

1 特色数据库的建设

1.1 特色数据库的现状简析。特色数据库提供的文献信息的针对性和专业性比较强，其时间跨度和收藏范围比较大，具有一定的权威性。若对数据库进行有效开发，可形成某一学科门类、专业或专题的资料库。特色数据库除了具有特色性，还具有规范性、服务性、实用性以及共享性等特点。目前，我国高校在特色数据库的建设方面已取得初步成绩，例如由全国工程中心清华大学图书馆负责承建的“高校学位论文数据库”，“教学参考书数据库”，“联合目录数据库”，“重点学科网络资源导航库”以及“专题特色数据库”等等，均是由各大高校图书馆组成的项目管理组，自建或组建相关资源而进行开发和利用的[3]。

1.2 特色数据库建设的作用。在现代信息服务中，特色数据库的建设作为一种文献资源，其特色模块的建设使其在学习型社会的教学和科研中发挥着重要作用[3-4]。其一，特色数据库能够帮助政府决策。根据政府决策自建特色数据库，为政府机关制定计划方针提供咨询和依据，提高政府的办事能力和决策水平。其二，特色数据库能够促进学科建设。学科建设作为学校综合实力的象征，其涉及范围比较广。特色数据库的建立能带动学科的建设与发展，可以为高校的整体水平和综合实力提供文献保障，并促进其发展。其三，特色数据库能够指导科学研究。高校图书馆通过数字资源优势的运用，积极开发宝贵的信息资源建立特色数据库，在各领域都有很大应用前景和学术价值，为科学研究提供强大的信息支持。

2 数据库的评价

2.1 数据库的评价意义。数据库的建设丰富了信息资源，为广大用户提供了深层次的服务。通过数据库的评价优化资源，使图书馆数据库的建设更加合理化、科学化，提高效益并促进其发展。概括地讲，数据库的评价能够帮助了解用户需求，提高数据库资源的利用率，促进高校数字化资源的优化，实现传统资源与现代数字化资源的优化配置，以发挥最大的效益[5]。

2.2 数据库的评价原则。经相关文献的总结，数据库的评价原则主要包括以下几点[5]：（1）强调数据库的布局统一，注重信息资源评估的整体性；（2）针对数字图书馆对广大用户的服务性工作，加大其信息资源的共享性；（3）要求其采用的数据库评价指标和方法的科学性，并保持其成熟先进性；（4）评价指标体系要能够反映数据库的检索特点，注重其全面性及灵活性；（5）评价指标的含义及统计要定义规范明确，保证数据的准确性。

3 评价指标体系

为提高特色数据库建设的质量，建立规范性的数据检查及评估流程，其具体步骤包括：评估指标的建立，评估方案的确定，评估工作组的设立，待评数据的选取，数据评估的实施，评估结果的整理及发布等[5]，现对数据库各评价指标分析如下。

3.1 数据库内容

3.1.1 数据资源内容。数据库都具备一定数据量，而特色数据库的特色资源，对数据量也有一定要求。特色资源的数据量是评估特色数据库的一个重要指标。目前，我国高校图书馆的特色数据库，主要有与学校自身特色相关的数据库，以个体或团体为主的特色数据库，以学校教育、科研成果为特色的数据库，与区域地理位置相关的数据库，与区域特色和人文环境相关的数据库，与学校重点学科有关的数据库，与学校教学相关的成果数据库，与图书馆深化服务相关的数据库。因此，应把数据库的内容是否具有特色性，是否真正体现某一方面的特色作为评估的一个指标。

3.1.2 数据资源组织。数据库资源的组织，首先是数据的规范化和资源导航。特色数据库的建设要遵循标准规范化，保证其综合质量，达到数据库的可靠性、完整性、系统性等基础上，实现资源共享。为提高数据库质量，保证数据收录质量，就应做好信息资源导航，其包括学科导航、类型导航及功能导航，在资源评估时关注标引质量和标引深度两方面内容。

其次，资源整合及用户界面的设计。资源整合主要是统一检索、全文链接、资源与服务的整合。为了衡量数据库检索性能的完备性，检索手段的快捷性以及检索入口的实用性，需要建设一套适用广泛的评估指数，来判断特色数据库在检索方式上的优劣。在检索范围包括信息的链接以及信息之间的切换和跳转。对于数据库系统用户界面设计的评价，主要有检索界面的适应性、版本的差异性、界面的定制及综合执行的统一等。

3.2 检索系统及功能。数据库检索系统及功能[6-8]主要是与其相关的检索平台的基本信息及其使用情况，检索系统能衡量一个数据库的优劣，但难以用量化指标分析。具体分为检索系统的功能、检索技术、检索结果、用户服务及检索效率等。主要考察是否提供检索页面及多途径检索，以方便用户查找信息资源；在检索技术上是否提供全文检索、支持布尔逻辑运算；在检索方式上是否支持简单检索和高级检索；在结果处理上是否支持二次检索，定制查询结果、记录数量的显示及排序方式的改变等。

3.3 数据库的使用。数据库的充分、有效使用是购买数据库资源的根本原因，其使用情况可通过量化和客观指标的比较来反映，而且该指标可使用一定时期的数据来评价，并且可进行动态评价。使用情况的相关指标具体包括：登录次数、检索次数、全文（文摘）下载数量、非正常使用次数（故障次数）、正常使用次数及读者满意度等。

3.4 数据库的经济性。成本核算将数据库的经济性作为一个评价指标，主要由我国高校图书馆的经费限制所导致。在当今时代的数字化、网络化环境中，数据库的建设费用和维护费用普遍较高，需要大量的资金、设备和人力投入，因此，有必要对其投入成本和效益问题进行评价，以促进图书馆特色数据库建设的良好发展。具体指标有：检索成本，登录成本，单篇使用成本，硬件设备、软件成本的投入，系统的维护费用，读者人均服务成本等。

3.5 其他。除上述情况几个指标之外，用于评估特色数据库建设的其它评价指标，还包括网站宣传以及网站推广等。网站宣传及推广，主要指数据库服务网站站点中链接的设置、新闻栏中关于特色数据库的相关信息情况通报等，以及该数据库服务网站的连接点和搜索引擎的广泛使用，以便于广大用户的了解和使用[3]。

4 结束语

建立特色数据库评价体系并不代表评价工作的成功，关键是对各指标的实际操作，需要了解并获得评价、选择数据库资源的依据。目前，在图书馆界特色数据库的建设正在蓬勃发展，良好的评价指标有利于指导特色数据库系统的建设。以上通过对数据库评价指标的相关探讨分析，还不够完善，某些评分指标还可进一步细化。总之，随着高校图书馆建设中特色数据库的增多，相关评价体系方面的工作将逐步扩大和完善，其评价指标也将日趋完善。

参考文献：

[1]潘长海，刘彩虹.公共图书馆特色数据库建设现状分析与思考[J].现代情报，2009（12）：105-108.

[2]覃凤兰.公共图书馆特色数据库建设调查分析及对策研究[J].图书情报工作，2009（15）：83-87.

[3]邓燕萍，王玉平.高校图书馆特色数据库建设评估指标体系的探讨[J].现代情报，2007（07）：118-119.

[4]汪徽志，岳泉.网络数据库评价指标体系构建[J].情报科学，2008（04）：557-560.

[5]孙芳，赵良英.高校图书馆数据库评价指标研究[J].图书馆工作与研究，2008（07）：45-46.

学生学习测验数据的分析评价篇6

数学老师往往喜欢把学生单元学习效果的测验数据登录下来，如下是A生以时间先后为顺序的20个测验数据：85, 99, 98, 92, 90, 85, 98, 83, 86, 89, 94, 98, 92, 100, 98, 90, 100, 95, 97, 88。你的第一感觉A生的成绩不错，95分以上的有9次，85分以下的只有1次，20次成绩的算术平均分92.8，排列一下，可以得出中位数是93。但要根据这些数据来评价A生的学习等级、学习趋势、学习品质等，就会觉得犯难。因为这些原始分数是用不同的试卷，内容、难度、效度都不同，犹如不同标准的秤所秤出的重量一样，价值不一样，不能根据原始分数的高低评价等级、发展趋势等。

2002年，我们开始利用标准分 (1) 来处理各次测验数据，积累了23395个数据，分段统计如下表1:

学生分数只要集中在60～45三个分数段中，占了近75%，根据习惯我们把标准分在55分以上的为优秀，55～50的为良好，40～50的合格，40以下的差分。由于标准分是以标准差来度量每个考分与平均分之间的离差，其单位是绝对等价的，为此对于某生的20个数据我们可以进行以下评价：

1. 综合性等级评价。

如图1是A生一年来20次数学成绩以时间顺序排列的原始分和标准分的对比曲线图。

我们从图1可以看出，原始分数的最高分与最低分出现在14、17次和第8次，标准分的最高分和最低分出现在第2次和第20次，也就是说最后一次期末考试却是最差的，只有49.4，低于班级平均成绩。我们再从标准分的曲线图统计发现，A学生的数学成绩的标准分平均值是55.7分，应该说是一个优秀的成绩，但是成绩不稳定的，经历一二次高峰以后必然会有一次低谷，而且低谷后马上上升为高分，可见A生智商可以，情商欠缺，骄傲情绪强烈。所以对于这样的学生我们也不能以最后一次成绩差而定性为一般，综合等级应该为优秀，但是评语中必须指出他骄傲自满的缺点，以促进其情商的提高。

2. 发展性比较评价。

评价必须置于一定的环境，既有个人的纵向比较，又有同学间的横向比较，这样才会让学生明确自我、反思自我、自加动力自奋蹄，也让学生对动态的发展评价心悦诚服。如图2选取的是ABC三位学生的20次考试的标准分分析。

从图2可以看出，三位学生在期末阶段，成绩都比较稳定，且在优秀的范围内。A生如前图1所述，成绩如波浪形起伏，最后一次刚好在峰谷。B生经历了第6、10两次大低谷后，渐渐稳定，进入了优秀生的行列。C生一直比较稳定优秀，没有大的波折。我们认为这种以考试时间为分类轴的统计能清楚地发现学习的进展状况，一些小小的知识缺陷、情绪波动都能反映出来，折线统计图犹如学生的学习轨迹图。通过学生间的比较分析，清醒自我，明确学习方向，扬长避短追求更大的提高。

3.追踪性分析评价。

以上分析的是A生由同一个教师任教一年内学习情况，可能会把成绩的波动归因为教师的教学责任，而不相信是自己的学习品质所致。因此我们可以进行追踪性分析评价。因为一个学生在一至六年级的数学学习中，往往有多名教师任课。一个学习习惯良好的人，一般不会随着教师变动而发生较大的波动，也不会在同一教师任期内发生大的波动。如果这些教师历年来的教学实绩稳定，那么学生成绩的变动应该归结到学生学习情绪和习惯上的原因。如图3是A生在同一个班级，因任课教师不同而产生的12次期末成绩的波动图。

从图3可以看出，A生的优秀成绩达到5次，每次成绩高于班级的平均成绩，应该说该生的成绩处在优良的档次上。一二年级由范老师任教，成绩中等，第四学期为低谷。三四五年级由沈老师任教，成绩提高快，竟有4次创造高分，但是6次期末考试波动也是大的，第六次成绩刚好处在优秀分数线上，呈下降趋势。到了六年级由王老师任教，成绩继续下滑，最后一学期又勉强进入优秀档次里。从A生成绩波动图上分析，不同教师任教还是同一教师的任教期内，成绩都是波动的，上上下下变化没有规律，我们认为该生的学习目的、态度、方法上是不稳定的、不成熟的。但是学生还是有潜力的，智商较高，在教师给予批评教育提醒后，成绩还是有转折性的提高。

利用标准分对学生学习效果的测试数据进行分析评价，客观公正、简明扼要、说服力强，而且随着这些数据日积月累更显优越性。北京的《中小学管理》2007年12期、河北的《教育实践与研究》2007年12期分别介绍了教师学科教学效果的管理和学科教学质量的动态评价方法，而本文介绍的是把学生学习效果的测试分数，转化成标准分来评价学生学习效果的思路。在五年多的实践来看，运用标准分管理仍应注意以下几点：

1.电子数据的评价分析应该因人而宜，不宜公开，以免伤学生自尊。不要认为标准分是铁证，就可下结论，把学生定性为差生或优等生。我们认为标准分也是一把双刃剑，用好了可以为教学服务，帮助学生改正缺点;用错了，会给学生产生心理暗示，产生自暴自弃的情绪，影响学生的再学习。

2. 标准分也好，图表也好，都是反映学生的一种学习结果，一种学习的发展趋势，属于“等级+评语”的评价模式，对于一些在平时学习过程中发出的创造性的智慧火化，还需要我们老师化功夫做好成长纪录，以便更加全面的记录学生的学习情况。

3. 测验分数管理的普及性和连续性。小学数学成绩可以用标准分来管理评价，其实语文等其他考试学科也一样可以管理;小学六年管起来了，同样一个学区(乡镇或县区)的初中、高中也可以应用，只要一个学区的生源没有大的变化，标准分还是“标准”的，不过标准分计算公式里的平均分、标准差要换算成学区的平均分和标准差。随着计算机的普及和Excel电子表格的熟练操作，标准分的管理变得轻而易举。

注释

数据资产价值评价方法研究篇7

近年来, 随着大数据写入政府工作报告, 大数据相关企业在全国遍地开花, 其中以大数据运营为主要经营方向的企业层出不穷。大数据企业最核心的资产是数据资产, 然而关于数据资产价值的评估, 行业内并没有统一的标准。面对以大数据为代表的新一代信息技术服务型企业的跨越式发展, 企业急需通过债务融资、股权融资等方式扩大规模。对于大数据运营企业, 数据资产无疑是企业最为重要的一种无形资产, 但由于缺乏科学的估值体系, 企业融资方面存在较多的困难。究其根本, 是关乎数据资产定价的问题。对于私募股权投资基金来说, 正确合理的评估数据资产的价值, 是对企业进行价值评估的前提条件。

二、数据资产定价中影响因素分析

数据成为一类资产是信息资源资本化的体现, 他让数据资源不仅仅具有经济价值和应用服务本身, 而且具有了内在的金融价值。“大数据之父”维克托·迈尔·舍恩伯格认为, 数据资产列入资产负债表, 只是时间问题。但同时我们也要认识到, 不是所有数据的都具备资产的属性, 数据本身不等于资产。根据财务关于资产的定义, 只有数据被企业拥有和控制的、并且能够用货币计量, 能够为企业带来经济利益, 才能成为企业的一种无形资产。在大数据时代, 数据运营企业关于数据价值的实现是体现在数据分析、数据交易层面。

数据资产作为一种无形资产, 其公允价值的计量应当考虑市场参与者通过最佳使用资产或将其出售给最佳使用该项资产的其他市场参与者而创造经济利益的能力。最佳使用数据资产应当考虑在实物上可能、法律上允许、财务上可行的情况下使用资产, 具体如下:

(一) 市场参与者在给资产定价时考虑的资产实物特征

如数据类型, 数据实时性、可靠性、数据数量、数据质量、数据格式、数据可获得性、数据跨度等内容。

(二) 市场参与者在给资产定价时考虑的资产法律限制

如水文、地理、气象等测绘数据、航天信息类数据、个人隐私数据、企业战略及商业数据等虽具有很高的应用价值, 但存在损害国家安全, 个人隐私, 企业利益等问题, 违反了国家法律, 其数据在应用中存在法律障碍。

(三) 市场参与者在给资产定价时考虑的资产财务特征

即是在实物上可能且法律允许的情况下使用资产能否产生足够的收益或现金流量 (考虑将资产转换到该用途的成本) , 以满足市场参与者投资于这样使用的该项资产所要求的投资回报。

三、数据资产定价方法

国内外相关文献中关于无形资产定价的方法可分为三种基本类型, 分别为收益现值法、市场价值法和重置成本法。本文在考虑了数据资产特殊性的基础之上, 提出了应用博弈论、人工智能等方法对数据资产进行评估的观点。

(一) 收益现值法

收益现值法 (Present Earning V alue M ethod) 又称收益还原法, 是将数据在剩余使用期限内的预期收益, 按照一定的折现率折现, 把评估基准日现值的总价值作为数据资产价值的一种计算方法。收益现值法的基本计算公式如下:

式中:PV表示数据资产的评估价值 (现值) ;表示第k年的数据资产预期收益流入;n表示数据资产有效使用年限;i表示收益折现率。数据资产作为经营性资产直接产生收益, 其价值实现的方式有数据分析、数据挖掘、应用开发等。这种价值实现 (预期收益) 会伴随着企业的经营持续不断的创造收益。收益现值法评估无形资产优势明显。目前国内外关于专利权、商标权、著作权、特许权等无形资产的评估中主要都采用了收益现值法。收益现值法较真实、准确地反映了数据资产本金化的价格, 因此在投资决策时, 更容易被评估双方所接受。

(二) 市场价值法

市场价值法是在市场条件下, 通过比较被评估数据资产与售出同类资产的异同, 进而分析资产的价值影响因素, 如期限、数量等, 从而确定被评估资产价值的一种方法。市场价值法的特点决定了其对需求量大、类型多、交易频繁的数据资产具有较高的应用价值。但由于数据资产差异性、个性化程度高, 且其作为一种新兴的交易类资产在国内外交易时间较短, 交易的数量较少, 可参考的有价值的历史交易资料非常有限。因此, 在运用市价价值法对数据价值进行评估时, 由于历史资料的缺乏, 价值评估的基础很难建立, 这样难免会造成评估结果失真。但是在交易市场条件成熟的情况下, 市场法也是一种较为可行的数据资产价值评估方法。

(三) 重置成本法

重置成本法是在现时条件下, 重新生产或取得与被评估数据资产具有相同用途和功效的资产时需要的成本作为计价标准。由于数据资产取得的不可逆性, 如视频数据、气象数据等便不能通过模拟的方法数据产生前的原始状态, 同时由于数据资产生产的不可复制性、数据资产应用的时效性, 数据资产折旧不能准确计量等特点, 应用重置成本法评估数据价值存在一定的困难, 其价值评估结果也不容易得到交易双方的认可。因此, 一般情况下, 重置成本法不适合作为数据价值评估的方法。

(四) 博弈方法

收益现值法是从数据资产交易的买方定价、重置成本法是从数据资产交易的卖方定价, 市场价值法则通过市场的角度考虑问题, 三种方法作为传统的数据资产评估方法其各有优势, 也有缺点。作者认为, 在一定条件下, 数据资产定价可通过数据资产的买卖双方各自所掌握的信息, 以讨价还价的方式实现自身利益最大化和风险成本最小化, 即博弈方法。在数据资产交易活动中, 由于买卖双方信息不对称, 交易过程根据自身掌握的信息进行往复的决策, 因此该博弈过程可以看作是不完全信息条件下的动态博弈。

(五) 人工智能方法

利用人工神经网络 (图3-1) 等人工智能方法, 根据数据资产的影响因素构建人工神经网络系统。人工神经网络的计算模型灵感来自动物的中枢神经系统, 被用于估计或可以依赖于大量的输入和输出的未知函数。在数据资产定价人工神经网络模型中, 输入可包含数据日期、有效期限、数据类型、数据复杂度、数据应用范围等数据价值指标, 输出层可包含数据内在价值、数据市场价值等价值指标。人工神经网络具有较高的自组织、自适应和自学习能力, 可以对数据本身的应用价值做出客观的评价和预测, 它不但克服了由人工评价所带来的人为因素及模糊随机性的影响, 能保证评价结果的客观性、准确性, 而且具有较强的动态性, 可为数据价格的确定提供重要的依据。

四、结语

本文提出从最佳使用数据资产应当考虑在实物上可能、法律上允许以及财务上可行的情况下使用资产, 进而提出了数据资产的一般定价方法。通过分析得出收益现值法和市场价值法作为一般的资产定价方法, 对数据资产也有一定应用价值, 但重置成本法不适合作为评估数据价值的方法。同时, 本文在数据资产价值评估中引入了博弈方法和人工智能方法。

参考文献

[1]张志刚, 杨栋枢, 吴红侠.数据资产价值评估模型研究与应用[J].现代电子技术.2015, 38 (20) :44-47.

[2]潘渭河.试论无形资产价值评估的特殊性[J].新课程:教育学术, 2010 (7) :31?32.

[3]陈昌云.无形资产价值评估方法研究[D].淮南:安徽理工大学, 2009.

统计数据质量的模糊综合评价篇8

随着科学技术的进步,统计在各领域中的地位越来越重要,统计数据质量的高低对于决策和我们的社会实践活动有着直接的影响。高质量的统计数据可以帮助我们做出更加科学的决策,有利于生产的发展和社会的进步,否则的话结果也是可想而知的。近来统计数据质量的评价已经成为人们关注的热点问题,也有了一些研究成果[1,2,3]。

客观世界中的许多问题都表现出一种界线不清晰的不确定性,这主要是人类的思维具有概括性、语言表达具有模糊性、逻辑具有一定的定性特点的缘故,人们在评价这类事物时,往往难以准确的描述它们,因而也就很难确定其特征。这种界线不清晰的不确定性就是所谓的模糊性,模糊不确定性现象不满足排中律,表现为模糊的亦此亦彼性,它们不能使用传统集合论和二值逻辑来描述,必须运用模糊集合理论加以研究才能奏效。另外,模糊技术模仿了人的思维和处理问题的方式,可以以较低的代价获得令人满意的结果,因而得到了越来越广泛的应用。不管是客观信息还是人为因素造成的模糊性,当它在评价问题中占有重要地位时,便构成了模糊综合评价问题。在统计数据质量的评价问题中,因为许多评价指标具有模糊性的特点,因此,运用模糊综合评价方法进行评价效果更为理想。目前。运用模糊综合评价方法评价统计数据质量的文献并不多见。

1 统计数据质量模糊综合评价模型

模糊综合评价可以用来对模糊信息进行全面和定量的评价,能够有效地提高判断的准确性和决策的科学性。要正确评价一个具体对象,首先要对其若干因素给出评语,然后再进行综合。为了表达上的简洁,我们仅介绍单因素模糊综合评价模型。模糊综合评价一般可归纳为以下几个步骤:

1.1 确定评价对象的因素集

因素就是评价对象的属性或指标,有些场合也成为参数指标或质量指标,它们综合反映出评价对象的质量,人们根据对象的因素对其进行评价。因素集可表示为

对于统计数据质量模糊综合评价问题,我们取X={及时性,统计数据的客观性,统计方法的科学性}。

1.2 确立权重集

由于对X中各因素有不同的测度,需要对每一个因素按其重要程度给出不同的权重,它可表示为X上的一个模糊子集,A={a1,a2,…,an},

其中ai={1,2,…,n}是因素xi对A的隶属度,通常规定

权重的确定在模糊综合评价中是至关重要的,因为权重集确定的恰当与否会直接影响到综合评价的最终结果。权重集的确定方法有很多种,诸如客观赋权法、主观赋权法、组合赋权法和交互式赋权法。下面介绍几种具体的常用方法。

(1)专家调查法

首先,请有关专家或具有丰富经验的相关人员若干个,请他们对因素集中各元素独立地给出自己认为最合适的权重向量

然后,对每个因素进行单因素统计,具体步骤是:

(1)对于因素xi(i=1,2,…,n),在其权重中找出最大值Mi和最小值mi,即

(2)选取适当的正整数k,有下述公式

计算出把权重分成k组的组距,并将权重由小到大分成k组。

(3)计算落在每组中权数的频数和频率。

(4)根据频数和频率的分布情况,确定第i个因素的权数ai,从而得到权重集。

(2)继承方法

对某种评价对象的个因素的权重,根据历史数据有某种方案,设为A1,对于目前的情况时间和空间上的改变可能会有新的权重分配方案A2,而A1是大量经验的积累,A2具有较现实的合理性,因此可以采用加权方式给出新的权重分配方案

其中,α可根据情况选取一个适当的数值。

(3)二元对比倒数法

对因素集中的各元素两两比较,根据它们对实现目标的贡献的大小从1到7赋值,如aij=7意味着因素xi比xj极端重要。令aji=1/aij,这样可得到对比矩阵A=(aij),对比矩阵的主对角元都是1。再用优势积累法,即求同一行元素之和,得到权向量,

再归一化即可得到所需要的权重集。

1.3 建立评价集

评价集是由对评价对象可能作出的评价结果所组成的集合,可表示为

对于统计数据质量模糊综合评价问题,我们取Y={质量高,良好,一般,差}。

模糊综合评价的目的就是通过对评价对象综合考虑所有影响因素,从评价集中获得一个最佳的评价结果。首先从单因素出发进行评价,确定评价对象对评价集中各元素的隶属度。

建立一个从X到Y的模糊映射,

由此可得到单因素评价矩阵

1.4 综合评价

因素集和权重集确定以后,按照模糊矩阵的乘法运算,可得到模糊综合评价集B,即B=A莓R.记B=(b1,b2,…,bm),它是Y上的一个模糊子集,其中

最后利用最大隶属度原则或加权平均等原则就可得到综合评价的结果。以上我们介绍的处理问题的一般原则,具体问题可结合具体情况与模糊数学理论采用不同的具体方法来处理,不可能说一种方法适用于所有的情况。譬如合成算子模型我们采用了取大取小模型,这种模型运算简单,但因丢失了不少信息,致使评价结果比较粗糙,该模型不适于因素太多或太少的情形。比较常用的合成算子如:M(•,∨),也就是,也就是,等等,这些合成算子各自都有各自的优势和劣势。具体应用那个模型可根据具体情况来定,也可以应用多个模型,作出多个结果在进行加权平均得到期望的结果。总之,具体应用时要根据具体情况选用适当的模糊技术,这样才能取得另人满意的效果。

2 算例分析

对于某统计数据质量的评价,我们给出权重集A=(0.2,0.5,0.3),评价矩阵采用专家评分方式给出:

那么

求出评价指标bj(j=1,2,…,m)后,一般根据最大隶属度原则,把与最大的评价指标相对应的评价集元素作为评价结果。当然,也可以根据具体情况应用加权平均法或模糊分布法来进行评价。我们本例的评价结果为该统计数据质量良好。

3 结论

本文利用模糊综合评价方法,给出了统计数据质量的评价体系和评价原则,各种评价指标可以根据具体情况的不同采用不同的模糊技术处理。较之确定性方法,运用模糊综合评价方法评价统计数据的质量,准确度更高,并且具有更为理想的可靠性。

参考文献

[1]谭洪章.统计数据质量问题研究[J].重庆工业管理学院学报,1998(3):49-52.

[2]陈健,王军.对提高统计数据质量的几点思考[J].淮阴工学院学报,2001(5):63-64.

[3]刘延年.如何评价统计数据的质量与可靠性[J].统计研究,2002(8):61-63.

[4]朱训生.工程管理的模糊分析[M].上海交通大学出版社,2004.

[5]王新利.模糊综合评价法在项目投资决策中的运用[J].财会月刊,2009(6):57-58.

数据中心设备状态评价模型研究篇9

关键词：设备状态评价,模糊理论,CRITIC算法,AHP算法,主客观组合赋权法

1引言

随着信息化的深入发展, 以及大数据和云计算技术的成熟与应用, 国家和企业纷纷加大了数据中心的建设。截至2012年3月我国各类数据中心约有43万个, 所有机房可容纳的服务器可达500万台。由于服务器设备数量巨大, 设备管理与维护越来越重要, 设备运维水平直接关系到数据中心能否安全稳定运营, 而做好设备运维的前提是及时、全面获知设备的运行状态。因此, 本文以数据中心服务器设备为研究对象, 对设备状态评价模型进行了系统研究, 结合了多套算法从不同的层面对数据中心设备进行评价, 旨在全面、系统地获知设备状态, 提升数据中心设备运维管理水平, 为数据中心的高效运营提供支撑。

2模型概述

2.1评价对象

服务器是数据中心最为核心的设备, 就服务器种类来说, 目前X86以其成本低廉、性能强大等优势逐渐成为数据中心的主流服务器, 在服务器组成结构上, 典型的X86架构服务器一般都包含CPU、内存、主板、网卡、磁盘、电源、风扇这几大核心部件。本文以基于X86体系架构的服务器作为基本评价对象。

2.2评价思路

数据中心由数以万计的服务器组成, 服务器又由若干部件组成, 每类部件具有若干指标属性, 基于数据中心的物理及逻辑构成特点, 将数据中心分为硬件层、设备层、部件层、指标层四个层面, 对数据中心设备状态进行系统评价。具体来说, 首先通过部件运行指标值对设备部件状态进行评价, 然后通过部件状态对设备状态进行评价, 最后统计分析众多设备的状态得出整个硬件层的状态, 完成对数据中心整体设备状态的评价, 整个评价思路是一个自下而上的过程。

2.3评价框架

首先需要考虑以下几个关键问题:

2.3.1状态界定

本文中设备状态是指设备当前的运行状态, 为了统一对设备状态的认识, 将设备状态分为以下四个等级:

(1) 正常状态:所有运行指标处于理想运行范围内, 设备处于健康状态;

(2) 注意状态:部分指标运行超出理想运行范围, 设备服务能力下降;

(3) 异常状态:运行指标变化量较大, 设备部分部件发生故障, 但设备仍可对外提供服务;

(4) 严重状态:运行指标严重超出理想运行范围, 设备几乎或已经不能对外提供服务。

2.3.2指标体系

构建一套科学的指标体系是设备状态评估的基础, 所选择的指标需要客观反映评价对象的运行特征, 具有客观性、完备性, 并且要可测量、可采集, 具有实际操作意义。本文选取的指标主要有CPU、内存使用率、温度、电压以及部件负载信息等。

通过模型算法对部件运行指标的“好”与“坏”进行判定, 需要制定一套指标标准值。设备部件运行指标值与设备配置、数据中心运营要求等多种因素有关, 目前业界没有统一标准, 主要依据专家经验并结合厂商给出的设备参数制定出合理的指标标准值。

2.3.3权重因素

主要包含两个层面的权重, 一是指标权重, 二是部件权重。通常设备部件的状态可通过多个指标来衡量, 如CPU使用率、CPU温度, 而这些指标对于部件状态的影响程度并不相同;类似, 不同部件的运行状态对设备状态的影响也不尽相同, 如风扇对设备的重要性相比CPU就低很多。因此, 在设备状态评价模型中需要引入这两类权重并进行量化。

目前权重的确定方法可分为两类, 一类是主观赋权法, 另一类是客观赋权法。主观赋权法是由决策分析者根据对指标的重视程度而赋权的一类方法, 由于引进了人为干预, 这类方法难以摆脱人为因素的影响;客观赋权法一般是根据所选择指标的实际信息形成决策矩阵, 在此矩阵基础上通过运算形成权重, 该类方法忽略了对指标重要性的先验认识。由于部分指标值在设备实际运行中存在一定的主观可调整性, 如CPU、内存使用率, 仅使用客观赋权法会存在一定的局限性。因此, 本模型拟组合客观赋权法 (CRITIC算法) 和主观赋权法 (AHP算法) 构建指标权重函数计算指标权重。

2.3.4评价理论

设备状态是一个模糊的概念, 具有很强的主观性, 难以对其进行精确区分与衡量, 在设备管理与维护过程中, 也无需对设备状态进行精确度量, 采用模糊理论可很好地满足设备状态评价需求。

基于以上分析, 给出设备状态评价模型框架图, 如图1所示。

3模型实现

3.1模型权重计算

3.1.1基于CRITIC算法的指标权重计算

(1) 样本数据选择。记部件类别数为m, 样本数据为当前时刻全部设备某类部件的指标值, 样本容量为n, 即样本包含n个该类部件的指标值, 每个部件上的指标数量为pi (i=1, 2, .., m) 。将原始指标值与指标标准值进行对比计算偏差率, 得到模型的最终输入值如下:

(2) 数据的标准化处理。不同指标的数量级和量纲可能会有所不同, 需要进行标准化处理以消除数量级和量纲的影响。对于正向指标, 即越大越好的指标, 作如下转换:

对于负向指标, 即越小越好的指标, 作如下转换:

为了便于理解起见, 仍记标准化处理后的指标值为xij。

采用CRITIC方法建模得到某类部件的指标权重向量记为Wc。

3.1.2基于AHP算法的指标权重计算

(1) 判断矩阵构造。AHP算法的关键在于利用1~9间的整数及其倒数作为标度来构造两两比较判断矩阵。在同一层评价因素中, 将部件的指标进行两两对比, 计共有m类部件, 第i类部件的指标数为pi, 根据相对重要性的判断引入合适的标度数值, 从而形成判断矩阵, 记为Ei:

其中CR为判断矩阵的随机一致性比率, CI为判断矩阵的一般一致性指标, RI为判断矩阵的一般一致性指标。当CR<0.1时, 即认为判断矩阵具有满意的一致性, 说明权数分配是合理的, 否则需要调整判断矩阵, 直到取得具有满意的一致性为止。

最后对权重向量进行归一化处理:

3.1.3主客观组合赋权法计算最终权重

亦可根据AHP算法思想得到部件的权重:

3.2部件层状态评价

对于部件评价结果向量的分析, 可采用最大隶属度原则。部件在哪个等级的得分最多, 则认为部件状态属于哪个等级。

3.3设备层状态评价

高层次的评估矩阵可由较低层次的综合输出构成, 即设备的评估矩阵R可由部件的综合输出构成。

设备综合评估结果为

对于设备评价结果向量的分析, 本文选择最大隶属度原则评价设备所属的状态等级。

3.4硬件层状态评价

在设备状态评价结果的基础上进行整个硬件层状态评价。使用探索性数据分析的方法, 可形象直观地评价硬件层运行现状。

探索性数据分析是对调查、观察和计算所得到的数据, 在尽量少的假定下进行处理, 通过作图、制表等形式和方程拟合、计算某些特征量等手段, 探索数据的结构和规律的一种数据分析方法。示例说明如表1所示。

4模型评估

从模型准确率和模型稳定性两个角度对模型进行评估, 模型准确率评估采用准确率的平均值来衡量, 稳定性评估采用准确率的均方误差来衡量。在已发生的时间轴上采集指标值和设备状态作为测试样本, 运用已建立的模型评价测试样本的状态, 并与真实的样本状态进行对比, 结果越符合真实状态则说明模型准确率越高。

假定采取了N个时刻的数据, Ni表示第i个时刻评价的设备数量, 准确率为Ri:

其中xj表示对设备j的状态评价正确与否:

则N个时刻平均准确率为:

准确率均方误差为:

MSE越接近于0, 则说明模型越稳定。

5模型优化

数据中心设备数量巨大, 保留的历史运行数据达到海量级别, 属于大数据的范畴。利用大数据技术与理念, 对这些数据进行挖掘分析, 可很好地对设备状态评价模型进行优化。本文模型中所使用到的指标标准值, 部分是依据专家经验得出的, 考虑到设备的利用效益、成本节约等因素, 诸如CPU、内存使用率的标准值是可结合历史运行状况适当进行调整的, 通过对历史指标值的统计分析并结合设备实际状态, 可以为指标标准值的制定与优化提供有力支撑;另外计算判断矩阵过程中对两两部件之间的重要性判断也存在一定的主观性, 通过对历史运行数据及设备实际状态的分析, 可以挖掘出部件之间的关联性, 进而为调整和优化部件之间的重要性提供依据。

6结语

本文以数据中心服务器设备为研究对象, 系统地进行了设备状态评价模型的研究。在评价思路上, 本文将数据中心所有设备分为硬件层、设备层、部件层、指标层四个层面, 从下到上逐层对设备状态进行评价。在具体算法方面, 采用了模糊理论并结合CRITIC算法和AHP算法分别评价部件层、设备层和硬件层的状态。在权重方面, 本文创新性地构建了主客观组合赋权法对指标权重进行赋权, 有效消除了单独使用主观或客观赋权法所产生的不良影响。同时, 本文对模型评估也进行了详细论述。最后, 本文还通过对海量历史指标数据的分析, 对模型优化进行了探索。该理论模型的应用可有效提升数据中心的设备运维水平, 支撑数据中心高效运营。受限于实际指标数据的采集等因素, 本文在模型检验方面存在一定的不足之处。

参考文献

[1]陈正伟.综合评价技术及应用[M].成都:西南财经大学出版社, 2013.

[2]何晓群.多元统计分析[M].北京:中国人民大学出版社, 2012.

[3]和讯网.http://www.hexun.com.

[4]李爱国, 厍向阳.数据挖掘原理、算法及应用[M].西安:西安电子科技大学出版社, 2012.

[5]孙亚辉, 林韩, 陈金祥.变电设备状态综合评估方法的研究[J].中国化工贸易, 2013 (04) .

[6]维克托·迈尔-舍恩伯格, 肯尼思·库克耶.大数据时代[M].杭州:浙江人民出版社, 2013.

[7]张炳江.层次分析法及其应用案例[M].北京:电子工业出版社, 2014.

评价数据篇10

当今时代，随着互联网的快速发展及云计算、大数据、移动互联网、物联网等技术日渐成熟，政府机关、金融机构、互联网公司、公共服务行业等都积累了丰富的数据资源，这些数据资源在大数据环境下才能得到充分利用，才能挖掘出这些数据与信用的关联关系，促进对征信数据进行更加充分的利用。

基于大数据实现公共信用评价，具有更广泛的用户覆盖率，能使信用评价更加全面和客观，评价产品的应用也更加广泛。对个人而言，将不只单纯地用于金融经济活动中，而将成为“人品指标”普遍运用于升学、招聘、升职、社保等领域；对于企业而言，除了提供最基础的征信报告以供其向银行贷款，还将全方位对其在环保、质量、安全等方面的行为做出信用评级，使消费者能直观地了解一个企业最让人关心的问题；对于政府而言，不仅是对政府的行政透明化的监督，更是让政府通过新标准的数据监测和规律挖掘，对整个社会信用状况有了预警防范的能力，降低信用危机（比如金融危机）带来的危害。

国内外信用评价体系现状与存在问题

信用评价体系主要包含评价方法、评价指标、评价程序、信用等级等内容，广义上还包括信用评价应用。目前，发达资本主义国家都建立了比较完善的信用评价体系，我国在这方面也进行了积极探索。

国外信用评价体系情况

国际上早期评价方法包括财务分析法与要素分析法，现代主要采用模型分析法。无论是采用财务分析法、要素分析法，还是模型分析法，对被评价对象的信用数据收集都包括两方面：被评对象提供和信用评价机构独立收集。

国际上一些知名的信用评价机构采用的评价程序不完全相同，但评价的周期都较长，比如穆迪在收集了足够的评价信息后，组建评级委员会，从评价委员会的首次讨论开始到评价结果发布，大约需要60-90天时间。

国际上对企业信用等级一般采用等级符号来区分，三大信用评估机构所采用的符号不完全相同，但划分标准和等级数量相差不大，标准普尔和惠誉是20个等级，最高级都是AAA，最低级是D，穆迪是19个等级，最高级是Aaa，最低级是C。FICO模型对个人信用等级用信用分表示，取值范围为300-850分，680分以上通常会被认为是信用极好。

过去几年里，发达资本主义国家已经出现了一些新兴企业利用大数据来重新定义信用评估方式。比如美国的Neo Finance公司利用申请人的工作历史和其在LinkedIn（一家面向商业客户的社交网络）上的人际关系来决定是否向他提供贷款。另一家名为Zest Fiance的公司是前谷歌首席信息官创办的，它利用顾客各方面的信用数据来做评价，包含成千上万的参数，比如借款方搬家的次数、他们在网页上使用大写字母的能力等，这些参数可能与借款方的信用没有直接的因果关系，但是通过大数据手段可以发现一定的关联关系，因此也会对借款方的信用状况产生影响。

国内信用评价体系探索

我国的信用评价体系发展较晚，采用了第三方评级机构和公共征信体系并行发展的模式。从1987年我国第一家信用评级机构吉林省资信评估公司成立，到1997年中国人民银行认可了中诚信等9家评级公司具有企业债券评级的资格，此后我国的信用评价开始步入快速发展阶段。近些年来，在国内占据领先地位的评级机构主要有中诚信、联合资信、大公国际、新世纪、东方金诚国际和中债资信等。而2006年人民银行征信中心的成立，则标志着我国公共征信体系正式开始构建。

国内信用评级业在自主发展的同时，也与国际信用评价机构积极开展合作，比如惠誉持有联合资信49%的股权、穆迪与大公国际曾签署为期3年的技术合作协议等。国内信用评价机构充分借鉴了国外在评价方法、评价指标、评价程序、信用等级等方面的经验，同时也在评价指标、评价模型等方面进行了积极探索。

我国在2006年中国人民银行印发的《信用评级管理指导意见》，将企业评级要素分为企业素质、经营能力、获利能力、偿债能力、履约情况和发展前景六个方面；中国信用行业标准技术委员会2009年编制的《企业信用评价标准》将企业信用评价过程分为外部环境、经营状况、管理状况、财务指标、公共信用记录和招投标信用记录五大部分。个人信用评价方面，目前国内主要使用的评价模型有：上海资信评估模型、深圳鹏远公司建立的“鹏元”模型和蚂蚁金服的芝麻信用评分模型。其中芝麻信用评分模型与美国的FICO模型类似，通过身份特质、履约能力、信用历史、人脉关系、行为偏好五个维度对个体信用进行分析。芝麻信用在评分的基础上扩展了信用贷、信用住、信用租车、出国免签等多种应用。

我国有些地方政府也对信用评价体系进行了积极探索，比如荣成市制定了可量化的细化加减分项信用指标，针对自然人的信用评价指标分为商务领域、社会管理领域、司法领域、重点人群和加分信息5大类，针对法人的信用指标分为商务领域、社会管理领域、政务领域、司法领域和加分信息5大类。这些评价指标基本涵盖了信贷、合同信用、行政管理、社会保障、公共服务缴费、司法诉讼、法律执行、社会公益、表彰奖励等各个方面。

其他城市大多采取了与第三方征信服务机构合作的方式开展信用评价工作。比如杭州市与芝麻信用合作，市民可通过芝麻信用查寻自己的公共信用记录；宿迁市与大公国际合作，成立了大公宿迁信用信息服务有限公司；沈阳市与辽宁中小企业信用服务有限公司合作，由其出具信用报告并评定信用级别等。

当前信用评价体系存在的问题

随着互联网、大数据、电子商务等产业的快速发展，传统信用评价体系也逐渐暴露出一些问题。一是评价结果易受到外部因素的影响。主权评级容易受到政治因素的干预，比如2008年金融危机爆发以后，国际三大评级机构频繁下调欧洲国家的主权信用评级，导致欧债危机加剧，间接帮助美国度过危机。对社会主体的评价结果容易受到评价委员会人员构成的影响，评价委员会的业务能力、经验、主观好恶、品德都是重要的影响因素。二是评价指标不全面。传统信用评价指标比较注重金融消费领域的指标，许多信用评价机构并未将公共管理领域和互联网数据纳入信用评价体系，即便纳入也只是少量指标，比如德国将地铁逃票作为个人征信的指标。三是运用范围较窄。传统信用评价主要运用于金融领域，比如银行贷款、发行证券、商业合作等，也有些信用评价产品会被用在招聘求职等方面。近年来在我国兴起的芝麻信用也是主要运用于提供小额贷款、免押金等领域，芝麻信用的出国免签是一大亮点。但是由于信用数据来源和评价机制的局限性，传统信用评价产品还无法广泛运用到社会管理、公共服务等各个领域。

基于大数据的公共信用评价体系设想

基于大数据的公共信用评价体系，就是要建立“用数据说话、用数据评价”的信用评价体系，将尽可能多的与信用有关的数据纳入评价指标，尽量减少人为因素对评价结果的干预，将评价结果运用到社会管理、公共服务、经济活动、公益慈善等各个领域。结合传统评价体系发展方向和大数据行业发展现状，采用基于大数据的信用评价模型实现信用评价是一个可行的选择。

评价方法

大数据信用评价模型里既包含因果关系的参数，也包含关联关系的参数。因果关系的参数可采用矩阵模型等进行处理，但是不再对被评对象的任何行为作出假设，而是通过海量社会主体的历史数据（包括基本信用要素和违约等失信行为等）进行统计分析，对信用要素与违约等失信行为进行回归分析，确定回归函数，将这些函数关系作为预设条件输入大数据模型。关联关系的参数通过大数据手段进行挖掘分析，引入最优化算法等技术，找出这些参数与违约行为的关联关系。最后结合因果关系和关联关系的计算结果，得出最终信用评价结果。

评价指标

为实现多维度评价，基于大数据的公共信用评价指标需要随着社会管理制度的完善和大数据技术的发展而不断进行补充，就目前的发展阶段而言，应包含但不限于如下数据：

金融数据：包括企业的资产负债率、盈利能力、品牌价值、信贷历史、已发债券情况、资金周转时间等；

交易数据：已签合同金额、合同履行情况、交易额、顾客反馈情况、售后服务满意度等；

政府数据：行政许可、行政处罚、行政调解、表彰奖励、慈善捐赠、社保缴纳等；

司法数据：司法审判记录、司法执行信息等；

公共事业数据：公共事业缴费及违约信息、公共交通逃票、强占或浪费公共资源等；

互联网数据：社交网络产生的数据、打车软件产生的数据、电商交易和评价数据、微博和网络评论、网络日志、新闻报道等。

这些数据都应该是各行各业在履职过程中产生的原始数据，既包括经济活动领域的数据，也包括公共管理、社会活动等过程产生的数据，因此评价结果有更广泛的适用性，可运用于社会管理、公共服务等各领域。

评价程序和原则

基于大数据的公共信用评价是个不断采集数据、进行计算、修订评价结果的螺旋形发展过程，使得评价结果的时效性更强。通过对海量社会主体违约的分析，可以找出违约发展轨迹，从一些细微的事件中找出风险因素，增强评价结果的预测性。

基于大数据进行信用评价时，应遵循如下原则：

一是去除数据垃圾。大量的原始数据价值较低，甚至有很多垃圾数据，做好数据的清洗比对，去除垃圾数据和冗余数据，提高数据质量，使数据变现才能进行利用。

二是建立数据“沙箱”。建立基于大数据的信用评价模型和统一的信用数据处理平台，有数据采集方直接将采集的数据提交到平台，使用模型处理后输出结果，实现数据“可用不可见”，提高安全性。

三是处理好因果性和关联性的关系。有些数据与社会主体的信用有因果关系，比如信贷历史、财务状况等。有些数据与社会主体的信用有关联关系，应加以区分对待。另外，从有些数据的关联性上入手，可以避免一些“误伤”现象，比如前几年在青岛市福州北路上有个红绿灯，在夏天的时候经常会被树叶挡住，有些平时很遵守交通规则的人在此误闯红灯，可以通过大量的交通违章数据发现这个现象，筛选出误闯的人群，降低对他们信用评价的影响。

四是做好评价后的跟踪。利用大数据技术可以快速处理大量数据，实现对瞬息万变的市场局势快速分析和响应，及时完善评价模型和调整评价结果，提高信用评价的时效性。

信用等级

对企业和个人都采用信用分的方式表示等级，考虑到芝麻信用分已经具有一定的影响力，使社会主体对信用分和信用状况的对应关系有了一定的认识，为了使公众有一致的用户体验，基于大数据的公共信用评价分取值范围与芝麻信用分的取值范围保持一致，为350-950分。为实现与国际信用评价机构的横向对比，可建立信用评价分与国际信用评价机构等级的对应关系，比如900-950分对应AAA级，860-899分对应AA+级等。

目前，全国性的信用信息共享机制尚未形成，建立全国统一的公共信用评价体系还需要理顺相应的体制机制，因此有条件的城市可以先试先行。

一个城市要建立基于大数据的公共信用评价体系应做好以下几点：一是加强政务大数据中心建设，为信用评价提供数据支撑和技术服务能力。二是进一步强化政务信息资源管理工作，以“一切数据皆为信用数据”的思维广泛采集社会主体的信用信息，加强与国家、其他城市、第三方征信机构、互联网公司、运营商之间的信息共享。三是推进基于大数据的信用评价模型研究。四是推进基于大数据的公共信用评价结果在联合惩戒、公共服务等领域的应用，以应用促进建设和研究。五是建立隐私数据保护机制，从制度、管理、技术等层面加强对信用信息的保护，防止隐私数据泄露对信息主体的损害和对公共信用评价体系建设的阻碍。

评价数据篇11

一、南开治理指数(CCGINK)

对公司治理评价开始主要由学者个人或其他非商业机构(如政府监管派出部门)进行,后来逐步衍生出有专门的商业机构进行评价,并定期有针对性地公开评级数据和信息。世界银行治理评价系统实质上是对公司治理环境进行评价, 而其他非商业性机构的公司治理系统具有如下特征: 一是评价系统均是由一系列详细指标组成;二是大多数评价系统都使用了权重评级方法; 三是获取评价所需信息的方法是一致的,主要来自公开可获得信息和调查问卷。

非商业性公司治理评价系统的主要区别:关注的重点、采用的标准以及评价指标体系的构成呈现出较大差别。公司治理评价的研究与应用,对公司治理实践具有指导意义。正如上述对不同评价系统的对比所看到的,不同的评价系统有不同的适应条件,中国公司的治理环境、治理结构与国外有很大的差别因而直接将国外评价系统移植到国内必将产生“水土不服”现象。南开大学开发的CCGINK指数,结合了中国公司所处实际运营环境, 其关注的指标或是评价体系的合乎中国公司运营实际,是中国化了的公司治理评价体系。

由南开大学开发的中国公司治理指数(CCGINK, 简称南开治理指数) 采用百分制形式, 最高值为100,最低值为0(表1)。 CCGINK指数延伸出六个维度:控股股东治理指数、董事会治理指数、监事会治理指数、经理层治理指数、信息披露指数、利益相关者治理指数作为评价指标体系。本文也是基于此对当前上市公司进行分类比较研究,在此基础上总结当前我国上市公司治理特征和大致概况。

二、中国上市公司治理现状描述性统计分析

本文研究样本数据源于2012年上市公司披露之年报信息。样本筛选的原则有二: 指标信息齐全; 不含异常数, 最终确定的有效样本为1216家。

数据分析表明,2012年中国公司治理较之以前明显改善, 表现为上市公司治理水平整体呈上升态势,从2003年的48.96提高到2012年的60.60,但有效性依然偏低,例如中小股东权益保护指数2012年均值仅为50.93;独立董事制度指数2012年均值仅为59.97;经理层激励约束指数2012年均值仅为46.85。 2012年中国上市公司治理指数的均值为60.60,最大值为71.82,最小值为48.09。上市公司治理受控股股东性质、行业因素、地区因素的影响。从控股股东性质分析,继2011年之后, 2012年民营控股上市公司治理指数再次超过国有控股上市公司;行业分类表明,金融、保险业的公司治理指数仍然位居第一。从市场板块来看,2012年创业板公司治理指数超过金融、保险业公司, 指数均值最高,为63.63;其次为金融、保险业公司,其治理指数均值为63.44;中小企业板为63.09;而主板上市公司的治理指数平均值最低,为58.68。

(一)股东治理提升遭遇瓶颈,股东治理各分指标下降

2012年CCGINKSH(股东治理指数)由64.56降为61.20,比上一年度(2011)有较大幅度的下降,这其中,独立性下降了2.90,关联交易下降了4.31,中小股东权益下降了2.62。股东单位任职的董事所占的比例从2011年的28.50%上升到2012年的41.78%, 兼任高管的董事比例由2011年的22.50%上升到2012年的24.63%是导致上市公司独立性下降的主要原因;经济形势的继续恶化时关联交易抬头的经济因素,相对于2011年, 未实现中小股东现金分红的上市公司的比例由53.79%上升到68.26%。数据显示:2012年上市公司投资者对于公司内部治理能力信心不足, 他们希望借由自身参与的方式对公司实行直接控制和管理,以应对近年来不够明朗的经济大势;除此之外,由于对于行业或是整个经济体未来预期不高, 故此, 对中小股东的现金分红也被部分截流,这说明上市公司对于自身现金流的管控能力不足,他们没有足够的信心在公司出现波动的时候筹措足够的资金。根源在于近期中国大陆金融市场的振荡和金融政策的连续性波动, 使得公司更多的考虑自留现金而不是向金融机构借贷。这表明公司管理层对于资金风险预期存在一个较大的心理预期。

(二)董事会治理水平稳步提升,但董事会治理有效性有待提升

CCGINkBOD2012年均值为61.21, 标准差为1.79。组织结构均值68.52,得分最高;运作效率为57.19,为5个分指标中最低值,形成原因主要是独立性受到较大程度的制约,牵制力量较之过往年度大幅增强。各方力量均衡的组织可以提高决策的质量和水准, 但是必然会导致运作效率的大幅下滑。外部经济形势不稳,这是个投资者纷纷入驻上市公司管理层的根本原因, 这大大的削弱了公司管理和执行阶层独立决策的权力,根据组织行为学,组织机构权力过于分散,各方相互牵制的情况下,将大大的制约其决策速度和执行效率。

(三)监事会治理质量逐年提高

2012年我国上市公司监事会治理指数的均值为57.35, 样本公司监事会运行指数表现良好,平均值为67.80;监事会胜任能力指数和规模结构指数平均值分别为55.88和49.86。可见上市公司监事会治理质量逐年提高。但同样存在的问题是:公司内部监管监管过严,决策和执行层遭到相当程度的限制,公司治理的效益整体实际下滑;而外部监管不足或是不能真正的进入到公司的核心地带, 无法切实地对公司的内部运营、资本操作和财务控制做有效和持续的监督,这便是2012年部分上市公司财务频频出问题的外部原因。

(四)经理层治理指数、信息披露指数略有上升, 但利益相关治理指数呈下降趋势

2012年,CCGINKTOP和CCGINkID皆略有上升,分别为61.3和63.2,主要原因在于监管机制的不断成熟和职业经理人理念不断为投资者所认可。但CCGINKSTH却由于受制于协调分指数的大幅下降而下降,从这个层面来说, 中国上市公司是外部合作和内部协作能力较之于往年都不理想。

三、结束语

伴随着我国企业改革的逐步深化和公司治理由行政型治理向经济型治理转型的十年里,围绕规则、合规和问责进行的公司治理结构、机制建设使得上市公司治理合规性明显改善, 公司治理水平整体呈上升态势,平均值从2003年的48.96提高到2012年的60.60,公司治理建设进步明显,治理质量大幅提升。然而,我们还应该看到,尽管上市公司治理水平总体呈提升态势,但治理有效性偏低亦成为突出问题。

参考文献

[1]南开大学公司治理研究中心公司治理评价课题组.中国上市公司治理指数与公司绩效的实证分析

[2]张丽丽.中小型工程咨询企业的内部治理及评价研究[D].天津商业大学,2008

【评价数据】推荐阅读：