变异系数法

2024-05-25

变异系数法（精选6篇）

变异系数法篇1

摘要：文章对高校学生评价中惯用的加权平均方法进行了反思, 结合实际情况, 运用变异系数加权法, 突出了个各评价指标的相对变化幅度, 在此基础上给出了新的加权方法, 它兼顾了每个指标原本的重要性也缩小了每一次实际情况的不同产生的差异情况两个方面, 结合算例我们也能看出改进后的加权平均对学生更公平合理一些。

关键词：变异系数加权法,评价方法,加权平均法

现在高校评价学生成绩时, 虽然学生可能选择的科目不同, 但是都是百分制, 所以一般都是采用加权平均的方法计算出学生的加权平均成绩, 权重一般都是老师直接给定的。例如, 在某次考试中, 权重都相同的两个科目A和科目B, 科目A稍难其平均成绩是70分, 科目B稍易, 其平均成绩是90分, 甲同学选修了A科目而乙同学选修了B科目, 如果甲和乙都考了85分, 显然, 虽然都是85分, 甲同学85分的“含金量”肯定高于乙同学的85分的“含金量”, 在这种情况下, 如果以一般的权重一样的加权平均的方法评价甲乙同学, 那么显然是有失公平的。所以根据具体的考试情况的差异, 适当的调整一下权重, 可以更公平的更合理的去评价学生, 文中提出的变异系数加权法就是考虑到了每次考试时每个科目的相对变化幅度, 适当提升了“含金量”高一点的科目的权重, 然后再结合原来科目的权重计算出新的权重, 这种新加权平均方法可以更公平合理的评价学生。

1 新的权重的计算方法

1.1 第一步:变异系数加权法的实现

用xij (i=1, 2, …, n;j=1, …2, m) 表示第i个人的第j科目的成绩。

xj (j=1, 2, …, m) 表示第j科目的成则均值为

所对应的变异系数为:

于是对于科目xj (j=1, 2, m) 根据评价对象的成绩数据, 相应的权就是:

这种加权的方法是为了突出各指标相对的变化幅度, 如果从评价的目的来看就是区别被评价对象, vi的值大表示xi在不同的对象身上变化大, 区别能力强, 所以应给以重视。

1.2 第二步:新权的确定方法

设原来规定的权wj (j=A, B, ……) 则各指标新的权重。

其新的加权平均成绩为各科目取得的成绩与新的权重相乘即:。 (分母中表示对应的当xij不为零时的和) 。

2 算例

以某大学2006级研究生评优评先中前十五名同学的成绩为例, 研究生学位课所有所选科目共六门, 各科目所对应的权重分别为2, 3, 3, 4, 3, 3。 (其原始成绩及原来的加权平均成绩见表2) 。

表1为新权重的计算过程

按新的权重计算后的加权平均成绩见表2。

注1:由表2知:学生1和2的总成绩一样, 其中同样有一个原来权重是3的科目都得到99分的成绩, 科目3的平均分只有81.9, 而科目6的平均分是94.6667, 显然, 其“含金量”不同, 我们需要根据实际情况适当提升科目3的权重, 这样会比以前的评价更显公平, 同理, 对其他同学也是一样。

注2:而且以上仅是前十五名同学的成绩, 如果把全体同学的成绩都考虑进去, 则它的变化幅度就会更大, 这样变异系数加权法在确定新的权重时就显得更为重要。

注3:计算过程不复杂, 可以运用计算器的统计功能计算, 文中计算过程精确到小数点后七位数字, 结果保留四位有效数字。

3 结语

本文讨论的是现在高校评价学生工作中的问题, 它经过了抽象和简化, 具有普适性。从形式上看, 这个方法非常简单, 但很值得我们认真的思考, 思考我们惯用的加权平均的评价方法, 不难发现其中的不合理不公平之处, 需要根据实际情况确定一种适度的测度思想, 本文就是为了实现这种测度思想而做的一种尝试, 客观的讲, 每一个科目的权数既要反映其本身的重要性, 也要根据其每一次的具体成绩而定, 为此, 我们构造了这种新的加权方法, 有理论基础。从前面的计算结果我们也能看出, 新的加权方法更注重实际, 更合理、公平。

参考文献

[1]胡永宏, 贺思辉.综合评价方法[M].北京.科学出版社.2000.42～44.

变异系数法篇2

1畜牧业发展综合效益评价体系构建

1. 1构建思路

畜牧业发展不仅带来经济效益的变化, 而且还产生社会效益和生态效益的变动[2]。笔者从畜牧业发展所产生的经济效益、社会效益、生态效益的角度出发, 参照国内外研究情况, 整理获取全面的指标因子体系, 从中提取经济效益指标、社会效益指标和生态效益指标的具体衡量因子, 从而构建一套评价指标体系, 然后针对指标数据进行运算和结果分析[3]。

1. 2指标筛选和体系构建

指标选取在科学性原则、综合性原则、指标数据易获取性和差异性原则的基础上确定。对三大效益指标因子进行筛选, 筛选结果见表1。

2评价方法选取

2. 1指标权重确定方法

变异系数法 ( Coefficient of variation method) 是统计领域比较常见的客观赋权方法, 它直接利用各项指标所包含的信息, 通过计算得到指标的权重[4]。此方法的基本思想是: 在多指标评价中, 如果某项指标在所有被评价对象上观测值的变异程度较大, 说明该指标在被评价对象执行时达到平均水平的难度较大, 它能够明确地区分开各被评价对象在该方面的能力, 则该指标应赋予较大权重; 反之, 则应赋予较小权重。

确定指标权重分为定性分析和定量计算两种。定性分析层面主要有德尔菲法 ( 又名专家打分法或专家意见法) ; 定量分析层面主要有熵权法、因子分析法和变异系数法等, 另外还有介于定性与定量分析之间的层次分析法。德尔菲法需要有足够数量的相关专家对指标进行打分, 定量分析的三种方法的数学原理基本相同, 都是应用数据本身波动性和离中趋势, 根据数据波动越大反映指标越有选取价值的原理来计算的。因此, 在计算指标权重过程中笔者选用定量方法中的变异系数法[5]。

2. 2指标标准化方法选取

数据无量纲化处理主要解决数据的可比性, 数据标准化的方法有很多种, 常用的有“min ~ max标准化”、“Z ~ score标准化”和“按小数定标标准化”等。经过上述标准化处理, 原始数据均转换为无量纲化指标测评值, 即各指标值都处于同一个数量级别上, 可以进行综合测评分析, 本文研究采用min ~ max标准化方法。min ~ max标准化方法是对原始数据进行线性变换[6]。设min A和max A分别为属性A的最小值和最大值, 将A的一个原始值Wi通过min ~ max标准化映射成在区间[0, 1]中的值Xi, 其公式为:

式中: Wi表示各个指标的原始数值, Wmax和Wmin分别代表所在数组的最大值和最小值。然后经过数据处理得到指标标准值, Xi表示各指标标准化数值。

3研究步骤

3. 1指标标准化

通过min ~ max标准化映射成在区间[0, 1]中的值Xi, 然后依据公式 ( 1) 经过数据处理得到指标标准值, 见表2。

3. 2变异系数、指标权重计算

变异系数是反映总体各单位标志值的差异程度或离散程度的指标。指标在评价对象上观测值的变异程度越大, 说明达到该指标平均水平的难度越大, 该指标可以明确区分各个评价对象, 权重也应该越大。由于变异系数法从数据本身出发, 历年数据不同就会导致指标权重不同, 因此在计算过程中, 使用2004—2012年的平均数据来计算权重。计算变异系数公式为:

式中: vi是第i项指标的变异系数, 也称为标准差系数; σi是第i项指标的标准差; i是第i项指标的平均数, 见表3。

进行权重计算, 其计算公式为:

根据表3, 结合公式 ( 3) , 计算得出各指标权重值, 见表4。

3. 3效益指数计算

采用多因素综合权重的方法来计算新疆畜牧业发展的经济效益、社会效益、生态效益及综合效益指数, 其公式为:

式中: Mj是畜牧业发展效益指数, Xij是指新疆j年第i个指标的标准化数值, qi是第i个指标的权重值。

依据前表数据和公式 ( 4 ) 加权可得2004— 2012年新疆畜牧业发展经济效益、社会效益、生态效益指数及综合效益指数及其发展趋势: 2004—2012年9年时间里, 2011—2012年的畜牧业发展效益指数最优, 单项及综合均稳定为第2位和第1位。 2006—2009年波动明显, 2006—2007排名提升, 发展增强, 2008—2009排名下降, 发展减缓, 见表5。

3畜牧业发展效益评价

3. 1子效益评价

从2004—2012年子效益指数来看, 畜牧业发展经济效益指数变化呈现增—减—增的趋势。效益指数最大值是2012年的0. 274 7, 最低值是2004年的0. 050 8, 平均值为0. 150 9, 其中9年中低于平均值水平的有4个年份, 依次为2004年、2005年、2008年和2009年, 而且2010年经济效益指数仅为0. 159 7, 略高于平均水平。这种变化与2008年前后国家农业部对统计数据的调整以及国际金融危机、美国危机及新疆暴力恐怖事件有关, 国际国内经济社会环境的变化, 使畜牧产业生产与消费、出口贸易等受到影响。 2010年以来, 随着中央新疆工作座谈会和新一轮援疆工作力度的投入, 新疆畜牧业发展的政策支持更加全面, 经济大环境开始发生变化, 畜牧业经济投资和贸易不断增加, 牲畜及产品不断增长。

新疆畜牧业发展社会效益指数变化呈现连续增长趋势。效益指数最大值是2012年的0. 382 0, 最低值是2005年的0. 028 2, 平均值为0. 145 0, 其中2004—2009年连续6个年份的社会效益指数低于平均值水平, 2010—2012年增长较为迅速, 依次为0. 175 8、0. 299 2和0. 382 0。这种变化与中央、新疆对畜牧业发展的畜牧良种和动物防疫补贴政策、退牧还草和草原奖补政策及牧民定居、富民安居工程支持密不可分。

新疆畜牧业发展生态效益指数变化高低起伏, 呈现波动性变化趋势。效益指数最大值是2010年的0. 188 8, 最低值是2004年的0. 102 2, 平均值为0. 133 8, 其中2004—2009年连续6个年份的生态效益指数低于平均值水平, 2010年增长较为迅速, 为0. 188 8随后2年略有下降。这种变化大致有三方面的原因: 一是新疆天然草原面积、水资源量有限, 牧草地面积到了一个近乎饱和的数值; 二是因为草原政策的变化及草地四至界限的进一步明确, 使得草原利用更加稳定和有序, 2009年开始的草原奖补政策使得2010年的生态效益出现一个最高点就是例证; 三是人为活动的造林面积、农作物播种面积受制于自然条件和技术条件的约束, 年度增长不大, 趋于平稳。

3. 2综合效益评价

从2004—2012年综合效益指数来看, 新疆畜牧业发展综合效益指数最大值是2012年的0. 824 0, 最低值是2004年的0. 182 3, 平均值为0. 429 7。其中2004—2009年连续6个年份的综合效益指数低于平均值水平, 2010—2012年增长较为迅速, 依次为0. 524 3、0. 665 7和0. 824 0。

从2004—2012年新疆畜牧业发展效益指数变化趋势来看, 综合效益指数变化趋势基本上与经济效益指数变化趋势一致; 2007年国家农业部对统计数据的调整对新疆畜牧业发展综合效益的影响不大。综合效益与社会效益在2004—2007年、2009—2012年趋势一致; 与生态效益在2008—2010年趋势吻合。

4小结

文章选用2004—2012年新疆国民生产总值、牧业产值、年底产肉总量、牲畜年底出栏数、农牧民人均纯收入、人均牧业收入、农村居民家庭人均畜产品消费量、第一产业从业人口数量、牧草地面积、造林面积、人均水资源量和农作物播种面积12个指标数据, 从经济效益、社会效益和生态效益三个方面建立了新疆畜牧业发展综合效益评价指标体系, 运用变异系数法对新疆畜牧业2004—2012年的绩效情况进行了分析, 评价结果基本上与实际情况相符, 并且比较客观地反映了目前新疆畜牧业发展的现状和历史发展趋势[7]。同时, 根据样本数据的变异程度运用变异系数法确定各个指标的权重[8], 既节约了评价过程对数据的处理时间, 又克服了主观赋权的随意性, 对提高工作效率增加了不少助力。

参考文献

[1]马颖忆, 陆玉麒.基于变异系数和锡尔指数的中国区域经济差异分析[J].特区经济, 2011 (5) :273-275.

[2]张计华.对清水河县发展现代畜牧业的思考[J].内蒙古科技与经济, 2014 (6) :7-9.

[3]屈宝林.基于变异系数法的征信管理绩效评价研究[J].区域金融研究, 2014 (4) :9-12.

[4]殷胜磊, 吕可文, 王赵海, 等.河南省畜牧业竞争力时空差异分析[J].河南科学, 2011, 29 (2) :214-219.

[5]陆文聪, 张宁, 西爱琴, 等.浙江省现代畜牧业发展水平的基本判断及综合评价[J].华南农业大学学报:社会科学版, 2007, 6 (1) :10-16.

[6]张志龙.湖南畜牧业国际综合竞争力分析[J].湖南农业科学, 2003 (3) :72-74.

[7]汤洋, 李翠霞.黑龙江省畜牧业发展水平的因子分析模型构建与综合评价研究[J].数学的实践与认识, 2013, 43 (12) :92-99.

变异系数法篇3

1 文献综述

国外针对科技竞争力评价进行了诸多研究,代表性成果有:瑞士洛桑国际管理发展学院(International Institute For Management Development,IMD)从研发财力资源、研发人力资源、技术管理状况、科学环境状况、知识产权保护状况5个方面选取26个具体指标建立评价指标体系,对各国科技竞争力进行综合评价[2]。世界经济论坛(World Economic Forum,WEF)将参评的国家和地区按照指标“百万人口实用专利美国授权数”进行了分类,然后应用不同的加权方式并选择不同分指数进行综合,以获得更加合理的评价结果,其中包括科技竞争力评价[3]。

我国政府部门及相关学者也对科技竞争力评价进行了大量研究,科技部发展计划司先后于2003年、2005年、2007年和2008年四次制定和修改了国家及各地区科技进步监测体系,形成了一套科技竞争力评价指标体系。鞠芳辉建立了一套由一级指标科技投入、科技产出、科技潜力、科技与社会经济协调发展程度构成的城市科技竞争力评价指标体系[4]。朱俊成等提出了一套由科技投入、科技产出、科技与经济社会协调发展和科技外向性等为一级指标的城市科技竞争力评价指标体系[5]。卢方元等从科技投入、科技产出、科技与经济发展的协调程度和科技潜力4个方面对河南省18个地市的科技竞争力进行分析[6]。倪芝青等在参考科技部科技进步监测体系和《中国科技发展研究报告》的基础上,建立了一套由科技投入水平、科技产出水平、科技与经济和社会协调发展程度、科技潜力为一级指标的评价体系[1]。

本文在借鉴已有研究的基础上,充分融入科技服务、科技环境等软性条件,构建了一套适合城市科技竞争力评价的指标体系。已有研究在指标权重确定方面,多是通过向有关专家咨询、汇总得到的,带有很强的主观性。本文采用层次分析法(AHP)和变异系数法主客观相结合的方法确定各指标权重,以期减小指标确定过程中的主观性。

2 模型、指标与方法

2.1 四维评价模型

城市科技竞争力的强弱不仅反映在科技投入和科技产出的多少,而且体现在科技服务、科技环境的优化,也就是说,在科技竞争力表现为现实能力的过程中,“软因素”也起着至关重要的作用,因为它往往在很大程度上决定前者的发展。其中,科技投入是科技竞争力的基础,主要表现在人力投入和财力投入两个方面,科技产出是科技竞争力的核心,主要体现在知识产权和高新技术,科技服务是科技竞争力的推力,主要包含技术市场和孵化器机构,科技环境是科技竞争力的支撑,主要依赖于基础设施、研发机构和教育资源。

2.1.1 科技投入

科技投入是一个城市进行科技创新的物质条件和基础,它反映了一个城市的科技研究与发展水平。科技投入是根据人力投入、财力投入来反映城市科技竞争力差异的一个指标。本文选取万人口专业技术人员数、万人口R&D人员数、万人从事科技活动人员数3个人力投入指标和人均科技活动经费、科技活动经费占城市GDP的比重、地方财政科技拨款总额占地方财政支出比重3个财力投入指标来衡量城市科技投入的差异。

2.1.2 科技产出

科技产出是反应城市科技竞争力的核心指标,城市科技产出的差异需要从知识产权和高新技术两个角度衡量,不仅要考虑知识产权、高新技术的绝对值,更要考虑知识产权、高新技术的结构。本文选取万人发明专利授权量、百万人国家级科技奖励数2个知识产权指标和高新技术产业总产值、高新技术产业增加值、高新技术产业增加值占城市GDP的比重、新产品销售收入占所有产品销售收入的比重4个高新技术指标来衡量城市科技产出的不同。

2.1.3 科技服务

科技服务旨在推进科技的应用、推广,生产力促进中心、创业服务中心、行业协会、中小企业服务中心、专业公司(中心)、专业协会、农技服务站等即属此类。科技服务反映城市科技的应用和推广差异。本文选取技术市场成交合同额、技术市场成交额占城市GDP比重2个技术市场指标和市级以上科技企业孵化器数量、孵化器机构在孵企业数、孵化器企业技工贸总收入3个孵化器指标来衡量城市科技服务的不同。

2.1.4 科技环境

科技环境实质上是科技活动的支撑系统,其好坏直接决定了区域科技竞争力的高低。良好的科技环境有助于区域内聚集大量的科技型人才,从而加快知识创造和科技创新,提升区域科技竞争力。本文选取万人拥有公共图书馆藏书量、万人拥有互联网用户数、万人拥有固定电话和移动电话数3个基础设施指标,国家重点实验室数、国家工程研究中心数、国家级科研院所数、国家认定企业技术中心数4个研发机构指标和高等院校数、公共教育支出占城市GDP的比重、高等学校在校生人数3个教育资源指标来衡量城市科技环境的不同。整个城市科技竞争力评价指标体系如表1所示。

2.2 研究方法

在科技竞争力综合评价中含有大量的主、客观因素,为了评价的科学性与合理性,本文采用层次分析法(AHP)和变异系数法主客观相结合的方法确定各指标权重,最终得到15个副省级城市科技竞争力的评价值。

2.2.1 权重确定

(1)层次分析法

本文根据指标体系,运用AHP分三层次对指标赋予权重。第一层次:根据科技投入、科技产出、科技服务以及科技环境(即一级指标)对科技竞争力影响程度的两两判别矩阵赋予一级指标权重(综合为1);第二层次:对影响一级指标内部的各二级指标按重要性程度的两两判别矩阵赋予二级指标权重(任何一级指标内各二级指标权重之和仍为1);第三层次:类似于第二层次方法,计算二级指标内部的各三级指标权重(同样任何二级指标内各三级指标权重之和仍为1)。由此计算在层次分析法下每一个三级指标对科技发展水平的综合权重(记为mijk):相应一级指标所占权重*相应二级指标所占一级指标权重*该三级指标所占二级指标的权重。

(2)变异系数法

变异系数赋权法就是根据各个指标在所有被评价对象上观测值的变异程度大小,来对其赋权。变异程度大的指标,说明能够较好地区分各城市在该方面的情况,应赋予较大的权重;反之,则赋予较小的权重。

变异系数一般计算步骤有:(1)计算变异系数(2)将变异系数代入计算变—异系数权重ui=vi/∑vi。其中Si为指标的标准差,为指标的均值,vi为变异系数,ui为变异系数权重。在本次评价过程中对于不同的指标,笔者都分别对其三级指标计算了变异系数权重,为了下标的统一,我们把对应指标的权重记为uijk。

(3)综合权重确定

利用上述计算结果,得出主客组合赋权模型最终确定的指标权重(记为λijk)。计算模型如下:

2.2.2 综合得分模型

(1)二级指标的综合得分模型

Xij指第i个一级指标下第j个二级指标的综合得分值。

(2)一级指标的综合得分模型

Yi指第i个一级指标的综合得分值。

(3)科技竞争力综合得分模型:

DST为科技竞争力综合得分;q/ijk-β为无量纲化处理后三级指数的得分值,λijk为对应指标在主客观组合赋权模型下的权重。

3 实证分析

3.1 副省级城市科技竞争力综合评价

通过综合模型计算,分别得到全国15个副省级城市的科技投入、科技产出、科技服务和科技环境四个维度评价结果以及综合竞争力结果,如表2和表3所示,我国15个副省级城市无论是在科技投入、科技产出、科技服务和科技环境四个方面表现,还是综合竞争力都已呈现出非均衡现象。将副省级城市数据导入SPSS17.0软件中,采用分层聚类方法,进一步得到我国副省级城市科技竞争力非均衡发展的四层分化结果:第一层,国内领先层,唯有深圳符合,能拥有国内绝大多数城市无法比拟的科技竞争力,在科技投入、科技产出、科技服务方面成就显著,引领着我国城市科技发展方向,但在科技环境方面排名靠后。第二层,区域中心层,包含南京、广州、杭州、厦门、武汉5个城市,此层城市代表所在区域科技发展水平,科技投入、科技产出、科技服务和科技环境在15个副省级城市中处于中上游水平。第三层,地区支撑层,包括沈阳、大连、济南、西安、青岛5个城市,此层城市拥有丰富的高等教育资源和研发资源,科技环境突出。第四层,地区发展层,包含宁波、成都、长春、哈尔滨4个城市,他们在15个副省级城市中科技发展基础相对较弱,科技竞争力不强,正处于起步快速发展阶段。

3.2 非均衡现象

根据表2中得分情况,分别将15个副省级城市按照综合得分从大到小进行排序,其结果如图2所示。从图中可以看出,剔除南京、广州、杭州、长春和哈尔滨5个城市外,绝大部分城市的科技投入、科技产出、科技服务和科技环境波动方向和幅度不一致,出现了副省级城市四方面非均衡发展现象,即某个城市其中一个方面较强,该城市其他三个方面未必也较强。从统计数据来看,共有10个城市出项了四个方面非同步发展情况,占到了副省级城市的三分之二,导致副省级城市整体上科技发展非均衡现象显现。

深圳的科技投入、科技产出和科技服务均排名第1,遥遥领先于其他副省级城市,但科技环境却排名第13,科技发展严重不均衡,可见作为中国经济特区发展起来的城市,深圳科技底蕴不足。厦门科技投入、科技产出和科技服务三项指标均名列前茅,但科技环境指标仅排名第12,说明厦门缺乏研发资源和高等教育资源。武汉和沈阳在科技服务、科技环境两个方面具有比较明显的优势,从最有利于自己的角度,在科技服务和科技环境方面,都有充分的理由排在更靠前的位置,如果武汉和沈阳进一步注重科技投入和科技产出两方面的工作,其在总体上的比较优势将更加明显,在科技竞争力的构成结构上就更加均衡。大连和济南科技投入和科技服务两项指标排名靠后,表明大连和济南在这两项指标上的弱势。这无形中提示了大连和济南在科技发展中应该注意的问题,应加大科技投入,强化科技中介服务体系建设,促进科技成果就地转化。西安和成都的科技产出明显落后于科技投入,说明这两个城市的科技投入产出效率不高。青岛和宁波这两个城市经济发展很快,特别是外资加工型经济发展十分迅速,而科技竞争力明显滞后于经济发展的态势,还需要进一步提高。

4 结论

从实证结果可以看出,我国副省级城市科技竞争力已经进入四层分化的非均衡发展阶段。从副省级城市非均衡表现形式来看,整体上呈现出科技投入、科技产出、科技服务、科技环境四个方面非均衡发展的局面。

在面对区域发展不平衡问题上,国家已制定了“西部开发”、“东北振兴”、“中部崛起”为主线的三大国家区域平衡战略,而顺势制定科技平衡发展政策,将改善我国副省级城市科技竞争力在区域中的非均衡现状。而制定科技发展政策不能局限某一侧面,应从科技人员和经费投入上强化科技投入,从知识产权和高新技术上提升科技产出,从技术市场和孵化器上增强科技服务,从基础设施、研发机构和教育资源上强化科技环境,最终实现副省级城市四个方面同步均衡发展。

摘要：以城市科技数据为依据,构建了副省级城市科技竞争力评价模型和指标体系,并通过采用AHP-变异系数法进行了实证分析。研究表明:我国副省级城市科技竞争力已进入四层分化的非均衡发展阶段,呈现出科技投入、科技产出、科技服务和科技环境异步非均衡发展的表现形式。

关键词：变异系数法,副省级城市,科技竞争力

参考文献

[1]倪芝青,林晔,沈悦林.18城市科技竞争力评价研究[J].中国科技论坛,2008(7):92-96

[2]IMD.Word Competitiveness Yearbook(2002)[R].Switzerland:IMD Lausanne,2002

[3]WEB.The Global Competitiveness Geneva Report[R].Switzer-land,2002-2003

[4]鞠芳辉,杜晓燕.中国沿海城市科技竞争力评价的实证研究[J].管理科学,2003,16(3):83-88

[5]朱俊成,郑林.中部五省省会城市科技竞争力研究[J].华东经济管理,19(8):43-47

含变异系数的一种抽样分布篇4

变异系数的定义为 $v = \frac{σ}{μ}$ , 是相对数形式表示的变异指标, 是个相对的无量纲量, 变异系数是一个个简单但用途广泛的指标, 普遍用于反映某一总体各单位标志值的差异程度[1], 是衡量结构风险程度或稳定程度的可靠性指标。对研究变异系数进行统计推断必须在含变异系数抽样分布的基础上才能进行进一步的分析, 文献[2]基于变异系数数据与原点选取无关特征, 取均值为计数原点的子样推导出变异系数的抽样分布。而本文取自一般正态总体的子样并给出了含变异系数的抽样分布——z分布, 其分布的建立为变异系数的区间估计和假设检验提供了理论依据。

1 引理

引理1 设总体X～N (μ, σ2) , X1, X2, …, Xn是来自总体的容量为n的样本

$\bar{X} = \frac{1}{n} \sum_{i = 1}^{n} X_{i}$ , $S^{2} = \frac{1}{n - 1} \sum_{i = 1}^{n} (X_{i} - \bar{X})^{2}$

分别为样本均值和样本方差, 那么

(1) $\bar{X} \sim Ν (μ ‚ \frac{σ^{2}}{n})$ 且有密度

$f_{1} (x) = \frac{1}{\sqrt{2 π} σ \sqrt{n}} e^{- \frac{(x - μ)^{2}}{2 σ^{2} / n}}$

(2) $\bar{X}$ 与S2相互独立, 且 $χ^{2} = \frac{(n - 1) S^{2}}{σ^{2}} \sim χ^{2} (n - 1)$ , 其密度为

$f_{χ^{2}} (x) = {\begin{cases} \frac{1}{2^{\frac{n - 1}{2}} Γ (\frac{n - 1}{2})} x^{\frac{n - 1}{2} - 1} e^{- \frac{x}{2}} ‚ x ＞ 0 \\ 0 ‚ x \leq 0 \end{cases}$

引理1的证明见文献[3][4]。

引理2 设总体X～N (μ, σ2) , X1, X2, …, Xn是来自总体的容量为n的样本

$\bar{X} = \frac{1}{n} \sum_{i = 1}^{n} X_{i}$ , $S^{2} = \frac{1}{n - 1} \sum_{i = 1}^{n} (X_{i} - \bar{X})^{2}$ , $v = \frac{σ}{μ} (μ \neq 0)$

分别为样本均值、样本方差和变异系数, 那么

(1) $U = \frac{\bar{X}}{μ} \sim Ν (1 ‚ v^{2} / n)$ , 其分布密度为

$f_{U} (x) = \frac{1}{\sqrt{2 π} \sqrt{v^{2} / n}} e^{- \frac{(x - 1)^{2}}{2 v^{2} / n}}$

$(2) V = \frac{S}{σ}$ 的分布密度为

$f_{V} (y) = {\begin{cases} \frac{1}{2^{\frac{n - 3}{2}} Γ (\frac{n - 1}{2})} (n - 1)^{\frac{n - 1}{2}} y^{n - 2} e^{- \frac{(n - 1) y^{2}}{2}} ‚ y ＞ 0 \\ 0 ‚ y \leq 0 \end{cases}$

证 (1) 由引理1得, $\bar{X} \sim Ν (μ ‚ σ^{2} / n)$ , 所以

令 $U = \frac{\bar{X}}{μ} \sim Ν (1 ‚ \frac{1}{μ^{2}} \cdot \frac{σ^{2}}{n}) = Ν (1 ‚ v^{2} / n)$

故其分布密度为

$f_{U} (x) = \frac{1}{\sqrt{2 π} \sqrt{v^{2} / n}} e^{- \frac{(x - 1)^{2}}{2 v^{2} / n}}$

(2) 由于 $V = \frac{S}{σ} \geq 0$ , 所以当y≤0时, V的分布密度为

fV (y) =0

当y>0时, V的分布函数为

$\begin{array}{l} F_{V} (y) = Ρ {V \leq y} \\ = Ρ {χ^{2} = \frac{(n - 1) S^{2}}{σ^{2}} \leq (n - 1) y^{2}} = \int_{0}^{(n - 1) y^{2}} f_{χ^{2}} (x) d x \end{array}$

所以V的分布密度为

$\begin{array}{l} f_{V} (y) = F^{'}_{V} (y) = 2 (n - 1) y f_{χ^{2}} ((n - 1) y^{2}) \\ = 2 (n - 1) y \frac{1}{2^{\frac{n - 1}{2}} Γ (\frac{n - 1}{2})} [(n - 1) y^{2}]^{\frac{n - 1}{2} - 1} e^{- \frac{(n - 1) y^{2}}{2}} \\ = \frac{1}{2^{\frac{n - 3}{2}} Γ (\frac{n - 1}{2})} (n - 1)^{\frac{n - 1}{2}} y^{n - 2} e^{- \frac{(n - 1) y^{2}}{2}} \end{array}$

从而 $V = \frac{S}{σ}$ 的分布密度为

$f_{V} (y) = {\begin{cases} \frac{1}{2^{\frac{n - 3}{2}} Γ (\frac{n - 1}{2})} (n - 1)^{\frac{n - 1}{2}} y^{n - 2} e^{- \frac{(n - 1) y^{2}}{2}} ‚ y ＞ 0 \\ 0 ‚ y \leq 0 \end{cases}$

2 定理

设总体X～N (μ, σ2) , X1, X2, …, Xn是来自总体的容量为n的样本

$\bar{X} = \frac{1}{n} \sum_{i = 1}^{n} X_{i}$ , $S^{2} = \frac{1}{n - 1} \sum_{i = 1}^{n} (X_{i} - \bar{X})^{2}$

分别为样本均值和样本方差, $S = \sqrt{S^{2}}$ 为样本标准差, $v = \frac{σ}{μ}$ 为变异系数, 那么随机变量

$Ζ = v \frac{\bar{X}}{S}$

仍为连续型分布, 其密度为

$f_{Ζ} (z) = \frac{(\frac{n - 1}{2})^{\frac{n - 1}{2}}}{\sqrt{\frac{π v^{2}}{2 n}} Γ (\frac{n - 1}{2})} \int_{0}^{+ \infty} y^{n - 1} e^{- \frac{1}{2} [(n - 1) y^{2} + \frac{(y z - 1)^{2}}{v^{2} / n}]}$ dy

证按引理2的记号, 由于V≥0且当y≤0时fV (y) =0, 故随机变量

$Ζ = v \frac{\bar{X}}{S} = \frac{\bar{X} / μ}{S / σ} = \frac{U}{V}$

其分布函数为

$\begin{array}{l} F_{Ζ} (z) = Ρ {Ζ \leq z} = Ρ {U \leq V z} \\ = \int_{0}^{+ \infty} [\int_{- \infty}^{y z} f_{U} (x) f_{V} (y) d x] d y \end{array}$

所以H的分布密度为

$f_{Ζ} (z) = F^{'}_{Ζ} (z) = \int_{0}^{+ \infty} y f_{U} (y z) f_{V} (y) d y = \int_{0}^{+ \infty} y \frac{1}{\sqrt{2 π} \sqrt{v^{2} / n}} e^{- \frac{(y z - 1)^{2}}{2 v^{2} / n}} \cdot \frac{1}{2^{\frac{n - 3}{2}} Γ (\frac{n - 1}{2})} (n - 1)^{\frac{n - 1}{2}} y^{n - 2} e^{- \frac{(n - 1) y^{2}}{2}} d y$

$= \frac{(\frac{n - 1}{2})^{\frac{n - 1}{2}}}{\sqrt{\frac{π v^{2}}{2 n}} Γ (\frac{n - 1}{2})} \int_{0}^{+ \infty} y^{n - 1} e^{- \frac{1}{2} [(n - 1) y^{2} + \frac{(y z - 1)^{2}}{v^{2} / n}]}$ dy

3 结束语

为方便, 我们把定理给出的分布称为z分布, 记作 $Ζ = v \frac{\bar{X}}{S} \sim z (v ‚ n - 1)$ , 其中 $v = \frac{σ}{μ}$ 为变异系数。其密度为

有了含变异系数的上述分布, 我们就可以在既有结构的可靠性、保险理论以及医院统计等方面的研究中对变异系数进行有效地估计和检验。

参考文献

[1].王文森.变异系数——一个衡量离散程度简单而有用的统计指标[J].中国统计, 2007, 6:41～42

[2].周昌隆.变异系数的抽样分布[J].赣南师范学院学报, 1996, 6 (1) :19～21

[3].赵彦晖, 等.概率统计[M].北京:科学出版社, 2006:108

[4].[美]E-勒克斯.概率论与数理统计 (引论) [M].北京:人民教育出版社, 1999:43

[5].孙祝岭.正态分布变差系数的抽样检验[J].数理统计与应用概率, 1997, 9 (12) :271～273

变异系数法篇5

人的全面发展指标体系的构建是根据“以人为本”的科学发展观的核心, 筛选出对人的全面发展评价有重要影响的代表性指标。建立合理的指标体系是人的全面发展评价的关键。

(1) 人的全面发展评价指标体系的研究现状

一是国外权威机构的评价指标体系研究。代表性的有世界银行 (1980) 推出的生活标准测算研究指标体系[1];联合国开发计划署UNDP (1990) 推出的人类发展指数HD[2];欧洲各国 (2000) 制定的欧洲生活质量指标体系[3]。美国的生活质量指标体系[4,5], 亚洲发展银行的生活质量指标体系[6], 日本的社会发展评价指标体系[7]。

二是国内权威机构的评价指标体系研究。代表性的有中国社会科学院社会学研究所社会发展与社会指标课题组、国家统计局和国务院发展研究中心发展战略和区域经济研究部研究制定了用来测算全国的小康发展水平指标体系[8,9,10]。

以上两类指标体系虽然权威性强, 但是侧重于生活质量以及小康社会等物质方面的评价, 不适合人的全面发展的综合评价和比较。

三是学术文献整理得出的评价体系研究。代表性的是1974年宾夕法尼亚大学的埃斯特斯 (Richard Estes) 设计的社会进步指数 (ISP) [11]。美国社会学家英克尔斯在对亚洲、非洲和拉丁美洲的调查基础上, 提出英克尔斯社会现代化指标体系[12]。原国家统计局副局长贺铿根据全面小康社会的内涵从经济发展水平, 文教与卫生发展水平和社会发展水平方面初步构建了全面小康社会评价指标体系[13]。国家发展计划委员会的曹玉书参照国际上常用的衡量现代化的指标体系于2002提出的全面建设小康社会的定量指标, 并根据国情制定了“全面建设小康社会”的基本标准[14]。武汉大学生活质量研究中心周长城教授在《社会发展与生活质量》一书中提出了一套生活质量评价指标体系的构造设想[11]。基于对生活质量概念的理解, 结合城市居民生活的特征, 浙江大学范柏乃 (2006) 遴选64个评价指标构成中国城市居民生活质量理论评价体系[15]。

这类指标体系都是反映了个体构建者的构建目的, 而还没有一人是从反映人的全面发展角度出发去构建评价指标体系。

综上三类评价指标体系研究都还未曾从反映科学发展观以人为本的核心的角度出发构建人的全面发展评价指标体系。

(2) 人的全面发展评价指标筛选的研究现状

一是基于专家经验的主观筛选方法。朱启贵 (2004) 从全面小康评价的内涵出发对全面小康评价指标进行筛选[8]。专家主观筛选法存在的问题是单纯依靠指标的含义和个人经验, 主观随意性强。

二是基于定量方法的客观筛选方法。范柏乃 (2006) 利用相关性分析剔除了我国城市居民生活质量评价指标体系中信息重复的指标[15]。耿金花等 (2007) 利用因子分析提取对评价结果有显著影响的社区评价指标体系[16]。客观筛选法存在的问题是过度依赖于指标数据, 忽略了指标的实际含义。

针对上述问题, 本文在根据人的全面发展评价的内涵海选与初筛指标的基础上, 利用R聚类和变异系数分析相结合的定量筛选指标, 建立人的全面发展评价指标体系。

2 人的全面发展评价指标体系的构建原理

(1) 根据科学发展观以人为本的核心和人与自然和谐、人与社会和谐、人与人和谐的原则从经济发展环境、社会发展环境、生态环境、人力资本环境、生活质量、人口素质6个准则出发海选指标。

(2) 对于海选的指标在准则层内进行聚类分析, 通过聚类分析保证每一类都代表了人的全面发展的某个方面。

(3) 计算各个指标的变异系数, 通过比较同一类中指标的变异系数大小进行指标筛选, 保证保留的指标既代表了人的全面发展的主要方面又保证了指标体系本身的鉴别能力。

(4) 人的全面发展指标体系的完善。一切的模型都是工具, 工具必然具有局限, 因此最后还需要对指标体系进行理论分析和完善, 保证指标体系反映人的全面发展主题。

指标体系构建原理如图1所示。

3 人的全面发展评价指标体系构建的方法

3.1 基于理性分析的指标筛选方法

(1) 国际权威机构典型观点高频指标的海选思路

以世界银行, 联合国开发计划署 (UNDP) 以及中国社会科学院社会学研究所社会发展与社会指标课题组[1,2,3,4,5,6,7,8,9,10]等权威机构的指标为基础指标, 根据反映国际权威机构经典观点的高频指标原则筛选人均GDP、基尼系数、恩格尔系数等指标。

(2) 通过以人为本核心原则指标筛选思路

人的全面发展评价指标要反映“以人为本”的科学发展观的核心。通过国民幸福指数、社会保障覆盖率、人均住房面积、人均安全水资源拥有量等指标反映“以人为本”的科学发展的核心。

(3) 同类指标选择信息最优原则

根据同类指标选择信息最优原则筛选指标。删除海选指标中信息反映重复, 且明显可以用其他更优指标代替的评价指标。

(4) 人的全面发展评价指标的可观测性原则

根据可观测性原则初步筛选指标。删除海选指标中数据无法获得的评价指标, 使初步筛选后的指标满足可观测性, 保证评价的顺利进行。

特别地, 国民幸福指数的指标数据是根据中国统计年鉴中的相关数据计算出来的。

3.2 基于定量分析的指标筛选方法

(1) 定量筛选方法及步骤

①评价指标的标准化

为了消除量纲对定量分析的影响, 需要对原始数据进行标准化处理。

②聚类分析

通过R型分层聚类将同一准则层内的指标分类, 并对每一类中的指标进行非参数检验, 使不同的类代表人的全面发展评价的不同方面。

③变异系数分析

通过变异系数分析选出同一类中鉴别能力 (变异系数) 最大的指标, 删除其他指标, 这就既保证了从不同的类中筛选出的指标反映信息不重复, 又保证了筛选后的指标体系能够全面覆盖人的全面发展评价的各个方面。

(2) 评价指标数据的标准化

为了消除量纲对定量分析结果的影响, 通过式 (1) 、式 (2) 、式 (3) 对原始数据进行标准化处理[15]:

$\begin{array}{l} z_{i j}^{*} = \frac{z_{i j} - \bar{z}_{j}}{s_{j}} (1) \\ \bar{z}_{j} = \frac{1}{n} \sum_{i = 1}^{n} z_{i j} (2) \\ s_{j} = \sqrt{\frac{1}{n} \sum_{i = 1}^{n} (z_{i j} - \bar{z}_{j})^{2}} (3) \end{array}$

式中:zij为第j个指标第i年的原始数据; $\bar{z}_{j}$ 为第j个指标2001-2007年的指标数据的均值;sj为第j个指标所有数据的标准差;z*ij为第i年第j个指标的标准化后的数值。

(3) 基于R型分层聚类的指标类别提取

①通过R型分层聚类划分每一个准则层下的指标类别与数量

本文采用离差平方和法对评价指标R型分层聚类。假设:把n个评价指标分成l类, 则第i类的离差平方和Si (i=1, 2, …, l) 可以通过式 (4) 计算[17]:

$S_{i} = \sum_{j = 1}^{n_{i}} (X_{i}^{(j)} - \bar{X}_{i})^{'} (X_{i}^{(j)} - \bar{X}_{i}) (4)$

其中:ni为第i类的评价指标个数;X (j) i为第i类中的第j个评价指标标准化后的样本值向量 (j=1, 2, …, ni) ; $\bar{X}_{i}$ 为第i类指标的样本平均值向量。

根据式 (4) 的第i类的离差平方和可以计算所有k个类的总离差平方和S为[17]:

$S = \sum_{i = 1}^{k} \sum_{j = 1}^{n_{i}} (X_{i}^{(j)} - \bar{X}_{i})^{'} (X_{i}^{(j)} - \bar{X}_{i}) (5)$

②聚类步骤

分类:将n个评价指标看成n个类。

合并:将n类评价指标中任意两个合并成一类而其他类保持不变, 根据排列组合知道:共有n (n-1) /2种合并方案。根据式 (5) 计算各合并方案的总离差平方和, 按总离差平方和最小的合并方案进行新的分类。重复本步骤直到最后分类数目为l.

③聚类数目的确定

为了避免聚类分析的分类数目l给定时的主观随意性, 通过对聚类后每一类的指标进行非参数K-W检验[17]判断聚类数目l的合理性。非参数K-W检验的原假设是不同的指标在数值特征上无显著差异。如果每一类的显著性水平Sig>0.05, 则接受原假设, 即同一类指标间无显著差异, 聚类数目合理;否则拒绝原假设, 重新聚类。

(4) 基于变异系数方法的指标鉴别力大小分析

指标的变异系数是刻画指标分辨信息的能力 (即指标的区分度) , 当变异系数越大, 表明该指标在各个决策单元中的分布变异性越大, 指标的信息分辨能力就越强;反之, 则越弱, 应予以剔除。通过删除变异系数小、对评价结果影响不大的指标, 简化指标体系。

变异系数是经济统计中常用的衡量数据差异的统计指标, 第j个指标的变异系数的计算公式[15]:

$v_{j} = \frac{s_{j}}{x_{j}} (6)$

其中, xj是总体的均值,

$x_{j} = \frac{1}{n} \sum_{i = 1}^{n} x_{i j} (7)$

sj是总体的标准差,

$s_{j} = \sqrt{\frac{1}{n} \sum_{i = 1}^{n} (x_{i j} - x_{j})^{2}} (8)$

式 (8) 中sj表示各指标的相对变异程度, xj作为各指标变异程度的参照物, 则式 (8) 反映了各指标的标准化变异程度。

变异系数指标筛选的优点:变异系数最大的指标, 有较强的信息分辨能力, 其在综合评价中起到的作用较大, 通过剔除指标变异系数小的指标, 删除对评价结果影响小的指标, 保证指标体系的简洁和有效。

变异系数与R聚类的关系:变异系数法与R型分层聚类筛选指标有本质的不同。变异系数法是删除对评价结果影响小的指标, 而R型分层聚类只是把相关性大的指标聚为一类。

3.3 指标体系的建立与完善

在经过3.1节的理性筛选和3.2节定量筛选后初步建立一套人的全面发展评价指标体系。

指标体系的特点:一是经过理性筛选剔除了不具有可操作性的、无法反映科学发展观以人为本核心的非典型指标。二是通过定量筛选剔除了反映信息重复的、对评价结果影响小的评价指标。

指标体系的不足:在对指标进行定量筛选的过程中会删除那些对评价结果影响小但是能很好的反映科学发展观以人为本主题的评价指标。

解决思路:通过理性分析添加能反映科学发展观“以人为本”主题的而在定量筛选中删除的典型指标。

3.4 指标体系构建合理性的判定标准

根据因子分析用数据方差表示指标信息含量的思路, 建立指标体系构建合理性的判定标准。

设S为指标数据的协方差矩阵;trS为协方差矩阵的迹, 表示协方差矩阵的主对角线上各指标方差之和;s为筛选后的指标个数;h为海选指标的个数。则筛选后的指标对海选指标的信息贡献率In为[17]:

$Ι n = \frac{t r S_{s}}{t r S_{h}} (9)$

式 (9) 的含义是筛选后的s个指标的方差之和trSs占海选的h个指标的方差之和trSh的比值, 表示s个筛选后的指标所反映的h个海选指标的信息。

式 (9) 根据因子分析的思想给出了指标体系构建合理性的判定标准In, 解决了指标体系构建合理性的判定缺乏定量标准的问题。

本文认为:用较少指标反映90%以上的原始信息, 则可认为指标体系构建合理。

4 人的全面发展评价指标体系的构建

4.1 人的全面发展评价指标体系构建的基础

(1) 评价指标的海选及初筛

根据以人为本的科学发展核心, 以权威机构经典观点的高频指标[1,2,3,4,5,6,7,8,9,10]为重点, 结合文献[11,12,13,14,15]梳理等共海选160个评价指标, 通过3.1节中初筛后保留具有可观测性的92个指标, 建立了人的全面发展海选指标体系, 如表1第1、2、7列所示。

(2) 样本选取与数据来源

本文选用中国2001～2007年人的全面发展评价指标的时间序列数据, 原思数据除国民幸福指数外均来源于2002～2008年中国统计年鉴[18]。国民幸福止数通过式 (10) 计算得到。

(3) 国民幸福指数的计算

国民幸福指数是衡量人们对自身生存和社会发展状况的主观感受和体验的指标[19]。

在现有统计年鉴中没有统计这个数据, 本文用式 (10) 计算:

设GNH为国民幸福指数, S为收入的增长率, G为基尼系数, U为失业率, I为通货膨胀率, 则[19]

$G Ν Η = \frac{S}{G U Ι} (10)$

4.2 评价指标的定量筛选

(1) 指标数据的标准化

把4.1节中的92个评价指标数据代入式 (1) ～式 (3) 进行标准化处理。

(2) 聚类分析

将表1中的92个评价指标的标准化后的数据按准则层代入式 (4) ～式 (5) , 用离差平方和法分别对每个准则层内的指标进行R型分层聚类, SPSS软件自动完成聚类过程, 为了确定同一准则下指标的分类数, 需要对聚类后的类中指标进行K-W非参数检验, 如果每一类中指标的K-W非参数检验的显著性水平Sig都明显大于临界值0.05, 说明同一类中的指标没有显著差异, 各个准则层中指标的分类数目是合理的, 否则重新聚类。最终的聚类结果与非参数检验结果如表1第3、4、8、9列所示。

由表1第4、9列中K-W非参数检验的显著性水平Sig都明显大于临界值0.05证明各个准则现有的分类数是合理的。

(3) 变异系数分析

通过式 (6) ～式 (8) 计算指标的变异系数, 列入表1第5、10列, 并根据指标的变异系数大小决定是否保留指标, 保留的指标具体如表1第6列、第11列所示。

由表1看出:通过变异系数筛选法剔除变异系数小的61个指标后, 由原来的92个指标变成31个指标。

由于定量方法主要是依据数据的变动大小来进行删除指标的, 这就会导致将数据变化不明显的权威机构典型参考文献高频出现的指标也被删除。根据指标的权威机构典型参考文献的高频原则等原则需要再对指标体系进行完善。

4.3 指标体系的建立和完善

(1) 经济发展环境准则指标完善

①居民人均可支配收入的拆分

针对中国城乡二元结构, 城镇居民的可支配收入和农民人均纯收入的差距, 将居民人均可支配收入拆分为城镇居民的可支配收入和农民人均纯收入两个指标, 对城乡分别统计, 体现中国特色。

②人均财政收入指标的删除

财政收入指的是指政府为履行其职能、实施公共政策和提供公共物品与服务需要而抽泣的一切资金的总和。是衡量一国政府财力的重要指标, 政府在社会经济活动中提供公共物品和服务的范围和数量, 在很大程度上决定于财政收入的充裕状况。人均财政收入在反映以人为本的科学发展观核心方面不如城镇居民可支配收入和农民人均纯收入, 因此保留城镇居民可支配收入和农民人均纯收入的基础上删除人均财政收入指标。

(2) 社会发展环境准则指标完善

①最低生活保障线人口指标的删除

由指标社会保障覆盖率可以代替, 因此删除最低生活保障线人口指标。

②基尼系数的添加

基尼系数所反映的贫富差距是衡量社会发展环境的重要指标, 通过城镇、农村和国家的基尼系数分析, 城乡二元结构是导致我国收入分配严重不公, 且我国居民内部贫富差距还有可能继续拉大, 不利于实现人的全面发展, 因此添加基尼系数来衡量我国的社会发展环境。

(3) 人力资本环境准则的指标完善

①城镇登记失业率的添加

通过城镇登记失业率可以判断一定时期内劳动人口的就业情况, 透过城镇登记失业率反映就业局面。

②农村居民非农业就业比重的添加

针对中国城乡二元结构的特殊性和实现农村居民人的全面发展的初衷, 增加农村居民非农业就业比重。一是反映了以人为本的科学发展观, 二是体现了中国特色。

③国家财政拨款占财政支出比重的删除

国家财政拨款占财政支出比重跟人力资本环境没有直接的相关性, 删除该指标。

④公共图书馆数的删除

随着网络的普及和信息的飞速发展, 人们获得信息的途径变得更加多元化, 因此删除公共图书馆数。

(4) 人口素质准则的指标完善

①义务教育普及率的添加

义务教育是我国教育的基础, 对我国教育的发展具有奠基性的意义, 同时, 教育的发展对提高人口素质有巨大推动作用。设置义务教育普及率指标, 间接的反映了人口素质的高低。是人的全面发展评价不可缺少的指标。所以应该将义务教育普及率添加到评价指标体系中。

②高中升学率的删除

高等学校在校人数、平均受教育年限和义务教育普及率3个指标已经构成了对我国教育水平的较全面的评价, 因此删除高中升学率, 避免对同一方面评价的重复计算。

(5) 人的全面发展评价指标体系

根据4.1节 (1) 的评价指标的海选及初筛、 4.2节的定量筛选和本节 (1) ～ (4) 的指标体系的完善, 建立一套反映科学发展观以人为本要求的人的全面发展评价指标体系, 包括6个评价准则31个评价指标, 如表2所示。

4.4 指标体系构建合理性的判定

把筛选后的31个评价指标方差之和trSs和海选的92个评价指标的方差之和trSh代入式 (9) , 得到筛选后的指标对海选指标的信息贡献率为:

$Ι n = \frac{t r S_{s}}{t r S_{h}} = \frac{2.166 \times 10^{7}}{2.391 \times 10^{7}} = 90.6 %$

即从海选指标中筛选出33.7% (31/92=33.7%) 的指标反映了90%的原始信息, 证明建立的指标体系是合理的。

5 结论

本文以科学发展观以人为本为指导思想, 以国际权威机构经典观点的高频指标为基础, 通过定性分析和以聚类分析加变异系数相结合的定量分析筛选国民幸福指数、基尼系数等31个指标建立了反映“以人为本”的科学发展的核心的人的全面发展评价指标体系。通过人均GDP、基尼系数、社会保障覆盖率等指标反映“人与社会和谐”原则;通过人均安全水资源拥有量、三废达标率、人均绿地面积等指标反映“人与自然和谐”的原则;通过国民幸福指数、恩格尔系数、平均受教育年限等指标反映“人与人和谐”的原则。

本文以世界银行、联合国可持续发展委员会、亚洲发展银行、中科院、国家统计局等权威机构的典型观点的高频指标为基础, 结合科学发展观以人为本的核心筛选人均GDP、基尼系数、社会保障覆盖率等指标构建了一套包括生活质量、人口素质、经济发展环境等6个评价准则的人的全面发展评价指标体系。

本文通过聚类分析和变异系数分析相结合的定量筛选指标, 用33.7%的指标反映90%以上的指标信息建立简洁明快的评价体系。通过R型分层聚类将同一准则层内的指标分类, 保证了不同的评价准则代表不同的评价方面。通过变异系数分析筛选出各个类中变异系数 (鉴别力) 最大的指标, 既保证了筛选出的指标在所在类别中对评价结果影响最显著、又避免了同一类指标的信息重复。最后, 结合理性分析增加能够体现以人为本的核心的但在定量分析中没被选中的特色指标, 保证了人的全面发展评价指标体系的完整性。

摘要：根据“坚持以人为本, 树立全面、协调、可持续的发展观, 促进经济社会和人的全面发展”的科学发展观的内涵, 从经济发展环境、社会发展环境、生态环境、人力资本环境、生活质量和人口素质6个方面入手, 海选人的全面发展评价指标, 根据可观测性原则初步筛选指标, 通过R聚类和变异系数分析相结合的方法定量筛选指标, 构建了人的全面发展评价指标体系。本文的创新与特色一是以国际权威机构典型观点的高频指标为基础建立指标体系, 反映当代人类社会的智慧结晶。二是通过筛选国民幸福指数、基尼系数、社会保障覆盖率等指标反映以人为本的科学发展观的核心, 建立了反映科学发展观的指标体系。三是通过聚类分析和变异系数分析相结合的定量筛选指标, 用较少的指标反映90%以上的指标信息建立简洁明快的评价体系。

变异系数法篇6

沉积环境、成岩作用及构造作用等是影响储层岩性、物性、含油性及分布规律的主要因素, 使储层内部及空间分布上都存在各向异性。随着油气资源需求量的日益增大, 以提高采收率、挖掘剩余油为目标的储层非均质性研究逐步受到人们重视。

茨榆坨采油厂牛74块沙河街组二段储层以细砂岩、泥质粉砂岩、粉砂质泥岩等物性较差的岩性为主。平均孔隙度11.4%, 平均渗透率7.6m D, 属于低孔特低渗储层, 储层非均质性较强。

在开发过程中主力层系含水上升较快、层间矛盾突出, 开发效果较差。为提高油田采收率, 对油藏储层非均质性的定量研究是解决原油采收率的问题的重要内容。由于储层渗透率的各项异性对注水开发的波及系数影响很大, 因此将渗透率变异系数作为衡量储层层内非均质强弱程度最常用也是最重要的参数。

目前计算渗透率变异系数的方法主要有地质统计学方法, Dykstra H方法、洛伦兹曲线法这三种方法。本文结合茨榆坨牛74块实际资料, 发现牛74块储层渗透率分布类型复杂, 不呈对数正态分布, 使得只适用于对数正态分布的Dykstra H方法无法应用;应用地质统计学方法计算的变异系数可以从0~+∞即均质→极端非均质 (朱小影等, 2009) , 无法定量地建立储层非均质性程度的概念。本文试图对储层渗透率变异系数用洛伦兹曲线法作进一步探讨。

1 地质统计学方法

统计学的方法是单砂体渗透率的标准偏差与其平均值的比值 (于银华等, 2006;毛英雄等, 2005) 。

式中:Vk—单砂体渗透率变异系数;Ki—小层内单砂体样品的渗透率值;i=1、2、3…n;—小层内所有单砂体样品渗透率的加权平均值;n—小层内样品个数;S—总体样本标准偏差;hi—样本有效厚度。

它反映了样品偏离整体平均值的程度, 其变化范围Vk≥0, 该值越小, 说明样品的渗透率值越均匀;反之, 非均质性越强。当Vk=0时为均匀型, 是理想值。一般地, Vk<0.5, 非均质程度弱;Vk介于0.5~0.7之间, 非均质程度中等;Vk>0.7, 非均质程度强。

然而, 从计算结果中可以看出, 变异系数是可以大于1的, 如果数据分布更分散扁平, 而平均值不变的话, 标准差可无限增大, 造成变异系数的值可以从0~+∞ (图1) , 这样地质统计学方法对过于分散的数据就无法对储层非均质性进行定量评价 (蒋明煊, 1996) 。

2 洛伦兹曲线法

2.1 原理

基尼系数 (Gini coefficient) 最早是由20世纪初意大利经济学家基尼根据洛伦茨曲线提出的, 用于判断居民收入分配平等程度, 即衡量一个国家贫富差距的指标 (图2) 。设实际收入分配曲线和收入分配绝对平均曲线之间的面积为A, 实际收入分配曲线右下方的面积为B。基尼以A除以 (A+B) 的商表示不平等程度, 它的范围在0~1之间, 这个数值被称为基尼系数或称洛伦茨系数。如果A=0, 基尼系数为零, 表示收入分配完全平等;如果B=0, 则基尼系数为1, 收入分配绝对不平等。该系数可在零和1之间取任何值。收入分配越是趋向平等, 洛伦茨曲线的弧度越小, 基尼系数也越小, 反之, 收入分配越是趋向不平等, 洛伦茨曲线的弧度越大, 那么基尼系数也越大 (马光华等, 2013) 。

将衡量居民收入分配平等程度的方法应用于计算渗透率变异系数。其原理是, 以单砂体解释样品数百分比为横坐标, 以各样品渗透率百分比为纵坐标, 建立直角坐标系。在对角线上的每一点都满足Y=X, 即样品数比重等于样品渗透率比重, 这说明所有样品的渗透率相等。将折线ADC称为完全非均质线, 它表示全部渗透率都集中在一块岩样上, 其他的渗透率均为0。如图2, 弧线OP即为洛伦兹曲线 (陈刚等, 2009) 。当储层达到完全非均质时, 洛伦兹曲线就是折线OMP;当储层完全均质时, 即为直线OP。

2.2 计算公式

计算基尼系数的公式即推导很多, 实际应用本文采用的计算公式 (胡祖光, 2004) 是:

其中:Wi是单砂体解释的每个样品数占单砂体解释总样品数的比重;Yi是各样品渗透率占样品总渗透率之和的比重;Vi是从i=1到i的累计数, 即, Vi=Y1+Y2+Y3…+Yn。

计算基尼系数时先对数据按数值从低到高排序, 然后可以用每个样品数据进行计算, 也可把样品分组进行计算, 但分组计算时要注意分组的组距相等。用样品分组数据计算的基尼系数要明显小于用每个样品数据的计算值, 尤其是当组数不多时, 差距更大。用单个样品数据计算基尼系数时, 采用的计算指标不同, 会出现不同的结果。因此在用基尼系数进行不同地区、不同层位的非均质性比较时, 应注意计算方法的一致性, 不同计算方法得出的基尼系数没有可比性。

牛74块储层渗透率的分布较为复杂, 测井解释结果发现渗透率既不呈正态分布, 也不呈对数正态分布 (图3) 。这种情况下, 用地质统计学方法和Dykstra H方法不宜进行储层非均质评价, 而且渗透率测井解释数据量大, 逐一判断数据分布类型繁琐;所以洛伦兹曲线法是未来进行储层非均质评价的优选算法。

2.3 评价标准

基尼系数的分布范围在0~1之间。数值越低, 表明储层渗透率分布越均匀, 反之亦然。当G=0时, 储层完全均质;G=1时, 表明储层完全非均质。

根据联合国组织规定:G<0.2表示收入完全平均;0.2~0.3之间表示比较平均;0.3~0.4表示相对合理;0.4~0.5表示贫富差距较大;G>0.5表明贫富差距悬殊。

应用联合国评价贫富差距的标准, 结合储层非均质性的分级 (李健, 2006) , 可以把储层渗透率洛伦兹曲线法评价指标定为如表1所示的标准。

3 实际应用

根据牛74块测井解释成果, 选取不同砂体, 分别用地质统计学方法和洛伦兹曲线法计算沙二段17个小层各井的平均层内渗透率变异系数, 对比结果如表2。

根据数据可以发现, 牛74块储层非均质强, 渗透率分散, 使得地质统计学的统计结果均偏大, 渗透率变异系数普遍在1以上, 均属于强非均质性, 若按此结果划分储层非均质性很难定量的确定非均质程度概念。而洛伦兹曲线法计算的结果可以看出此方法的优点是计算的渗透率变异系数在0~1之间, 由图可以看出只有I-2、V-1、VII-3非均质性属于强非均质, 其它小层属于中等非均质, 计算结果有较强的可比性 (图4) , 而且适合任何类型的油藏。

4 结论

(1) 实际应用表明, 洛伦兹曲线算法适合本地区的储层非均质计算, 数值范围在0~1之间, 有较强的可比性, 可用于明确定量表示储层非均质性, 并可使用于任何类型油藏。

(2) 渗透率变异系数计算需根据数据分布特征选取适当方法。

(3) 地质统计学方法求取的渗透率变异系数在0~+∞范围内, 不利于建立储层非均质程度的概念。

(4) 茨榆坨牛74块沙二段储层17个小层中I-2、V-1、VII-3属于强非均质程度, 其它小层介于0.4~0.6之间, 属于中等非均质储层。

参考文献

[1]朱小影, 周红, 余训兵.渗透率变异系数的几种计算方法——以麻黄山西区块宁东油田2、3井区为例[J].海洋石油, 2009, 29 (2) :23-27.

[2]于银华, 喻高明, 李凌高.文13北油藏非均质性研究[J].内蒙古石油化工, 2006 (7) :73-76.

[3]毛英雄, 刘德华.赵凹区油藏非均质性研究[J].西部探矿工程, 2005 (11) :96-97.

[4]蒋明煊.确定渗透率变异系数方法的分析和讨论[J].石油钻井工艺, 1996, 18 (6) :89-90.

[5]马光华, 魏文懂, 钱凤燕.浅谈储层渗透率变异系数计算方法[J].地质找矿丛书, 2013, 28 (2) :256-258.

[6]陈刚, 王正, 陈清华.陈堡油田陈2断块阜宁组阜三段储层非均质性研究[J].油气地质与采收率, 2009, 16 (2) :21-22.