综合聚类

2024-10-26

综合聚类（精选9篇）

综合聚类篇1

学生综合素质的测评工作是高等学校教育、教学工作的重要一环, 既是对学生综合素质水平的评价, 也是对教育教学成果的检查。学生管理部门通过素质综合测评, 掌握学生在校期间德、智、体等方面的发展情况, 以便对学生实行相应的奖励、惩罚。同时, 学生的综合测评成绩也可作为用人单位选拔人才的依据[1]。

目前, 高校在评定学生在校期间的综合素质时, 常采用定量计算的评定方法, 将德育、智育、体育等各项素质全部量化, 然后加权计算得出每个学生的素质分, 并根据分值来评定学生综合素质的高低。这种考核评价方法将学生的综合素质绝对量化, 而没有定性的评价, 由于受主、客观因素的影响, 难免出现不同程度的失真偏差, 因而学生的综合素质水平难以得到准确评价。本文拟用系统聚类法对学生的综合素质进行评价, 以便实现客观、公正的评价。

一、高职学生综合素质的主要内容

高等学校的根本任务就是要培养德、智、体等全面发展、适应社会主义现代化建设需要的高素质人才。根据这一任务和要求, 将素质教育内容具体化、目标量化, 即把学生的综合素质分解为德、智、体等三个方面, 按百分制测算。

(一) 德育素质是学生综合素质的灵魂, 也是培养社会主义建设者和接班人的根本要求

根据党的教育方针以及《高等学校学生行为准则》、《普通高等学校学生管理规定》等规章制度, 从学生的政治表现、思想品德、学习态度、集体观念、遵纪守法和社会公德等方面对学生进行德育素质的测评, 主要采取“基本分加减法”, 即规定每位学生德育素质的基本分, 然后根据学生在上述几个方面的不同表现, 建立考核附加分指标体系, 如参加集体活动、志愿者活动都将进行不同分值的加分。

(二) 智育素质是学生综合素质的核心

高职教育的特点是着重培养学生的核心职业能力, 培养具有必要理论知识和较强实践能力的高等技术应用型专门人才。其教学环节包含两个方面:一是理论教学, 要求学生掌握“必需、够用”的理论知识;二是实践教学, 注重理论知识与实践操作的结合, 着重培养学生的动手操作能力。因此, 两个不同的教学环节培养不同的能力, 在智育素质测评时, 对理论课程、实践课程的成绩求均值, 分别作为智育素质的理论成绩与实践成绩。

(三) 体育素质是学生综合素质的基础

强健的体魄、健康的心理是学生搞好学习、干好工作的前提和保证。因此, 体育素质测评不仅包含体育课成绩, 而且还包含体育达标成绩和课外体育活动情况, 并对参加各级、各类体育竞赛获奖的学生给予相应加分。

二、系统聚类理论及方法

分类学是人们认识世界的基础科学, 而聚类分析是研究“物以类聚”的多指标统计分析方法, 主要用于对事物类别的面貌尚不清楚、甚至连总共几类都不能确定的情形下分类问题的研究。

进行聚类分析时, 事先不必知道分类对象的分类结构, 而是根据事物本身的数据特征, 按事物之间某种近似程度进行分类。其中, 系统聚类法应用最为广泛, 它是将类由多变到少的聚类分析法, 凡是具有数值特征的变量和样品都可以通过选择不同的距离和系统聚类方法而获得满意的数值分类效果。该法主要步骤如下[2,3]:

1.首先将N个样本各成一类, 共N类, 即每类只含一个样本;

2.计算N类两两之间的距离 (或相似系数) ;

3.将距离最近的两类并成一新类, 并计算新类与其他类的距离;

4.重复上一步骤, 直至全部样本归成一类;

5.并类时记下合并时的样本编号及并类时的水平 (距离或相似系数的值) , 并由此画成聚类谱系图 (树状图) ;

6.由聚类谱系图及实际问题的意义确定最终分类数及分类结果。

三、系统聚类分析实例

(一) 数据采集与处理

本文以2006级高职汽车电子技术专业学生为研究对象, 学生综合素质的测评数据采自一年级第二学期。现先对理论课程、实践课程的成绩求均值, 然后分别作为智育素质的理论成绩、实践成绩。将德育分考核汇总后作为德育素质成绩, 将体育与健康的成绩作为体育素质成绩。现选取12名学生的综合素质成绩, 汇总后见表1。

当系统中各因素的量纲不相同, 且各因素之间数值相差较大, 这样的数据很难直接进行比较, 通常需要对原始数据进行变换处理。由于综合素质各测评项目使用的数据数量级、量纲相同, 所以无须对原始数据进行变换。

(二) 类间距离与聚类方法的选择

聚类分析是直接比较样本中各指标 (或样本) 之间的“性质”, 将性质相近的归为一类、性质差别较大的归为不同类。衡量指标或样本间性质相近程度的统计量主要分为距离和相似系数两大类。距离一般用于对样本的分类, 其定义有很多, 如欧氏距离、绝对值距离、卡方距离、切比雪夫距离、马氏距离等。根据相关研究结果, 聚类分析时采用有较强的分辨能力的卡方距离[4]。

由于样本之间和类之间的距离有多种定义, 而这些不同距离定义又产生了不同的系统聚类法, 常用的方法有:最短距离法、最长距离法、中间距离法、可变法、重心法、类平均法、可变类平均法、间离差平方和法等。本文聚类分析时采用有较好综合特性的离差平方和法[5]。

(三) 结果讨论

聚类分析是根据变量的属性或特征的相似性、亲疏程度, 用数学的方法把它们逐步地分型划类, 最后得到一个能反映个体之间、群体之间亲疏关系的分类系统图。现运用DPS软件[6], 对表1综合素质数据进行系统聚类分析, 结果如图1所示。

1. 根据图1的聚类结果, 12位学生的综合素质可分成4个等级, 即Wu HY、Yao BY、QIAN YJ等属于优秀等级, Chen YX、Yu HP、Lu HD等属于良好等级, Sun JF、Yu YK、Tang ZW等属于中等等级, 而CHEN LB、Y JJ、Jin LW等属于较差等级。比较表1数据可知, 综合素质等级较高的学生, 其各项综合素质成绩相对也较高。

2. 聚类分析时, 如果个体之间的差异越小, 关系越密切, 则首先聚合成一小类;然后, 再与关系较疏远的个体, 即与成绩差异较大的个体聚合成一大类。以优秀等级为例, Yao BY、QIAN YJ两位学生的各项成绩相对较接近, 先聚合在一起, 再与Wu HY聚合。表明Wu HY的综合素质最优, 而Yao BY、QIAN YJ的综合素质相差不大。

3. 当综合素质的平均成绩相差较小时, 其各项成绩越接近, 则越能体现学生的全面、均匀发展, 在聚类图中的位置越靠前。在良好等级中, Chen YX的各项成绩较接近, 即综合素质的各个方面最均匀发展, 因而在聚类图中位置居于其他两位学生前面;而Yu HP的各项成绩相差较大, 即存在着较大的片面发展情况, 因而在聚类图中位置居后。因此, 应用系统聚类的方法来评价学生的综合素质, 可引导学生在各方面均衡发展。

在高等院校中, 学生的综合素质测评是学籍管理中一项重要而复杂的工作。如果采用绝对量化的评价体系, 使得个别学生为了获得较高的素质分而刻意参加一些活动, 导致仅凭素质分的高低就很难评价学生的综合素质水平。本文在记实量化的基础上, 应用系统聚类的方法对学生的综合素质实现科学、准确地评价, 使评价结果成为调节和引导学校教育、教师教学和学生发展的风向标, 促进校风、学风的建设。

在日常教学与管理中, 积极利用综合评价结果, 能调动学生积极、主动地学习及参加各项实践活动, 积极引导大学生形成正确的思想、规范行为, 促使大学生在德智体的全面、协调发展, 从而切实提高大学生的综合素质, 为社会和企业培养更多的高素质人才。

参考文献

[1]王景英.教育评价理论与实践[M].长春:东北师范大学出版社, 2002:239-261.

[2][5]高祖新, 尹勤.聚类分析及其在人口研究中的应用[J].南京人口管理干部学院学报, 1999, (4) .

[3]卢纹岱.SAS/PC统计分析软件实用技术[M].北京:国防工业出版社, 1996:179-283.

[4]徐振邦, 娄元仁.数学地质基础[M].北京:北京大学出版社, 1994:192-198.

[6]唐启义, 冯明光.实用统计分析及其DPS数据处理系统[M].北京:科学出版社, 2002:333-339.

综合聚类篇2

应用模糊聚类和主成分分析(PCA)对黄土高原丘陵沟壑区植物群落演替进行研究,以探讨该方法在植被演替研究中的.可行性.研究结果表明,利用模糊聚类分析和主成分分析,可以将13个样地客观地划分为5个群系.结合不同群系的恢复时间,即可判定随时间变化而呈现出的植物群落演替序列:猪毛蒿群落-赖草群落-长芒草群落-铁杆蒿群落-沙棘群落.该演替序列与传统的研究结果基本相同,说明利用模糊聚类分析和主成分分析方法研究植被演替是可行的.同时该方法数学上较为严格,且计算简单、运算量小,精度较高、可在计算机上运算,可大大提高植物群落演替研究的定量化水平,在植被演替中具有较好的应用价值.

作者：卜耀军温仲明焦峰焦菊英作者单位：卜耀军(西北农林科技大学资源环境学院)

温仲明,焦峰,焦菊英(中国科学院水利部水土保持研究所,陕西,杨陵,712100)

综合聚类篇3

关键词：公安院校,藏族,学生,体质,综合评价

1 概述

体质是指人体的质量, 是在遗传性和获得性的基础上表现出来的人体形态结构、生理机能、心理素质和适应能力的综合的、相对稳定的特征。[1]目前我国对于大学生体质评价的研究内容较为广泛, 主要围绕学生体质水平、机能水平、身体素质发展水平、体质与体力活动关系等方面进行。本研究主要以2000年国民体质成人监测指标和新《学生体质健康标准》[3]为研究依据, 结合公安院校的专业特色, 分别从身体形态、身体机能和身体素质对公安院校藏族学生的体质健康状况进行综合评定, 并建立公安院校藏族大学生体质综合评价模型, 为科学调整和加强公安院校藏族学生体质评价与身体训练提供科学理论依据服务。

2 研究对象与方法

2.1 研究设计:

整群抽样, 分类指标测试、建立数据库、统计分析

2.2 研究单位:

浙江警察学院警体部

2.3 研究对象:

本研究抽取来自西藏各个地区, 贯穿西藏东、西、南、北、中地域的11、10级公安方向专业的42名藏族男生, 年龄19～21岁。于2011年7～12月, 经测试对象同意, 以学生身体形态、身体机能、身体素质、专业素质这四个人体机体特征及运动能力为研究对象, 对相关指标进行测试。本测试研究无涉及伦理问题。设计、实施、评估者:实验设计、实施、评估为本文第一作者, 所有参与本实验的测试工作人员均经过统一岗位系统的培训, 整个过程由浙江省学生体质与健康调研组及浙江警察学院警务技战术研究所指导和验收。

2.4 研究方法:

依据2000年国民体质成人监测指标[1], 结合我院警察体育教学的专业特点, 设计了一套能满足对藏族学生体质进行评价的指标方案, 运用国家体质监测颁布的全套仪器和要求对学生的身体形态、机能进行测试, 运用Inbody520人体成分测试仪【韩国百斯公司生产, 批号:sn:P1801C5BE, 特点:任何时间皆可开始测试、八点接触电极、身体节段分析、多次回归分析、多频率检测、测试精确、整个检测过程只需1分半钟、简便、快捷、自动分析并打印报告、无创性、无限量储存、可连接电脑接口、实际测量值、不依靠经验估算、中文软件、可进行各类分析 (包括数据分析) 、提供参考意见】。对学生的身体成份进行测试。

主要观察指标:测试指标:a.身体形态指标:身高、体重、体脂肪、骨骼肌、蛋白质含量、无机盐。b.身体机能指标:安静脉搏、肺活量、血压。c.身体素质指标:100米、400米障碍、1000米、5000米、反应时、倒立、引体向上、立定跳远。派生指标:体重指数、肌肉体重比、体脂百分数、腰臀脂肪比、肺活量身高比、肺活量体重比、脉压差。统计学分析:由第一作者采用SPSS12.0软件包进行统计分析, 结果数据以表示。

3 结果与分析

3.1 身体形态典型指标的评价分析

3.1.1 建立身体形态评价模型

运用Inbody520人体成分测试仪以及依据藏族学生体质监测数据资料和身体形态计算模型, 计算其原始指标和派生指标见表1。

3.1.2 计算身体形态类系列指标中的典型指标

依据藏族学生身体形态系列指标, 运用Excel和体育科研数据统计处理系统软件包对其进行计算和进行R型聚类分析, 可以将该十项身体形态指标分为三类, 得到相关指数的平均数最大的三个典型指标, 分别为:身高x1、蛋白质含量x4、体脂肪x6, 这说明此3项典型指标可涵盖藏族学生身体形态类10项指标的信息量。因此可认为, 这3项指标可作为对藏族学生身体形态进行评价的典型指标。

3.2 建立身体机能评价模型

3.2.1 确立身体机能类系列指标

依据藏族学生体质监测数据资料和身体机能计算模型, 计算其原始指标和派生指标见表2。

3.2.2 计算典型指标

依据藏族学生身体机能类系列指标, 运用Excel和体育科研数据统计处理系统软件包对其进行计算和进行R型聚类分析, 分为两类, 得其典型指标分别为:收缩压X12和肺活量/身高X16。

3.3 对身体素质典型指标的分析

3.3.1 确立身体素质类系列指标

作为维护未来西藏地区安全繁荣的预备警官, 对他们身体素质的评价, 除了《国家学生体质健康标准》规定的测试项目外, 还需在警务实战能力方面体现公安执法战斗工作的要求, 因此, 从人才培养效果来看, 评价公安院校藏族学生的身体素质还应包括400米障碍, 5000米等警察体育项目。依据对藏族学生身体素质系列指标测试数据以及计算模型, 其测试指标见表3。

3.3.2 计算典型指标

依据藏族学生身体素质类系列指标, 运用Excel和体育科研数据统计处理系统软件包对其进行计算和进行R型聚类分析, 将其分为五类, 得其典型指标分别为:直接反应时、5000米、400米障碍、倒立、立定跳远。

3.4 计算体质的典型指标

依据藏族学生身体形态的3项典型指标、2项身体机能指标、5项身体素质指标, 确立其为体质评价的10项指标, 重新确定指标符号见表4。

为方便对学生进行评价, 我们采取综合评价的方法, 依据表4中10项指标, 运用体育科研数据统计处理系统软件包, 再次对其进行R型聚类分析, 计算典型指标。根据谱系图分析, 其指标可以分为6大类, 依据每类指标相关系数的平均值的最大值确定为典型指标的原则, 藏族学生体质的典型指标可以确立为X1身高、X2蛋白质含量、X5肺活量/身高、X6直接反应时、X8400米障碍和X9倒立。 (见图1)

3.5 体质综合评价模型

3.5.1 计算权重系数

依据体质评价的6项典型指标, 再次建立指标符号, 运用体育科研数据统计处理系统软件包, 计算其平均数、标准差和权重系数, 其结果如表5。依据表5中的权重系数分析可知, 影响藏族学生体质水平的典型指标权重值。

3.5.2 建立体质评价综合模型

依据表5中的Xi、Si、Ri值和体质评价的标准分模型, 可以得出藏族学生体质综合评价模型:

某单项典型体质指标得分

[负相关 (速度类) ]70

某单项典型体质指标得分

(正相关)

六项典型指标的得分乘以相应的权重系数之总和即为该生体质综合评价的总得分。

3.5.3 实例计算和评价

依据体质综合评价的6项典型指标和体质综合评价模型, 在Excel上对其进行计算, 得学生综合评价分值 (表6) 。

依据表6中藏族学生的体质综合评分分值和体质综合评分标准 (上等:77分以上;中上等72.9～76.9分为;中等:66.7～72.8;中下等:63.1～66.6;下等:63分以下) 来确定学生体质等级。其等级百分比分别为:上等7.14%, 中上等21.43%, 中等40.48%, 中下等26.19%, 下等4.76%, 其等级百分比呈正态分布, 因此可认为运用此评价方法建立的体质综合评分和等级评价较科学合理。

4 结论

综上, 本研究依据浙江警察学院藏族学生的身体形态、机能以及身体素质指标数据, 从R型聚类分析的典型指标分析, 影响藏族学生身体形态、身体机能、和身体素质的典型指标分别是身高、蛋白质含量、肺活量/身高、直接反应时、400米障碍和倒立。这些指标可作为对公安院校藏族学生体质进行单项指标评价和综合评价的主要因素。运用此评价结果的信息可以较为科学、客观的反映公安院校藏族学生的体质现状。

参考文献

[1]全国学生体质健康调研组.2000年全国学生体质健康状况调查研究工作手册[M].北京:北京出版社, 2000:1-56.

[2]2000年浙江省大学生体质监测研究报告课题组, 2000年浙江省大学生体质监测数据库.浙江省体育局, 2001.

[3]姜建华, 陈志强等.浙江省大学生体质健康评价方法与运动保健处方[M].杭州:浙江大学出版社, 2004:408-444.

[4]陈小华, 公安院校特警人才培养方法探究[J].新疆警官高等专科学校学报, 2006 (4) :50-53

[5]赵军等.公安学校西藏班学生体质综合评价研究[J].北京体育大学学报, 2003 (3) :208-210.

层次聚类读书笔记篇4

值得注意的是，层次聚类方法是不可逆的，也就是说，当通过凝聚式的方法将两组合并后，无法通过分裂式的办法再将其分离到之前的状态，反之亦然。另外，层次聚类过程中调查者必须决定聚类在什么时候停止，以得到某个数量的分类。最后，必须记住，在不必要的情况下应该小心使用层次聚类方法。最好用于有潜在层次结构的数据上。

凝聚式方法是层次聚类中被广泛使用的方法。过程中，会产生一系列的分划：最初的是n个单成员的类，最后的划分是一个包含全部个体的单个类。凝聚式聚类有很多方法，但基本的操作是相似的，在每一步中，将距离最近的类或者个体融合成一个类。方法之间的差异只是由不同的个体和组之间，或组与组之间的距离的计算方法而带来的。下面介绍一些常用的方法。

单连锁(single linkage)，又称最近邻(nearest neighbour)方法。这个方法使用数据的相似度矩阵或距离矩阵，定义类间距离为两类之间数据的最小距离。这个方法不考虑类结构。可能产生散乱的分类，特别是在大数据集的情况下。因为它可以产生chaining现象，当两类之间出现中间点的时候，这两类很有可能会被这个方法合成一类。单连锁也可以用于分裂式聚类，用来分开最近邻距离最远的两组。

全连锁(complete linkage)，又称最远邻(furthest neightbour)方法。同样从相似度矩阵或距离矩阵出发，但定义距离为两类之间数据的最大距离。同样不考虑到类的结构。倾向于找到一些紧凑的分类。

（组）平均连锁(group average linkage)，又称为 UPGMA(Unweighted Pair-Group Methodusing the Average approach)。跟前两个方法一样，从相似度矩阵或距离矩阵出发，但定义距离为类间数据两两距离的平均值。这个方法倾向于合并差异小的两个类。（距离）介于单连锁和全连锁之间。它考虑到了类的结构，产生的分类具有相对的鲁棒性。

质心连锁(centroid linkage)，又称为UPGMC(Unweighted Paire-Group Method using Centroid approach)。不同于前面的方法，它从距离矩阵和原始数据出发，一般定义距离为平方欧几里得距离（可以使用其他距离测度方法，但是可能会对缺少原始数据的阐释，比如“质心”的概念），此距离为个体与组的质心（所有成员的原始数据均值），或组与组的质心距离。（待补充）

中值连锁(median linkage)，又称为WPGMC(Weighted Pair-Group Method using Centroid approach。跟前面的UPGMC不同的是，在计算组的质心时，将合成该组的两部分（组组，个体和组？）按照相同的权重计算，也就是说算出的质心实际上是组成该组的两部分的质心的均值。（待补充）

Ward′s method，又称离差平方和法(error sum of squares criterion)。这个方法倾向于在每一步使组内的离差平方和的增量最小。所谓的离差平方和定义为

E=sum_{m=1}^{g} E_{m}

Where

综合聚类篇5

关键词：经济综合实力,灰色理论,灰色聚类

1 前言

江苏省作为东部沿海地区发达省份之一,2013年江苏省经济总量 ( GDP) 达到59161. 75亿元,在全国排名第二仅次于广东,全省人均GDP为74699. 37元,高于全国水平。但同时我们也看到,由于地理位置和资源配置问题不均衡的原因,江苏省南北地区经济发展差距越来越明显。一个地区未来发展的关键在于区域经济,区域经济强,则综合实力强,发展的空间和潜力才会越来越大。因此,客观、公平和科学地评价江苏省各市的经济综合实力,找出各市之间的差异成为迫切的问题。

2 地区综合实力与灰色聚类分析

2. 1 地区综合实力

改革开放以来,江苏省经济得到了长远发展。但是,江苏省各省市之间的经济发展仍然存在较大差距,地区经济综合实力反映了一个地区社会经济发展的整体水平,可以为各级领导进行科学管理和决策提供数量依据。

2. 2 灰色聚类分析

1982年,我国著名学者邓聚龙教授创立了灰色系统理论。灰色系统理论的研究对象是“部分信息未知”的“小样本”、“贫信息”不确定性系统。它通过对“部分”已知信息的生成、开发去了解、认识世界,实现对运行系统行为和演化规律的正确把握和描述。灰色聚类分析是建立在灰数白化基础上的一种方法,检测对象是否属于事先设定的不同类别,其主要步骤是:

( 1) 确定聚类对象因素集;

( 2) 给出聚类评判集;

( 3) 确定聚类白化数和分类标准;

( 4) 确定实际权数;

( 5) 计算聚类系数。

3 江苏省经济综合实力评价指标体系及数据搜集

3. 1 指标体系构建

为了数据搜集和实证分析的需要,依据科学性、合理性、可比性和可操作性的原则,并力求较完善地、全面地和真实地反映各市的经济综合实力。本文选取了反映江苏省各市地区经济综合实力的7项统计指标,构成指标体系,具体如下: 1地区国内生产总值X1( 亿元) ; 2工业总产值X2( 亿元) ; 3第三产业值X3( 亿元) ; 4公共财政预算收入X4( 亿元) ; 5固定资产投资X5( 亿元) ; 6对外贸易X6( 亿美元) ; 7社会消费品零售总额X7( 亿元) 。

根据江苏省各市社会经济的发展水平,将地区经济综合实力分为强、中等和弱这3个灰色类等级,并划分出相应的各区间段。

3. 2 样本选择及数据来源

江苏省位于我国东部,地居长江、淮河下游,北接山东省,南连上海市和浙江省,西邻安徽省,东滨黄海。在习惯上按地理位置和经济发展水平划分为苏南和苏北,其行政区域主要划分为13个省市。表1中给出了江苏省内13个省辖市2012年的7项主要经济指标数据。

数据来源: 《江苏省统计年鉴 2013》。

4 江苏省各市经济综合实力的灰色聚类分析

4. 1 确定聚类对象因素集

将表1中的13个省市作为灰色聚类对象,用i ( i =1,2,…,13 ) 来表示; 7个聚类评价指标用j ( j = 1,2,…,7) 来表示; 地区经济综合实力分为强、中等和弱这3个灰色类等级用k ( k = 1,2,3) 来表示。

因为参与聚类评价指标的量纲不同,不具有可比性,需要进行无量纲化处理,本文采用初值法的方法: 把各个评价指标无量纲化,用dij表示第i个地区对第j个评价指标的无量纲化数值。

4. 2 建立白化权函数

我们用白化权函数fkj( dij) 来描述第i个对象关于第j个指标所属的灰类等级,常用的白化权函数有三种类型,见下图。

( 1) 设聚类对象i关于评价指标j ( j = 1,2,…,8)的白化权函数分别:

f11[0. 41,1, -, - ],f21[0. 27,0. 43, -,0. 63],f31[-,-,0. 27,0. 43]

f12[0. 45,1, -, - ],f22[0. 27,0. 49, -,0. 72],f32[-,-,0. 27,0. 49]

f13[0. 31,0. 89,-,- ],f23[0. 2,0. 31,-,0. 47],f33[-,-,0. 2,0. 31]

f14[0. 31,0. 9,-,- ],f24[0. 29,0. 43,-,0. 57],f34[-,-,0. 29,0. 43]

f15[0. 33,0. 79,-,-],f25[0. 28,0. 43,-,0. 79],f35[-,-,0. 28,0. 43]

f16[0. 14,1,-,-],f26[0. 1,0. 21,-,0. 53],f36[-,- ,0. 1,0. 21]

f17[0. 31,0. 79,-,- ],f27[0. 2,0. 33,-,0. 55],f37[-,-,0. 25,0. 46]

( 2) 由以上可以求得各聚类对象对于各灰类的白化函数。例如,南京的白化函数:

同理,可以写出其他省市的白化函数,此处省略。由此把聚类评价指标的无量化的数值带入白化函数,可以求得各省市的每项聚类指标k子类的临界值λkj,得出结果见表2。

( 3) 确定实际权数

同理,得: σ21= 0 ,σ31= 0

同样的方法计算得到各个聚类对象i的聚类系数向量。

综合以上结果,可得各聚类对象i关于k灰类的聚类系数如表4所示。

( 4) 确定各市综合实力的等级

由 ,得各市所属灰类,如表5所示。

( 5) 评价结论分析

从灰色聚类评价结果来看,南京、无锡、苏州、南通和常州属于经济综合实力较强的市; 盐城、扬州、泰州和徐州属于经济综合实力中等的市; 连云港、淮安、宿迁和镇江属于经济综合实力较弱的市。

从聚类系数来看,南京、无锡和苏州的聚类系数在0. 7以上,是江苏省经济发展的第一梯队,而南通和常州只有0. 3,如果将经济综合实力进一步细分,南通和常州应该属于较强; 连云港、淮安、宿迁和镇江的聚类系数在0. 6以上,而镇江只有0. 3,如果将经济综合实力进一步细分,镇江应属于较弱。

从地区来看,江苏省从经济区域上划分为苏南、苏中和苏北,区域经济发展的梯度特征十分明显,南北差异较大。经济综合实力强的省市主要集中在苏南,综合实力中等和弱的城市主要集中在苏中和苏北。这和江苏省整体区域经济发展是吻合的,苏南是江苏最大的“优势板块”,也是最快的增长点。

5 结论

从上述分析结果可以看到,江苏省区域经济发展不平衡比较明显,其中以南京、无锡和苏州领头的苏南较强经济实体占据江苏省经济发展第一位,苏中适中,苏北较慢。这既是江苏省经济发展的制约和障碍,又是江苏省经济整合、协调发展的机遇。

综合聚类篇6

根据不同的分析主体和目的, 有多种财务分析方法可供采用, 例如从内容的综合程度上, 有杜邦分析方法、沃尔分析方法等。但是杜邦分析的缺陷是能够参与分析的指标较少, 损失较多, 综合性分析不够;沃尔分析的不足是不能进行企业之间财务状况的横向、综合比较。本文从投资者投资决策的角度, 提出基于两阶段聚类算法的上市公司综合财务分析方法。

一、二阶段聚类算法

聚类分析是研究事物分类的基本方法, 它从事物数量上的特征对事物进行分类。其优点是使用简便, 分类效果好。聚类分析的算法很多, 主要有二阶段聚类、中心聚类、层次聚类等。其中二阶段聚类的优点是其算法适合任何尺度的变量。该算法主要分为以下两个步骤:

第一, 确定聚类数。具体有有两种方法:一是根据数据特点, 按照一定的信息准则 (BIC或AIC) 进行迭代运算, 自动聚类 (BIC或AIC数值最小时对应的分类数最优) , 但需要指定最大分类数。二是研究者自己根据需要和经验指定所想要的分类数。

第二, 进行聚类结果描述。描述范围包括每一聚类的平均值、标准差等统计特征、参与聚类的变量对聚类结果的贡献程度、聚类变量数字特征的置信区间等。

二、实例分析

本文对张瑞龙 (2008) 在进行类似研究中提出的汽车配件板块7家上市公司2005年财务数据进行分析, 分别为:沪东重机、航天晨光、长春一东、耀玻璃、ST方向、轮胎橡胶、航天科技。同时选择流动比率、股东权益比、存货周转率、应收账款周转率、资产净利率、净资产收益率、净利率增长率等7个财务变量指标进行研究。

根据人们对于不同事物在相同属性差别的分辨判断能力和习惯, 一般采用3标度、5标度、9标度法进行度量。由于本文讨论的公司数量只有7个, 因此采用3标度法进行分类, 即将选取的7家公司计划分为3类。各变量指标距离间的度量采用欧氏距离进行度量, 利用SPSS3.0软件进行分析。表2是3类公司中每类包含的公司数量。可以看出, 分为第一类的公司数量最多, 占公司总数的42.9%。

各财务指标对于公司分类的影响程度是不一样的, 可以用统计学方法中的检验进行表示, 图1是第1类公司的财务指标对分类结果的影响程度。可以看出, 上市公司财务指标中净资产收益率对分类结果的影响在置信水平为95%的检验中是显著的, 其余财务指标在统计学意义上没有显著影响。第6个指标净资产收益率平均值95%的置信区间如图2所示。

通过对选取的汽车配件板块7家上市公司2005年的财务指标采用二阶段聚类算法进行分析, 发现在7家公司分为3类的情况下, 选用的7个财务指标中, 第6个指标净资产收益率对分类结果的影响是显著的, 其余财务指标在统计学意义上没有显著影响, 该结论可以为投资者提供决策帮助和参考。

参考文献

[1]马建锋:《企业财务分析方法评价》, 《焦作工学院学报 (社会科学) 》2003年第4期。

[2]李华金:《试论我国上市公司的财务分析方法》, 《甘肃农业》2004年第9期。

[3]宇传华:《SPSS与统计分析》, 电子工业出版社2007年版。

综合聚类篇7

本文选取汽车配件板块部分上市公司2005年年报的数据, 计算相应的财务指标, 利用模糊聚类方法进行分析, 具体运算过程通过Excel实现。

一、模糊聚类的步骤

1. 数据规格化

由于各个指标的量纲和数量级不同, 直接利用原始数据参与计算, 可能会突出某些数量级特别大的指标对分类的作用, 降低甚至排斥某些数量级较小的指标的作用, 导致一个指标只要改变一下单位, 就会改变分类结果, 所以, 必须对原始数据进行无量纲化处理。数据标准化的方法很多, 如标准差规格化法、极差规格化法、对数规格化法等。

(1) 标准差规格化法

设xi= (x1i, x2i, …, xpi) T, (i=1, …, n) 是具有p个变量的n个样品, 现对第k个变量进行标准化, 就是将数据xki变成x'ki, 即:

其中, 为第k个变量的平均值, sk为第k个变量的标准差。

(2) 极差规格化法

将数据xki变成x'ki,

其中, k=1, …, p;i=1, …, n

(3) 对数规格化法

将数据xki变成x'ki,

其中, k=1, …, p;i=1, …, n

2. 计算对象间相似关系的模糊矩阵R

为了定量地进行分类, 必须计算一些分类指标, 即计算样品之间的相似程度的数量指标, 称为聚类统计量。聚类统计量可分为两大类:相似度和距离。

(1) 相似度

(1) 夹角余弦

记向量 (xi1, …, xim) 与向量 (xj1, …, xjm) 之间的夹角为α, 则有

(2) 相关系数

(3) 指数相似系数

(2) 距离

(1) 欧氏距离

(2) 绝对距离

(3) 闵科夫斯基距离

3. 建立模糊等价矩阵t (R)

在模糊矩阵R的基础上, 可以求解模糊等价矩阵t (R) 。当模糊矩阵满足自反性、对称性、传递性时称为模糊等价矩阵, 即:

(1) 自反性:rii=1

(2) 对称性:rij=rji

(3) 传递性:R2≤R

从一个模糊矩阵出发, 可以构造一个模糊等价矩阵, 具体方法可以采用平方法:

经过有限次运算后, 一定有 , 可以得到一个模糊等价矩阵。

4. 聚类

给定一个聚类水平λ, λ∈[0, 1], 计算模糊等价矩阵的截矩阵。给定任意λ∈[0, 1], 若rij≥λ, 则样本xi和xj属于同一类, 随着λ从1降到0, 所确定的分类随之由细到粗变化, 这样就可以得到较为合理的分类关系。

5. 调整截矩阵

将列相同的行排在一起, 可以构成分类块。

二、模糊聚类综合财务分析

1. 样本选取及数据标准化处理

本文选取汽车配件板块部分公司2005年财务数据进行分析, 具体选取的有沪东重机、航天晨光、长春一东、富耀玻璃、ST方向、轮胎橡胶、航天科技等7家公司, 表1中公司顺序号按以上顺序排列, 以后各表相同。同时选择流动比率、股东权益比、存货周转率、应收账款周转率、资产净利率、净资产收益率、净利率增长率等7个指标参与运算。

数据规格化方法采用标准差规格化法, 7个指标的均值及标准差用AVERAGE () 和STDEV () 函数求得, 结果见表2。

利用表2中的均值与标准差, 按标准差规格化法对各样本数据进行规格化处理, 结果见表3。

2. 建立模糊矩阵R

利用公式: , c为可使0≤rij≤1的一个常数, 求得模糊矩阵R。其中c取矩阵D中的最大值, 在单元格A37中定义公式:=1-A26/MAX ($A$26:$G$32) , 应用数据填充可建立模糊矩阵R (见表5) 。

3. 建立模糊等价矩阵t (R)

R2的求解过程如下:A47==MAX (MIN ($A37, A$37) , MIN ($B37, A$38) , MIN ($C37, A$39) , MIN ($D37, A$40) , MIN ($E37, A$41) , MIN ($F37, A$42) , MIN ($G37, A$43) ) , 应用数据填充, 求得R2 (见表6) 。

重复执行, 直到出现 , 当k=2时, R4=R8, 可以得到一个模糊等价矩阵t (R) =R4 (见表7) 。

取λ=0.5, 当模糊等价矩阵中rij≥0.5时, 取1, 否则取0, 利用IF () 函数, 求得模糊等价矩阵的截矩阵, 经整理后的模糊等价矩阵的截矩阵见表8。

三、聚类结果分析

公司1、2、4、6 (沪东重机、航天晨光、富耀玻璃、轮胎橡胶) 偿债能力中等、营运能力较强、盈利能力较好, 聚为一类;公司3、7 (长春一东、航天科技) 偿债能力较强、营运能力中等、盈利能力较弱, 聚为一类;公司5 (ST方向) 各方面指标均较弱, 聚为一类。

通过运用模糊聚类分析方法, 结合上市公司的财务指标进行聚类分析, 揭示一个行业中不同企业的财务状况与经营成果, 可以指导投资决策。

参考文献

[1]秦寿康等.综合评价原理与应用[M].北京:电子工业出版社, 2003.

[2]杨春, 邓红.基于模糊聚类分析的多目标决策方法[J].西安财经学院学报, 2005, 18 (4) :31-34.

综合聚类篇8

河南“居天下之中”, 是国家南北、东西交通大动脉的枢纽要冲, 亚欧大陆桥和进出西北六省的门户。河南是中国重要经济大省, 改革开放以来河南省经济发展较快, 在全国各省市、自治区中位居第5位。近年来河南省经济发展取得了快速增长, 但一个不可回避的问题就是区域经济发展的差异显著加大。区域经济社会发展水平综合评价对支持河南省加快发展有至关重要的作用。本文以河南省18个地市为研究对象, 结合《河南省统计年鉴2013》的相关数据, 运用聚类分析法, 对河南省区域经济社会发展水平进行综合评价, 力求为河南政府相关部门决策提供参鉴建议。

1 河南省区域经济社会发展水平综合评价聚类分析

1.1 聚类指标的选取

1.1.1 指标选取原则

在指标选取原则上, 目前国际公认的是多指标体系, 主要考虑到以下几个方面的因素: (1) 指标体系的综合性。指标体系不应片面性, 而应具有综合性。指标体系要求能反映各地区的经济发展水平, 还要能反映各地区的经济发展潜力。 (2) 指标的代表性。能够反映一个地区经济发展状况的指标有很多, 即所选的指标不仅要有明确的社会和经济意义, 还要能代表这个地区经济发展水平的某一个方面。 (3) 指标的可比性。各区域间存在着空间大小的差异和人口数量多少等方面的差异, 所以在研究区域间发展水平时, 所采用的指标要求能够进行相互间的比较。 (4) 指标的可得性。在选取指标时, 应该选取那些我们比较容易获得的指标, 有些不易获得但是对评价区域经济发展水平有重要作用的指标, 可以找其他相似且容易获得数值的指标来代替。 (5) 指标体系的简洁性。由于聚类的样本数较多, 所以在指标选取上应尽量精炼实用。

1.1.2 指标的意义

基于以上相关原则, 在参考相关文献的基础上, 结合2011年河南省统计年鉴相关数据及河南省的经济发展现状, 制定以下四个方面能够反映经济综合实力的评价指标: (1) 经济发展方面:实际利用外资额 (X2) (万美元) , 说明地区本年实际利用外资总额的情况, 反映出地区在吸引外资方面有多大的优势;城镇固定资产投资 (X6) (亿元) , 用其反映地区固定资产投资规模和使用方向。 (2) 产业结构方面:第三产业增加值 (X9) (亿元) , 比较过去的第三产业生产总值, 能反映地区的第三产业的发展情况;第三产业占GDP比重 (X7) (%) , 通过了解第三产业在三大产业中所占的比例, 我们可以知道地区第三产业的发展状况, 用其反映地区服务业和城镇化水平;第二产业占GDP比重 (X8) (%) , 通过了解第二产业在三大产业中所占的比例, 我们可以知道地区第二产业的发展状况, 用其能够反映地区的工业化水平。 (3) 人民生活方面:人均GDP (X1) (元) , 可以表示地区人均GDP的大小, 用其反映地区的综合经济实力;在岗职工平均工资 (X3) (元) , 通过对各地区在岗职工平均工资的比较, 可以反映出地区职工的工资水平状况;农村居民人均纯收入 (X5) (元) , 用其反映各地区农村居民的生活水平状况。 (4) 社会发展方面:每万人拥有医院床位数 (X4) (张) , 通过了解每万人拥有的医院床位数, 能够反映出该地区在医疗服务设施方面的发展状况;城镇社区服务设施个数 (X10) , 城镇社区服务设施的个数, 反映出地区在社区基础设施建设方面的状况。

1.2 数据处理及分析过程

1) 聚类分析思想。聚类分析 (cluster analysis) 是一组将研究对象分为相对同质的群组 (clusters) 的统计分析技术。聚类分析是根据研究对象的特征按照一定标准对研究对象进行分类的一种分析方法, 它使组内的数据对象具有最高的相似度, 而组间具有较大的差异性。聚类与分类的不同在于, 聚类所要求划分的类是未知的。聚类分析的目标就是在相似的基础上收集数据来分类。聚类源于很多领域, 包括数学、计算机科学、统计学、生物学和经济学。这些技术方法被用作描述数据, 衡量不同数据源间的相似性, 以及把数据源分类到不同的簇中。聚类分析是根据对象的特征, 按照一定的标准对研究对象进行分类, 由于研究对象和分析方法的不同, 聚类分析也分为不同的种类。

按照研究对象的不同, 聚类分析一般分为样本聚类和变量聚类: (1) 样本聚类:它针对观测量进行分类, 将特征相近的观测量分为一类, 特征差异较大的观测量分在不同的类。 (2) 变量聚类:它是针对变量分类, 将变量性质相近的变量分为一类, 将变量性质差异较大的变量分在不同的类。

按照分析方法的不同, 聚类分析一般分为快速聚类、分层聚类和两阶段聚类: (1) 快速聚类:它将数据看成K维空间上的点, 以距离为标准进行聚类分析, 将样本分为指定的K类。 (2) 分层聚类:其对相近程度最高的两类进行合并组成一个新类, 并不断重复此过程, 直到所有的个体都归为一类。 (3) 两阶段聚类:两阶段聚类分析首先以距离为依据形成相应的聚类特征树结点构造聚类特征树, 然后通过信息准则确定最优分组个数对各个结点进行分组。

2) 聚类分析过程。本文采用SPSS17.0统计分析软件, 对2012年河南省18个地市的各指标数据进行K-均值聚类分析。利用SPSS软件对原始数据进行处理, 得到结果如下 (见表1) 。

通过聚类分析可以看出, 所有的观测对象被分成四类和每个聚类中心的案例数:第一类城市有1个, 第二类城市有9个, 第三类城市有1个, 第四类城市有7个。通过表1还能看到这四类城市之间的距离差距。

1.3 结论

通过聚类分析的结果可看出, 18个地市被分成了四类, 每一类所包含的地市都具有相同或类似的经济特征。上述的相关分析, 我们可以得到河南省区域经济社会发展水平的不平衡, 各地市经济综合实力可分为四类, 第一类城市郑州市经济综合实力最强;第三类城市洛阳市经济综合实力仅次于郑州;第四类城市经济综合实力较弱;第二类城市经济综合实力最弱。事实上, 各类地区在吸引和利用外资、产业结构、人民生活水平和社会发展上都存在着巨大的差距。各地市聚类见表2。

第一类城市郑州是河南省的省会城市, 是河南省政治、经济、教育、科研、文化中心。国家级战略“中原经济区”的中心城市和国家重要的综合交通枢纽, 是河南省经济发展的领头羊。

第三类城市洛阳是国务院首批历史文化名城。新兴的重工业城市和新能源节约型城市。近年来洛阳在经济发展上同时从“工业城市”和“旅游城市”两条路出发, 在发展工业的同时也重视旅游资源的开发, 大力发展旅游经济。

第四类城市:鹤壁市、新乡市、焦作市、许昌市、漯河市、三门峡市、济源市, 近年来经济发展迅速, 工业发展较快, 第二产业在三大产业中的比重大, 第三产业的发展形势也比较好, 人均GDP较以前有显著的提升。各地市在经济发展上有着各自的发展优势。

第二类城市:开封市、平顶山市、安阳市、濮阳市、南阳市、商丘市、信阳市、周口市、驻马店市, 为欠发达地区, 矿产资源贫乏、能源不足, 经济基础薄弱, 人口多, 农业人口占了很大的比例, 工业化和城镇化水平较低, 近年来二、三产业的比重有所提高, 但仍低于其他类地区, 第一产业的比重偏高, 产业结构不合理, 各类经济指标比其他各类城市相对较低。受地形等自然条件的制约以及历史原因, 这些地区经济发展水平低, 远远落后于其他各类地区。以上等原因使得第二类地区与其他各类地区之间的差距越来越大。

2 河南省各区域经济社会发展存在的问题

改革开放时, 邓小平提出了共同富裕的长远远景。这一政策在改革开放初期对于打破中国经济发展的桎梏, 推动了经济的迅速发展。但是现在的问题是, 这一政策没有得到完整落实。先富起来的人并没有去带动其他人实现共同富裕, 拉大了相互之间的贫富差距。在区域经济上也是一样的道理, 如果那些经济率先发展的地区不带动落后地区的经济发展, 那么区域经济间的差异也将变的越来越大。

通过以上的分析, 我们可以了解到在河南省区域经济发展上存在着如下一些问题:

1) 由表1及表2的分析结果得知河南省区域经济的发展存在着严重的不平衡。自改革开放以来, 河南省在经济发展上采取了不平衡发展的战略, 优先发展一些区位优势明显的地区, 加大了与在经济发展上并不具有优势地区的差距, 导致了区域经济间的不平衡发展。

2) 由各地实际利用外资额的不同, 可以得知各类地区在吸引和利用外资上有很大的差距, 使经济的发展差距加大。各地区政府在招商引资上采取的政策有着较大的差异, 各地区对外优惠举措不一致, 使得在吸引外资, 发展本地产业经济上产生了巨大的差距。

3) 由二、三产业所占比重和第三产业增加值的差异我们可得知各类地区在产业结构上的比例不协调, 三大产业间的生产产值差距过大。国家和省政府在那些具有能源和资源优势的地区大力发展传统工业, 形成了传统工业区和一些重工业城市, 而能源和资源匮乏的地区, 在工业发展上远远落后。由于历史原因, 河南历来是一个人口大省, 农业在产业结构上占较大的比重, 使得各地区在经济发展上有较大的差距, 三大产业生产产值间的差距也不断拉大。

4) 由表2分析可得出各地区经济发展水平不均衡, 贫富差距大且贫困人口所占比重较大。受不平衡发展战略的影响, 优先发展的地区计划经济向市场经济过渡的时间较早, 基础设施建设较完善, 人民生活水平也显著提高, 从而加大了与其他地区间的发展差异。

3 促进河南省经济社会平衡发展的政策理念

区域经济发展的严重不平衡, 已成为河南省全面建设小康社会和可持续发展中的首要难题。改革开放30多年来, 随着全国各地经济的快速发展, 河南面临的竞争压力也越来越大, 其突出的问题是地区间的差距过大。区域差异的扩大会严重制约全省经济发展整体水平的进一步提高, 当前最迫切需要解决的问题是缩小区域经济间的差异, 实现各区域间协调和共同发展。对此本文提出了如下建议, 为河南政府相关部门决策提供参鉴建议:

1) 充分发挥第一类城市的龙头带动作用, 逐步缩小地区差异。郑州作为省会城市要起到带动全省的作用, 辐射带动省内各地区经济的发展。郑州在技术、管理、经验、科技以及资金等方面有着巨大的优势, 而经济相对落后的其他地区劳动力成本低, 在资源成本上存在着优势, 因此他们之间可以实现互补多赢, 从而逐步缩小区域间的差距。

2) 经济相对落后的第二类和第四类城市要充分利用时机, 积极利用自身的优势, 吸引外资。这些经济落后地区劳动力成本低, 土地租金低, 地区政府要做好招商引资工作, 在招商引资方面出台一些免税政策等, 把外边的外资、三资企业、民营经济、民营企业引进来。充分发挥利用外资的优势, 大力发展本地区经济。当前中原经济区建设如火如荼, 这些地区要充分把握住机会, 加快本地区经济建设, 提高地区人民生活水平, 努力缩小区域经济间的差异。

3) 加快产业结构调整步伐, 优化产业结构。河南省各类地市间的产业结构存在严重的不平衡, 导致各地市三大产业间生产总值的巨大差异。政府要加大对落后地区的农业科技投入, 大力发展农业产业化、市场化和农副产品加工, 加速推动城镇化和农村劳动力的转移。各地区还要充分利用本地区优势, 加快工业发展。大力发展服务业, 增加就业机会, 合理配置农村剩余劳动力, 加大第三产业生产产值。从而优化产业结构, 缩小区域间的差异。

4) 充分发挥政府作用, 向经济落后地区适度的政策倾斜。从1978年改革开放以来, 沿海城市的开放、经济特区的建立, 都是政策在起着决定性的作用。为缩小区域间发展不平衡的现状, 在维持经济快速增长的同时, 河南省政府应加大对本省欠发达地区的政策支持, 如:加大资金支持, 加大对相对落后地区教育的投资力度, 加快对经济落后地区的开发和开放, 引导其走上招商引资、发展本地区特色产业的道路。在广大农村地区要严格保护农民的耕地同时大力发展乡镇企业, 增加广大农村居民的收入渠道, 减少贫困人口数目, 缩小当前巨大的贫富差距, 从而缩小各地区间的发展差异。

参考文献

[1]陈爱娟, 王小翠.陕西省县域经济发展水平聚类分析[J].学术纵横, 2009 (2) :104-105.

[2]彭红毅, 刘宗霖.广东省各县市区域经济发展水平的聚类分析[J].应用技术, 2009 (2) :48-49.

[3]崔国印.聚类方法在江苏省区域经济分析中的应用[J].科技情报开发与经济, 2011 (9) :157-161.

[4]杨竹莘.区域经济差异理论的发展与演变评析[J].工业技术经济, 2009 (8) :63-68.

[5]田晓佳.基于因子聚类分析的河南省区域农产品物流能力评价[J].物流技术, 2014 (1) :264-266.

[6]王攀娜.我国农村居民消费支出地区差异实证研究——关于聚类分析和因子分析的应用[J].商业时代, 2013 (36) :48-50.

[7]王颂吉, 白永秀, 宋丽婷.县域城乡发展一体化水平评价——以陕西83个县 (市) 为样本[J].当代经济科学, 2014 (1) :116-123.

[8]吴小节, 谌跃龙, 汪秀琼, 等.中国31个省级行政区资源节约型社会发展状况综合评价与空间分异[J].科学决策, 2014 (3) :30-43.

综合聚类篇9

文章根据相关文献资料, 结合河南省内实际, 充分考虑到经济数据的复杂性和多样性, 一共选取了8个指标系统地描述了河南各市经济发展的现状, 分别是:职工平均工资X1 (元) 、固定投资金额X2 (万美元) 、财政一般预算收入X3 (万元) 、工业总产值X4 (万元) 、社会消费品零售总额X5 (万元) 、第三产业增加值X6 (万元) 、第一产业增加值X7 (万元) 、公路通车里程X8 (公里) , 利用这8个指标建立评价模型 (具体数据来源于《河南统计年鉴2011》) 。

二、因子分析

在对经济进行分析时, 选择的数据虽然包括了必要的内容, 但由于该种数据的特殊性, 也使分析难度增加。举例子说, 数据在某些情况下显示的信息可能是相同的, 这时需要避免相关性。有一个方法可以解决这种情况, 并且缺失的信息可能很少, 这就是因子分析。原理是把变量减少, 但是信息量不减少, 集中为几个重要的因子, 也就不影响下一阶段的分析了。对8个变量用SPSS软件检测, 结果显示它们之间具有高度相关性, 这就为因子分析提供基础。下一步将得到总方差能力解释表, 以及相关系数矩阵的全部特征值、方差贡献率、累计方差贡献率、未经旋转提取因子的载荷平方和等信息。其中两个最大的特征值分别为5.169和2.162, 且累计贡献率已达91.64 3%, 故提取两个公共因子F1、F2。

因子的协方差阵显示, 所得的两个公因子线性无关, 达到了因子分析的目的, 那么下一步得到旋转后的空间成分图 (见图1) 可以发现:

第一个公因子F1的方差贡献率最大, 为64.006%, 并且在“财政一般预算收入”、“第三产业增加值”、“工业总产值”、“固定投资金额”、“社会消费品零售总额”和“职工工资”上载荷较大, 而且该因子主要反映城市财政收入水平。第二个公因子F2的方差贡献率为27.638%, 且在“第一产业增加值”、“公路线路里程”上载荷较大, 反映了第一产业水平。根据因子得分系数矩阵, 我们可以将三个公共因子表示成原始变量的线性组合。

由此可以得到两个公因子的得分, 将两个因子对应的方差贡献率作为两个因子的权重系数, 然后对各市的两个因子加权求和, 可以得到最后所需的经济发展综合评价得分值=0.641F1+0.276F2, 经过简单计算可以得到河南18地市经济发展评价的综合得分及排序 (见表1) :

从2010年数据, 各市综合实力排序来看, 郑州作为河南省会城市, 在选取的8个指标中, 每个指标值都最大, 因子得分排序也印证了这点。济源、鹤壁和漯河位于排名后三位, 无独有偶, 这三个市的地理面积排名与其综合实力排名一致, 或许正是其不能突破面积限制, 综合实力排名落后。另外一个值得关注的是许昌与濮阳, 二者地理面积与人口相当, 但是综合排名相差四位, 这是什么原因导致濮阳落后的, 本文接下去分析。

三、聚类分析

为使分析结果更全面, 可对原始数据标准化后再进行系统聚类, 以辅助分析。使用SPSS进行聚类分析, 在聚类过程中采用类间平均连接法, 得到的聚类垂直冰状图 (见图2) :

结果显示:郑州、洛阳、平顶山、焦作聚为一类;开封、安阳、鹤壁、新乡、三门峡、濮阳、许昌、漯河、济源聚为一类;商丘、信阳、周口、驻马店聚为一类;南阳单独为一类。

南阳的财政一般预算收入为69.07亿元, 第一产业增加值为401.18亿元, 而公因子F1 (代表财政一般预算收入) 为0.29146, 公因子F2 (代表第一产业增加值) 为2.37551, 但是在综合实力中排名第二。而排名第一的郑州财政一般预算收入为386.8亿元, 第一产业增加值为124.56亿元, 而公因子F1 (代表财政一般预算收入) 为3.49151, 公因子F2 (代表第一产业增加值) 为-0.46761。因此虽然排名接近, 但是并不能聚为一类。

四、对各市经济发展建议

1. 充分发挥地区优势。

聚类分析结果将各市分为四组, 也区分了每组的发展特征。特色和优势是一个地区或企业加快发展的根本, 河南各市的特色很多, 如洛阳是十五朝古都, 开封是七朝都会, 此外菊城、信阳的毛尖, 驻马店的麦草画等等。

2. 按产品调整产业结构。

各市州今后在调整产业结构过程中, 应从以行业调整为主转变为以产品调整为主, 特别是一些有潜力的市州。哪种产品质量高、效益好、有市场前景, 就发展哪种产品, 对拥有这些产品的企业进行重点扶持, 以优化企业组织结构和产品结构, 增强其竞争优势。

3. 重视农村社会经济发展。

河南是一个农业大省, 须大力推动城乡协调发展, 加大对农业、农村、农民的扶持力度, 开放城乡资源和市场, 促进城乡产业链的形成, 加大治理污染和环境破坏的力度, 积极培育农民增收的产业。

摘要：作为国家战略中第四大经济区——中原经济区的主要省份, 河南省地处中原腹地, 是中国经济大省、工业大省、食品工业大省、国家战略综合交通枢纽。虽然河南整体的资源能源十分丰厚, 但是河南18地市因其优势不同, 综合经济实力相距甚远。因此, 对18地市的综合实力进行评价, 明确地区发展的程度和面临的问题, 在当前具有很重要的意义。通过SPSS因子和聚类分析方法, 为18地市进行综合实力评价和分类, 并提出相关建议。

关键词：河南省,综合实力评价,因子,聚类分析

参考文献

[1]贺彦淇.云南各市州的经济状况评价——基于因子分析方法[J].经济研究导刊, 2012, (11) :32-81.

[2]黄智俊, 王克强.用因子和聚类分析方法评价全国农业节水灌溉绩效[J].水资源研究, 2006, (3) :46-49.

【综合聚类】推荐阅读：

因子分析和聚类分析在长江水污染综合评价中的应用10-15

小学三年级综合实践教学计划-小学综合实践计划09-01

综合降尘07-14