数据协调(精选6篇)
数据协调 篇1
1 引言
随着信息化浪潮席卷全球, 云概念如火如荼, 中国的数据中心建设也在迅猛发展, 数据中心等级日益提高 (Tier-3/Tier-4或A级机房, 已成为常见的数据中心等级标准) , 机电设计方案不断更新 (电气的2N系统架构、气体灭火系统、水喷雾系统、水/冷媒系统精密空调、灾后清空系统等新技术已普遍应用) , 公共走廊里的设备呈几何级的增长, 在项目的各个设计阶段 (方案设计/初步设计/施工图设计) 需对公共通道内的设备做出合理布置, 如果轻视该项工作会造成建筑布置及结构形式的重大调整、机电设计返工、现场施工困难及工期拖延、运行维护困难等一系列不良后果, 本文结合多个项目的设计经验, 对机电综合图设计提出了一定的解决思路, 供大家借鉴。
2 名词解释
(1) 数据中心等级
数据中心的等级划分决定了基础设施的运行能力, 根据标准来源不同分为:
Tier I~IV等级:根据国际Uptime协会及美国国家标准TIA 942“数据中心用远程通信基础设施标准”规定的数据中心分级标准。
A/B/C级机房:根据国家《电子信息系统机房设计规范》 (GB 50174-2008) 规定的数据中心分级标准。
(2) 公共设备通道
建筑工程中供机电设备进行布置的公共空间, 主要包括设备走廊、设备夹层、主要室内管沟、公共管道竖井、公共降板区域、架空地板等区域。
(3) 空间协调图
根据公共设备通道的典型建筑断面, 汇总了电气/弱电/暖通/给排水各专业的设备布置及相对尺寸的综合图纸, 一般由建筑专业汇总出图。该图纸主要用来解决管道设备交叉问题, 实现指导施工、控制净高、控制造价、提高质量、美化空间效果、利于维修等功能。
(4) BIM
建筑信息模型 (Building Information Modeling) 是以建筑工程项目的各项相关信息数据作为模型的基础, 进行建筑模型的建立。
3 各设计阶段的空间协调图要求
(1) 方案设计阶段
◆预估公共设备通道内的主要设备种类/数量/规格;
◆初步确定公共设备通道的尺寸:宽/高/梁高/吊顶高度等;
◆设计包括主要设备的机电综合图:主要桥架/主要风管/主要水管等。
(2) 初步设计阶段
◆进一步细化公共设备通道内的主要设备种类/数量/规格;
◆基本确定公共设备通道的尺寸:宽/高/梁高/吊顶高度等;
◆设计包括大部分设备的机电综合图:主要桥架/主要风管/主要水管等。
(3) 施工图设计阶段
◆最终确定公共设备通道内的主要设备种类/数量/规格;
◆确定公共设备通道的尺寸:宽/高/梁高/吊顶高度等;
◆设计包括所有设备的机电综合图, 并标定最终尺寸, 最终尺寸包括所有设备规格/设备标高/设备间距/设备坡度等。
4 空间协调图设计的主要流程及原则
空间协调图设计的主要流程为:资料收集—空间协调。
4.1 资料收集
数据中心公共设备通道机电综合图设计所需收集的设计资料 (包括设备材质、尺寸、数量、位置、标高等) 如表1所示。
4.2 空间协调
(1) 公共设备通道的尺寸确认
考虑到设备搬运及吊顶设备安装高度等因素, 一般吊顶不低于通道内的门高度, 原则上不低于2.6m。考虑到兼做空调静压箱、桥架布置及检修要求, 架空地板高度不宜低于600mm。
(2) 设备布置原则
设备布置的主要依据如下:
◆建筑结构, 设备各专业设计方案或设计图纸;
◆国家颁布的各专业的制图标准;
◆业主方提出的净空高度要求;
◆其他合作设计单位提供的设计资料 (装修, 智能化等) 。
空间协调图的目的是采用最经济合理的方式排布各管线设备, 一般按照以下原则进行布置:
◆由上而下, 由大到小;
◆先布置管径较大的管线, 后布置管径较小的管线, 遇管线交叉时应小管避让大管;
◆压力流管道避让重力流管道;
◆冷水管避让热水管, 因热水管往往需要保温且造价较高;
◆电缆动力自控通信等桥架与输送液体的管道宜分开布置或布置在其上方以免管道渗漏时损坏电缆造成事故;
◆附件少的管道避让附件多的管道, 这样有利于施工操作和维护及更换管件;
◆可弯曲管避让不可弯曲管;
◆各种管线在同一处垂直方向布置时, 一般是线槽/电缆在上, 水管在下, 热水管在上, 冷水管在下, 风管在上, 水管在下;
◆空调风管/供回水管/冷凝水管/热水管等设计时应考虑保温层厚度、法兰尺寸、吊架材料所占空间;
◆气灭管道宜布置于上层, 水喷雾管宜布置于下层, 消火栓管靠近消火栓箱侧布置;
◆走廊送、回风口灯具/感烟探测器/摄像头/广播喇叭/喷头等布置应统一协调避免相碰, 一般风口、灯具等要求居中呈一直线布置, 以保证装修效果;
◆检查公共设备通道内是否有风机/卷帘门控制箱等动力设备;
◆如设备有分支管道或桥架, 需考虑弯通及三通的设备尺寸影响;
◆保证通道有可上人至吊顶内的检修通道 (原则上预留在通道中部) , 检修通道宽度原则上不小于500mm;
◆根据数据中心级别合理布置主要工艺设备:如2N系统的供电及IT桥架/暖通风管等需分两侧布置;
◆可汇总各专业设备做综合吊架;
◆极端情况下, 设备可穿梁布置, 需与结构专业协调后设置开孔。
(3) 主要设备间距确认
(1) 电气 (因数据较多, 故只标注参照的文献资料, 具体数据请自行查找, 余同)
◆电气桥架与其他工艺管道的布置间距参照JGJ-16-2008民用建筑电气设计规范, 第83页相关规定;
◆电气桥架间的布置间距间距参照JGJ-16-2008民用建筑电气设计规范, 第94页相关规定;
◆电气桥架与弱电/仪表桥架的布置间距参照HGT 20512-2000仪表配管配线设计规定, 第11页相关规定。
(2) 弱电及通信
◆弱电/通信桥架与强电桥架的布置间距参照GB 50311-2007综合布线工程设计规范, 第36页相关规定;
◆弱电/通信桥架与其他工艺设备的布置间距参照GB 50311-2007综合布线工程设计规范, 第37页相关规定。
(3) 暖通及给排水等动力设备
◆气体灭火管道的布置要求参照国标图集07S207气体消防系统选用、安装与建筑灭火器配置, 第67页相关规定;
◆动力管道间的布置间距参照国标图集03S402室内管道支吊架, 第40~42页相关规定;
◆管沟内的动力管道间的布置间距参照天津地方图集DBJT03-22-2005-05S9管道支吊架, 第139~144页相关规定;
◆管井内的动力管道间的布置间距参照天津地方图集DBJT03-22-2005-05S9管道支吊架, 第119~122页相关规定。
(4) 其他工艺设备
其他工艺管道与动力管道及强弱电设备间的布置间距参照“动力管道设计手册 (2006) ” (机械工业出版社) , 第239/268页相关规定。
5 空间协调图设计典型案例
某工程的空间协调图如图1所示。
6 空间协调图设计的最新技术的应用
随着计算机辅助设计软件技术开发应用的不断进步, 3D模型技术为空间协调给出了新的解决思路。目前, 主流的3D模型技术包括:Autodesk公司的BIM (建筑信息模型) 、Autoplant, Graphisoft公司的ArchiCAD, Bentley公司的Microsta-tion、PDS等。现以BIM软件为例, 简述一下3D软件在空间协调图设计中的优势。
图1
可视化:可视化即“所见所得”的形式, 将100%实际尺寸的三维立体实物图形展示出来, 不是普通的平面/立面图。
协调性:传统的空间协调依靠工程师的经验进行空间协调, BIM可自动检测各设备的碰撞信息, 生成协调报告, 大大提高效率。
优化性:事实上整个设计、施工、运营的过程就是一个不断优化的过程, 优化受信息、复杂程度和时间的制约。BIM模型提供了建筑物的实际信息, 包括几何信息、物理信息、规则信息, 并可根据需要随时修改。另外, BIM模型可在短时间内提供多种方案比较, 极大地缩短了决策时间。
可出图性:BIM模型除了可以提供常规的建筑及机电设计图纸, 还可以通过对建筑物进行了可视化展示、协调、模拟、优化以后, 可以帮助业主出综合管线图 (经过碰撞检查和设计修改, 消除了相应错误以后) 、综合结构留洞图 (预埋套管图) 、碰撞检查侦错报告和建议改进方案等图纸。
对以后的管理及运维提供实质的帮助:BIM模型可根据现场的最新施工变化, 动态的更新模型, 保证模型与施工状态的一致性, 为未来的管理及运行维护提供重要的支持。
图2为某项目的3D模型图。
7 结束语
综上所述, 数据中心的公共设备通道空间协调图的设计需综合多方面因素考虑, 在设计的不同阶段及时准确地做出适当的空间协调图, 对整个项目的进度及各专业的设计均有很大的帮助。
将来采用更直观、准确的3D模型辅助设计会是空间协调图设计未来发展的主要方向。
参考文献
[1]朱伟雄, 王德安, 蔡建华编译.新一代数据中心建设理论与实践.人民邮电出版社
[2]动力管道设计手册 (2006) .机械工业出版社
[3]数据中心用远程通信基础设施标准ANSI TIA942-2005
[4]电子信息系统机房设计规范GB50174-2008
[5]民用建筑电气设计规范JGJ-16-2008
[6]仪表配管配线设计规定HGT20512-2000
[7]综合布线系统工程设计规范GB50311-2007
[8]国标图集07S207气体消防系统选用、安装与建筑灭火器配置
[9]国标图集03S402室内管道支吊架
[10]天津地方图集DBJT03-22-2005-05S9管道支吊架
数据协调 篇2
粗糙集理论是上世纪80 年代由波兰学者Pawlak Z 提出的一种处理含糊和不精确性问题的新型数学工具。近年来该理论在机器学习、知识获取、决策分析、归纳推理、模式识别、数据融合等诸多领域都得到了广泛而不俗的应用。模糊数学的创始人Zadeh 对粗糙集理论给予了很高的评价, 并将其列为他新提倡的软计算的基础理论之一[2]。
遗憾的是, 经典粗糙集理论是基于完备信息系统这样一个假设的, 即所处理的信息表是一个完备的信息表, 每个样本对象的所有属性都是已知的。但是在现实生活中, 由于数据测量的误差、数据理解或获取的限制等原因, 使得在知识获取时往往面对的是不完备信息系统, 即可能存在部分对象的一些属性值未知的情况。为了使粗糙集理论能够适应于不完备信息系统的处理, 目前主要有两种方法:一种是间接处理方法, 它的特点是通过一定的方法 (一般是基于概率统计) 把不完备信息系统转化为完备信息系统, 也称之为数据补齐;第二种是直接处理方法, 它的特点是对经典粗糙集理论中的相关概念在不完备信息系统下进行适当的扩充, 提出各种不同的粗糙集模型, 如利用相容关系、相似关系、量化相容关系、限制相容关系甚至更一般意义下的覆盖而得到多种不同的扩展粗糙集模型等[1]。
不完备信息系统是指丢失数据的数据库, 或者数据不完全的信息系统。不完备数据填补与约简不同, 有时候关注的不是冗余属性的消除问题, 而更重视丢失数据的合理补充问题[5]。因此, 不完备信息系统的完备化研究具有很高的价值。本文就是通过量化相容关系来补齐数据。
1 基本概念
1.1 不完备决策信息系统
定义1[5] 设I= (U, A, F) 是不完备信息系统, 其中U是对象集, 一般称为论域, A是属性集, F={Fl: U→ρ (Vl) (l≤m) }是对象与属性的关系集合, 其中Vl是属性al的取值域, ρ (Vl) 是Vl不含Φ的全体子集合。如果∀al∈A, ∀xi∈U, Fl (xi) 是一个单点集, 那么 (U, A, F) 称为完备信息系统。如果∃al∈A, ∃xi∈U使Fl (xi) 不是单点集, 那么 (U, A, F) 称为不完备信息系统。完备信息系统是不完备信息系统的特殊情况。
设 (U, A, F, d) 是决策信息系统, 其中d是决策属性, d:U->Vd表示对象在决策属性上的映射。∀x∈U, d (x) 是一个单点集。若信息系统 (U, A, F) 是不完备的, 则 (U, A, F, d) 就是不完备决策信息系统。
定义2 令DS= (U, A, F, d) 是不完备决策信息系统, A关于β相对于d的正域定义为:
定义3 对于协调的不完备信息系统S, 条件属性A关于β相对于d的依赖度为:
Kβ (A, d) =|posβ (A, d) |/|U|
定义4 属性意义SIG (c) 可按下式计算:
SIG (c) =Kβ (A, d) -Kβ (A-c, d)
定义5[4] 遗失对象集MOS定义为:
MOS={xj |存在ai, ai (xj) =*}
定义6[4] 容差关系T的定义为:
T={ (x, y) |x∈U, y∈U, ∀ai, ∃ai (xj) =ai (yj) or ai (xj) =*or ai (yj) =*}
定义7[5] 对象x的容差类T (x) 定义为:
T (x) ={y | (x, y) ∈T}
定理1[3] 决策规则独立原则:对于任一决策表, 其中条件属性完全相同的决策, 应尽量保持其决策属性的一致, 以避免不相容决策, 即尽量使决策规则相容, 这个原则称为决策规则独立原则。
1.2 不协调不完备决策信息系统
定义8[4] 协调决策信息系统定义为:如果T (A) ⊆Rd, 则DS= (U, A, F, d) 是协调决策信息系统, 否则是不协调决策信息系统。
定义9[4]DS= (U, A, F, d) 是不完备决策信息系统, B⊆A, 记:
U/R{d}={D1, …, Dr}
mB (x) =max{D (Dj/sB (x) ) |j≤r} (x∈U)
其中SB (x) ={y∈U| (x, y) ∈SIM (B) }。记m
定义10[4] 设DS= (U, A, F, d) 是不完备决策信息系统, Sf是DS的一个选择, 且Bf是Sf的最大分布约简集。若Bf是DS的所有选择中的最小集合, 且满足:
称缩减的完备信息系统 (U, Bf, f, d) 是DS的最优完备选择。
对不协调不完备决策信息系统, 获取决策规则的基本思想是最优选择。最优选择方法排除了人们的主观性, 不是通过人主观判断去填补那些空缺的数据, 而是找出那些是决策最可能发生的数据。它不是孤立的条件选择, 而是通过已知的条件属性值, 系统的选择缺失的数据值, 即在整体上选择缺失的数据值[4]。
2基于新型协调量化容差关系的不完备数据填补算法
2.1 算法描述
一般的基于容差关系的数据完备算法就是计算每个缺失对象x的容差类, 然后采用某种方法将容差关系量化, 从中选出容差度最大的那个对象来对照填补数据。而本算法既考虑了容差类的量化问题, 同时也考虑了不同条件属性的属性重要度对决策的影响。而且还考虑了决策表的协调性, 尽量减少对系统协调性的影响。算法具体描述如下:
输入:不完备决策信息系统DS= (U, A, F, V, d)
输出:完备的决策信息系统DS′= (U′, A, F′, d)
Step1 求出决策系统的缺失对象集MOS (DS) , 同时计算每个缺失对象的相容类T (x) ;
Step2 根据原信息系统计算出各个属性的重要度SIG (a) , a∈A, 并排序得到n (SIG (a) ) 即序列号, 如果缺失属性为冗余属性, 那么该属性的缺失值可以任意填补, 对预测没有任何影响;
Step3 if MOS (DS) 不为空, 则转到Step5, 否则, 转到Step4;
Step4 输出DS′ (U′, A, F′, d) ;
Step5 ① 计算MOS (DS) 集中缺失对象xi与相容类中各个相容对象的相容度, 并按照相容度的大小降序排列, 两个对象的相容度按照下式计算:
② 从相容度最大的相容对象开始, 若有最大相容度并列则转33, 若没有则:if d (xj) !=d (xi) , 即xi, xj属于不同的决策类, 那么此时我们采用逆向操作, 即选择与相容对象不同的该属性的可能数据来补缺, 即填补的属性值要与这些对象的相应属性值不同, 即a (xi) ≠a (xj) , a (xi) ∈{a}。该属性还有几种可能的值没有选取, 那就有几种完备选择。if d (xj) =d (xi) , 即两个对象属于同一个决策类, 那么我们只要简单的对照相容对象填补数据即可, 即a (xi) =a (xj) ;
③ 最大相容度对象并列时, 取整体协调度大的选择:优先根据决策属性值不同的相容对象进行数据补缺, 如果决策属性值不同的相容对象已取尽该属性的全部可能属性值, 那么就根据决策属性值相同的对象来进行数据补充, 具体填补方法与②相同;
Step6 转到Step3。
2.2 算法分析
填补算法在填补过程中仅仅依据一般的容差关系, 而且填补时简单对照相容对象进行相应的填补, 作者认为是不充足、不合理的。本算法也是基于容差关系对不完备决策信息系统进行数据填补, 但是本算法有两点改进具有很重要的意义。
(1) 一般容差关系中容差度的计算公式仅仅关注缺失属性个数和缺失属性可能的取值概率, 比如:
ki是两个对象i属性相同的概率, 而在本文算法中第二步中先根据现有的决策信息表计算出各个属性的重要度SIG (a) , 并且在第五步计算相容度是也充分利用属性间重要度的差别这一有效信息, 而不是仅仅考虑对象间的相似程度。相似程度相同, 不同的属性对决策的贡献程度使有很大差别的。比如, 如果缺失的是冗余属性, 那么它的任何取值对分类和决策都是没有影响的。
(2) 在具体数据的填补时不是简单根据容差度的高低, 同时考虑不完备信息表整体的协调度, 使得决策更有价值。原算法中填补时根据该对象容差类中容差度最高的对象进行填补, 而本文算法优先考虑协调性的整体最好, 在此基础上再依据容差度来进行填补。这是考虑到系统整体的协调度, 这对决策的影响很大, 在实际中我们总是要尽可能提高决策的协调度以使决策更有使用价值。
3 案例分析
给定的不协调的不完备的决策信息系统DS= (U, A, F, d) 如表1所示。其中U={x1, x2, x3, x4, x5, x6, x7}, A={a, b, c }, d是决策属性。
执行本文算法可得:
MOS (DS) ={x2, x4, x5};
TB (x2) ={x1, x5, x7};
TB (x4) ={ };
TB (x5) ={x1, x2, x7};
DS/A={{x1, x7}, {x2, x5}, {x3}, {x4}, {x6}};
DS/{a, b}={{x1, x7}, {x2, x5}, {x3}, {x4}, {x6}};
DS/{a, c}={{x1, x2, x5, x7}, {x3}, {x4}, {x6}};
DS/{b, c}={{x1, x3, x7}, {x2, x5}, {x4}, {x6}};
属性c是冗余属性, 对于分类没有什么任何影响, 因此c的取值可以任意。
n (SIG (a) ) =1 n (SIG (b) ) =n ( (SIG (c) ) =2
tol (x2, x1) =tol (x2, x7) =1/4 tol (x2, x5) =1/8
根据算法的Step5的②和③对x2进行填充, x2与x1和x7的相容度相同, 可知属性b的缺失值应填与x7不同的值即b (x2) =2;x4的缺失值属性为冗余属性c, 则x4可以任意取值。
重新计算x5与其相容类的相容度, 得:
tol (x5, x1) =tol (x5, x2) =tol (x5, x7) =1/4
根据算法可得此时x5应根据x7进行填充, 得b (x5) =1;此时MOS (DS) 为空, 结束本算法。得到得DS’, 如表2和表3所示。表2和表3不同之处就是x4的缺失属性c取值分别为1和2。
采用一般的基于容差关系的填补算法, 即求出容差对象的容差类后就按照算法分析时列举的容差度计算公式计算容差度, 再依据容差度的高低直接填补, 所得结果列为表4, 具体计算这里不再赘述。
4 实验结果分析
原不完备决策信息表有三处缺失属性, 有六种完备化选择。使用一般的基于容差关系的算法进行填补结果如表4所示, 而通过本算法我们结合重要度、容差度和协调度后直接得到了其中两个完备的决策信息表。两种算法的结果不同在于:对六种完备化选择根据定义10进行验证计算可知道, 原不完备表有两种最优完备选择, 这两种选择正是我们通过本文改进算法直接得到得两种选择, 而原算法一个也不属于最优完备选择。
5 结 论
本文主要提出一种结合属性重要度和决策独立原则的新型协调容差关系, 以及根据该容差关系对不完备数据进行填补的算法。并且从理论和实验两个方面对新旧算法进行了比较, 说明了该算法改进的有效性。该算法在尽量不降低整体协调度的前提下对不完全数据进行完备, 能直接得到最优完备选择, 得到更有价值的信息以及决策。
摘要:提出一种基于新型协调量化容差关系的不完备数据补齐算法。首先求出属性值不完备对象的容差类, 结合属性的重要度, 将容差类里面的对象容差关系量化, 再根据决策规则独立原则, 在尽可能保持系统协调性的前提下对缺失属性值进行补齐。大量实验证明了本算法的有效性。
关键词:协调量化容差关系,属性重要度,不完备信息系统,决策规则独立原则
参考文献
[1]胡峰, 黄海, 王国胤, 等.不完备信息系统的粒计算方法[J].小型微型计算机系统, 2005, 26 (8) .
[2]Kryszkiewicz M.Rules in incomplete information system[J].informa-tion science, 1999 (113) :271-293.
[3]Kryszkiewicz M.Rough set approach to incomplete information system[J].information science, 1998 (112) :39-49.
[4]张文修, 仇国芳.基于粗糙集的不确定决策[M].北京:清华大学出版社, 2005:149-166.
[5]Yee Leung, Deyu Li.Maximal consistent block technique for rule acqui-sition in incomplete information system s.Information Sciences, 2003, 153 (1) :85-106.
[6]周献中, 黄兵.基于粗集的不完备信息系统属性约简[J].南京理工大学学报, 2003, 27 (5) .
[7]Slowinski R, Venderpooten D.Ageneralized definition fo rough approx-imations based on similarity[J].IEEE Transaction on knowledge anddata mining, 2000, 12 (2) :331-336.
[8]Kryszkiewicz M.Rough Set approach to incomplete in2 formation sys-tems[J].informat-ion Sciences, 2001, 131:129-156.
数据协调 篇3
近年来, 人们对统计数据的需求与日俱增, 大量统计数据用于政府宏观决策、企业生产经营, 以及公众生产生活上, 社会各界对统计给予了越来越多的关注, 了解统计、应用统计、监督统计的意识不断增强。随着关注度的提高, 部分统计数据也引起了广泛质疑, 特别是在1998年亚洲金融危机期间和2008年全球金融危机爆发以来, 国际研究机构从数据协调性的角度对中国GDP等数据提出了质疑。中国及各地区统计数据的协调性究竟如何, 采用什么样的方法可以对各地区数据进行客观评估并找出不协调的数据等等一系列问题亟待解答, 对统计数据的协调性和准确度做出客观评估具有重要的现实意义。
二、文献综述
国内外学者采用多种方法评估中国经济数据协调性, 并得出了不同结论。Rawski (2001) 指出, 中国经济增长率与能源消耗数据之间、生产数据之间以及生产数据与投资数据之间存在数据不匹配, 并由此质疑中国统计数据造假。Klein和Ozmucur (2002) 选取对中国经济有广泛代表性的15个指标进行了主成分分析, 结果表明, 各指标的变动与中国官方数据的变动是一致的。任若恩 (2002) 考察了德国、英国、日本和韩国的经济增长与能源增长数据, 发现这些国家都曾经出现过二者不同步的现象。阙里和钟笑寒 (2003) 借鉴Klein和Ozmucur的思想, 使用1984—2001年的中国省际面板数据开展研究, 为中国GDP数据真实性的讨论提供了地区一级数据的检验, 结果表明, 从整个时期来看, 各地区的若干基础经济变量 (包括能源消费量) 相对于各自GDP的变化趋势是符合基本经济规律的, 年度特殊影响也不严重, 地区特殊影响虽然较大, 但可以从地区经济结构及其变化等方面的差异上得到解释。周国富和连飞 (2010) 选取了9个主要经济指标, 提取其主成分, 并考虑地理空间因素对经济增长的影响, 采用空间面板数据模型对中国地区GDP数据的真实性进行经验分析, 结果表明中国地区GDP同各经济指标的协调性较好, 分年份来看也没有被系统高估的迹象。
以往学者的研究往往偏重于经济数据的静态分析。对宏观经济数据而言, 由于经济改革、各种各样的外界冲击和政策变化等因素的影响, 经济结构会逐渐发生变化, 在相似的外部环境和内在因素下, 指标间的相互关系具有相似性, 通过同时期数据关系演变趋势的对比可以在一定程度上反映和评估数据的协调性。考虑到使用固定参数模型难以反映数据关系的动态变化, 在数据评估方面难以体现灵敏性和动态性, 因此本文选择状态空间模型 (Harvey 1989, Hamilton 1994) 这一变参数模型反映指标间的动态关系, 并通过参数变化趋势的对比进行数据协调性评估。
三、模型构建
以GDP为被解释变量, 用电量指标为解释变量, 构建模型如下:
量测方程
式 (1) 中, 可变参数βt是电力消耗系数, 为不可观测变量。式 (3) 中ut和εt相互独立, 且服从均值为0, 方差为和协方差矩阵为Q的正态分布。
图 1 1995—2010 年电力消耗系数对比
将1995—2010年全国及山东省GDP和用电量数据代入, 利用EViews 5.0软件计算出时变的电力消耗系数结果如图1所示。
从电力消耗系数的变化趋势看, 山东省与全国的电力消耗系数总体趋势具有相似性, 除2004年等个别年份外, 多数年份的系数差相对稳定。从电力消耗系数时点值的比较看, 1990—2010年山东省电力消耗系数均明显高于全国平均水平, 但考虑两者的经济发展状况差别较大, 山东作为东部沿海城市, 以全国作为参照具有较强的不可比性。因此我们选择人均地区生产总值指标对全国各省市做聚类分析, 并将山东省所在的包括北京、江苏、浙江、广东、辽宁、福建、山东等七个省市大类的GDP和电力消耗数据加总, 以此作为参照系进行数据评估。通过状态空间模型求得参照区域电力消耗系数, 对比情况如图1和表1所示。
可以看出, 与以全国为参照相比, 山东省与新参照系的电力消耗系数整体差距有所缩小, 但系数差本身波动较大, 尤其是1997年、2001年等年份, 协调性不够理想。山东省与参照区域电力消耗系数差如图2所示。
图 2 1995—2010 年山东省与参照区域电力消耗系数差
四、模型评估
通过电力消耗系数差可以从整体偏离、整体波动和时点偏离三个角度进行数据协调性评估。
1、整体偏离评估
从整体偏离的角度, 可以通过整体偏离系数对数据做出评估和判断, 其表达式为:
其中表示待评估区域与参照区域电力消耗系数差均值, 表示参照区域电力消耗系数均值。整体偏离系数反映待评估区域相关数据整体偏离的程度。我们可以结合实际情况和相关省市整体偏离系数的大小设定警示标准, 例如可以将该警示标准设定为0.1, 小于警示标准值视为数据整体基数较为客观, 超过警示标准则视为相关年份数据整体匹配度偏低, 或基数偏大。计算可得1995—2010年山东省整体偏离系数为0.114, 如果假定警示标准为0.1, 则可以据此对数据质量做出整体评估, 或在此基础上引导调整。
2、整体波动评估
从整体波动的角度看, 可以使用变异系数法对一个省市数据的协调性做出评估, 其表达式为:
其中, S表示电力消耗系数差值的标准差。变异系数值能够动态反映待评估区域相关数据的稳定性。我们可以根据需要设定变异系数的警示标准, 例如可以将该警示值设定为10%, 低于警示值表示相关年份数据基本稳定, 或协调性较好, 超过警示值则表示数据波动偏大, 并可将此标准作为数据评估调整的参照。计算可得1995—2010年山东省电力消耗系数差的变异系数为22.5%, 依据10%的参照标准, 该省数据波动偏大, 匹配度不理想。
3、时点偏离评估
从时点偏离的角度看, 可以通过时点偏离指数对具体年份数据的异动情况做出评价, 其表达式为:
时点偏离指数以参照系为基础能够直观反映某一年份数据的异常波动情况。我们可以结合实际需要设定警示标准值, 例如可以将警示值设定为0.2或0.3, 低于警示值视为该年份数据基本稳定, 超过警示值则表示该年份数据出现异常波动。计算可得山东省各年份的电力消耗系数差的偏离指数, 如果以0.2为警示值, 则山东省1997年、1999年、2001年、2004年数据出现异常;如果以0.3为警示值, 则山东省1997年和2001年数据出现异常波动, 表示相关年份数据不够协调。
五、研究结论
研究发现, 1995—2010年, 山东省电力消耗系数明显高于全国平均水平, 二者总体变动趋势具有相似性, 除2004年等个别年份外, 多数年份的系数差相对稳定;若以北京、江苏、浙江、广东、辽宁、福建、山东七省市聚类数据作为参照系, 则山东省与新参照系的电力消耗系数整体差距有所缩小, 但系数差本身波动较大, 尤其是1997年、2001年, 协调性不够理想。
摘要:本文以山东省为例, 尝试使用状态空间模型对动态数据协调性进行评价。首先通过分层聚类选择参照系, 分别利用整体偏离系数、变异系数和时点偏离指数等参数对数据的整体偏离情况、整体波动情况和时点偏离情况进行协调性评估, 并得出基本结论:山东省电力消耗系数明显高于全国平均水平, 二者总体变动趋势具有相似性;以七省市聚类数据作为参照系, 则山东省与新参照系的电力消耗系数整体差距有所缩小, 但系数差本身波动较大, 协调性不够理想。
关键词:数据评估,协调性,状态空间模型
参考文献
[1]卢二坡:统计数据质量评估方法述评[J].工作视点, 2006 (12) .
[2]孟连、王小鲁:对中国经济增长统计数据可信度的估计[J].经济研究, 2000 (10) .
[3]张新、蒋殿春:中国经济的增长——GDP数据的可信度以及增长的微观基础[J].经济学 (季刊) , 2002 (1) .
[4]任若恩:中国GDP统计水分有多大—评两个估计中国GDP数据研究的若干方法问题[J].经济学 (季刊) , 2002 (1) .
[5]Rawski Thomas G.:近年来中国GDP增长核算:目前的状态[J].经济学 (季刊) , 2002 (1) .
[6]许宪春:中外经济学家对中国经济增长率的评论[J].财贸经济, 2003 (2) .
[7]阙里、钟笑寒:中国地区GDP增长统计的真实性检验[J].数量经济技术经济研究, 2005 (4) .
[8]周国富、连飞:中国地区GDP数据质量评估—基于空间面板数据模型的经验分析[J].山西财经大学学报, 2010 (8) .
[9]高铁梅:计量经济分析方法与建模[M].北京:清华大学出版社, 2009 (5) .
数据协调 篇4
对于经济增长和城市化是否协调的研究由来已久, 本文基于对全国1995~2011年经济增长和城市化水平相关数据, 对经济增长和城市化水平之间的协调性进行分析, 得出:我国进入上世纪90年代后, 经济增长与城市化水平具有良好的协调性。
本文的研究重点分为三部分:第一部分, 是本文研究的理论基础和选题的依据;第二部分, 运用功效系数法、模糊数字中的隶属度函数, 对经济增长和城市化水平是否协调进行实证分析, 得出我国1995~2011年两者的协调度较高, 并对个别年份出现略低于平均协调度的情况给予相应解释;第三部分, 针对如何促进经济增长与城市化水平的协调发展, 提出了促进经济稳定增长、避免经济波动、稳妥推进城市化建设的意见。
理论基础及选题依据
国内外学者从不同角度对于城市化与经济增长的内在关系进行了研究, 如lucas (1998) [1]从城市教育这一因素出发, 认为受教育程度对经济增长有重要作用。black (2004) [2]认为, 城市规模和数量对经济增长有重大作用。关于城市化水平与经济增长之间的关系, 李树坤 (2008) [3]认为, 经济增长是影响城市化水平的关键因素, 但反过来, 城市化却不是经济增长的原因。王领 (2011) [4]通过实证研究同样得出, 经济增长对城市化发展水平有较强作用, 但城市化发展水平对经济增长的作用却不明显。然而, 韩燕 (2012) [5]通过对我国各省、市、自治区的面板数据研究发现, 城市化对经济增长有积极的作用。以上文献是不同学者从不同角度进行的分析, 结果自然不同, 但很少有学者从协调性出发, 来研究城市化和经济增长的协调关系。
所谓城市化和经济增长的协调发展, 是指在两者内部要素和系统协调发展的基础上, 融为一个有机的整体, 并在发展目标、阶段、对策和发展速度上有机配合、全局优化, 从而取得二者较好发展的过程。协调性可以用协调度来定义, 协调度, 是度量系统机制或系统内部各要素之间协调状况好坏的定量指标。[6]有研究认为, 我国自建国以来, 统筹安排、制定了较为严厉的户籍制度, 限制了人口流动, 阻碍了城市化进程。进入上世纪90年代之后, 我国进入了全面建设社会主义市场经济体制的新时期, 城市化水平发展进入新阶段。针对这一阶段我国城市化与经济增长之间的协调性问题, 本文选取了1995~2011年我国经济和城市化的相关数据, 为避免单一指标的片面性, 本文采用综合指标加权的方法, 对这一时期两者之间的协调性进行研究, 并根据本研究的侧重点来选取相应的指标。
指标选择、数据处理及分析
1.数据来源、城市化水平和经济增长评价指标选择
本文数据来源于历年《中国统计年鉴》、历年《中国城市统计年鉴》。选取1995~2011年我国城市化发展水平与经济增长相关数据。
考虑到我国城市化水平的测度尚未形成统一的指标体系, 故根据本文研究的需要, 根据指标选择的系统性、一致性、差异性, 以及数据的可获得性等原则, 参考程开明《中国城市化与经济增长的协调度研究》、[7]国务院发展研究中心课题组《中国城镇化:前景、战略与政策》[8]中对城市化水平指标的选择, 从人口城市化、经济城市化、土地城市化、生活城市化的角度, 选取了城市化人口比重、建成区绿化覆盖率、建成区面积、城镇从业人员占全部从业人员的比重、非农产业增加值、医疗卫生机构床位数等6个指标, 来测度我国城市化水平;选取地区生产总值、地区人均生产总值、三大产业占GDP的比重、财政收入、全社会消费品零售总额、全社会固定资产投资、城镇居民人均可支配收入、农村居民人均收入等11个指标, 作为测度经济增长的指标。一级指标和二级指标均采用方差加权法与熵值法相结合的综合赋值法计算权重。
2.评级模型选择
(1) 数据标准化处理。为了消除指标不同单位的影响, 对经济增长和城市化水平进行评价时, 将指标的实际值进行标准化处理, 即转化为无量纲的评分值。标准化处理具有对原数据线性处理, 不改变数据分布特点的优点。其公式如下:
其中, Xj表示j变量的真实值, X軍表示j变量的平均值, Sj表示j变量的标准差。
(2) 功效系数法。本文采用功效系数法, 测算城市化水平指数和经济增长水平的指数。[9]功效系数法, 是对每一个变量指标选取一个满意值和一个不允许值。这里的满意值设定为指标的最大值;不允许值为指标的最小值。以最小值为下限, 计算各指标与满意值之间的差异, 并转化为相应的功效系数。指标的功效系数与该指标权重的乘积即是该指标的评估得分, 其公式表示为:
。式中, D为某个城市的评估总分, Wj为某个城市第j个指标的权重。
式中, dj为指标的功效系数, Zj、Zji、Zjs分别表示各个时期j指标的实际值、j指标的满意值 (指标序列中的最大值) 和j指标的不允许值 (指标序列中的最小值) 。
(3) 权重的确定。本文采用方差加权法与熵值法相结合的综合赋权方法, [10]计算某个城市每个指标的权重, 其计算公式如下:
wj=ρwjd+ (1-ρ) wje。式中:wj为j的权重, wjd为运用方差加权法确定的权重, wje为采用熵值法确定的权重, ρ取0.6。
其中, 式中, Sj为j指标的标准差。
注意:在对数据进行无量纲处理时, 可能出现负值, 可通过坐标平移的方法得到正值, 以便进行Wje的确定。根据本文情况, 将量化指标平移2个单位。
(4) 我国经济增长与城市化水平协调性的评价模型。根据功效系数法得到我国经济增长和城市化水平综合评价指数;将经济增长和城市化水平综合评价指数, 分别作为自变量和因变量进行回归拟合;根据拟合方程所得的结果, 计算经济增长系统和城市化水平系统相应的协调度。当得到以x为自变量, 以y为因变量的函数, 利用x的实际值得到的y’, 即是y的协调值, 反之亦然。利用得到的协调值, 运用模糊数字中的隶属度概念, 对这两个子系统的协调度进行分析。[11]其状态协调度的函数形式如下:
式中, U (i/j) 为i系统对j系统的状态协调度, Fi为i系统的综合评分值, F'是j系统对i系统所要求的协调值, 即拟合回归所得到的值, S2为i系统的综合评分值的方差。协调度的计算公式为:
式中, U (L÷E) 表示经济增长与城市化水平两者的协调度, u (L÷E) 表示经济增长系统对城市化水平协调发展的适用程度, u (E÷L) 表示经济增长对城市化水平协调发展的适应度。
实证分析
1.我国1995~2011年经济增长和城市化综合水平分析
本文借助SPSS软件, 对我国1995~2011年经济增长和城市化综合水平进行分析, 处理结果见表1和表2。
根据表2的数据可对1995~2011年我国经济增长综合指数进行纵向分析。自1995年开始, 我国经济增长虽然总体上升, 但是有轻微波动且增速较慢。自2002年开始, 经济增长速度大幅度攀升。在我国政府的宏观调控政策以及各项相关政策的推动下, 我国经济自2003年开始实现高速增长。1995年以来, 我国城市化进入迅速发展时期, 这与党的“十四大”将城市化作为经济社会发展中心, 明确了其在经济发展中重要作用的决定密切相关。自2004年开始, 我国城市化水平发展迅猛, 这党的“十六大”第一次明确提出, 发展“走中国特色的城镇化道路”的结果, 说明城市化的发展与国家相应的政策密不可分。
2.回归分析结果
(1) 以我国经济增长综合评分指数为自变量、城市化水平综合评分指数为因变量进行拟合, 得到如下回归方程:
(2) 以我国城市化水平综合评分指数为自变量、经济增长综合评分指数为因变量, 进行回归分析, 得出方程如下:
根据方程得出我国1995~2011年经济增长和城市化水平状态协调度 (协调度函数中的) 、经济增长系统与城市化水平系统的协调度, 如表3和表4所示。
(3) 我国1995~2011年经济增长水平和城市化水平协调发展情况 (见图1) 。
总体看, 1995~2011年, 我国经济增长和城市化水平协调性较强, 协调度都在0.7以上。说明了进入上世纪90年代以后, 我国工业快速发展, 引起经济、社会结构的极大变化, 城市便利的生活方式和巨大的经济利益, 吸引了大量农村剩余劳动力。第三产业的迅速发展, 使其能吸纳较多的劳动力, 实现劳动力资源的优化配置。大城市及中小城市增多, 城市规模得以体现, 推动经济增长, 表现为经济增长和城市化水平的协调发展。其中, 1979~1995年, 我国GDP平均增长率高达9.88%, 1996~2000年我国GDP年平均增长率为8.26%, 而1996年为9.6%, [12]高于这一时期的平均水平。2001年和2002年世界经济全面衰退的影响, 对我国经济带来一定的冲击, 1996年、2001~2002年, 经济增长的变化与城市化协调度的关系均体现为, 经济增长和城市化水平协调度低于平均协调水平。
结论与政策建议
1.结论
城市化是推动我国经济快速发展的重要因素, 而城市化发展又是一个复杂的综合性问题, 它涉及一个城市经济、政治、文化的发展水平。如何协调好城市化和经济增长之间的关系, 是一个城市能否快速、稳步发展的关键因素。
根据本文以上的分析可以发现, 1995~2011年, 我国在经济增长和城市化水平进程方面表现出较好的协调性, 系统协调性都在0.7以上。稳定的经济增长为经济和城市化协调发展创造了良好的条件, 促进了经济社会的健康有序发展。说明在目前阶段, 我国经济增长对城市化水平的影响较大。
2.政策建议
(1) 要保证宏观经济的稳定, 审时度势, 避免经济波动, 为合理有效地推进城市化发展提供良好的空间。
(2) 积极调整产业结构、稳定经济增长, 从而带动城市化发展。工业发展可以带动农业劳动力的转移, 使劳动力不断由农业向第二、三产业转移, 从而实现劳动力的优化配置, 对城市化的发展产生积极的作用。因此, 对于工业发展落后的地区, 应加大产业结构调整力度, 提高政府投资水平, 鼓励有良好背景的外资企业进驻办厂, 以促进经济的快速增长。
(3) 各地政府要根据本地区的特点, 因地制宜, 稳步推进城市化进程。不同地区有不同的政治、文化背景和经济发展水平, 如北京、上海、深圳等经济发展水平较高的地区, 城市化水平相对较高, 但对于内陆地区如西安、郑州等经济化水平较低的地区, 城市化水平相对较低, 这些地区在赶超其他地区的同时, 要根据当地的城市发展水平, 发展主导产业, 以提升经济增长水平, 避免盲目造城、人为造城, 制止过分追求城市化数量, 而忽略城市化质量的行为, 走可持续发展的城市化道路。
参考文献
[1]Lucas, R.E.On the Mechanics of Economic Development.Journal of Monetary Economics, 1998 (22) :3-22.
[2]Black D., Henderson VA Theory of Urban Growth.Journal of Political Economy, 1999, 107 (2) :252-254.
[3]李树坤.我国城市化与经济增长的计量分析[J].统计与决策, 2008 (16) :86-88.
[4]王领.基于VAR系统的人口城市化与经济增长关系研究——以上海1978-2009年数据为例[J].国际贸易问题, 2011 (9) :65-74.
[5]韩燕, 聂华林.我国城市化水平与区域经济增长差异实证研究[J].城市问题, 2012 (4) :22-26.
[6]隋映辉.协调发展论[M].青岛:青岛海洋大学出版社, 1990:20-21.
[7]程开明.中国城市化与经济增长的协调度研究[J].商业经济与管理, 2010 (9) :86-91.
[8][9]国务院发展研究中心课题组.中国城镇化前景、战略与政策[M].北京:中国发展出版社, 2010, 7:71-72.
[10]欧阳小迅, 黄福华.区域物流竞争力评价指标、方法和实证[J].湖南商学院学报, 2010 (2) :131-133.
[11]司光南.人口-经济系统的协调度分析[J].统计与决策.2008 (4) :48-50.
数据协调 篇5
一、城镇化-生态环境系统协调发展指标体系
城镇化与生态环境协调发展指标体系主要包括城镇化评价指标体系与生态环境评价指标体系。两个指标体系均属于复杂的多变量指标体系, 在构建指标体系的时候遵循针对性、区域性、动静结合、可操作性的原则。本文选择的指标体系 (见表1-1) 。
二、城镇化-生态环境系统协调发展评价步骤
(一) 样本标准化
1. 逆向指标的同趋势化。
用逆向指标的倒数代替原指标。
2. 标准化。
考虑到原始指标数据间的量纲差异并且指标间数量级也存在较大差异, 为了方便进行汇总比较, 利用SPSS对原始指标数据进行标准化处理:设对n个个体, 每个个体有p个变量Xi1, Xi2, …, Xip, (i=1, 2, …, n) , 将每个变量按标准化公式 (见2-1式) 进行处理, 即:
其中:X为均值, s为标准差
(二) 计算体系的综合发展水平
解特征方程求出特征值和特征向量, 利用公式计算各因子的方差贡献率, 依据的原则, 求出前m个主成分, 再根据主成分的表达式, 推导出综合水平计算公式 (见2-2式) 并计算。
(三) 计算城镇化系统与生态环境系统的静态协调度
利用样本数据, 结合主成分分析的方法, 求出农村城镇化与生态环境各自的综合水平值并进行回归分析, 得到回归方程, 然后利用回归方程求出农村城镇化与生态环境的协调值。
反映农村城镇化与生态环境两个系统之间的静态协调模型US (x, y) :
式中US (x, y) 表示静态协调度, u (x/y) 表示x系统对y系统的协调度, u (y/x) 表示y系统对x系统的协调度, x表示x系统的综合发展水平实际值, 表示x系统综合发展水平协调值, s2表示x系统综合发展水平的均方差。
(四) 计算城镇化-生态环境系统的协调发展度
反映农村城镇化与生态环境两个系统的动态协调度Ud (t) :
其中, US (t-T+1) , US (t-T+2) , …, US (t-1) , US (t) 是农村城镇化与生态环境系统在 (t-T) ~t这个时间段各个时间点的静态协调度。设t2>t1 (t1、t2为任意两个不同时间点) , 若Ud (t2) >Ud (t1) , 则表示所研究的系统始终处在动态协调发展状态。
三、实证研究
按照所选的指标体系, 选取黑龙江省2002-2011年的指标数据。根据公式2-2和公式2-3求出黑龙江省城镇化水平 (X) 与生态环境综合发展水平 (Y) , 利用EVIEWS软件对城镇化综合水平和生态环境综合水平值进行分析, 结果显示自变量对因变量具有显著的线性影响, 所以本文采用线性拟合方法来处理城镇化和生态环境的数据, 得到以下方程:
回归方程中, 可决系数R2等于0.91, 这说明所建模型整体上对样本数据拟合较好;另外, 方程中F值为80.99, F值很高, 这就说明城镇化综合水平对生态环境综合水平有显著影响, 生态环境水平也对城镇化综合水平有显著影响。基于这些条件, 求出两个系统的的各项指标数据, 详细计算结果见 (表3-1) 。
根据表 (3-2) 的计算结果, 结合协调度分析, 2002年~2011年黑龙江省农村城镇化与生态环境的静态协调度发展趋基本平稳。从2002年到2011年, 每一年的静态协调度均大于0.85, 为协调发展, 尤其在2003、2004、2005、2006、2007、2008、2009年这七年的静态协调度超过0.95, 达到优质协调, 2002年、2010年和2011年的静态协调度小于0.95且大于0.85, 为协调状态。从表 (3-2) 可以看出, 动态协调度的发展趋势呈现基本不递减状态, 但2008年、2010年、和2011年的数据显示, 该三年的动态协调度较上一年都有所下降, 即:Ud (2007) >Ud (2008) 、Ud (2009) >Ud (2010) 、Ud (2010) >Ud (2011) 。
纵观2002~2011年黑龙江省农村城镇化与生态环境的静态协调度数据, 结合统计方法, 可以得到静态协调度的均值为0.970, 方差为0.00089, 这就说明黑龙江省在2002~2011年间的城镇化与生态环境静态协调度虽然有一定起伏, 但是始终处于较为稳定的协调状态之中。另外, 2005年的静态协调度达到峰值0.998、动态协调度也达到相对较高0.976, 2009年的动态协调度达到峰值0.980、静态协调度也达到较高的0.997, 因此, 黑龙江省在制定农村城镇化与生态环境的协调发展的决策时, 可以参照2005年及2009年的相关政策。黑龙江省农村城镇化与生态环境的协调发展状况良好, 但是也不能忽视一些存在的问题。从表 (3-1) 可以看出, 2002年~2011年黑龙江省生态环境综合水平值逐年递减, 也就是说, 随着农村城镇化步伐的加快, 黑龙江省生态环境的综合水平每况愈下, 2009年~2011年间, 静态协调度和动态协调度都有下降趋势, 未来黑龙江省农村城镇化进程中的生态环境问题不容乐观。因此, 黑龙江省在推动农村城镇化的进程中, 应该采取有力措施及制定相关政策来加大对生态建设和环境保护的投入力度, 确保农村城镇化与生态环境协调稳定发展。
参考文献
[1]田金平, 刘巍, 等.中国生态工业园区发展模式研究[J].中国人口·资源与环境, 2012, 22 (7) :60-66.
[2]李广明, 黄有光.区域生态产业网络的经济分析—一个简单的成本效益模型[J].中国工业经济, 2010 (2) :5-15.
[3]丁志国, 赵宣凯, 等.中国经济增长的核心动力—基于资源配置效率的产业升级方向与路径选择[J].中国工业经济, 2012 (9) :19-30.
[4]范进, 赵定涛.土地城镇化与人口城镇化协调性测定及其影响因素[J].经济学家, 2012 (5) :62-67.
[5]叶素云, 叶振宇.中国工业企业的区位选择:市场潜力、资源禀赋与税负水平[J].南开经济研究, 2012 (5) :94-110.
数据协调 篇6
人口既是生产者又是消费者, 并通过这种两重属性与经济社会产生密切联系, 现代系统理论将人类的生存发展作为一个大系统, 而人口、经济、社会等都是其子系统, 各子系统相互依存、相互渗透、相互影响。人口数量、人口素质、人口结构及人口分布等人口系统的情况及其变动对一个区域的经济、社会发展都具有重要影响作用, 这种影响促进还是阻碍经济、社会发展难以凭空判断。
本文以广东省韶关市的人口数据为例, 评价分析该地区的人口与经济、社会发展的协调性。韶关市位于广东省北部, 属于经济欠发达地区, 可将韶关市看作一个具有复杂功能的特殊系统, 人口、经济、社会都可以看作这个系统中的子系统, 以韶关市2000—2010年人口、经济、社会指标为例计算评价其人口、经济社会发展水平, 并分析韶关市人口数量、结构、质量及空间分布是否与本市经济、社会发展水平之间具有协调性, 全部数据来源于2011年韶关市统计年鉴。
二、评价人口、经济和社会发展的指标体系
全面、客观地评价人口、经济和社会的协调发展状况需要建立科学的指标体系, 并应遵循以下四个基本原则:
1.科学性原则。即指标体系建立在科学的基础上, 能够准确、全面、系统地反映人口、经济和社会发展的内涵。2.实用性原则。合理地选择指标, 指标数据应易于统计, 统计数据能确保权威性。3.完备性原则。指标体系作为一个有机整体, 要能反映和测度被评价系统的主要特征。4.可行性原则。从实际情况出发, 选择有代表性的综合指标和主要指标, 那些在统计上无法量化、数据不易获得或相对不十分重要的指标可暂时不列入。
根据指标体系建立的相关原则, 选取的指标如下:
1.人口子系统。常住人口数X1 (万人) 、户籍人口数X2 (万人) 、人口增长率X3 (百分比) 、人口密度X4 (人/平方公里) 、在校学生数X5 (人) 、户籍中非农业人口比重X6 (百分比) 。
2.经济子系统。国内生产总值 (亿元) Y1、人均国内生产总值 (万元) Y2、第三产业增加值Y3 (亿元) 、人均第三产业增加值Y4 (万元) 、全社会固定资产投资额Y5 (亿元) 、城镇人均可支配收入Y6 (元/人) 、农村人均纯收入Y7 (元/人) 。
3.社会子系统。从业人员总数Z1 (人) 、第三产业从业人员比例Z2 (百分比) 、人均储蓄余额Z3 (元/人) 、每千人拥有卫生技术人员数Z4、每千人拥有医疗床位数Z5 (张/千人) 、社会消费品总额Z6 (万元) 。
三、人口、经济、社会各子系统综合发展水平的评价
采用主成分分析方法对各子系统综合发展水平进行评价, 评价的原理及具体步骤如下:1.收集整理基本数据, 采用Z—Score法对数据进行标准化, 得到标准化后的数据;2.通过主成分分析法, 求相关矩阵、特征根、特征向量和方差贡献率;3.求主成分及其得分;4.计算各主成分的得分与其特征值的乘积和得到各系统的综合发展水平值。本文利用SPSS软件处理上述数据, 可自动将原始数据标准化、计算主成分得分。
下面以人口子系统为例, 简述系统评价过程:
第一步, 收集原始数据, 2000—2010年人口子系统所选变量的值见表1, 将表1中的6个变量数据粘贴至SPSS软件中, 利用数据分析、降维、因子分析进行主成分分析。
第二步, 分析软件输出的公因子方差见表2, 表2给出了提取公因子后前后各变量的共同度, 它刻画了全部公共因子对于变量Xi的总方差所作的贡献, 说明了全部公共因子反映出原变量信息的百分比。例如, 提取公共因子后, 变量X1的共同度为0.980, 即提取的公共因子对变量X1的方差做出了98.0%的贡献。从表2的数据可以看出, 各个变量的共同度都比较大, 说明变量空间转化为因子空间时, 保留了比较多的信息, 因此因子分子的效果是显著的。
第三步, 求主成分及其得分。
根据主成分的提取方法, 特征值大于1或者累计方差占总方差的85%以上, 根据以上方法得出提取前两个主成分是合理的。
第一主成分的表达式为:
Fac1=0.989X1+ 0.488X2 +0.003X3 + 0.989X4 +0.231X5 +0.947X6
第二主成分的表达式为:
Fac2=-0.028X1-0.828X2 +0.899X3 -0.028X4 +0.952X5 +0.026X6
将各年数据代入Fac1和Fac2的表达式就可得到Fac1和Fac2的值。
第四步, 计算系统的综合水平值。
根据F= 3.204Fac1+2.345Fac2, 计算人口子系统的发展水平值。同理可得到经济和社会子系统的发展水平值。
人口、经济和社会子系统综合发展水平值见表5。由表5可以看出韶关市的人口、经济和社会子系统的综合发展水平趋势。2000—2010年人口子系统的综合发展水平值按时间顺序呈现先上升后下降的趋势, 2005以前是上升趋势, 以后呈下降趋势;经济和社会子系统的综合发展水平值按时间顺序呈现明显的上升趋势。2008年以后人口系统水平又变回负值, 2010年水平与2000年相差不大, 说明人口方面2005年以前是不断进步的, 2005年之后水平呈现逐年退步趋势;经济、社会子系统的综合发展水平在2007年之后发展速度不断加快, 这与韶关市经济、社会等各方面建设取得了与日俱增的进步密切相关。
四、人口、经济和社会子系统协调发展状况分析
韶关市人口、经济和社会子系统的综合发展水平值呈现出不同趋势, 其中经济、社会子系统的变化趋势相同, 而人口子系统综合发展水平值在2005年出现下降趋势, 如果韶关市人口水平继续沿此下降趋势发展, 人口问题可能会成为制约韶关市经济社会快速发展的不利因素。
导致人口系统综合发展水平值出现先升后降趋势的主要原因也反映了韶关市人口发展方面的一些问题:
首先, 常住人口总量减少。尽管韶关市户籍人口每年都以低速增长, 但常住人口数量自2005年292.26万人以后不断减少, 2010年人口数量降至282.66万人, 这主要是由韶关市劳动力流出数量大于流入所致。农村劳动力大量转移对于缓解资源压力、农民增加收入等方面发挥了重要作用, 但过度转移对于当地的经济社会发展也会带来诸多负面影响, 如本地农业生产劳动力减少、留守老人、留守儿童等一系列问题。高素质劳动力大量转移对本地经济发展也带来了不利影响, 例如韶关市本地有多所技校, 但是很多毕业生在就业时首选珠三角等经济发达地区, 只有少部分毕业生留在本地工作, 从而不利于韶关市工业发展。
其次, 在校生人数呈下降趋势。尽管韶关市高等学校、中等职业学校、技工学校的在校人数在2000—2010年间呈增长趋势, 但由于多年来人口只维持低水平增长率, 小学在校生人数由2000年的338916万人降至2010年的207299万人, 在校生总人数自2005年开始呈现下降趋势。这个问题也在一定程度上反映了韶关市当前人口结构的不合理现象。
第三, 城镇化水平无显著提高。在人口指标体系中户籍人口中非农人口的比例自2005年之后一直下降, 2000—2010年间韶关市城镇化水平变化不大, 因此, 韶关市在今后的发展过程中需要加快城镇化进程, 以工业化带动城镇化, 提高城镇化水平。
摘要:人口是影响一个地区经济社会发展的重要因素之一, 正确评价分析人口对当地经济社会发展的促进作用和阻碍作用, 对该地区制定科学的人口发展战略和政策、充分发挥人口因素的有利作用、促进经济又好又快发展具有重要意义。
关键词:人口,经济,社会发展,协调性评价
参考文献
[1]苏海红.青海省人口与经济社会协调发展问题研究[J].西北人口, 2005 (1) .
[2]田成诗, 盖美.关于人口与经济社会协调发展状态的研究[J].统计与信息论坛, 2004 (4) .
[3]赵德滋.关于人口与经济社会协调发展指标体系的探讨[J].南京人口管理干部学院学报, 1996 (1) .
[4]冯国生, 吕振通, 胡博.SPSS统计分析与应用[M].机械工业出版社, 2011.