数据聚集

2024-06-05

数据聚集(精选7篇)

数据聚集 篇1

本研究针对当前计算数据中心的动态数据分配及数据分配方法中存在的问题,其局限性、公式复杂、算法运行效率低等弊端,提出动态数据聚集算法,并结合计算数据中心实际情况进行改进,仿真研究动态数据聚集算法在计算数据中心的应用效果。

1 浅析动态数据聚集算法

动态数据聚集算法中,聚类是数据挖掘中一类重要的问题,在许多领域有其应用之处。聚类的定义是:给定一个由许多数据元素组成的集合,将其分为不同的组(类、簇),使得组内的元素尽可能相似,不同组之间的元素尽可能不同[1]。在动态数据聚集算法中,其数据流具有以下特点:数据实时到达,数据到达次序独立,不受系统控制;数据量巨大,不能预知其大小;单次扫描,数据一经处理,除非特意保存,否则不能再次被处理。由于计算机数据中心数据流的特点,要求数据压缩表达,并且可以迅速、增量地处理新到达的数据,要求该算法可以快速、清晰地识别离群点。

2 计算数据中心应用动态数据聚集算法实现

对动态聚类算法中的数据流,在每一个时刻,动态聚类算法的在线部分连续地读入一个新的记录,将多维的数据放置到对应多维空间中的离散密度网格。在第一个gap时间内产生了初始簇[2],然后,算法周期性地移除松散的网格以及调整簇,由于不可能保留原始数据,D Stream将多维数据空间分为许多密度网格,然后由这些网格形成簇,如图1所示。

文本中,假设输入的数据有d维,在计算机数据中心空间中定义数据:

在动态数据聚集中,可以将d维的空间S划分成密度网格。假设对于每一维,它的空间是Si,i=1,2,⋯,d被分为pi个部分。

这样数据空间S被分成了个密度网格。每个密度网格g是由,ji=1,2,…,pi组成,将它表示为:

一个数据记录X=(x1,x2,…,xd)可以映射到下面一个密度网格g(x):

根据网格密度变动,更新网格密度,当一个新的计算机中心数据到网格,接收数据记录,设一个网格g在时刻tn接收到一个新的数据记录,假设g接收到最后的数据记录是在时刻tl(tn>tl),那么g的密度可以按下面的方式更新:

计算数据中心动态数据聚集算法的实现中,其最基本的计算思想是,在聚集数据的最中心对象,对n个对象给予k个划分区域;并且此代表对象也可以被称为中心点,而其他的对象为非代表对象,反复使用非代表对象替换代表对象,从而动态地找出数据中心更好的中心点,改进数据中心聚类质量。自定义一个函数:

一个非中心点代替一个中心点的总代价s

3 计算数据中心动态数据聚集算法仿真研究

3.1 仿真试验环境搭建

对于计算数据中心动态数据聚集算法,针对动态数据聚集算法实施仿真试验,在一台带有1.7 GHz CPU和256 MB内存的PC上进行,用VC++6.0以及一个Matlab图形接口实现动态聚类算法仿真。研究其算法性能及结果准确性,数据中心将10个节点存放于一个机架上,环境参数见表1。

在动态数据聚集算法仿真试验中,可以设置:Cm=3.0,Cl=0.8,λ=0.998,β=0.3,使用两个测试集。第一个就是测试数据集,也是一个真实的数据集合KDD CUP-99,它包含由MIT林肯实验室收集的网络入侵数据流。也使用人工数据集测试动态聚类算法的伸缩性。这个人工数据集包含的数据数量从35 000~85 000不等,簇的数目被设定为4,维度的数目范围[3]从2~40。在动态数据聚集算法仿真试验中,将数据集的所有属性规格化为[0,1]。每个维度被均匀地分为多个数据段,每个段的长度为len。

3.2 仿真结果评估

将评估计算数据中心的动态聚类质量与效率与传统计算数据中心的算法进行比较,本文算法能提高算法时间、空间效率,对于计算中心高速的数据流不损失聚类质量,有独特的优势,准确地识别实时数据流,并实施演化行为。计算数据中心动态聚类算法与传统数据分配算法相比,数据准确性得到提升,为98.2%,常规数据分配准确率为83.6%,有明显优势(P<0.05)。计算数据中心动态聚类算法的应用,可以提升计算数据中心系统的稳定性。

4 总结

基于计算机数据中心数据分配中,在数据中心网络技术基础上,由于数据节点可以自由移动,这样会降低数据分配进度,从而降低系统性能,导致计算机数据中心网络维护开销过高。故此,针对计算机数据中心数据分配,应该改进传统静态数据流数据方法,实现动态数据聚集,减少信息冗余,提升数据计算效率及安全性。

参考文献

[1]李文华,罗霄,张乐.飞控计算机数据模拟器的设计与实现[J].现代电子技术,2014,37(11):104-106.

[2]徐小龙,杨庚,李玲娟,等.面向绿色云计算数据中心的动态数据聚集算法[J].系统工程与电子技术,2012,34(9):1923-1929.

[3]郭建波.动态数据聚集算法探究:以绿色云计算数据中心为研究方向[J].中国信息化,2013(4):108-109.

[4]翁祖泉,张琪.基于物联网海量数据处理的数据库技术分析与研究[J].物联网技术,2014,4(6):88-90.

[5]李海涛.云计算用户数据传输与存储安全研究[J].现代电子技术,2013,36(20):24-26.

[6]杨波.基于云计算的作战数据存储系统研究[J].现代电子技术,2013,36(19):12-14.

数据聚集 篇2

提起我们五(1)班,全校师生都会竖起大拇指,称赞几句。夸我们班风好,学习棒。当然啦,我们班人才辈出,“名家”汇聚呢!

先说说我们公认的“大作家”蔡璨吧!别看他平日少言寡语的,可写起作文来还真有两下子!不论老师出什么作文题,当别的`同学都还在咬着笔苦苦思索时,蔡深却早已动笔了。“沙沙沙”,不一会儿就是两三张稿纸。正如他所说的,“思如泉涌,下笔有神”。翻开蔡璨的作文本,里面全是“优”。不光这些,他的作文还多次见报、人书呢!“翻译家”李侃也不简单。每次英语侧验总是遥遥领先。有一次观看展览会,一位外国朋友拉住了黄小艳,“叽哩呱啦”说了一大堆英语,像是要问路。黄小艳一急,忙叫来李侃。李侃沉着地用一口流利的英语和老外交谈。那外国朋友紧皱的眉头顿时舒展开来,一个劲地说:" Good一good,thank you”你说李侃棒不棒。“画家”胡秋辰虽说调皮,有时还喜欢闹点恶作剧,可他的画画水平还真不赖!一次,学校进行当场作画比赛。胡秋辰画的一幅《桂林山水》,班得了师生们的一致好评。那一座座俊秀的山峰倒映在绿似翡翠的漓江中。画中山青水秀,让人身临其境。现在,胡秋辰己获得业余画画五级证书呢!

无线传感网数据聚集技术分析 篇3

1 无线传感网数据聚集技术及其分类

通常情况下, 一个无线传感器网络中都要部署大量的传感器节点, 节点对环境进行感测并把数据传送到汇聚节点, 在汇聚节点中对数据进行融合。如果在数据到达汇聚节点之前进行融合, 就可以大大减少网络中传送的数据包的数量, 有利于节约传感节点的能量消耗。这种技术被称为数据聚集技术。Elena Fosolo等人[1]这样定义数据聚集技术:“数据聚集是指在一个多跳的网络中, 采集并路由数据的过程, 其中的数据处理由中间节点进行, 目的在于减少资源的消耗 (尤其是能量) , 从而延长网络的生命周期”。

数据聚集技术在很大程度上受网络拓扑结构的影响。因此, 可以按网络结构的类型把数据聚集技术分成平面型与层次型两大类, 如图1所示。层次型数据聚集技术又可以进一步分成基于簇、基于链、基于树、基于网格等类型。

2 平面型数据聚集技术

在平面网络中, 每一个传感节点在网络中的作用是相同的, 数据聚集是由以数据为中心的路由完成的。汇聚节点以某种路由协议向传感节点发出一个查询消息, 拥有与该查询相匹配数据的节点就把响应消息发送回汇聚节点。

常见的平面型路由协议有:

泛洪协议Flooding和Gossiping协议;

信息协商传感协议SPIN;

定向扩散协议Directed Diffusion;

谣传路由Rumor routing;

基于梯度的路由Gradient-Based Routing。

平面型数据聚集技术对汇聚节点的通信与运算负担导致能量的过快消耗。一旦汇聚节点能量耗尽而死亡, 传感网络的功能就遭到破坏。平面型数据聚集技术只适用于小型网络。

为提高网络的规模性和能量有效性, 人们提出了各种层次型的数据聚集技术。

3 层次性数据汇聚技术

3.1 基于簇的数据汇聚技术

在这种层次型网络中, 网络节点被划分为簇, 每个簇都有一个特殊的节点称为簇首, 簇首节点负责聚集本簇节点的数据并把数据发送到汇聚节点, 这里介绍3种基于簇的数据汇聚协议:

1) LEACH (Low-Energy Adaptive Clustering Hierarchy)

LEACH[2]协议是第一个基于簇的数据汇聚协议, LEACH在运行过程中不断的执行簇的重构过程, 每个簇的重构过程可以用回合来描述, 每个回合可以分成两个阶段, 簇的建立阶段和传输数据的稳定阶段。在簇建立阶段, 进行簇的划分和簇首的挑选。选出的簇首向所有节点广播自己成为簇首的消息, 其他节点根据收到的消息强度决定加入哪个簇, 并告知相应的簇首, 完成簇的建立过程。

在稳定阶段, 传感器节点将数据传送到簇首节点, 簇首对采集的数据进行数据融合后再将消息传送到汇聚节点。

稳定阶段持续一段时间后, 网络将重新进入簇的建立阶段, 进行下一轮的簇的重建, 如此不断循环。

2) CAG (Clustered Aggregation Technique)

CAG[3]根据用户查询误差阈值和节点数据的空间相关性进行分簇, 从而减少传送的数据量, 满足查询的精度要求。CAG以两种模式工作:交互模式和流模式。在交互模式下, CAG对每一个查询产生一个响应;在流模式下, 对一个查询CAG生成周期性的响应。CAG的交互模式只是利用了数据的空间相关性, 数据传送的路径与查询传播的路径正好相反。在交互模式下, 每次用户需要新的数据都需要广播一个查询。

在流模式下, CAG同时利用了数据的空间相关性和时间相关性, 在流模式下只要把查询一次性注入到网络中, CAG会每隔设定的时间间隔就产生一次对该查询的响应。

3) EECDA (Energy Efficient Clustering and Data Aggregation)

EECDA[4]结合了基于簇的能量有效性的路由和数据聚集功能, 以增强网络的寿命和稳定性, 它主要用于异构的无线传感器网路。EECDA平衡了能量的消耗, 延长了网络生命周期, 与LEACH相比, 它使网络生命周期延长了51%。

3.2 基于链的数据聚集技术

在基于簇的网络中, 如果簇首节点离汇聚节点较远, 则与汇聚节点的通信会消耗更多的能量, 而在基于链的数据聚集技术中, 数据只传送给最近的邻居节点。

1) PEGASIS (Power Efficient GAthering in Sensor Information System)

PEGASIS[5]是对LEACH协议的改进, 在PEGASIS中没有簇的建立与簇首节点的选取, 每个节点用信号强度来判断到其邻居节点的距离, 然后调节自己发送信号的强度, 使只有最临近的节点才能接受到信号, 采集到的数据以点对点的方式传递、融合并最终被送到汇聚结点。传感节点与汇聚结点的通信是轮流进行的, 从而使能量消耗均衡分布在每个节点上。

2) COSEN (Chain Oriented Sensor Network for Efficient Data Collection)

COSEN[6]是基于链的两层结构的路由方案。与PEGASIS相比, 它减少了传送延迟和能量消耗。它将传感器节点按地理位置划分为多个低层的链, 对每一个低层链, 具有最多剩余能量的节点被选作链首。高层的链及其链首在低层链的基础上形成, 在数据通信时, 所有的普通节点与PEGASIS中的节点一样传送融合的数据, 通过低层链首和高层链首把数据发送到汇聚节点。COSEN引入了冗余的传送路程, 特别是在最靠近汇聚节点的地方。

3) Enhanced PEGASIS

该方法将整个传感网区域以汇聚节点为中心分成多个同心扇环, 对每个同心扇环, 用基于PEGASIS的贪心算法建立一个节点链。在数据通信时普通节点与PEGASIS中一样传送数据, 然后从最外层的扇环向内层的扇环, 进行一个多跳的, 链首对链首的数据传输过程。

3.3 基于树的数据聚集技术

在基于树的数据聚集技术中, 节点以树状结构进行组织, 汇聚结点就是树的根节点, 其他节点把数据聚集并传送到根节点, 能量有效的树的构建是这类技术的关键。

1) TREEPSI (Tree-based Efficient Protocol for Sensor Information)

在传送数据之前, 首先在所有节点中选择根节点, 并构建树。构建树的方法有两种, 第一种方法是由汇聚节点, 计算出路径, 并广播到全网络;第二种方法是在每个节点内建一个算法, 所有节点分布式构建相同的树。

在初始阶段, 根节点使用标准的树遍历算法向其子节点发送控制包来建立数据收集过程。在数据传输阶段, 所有的叶节点传送数据到它们的父节点, 父节点收到数据后与它们自己的数据融合后再发送到它们的父节点, 这一过程不断重复直到根节点收到数据。最后由根节点直接发送到汇聚节点。路径建立后可进行多轮的通信, 直到根节点耗尽能量死亡, 再构建一个新的树状路径。

2) TCDGP (Tree-Clustered Data Gathering Protocol)

TCDGP[8]协议结合了簇与树两种结构, 它把数据采集的过程分成三个阶段:第一阶段, 建立簇的阶段;第二阶段构建基于簇的树;第三阶段数据聚集阶段。

第一阶段, 由汇聚结点建立簇并选择簇首。汇聚节点按照节点的位置选取簇首, 簇首必须位于一个簇的中心位置。第二阶段以各个簇首为根节点在簇内构建最小生成树。

在数据聚集阶段, 节点传送数据到高层的节点, 高层的节点对数据融合后发送到更高层的节点, 这一过程反复进行直到数据聚集到根节点。

3.4 基于网格的数据聚集技术

在基于网格的数据聚集技术中, 每个网格中数据聚集节点是固定的, 它负责收集网格中所有节点的数据, 而网格中的传感节点之间并不相互通信, 网格中的任一个传感节点都可以轮流充当数据聚集节点, 直到最后一个节点死亡为止, 这种技术尤其适用于军事监控和气象预测等。

1) GROUP

GROUP[9]协议是一种能量有效的基于簇的路由协议, 节点被分成多个的簇, 每个簇选出一个节点作为簇首, 所有的簇首组成一个虚拟的簇网格。汇聚节点发出的查询经由簇首传送到每个节点, 节点中与查询相匹配的数据再通过簇首路由回汇聚节点。

GROUP动态地选择簇首, 数据的传送包括三个过程:簇网格的构建过程、查询的传递和数据的传递。

簇网格构造阶段, 在网络中的所有的汇聚节点中选择一个汇聚节点作为主汇聚节点, 由主汇聚节点根据节点的位置初始化簇网格的构建, 主汇聚节点比其他汇聚节点更靠近网络的中心, 从而保证在最短的时间内构建网格。

查询传送阶段, 查询分别通过有限广播和单播传送, 汇聚节点发送两类查询:位置感知的查询、位置不知的查询。位置不知的查询由汇聚节点发送至邻近的簇首节点。位置感知的查询发送到离目的区域最近的下游簇首。

在数据传输阶段, 传感节点从簇首接收到查询后, 检查收集的数据, 如果数据与查询相匹配, 就发送到簇首, 数据由簇首逐级传递到它的上游簇首, 直到抵达发出查询的汇聚节点为止。在GROUP中, 数据聚集由簇首承担, 以减少数据传输量。

2) ATCBG (Aggregation Tree Construction Based On Grid)

ATCBG在GROUP基础上有所改进。在ATCBG中, 以汇聚节点为网格的中心来构建聚集树。整个网络划分成网格, 每个网格就是一个簇, 簇首节点的选取是综合考虑节点的剩余能量、到网格中心的距离等因素来确定。数据的聚集由簇首承担, 所有的簇首节点构成树状结构。汇聚节点初始化聚集树的构建。

由于簇首节点接收与融合数据, 消耗的能量较多, 必须定期更换。当簇首节点的剩余能量低于阈值时, 它会发出更换簇首的消息。

在数据传输时, 传感节点首先把收集的数据发送到簇首节点, 簇首把从簇成员节点, 以及子节点处收到的数据进行融合后, 发送到它的父节点, 这一过程不断进行, 直到数据传递到汇聚节点。

4 结束语

数据聚集技术通过减少无线传感网络中传输的数据量, 提高了网络的能效, 延长了网络的生命周期。数据聚集技术与网络结构密切相关, 文章基于网络的拓扑结构, 分析了无线传感网中的数据聚集技术。这些技术关注于提高网络性能, 如数据延迟、数据精度、能量消耗等。目前这些工作主要集中在数据聚集的路由机制方面, 而对异构性以及诸如单跳、多跳等通信模式对数据聚集的影响等方面的研究还不够多。这些将是今后研究的方向之一。此外, 与数据聚集相关的安全性, 数据延迟等方面还有很多的工作值得进一步的研究。

摘要:无线传感网通常包含大量的低成本传感器节点, 传感节点的感测、能量、计算、通信能力都受到严格限制。重要的是最小化网络中的数据传输量, 从而延长网络生命周期, 提高信道利用率。数据聚集技术被认为是一种有效的方法, 它能减少数据传输量, 降低能量消耗。文章基于网络拓扑结构分析了主要的数据聚集技术, 并基于目前的研究提出了今后的研究方向。

关键词:无线传感网,数据聚集,能量有效

参考文献

[1]Fasolo E., Rossi M., Widmer J.and Zorzi M[J].IEEE Wireless communication, 2007.

[2]W.Heinzelman, A.Chandrakasan, and H.balakrishnan.An Energy-Efficient Communication Protocol for Wireless Microsensor Net works, Proc[J].Hawaii Conf.System Sciences, Jan, 2000.

[3]SunHee Yoon and Cyrus Shahabi, March.The Clustered AGgregation (CAG) Technique Leveraging Spatial and Temporal Correlations in Wireless Sensor Networks[J].ACM Transactions on Sensor Networks (TOSN) , Vol.3, Issue 1, No.3, 2007.

[4]D.Kumar, T.C.Aseri, R.B.Patel.EECDA:Energy Efficient Clustering and Data Aggregation Protocol for Heterogeneous Wireless Sensor Networks[J].Int.J.of Computers, Communications&Control, ISSN 1841-9836, E-ISSN 1841-9844 Vol.VI (2011) , No.1 (March) , pp.113-124

[5]Lindsey S Raghavendra C.PEGASIS Power-efficient Gathering in Sensor Information System[J].In Proceeding of the IEEE Aero space Conference.Montana IEEE Aerospace and Electronic Systems Society 2002, pp.1125-1130.

[6]N.Tabassum, Q.E.K.M.Mamun, and Q.Urano.COSEN:A Chain Oriented Sensor Network for Efficient Data Collection[J].Proceed ings of the Global Telecommunications conference, Vol.6, pp.3525-3530, 2003

[7]S.S.Satapathy and N.Sarma, TREEPSI:tree based energy efficient protocol for sensor information, Wireless and Optical Communica tions Networks[J].IFIP International Conference 11-13 April 2006.

[8]Gurpreet Singh Chhabra, Dipesh Sharma.Cluster-Tree based Data Gathering in Wireless Sensor Network[J].International Journal of Soft Computing and Engineering (IJSCE) ISSN:2231-2307, Volume-1, Issue-1, March 2011

形容人群聚集的成语 篇4

才墨之薮:指文人聚集的地方。

成团打块:聚集成群。

鸱张蚁聚:喻指如鸱嚣张,如蚁聚集。

呼群结党:谓招引同伙,聚集成帮。

胡越一家:喻居地远隔者聚集一堂。犹言四海一家。

交颈并头:形容许多人聚集在一起。

不期而会:期:约会。未经约定而意外地遇见或自动聚集

聚众滋事:聚集一帮人到处惹事,制造纠纷

绿林大盗:指聚集山林的强盗

柳街花巷:旧指妓院或妓院聚集之处。同“柳巷花街”。

柳陌花丛:旧指妓院或妓院聚集之处。

柳陌花街:旧指妓院或妓院聚集之处。

柳陌花衢:旧指妓院或妓院聚集之处。

柳衢花市:旧指妓院或妓院聚集之处。

柳巷花街:旧指妓院或妓院聚集之处。

柳营花市:旧指妓院或妓院聚集之处。

柳营花阵:旧指妓院或妓院聚集之处。

花阶柳市:〖解释〗指妓院聚集的街市。

花街柳陌:〖解释〗指妓院聚集的街市。

花街柳市:〖解释〗指妓院聚集的街市。

花衢柳陌:〖解释〗指妓院聚集的街市。

济济一堂:形容很多有才能的人聚集在一起。

连珠合璧:比喻人才或美好的事物聚集在一起。

绿林好汉:绿林:古代山名。指聚集山林反抗封建统治阶级的人们

宾客如云:来客多得如聚集的云层。形容客人多。

大庭广众:大庭:宽大的场地;广众:为数很多的人群。指聚集很多人的公开场合。

蜂屯蚁聚:形容成群的人聚集在一处。

广庭大众:广庭:宽大的场所。众人聚集的公共场所。

欢聚一堂:欢乐愉快地聚集在一起。

鸟集鳞萃:鳞:鱼;萃:聚集。象鸟类或鱼类那样聚集在一起。形容聚集得很多。

人众胜天:聚集众人的力量,可以战胜大自然。

人山人海:人群如山似海。形容人聚集得非常多。

胜友如云:胜友:良友。许多良友聚集一处。

万箭攒心:攒:聚集。象万枝箭聚在心上。形容万分伤痛。

万头攒动:形容许多人聚集在一起争着看。

琼堆玉砌:好象白玉堆砌而成。比喻白玉般的事物聚集一处。

群蚁附膻:比喻许多臭味相投的人聚集在一起。

人文荟萃:人才和文物众多,并聚集在一地

沙鸥翔集:水鸟时而飞翔,时而聚集。

雾集云合:形容众多的事物聚集在一起。

烟聚波属:如烟之相聚,波之相接。比喻接连而来,聚集甚多。

云合雾集:比喻聚集迅速。

云屯飙散:聚集如云,分散如风。形容来往迅疾。

云屯鸟散:如云聚集,如鸟飞散。形容众多的人忽聚忽散。

云屯雾集:像云和雾那样聚集。形容数量多而集中。

云屯蚁聚:形容众多的人物聚集在一起。

云屯雨集:形容众多的人聚集在一起。

蜂附云集:〖解释〗比喻人众从各处聚集。

车马辐辏:〖解释〗辐辏:形容人或货物像车轮上的辐条聚集在车毂上一样。指车马集聚拥挤。

车马骈阗:〖解释〗车马聚集很多。形容非常热闹。

蜂屯乌合:〖解释〗形容人群蜂蚁般杂乱地聚集在一起。同“蜂屯蚁聚”。

蜂屯蚁附:〖解释〗形容人群蜂蚁般杂乱地聚集在一起。同“蜂屯蚁聚”。

蜂屯蚁杂:〖解释〗形容人群蜂蚁般杂乱地聚集在一起。同“蜂屯蚁聚”。

蜂攒蚁集:〖解释〗形容人群蜂蚁般杂乱地聚集在一起。同“蜂屯蚁聚”。

蜂攒蚁聚:〖解释〗形容人群蜂蚁般杂乱地聚集在一起。同“蜂屯蚁聚”。

蔚然成风:蔚然:草木茂盛的样子,引伸为荟萃、聚集。指一件事情逐渐发展盛行,形成一种良好风气。

言谈林薮:林薮:人或物聚集的地方。指关于谈论的人。

云兴霞蔚:象云霞升腾聚集起来。形容景物灿烂绚丽。

云蒸霞蔚:蒸:上升;蔚:聚集。象云霞升腾聚集起来。形容景物灿烂绚丽。

众毛攒裘:攒:聚;裘:皮衣。聚集许多小块皮毛,能够缝成一件皮衣。比喻积少成多。

蜂拥蚁屯:形容人群蜂蚁般杂乱地聚集在一起。同“蜂屯蚁聚”。

蜂拥蚁聚:形容人群蜂蚁般杂乱地聚集在一起。同“蜂屯蚁聚”。

雨凑云集:〖解释〗比喻众多的人或事物聚集一处。

百虑攒心:各种思虑一齐聚集在心头。

鲍鱼之次:卖咸鱼的店铺。鱼常腐臭,因以喻恶人之所或小人聚集之地。亦作“鲍鱼

蜂合豕突:〖解释〗如群蜂聚集,似野猪奔突。比喻众人杂沓会合,横冲直撞。

蜂合蚁聚:〖解释〗形容人群蜂蚁般杂乱地聚集在一起。同“蜂屯蚁聚”。

蝇飞蚁聚:〖解释〗比喻人众多杂沓,聚集一处。

蝇营蚁聚:〖解释〗像苍蝇样往来飞逐,像蚂蚁般纷纷聚集。比喻不顾谦耻,趋炎附势,到处钻营。

蝇攒蚁聚:〖解释〗比喻人众多杂沓,聚集一处。同“蝇飞蚁聚”。

众星拱月:〖解释〗许多星星聚集、环绕着月亮。比喻众人拥戴一人或众物围绕一物。同“众星攒月”。

众星攒月:〖解释〗许多星星聚集、环绕着月亮。比喻众人拥戴一人或众物围绕一物。

悲喜交加:交加:聚集。悲伤和喜悦的心情交织在一起

四方辐辏:〖解释〗比喻四方的人才或货物像车轮上的辐条聚集在毂上那样汇集到一处。后引申为从各方聚集的意思。

蚁聚蜂屯:〖解释〗屯:聚集。像蚂蚁、螽斯一般集聚。比喻集结者之众多。

荟萃一堂:荟萃:草木繁茂,引申为杰出人物或精美东西的聚集;一堂:指在一个厅堂里。形容难逢的盛会。

探竿影草:探竿、影草、都是渔民使鱼聚集后下网捕捞之法。佛教禅宗借以喻启发性的随宜施教。

集腋成裘:腋:腋下,指狐狸腋下的皮毛;裘:皮衣。狐狸腋下的皮虽很小,但聚集起来就能制一件皮袍。比喻积少成多。

绿林豪客:绿林:西汉王匡、王凤为首的“绿林军”。指聚集山林、反抗官府的武装力量指伤害人民的群盗股匪。

拔萃出群:拔:超出。萃:原谓草丛生的样子,引伸为聚集,指聚集在一处的人或物。超出一般,在众人之上。

出类拔萃:拔:超出;类:同类;萃:原为草丛生的样子,引伸为聚集。超出同类之上。多指人的品德才能。

荆棘丛生:荆棘:荆条蒺藜;丛:聚集成堆。荆蔓蒺藜成群地生长出来。比喻前进道路阻碍很大,困难极多。

九合一匡:合:聚集。匡:救助,帮助,拯救。“九合诸侯,一匡天下”的省略语。原指春秋时代齐桓公多次会合各国诸侯,称霸华夏,使混乱不安的政局得以安定。后用以形容有卓越非凡的治国才能。

山川米聚:谓从高处下望山川起伏,如米之聚集。语本《后汉书・马援传》:“I援橛钟诘矍埃聚米为山谷,指画形势,开示众军所从道径往来,分析曲折,昭然可晓。”

更多热门文章推荐:

1.形容人群聚集的成语

2.形容人多的成语新篇

3.形容热闹场面的成语

4.形容过去的成语

5.形容人非常多的成语及解释

6.描写场面气势的成语

7.出自韩愈的成语大全

8.与动物有关的成语

9.第四个字是云的成语

数据聚集 篇5

数据聚集(如求平均数,最大值,最小值等)是自组织网络中的一种重要数据操作[1,2],如无线传感器网络作为自组织网络的一种,用于数据聚集时需要将传感器感知的数据通过多跳传播到基站节点。对于自组织网络中的数据聚集应用,可采用网内数据聚集方法:将部分数据处理放到网内节点上,从而有效减少网内的数据传输流量。一些典型的数据聚集系统,如TinyDB[3]和Cougar[4],用于在一种自组织网络(如无线传感器网络)中管理数据聚集操作。在这些数据聚集系统中,无线传感器网络被组织成数据聚集树,用于数据向根节点的路由,路由过程中进行网内数据聚集。树状结构对于网内数据聚集是一种传输能量的有效结构,树状结构可以减少网络节点间某些无用的数据传输操作。而相对于将所有数据都传输到基站节点进行汇集的方法,网内数据聚集方法能够有效减少节点间的数据传输。

虽然上述TinyDB[3]和Cougar[4]等数据聚集系统采用了“数据路由树结构”实现数据向基站节点的路由,但该树结构只是用于实现数据向基站节点的路由,并没有为数据聚集在中间结点上的执行路径作优化。

提出一种为网内数据聚集优化的路由重构方法,该路由重构方法包含三个阶段过程,通过路由树的遍历、父节点的优化和路由树的动态维护,实现一种为数据聚集优化的动态路由树,通过沿着动态路由树进行数据聚集,实现一条动态最优的网内数据聚集执行路径。

1 网内数据聚集

在网内数据聚集中,分布在不同节点上的数据向某个基站节点汇聚,数据的聚集运算发生在数据向基站节点的路由过程中。网内数据聚集中的聚集运算满足下列两个性质:

首先,聚集函数的结构满足:<z>=f(<x>,<y>),这里f是聚集函数,x, y, z分别代表不同的数据集合。这里表示聚集函数能够在两个或多个数据集合上进行运算,产生聚集结果集。

其次,期望聚集函数满足f(x ∪ y) = g(f(x), f(y)),这里f和g分别代表不同的聚集函数,这里表示聚集函数在多个数据子集的并集上的运算可以转化为在不同节点上分别对数据子集进行聚集运算。

利用聚集函数的上述性质,可以实现一种网内数据聚集模式:该运算模式将聚集运算放在存储数据子集的节点和需要产生最终聚集结果的基站节点之间的一些中间节点上,从而实现一种数据向基站节点路由的同时进行数据聚集的运算方式,由于聚集运算可将多个大的子集聚集为一个小的数据集,这种网内数据聚集运算模式能够有效减少数据向基站节点路由过程中的数据传输量。

在下面部分,将介绍如何利用网内数据集实现数据聚集查询。

设G<Ni, B, Q, P(), Data(), f>是一个包含自组织网络节点的图,Ni表示图中的节点,B表示基站节点,用于发出聚集查询Q,并接收查询结果集,P(Ni) 表示节点Ni的父节点,Data(Ni)表示节点Ni上的数据,f表示聚集函数。当基站节点将数据聚集查询广播到所有节点后,节点Ni将数据传播到节点P(Ni)并在其上进行数据聚集操作,即z = f(Data(Ni),Data(P (Ni)),其中z表示数据聚集结果集,以上操作在中间节点上递归执行,直至聚集结果抵达基站节点B。

2 基于动态路由树的数据聚集算法

实现动态路由树可分为三个阶段: (1)路由树遍历;(2)最优父节点发现;(3)路由树维护。

在路由树遍历传播过程中,一个"Tree Travel"消息被沿着树结构路由到每个节点。当一个节点接收到"Tree Travel"消息后,他向其邻居节点广播一个"Father Discovery"消息,当该节点接收到所有邻居节点对"Father Discovery"的返回消息后,可以为自己选择一个新父节点。通过这种方式实现路由树的重构。

"Tree Travel"消息包含下述属性: <"Tree Travel", distance)>.

"Father Discovery"消息包含下述属性: <"Father Discovery",distance)>.

每个节点维护两个本地变量:father和distance。distance变量用于记录本地节点到基站节点的距离,father变量用于记录对于数据聚集最优的父节点标识。为方便算法描述,对于节点X上的这两个本地变量,分别表示为X.father和X.distance。

为创建动态路由树,首先假设网络中已存在一个数据聚集路由树,然后通过路由树的遍历和新父节点发现过程重新创建一个为数据聚集优化的路由树。这里需要指出的是,对于每一个数据聚集查询都有一个数据路由树:如果有n个数据聚集查询,则有n个不同的数据路由树。

2.1 路由树遍历

为实现路由树遍历,基站首先广播一个"Tree Travel"消息到其邻居,该消息中携带的distance属性值初始化为0,邻居节点按照表1所示操作将该消息转发到所有网络节点上:当某一节点收到"Tree Travel"消息后,若数据可本地获得,则本地的distance变量值设置为0,并将路由到本地的"Tree Travel"消息中的distance值重新初始化为0,然后继续转发到其节点;若数据无法本地获得,则将路由到本地的"Tree Travel"消息中的distance值增1,然后据此修正本地distance变量,最后向其邻居节点广播一个"Father Discovery"消息。

通过这种遍历方式,每个节点的distance值的大小由距离数据节点的远近决定,这样,每个节点可以根据邻居节点上的distance值选择最优父节点。最优父节点的具体选择过程可参考第2.2节的描述。

其中圆圈代表自组织网络中的节点,带阴影的圆圈表示存储有数据的节点,节点旁边的数字表示节点上运行路由树遍历过程后所记录的distance变量的值。

2.2 最优父节点发现

当一个节点收到"邻居节点"传来的所有"Father Discovery"的响应消息后,它开始根据这些消息重构自己的新的父节点。这里,新的父节点是返回具有最小"distance"值的响应消息的那个邻居节点。具体的最优父节点发现过程如表2所示。

按照表2所示的最优父节点发现过程,针对图1进行最优父节点发现后构造的新的路由树,如图2所示。

2.3 路由树维护

对于动态自组织网络,节点可以随时随处随机移动,同时节点可能随时进入或离开网络。对于这种情况,需要一种同台路由树维护算法,使得路由树可以实时适应当前网络拓扑结构的变化,产生最优的数据网内计算路径。路由树的维护根据下面两种情况分别进行处理:

主动路由维护:当节点X准备退出网络时,向其所有子节点发送"Father Discovery"消息,其子节点按照表2所示操作重新寻找各自的新的最优父节点。

被动路由维护:当节点X发现其父节点失败(发送"hello"消息时无响应)时,向自己发送一个新的"Father Discovery"消息,实现最优父节点的再发现(其消息处理过程见表2)。

3 性能分析

假设自组织网络中的节点数为N,路由树的遍历过程的消息传递量为O(N)。设网络密度为D,即每个节点的平均邻居个数为D,则父节点发现所需消息传递量为O(N*D),则本算法的路由树重构过程所消耗的信息传递量为O(N*(D+1))。

4 结束语

已有数据聚集系统,如TinyDB[3]和Cougar[4],使用"数据路由树结构"实现数据向基站节点的路由,但该树结构只是用于实现数据向基站节点的路由,并没有为数据聚集在中间结点上的执行路径作优化。提出一种为网内数据聚集优化的路由重构方法,该路由重构方法由三个阶段过程,通过路由树的遍历、父节点的优化和路由树的动态维护,实现一种为网内数据聚集优化的动态路由树。即通过沿着动态路由树进行数据聚集,实现一条动态最优的网内数据聚集执行路径。

提出的这种基于动态路由树的网内数据聚集算法,通过对路由数据的动态重构和维护,解决了自组织网络的节点动态变动问题,以及树结构为数据聚集操作优化的问题。

通过该算法的复杂性分析可知,本算法为进行动态路由树的维护只需付出多项式级别的节点间的消息传递,实现对自组织网络中的数据聚集路径的优化:通过中间节点上的优化的数据聚集操作,减少响应数据聚集查询所需的数据向基站节点的传输过程中的带宽占用量。

摘要:数据聚集是自组织网络(Ad-hoc network)中的一个重要的数据操作。一些用于无线传感器网络的数据聚集系统,通常在网络节点中构建一个路由树结构,用于传感器感知的数据向基站节点的路由和数据在网内节点上的处理。路由树结构是一种用于网内数据聚集的简单通用的算法,但这些数据聚集系统中的路由树结构并没有为数据聚集作优化。提出一种基于动态路由树的网内数据聚集算法,通过对路由数据的动态重构和维护,解决自组织网络的节点动态变动问题,和树结构为数据聚集操作优化的问题。性能分析表明,动态路由树的创建和维护只需多项式级别的节点间的消息传递,为自组织网络中的网内数据聚集实现执行路径的优化。

关键词:网内数据聚集,动态路由树重构,执行路径,自组织网络

参考文献

[1]Intanagonwiwat C,Estrin D,Govindan R,et al.Impact of networkDensity on Data Aggregation in Wireless Sensor Networks[C]//CDCS 0'2:Proceedings of the 22nd International Conference on Dis-tributed Computing Systems(ICDCS'02)Washington,DC,USA,2002.IEEE Computer Society,2002:457.

[2]Madden S,Szewczyk R,Franklin MJ,et al.Supporting aggregatequeries over ad-hoc wireless sensor networks[C]//WMCSA'02:Proceedings of the Fourth IEEE Workshop on Mobile Computing Sys-tems and Applications,Washington,DC,USA,2002,49.IEEEComputer Society,2001:346-356.

[3]Madden S R,Franklin MJ,Hellerstein J M,et al.Tinydb:an ac-quisitional query processing system for sensor networks[J].ACMTrans.Database Syst,2005,30(1):122-173.

数据聚集 篇6

随着经济的快速发展, 我国城乡居民收入差距已成为亟待解决的问题, 受到国内外学者的高度关注。已有关于城乡收入差距的研究主要集中在城市化、城市规模对城乡收入差距的影响, 制度与政策对城乡收入差距的影响, 以及产业聚集对城乡收入差距的影响等几个方面。

关于城市化、城市规模对城乡收入差距影响的研究。James等用美国79个都市区的截面数据, 研究影响收入差距的因素, 结果显示, 收入差距随城市规模的扩大而上升。[1]陆铭和陈钊用1987~2001年中国省级面板数据研究城市化、城市倾向的经济政策对城乡收入差距的影响, 结果表明城市化能显著缩小城乡收入差距;经济开放、政府对经济活动的参与和非国有化都会扩大城乡收入差距。[2]程开明研究了城市规模对城乡收入差距的影响, 结果显示, 不同的城市规模对城乡收入差距的影响存在较大差异, 总体而言, 中心城市规模越大, 区域城乡收入差距越小, 城乡收入差距随城市规模变动呈现出U型特征;分散型中心城市的结构有利于缩小区域城乡收入差距, 城市经济发展水平越高, 城乡收入差距越小。[3]

关于制度与政策对城乡收入差距影响的研究, 主要集中在收入分配制度、城市偏向政策等对城乡收入差距的影响。Hussain等以家庭数据为研究样本, 研究了中国的城乡收入的构成及城乡收入不平等的原因, 发现收入分配制度加剧了城乡收入差距。[4]陆铭和陈钊的研究表明, 政府财政支出结构对城乡收入差距有显著影响。[5]武小龙和刘祖云用江苏市级面板数据, 运用固定效应模型, 从城市偏向理论的视角对城乡差距的形成原因进行了研究, 发现城市偏向政策越明显, 城乡收入差距越大。[6]陈斌开和林毅夫的研究显示, 旨在鼓励资本密集型部门优先发展的政府战略, 造成城市部门就业需求的相对下降, 进而延缓城市化进程, 农村居民不能有效地向城市转移, 导致城乡收入差距扩大。[7]

从产业聚集视角研究城乡收入差距的文献并不多见。康伊认为产业聚集可以作为一种工业组织形式来推动农村经济的发展, 从而缩小城乡收入差距。[8]蔡武和陈望远用空间面板计量方法, 对中国省区城乡收入差距与产业聚集等因素的关系进行了实证研究, 发现非农产业聚集规模扩大了城乡收入差距。[9]蔡武等研究了产业聚集、劳动力流动对城乡收入差距的影响, 认为伴随城市产业集聚规模效益的变动, 农村劳动力流动影响城乡收入差距的轨迹呈现倒U型的阶段性特征;产业集聚、劳动力流动等因素通过影响本省区城乡差距, 进一步将作用传递和迭加到相邻省区城乡差距之上;城市产业集聚过程中我国农村劳动力流动对城乡居民收入的影响目前尚处于极化效应阶段, 农村劳动力流动通过加速城市产业集聚扩大了城乡收入差距。[10]

综上所述, 关于城乡收入差距的研究取得了一定的成果, 但尚未得出一致的结论。特别是从产业聚集视角研究城乡收入差距的结论还存有争议。本文将在充分考虑城市化水平、制度与政策等相关变量影响的条件下, 重点研究产业聚集对城乡收入差距的影响, 并揭示其中的内在机理。

二、计量模型与数据说明

1. 计量模型设定

影响城乡居民收入差距的因素有很多, 主要因素包括人力资本水平、城市化水平、对外开放程度、政府政策偏向等。为了能够较为精确地测度产业聚集对城乡居民收入差距的影响, 有必要引入上述变量作为控制变量。我们把计量模型设定为如下形式:

其中, Gap为城乡居民收入差距;Agglo为产业聚集水平;Edu、Urban、Trade、Gov是控制变量, 分别表示人力资本水平、城市化水平、对外开放程度和政府政策偏向, 下标i和t分别表示省份和年份, 其他字母则分别表示常数项、变量的系数和残差。

2. 变量选取与指标说明

下面, 对变量的理论基础及指标作简要说明。

(1) 城乡居民收入差距 (Gap) 。借鉴已有研究的通常做法, 我们用城市居民可支配收入与农村居民纯收入之比来衡量城乡居民收入差距, 其中, 城市居民可支配收入是城市居民总收入扣除税费和社会保险支出以后的收入, 农村居民纯收入是农村居民总收入扣除经营家庭生产的费用、生产工具折旧和税费以后的收入。

(2) 产业聚集水平 (Agglo) 。改革开放30多年来, 我国产业聚集水平不断提高, 产业主要聚集在东部沿海地区和中西部地区的城市范围。近年来, 随着城市产业聚集水平的逐渐提高, 城市的土地租金、劳动力价格等生产要素逐渐上升, 交通拥挤、环境污染等外部不经济问题越来越严重。[11]因此, 部分城市的产业开始向农村扩散, 从而提高了农村的产业聚集水平, 促进了农村地区劳动生产率的提高, 进而在一定程度上促进了农村居民收入水平的提高。另一方面, 伴随产业聚集的一个非常显著的特征是劳动力从农村向城市流动。2012年, 我国流动人口数量达2.36亿人, (1) 相当于每6个人中有一个是流动人口。根据要素价格均等化理论, 在劳动力自由流动情况下, 要素价格逐渐趋同, 即农村居民的劳动报酬与城市居民逐渐趋同。基于上述分析, 我们认为产业聚集能够缩小城乡居民收入差距。

衡量产业聚集的方法较多, 区位商能较好地从区域角度研究产业聚集水平及其特性, 因此, 我们采用区位商方法来测度各省制造业聚集水平。地区i在t时刻的产业聚集水平Aggloit= (Mit/Pit) / (Mt/Pt) , 其中Mit表示地区i在t时刻的制造业从业人数, Pit表示地区i在t时刻的总就业人数, Mt和Pt分别表示t时刻全国制造业从业人数和全国总就业人数。一般而言, 这一指标的数值越大, 表明制造业在该地区的聚集水平越高。我们预期, 产业聚集对城乡收入差距有负的影响, 即随着产业聚集水平的提高, 城乡收入差距随之减小。

(3) 人力资本水平 (Edu) 。一般来说, 一个地区人力资本水平越高, 劳动生产率也相对较高, 该地区居民劳动所获得的报酬相对较多, 因此, 城乡人力资本水平的差距可能是导致城乡收入差距的一个重要因素。张伟和陶士贵研究发现, 人力资本水平的差异显著影响城乡收入差距, 教育、食品、医疗等方面的支出差距越大, 城乡收入差距越大。[12]我们借鉴张伟和陶士贵的做法, 用城乡教育、食品、医疗保健总和之比来衡量城乡人力资本水平的差异。我们预期, 城乡人力资本水平差距对城乡居民收入差距有正的影响, 即城乡人力资本水平差距越大, 城乡收入差距越大。

(4) 城市化水平 (Urban) 。城市化水平对城乡收入差距的影响存在两种相反的作用。一方面, 城市化有利于缩小城乡收入差距。在二元经济中, 只要存在着城乡期望收入差距, 劳动力就会流动, [13]而劳动力的流动则会增加城市劳动供给, 降低城市劳动力的工资;同时, 农村劳动力向城市转移就业将得到除了农村土地收入以外的额外收入, 提高农村居民的收入水平。另一方面, 城市化可能会拉大城乡收入差距。这主要是因为在城市化进程中, 劳动力、资金等大量生产要素为了获得较高的收益率, 不断向城市聚集, 使得城市的聚集效应更为明显, 生产效率进一步提高, 从而导致城市居民收入增加, 拉大城乡居民收入差距。城市化对城乡收入差距的影响取决于上述两种相反作用的对比, 有待进一步的实证检验。借鉴李小玉和郭文的做法, 我们用城镇人口占总人口的比重来衡量城市化水平。[14]

(5) 对外开放程度 (Trade) 。改革开放30多年来, 我国的经济体制逐渐从计划经济转变为社会主义市场经济, 对外开放程度越来越深。对外开放程度越深的地区, 外资相对容易流入, 出口相对较多, 经济发展水平和就业情况也相对较好, 因此, 居民收入水平相对较高。由于外资利用、对外贸易等活动主要集中于城镇地区, 有利于提高城镇居民的收入, 因此, 对外开放程度越深的地区, 城乡收入差距可能越大。借鉴已有研究的通常做法, 我们用商品出口值占地区生产总值的比重来衡量地区对外开放程度。我们预期, 对外开放程度对城乡收入差距有正的影响, 即对外开放程度越高, 城乡收入差距越大。

(6) 政府政策偏向 (Gov) 。多年来, 在城乡经济关系上, 我国一直实行对城市的偏向政策, 经济建设主要以城市为主, 在一定程度上忽视了农村建设。虽然, 近年来国家提出并实施新农村建设, 大力开展新型城镇化建设, 取得了一定的效果, 但城乡发展的二元结构还没有根本改变。政府对城市的政策偏向促进了城市发展, 提高了城市居民的收入水平, 也在一定程度上拉大了城乡居民收入差距。我们借鉴武小龙和刘祖云[14]的做法, 以城镇固定资产投资占全社会固定资产投资比重来衡量政府政策偏向, 该指标值越大, 表明对城市发展的政策偏向越严重。我们预期, 政府政策偏向对城乡收入差距的影响为正。

数据来源:本文共选取了2001~2012年中国31个省 (自治区、直辖市) 的各变量数据作为样本数据, 数据来源于《中国统计年鉴2002~2013》、国研网区域经济数据库、中国资讯行高校财经数据库等。

我们对各主要变量的数据特征作简要的描述统计, 统计结果见表1。

三、计量结果及分析

1. 计量方法

面板数据 (PanelData) 的估计方法包括固定效应 (FixedEffect) 模型、随机效应 (RandomEffect) 模型和可行的广义最小二乘法 (FGLS) 等多种形式, 各种形式都有其特定的假设前提。可行的广义最小二乘法 (FGLS) 可以在一定程度上消除可能存在的异方差性和序列相关性, 能够得出较为可靠的估计结果。[15]为了得到较为可靠的结论, 我们参照国内外学者的通常做法, 分别采用固定效应 (FE) 、随机效应 (RE) 和可行的广义最小二乘法 (FGLS) 进行估计。分析软件选用Stata12.0。

2. 回归结果

各解释变量的系数估计结果见表2, 其中第1列、第2列和第3列分别为固定效应模型 (FE) 、随机效应模型 (RE) 和可行的广义最小二乘法 (FGLS) 的估计结果。

注: (1) 系数下方的值是t值; (2) ***、**、*分别表示变量系数通过了1%、5%、10%的显著性检验。

根据Hausman检验, chi-值为正数, (2) 因此, 我们在固定效应模型和随机效应模型之间选择随机效应。[16]也就是说, 根据Hausman检验, 随机效应的结果优于固定效应。通过比较表2中第2列和第3列, 可以发现随机效应和可行的广义最小二乘法 (FGLS) 两种方法得出的解释变量系数的符号完全一致。由于可行的广义最小二乘法 (FGLS) 在一定程度上消除了可能存在的异方差性和序列相关性, 因此我们认为可行的广义最小二乘法 (FGLS) 得出的结果是稳健的。

通过观察第3列, 可以得出以下几点发现:

第一, 在控制了人力资本水平、城市化水平、对外开放程度和政府政策偏向因素等条件下, 产业聚集的系数为-0.0942, 且通过了1%的显著性检验, 表明产业聚集缩小了城乡居民收入差距, 这与我们的预期一致;并且产业聚集水平提高1%时, 城乡居民收入差距将减少0.0942%左右。产业聚集缩小城乡居民收入差距的原因可能在于以下两个方面:一是伴随着新型城镇化建设, 农村的产业发展水平逐渐提高, 在一定程度上提高了农村的产业聚集水平。产业聚集水平的提高促进了农村劳动生产率的提高, 进而在一定程度上促进了居民收入水平的提高。二是近年来伴随着产业的聚集, 大量劳动力相对自由地从农村向城市流动, 在城市就业使得农村劳动力在保持农村土地收入基本不减少的情况下, 增加了额外的收入, 这在客观上提高了农村居民的收入, 缩小了城乡收入差距, (3) 这种结果符合要素价格均等化理论。

第二, 人力资本水平的系数为0.3632, 且通过了1%的显著性检验, 显示人力资本水平差距对城乡居民收入差距有显著正的影响, 城乡人力资本水平差距越大, 城乡收入差距也就越大。这说明城乡人力资本水平的差距是导致城乡收入水平差距的一个重要原因。

第三, 城市化水平对城乡居民收入差距的影响系数为负, 且通过了1%的显著性检验, 表明城市化水平的提高会缩小城乡居民收入差距, 这与陆铭和陈钊的研究结果一致。如前所述, 城市化对城乡收入差距的影响存在两种相反的作用:一是有利于缩小城乡收入差距, 二是拉大城乡收入差距, 其综合效应取决于两种相反作用的对比。回归结果反映出我国的现实状况是:城市化缩小城乡收入差距的作用力较大, 拉大城乡收入差距的作用力较小。因此, 城市化水平的提高, 缩小了城乡收入差距。

第四, 对外开放程度对城乡居民收入差距的影响系数为正, 且通过了1%的显著性检验, 表明对外开放程度扩大了城乡收入差距。这主要是因为外资利用、对外贸易等活动主要集中于城镇地区, 对城镇的经济增长和就业水平贡献较大, 提高了城镇居民的收入, 拉大了城乡收入差距。

第五, 政府政策偏向对城乡居民收入差距的系数为正, 且通过了1%的显著性检验, 这表明政府政策偏向扩大了城乡居民收入差距。其原因在于政府在固定资产投资及财政支出等多方面对城市采取偏向政策, 极大促进了城市发展, 提高了城市居民的收入水平, 拉大了城乡居民收入差距;并且, 由政策偏向导致的城乡发展差距具有一定的“累积效应”, 或者称为“路径依赖”, 即城市快速发展带来的各种收益将进一步吸引各种要素聚集, 从而逐渐形成以城市为中心的经济“增长极”, 而这一“增长极”会由于要素的进一步聚集, 其地位被不断固化, 进一步深化城乡二元格局, 拉大城乡发展差距。

3. 稳健性检验

为了进一步验证上述回归结果的稳健性, 我们借鉴一些学者的做法, 如范剑勇、刘修若等, [17,18]采用制造业就业密度 (人/平方公里) 衡量产业聚集水平, 进行稳健性检验。t时刻地区i的制造业聚集指数Aggloit=Mit/Sit, 其中, Mit为地区i在t时刻的制造业就业人口 (人) , Sit为地区i在t时刻的面积 (平方公里) 。显然, 制造业就业密度的数值越大, 表明制造业在该地区的聚集水平越高。分析数据和选用的计量分析软件与前文保持一致, 各解释变量系数估计结果见表3。

注: (1) 系数下方的值是t值; (2) ***、**、*分别表示变量系数通过了1%、5%、10%的显著性检验。

首先比较表3的第1列和第2列的固定效应与随机效应结果, 根据Hausman检验, chi-值为正数, (4) 因此, 我们在固定效应模型和随机效应模型之间选择随机效应。通过观察随机效应结果可以发现, 产业聚集的系数为负值, 通过了1%的显著性检验;人力资本水平的系数为正值, 也通过了1%的显著性检验。这两个变量的系数符号与表2的广义最小二乘法 (FGLS) 的估计结果一致, 但其余变量未通过显著性检验。如前所述, 为了在一定程度上消除可能存在的异方差性和序列相关性, 我们继续采用可行的广义最小二乘法进行估计, 估计结果见表3的第3列。由于该方法在一定程度上消除了可能存在的异方差性和序列相关性, 因此, 我们认为这一方法得出的结果是稳健的。通过观察表3第3列可以发现, 产业聚集对城乡居民收入差距的弹性系数依然为负数, 这进一步证实了我们的预期, 即产业聚集缩小城乡居民收入差距。此外, 其余解释变量的符号与表2中第3列完全相同, 且均通过了1%的显著性检验, 表明人力资本水平、对外开放程度和政府政策偏向扩大城乡居民收入差距, 城市化水平缩小城乡居民收入差距。

四、结论与政策建议

本文用2001~2012年中国省级面板数据研究了产业聚集对城乡居民收入差距的影响, 得出以下结论:

在控制人力资本水平、城市化水平、对外开放程度和政府政策偏向等条件下, 产业聚集对城乡居民收入差距有显著的负向影响, 即产业聚集缩小城乡居民收入差距;城市化水平对城乡居民收入差距也有显著的负向作用;城乡人力资本水平差距、对外开放程度和政府政策偏向对城乡居民收入差距有显著的正向影响作用, 即城乡人力资本水平差距、对外开放程度和政府政策偏向导致城乡居民收入差距的扩大。

基于上述结论, 提出以下政策建议:

1. 适度提高城市产业聚集水平, 有条件的地区引导产业向农村扩散

由前面的分析可知, 在劳动力自由流动的情况下, 产业聚集有助于缩小城乡居民收入差距。因此, 在劳动力自由流动的情况下, 应根据城市的产业基础、资源禀赋和区位优势, 培育本地区具有比较优势的产业, 促进产业集群式发展, 提高产业聚集水平;另一方面, 当城市的产业聚集水平达到一定的临界点之后, 产业聚集带来的交通拥挤、环境污染等外部不经济问题会越来越严重, 此时, 应当积极引导城市的部分产业向农村地区扩散, 充分利用农村地区成本低廉的劳动力和其他有利于产业发展的因素, 逐步提高农村的产业聚集水平, 促进农村地区劳动生产率的提高, 进而在一定程度上促进农村居民收入水平的提高, 逐步缩小城乡居民收入差距。

2. 改革户籍制度, 促进劳动力流动

当前, 应大力推进户籍制度改革, 促进劳动力相对自由地流动, 使得农村劳动力可以从劳动生产率相对较低的农业部门转移到劳动生产率较高的非农产业部门, 在城市获得较高的劳动报酬, 提高农村居民的收入, 进而缩小城乡居民收入差距。

3. 加快农村城镇化建设, 提高城市化水平

如前所述, 城市化水平的提高有利于缩小城乡居民收入差距, 因此, 应加大力度推进农村城镇化建设。城镇化建设不是空中楼阁, 在一定程度上要以产业发展为基础。加快城镇化建设, 势必会拉动农村的产业发展。产业发展将使得农村大量的剩余劳动力在当地就业成为现实。因此, 城镇化建设能够充分发挥我国劳动力丰裕的优势, 逐步提高农村劳动力的就业水平, 进而提高农村居民的收入水平, 缩小城乡收入差距。

4. 加大农村人力资本投入和政策扶持力度, 提高农村人力资本水平和资本投入水平

数据聚集 篇7

我国沿海地区成熟型产业产业聚集广泛存在, 广东、江苏、浙江、福建和江苏等省的经济都呈现出产业地方化、地方专业化的特征。如, 广东顺德的家电产业、家具产业和花卉产业聚集。IT产业则聚集于苏州和东莞。浙江温州的柳市是我国低压电器之都, 绍兴和桥是我国轻纺之城, 福建晋江是我国鞋业聚集地, 诸暨大塘是我国袜都。根据梁琦的计算, 我国产业中区位基尼系数高于美国产业区位基尼系数最高水平0.5的产业包括烟叶复烤业、钟表制造、航空航天器制造、铁合金冶炼、炼焦业、文化办公用机械设备制造业、轻有色金属冶炼业和玩具制造业。这些产业大多已经处于成熟期, 对于不受资源约束的产业, 随着其他区域市场条件具备和技术扩散, 这些产业将逐步扩散, 为什么产业扩散没有发生?为什么这些产业聚集持续存在?

关注产业聚集的文献很多, 有代表性的包括:马歇尔的外部性溢出模型;迈克尔波特的钻石模型;克鲁格曼的报酬递增———预期模型。关于产业聚集形成机制最经典的分析是马歇尔关于产业地方化的论述, 他注意到三种产业聚集的原因:劳动力共享、投入品专业化和专业化信息局部溢出。阿罗和罗默都认为特定产业聚集在特定地区可以促进知识在产业不同公司间扩散和交流, 从而增加研究、发展和创新活动。萨克森宁对硅谷高科技产业聚集的分析进一步深化了这一分析。她强调先行企业的人力资源、技术和市场信息溢出。克鲁格曼认为产业聚集的形成主要是由于市场规模、外部经济和规模聚集良性互动形成的累积循环机制。根据马歇尔———阿罗———新产业区学者的模型, 产业发展初期, 创新较为重要时产业聚集才会发生, 这不能解释我国成熟性产业聚集的普遍存在。根据克鲁格曼模型, 规模经济是产业聚集持续发展的重要条件。而我国这些产业聚集, 如轻纺等产业企业规模普遍不大, 不满足克鲁格曼锁定产业聚集的累计循环机制发生的基本条件。

根据波特的产业聚集模型, 市场需求、生产要素供给、产业支持体系和本地化竞争相互作用决定产业竞争力, 可以认为这一模型与奥地利学派发现理论结合可以很好地解释为什么某些成熟产业聚集于特定区域并持续存在, 并解释了我国区际趋同滞后的根本原因。

二、基本解释

本文认为应该从资源禀赋和分工区位考虑企业区位的选择, 种子企业落户某一地区是企业家对地域优势发现的结果, 需求和资源是种子企业生存和产业聚集发展的基础, 产业聚集的持续发展则是市场扩张拉动和配套产业持续增强竞争力良性互动的结果。

产业聚集的发展总是与某些先行企业获得竞争优势有关。资源、交通优势使得某些区域首先被选择。地域资源优势和贸易区位优势被企业家发现, 种子企业被建立。先行企业的发展过程中, 企业家在实践中逐步形成企业家素质, 并不断发现市场需求, 通过满足市场需求上的竞争优势, 带动配套产业和市场形成与发展。在这一过程中, 企业不断积累企业赖以获得竞争优势的核心能力和资源, 形成专门化资本、特质人力资本, 积累技术知识, 建立投入和销售网络。随着市场信息、技术知识局部溢出和人力资本流动, 聚集区域进入成本降低, 模仿进入推动企业集群形成。聚集优势推动企业集群发现和更好、更及时地满足推动市场扩张和产业聚集发展的基础, 同时, 集群需求推动当地中间品生产和配套产业竞争与竞争力提升。随着集群竞争力的提升, 产业市场份额进一步提升, 该地市场网络的竞争位次逐步提升。大市场规模和发展决定产业集群的规模与发展, 进而决定配套产业集群的产业规模和发展, 市场和生产良性互动推动产业聚集发展, 其中市场的扩张与收缩起决定性作用。

综上所述, 在产业聚集形成与发展过程中, 资源、交通条件和企业家的偶然发现对先行企业的建立和发展发挥着非常重要的作用。同时, 诚如波特强调的, 挑剔的消费者的压力、大市场与配套产业发展竞争力加强之间的良性互动对产业聚集的持续发展尤为关键。

三、湛江对虾产业聚集形成分析

目前湛江是中国最大的对虾养殖基地, 最大的虾苗、加工及出口基地, 年创造产值101.6亿元, 创造就业岗位40万个, 涉及人口一百多万。湛江对虾产业已经形成了育苗、养殖、流通、加工、出口一条龙产业链, 成为我国典型的外向型纵向一体化型成熟产业聚集。

从资源条件和区位条件来看, 湛江是天然良港, 有利于出口。从对虾养殖所需主要不可移动资源来看, 湛江可利用浅海养殖面积约1.2万平方公里, 由于湛江地处冷暖海流交汇处, 海水自净能力强, 一年中气温高于15℃有三百多天, 年平均气温22.8℃, 适合对虾生长, 一年四季可生产对虾。1978年, 国家为出口创汇的首批建立的四大国有对虾养殖公司之一落户湛江。国有对虾公司———廉江养虾集团公司的创立推动了市场和配套产业的发展。我国对虾产业发展初期, 对虾主要来自野生虾捕捞。1980年, 对虾工厂化育苗技术由中国水产科学研究院黄海水产研究所研究成功, 这极大推动了对虾养殖业发展。1985年廉江建立了第一个万亩虾塘。1984年, 湛江市坡头镇创立集体建设虾塘, 公开招标分配承包权的制度。在承包收入的激励下, 村集体整修虾塘, 通过招投标分配承包权的体制在湛江扩散开来。对虾养殖的发展推动对虾饲料和虾成品加工、对虾贸易的需求。1986年, 广东第一家海水对虾配合饲料生产厂———廉江市养虾集团公司珊瑚饲料厂成立。生产推动销售, 1988年国联水产创始人李忠把湛江对虾打入北京市场, 对虾加工企业发展加速。1994年, 霞山水产市场建立, 随着湛江对虾产量增长和外贸发展, 水产市场交易逐步增长。1996年, 对虾产业危机期间的廉江养虾集团遭遇危机, 大批人才流出。廉江对虾养殖集团带动下, 人才扩散、配套企业发展和出口渠道完善推动湛江对虾产业迅速发展。

在廉江养虾集团带动下, 湛江养虾产业配套体系不断发展, 湛江市的市场优势、加工企业优势和资源产权创新使养虾遍布其周边的东海岛、南三岛等地, 相关产业不断完善。

四、湛江对虾产业聚集的持续发展分析

湛江对虾产业发展之初, 由于我国居民收入水平低, 对虾市场主要是日本、美国和欧洲等发达国家, 产业聚集具有典型的外向型特征。湛江市霞山水产市场的龙头地位使其成为国外采购的重要渠道, 产业配套体系的发展和出口扩张的良性互动推动湛江对虾产业持续发展。

我国很多成熟型产业聚集大都是外向型产业聚集, 通过与国外大市场对接获得大市场规模, 支撑庞大的产业规模。企业生存和发展的关键在于融入分工体系, 而各种形式的市场形式, 如会展、商品城的发展是企业与需求对接的必需条件。目前, 湛江已经成为我国对虾交易的中心, 交易额高达近百亿元人民币, 占全国对虾交易总量的三分之二。市场渠道优势和加工企业推动的产业整合使出口稳步推动, 出口的扩张推动了产业规模的持续扩张。湛江对虾出口贸易稳居全国首位, 且比重不断增加。1999年湛江市虾类产品出口206吨, 金额58万美元, 2002年出口11 143吨、金额6539万美元。2006年湛江对虾出口6.03万吨, 产值3.3亿美元, 占全国对虾出口量和出口额的比例分别为22.3%和24.6%;2007年进一步增至5亿美元, 占全国对虾出口额的39%以上。据湛江海洋与渔业局统计, 2009年1至5月份, 尽管遭遇严重的金融危机, 全市仍然完成对虾出口1.23万吨, 创汇6436万美元, 分别比上年同比增长84%和77%, 创历史新高。对虾出口的高涨支持了对虾价格稳定, 市场规模的扩张推动了产业规模扩张。养殖规模扩张推动了湛江饲料行业、加工行业的进一步发展。

湛江出口的发展是湛江对虾加工企业技术进步及其市场开拓推动的。从2002年开始, 美国FDA对中国输美的冻虾等水产品“逢柜必检”, 不断提高贸易技术壁垒, 这使得中国出口冻虾的企业“谈虾色变”, 水产品出口锐减, 不少企业纷纷停止出口, 中国输美冷冻养殖南美白对虾出口几乎为零。此时, 以出口对虾为主的湛江国联水产开发有限公司花重金把自己的产品送到全球权威检测机构“SGS”新加坡公司检测, 检测证明了湛江对虾的品质, 湛江对虾经受住了市场检验。随后, 国联水产积极应对美国对中国虾类产品的反倾销, 赢得诉讼, 国联水产成为全球对美国出口冻虾产品唯一获零关税的企业。为应对日本、美国、韩国、加拿大对产自中国湛江对虾出口贸易采取了一系列限制性措施, 湛江水产加工企业积极应对, 推动公司加农户模式, 提升各环节质量控制。同时, 积极获得各种国际认证, 据统计, 2006年全市有41家对虾出口企业, 其中获欧盟认证13家, 美国HACCP认证37家, 俄罗斯认证17家, 另有获日韩认证的若干家。出口压力推动湛江对虾产品质量升级, 产品市场竞争力提升, 进而推动了湛江对虾出口和整个产业发展。

市场扩张是产业扩张的根本动力, 湛江产业聚集持续扩张的主要原因在于高水平出口加工企业发展推动的产业升级提升了湛江对虾产业市场份额, 市场扩张决定了产业发展。

五、结语

不可否认的是, 湛江对虾产业的发展有其自身的独特性, 样本具有一定特殊性。但是, 湛江对虾产业聚集的形成和持续发展基本反映了我国成熟期产业聚集形成和持续存在的一般特征, 我们依然可以得出我国成熟型产业聚集持续存在的主要原因及其政策涵义。

第一, 对虾养殖是资源相关型产业, 对虾养殖要求具有相应的养殖水面, 这一要求是很多区域所不具备的。所以, 湛江产业聚集的持续发展出口与其龙头企业带动的出口市场的扩张有关, 还可能是资源限制导致的。但是, 与湛江具有同样养殖条件区域的竞争是存在的, 这表明湛江产业聚集的形成和持续发展具有产业聚集的一般特征。尽管, 其他产业聚集形成过程中, 市场区位和企业家偶然发现可能会扮演更为重要的角色。

第二, 成熟期产业聚集规模和产业市场规模有关。如汽车制造等产业虽然集中度较高, 但多数制造厂分散分布, 扩张期产业会扩散到满足一定市场规模的区域。在产业发展生命周期中, 随着市场规模由小到大, 再从大到小, 产业由聚集到扩散, 最后重新聚集。产业发展初期聚集创新优势较大。随着产业市场扩张, 满足最小规模的地区较多, 产业扩散。但是, 产业发展晚期, 产业又会重新收缩于特定区域。产业聚集将会聚集于交通枢纽和人口密集中心。

第三, 由于产业聚集的优势具有一定的持续性, 落后地区要争取某些产业的扩散实现经济追赶, 不能寄希望于区域趋同的自发力量。要积极发现新的适宜的产业机会, 同时, 对具备市场条件的现有产业, 要积极吸引其扩散投资, 利用区域趋同机制实现赶超。

摘要:我国成熟性产业聚集广泛存在。聚集区域由市场扩张、上下游产业之间的良性互动形成的聚集经济优势将会阻滞产业扩散。地方品牌优势、配套产业优势和市场优势是成熟型产业聚集持续存在的主要原因。

关键词:趋同滞后,产业聚集,持续存在机制

参考文献

[1]梁琦.产业聚集论[M].北京:商务印书馆, 2004.

[2]鲁诚至.地域专门化形成机制研究[J].生态经济, 2006 (10) .

[3]Marshall A.经济学原理[M].陈良璧, 译.北京:商务印书馆, 1965.

[4]Porter M.国家竞争优势[M].李明轩, 邱如美, 译.上海:中信出版社, 2007.

[5]Krugman P.Geography and Trade[M].MIT Press, 1991.

上一篇:喷射成形下一篇:幸福的粮食