城市规模分布

2024-08-13

城市规模分布（精选7篇）

城市规模分布篇1

1 前言

城市规模分布研究是城镇体系规划和城市规划工作的重要基础,理性地分析区域中城市规模分布的变化特征及其趋向对于准确预测城市人口规模以及合理地确定城镇体系结构具有非常重要的意义[1]。城市规模包括城市人口规模和城市用地规模[2],城市人口是城市研究中反映城市规模最多的统计指标,现有的人口统计指标在反映城市的实际规模时存在很多缺陷[3]。

城市用地面积的大小是反映城市规模的另一个重要指标。一般情况下,城市用地面积越大,说明该城市对土地的需求量越大,即城市规模越大,城市人口规模与用地规模存有高度线性相关性。Schweitzer等用城市用地面积来研究城市规模及其变化,取得了较为理想的结果[4,5]。谈明洪利用统计资料,以建成区面积衡量城市规模,研究了面积位于前200位的中国城市的规模特征[6]。利用遥感手段获取城市用地面积能更为客观地反映城市的实际用地规模。本文选取4个不同时段的遥感影像,在城市用地提取的基础上,采用首位度、城市规模基尼指数、分维数、结构容量等指标对安徽省的城市规模分布变化及其空间特征进行了深入的分析。

2 数据来源和城市用地提取

选用1987年、1995年、2000年、2006年4个时段的Landsat—5/TM数据,将遥感影像进行校正、增强后,采用目视解译的方法提取每个城市的城市用地。这里,城市用地包括各种建筑物、构筑物、城市中的水体、绿化用地、道路和广场等。城市用地在TM图像上光谱特征明显,分类精度较高,分类结果能够满足需要,信息提取后的结果和专题图分别见图1和图2。在研究的时段范围内,安徽省的城市曾做过几次调整,选取最近一次调整后的城市,即目前的17个地级市作为研究对象。

3 研究方法

3.1 城市首位度

城市首位度是指区域内首位城市与第二位城市的人口规模的比率,即首位度=P1/P2,也叫“两城市指数”[2]。杰斐逊将最大城市拥有压倒优势人口数量的城市规模分布称为首位分布,并用51个国家城市数据证明首位度一般在3左右。随后的学者为了弥补首位度计算过于简单的缺陷,改进了指标的计算方法,提出4城市指数和11城市指数,4城市指数=P1/(P2+P3+P4),11城市指数=2P1/(P2+P3+...+P11)。式中,P1为最大城市人口数,P2-P11为第二位至第十一位城市的人口数。4城市指数和11城市指数,比只考虑两个城市更能全面地反映城市规模分布的特点。它们的共同点在于都抓住第一大城市与其它城市的比例关系,因此有作者把它们和两城市指数一起统称为“首位度指数”。正常的4城市指数和11城市指数都应该是1,而两城市指数应该是2。

城市首位度是用于测量城市规模的主导性指标,能够反映出区域城市序列中首位城市的优势度。一般来说,首位城市的发展状况很大程度上代表了一个地区总体发展的基本情况。城市首位度越高,其凝聚力和集聚功能越强,带动地区经济的能力就越强,该区域的发展规模和经济效能也越大,本文用城市用地面积代替人口来表达城市首位度。

3.2 城市规模基尼指数

基尼指数最早用于衡量社会财富分配是否公平的指标[7]。加拿大约克大学地理系的马歇尔教授将其计算方法应用于研究不同规模城市的发育成长状况,并首次提出了城市基尼指数的概念[1]。城市规模基尼指数表示为:

undefined

式中,G为城市规模基尼指数,T为城市体系中每个城市之间人口规模之差的绝对值总和,S是整个城市体系中大于某种规模城市的总人口,n为满足某种规模城市的个数。基尼指数的取值范围在0—1之间,基尼指数越接近0表明城市规模越分散,越接近1表明城市规模越集中。

3.3 位序—规模法则

对于一个城市的规模和该城市在其国家所有城市按人口规模排序中的关系所存在的规律,叫做位序—规模法则[2]。城市的位序规模可用下面的公式表示,即:

X1≥X2≥X3≥…≥Xr≥…≥Xn (2)

式中,r为城市位序,r=1,2,3…n,Xr为城市规模(如城市人口规模)。如果将城市从大到小按人口规模排序,位序—规模法则常见的表达式为:

Pi=P1Ri-q (3)

式中,Pi为位序,是Ri的城市人口规模;P1为理论上的首位城市人口;Ri为城市i的位序;q为Zipf维数。

城市地理学中常用的帕雷托(Pareto)公式把位序—规模法则表示为[2]:

N=aP-D (4)

式中,N为大于门槛人口规模的城市数量;D为城市规模分布的维数,为系数;P为城市人口规模。

城市规模分布的维数(D)变化可以反映城市系统的均衡度。均衡度越大,各城市之间的规模就越接近,相互之间的差距就越小,城市规模越均衡,城市首位度就越低。相反,城市规模就越不均衡,城市的首位度就越高。

3.4 分形理论

分形研究是当代理论地理学的重要研究方法之一,城镇体系的等级结构存在无标度性,具有分形特征[8]。帕雷托(Pareto)公式的常系数D可被看做是分数维。城市规模分布的分维值(D)和公式(3)中的q存在如下关系,即:

D×q=R2(R2为判定系数) (5)

运用帕雷托公式对17个城市用地的位序规模进行定量描述,以城市用地规模为横坐标,帕雷托公式可以表示为:

N=aLi-D,(D>0) (6)

其相应的双对数曲线的表达式为:

InN=Ina-D(InLi) (7)

式(6)和(7)中,N为大于某城市用地规摸的城市数目,a为系数,D为城市用地规模分布的维数,Li为位序i的城市用地规模。Ina被称为结构容量,对城市体系而言,城市体系复杂、总体规模大,结构容量也就大;相反,城市体系简单、总体规模小,结构容量也就越小[9]。

4 安徽省城市规模分布特征

4.1 首位城市发展强劲,小城市发展不足

安徽省城市首位度的各项指标明显增大。两城市指数从1987年的2.056增加到2006年的3.479(表1),已经超过了正常值2;4城市指数从1987年的0.853增加到2006年的1.248;11城市指数从1987年的0.702增加到2006年的1.096;4城市指数和11城市指数都超出了正常值1。从位序—规模分析结果可见,首位城市近年来用地规模明显加大,2006年首位城市用地规模达到326.80km2,超过了理论值249.12km2(表2)。说明安徽省的城市首位度在不断提高,中心城市凝聚力不断增强,这对带动整个区域城市体系的发展是有利的。

结合位序—规模曲线(图3)可见,首位城市用地规模增加幅度明显加快,低位次城市发展不足,位序规模曲线在高位次城市上扬幅度增大,低位次城市规模逐渐收敛,两极有分化趋势,这在规模—位序双对数图中表现的更为明显(图4)。表2列出了1987年、1995年、2000年、2006年17个城市用地面积的位序—规模拟合函数、判定系数(R2)和其它指标。判定系数都在0.855之上,说明城市用地的规模分布基本符合位序—规模法则。

拟合结果可用幂函数关系曲线来表示,即:

S=S0Ri-1,(q>0) (8)

式中,S为城市用地面积(km2),S0为首位城市用地规模的理论值(km2),Ri为城市i的用地面积在17个城市中的排序,q为Zipf维数[2]。

由图4可以看出,城市总体规模有平行向前推移的特点,尤其在中等规模城市中表现得最为突出,这种特点可为预测城市未来的发展规模提供依据。

4.2 城市规模先分散后集中

城市基尼指数分析结果显示,安徽省城市基尼指数总体偏小,且先减小后增大,即安徽省城市规模一直以来比较分散,并经历了一个先分散后相对集中的过程,城市规模有集中的趋向。基尼指数从侧面反映了以合肥为代表的合肥、芜湖、马鞍山的发展速度明显快于全省其它城市,致使城市规模有集中趋势。3个城市的用地规模占总体规模由1987年的39.50%增加到2006年的48.10%。这些城市本来基础较好,随着近些年来的政策(合肥)、区位(芜湖、马鞍山)优势的提升,发展速度加快。即由于人为资源分配和区位资源享受均衡度差异的存在,使少数城市的发展速度加快。区位优势,主要受益于长江三角洲经济圈的带动影响。进一步的研究表明,近些年来安徽省东南部的发展速度明显快于西北部[10]。

4.3 均衡度不断增大,规模增长加速

从表2中的分维值计算结果可见,安徽省城市体系分维值在增大,表明城市规模分布均衡度增加。表面上看这与基尼指数的分析结果相违背,即规模向少数城市集中会使城市规模趋于不均衡,但少数城市的快速发展掩盖不了以中等规模城市为主体的大多数城市的均衡发展。从位序—规模曲线上看,多数城市是呈平行向前推移发展的。表2中的城市体系结构容量一直在增大,从1987年的4.676增长到2006年的6.055。对城市体系而言,结构容量增大意味着城市体系趋于复杂、总体规模在增大,这正是首位城市高速发展、占主体的中等规模城市均衡发展、小城市发展不足,致使城市体系趋于复杂的直接体现。总体规模增大的趋势,可结合具体的城市用地提取的面积数据得到进一步分析。从几个年份的跨度中,2000—2006年城市用地规模的增加幅度明显加大,总体用地规模年平均增长13.44%,远远大于1987—1995年的3.08%和1995—2000年的4.09%。这可能和近些年来的城镇化建设和安徽省经济增速加快有关。

4.4 不同类别城市用地规模变化特征

17个城市用地规模位序—规模分布在双对数图上表现出不同的分布特点(图4),曲线的形状特点反映了城市规模类别的差异。这里,为了避免人为分类产生的随意性,根据曲线的形状特征,我们将这些城市的用地规模大体分为4类(表3),不同类别城市用地面积占17个城市总用地面积的比重变化见图5。

第Ⅰ类:城市用地规模超过100km2。这类城市从无到有,即目前的合肥市是安徽省目前唯一的特大型城市,城市面积从1987年的89.42km2增加到2006年的326.80km2。城市用地规模呈高速扩张状态,用地规模在过去的20年间增加了2.64倍,2006年城市用地面积占17个城市总用地总面积的31.77%。

第Ⅱ类:城市用地规模位于40—100km2之间,用地规模曲线基本成平行推移,在对数图上呈直线形态。该类城市的用地规模增速也较快,1987年只有2个,即合肥市和淮南市,2006年达到9个。在17个城市建成区总用地中所占的比重从1987年的35.05%上升到2006年的51.33%。目前这类城市在安徽省的城市体系中占主体地位,它们的进一步发展将使渐成规模的安徽省形成城市体系,构建出成熟的安徽省城市体系。

第Ⅲ类:用地面积位于20—40km2之间。这类城市的个数基本维持不变,但有跳动,位于第Ⅱ类和第Ⅳ类之间的转换区间。这类城市从1987年的5个减少到2006年的4个;占城市用地总面积的比重下降明显,1987年为36.29%,2006年为12.18%。

第Ⅳ类:城市用地面积小于20km2的城市,城市用地规模曲线随位序降低呈逐渐收敛的直线形状。这类城市的数量在逐渐减少,城市用地总面积不断减少,占17个城市用地总面积的比重也在降低。数量由1987年的10个减少到2006年的3个,用地比重由28.66%减少到4.72%。

城市规模体系中的金字塔理论认为:规模越大的城市数量越少,规模越小的城市数量越多[2]。从表3的分析结果发现,金字塔理论似乎越来越不适应安徽省的城市体系。本文研究对象是安徽省地级以上的城市,县级城镇并未纳入研究范围。由于区域间发展速度的差异,有些县级城镇已经达到或超过了落后的地级城镇,如当涂县、宁国市(县级市)、凤台县、芜湖县、肥西县、肥东县、天长市(县级市)等城镇的用地面积就已经达到或超过了池州市的城市用地面积。所以,当不考虑行政级别时,安徽省的城市规模分布仍然是符合金字塔规律的。但由于安徽省的地级城市都是一个区域内发展最好的,出现地级城市用地面积小于县级城市的现状,从侧面反映了安徽省的区域差异正在增大,以至于某些县级城市用地面积超过了比较落后地区的地级城市的用地规模。

由于沿海地区经济增长成本的增加,会导致大量的企业转向中部和内陆。安徽省劳动力资源丰富,成本较低,正面临着前所未有的发展机遇。按照安徽省目前的经济现状,各地级城市仍是寻求全省经济协调发展的突破口,在抓具有集聚功能的重点城市建设时,要兼顾区域协调发展,以减小区域差异增大后带来的负面影响。

5 结论

通过遥感图像提取城市用地信息,能客观的反应城市的实际用地规模。以建成区面积代替城市人口作为衡量城市规模的指标,位序—规模法则能很好地描述城市规模的分布特征。1987—2006年间,安徽省17个城市用地规模分布的分维值逐渐增大,城市用地规模的结构容量增大趋势明显;受主体城市影响,城市用地规模分布的均衡度仍不断增强,用地规模总量持续增加,城市体系趋于复杂。4类城市的地区分布很不均衡,用地扩张速度差异明显;高位次城市用地快速扩张,低位次发展不足,两极分化加大。由于本文的研究对象是地级市,反映出区域间差距在拉大。安徽省城市规模普遍偏小,具有集聚功能的中心城市偏少。到2006年,城市用地面积达到100km2以上的仅有合肥市一个,仍有10个城市在50km2以下,且规模较大、发展较快的城市多集中于长江沿线,因此应处理好高位次优先发展与多规模互促协同的关系,积极发展地方性中心城市,加快皖北中心城市的建设。

参考文献

[1]张虹鸥,叶玉瑶,陈绍愿.珠江三角洲城市群城市规模分布变化及其空间特征[J].经济地理,2006,26(5)∶806-809.

[2]周一星.城市地理学[M].北京:商务印书馆,1997∶254-319.

[3]周一星,于海波.中国城市人口规模结构的重构(一)[J].城市人口,2004,28(6)∶49-55.

[4]Makse A H.Modeling Urban Growth Patterns with Correlated Percolation[J].Physical Review E,1998,58(6)∶7054-7062.

[5]Schweitzer F,Steinbrink J.Estimation of Megacity Growth:Simple Rules Ver-sus Complex Phenomena[J].Applied Geography,1998,18(1)∶69-81.

[6]谈明洪,吕昌河.以建成区面积表征的中国城市规模分布[J].地理学报,2003,58(2)∶285-293.

[7]张庭伟.从基尼指数看社会发展问题——再谈从物质发展规划趋向社会发展规划[J].规划师,1998,14(1)∶91-92.

[8]陈彦光,刘继生.城市规模分布的分形和分维[J].人文地理,1999,14(2)∶43-48.

[9]仵宗卿,戴学珍,杨吾扬.帕需托公式重构及其与城市体系演化[J].人文地理,2000,15(1)∶15-19.

[10]蔡爱民.安徽省区域经济差异变化研究[J].滁州学院学报,2007,9(6),待刊.

城市规模分布篇2

自1998年Watts等在Nature[1]与1999年Barabasi等在Science[2]上的文章发表以来,物理学界掀起了复杂网络的研究热潮,进而引起人们对规模分布尤其是幂率分布的极大兴趣[3],这一兴趣在国外已延伸到经济与管理学界[4],笔者也对产业竞争关系的复杂网络进行过探讨[5]。目前,现实世界大量幂率分布的发现,引起学界包括经济与管理学界对正态分布高斯世界的反思,并开始重视对极端事件研究。

城市规模的幂率分布在地理学界已经有了较长时间的研究[6,7]。由城市化与产业结构演变的内在联系,本文以广东省的数据为例,提出了城市产业系统的层级结构,对该系统的规模分布进行研究,并提出以城市产业系统的规模分布作为产业结构分析的指标。与地理学界的研究对象“城市规模”不同,本文研究的是“城市产业系统的规模”,且通过系统3个层次的规模分布及其比较,揭示城市产业系统整体的结构特点。与经典产业结构的研究比较,本文除以城市产业系统为研究对象外,还采用规模分布这个新的测度去分析产业结构,并且论述了产业规模为幂率分布的理论意义。

1 广东省城市产业系统的层级结构及规模分布

1995年后,伴随着产业结构升级的加速,广东省城市化进程不断加快。2004年该省已有21个地级市,23个县级市,到2005年11月1日零时,常住总人口为9185万人,其中城镇人口5573万人,占60.68%. 本文研究以广东省的城市产业系统为例,将广东省所辖各城市的产业看成一个具有3个层次的产业系统来研究产业结构。广东省城市产业系统模型的第1层为“省内城市产业群”,由广东44个城市的产业组成;第2层为“城市内产业系统”,由各个城市的所有产业组成;第3层为“产业内企业系统”,由城市每个产业内的所有企业组成,如图1所示。

1.1 第1层:广东省城市产业群的规模分布

广东省城市产业系统的第1层由各城市的产业群组成,其规模分布就是城市产业群的规模分布。

地理学界发现,无论用城市人口或城市建成区面积表示城市规模,城市的规模分布都服从幂率,有名的城市规模分布有Zipf分布[6]和Pareto分布[7]。

Zipf分布的一般形式是:

$Ρ (Κ) = Ρ_{1} Κ^{- q} (1)$

式中, K表示城市位序,P(K)是排在第k位的城市规模,P1是排在第1位的城市规模,q为Zipf指数。

Pareto分布的公式是:

$Ν (r) = C r^{- D} (2)$

式中, r为人口门槛值,N(r)为大于r的城市累积数,C为常数,且理论上Zipf指数q是D的倒数。

参考城市的规模分布,我们假设城市产业群的规模(用单位从业人员数表示)也服从Pareto分布,使用广东省2004年与2005年末的21个地级市及23个县级市单位从业人员的数据(《中国城市统计年鉴2005、2006》)来分析,结果证实了这个假设。2004年广东城市产业群规模分布的幂指数D=0.754(R2=0.9322),而2005年该产业群规模分布的幂指数D=0.730(R2=0.927),见图2所示。

1.2 第2层:广州市的产业规模分布

将广州市内产业按有关标准分为农林牧渔业、制造业、信息传输与计算机服务和软件业、批发和零售业、公共管理和社会组织等共19个行业。因为没有各产业的单位从业人数的数据,所以用职工人数作为产业规模的测度,近似代表产业的规模。使用广州市(不包括增城市和从化市)2004年、2005年末的数据(《广州市统计年鉴2004、2005》)来分析,发现广州市内19个产业的规模分布仍然服从Pareto分布,2004年规模分布的幂指数D=0.59624(R2=0.7967),2005年规模分布的幂指数D=0.553(R2=0.750),见图3所示。

因为在第三层“产业内企业系统”中,我们将以软件产业为例来说明。这里第二层为了与第三层软件产业内的企业规模分布相对应,我们将产业再进行细分,比如将信息传输与计算机服务和软件业,分为电信和其他信息传输服务业、计算机服务业以及软件业。产业细分后,得到广州市85个细分产业的规模分布,发现其也服从Pareto分布,2004年规模分布的幂指数D=0.515(R2=0.729),2005年规模分布的幂指数D=0.509(R2=0.734)。

1.3 第3层:广州等城市软件产业内的企业规模分布

基于数据的可得性考虑,这一层我们以软件产业为例。根据搜集到的2004年、2005年、2006年广州和珠海软件企业,以及2005年深圳软件企业的职工人数数据,我们求出2004年、2005年、2006年广州(分别有372个、430个、564个企业)、珠海(分别有144个、268个、164个企业)以及2005年深圳(862个企业)软件产业内的企业规模分布, 发现它们全都呈现Pareto分布。2004年、 2005年、 2006年软件企业规模分布的幂指数D, 广州分别为1.0365(R2=0.9398)、 1.088(R2=0.961)、 1.116(R2=0.946); 珠海分别1.9037(R2=0.908)、 1.951(R2=0.941)、 1.864(R2=0.927); 2005年深圳为1.093(R2=0.944)。

2 规模分布的比较

2.1 城市产业系统的纵向比较

表1汇总了广东省城市系统的3个层次的幂率指数D。从表1可以看出,无论2004年还是2005年,广东省内城市产业群规模的差异性以及广州软件企业规模的差异性,都小于广州市内产业规模的差异性,呈现出中间大两头小且两头不对称的橄榄球形状。

注: 规模分布的幂指数 D即累积分布指数,比分布指数小1。

2.2 城市产业系统的横向比较

下面先对系统同一层次在不同年份的规模分布进行横向比较。

图2、图3、图4的成对图形以及表1的数据显示,从2004到2005年,广东省内城市产业群的规模分布变得更为分散;广州市内产业的规模分布也有同样的变化方向,而且变化幅度更大;但是,广州软件产业内企业的规模分布却有相反的变化方向。这就是说,随着时间推移,广东省内城市之间的规模差距变大,广州市内产业之间的规模差距也变大,而广州软件产业内企业之间的规模差距却变小了。

由于数据可得,本文顺便也分析了广州软件企业2005年和2006年,珠海软件企业2004年、2005年和2006年规模分布的变化,还对三地软件企业2005年的规模分布进行了比较。分析结果汇总在表2中。从表2可知,2005~2006年广州软件企业的规模差异仍呈变小态势;而2004~2006年珠海软件企业规模的差异,先是变小而后变大,并且在2005年,珠海软件企业的规模差异最小,深圳与广州软件企业的规模差异很接近,都大于珠海。

3 产业规模分布为幂率的结构意义

上面对广东城市产业群、城市内的产业以及软件产业内的企业的规模都呈现幂率分布,幂指数为分数且大小各异的发现告诉我们:第一,由于幂率与正态或钟型分布不同,呈现厚尾及长尾现象,体现着差异,所以该产业系统3个层次的要素都没有代表性的规模,而是都有着多个数量级的差异。第二,由于城市产业系统第2级的规模差异最大,所以城市产业系统的结构从规模来看呈现橄榄球形状。第三,由于城市产业系统的各级规模呈现幂率分布,所以影响各级对象规模的因素不是独立而是相互依赖的。这些是产业规模幂率分布的最直观的意义,下面探讨产业规模幂率分布尤其是幂指数为分数的深层结构意义。

3.1 产业的自相似性

由Pareto分布式(2)可得

$Ν (λ r) = C (λ r)^{- D} = λ^{- D} Ν (r) (3)$

其中, λ为常数。

式(3)说明幂率函数具有伸缩变换的不变性,而伸缩不变性表示了标度不变性或自相似性。

维数本来是描述对象所需独立变量的个数,取整数值,称为拓朴维数。从测度角度定义维数,就可将其扩展到分数,得到hausdorff维数。扩展的思路如下[8,9]:若用与对象相同维数的“尺r”去度量对象,则可测得一确定的数值N,若用低于对象维数的“尺r”去度量它,测量结果为无穷大,若用高于它维数的“尺r”去量它,结果为0,数学表达式为:

$Ν (r) \sim r^{- D h} (4)$

上式两边取自然对数可得

$D h = \ln Ν (r) / \ln (1 / r) (5)$

式中的Dh就称为hausdorff维数,显然它可以是整数,也可以是分数,Dh是分数的对象被称为分形体。分形是一种复杂的、细碎的、不规则现象,数学分形具有局部与整体无限层次的相似性,或者说具有在任何标度下呈现相似形态的标度不变性。

比较式(2)与式(4)可知, Pareto分布中的幂指数D就是hausdorff维数。上面求出的广东省城市产业系统各层次Pareto分臣的D都为分数,说明了它们都是统计意义下的分形体,具有统计自相似性。不过,对广东城市产业群、广州市内的产业以及广州市软件产业内的企业三个分形体来说,由于各自的分维值不同,当尺度放大同样倍数时,各自形态放大的倍数不同。

3.2 产业的自组织临界性

自组织的沙堆[10]模型指出,沙堆可以自发地演变到一个临界态,这时出现蹬雪崩大小遵从幂率分布,因此自组织是幂率的一个形成机制,幂率是在不需要从外部调节特定参数的条件下,系统达到临界性的一个标志。广东城市产业系统各级规模的幂率分布,说明它们处于自组织的临界状态。

从另一角度看,复杂是介于有序与混沌之间的现象,自组织临界性介于有序与混沌之间,所以是一种复杂现象。复杂性的大小有两个度量公式,一个是Shannon信息熵,另一个是Kolmogorov复杂度,而1986年Ryabko[7]已经证明hausdorff分数维与Shannon信息熵及Kolmogorov复杂度等价,所以广东产业系统各级规模的hausdorff分数维,从复杂性角度也说明了它们处于自组织临界状态。

根据沙堆模型,自组织临界态形成的条件是系统开放、远离平衡以及经过漫长时间的缓慢演化,从经济学可知,广东城市产业群、广州城市内产业以及广州软件产业内企业的发展的确满足这些条件,所以说它们处于自组织临界态是有其实际的物理背景支持的。

3.3 统一的规则

分形理论指出,自相似性只是分形对象的外在表现,其本质特征是标度的多重性与不同标度下规则的统一性。

虽然广东城市产业系统各层对象分别有自己的分维值、相应的自相似性以及本身不同标度下的共同规则,但各层对象都呈现幂率,说明不同层次对象之间也有共同的生成机制,比如前面已经提及的自组织机制。可以假设,城市产业系统各层对象的自组织临界性,是在劳动力为个人效用最大化而在空间流动(像沙子追求势能最小而落下),与各层对象为寻求发展(像沙堆追求变大)这两种力量的综合作用下形成的。

除共同的生成机制之外,第1层城市产业群之间,第2层一个城市所包含的各产业之间,以及第3层的软件产业内企业之间,在投入产出方面的联系以及集聚的经济功能方面的相似性,说明各层在结构与功能方面也有相似之处。出现这种现象的原因,可以尝试用Zipf[6]提出的人类行为及大自然行为的最小努力原理来解释。

4 结束语

本文将广东省城市产业群、广州城市内产业与广州软件产业内企业看成一个系统,用单位就业人员或职工人数来测度系统各层对象的规模,并研究其规模分布,发现了各层规模分布均呈现幂率及幂率之间的关系,从而归纳出广东城市产业系统的整体产业结构的特点;同时提出了规模分布可以作为产业结构分析的一个新指标,并从理论上论述了产业规模分布为幂率的意义。

规模分布在产业结构的研究中具有普适性,可用于测度各种对象的产业结构。本文提出的方法不仅适用于城市产业系统的结构分析,也适用于一般的产业结构问题。尤其是由于其它产业结构的指标都要用具体对象的相关值来计算结构比例,比如分别用广州市产业等44个城市产业(第一层)、广州软件产业等19个产业(第二层)、软件产业内数百个软件企业的产值来计算各层的结构,所以在产业结构的指标中,只有抽去具体对象的规模及分布才能成为城市产业系统不同层次(有不同的对象:如城市产业、产业、企业)的统一测度,从而可以在对各层规模分布的比较中,看出城市产业系统整体结构的特点。因此,规模分布对城市产业系统结构的分析具有重要作用。

摘要：研究城市产业的规模分布,提出产业结构分析的新途径。首先,将广东省内各城市的产业看成一个具有层级结构的城市产业系统,探讨了第1层省内城市产业群的规模分布、第2层广州市内产业的规模分布、第3层广州等市软件产业内企业的规模分布,发现它们都是幂率分布;然后,比较各层幂率指数的差异反映出的该城市产业系统结构的特点;最后,论述这个新指标尤其是其为幂率分布时的理论意义,并指出了规模分布的普适性。

关键词：产业结构分析,规模分布,幂率,城市产业系统

参考文献

[1]Watts D J,et al.Collective dynamics of"small-world"networks[J].Nature,1998,393:440~442.

[2]Barabasi A L,Albert R.Emergence of scaling inrandom networks[J].Science,1999,286:509~512.

[3]Shiode N,Batty M.Power law distributions in realand virtual worlds[A].Internet Society:Inet 2000Proceedings[C].2000.

[4]Andriani P,McKelvey B.Beyond Gaussian aver-ages:redirecting management research toward ex-treme events and power laws[Z].2006.

[5]Yang J M,et al.On competitive relationship net-works:a new method for industrial competitionanalysis[J].Physica A,2007,382(8.17):704~714.

[6]Zipf G K.Human behavior and the principle of leasteffort[M].Addison-Wesley,Reading,MA,1949.

[7]陈彦光.自组织和自组织城市[J].城市规划,2003,27:17~22.

[8]Mandelbrot B B.The fractal geometry of nature[M].New York:W.H.Freeman and Company,1983.

[9]Batty M,Longley P A,Fotheringham A S.Urbangrowth and form:scaling,fractal geometry,anddiffusion-limited aggregation[J].Environment andPlanning A,1989,21:1447~1472.

广西城镇规模分布的时空演变特征篇3

城市是区域经济发展的引擎和增长极,随着世界范围内城市化进程的不断加速,城市规模分布演变不仅为城市地理学家所关注,也日益受到城乡规划等领域学者的关注。城市规模分布研究已经成为城市地理学、城乡规划学和空间经济学等学科研究的重要议题,也是城市科学研究中最富成果亦颇具争议的研究领域之一。1910年以来,西方学者建立了一系列可供理论分析和实际应用的经典理论和数学模型:如由Auerbach提出、Lotka等发展的等级—规模法则;Jefferson给出的首位城市规律;Zipf给出的位序—规模分布法则;Carroll等人提出的帕雷托法则等,这些理论和模型对西方国家城市规模增长和分布给出了强有力的解释。上述理论与模型也由一些学者引入到我国,严重敏、宁越敏、许学强、周一星、顾朝林等人运用上述模型和理论对我国的城市规模分布规律进行了一系列有意的研究,取得了较为丰富的研究成果。

广西既是西部大开发的一个省区,又是民族自治地区,改革开放以来的30多年,广西城市化进程发展迅速,截至2008年底,城镇化地区总人口达1047.05万,形成了包括特大城市、大城市、中等城市和小城市在内的较为完整的城市群网络体系。在西部大开发以及多区域合作框架的背景下,作为中国南疆对外开放的窗口,广西的城市化进程将会在我国具有重要的地位。因此,本文对广西城镇规模分布演变轨迹和规律进行研究,将对广西城市化进程的良性推进具有重要的理论和现实意义。

2 数据来源和研究方法

本文研究对象为广西所有县级以上的城镇,具体包括14个地级市和75个县城,总共89个行政单元。考虑城市化进程的特点、数据的可获得性和连续性等,本文选择1997～2008年为分析时段,时间序列数据均来自历年《广西统计年鉴》。本文采用的研究方法为城市位序—规模法则、城市增长回归模型和城市基尼指数等。

3 广西城镇规模分布的时间演变特征

3.1 城镇数量和规模演变特征

改革开放以来,广西大城市和中等城市数量增长较快,大城市的规模增长也较快,中等城市的规模增长较小,相比较小城市增长不显著,特大城市没有增长。从表1中可见,大城市和中等城市数量增长较快,分别由1997年的1个和3个增加到2008年的3个和5个,相应增加了2倍和0.6倍;人口比重有所增加,分别由初期的22.28%和29.03%增加到2008年的36.18%和29.39%。与数量的增长相比,大城市的规模增长较明显,中等城市规模增长不明显。相比较,小城市增长不显著,由1997年的4个增加到2008年的5个,人口比重却减少,由1997年的19.25%下降至2008年的11.25%。规模大的特大城市的数量没有增长,由1997年的1个到2008年的1个不变,但其人口比重仍占大部分,1997年占29.44%,2008年占23.18%。1997年特大城市的人口占有最大比重为29.44%,小城市占有最小比重为19.25%;2008年大城市人口占有最大比重为35.71%,小城市占有最小比重为11.25%。

3.2 城镇体系由位次型向首位型分布模式转变

在一个国家或区域城市体系内部,所有城市的规模与其位序之间存在着如下关系:当按人口规模将城市从大到小排序后,大于或等于某一规模(P)的城市数量(R)将随着规模(P)的增加而以一个指数形式(α)递减,可以用如下的函数形式加以表示:

式中,R、P分别表示城市位序和城市规模;A为最大城市的理论人口规模;α为帕累托指数。

城市规模与位序之间的关系通常称为城市位序—规模法则(Rank-Size Rule)。指数α的大小可以用来测度城市规模分布的差异程度,值越大,城市体系中人口分布越均匀。一般而言,当α<1时,表明大城市占优势,城市首位度高,称为首位型分布;当α>1时,表明城市体系内中小城市占优势,城市首位度低,称为位次分布;当α=1时,称为Zipf(捷夫)定律,体系内各级城市的规模为首位城市规模自然序列倒数的倍数。

资料来源:广西统计年鉴(1998～2009年)

将1997～2008年间广西城镇城市人口规模按照从大到小的顺序排列后,分别建立城市位序与城市规模之间的双对数线性模型(见表2),可以发现:1997～2002年间,α>1,这意味着期间广西城镇体系的规模分布呈现位次分布,表明城市体系内中小城市占优势,城市首位度低,而且其间一直存在波动,没有明显的变化趋势。1997～1998年α值减小,表明位次分布减弱。1998～2001年α值增大,表明位次分布加强。2001～2003年α值减小,位次分布又减弱,首位分布加强,在2003年时α<1,则表明在2003年广西城镇规模分布转变成首位型分布模式。2003～2008年间,α<1,表明大城市占优势,城市首位度高,大城市的发展势头强于中小城市,期间也有波动。2003～2005年α值基本不变;2004～2006年α值减小,表明首位分布加强;2007年α值增加,首位分布减弱;2008年α值减小,首位型分布加强。

3.3 城镇体系呈现平行的增长态势,城市规模分布保持相对稳定

通过进一步考察城市增长率和初始城市规模之间的关系,可以帮助识别城市规模分布的演变模式。具体而言,以初始年份的城市规模(x)为自变量,以城市人口年均几何增长率(y)为因变量,建立如下城市增长回归模型:

若回归系数b显著为正,说明初始规模较大的城市,其增长率较快,城市规模分布呈现发散增长模式;若回归系数b显著为负,说明初始规模较小的城市,其增长率较快,城市规模分布呈现收敛增长模式;若回归系数b接近于0,说明城市增长与初始规模之间并没有多大关系,城市规模分布呈现平行增长模式。广西城镇地区1997年和2001年的城市初始规模为自变量,以城市年均增长率为因变量而建立的增长回归模型,从分析结果(见表3)可以看出:(1)第一阶段的回归系数b为正值,但是接近于0,可见三个不同研究阶段上的回归系数b皆接近于0,说明城市增长与初始规模之间并没有多大关系,城市规模分布呈现平行增长模式。(2)回归系数b非常小,而且模型的拟合程度也非常低,这表明广西城镇地区的城市初始规模对城市增长的解释能力非常有限。

注:因统计资料缺失,2000年数据无法计算。

资料来源:广西统计年鉴(1998～2009年)

资料来源:广西统计年鉴(1998～2009年)注:因统计资料缺失,2000年数据无法计算。

3.4 城镇体系呈不均衡空间格局,由“低水平均衡”向“极化”发展

城市体系的形成与演变,大体遵循着“低水平均衡→极化→扩散→高级均衡”的发展路径。这一过程可以通过马歇尔(J·U·Marshall)的城市基尼指数(Gini index)加以描述。设一个城市体系由n个城市组成,各个城市的人口规模之间有如下关系:P1≥P2≥P3≥…Pn。S是这n个城市的人口总和或整个城市体系的总人口,T是城市体系中每两个城市之间人口规模之差的绝对值总和的2倍,即:

城市规模基尼系数越接近0,说明城市规模分布越分散;系数越接近1,说明城市规模分布越集中。从表4可以看出,广西城镇体系的城市基尼指数的变化趋势不是很明显:1997～2001年在0.53左右波动,说明1997～2001年广西城镇分布比较集中;2002年小于0.5,为0.445602829,则2002年广西城镇分布趋于均衡;2003～2008年在0.56～0.57之间波动,说明2003～2008年广西城镇分布也较集中,可见广西城镇地区城市规模基尼系数基本大于0.5,平均值为0.542274165。1997～2008年基尼指数的变化过程大体遵循“下降→上升”的变化,即城市规模的形成与演变大体遵循“低水平均衡→极化”的发展路径,这与城市位序—规模法则的检验结果大体一致。

4 结语

本文探讨了1997～2008年十多年间广西城镇规模分布的时空演变特征,研究结果如下:(1)改革开放以来,广西大城市和中等城市数量增长较快,大城市的规模增长也较快,中等城市的规模增长较小,相比较小城市增长不显著,特大城市没有增长。(2)广西城镇体系1997～2003年为位次型分布模式,表明城镇体系内中小城市占主要优势,大城市优势不突出,城市首位度低。2003～2008年为首位型分布模式,表明大城市占优势,大城市的发展势头强于中小城市,城市首位度上升。(3)在整个研究期间,广西城镇体系呈现平行增长模式,城镇体系中各种规模的城市增长率大体相似,城市规模分布保持相对稳定。(4)广西城镇体系在空间上的分布格局没有呈现均匀,空间极化现象比较明显。城市规模的形成与演变大体遵循“低水平均衡→极化”的发展路径。本文尚未对造成城市在规模分布特征的各种因素和动力机制进行深入分析,有待今后进一步研究。

摘要：在相关研究综述的基础上,采用城市位序—规模模型和基尼系数对近期广西城镇规划分步的时空特征进行深入研究,结果表明:(1)1997～2008年间,广西大城市和中等城市数量增长较快,大城市的规模增长较快,中等城市的规模增长较慢,小城市增长不显著,特大城市没有增长;(2)广西城镇体系经历了位次型—首位型分布模式,城市首位度升高,但其间有波动;(3)广西城镇体系呈现平行的增长态势,城市体系中各种规模的城市增长率大体相似,城市规模分布保持相对稳定;(4)广西城镇体系呈现不均匀的空间分布格局,空间极化现象比较明显,城市规模的形成与演变大体遵循“低水平均衡→极化”的发展路径。

关键词：城市规模分布,位序—规模法则,回归分析,基尼系数,广西

参考文献

[1]毛广雄,曹蕾,丁金宏,等.基于传统和五普口径的江苏省城市规模分布时空演变研究[J].经济地理,2009,29(11):1833～1838.

[2]顾朝林.中国城镇体系等级规模分布模型及其结构预测[J].经济地理,1990,10(3):54～56.

[3]江曼琦,王振坡,王丽艳.中国城市规模分布演进的实证研究及对城市发展方针的反思[J].上海经济研究,2006(6):29～35.

[4]蒲英霞,马荣华,马晓冬,等.长江三角洲地区城市规模分布的时空演变特征[J].地理学报,2009,28(1):161～172.

城市规模分布篇4

特高含水期开发阶段, 油田开发调整需要对剩余油潜力的认识与评价落实到沉积单元的同时, 还应进一步对剩余油最大可采出量、水淹状况以及分布的非均匀程度进行系统地量化表征, 而通常采用的采出程度等几项指标以及常规的含油饱和度等描述无法满足要求, 因此, 可以通过与油藏数值模拟相结合, 以模型的网格节点为基本统计分析对象, 以储层渗流理论为基础, 围绕剩余可动油就其规模、品质和分布描述, 才能对储量潜力评价更具现实作用。

2 测算剩余可动油量数量, 确定剩余油潜力规模

根据储层渗流理论, 依据孔渗饱参数得到原生地质储量由于微观孔隙中的残余油无法采出, 因此剩余地质储量在水驱条件下不能完全采出;依据水驱特征曲线法等测算得到的可采储量直接受井网部署等开发因素影响, 当实施井网加密等开发调整措施时, 可采储量会发生明显变化。因此, 剩余地质储量和剩余可采储量用于储量潜力规模的确定都有一定局限性。

通常, 数值模拟软件都能给出不同时间的网格节点的储量场数据, 但描述的储量为地质储量, 因此不能直接应用。

按照油水两相条件下考虑, 忽略油水体积压缩系数的差异后, 剩余可动油量可由以下公式确定:

由于:

式中:N为网格原始储量, m3;Nsk为网格剩余可动油量, m3;Nk为网格可动油量, m3;Swc为束缚水饱和度, 无量纲;Soc为残余油饱和度, 无量纲;Sw为含水饱和度, 无量纲;Sok为原始可动油饱和度, 无量纲;

由上式可以看出, 网格内的剩余可动油量与当前的含水 (含油) 饱和度有关, 也与储层的束缚水饱和度和残余油饱和度有关, 即受储层渗流特性影响。

由于不同油层的束缚水饱和度不同, 相对于物性差的油层, 物性好的油层在含水饱和度低于0.3时可动油已开始动用;各线的斜率也反映出, 在开采过程中, 含水饱和度下降相同值, 物性好的油层可动油阶段采出程度低于物性差的油层;相同含水饱和度或含油饱和度时, 不同物性条件储层的可动油采出程度是不同的, 物性好的油层可动油阶段采出程度高;可动油全部采出时的, 受残余油饱和度差异影响, 物性好的油层含水饱和度低于物性差的油层;从可动油全部采出整个过程看, 物性好的油层含水饱和度变化大于于物性差的油层。

有学者研究认为, 对于化学驱可以进一步降低残余油饱和度, 因此, 可动油的比例按化学驱考虑能够进一步增加。

3 求解储层内各流体的分流相, 描述剩余油潜力品质

特高含水期开发阶段, 水驱注水已大范围波及, 因此, 针对补孔、布新井等挖潜措施, 分析不同位置储量挖潜初期的产液含水。

根据莱弗里特提出的分流量的概念, 结合达西定律, 在忽略了毛管压力和重力影响时, 流经储层某点的流束中, 油的分流量 (即产液的含油率) fo为:

式中:

fo为油的分流相;fw为水的分流相;u o为油的粘度;u w为水的粘度;K r o为水的相对渗透率;Krw为水的相对渗透率;

由以上公式可以看出, 对于储层中某一确定的位置, 在随开采含油饱和度降低时, 油的分流量不断降低;对于储层中物性条件不同的位置, 由于油水两相各自的相对渗透率不同, 在相同含油饱和度时, 油的分流量也会不同。油的分流量越高, 储量潜力品质越好, 初期挖潜效果越有保障。

4 量化沉积单元平面剩余油差异程度, 表征潜力分布均匀状况

受储层发育等地质条件以及井网分布等开发因素影响, 剩余油分布零散, 沉积单元平面潜力的分布极不均匀, 并且各沉积单元对比, 潜力的分布不均匀程度也有所差别。因此应用数理统计方法, 以各沉积单元的油的分流相平均值等描述参数为目标值:

式中:

S为沉积单元均方差, x为油的分流相平均值, n为节点统计数量;

各沉积单元均方差S越大, 则含油率的平面分布越不均匀, 在局部区域存在潜力;类似, 也可采用该方法表征可动油丰度等其它参数的平面分布。

5 认识与结论

(1) 相对于物性差的油层, 物性好的油层可动油开始动用时在含水饱和度低;相同含水饱和度时, 可动油采出程度水平高;含水饱和度下降相同值, 可动油阶段采出程度低;可动油全部采出时的, 含水饱和度低于物性差的油层;并且从可动油全部采出整个过程看, 含水饱和度变化幅度大。

(2) 水的分流相初期均呈快速攀升, 9 0%以后攀升速度趋缓, 相同含水饱和度时, 物性好的油层水的分流相值高于物性差的油层, 随着含水饱和度及水的分流相值的上升, 差值在缩小。

(3) 可动油采出程度与水的分流相关系略呈“半S”形, 可动油采出程度相同时, 物性好的油层水的分流相值高于物性差的油层, 随着采出程度饱和度及水的分流相值的上升, 差值在缩小。

(4) 实际评价表明, 进一步对储量最大可采出量、水淹状况以及分布的非均匀程度进行系统地量化表征, 对储量潜力评价具实际意义。

参考文献

[1]金毓荪, 巢华庆, 赵世远等.[M]采油地质工程, 北京:石油工业出版社, 2003

城市规模分布篇5

本系统密切结合国家重大工程应用中的迫切需要, 主要集中在当前虚拟现实系统中的TB级甚至PB级海量场景数据的快速处理、存储与发布、GB级复杂场景实时交互绘制以及高并发协同交互分析等技术难点进行深入研究, 研制了一个超大规模分布式虚拟现实综合集成支撑平台, 可以应用于大规模联合作战模拟演练、复杂产品设计与仿真计算、海量多维海洋信息可视化分析、以及城市规划和数字博物馆等多个行业领域, 可以克服当前我军数十万个武器装备实体及其行动描述的跨域异地多点的虚拟战场仿真演练的瓶颈问题, 也可以用于数字海洋、数字博物馆的海量数据可视化交互显示分析。

优势:本系统自成体系, 应用针对性强, 所研制的虚拟现实综合集成支撑平台已经用于我军联合作战模拟训练、电子对抗模拟、航天飞行模拟、数字海洋、数字博物馆和城市规划等重要领域, 攻克了当前大规模分布式虚拟现实系统研制中的大量关键技术和诸多瓶颈问题。更为重要的是, 该系统具有我国完全自主知识产权, 避免了我国在国防军事和社会安全领域应用国外系统和软件工具可能出现的信息安全隐患。

城市规模分布篇6

当前在互联网+ 的时代背景下,大多数工业企业与事业单位都建有园区网络,其用户数量的不断增加、各种业务的不断普及和信息流量的持续高速增长,给传统的园区网络接入方式造成了巨大的压力。因此,建设大型园区网络,为用户提供高带宽的接入方式,已成为园区网络发展的必然趋势[1]。目前存在PPPOE、Web Portal等接入方式[2,3,4]。PPPOE接入方式成熟,计费准确,能够较好地控制用户属性,但PPPOE由于需要多余的PPPOE封装,不但增加网络开销,而且使得MTU减小造成IP分片,这对接入控制服务器的性能是一个严重的损害。而Web Portal接入技术组网方式灵活,客户维护成本低,适应各种资费策略,当它工作在二层体系时可以实现用户名、IP地址和MAC地址的绑定,方便管理。但是用户的每个Web请求数据包都必须被接入控制服务器截获处理,这样对服务器的处理能力要求比较高。

这些传统的网络访问控制采用集中式控制方法,大部分控制内容都集中到一个核心网关完成,对接入控制服务器形成很大的压力,同时随着网络带宽资源的增加,使用网络的用户不断增多,对服务器的处理速度和效率也提出了新的考验,接入控制服务器本身容易成为流量通路的瓶颈。本文针对大型园区网络的用户接入需求,研究了一种分布式的接入控制技术。该技术把TCP的连接包与传输包分别传输,利用TCP面向连接的特点,拦截TCP建立连接包对其进行控制。由于TCP连接包只占TCP流量的很小一部分,因此接入控制服务器的压力很轻,从而实现了高效的数据包控制与转发。该方案可以满足大规模园区网络的用户管理、网络接入控制、用户使用资源控制以及用户使用出口资源的控制等业务需求。

2 系统结构

当前大部分应用程序使用的传输方式为TCP协议,包括HTTP、FTP、TELNET等。随着网络流量的不断增长,对流量所有数据包实行控制的方式给网关设备带来了巨大的压力。在园区用户的主机上安装客户端,把TCP的连接包与传输包分别传送到控制服务器与网络出口实行控制。因为TCP协议必须完成连接的创建才可以传送数据,从而实现在控制服务器端对用户上网进行控制,且大大减少了需要控制的数据包数量,极大提高了控制效率,减少了控制网关的压力。

系统主要包括客户端、控制服务器以及截断网关三个主要部分,此外还包括用户信息服务器与数据库服务器等。其中客户端负责对TCP数据包分别传输,把创建连接数据包发送到控制服务器处,而把其余数据包发送到截断网关处。而控制服务器则负责对接收到的TCP创建连接包所属的用于进行认证,对符合认证的数据包放行至网络出口。截断网关对所有不是发送到上网控制服务器的TCP连接数据包进行截断,对于其余数据包正常放行。系统完全结构如图1 所示,后续章节将对客户端与控制服务器的设计方式进行详细介绍。

3 客户端详细设计

对于用户计算机,在未登陆客户端时,只允许访问园区内部的计算机,登陆客户端之后,用户即可顺利接入互联网络。该客户端对所有TCP连接包转发到控制服务器;同时对于发送数据包的应用程序类型加以识别,并标记到数据包当中。

3.1 客户端实现技术

由于要对从用户计算机发送出去的所有的数据包进行处理,而且需要足够的执行效率,因此在操作系统低层进行处理,所以需要采用驱动程序。对于WINDOWS系统的用户来说,采用NDIS HOOK技术来实现对数据包的高速识别与转发。

NDIS是Network Driver Interface Specification的简称,即网络驱动接口规范。NDIS的主要目的是为NIC(网络接口卡,Network Interface Cards)制定出标准的API接口。MAC(介质访问控制,Media Access Controller)设备驱动封装了所有的NIC硬件实现,这样以来所有的使用相同介质的NIC就可以通过通用的编程接口被访问。NDIS同时也提供一个函数库(wrapper),这个库中的函数可以被MAC驱动调用,也可以被高层的协议(例如TCP/IP)驱动调用。这些wrapper函数使得MAC驱动和协议驱动的开发变得更加容易。同时,这些wrapper函数也减少了驱动程序对工作平台的依赖性。而NDIS HOOK的工作原理是直接替换NDIS的函数库中的函数地址,这样只要向NDIS的请求就会先经过自己函数的处理,处理完数据包再转发给系统函数就可以了,如图2 所示。

3.2 客户端存在的通信机制

为了使得控制服务器在客户端因某种原因导致网络中断后可以得到消息。客户端与控制服务器之间采用JUMP包(心跳包)的方式通知存在。客户端定时向服务器发送JUMP包,每发送一次JUMP包,服务器的TTL位重置为最大值。服务器每过一定时间递减TTL位,并扫描所有客户端的存活时间,对于超时未发送JUMP包的用户执行KICK操作。

在两次JUMP包发送的间隔期,如果用户掉线,则用户重新登陆时允许其登陆。为了实现这种需求,即需要允许同一序列号多次登陆。但是,这会造成用户伪装掉线从而导致多用户使用同一序列号登陆的问题。在本系统中,为了避免这种问题,用户登陆时采用MAC地址与用户序列号双重验证的方式。因为MAC地址是每个网卡唯一的标识,所以每次用户登陆后都有一个唯一的MAC地址与其对应,如果用户上次登陆的MAC地址与新登陆的MAC地址不一致,则认为用户在重复登陆,用这种方式来防止多人用相同序列号上网,同时允许用户可以在掉线后重复登陆。

3.3 客户端处理流程

为了确定本地IP与园区外IP,客户端需要维护一张表,表中为园区网络IP地址的范围,对于发送到园区外的TCP创建连接包转发至控制服务器,而对于发送到园区内的数据包直接发送。下面为客户端的处理流程:

(1)发送MAC地址、序列号与密码的验证信息到控制服务器,并等待验证结果,验证数据包加密传输。

(2)如果通过验证,启动发送JUMP包定时器,并对后续所有数据包执行下述操作:对发往园区外IP的TCP连接初始化包转发到控制服务器,在数据包结尾添加序列号与原始目的IP地址,转发的数据包采用加密运算;对其余数据包直接发送;对所有数据包进行识别并修改TOS位

(3)如果用户下线,通知控制服务器的上网用户表删除该条记录,并更新用户信息表。

4 控制服务器详细设计

控制服务器负责验证用户的登陆信息,并转发TCP创建连接包。客户端会把用户的TCP创建连接包转发到控制服务器,控制服务器对用户当前的剩余流量进行判断是否还有可用流量,如果还有剩余流量则放行数据包,否则丢弃数据包,用户此时即无法与远程的主机创建TCP连接。

4.1 控制服务器实现技术

控制服务器的操作系统采用Linux。因为需要对包的判别与转发采取高速处理,所以利用Net Filter在Linux底层进行程序设计。Netfilter是一种Linux内核中用于扩展各种网络服务的结构化底层框架。Netfilter的设计思想是生成一个模块结构使之能够比较容易的扩展。新的特性加入到内核中并不需要重新启动内核。这样,可以通过简单的构造一个内核模块来实现网络新特性的扩展。给底层的网络特性扩展带来了极大的便利,使更多从事网络底层研发的开发人员能够集中精力实现新的网络特性。

在Netfilter中定义了协议栈中的检查点和检查点上引用的数据结构以及对这些数据结构引用的过程,可以让用户方便的钩挂自己的包处理函数。总共有5 个检查点,它们包括(如图4 所示):

(1)NF_IP_PRE_ROUTING:刚刚进入网络层的数据包通过此点(刚刚进行完版本号,校验和等检测),源地址转换在此点进行。

(2)NF_IP_LOCAL_IN:经路由查找后,送往本机的通过此检查点,INPUT包过滤在此点进行。

(3)NF_IP_FORWARD:要转发的包通过此检测点,FORWORD包过滤在此点进行。

(4)NF_IP_POST_ROUTING:所有马上便要通过网络设备出去的包通过此检测点,内置的目的地址转换功能(包括地址伪装)在此点进行。

(5)NF_IP_LOCAL_OUT:本机进程发出的包通过此检测点,OUTPUT包过滤在此点进行。

本系统在NF_IP_PRE_ROUTING检查点钩挂包处理函数。

4.2 数据库结构

控制服务器的本机数据库主要包含两个表:用户信息表与上网用户表。用户信息表用于描述用户信息,在客户端登陆时查询,包括卡号、序列号、密码、流量上限、当前流量、IP地址、MAC地址、最近JUMP包到达时间。而上网用户表为高速查找表,每个数据包发送到控制服务器后都要查询此表,包括序列号与流量。该表为HASH表,HASH函数为:

其中sn为序列号,SN_LENGTH为序列号长度,MAX_LONG_ INTENGER_LENG TH为采用的作为计算HASH数的序列号中的位数。该HASH即为将序列号中的后几位转化为整数,然后取余。

用户信息表的更新方式为,当接收到来自数据库操作服务器的更新数据结构的请求,则更新整个用户信息表。对序列号发生改变的卡号,即完成交费的卡号,更新序列号、流量上限、当前流量;对序列号未改变的卡号,通知数据库操作服务器,并通过该服务器更新数据库内的流量信息。而对上网用户表来说,每接收到一个新的数据包,则递增该表中的流量信息。

4.3 控制服务器工作流程

(1)循环等待接收来自客户端信息验证。

(2)接收到验证数据包,解密数据包,查询用户信息表。如果序列号与密码一致,且MAC地址为空或当前MAC地址与前一次登陆的MAC地址一致,且用户流量没有超过上限,则返回成功信息,否则返回失败信息。

(3)把该用户加入上网用户表,并且记录序列号,流量设置为0;如果之前已经有该条记录,则不做改变。

(4)等待接收来自用户的创建连接数据包。

(5)接收到创建连接数据包,解密,提取包中的序列号,根据序列号查找上网用户表,并且根据包的大小递增流量。

(6)如果提取序列号失败或无法在上网用户表中查找到该序列号,丢弃数据包。否则利用包中附加的原始目的地址还原数据包并转发到网络出口。

(7)每过一定的时间,扫描整个用户信息表,用最近JUMP包到达时间与当前时间相减,检查该用户是否超时来确定用户是否在线。如果不在线则对该用户执行KICK操作,并把上网用户表中累加的流量叠加到用户信息表的当前流量中。

(8)如果接收到来自客户端的注销数据包,则对该用户执行KICK操作,并把上网用户表中累加的流量叠加到用户信息表的当前流量中。

(9)经过处理后的数据包被路由模块转发。

5 总结

本文针对大型园区网络的用户接入需求,研究了一种分布式的接入控制技术。该技术把TCP的连接包与传输包分别传输,利用TCP面向连接的特点,拦截TCP建立连接包对其进行识别与控制。由于TCP连接包只占TCP流量的很小一部分,因此控制服务器的压力很轻,从而实现了高效的数据包的控制与转发。

城市规模分布篇7

随着网络规模的日益增大,网络结构也异常复杂,现有的入侵检测系统很难适应大规模分布式网络的安全需要。免疫系统以其在信息处理中所表现出来的分布式保护、自适应性、鲁棒性、可扩展性以及记忆能力等特性能很好地适应网络的这种发展需要。

生物免疫系统是一个很复杂的生物系统,它能够准确地识别“自我/非我”,对“自我”产生免疫耐受,对“非我”产生免疫应答,并产生记忆。生物免疫系统初次检测到某种病菌时,发起初次应答,类似于异常检测。异常检测可以检测到未知形式的入侵。初次应答后,免疫系统保留导致这种感染的病菌记忆,当机体再次被这种病菌感染时,适应性免疫系统将发起快速而有效的二次应答,二次应答又被称为记忆应答。二次应答类似于误用检测。本文提出的检测模型有效地将二种检测方法结合起来,并充分考虑主机所面临的实际网络环境,提高主机的检测效率。

1 基于免疫原理的大规模分布式入侵检测系统模型

1.1 系统模型

大规模分布式入侵检测系统结构如图1所示。

1.1.1 IDS主机(HIDS)

HIDS负责对数据包进行信息提取,形成可供免疫系统分析的数据格式。抽取数据包的特征进行协议分析,并进行异常检测。它由协议分析器、异常检测器、事件处理单元等模块组成。

协议分析是第三代入侵检测探测攻击手法的主要技术,具有解析命令字符串、探测碎片攻击和协议确认、降低误报率及高性能等优势。通过协议分析器可快速探测攻击。异常检测是根据系统应用的模式或系统行为的模式的异常进行检测。其主要方法有:统计方法、预测模式生成法和神经网络法。这种类型的入侵检测系统建立一个含有度量受监控系统执行情况的标准和标记的静态模式,通过发现行为与标准的明显偏差来判定有入侵行为。

为了提高主机的检测效率,以适宜主机所面临的实际网络环境,在HIDS中并没有设计复杂的检测器。通过协议分析及异常检测后,可疑的数据包直接发送给主机所在的IDS中心服务器处理。这样不会影响到正常用户对主机的访问。

1.1.2 IDS中心服务器

IDS中心服务器是系统的基本组成单位,由正常数据记录库、入侵签名库、协同刺激集合、非成熟检测器、成熟检测器及记忆检测器等模块组成计算机免疫系统。

正常数据记录库用于记录正常网络环境下的数据包,通过它统计出用户正常行为特征用于异常检测。入侵签名库则用来记录与入侵行为有关的数据集,通过它可生成疫苗数据集,用于对系统接种疫苗。

IDS中心服务器接收HIDS发送来的可疑数据包,在记忆检测器和接种疫苗的作用下进行模式匹配。匹配成功则产生报警,不成功则将数据送至成熟检测器进行检测。根据免疫原理,随机生成非成熟检测器集合与由正常数据记录库中产生的自体数据集进行阴性选择,将那些在耐受期内与自体数据匹配的非成熟检测器淘汰,当达到最大耐受期仍然存活的非成熟检测器晋级为成熟检测器。成熟检测器接受与记忆检测器不匹配的数据包的同时接受协同刺激信号,判定无危害的加入自体集合。判定有危害的经过克隆选择被激活成为一个记忆检测器,同时产生报警。每个类别的检测器都有自动更新的过程,保持整个系统的动态性以适应不断变化的网络环境。

1.1.3 IDS分区服务器

IDS分区服务器是系统的协调管理层,为其下级服务器提供网络安全支持,维护分区内各数据库的安全与更新。接受来至管理员的命令,并为下级服务器提供协同刺激。与其它分区服务器进行通信,及时获取网络安全信息。将好的检测器和疫苗向全网发布,以提高全网的检测能力。

IDS分区服务器还必须对分区内的各数据进行数据融合及关联分析,以支持大规模分布式、层次化的网络结构。在同一系统中,采用多种分析、检测机制,针对系统中不同的安全信息进行分析,并将它们的结果进行融合和决策,上报至根服务器。将有效地提高系统的检测效率、降低系统的虚警率,为安全管理人员提供简练、精确的告警。

1.1.4 IDS根服务器

IDS根服务器是整个系统的最高层。维护整个体系结构的合理组成和分区服务器之间的协调与合作以及整个系统工作的自动化和智能化。实时地监控整个网络安全系统,根据各分区服务器所提供的融合数据,进行分析决策,及时发布安全信息和灾难恢复。构建动态安全防御体系。

1.2 问题定义

我们以Ag表示抗原集合,Ab表示抗体集合。自体集合self表示正常网络行为特征,非自体集合noself表示不正常网络行为特征或攻击特征。显然有self∪noself=Ag,self∩noself=Φ。将抓获的网络数据包预处理为结构体P{SIP,TIP,Port,Ag,ID,Time},其中SIP为源IP地址,TIP为目的IP地址,Port为端口号,Ag为数据包中待检测的数据,即抗原,ID为标识,Time为抓包时间。

我们将检测器定义为D{Ab,age,count,type},其中age为抗体Ab的年龄,设最大死亡年龄为n。count为抗体Ab匹配抗原Ag的数目,type为检测器的类型。这样在age

模式匹配用函数Match(Ag,Ab)表示。规则匹配分为完全匹配和部分匹配两种。目前有许多部分匹配规则,如海明规则,它通过比较两串的海明距离与设定阈值r的大小,以确定两串是否匹配。海明距离是指两个字符串中相同位置上不同位的值的和,如串a=100001,b=101101,则字符串a、b的海明距离为2。当两串之间的海明距离小于等于阈值r,称这两个串是匹配的,反之则不匹配。其数学表示为:

1.3 系统检测过程

1.3.1 IDS主机检测过程

(1)网络数据包被抓取后,首先送往协议分析器,根据网络协议的完整执行过程来判定是否异常。例如在TCP协议中客户端通过3次握手与服务器建立连接。我们令q0为一次连接建立的初始状态,q1表示客户端向服务器发送了一个SYN报文,q2表示服务器发送了SYN报文和ACK报文;q3表示当客户发送ACK报文对服务器的SYN报文进行确认后完成了连接的建立。可见{q0,q1,q2,q3}是正常的执行序列,其它将被视为异常。

(2)经协议分析器检测,不正常则引发事件处理,产生报警。若正常就将数据包送往异常检测器。

(3)异常检测器可检测出与用户正常行为发生重大偏差的用户活动,由此检测出可疑的数据包,并送至IDS中心服务器。重复执行(1)。

1.3.2 IDS中心服务器检测过程

(1)检测系统接受来至HIDS异常检测器传送来的可疑数据包,在记忆检测器进行模式匹配,若H(Match(P.Ag,D.Ab))≥r,引发事件处理,产生报警,若H(Match(P.Ag,D.Ab))

(2)成熟检测器检测抗原并进行匹配,当一个成熟检测器的匹配数超过了阈值r同时受到协同刺激,就被激活成为一个记忆检测器(此过程为克隆选择过程)。被判定为有危害的数据包送至事件处理单元,而没有危害的送入自体数据集。如果成熟检测器经历了N代,还没有成为记忆检测器,就被淘汰。协同刺激过程分两种,一种直接接受来至分区服务器中管理员的命令;另一种则是与在成熟检测器中类似的检测过程。

1.4 系统学习过程

(1)随机生成非成熟检测器组成抗原集合Ag[i],由正常数据包记录库产生出自体数据组成抗体集合Ab[j],两者进行阴性选择,即将与抗体集合Ab[j]相匹配的抗原集合Ag[i]淘汰,而不匹配的,即耐受成功的成为成熟检测器。

(2)在成熟检测器检测过程中,若匹配到抗原Ag,则成熟检测器D的D.count加1。设∮为匹配数阈值,在D.age

(3)记忆检测器接受接种疫苗(由入侵签名库定期更新)的筛选,那些与疫苗具有相同检测功能的记忆检测器将被淘汰。这有效地促进了记忆检测器的更新换代。

(4)异常检测器则有从正常数据包记录库中统计抽取得到的用户正常行为特征集,不定期地对其进行更新。

2 相关免疫算法介绍

2.1 阴性选择算法

在生物免疫系统中,T细胞表面存在能识别抗原的表面受体。在T细胞产生初期,它位于胸腺中,其受体由于基因重组和体细胞免疫等因素而随机产生。T细胞经过一个“阴性选择”过程清除掉那些对自身成份发生免疫反应的T细胞,从而使流出胸腺的成熟T细胞在免疫反应过程中能够对自身成份表现为免疫容忍状态,而对外部抗原产生免疫反应并将其清除。

本文采取相同原理,随机生成一定数量的未成熟检测器,并设定一个耐受期,未成熟检测器不断与自体数据相匹配,匹配成功的未成熟检测器死亡,达到最大耐受期,仍然存活的未成熟检测器晋升为成熟检测器。算法设计如下:

2.2 克隆选择算法

根据免疫原理,原被引入个体时,带有该抗原受体的淋巴细胞搜寻并结合抗原,激发增殖和分化,产生抗原特异的细胞的克隆。这些细胞及其产物与该抗原特异地反应,以中和或消除抗原。

本文中的克隆选择算法描述如下:成熟检测器检测抗原并发生匹配,当一个成熟检测器的匹配数超过了某一阈值并受到协同刺激,就被激活成为一个记忆检测器。如果成熟检测器经历了N代,还没有成为记忆检测器,就被淘汰。算法设计如下:

3 性能分析

本文针对当前网络规模的增大以及网络结构的复杂性,设计出一种新的入侵检测系统框架,它是一种开放式的体系。其性能取决于模型中各相关功能模块及模块间的协调,包括免疫算法、模式匹配算法以及统计分析方法等。并随着算法的改进和模块的功能增强,整个检测系统的性能将逐渐提高。

4 结论

【城市规模分布】推荐阅读：

山东城市规模07-16

城市规模等级06-17

城市等级规模结构07-08

盐亭城市规模发展调查报告07-04