时空数据统计

2024-10-21

时空数据统计（精选10篇）

时空数据统计篇1

雷电是一种壮观的自然现象, 并且伴随有声、光、电的发生。它被联合国有关部门列为“最严重的10种自然灾害之一”[1]。依据历史资料统计结果, 我国大部分地区市处在多雷区, 年雷暴日从20到60天不等。李玉塔等[2]利用2004年~2007年江西地区闪电监测网获取的闪电资料, 从闪电的时间分布、强度分布、密度和极性等方面研究了江西地区的雷电分布特征。李霞等[3]利用苏州地区2002年~2004年闪电定位系统监测资料, 分析了该地区地闪的月变化、日变化、强度、闪电密度等特征, 为雷电预警提供参考。根据历年资料统计结果, 4月~10月是宁夏闪电的高发期, 其大多数集中发生在7月~8月, 纬度上表现为南多北少, 峰值区域出现在河流流域, 山地, 森林覆盖较高的区域[4]。

宁夏回族自治区地处内陆地区, 年降水量南多北少, 雷电出现频率较高。随着改革开放以来伴随着西部大开发的浪潮, 经济快速发展, 境内大量电子设备的出现并且高层建筑物逐年增多, 加之境内古建筑物较多, 每年因雷击造成的损失很大, 如何避免损失, 是对雷电预警和防护工作提出的迫切要求。现阶段充分利用现有的资源, 找出宁夏雷电的时间, 地域分布特征, 以及其他特性, 为雷电预警和防雷工作提供参考依据, 是当前的迫切要求。

一、宁夏闪电定位网介绍

历史资料统计, 目前全国有26个省 (自治区、直辖市) 气象局建设的雷电定位总探测站数为150多个, 主要测量云地闪电。资料显示闪电定位系统对于监测中小尺度雷电的发生和发展以及对其进行预测效果是比较好的[5], 并且对闪电造成的灾害事故的鉴定能够提供可靠的科学依据[6]。

闪电资料中包括闪电发生的时间, 经纬度位置, 电流强度大小, 陡度, 定位方法等。探测的结果中显示了四种定位方式, 分别为“二站振幅”、“二站混合”、“三站混合”、“四站算法”。该定位系统网络共有5个测站, 分别位于银川, 中卫, 盐池, 同心和六盘山。

从2009年1月份至2009年12月份, 由宁夏闪电定位系统监测到的所有闪电中, 使用的闪电定位算法主要有二站混合算法、二站振幅算法、三站混合算法以及四站算法。各种算法的使用比例是不同的, 其中二站混合算法使用最多达到52%, 其次是三站混合20%以及四站算法15%, 二站振幅在所有算法里面使用最少, 只有13%。从这些统计结果来看二站混合算法是闪电定位系统中主要使用的算法, 并且这种算法精度也比较高, 并且联合定位法有着很多优良特性。

二、宁夏地区闪电分布规律研究

㈠闪电地位资料介绍闪电定位资料来源于宁夏闪电定位监测系统, 下文中分别计算了闪电的强度谱分布, 月变化, 日变化, 季节闪电密度分布, 其中计算闪电强度谱分布的时间以0KA-10KA, 10KA-20KA, ……, 140KA-150KA, 150KA-200KA及大于200KA共17段进行了统计, 在进行密度图绘制时, 图上的任意一点就代表资料中闪电发生具体位置。

㈡宁夏地区的时间分布特征在2009年1月至2009年12月, 在12个月闪电定位系统总共监测到的21281次闪电中, 正地闪总共发生4318次, 负地闪发生15662次, 正负地闪的比例达到1:3.63, 负地闪占到总数的78%, 与其他地区的研究结果不太一样, 这可能与宁夏地区的雷暴云结构与其他地区有所差别。一般来讲, 雷暴云的上部带正电荷, 下部则带负电荷。因而雷暴的电荷结构是典型的电偶极子, 偶极子的带电区直径为几公里量级。除了这两个主电荷区外, 在雷暴云的底部还可有一个小的正电荷区, 在偶极结构雷暴中, 下部小正电荷区一般不参与放电, 但有些地方的雷暴云下部小正电荷区较强, 并参与放电过程。如我国甘肃、青藏高原地区等。因为雷暴云底部的负电荷距离地面较近容易放电, 所以负闪较多。但是目前有关雷暴云的电荷结构还没有统一定论, 还有争议, 宁夏地区的雷暴云电荷结构还有待于进一步考证。

图1中可以清楚的看出2009年闪电次数随着月份呈现明显的单峰结构, 峰值最大出现在8月份, 闪电主要发生在6月份~10月份, 这几个月闪电发生的次数站总的闪电的次数超过99%, 7月份、8月份是全年闪电发生的鼎盛时期, 而冬季极少发生。可能是这一时期, 太阳辐射比较强, 水汽丰富, 地面增温明显, 水汽抬升较容易发生, 从而引起天气多变, 容易引发强对流天气, 而冬季由于地表增温不明显, 水汽含量低, 没有强对流天气出现。

图2给出了地闪次数的日变化图, 图像呈明显的双峰分布, 下午14时至18时是全天雷电活动最活跃的时间, 晚上0时左右为全天雷电活动的次峰值, 两个峰值之间相差比较大, 而在凌晨6时到上午11时地闪发生相对较少。原因分析为从下午12时开始, 由于太阳辐射的作用, 导致地表温度明显骤增, 大气静力不稳定度加强, 极易生成强对流性天气, 使得雷电活动开始发展, 到达下午16时, 强对流天气发展成熟, 闪电活动频繁。

㈢闪电电流强度特征在12个月所有闪电资料中, 正地闪发生4318次, 平均电流强度为93.97千安, 负地闪发生15662次, 平均电流强度为49.32千安, 正负地闪比例为1:3.63。正负地闪电流平均电流强度均比兰州[7]的高, 反映了各地雷暴云的不同的区域性特征, 也说明各地雷暴云的带电量是不同的。如图3所示, 负地闪与总地闪的电流强度谱分布形式基本相同, 均呈单峰分布, 这个结果与赵旭寰[4]的结果基本类似, 其中20千安~50千安范围内的电流占53.7%, 81.13%的电流值小于80千安, 分布较为集中。正地闪电流强度谱也呈明显的单峰分布, 峰值出现在40千安~50千安区域之中, 约占总数的10.8%, 与负地闪谱分布相比较, 观察可得正地闪具有更宽的谱分布。根据一般的理论, 在对流系统发展成熟时正地闪才有可能发生, 所以可以用正地闪做为对流发展的指标, 而其强度平均达到93.97千安, 危害比负地闪大。

㈣闪电的空间分布特征观察图4 (从上至下, 从左到右) 所给出的2009年四个季度的闪电密度图, 点的密集程度代表闪电发生的密集程度, 部分点重合叠加在一起了, 清楚的表明了闪电发生的密集程度, 和随季节分布特征。从图上观察可以得到以下结论。

第一, 闪电密度分布明显存在地区差异, 尤其是在4月~9月这几个闪电高发期, 中南部山区高于北部地区。

第二, 地闪的密度较大区出现在中南部山体密布区, 银川, 中卫, 固原等城市地区。这个结果与郑栋[8]等北京地区研究结果基本相符。

第三, 地闪密度的峰值区出现在夏季, 分布范围广, 其次是春秋两季, 冬季的闪电出现次数很少。

第四, 距离闪电定位系统的距离越远, 能测到的闪电发生次数越少。这表明闪电定位系统的探测能力与水平距离有密切关系, 这与国外有关理论分析相一致。

第五, 地闪密度分布随着季节明显呈现南北纬度变化, 具体表现为春夏北进, 秋冬南退的迹象。许多研究人员认为闪电常常随着降水发生, 这是否与西风槽的东移以及太平洋副高的西升北抬有关还有待于进一步证实。

原因分析为一是夏季水体蒸发强烈, 造成局部地区的水汽密度增大, 由于空气中所含水汽的不同, 外加太阳辐射作用形成局地温度差, 造就了小范围的空气环流为局地热力抬升提供良好的条件, 以至于水体密布地区的闪电密度较大。二是银川等城市地区的大型企业较多, 工业生产所释放的大量暖湿气体为气层抬升提供有利条件, 容易形成不稳定层;另外由于城市下垫面的关系, 形成城市热岛效应, 为雷暴天气的形成提供的有利条件。三是在土壤电阻率分布不均匀的区域内, 当雷暴云在某区域上空形成时, 雷暴云的电荷将在该区域感应出反极性的感应电荷, 由于该区域内土壤的电阻率分布不均匀, 就会有一块电阻率最小的地方, 这个地方的导电性能也相对最好, 所以在该地方出现的感应电荷将明显多于周围的其它地方, 在这里的电场强度也就高于其他地方。这就为先导放电提供了良好的条件, 雷暴云的下行先导自然也就可能被吸引到这里来, 从而导致在这里容易出现闪电。在城市或河边, 土壤的含水量比较高, 其电阻率低于其它远离水边的区域, 因此, 该地区出现闪电的密度较高, 另外在森林覆盖较高的区域, 高大树木顶部容易聚集电荷, 使得电场强度增大, 易触发闪电。四是中南部的山地, 受到地形对气流的明显抬升作用的影响, 雷暴天气也较容易发生, 闪电密度相应也较大。五是随着经济发展, 城市人口增多, 市区高层建筑物增多, 高层建筑物顶部尖端会聚集大量电荷, 使其电场强度增大, 在其上部若有雷暴云生成, 易形成上行先导, 使其易受雷击。

三、小结

研究中发现, 年平均雷暴日简单的反映了一个地区的雷暴发生情况, 但是局限性较大。依据闪电定位仪观测的资料可以清楚的知道具体区域的落雷情况, 相比之下更有说服力, 值得雷电防护工作参考。总结宁夏地区雷电活动规律有以下几点。一是宁夏地区闪电活动主要集中于夏季, 8月的闪电总数占全年的50.3%单峰特征十分明显, 春秋两季闪电活动相对较少, 而冬季则很少发生。二是宁夏地区闪电主要发生在沿黄流域, 中南部山区以及银川等大城市地区, 闪电活动与下垫面性质关系密切。三是一年四季地闪分布不均匀, 地闪的发生随季节存在纬度上出现夏季北进, 秋冬季南退的趋势, 初步分析可能与太平洋副高的移动有关。四是正地闪电流强度比负电闪强, 可以做为对流发展程度的指标, 危害也比负地闪大。五是宁夏地区闪电的主要发生峰值时段集中在下午14时至18时左右, 与夏季强对流的发生发展密切相关。

摘要：利用宁夏回族自治区2009年1月至2009年12月的闪电定位系统监测资料, 分析了该地区地闪的月变化、日变化、强度谱分布、闪电密度等特征。统计结果显示:宁夏地区闪电活动主要集中于夏季, 主单峰特征十分明显。宁夏地区地闪的密度较大区域出现在沿黄流域, 中南部山区以及银川等大城市地区, 闪电活动与下垫面性质有很大关系。全年四季中地闪密度分布不均匀, 地闪的发生随季节也存在纬度上的变化。

关键词：闪电定位系统,地闪密度,月分布,空间分布

参考文献

[1]陈渭民.雷电学原理[M].北京:气象出版社, 2003.

[2李玉塔, 傅智斌.2004-2007年江西雷电分布特征分析[J].气象与减灾研究, 2008, ⑵.

[3]李霞, 汪庆森, 巩晴霞, 等.苏州地区雷电分布规律分析[J].气象科学, 2006, ⑷.

[4]赵旭寰.江苏省雷电分布规律及预报研究[D].江苏:南京信息工程大学, 2008.

[5]林逸, 陈丹青.雷电定位系统在深圳的应用[J].广东气象, 2002, (z2) .

[6]罗树如, 段和平.雷电定位资料在雷电灾害鉴定中的应用[J].江西气象科技, 2004, ⑵.

[7]李照荣, 陈添宇, 康凤琴, 等.兰州周边地闪分布特征[J].干旱气象, 2004, ⑵.

[8]郑栋, 孟青, 吕伟涛, 等.北京及其周边地区夏季地闪活动时空特征分析[J].应用气象学报, 2005, ⑸.

时空数据统计篇2

气象监测数据的时空特征分析与建模

尝试对美国爱荷华州东部66个气象观测站1951～的月均最低气温数据进行时空特征分析和建模,将时空数据分解为时空趋势和时空残差两部分,使用非线性时间序列模型模拟气温的时空趋势,分析模型参数和残差的时空特征,探索时空数据建模方法.案例研究表明研究区域内所有站点的`时间序列特征较一致,可采用一个趋势性和周期性模型表达、同时残差部分具有一定的时空自相关特征,建议开发一个简单方法进行时空数据插值.

作者：刘晓晓孔云峰 LIU Xiaoxiao KONG Yunfeng 作者单位：河南大学环境与规划学院,中澳地理信息分析与应用研究所,河南,开封,475004 刊名：地理空间信息英文刊名：GEOSPATIAL INFORMATION 年，卷(期)： 7(4) 分类号：P208 关键词：空气温度时空数据时空趋势自相关分析

时空数据统计篇3

关键词：环境保护时空数据挖掘应用

中图分类号：P208 文献标识码：A 文章编号：1007-3973（2013）006-140-02

近些年来，随着生活品质的提升和环保理念的深入人心，人们对于环境保护问题越来越重视。在目前展开的对环境变化进行动态的实时监测中，监测系统已经收集了丰富的环境数据，关于我国的环境状况、环境变化情况及存在问题形成了庞大而繁复的数据资源，已经超过了过去的数据处理方法所能处理的极限，导致传统的处理数据方法已不能承担起对这些环境数据进行快速而准确处理的任务，这就需要将时空数据挖掘技术加以广泛的应用。时空数据挖掘可以对大量环境数据进行分析，将其中隐藏的有用知识抽取出来，为环境保护中的环境规划与决策工作提供准确而高效的科学理论依据。

1 时空数据挖掘

数据挖掘是将海量数据内隐藏的目的知识进行分析和抽取的方法和过程，主要是对关联规则进行挖掘、进行聚类和分类等研究活动。在发展初期，数据挖掘主要是对于一些商业数据中的字符与数值形式的数据进行研究，在上个世纪的90年代中后期，该领域中对关联规则进行挖掘、预测、聚类和分类等成熟技术在空间数据和时间、序列数据进行的挖掘工作中得到了应用，以期对有价值的、关于空间和时间一些模式进行探讨。随着科技的发展，GPS、射频识别、移动设备和传感器网络等诸多设备得到了广泛的应用，使众多的移动数据被收集并得以积累。而地理信息系统与遥感卫星等技术的进步也实现了气候数据、影像等气候资料的获取。获取到的时空数据存在于相应联系的空间内部，在空间和时间上样本的自相关性极强，常常隐含局部的模式，造成了时空数据挖掘的复杂性与特殊性。对时空模式进行自动分析与抽取离不开时空数据挖掘。

时空数据挖掘是对时空数据的海量知识进行抽取的方法和过程，主要是对时空管理的规则进行挖掘，对时空聚类进行分析并展开预测。目前来说，时空数据通过对新型计算技术进行研究和应用，对高维度的海量时空数据进行分析，从而对时空数据内有用的知识进行抽取和揭示。

2 时空数据挖掘和环境保护

在现阶段的环境管理和环境保护中，涉及到的数据挖掘主要包括对关联规则进行挖掘，对数据进行分类与分析，展开聚类分析及预测分析等内容。在环境保护中，时空数据挖掘技术已经得到了较广泛的应用。Eklund和其他科学家曾对众多地理自然因素进行了选取，形成了各因素和土壤中的二次盐碱化相关类型的分类之间的规则，并对其关联度的规则展开了挖掘。在农业生产中，作为的产量受到诸多因素的制约，但是制约因素和产量之间的关系极其繁杂，不是简单的利用非线性或线性回归方法就可以将二者的关系进行准确反映的，国内外目前都利用数据挖掘技术，如模糊集和决策树等，对作物产量的制约因素进行分析，对作物的产量和土壤中的养分等因素之间的关系进行了清晰的展现。

北京已建立了对区域内的污染源进行管理的信息系统，对于环境污染有较强的分析作用和监测作用，如根据系统中的排污记录，可以对企业中排出的污染物形式加以判断，确定是废气污染还是废水污染等，对污染排放进行聚类分析可发现，在企业排污库中存在不同排污群，通过排污模式的分析，可以对企业群的相应特征进行准确刻画。在上海的长江口设置有潮滩环境的管理信息系统，对监测到的潮滩环境数据可以展开深层次的分析与挖掘，将造成潮滩环境污染的相关因素探寻出来，从而为环境治理和保护工作提供相应的理论依据和决策依托。同时，在国内外目前对于空气质量进行评估和监测的系统中，很多都用到了时空数据挖掘技术，在短时间内利用机器学习的方式对污染指数进行预测，对气象资料在时空上的关联规则进行深层次挖掘，对未来某段时间在小尺度的时间范围内，空间中污染物的分布情况进行预测，或者通过分类器对空气质量进行动态实时的评估等。

3 时空数据挖掘在环境保护中的具体应用

3.1 对气象条件与空气质量之间的关联规则进行挖掘

气象与大气污染之间互相作用、互相影响，在污染物排放条件相同时，不同的气象条件会造成不同的污染物浓度，有时甚至相差几十倍，这是因为气象因素对大气中污染物的浓度及分布有影响。对二者之间的相关性进行研究，可以对其关联程度进行揭示，便于对二者之间的关联规则进行挖掘。在挖掘关联规则时，首先要对数据进行预处理。气候监测站的数据常存在输入错误、缺失、噪声及不一致等不利干扰，要先进行必要的修整与处理后才可用于数据挖掘。在对关联规则进行挖掘时，可以利用专门的开源数据挖掘工具来展开分析，通过知识表示形式将相应的关联规则表达出来，使其具有较强的可读性。最后，还要对挖掘到的关联规则展开知识的评价与鉴别，判断其是否与实际相符，是否可以在实际中得到应用。

对气象条件和空气质量之间的关联规则进行挖掘后，可以将二者之间的关系准确的揭示，但是因为空气中污染物的分布和浓度受到多方面因素的影响，而气候条件只是其中之一，除此之外还包括地理实体、位置和人类活动等，所以还要对空间要素进行研究，判断其与空气质量之间的联系。

3.2 对污染源和空气质量空间关联的规则进行挖掘

所谓的空间关联规则，也就是空间对象彼此之间存在的非空间与空间的关联。在空间智能化分析和辅助决策方面，空间关联的规则和相关知识可以提供有力的支持。因此，在空间数据的挖掘工作中，对数据库中空间的关联规则进行分析是重要任务。空间的关联规则是描述性的模式，逻辑关系较强，可以用逻辑语言，根据空间和地理的认知进行表达及予以准确描述。在展开挖掘的过程中，首要的工作就是对挖掘任务进行明确，这就需要明确分析工作的目标，将任务予以合理分解，对涉及到的数据进行明示，并对其在事务数据库中的组织方法与存储方式加以明确。之后要从数据库中将有关的属性数据及空间数据进行提取，形成图层。对不同图层涉及到的空间对象进行分析，对这些对象彼此间的关联进行计算并进行谓词化，和相关数据进行联接并将之存于数据库。将数值型的属性进行离散化处理，形成相关数据的挖掘表，通过对于关联规则进行挖掘的相关算法，对复杂的空间模式进行挖掘，将结果存于规则数据库。最后，将不必须或多余的规则加以清除，将有价值而可靠的关联规则加以保存。在构建空间事务数据库时，可用Apriori进行构建，这一算法可以将空气质量和污染源间的空间关联规则加以明确揭示。

3.3 对于时空事件基础上的空气质量进行时空关联的规则挖掘

传统的数据挖掘中，对于关联规则进行时空的扩展，即是时空关联的规则，这类规则较为复杂，其他的关联规则在一定程度上都可看作是该规则程度不同的简化结果。在挖掘时空关联的规则时，常需对众多非空间或空间对象之间的多种关系进行计算，十分复杂，在时空关联规则的挖掘中通常是逐步求精进行计算。进行分析的程序是先对数据进行预处理，以便后续挖掘的顺利实施；之后要建立时空事务的数据库，对相关知识进行提取与储存；对时空关联的规则进行挖掘，还是使用Apriori算法进行挖掘；最后，是对时空关联的相应规则进行评价，合格后即可投入实际应用。

参考文献：

[1] 赵彬彬，李光强，邓敏.时空数据挖掘综述[J].测绘科学，2010，8（2）：62-65.

[2] 李晶晶.时空数据挖掘在环境保护中的应用研究[D].湖南：中南大学，2008.

[3] 刘大有，陈慧灵，齐红，等.时空数据挖掘研究进展[J].计算机研究与发展，2013，50（2）：225-239.

[4] 成伟.数据挖掘技术支持下的土壤重金属污染评价系统的研究[D].浙江：浙江大学，2009.

[5] 侯西勇，高猛，常远勇，等.基于时空数据挖掘技术的黄河三角洲——莱州湾沿岸植被覆盖变化特征分析[J].科研信息化技术与应用，2010，1（3）：512-516.

时空数据库索引技术研究篇4

关键词：时空数据库,移动对象轨迹,索引

因为出现许多需要有效对移动对象管理的应用,STDB受到很多关注。这些应用需要在不同的时间戳记录对象的地理位置(有时也记录对象的形状),而且支持对它们历史的和将来预期的特征进行查询。

STDB的目的是根据数据的时间属性作历史性和预言性的检索。具体地说,给定对象集合o1,o2,…,oN(N是基数),对于每个对象oi(1≤i≤N),历史性STDB会存储oi在历史的所有时间戳t的有效范围oi.E(t)。根据空间数据库的原理,oi.E(t)能够表示为一个描述对象在时刻t的真实形状。尤其是,如果其形状不是重要属性,oi.E(t)则以一个点代替以表示oi在时刻t的位置。实际上,在连续时间戳,同一对象的有效范围可以用不同的方法压缩(例如:如果对象在几个连续时间戳保持静止,则它的有效范围在该时间内只需存储一次)。

另一方面,对每个对象oi,预期性STDB会存储它的最新更新的位置oi.L(tupd)(tupd:对象最新更新的时间)和用于描述它当前移动特性时间函数。最适合的时间函数是线性函数,因为1)线性函数能够近似描述任何运动轨迹,2)线性函数要求的参数个数最少。具体来说,除了oi.L(tupd),系统只需记录对象的速度oi.vel,就可以计算出在将来任何时刻t>tupd对象的位置:

oi.L(t)=oi.L(tupd)+oi.vel(t-tupd)

用这种模型只需在对象的时间函数的参数(如:速度)发生变化时采取更新数据库。

人们已经对作为支持时空查询的辅助结构的时空索引方法做了很多研究。时空存取方法主要集中在两个正交方向:1)对对象过去位置的索引,2)对现在的位置和将来预期位置的索引。

1 移动对象历史数据的时空索引

考虑到移动对象连续不断发送它们的位置,保持所有的更新几乎是不可能的。有两种方法可用来减少历史数据:1)采样,对数据流在某一时刻进行采样。可以采用线性插值计算出相邻采样点间的线性轨迹。2)仅在变化时更新,移动对象仅当它们的数据属性(速度或方向)发生变化时才发送数据。我们把对历史数据的时空索引机制分为三类。

第一类是在现存的空间索引方法加入时间属性。这类时空索引方法主要是处理空间维,时间维是第二要素。

RT-tree[1]结合了作为空间存取方法的R树和作为时间存取方法的TSB树。在RT树中,时间和空间信息是分开维护的。不管是叶结点还是非叶结点,每个索引项都包含(S,T,P)形式。S是空间信息,T是时态信息(时间间隔),P是指向子树或对象的指针。随着时间变化,如果对象空间位置不变,则它的空间信息S不变,仅对时态信息进行更新。如果对象空间位置发生变化,则需要创建一个新的索引项插入RT树。这种方法有许多局限性,一方面,如果变化对象的数量很大,许多索引项被创建,RT树会迅速膨胀;另一方面,当结点溢出时,怎样分裂结点还没有很好的解决办法。

3D R-tree[2]把时间看作除了空间维以外的另一维。主要思想是为了避开时间和空间查询之间的区别。3D R-tree可以直接利用现有的R树算法来处理空间及时态查询而无需修改,其前提是必须知道移动对象历史轨迹存在的有效时间范围,如果移动对象轨迹结束时刻不确定,那么3D R-tree将无法有效工作。比如若移动对象运动轨迹从某个历史时刻开始一直延伸到当前时刻,显然包围移动对象轨迹的3D MBR将会非常巨大且造成空间区域的大量重叠,直接导致3D R-tree的查询搜索性能下降。因此,在应用中要求移动对象轨迹是封闭的(closed),即移动对象历史轨迹必须在某个过去时刻终止而不能延伸到当前时刻。由于3D R-tree将时间维与空间维等同索引,时间片查询则必须扫描整个3D R-tree而非在此时间片下的有效子树,因此性能非常低下。

第二类是同时把空间和时间加入某一结构中,但它们是各自独立的。这是为了使在某一时刻所有有效的空间数据同时在一个索引结构(R-tree)中。最高目标使为每一时间项都建立一个单独的R-tree。这种方法需要很大的存储量。

MR-tree[3]采用了在R-tree的背景下可重叠B-tree的思想。主要思想是避免每个时间戳都有单独的R-tree而引起的存储量过大。通过在连续的R-tree中不存储相同的对象实现减少存储量。作为替代,以不同根结点的链接指向同一结点,而所有的结点项都保存着它们在不同时间戳的值。这种思想对时间片查询来说是完美的。搜索被指向适合的根结点,然后利用R-tree进行空间搜索。然而,它对时间窗口查询的执行是无效的。而且,一个主要的缺陷是存在许多重复项。考虑到这样的情况,在连续两个时间戳仅有一个结点项发生变化,而在这连续两个R-tree的所有其它结点也必须重新复制。

HR-tree与[4]MR-tree非常相似。HR-tree是一种采用重叠技术、将单一版本的结构转换为部分固定结构的高效时空索引结构。该结构为两级索引机制,分别对时空对象的时间信息和空间信息进行索引:1)HR-tree是对事务时间进行索引,它按时间递增顺序将时空对象的时间信息组织为有序表,并将时空对象不发生空间变化的那个时间片作为时空对象的时间信息值;2)用R-tree索引结构为每个时间片的空间对象建立索引,并将R-tree的存储信息(根结点存储地址)保存到对应时间片的时间索引结点中。为了节省空间,相邻时间片的R-tree可能会重叠,即若相邻时间片的R-tree有共同的分枝,则只保存该分枝的一个版本。

第三类是主要考虑时间维索引,其次考虑空间维。第三类方法主要集中在面向轨迹的查询。在此类中处理空间查询处于次要位置。

Trajectory-bundle(TB-tree)[5]是完全保持轨迹的类似R-tree结构。一个叶子结点仅能包含属于同一轨迹的线段。存在一个缺陷:在空间上比较靠近的不同轨迹的线段将被存储在不同的结点上。构建TB-tree是从左到右的原则。也就是说。最左边的结点是最先插入的结点,最右边的结点是最后插入的结点。

Scalable and Efficient Trajectory Index(SETI)[6]将空间区域分割成静态且不重叠的分区,在每个分区下对移动对象的轨迹线段利用R树进行索引。其考虑是,相对于无限连续变化的时间维而言,移动对象轨迹受空间范围所限,那么可以把受限的空间区域利用某种规则静态划分以分而治之。良好的划分函数应尽量把同一移动对象不同轨迹线段聚类在同一个分区中。若一条轨迹线段穿过多个分区,那么必须将此线段裁剪并分别存储在不同分区R树中,这样会导致查询结果的重复,在查询处理后必须进行重复结果的剔出。相应地,时态查询则被转换为对折线段集合的空间窗口查询,利用几何计算方法可以得到空间窗口内的折线段集合,其对应的移动对象集合即是时态查询结果。

2 移动对象当前位置轨迹索引

在现实应用中许多要求能够有效地对移动对象当前位置进行管理和查询。相对来说,检索移动对象当前位置更具有挑战性,其关键在于如何提高传统空间索引的频繁更新动态性能以满足动态环境下的应用要求。标准R树更新算法采用删除-重插机制来实现移动对象位置更新,频繁更新会导致R树性能急剧下降。为了支持R树的频繁更新操作,近年来提出的方法包括LUR树(Lazy Update R-tree)、自底向上更新策略(Bottomup Update)、哈希方法(Hash)等。LUR[7]提出了一种延迟更新(Lazy Update)策略,即若移动对象位置未超出当前节点MBR,算法仅仅更新移动对象所在的数据页面并维持索引页面不变;对于移出MBR之外的移动对象,根据其超出MBR程度大小,判断是否将MBR进行有限扩展以包含移动对象新位置;或者利用标准R树更新算法进行更新以尽量减少位置更新所带来的索引树更新操作。Bottom-up Updates的自底向上法扩展了LUR-tree思想。自底向上法比较适合处理移动对象的连续更新。例如:扩展MBR以包含新的值和移动当前对象到兄弟结点。

Song等人利用空间划分的思想来索引移动对象当前位置,首先静态地把空间划分为可以相互重叠的区域,然后根据当前位置将移动对象哈希映射到不同区域中去。只有当移动对象位置超出了当前区域才会更新此对象的索引记录,数据库中保存了移动对象位置近似视图。

3 当前和将来轨迹查询索引

在移动计算、位置服务等新兴应用中,需要对移动对象当前及未来位置预测以提供相关服务,针对移动对象当前和未来轨迹的索引方法是目前研究的热点。为了能够预测移动对象未来轨迹,需要存储一些额外的信息(如移动对象当前速度和目的地等)。然后根据移动对象当前的运动特性对未来轨迹进行预测,目前通常使用线性方程来描述移动对象的运动特性。在D维空间下,移动对象运动特性可以使用参考时间tref时位置xref=(x1,x2,…,xd)以及速度矢量v=(v1,v2,…,vd)来描述。移动对象在任何时间点t(t≥tref)的位置可利用公式xt=xref+v(t-tref)计算得出。主要的索引方法有:FT-Quadtree、PMR-Quadtree、STRIPE索引、TPR-tree、TPR*-tree等。

FT-Quadtree[8]使用的是Quad-tree索引结构,最大的特点是使用了轨迹共享技术来最大限度地减少数据的存储数量,提高索引的更新效率。在这种树中的叶子节点结构表示为(oid,轨迹的数量,起始坐标,结束坐标,起始时间,结束时间,其他信息)。对于在同一时间内的节点而言,如果它们的坐标位置相同或者接近,那么就可以采取共享策略把若干个节点的内容放入一个公共的节点内,这样就可以明显地减少存储的空间。

使用PMR-quadtree[9]作为索引将来轨迹的基本空间存取方法,关键的一点是当移动对象发生更新时,整个索引结构被破坏,然后根据新的信息重建索引结构。为了避免过多的更新操作,索引每ΔT时间单元重建。在理论上,无限的时间维可以分割为大小为ΔT的相等的时间片。对于每一时间片,会构建一个新的基于运动方程的PMR-tree。然而,由于存储设备的有限性,只有当前的PMR-tree会被存储。

TPR-tree[10]使用时间参数化包围框来包含移动对象,其索引结构与R树类似。但TPR-tree采用谨慎的BR策略,在某些时刻(如构建时刻)包围框是最小的,但在其后的时间内往往不是。从一维角度考虑,MBR最(大)小边界速度为其范围内所有点的最(大)小速度,从而保证所有点始终包含在同一个MBR中。TPR-tree索引节点记录不仅存储了移动对象(子树)MBR,而且包含了移动对象(子树)MBR速度矢量。由于节点MBR呈现出一种随时间变化的动态性,随着时间延伸包围框会越来越大,导致空间区域的大量重叠从而使得性能下降。因此,必须在适当时候对TPR-tree进行重构以提高查询性能。

TPR*-tree[11]修改了TPR-tree的动态操作算法。通过维护一个代价下降优先队列保证插入路径选择的全局最优,保持TPR-tree MBR的紧致性以提高查询性能。对于上溢节点的分裂算法,TPR*-tree只是在必要的时候才对节点分裂并重插。以二维空间移动对象为例,节点首先在所有可能的8个方向(4×d)上进行排序,并从中选择一种最好的分裂方式,实际上此时节点并不分裂,而是把节点中30%的记录删除后重插。如果在重插过程中发生上溢,那么就直接进行节点分裂以避免传递操作。TPR*-tree是目前最好的参数化空间访问方法。

4 结束语

该文总结了移动对象轨迹索引的各种技术,并对它们进行了比较详细的分类,对每种方法均找出了多个比较典型的模型进行介绍。近年来对移动对象历史轨迹、当前位置与未来趋势预测的索引方法研究较多,在如何同时解决上述三种查询的索引方法上研究仍然欠缺。多种索引结构的结合是时空数据库系统实际设计的主要趋势,选择哪几种索引结构以及如何把它们有机地结合起来将是系统设计所面临的主要难题。

参考文献

[1]Xu X,Han J,Lu W.RT-Tree:An Improved R-Tree Indexing Structure for Temporal Spatial Databases.In Proc.of the Intl.Symp.on Spatial Data Handling,SDH,pages1040-1049,July1990.

[2]Basch J,Guibas L J,Hershberger J.Data structures for mobile data.In Proc.of the ACM-SIAM symposium on Discrete algorithms,SODA,pages747-756,1997.

[3]Xu X,Han J,Lu W.RT-Tree:An Improved R-Tree Indexing Structure for Temporal Spatial Databases.In Proc.of the Intl.Symp.on Spatial Data Handling,SDH,pages1040-1049,July1990.

[4]Nascimento M A,Silva J R O.Towards historical R-trees.In Proc.of the ACM Symp.on Applied Computing,SAC,pages235-240,Feb1998.

[5]Pfoser D,Jensen C S,Theodoridis Y.Novel Approaches in Query Processing for Moving Object Trajectories.In Proc.of the Intl.Conf.on Very Large Data Bases,VLDB,pages395-406,Sept.2000.

[6]Chakka V P,Everspaugh A,Patel J M.Indexing Large Trajectory Data Sets with SETI.In Proc.of the Conf.on Innovative Data Sys-tems Research,CIDR,Asilomar,CA,Jan.2003.

[7]Kwon D,Lee S,Lee S.Indexing the Current Positions of Moving Objects Using the Lazy Update R-t ree[C]//In:Proc.of MDM,2002.

[8]Ding R,Meng X F,Bai Y.Efficient Index Maintenance for Moving Objects with Future Trajectories[C]//Kyoto:The8th International Conference on Database Systems for Advanced Applications(DASFAA),2003.183.

[9]Tayeb J,Ulusoy O,Wolfson O.A Quadtree-Based Dynamic Attribute Indexing Method.The Computer Journal,41(3):185-200,1998.

[10]Saltenis S,J ensen C S,Leutenegger S T,et al.Indexing the Positions of Continuously Moving Objects[C]//In:Proc.of ACM SIG-MOD,2000.

时空数据统计篇5

经过5 a 的建设，在智慧武汉的总体框架下，武汉市社会管理创新以服务人为主线，提出了“一主、两新、五全”的管理理念，以智慧武汉时空信息云平台为基础，依托时空大数据、云计算、物联网等科技手段，建立了武汉市社会服务与管理信息系统，实现了人、地、事、物、情各类社会管理要素的空间化集成调用和综合展现，形成了市、区、街、社区、网格5 级联动机制，推进了信息资源共享，整合了社会管理资源，完善了社会管理机制，构建了一个全方位、宽领域、全覆盖、无缝衔接的社会管理与服务体系。建设目标与内容

1.1 总体目标按照网格化管理的思想，运用时空大数据管理的分布式数据集、流式空间索引、MapRuduce 技术等前沿技术方法，以实有人口实有房屋信息共享为基础，进一步整合公安、计生、民政、人社、卫生等部门的人口、法人和社会经济等信息，将各类资源纳入全市统一平台，创新社会管理体制，优化再造管理流程，以信息为先导来整合、引导和分配社会管理资源，建立全口径的城市社会管理与服务平台，为完善社会管理领导体制、建立健全社会矛盾调节机制、抓好社会防控体系建设提供新的技术手段，为武汉中心城市、和谐城市、幸福城市的建设提供一体化的信息支撑。

1.2 建设内容武汉市社会服务与管理信息系统建设以“整合资源、统一规划，市区共建、以区为主，规范运作、分级管理”为原则，以数字武汉地理空间框架为支撑，依托智慧武汉时空信息云平台，充分利用现有系统数据和基础进行改造、升级、整合，建立市、区、街道、社区、网格5 级联动的社会服务与管理信息系统，为网格化管理与服务提供信息支撑。

2平台实现及应用效果

2.1 制度确立，纳入智慧城市总体框架2012 年，按照中央和湖北省有关部署要求，武汉市委、市政府把智慧社会管理作为智慧武汉的基础和核心内容，启动了武汉市社会管理与服务网格化建设工作。在统一思想、充分调研的基础上，市委市政府先后出台了《关于加快推进社会综合管理与服务网格化建设工作的意见》等系列文件，加强网格化工作顶层设计，要求全市在整合人力资源、信息资源、地理信息资源、网络资源等核心资源的基础上，开展武汉市的网格化管理建设工作，做到“一网打尽”。

2015 年武汉市委市政府又出台了《关于进一步创新社会治理加强基层建设的意见》等“1+10”系列文件，进一步从制度上为武汉市社会管理与服务信息系统的建设提供了保障。3.2 标准先行，建立健全相关机制标准具体包括《武汉市社会综合管理与服务网格划分规则与编码规范》《武汉市社会综合管理与服务基础信息采集表》《武汉市社会综合管理与服务专业信息共享内容》《武汉市社会综合管理与服务事项分类标准》《武汉市社会综合管理与服务信息系统服务接口规范》和《武汉市社会综合管理与服务区级平台建设要求》等6 大规范，形成了网格划分、数据共享、信息采集、平台管理的标准规定。

对市、区、街、社区和相关部门、不同岗位操作人员分别设置信息使用权限，分层级、分部门、分岗位授权;建立了工作考核机制，每日对全市各区、街道、网格员及各相关职能部门进行考核;通过平台强化事件全程办理和全程监督功能，通过对事件接件、流转、办理等流程的实时监控，实现即将到期预警、超期报警;建立了信息采集、比对、更新和共享机制。结语

濮阳县暴雨时空分布统计分析篇6

1 暴雨的时间分布

气象常把日雨量大于或等于50mm的降水量称为暴雨。日雨量分界为20~20时 (北京时) , 若20~20时雨量小于50mm, 但8~8时雨量大于或等于50mm, 也作为暴雨。

1.1 年分布

由1961~2000年濮阳县年暴雨记录发现:在这40年间, 出现0~1次暴雨的计17年, 出现频率为42.5%;每年出现2~3次的计18年, 出现频率为45.0%;每年出现4~5次的计5年, 出现频率为12.5%。

40年间濮阳县共出现暴雨76次, 平均每年出现1.9d;最多年份2000年达到5d;最少的一年当中没有出现1次暴雨;前30年 (根据国家气象局气候资料有关规定1961~1990年为标准气候值) 暴雨共出现56d, 平均每年1.9d;近30年 (1971~2000年) 暴雨共出现54d, 平均每年1.8d, 前30年与近30年全县每年出现暴雨天数相当。

1.2 月分布

统计濮阳县40年暴雨每月出现次数发现:4月份出现1d, 出现频率为1.3%;5月份出现3d, 出现频率为3.9%;6月份出现8d, 出现频率为10.5%;7月份出现31d, 出现频率为40.8%;8月份出现24d, 出现频率为31.6%;9月份出现8d, 出现频率为10.5%;10月份出现1d, 出现频率为1.3%。

从40年间各月暴雨分布情况看, 一年中虽有7个月份可能出现暴雨, 但其各月出现频率悬殊较大。据统计, 7月份暴雨出现频率最高达40.8%, 其次是8月份出现频率为31.6%;4月份和10月份出现暴雨可能性较小, 均为1.3%。

2 暴雨的空间分布

2.1 每10年暴雨时空分布与强度

第1个10年 (1961~1970年) 共出现暴雨22d, 每年平均2.2d;最多年为1961年和1967年, 出现天数均为4d;日最大暴雨量232.0mm, 出现在1963年8月3日;日最小暴雨量50.2mm, 出现在1961年9月3日;其余年份在0~3d之间。

第2个10年 (1971~1980年) 共出现暴雨17d, 每年平均1.7d;最多年份为1972年、1973年及1974年, 出现天数均为3d;日最大暴雨量119.6mm, 出现在1971年6月25日;日最小暴雨量52.2mm, 出现在1975年7月9日;其余年份在0~2d之间。

第3个10年 (1981~1990年) 共出现暴雨17d, 每年平均1.7d;最多年份为1990年, 出现天数为4d;日最大暴雨量139.5mm, 出现在1984年8月9日;日最小暴雨量50.1mm, 出现在1987年6月1日;其余年份在0~2d之间。

第四个10年 (1991~2000年) 共出现暴雨20d, 每年平均2.0d;最多年份为2000年, 出现天数为5d;日最大暴雨量183.0mm, 出现在2000年7月5日;日最小暴雨量50.1mm, 出现在1994年7月3日;其余年份为0~4d之间。

每个10年之中, 都有1个年份未出现暴雨。如1966年、1978年、1985年、1997年均未出现1次暴雨。

濮阳县历年日最大暴雨量276.9mm, 出现在1960年7月28日;近40年日最大暴雨量为232.0mm, 出现在1963年8月3日;历年小时最大暴雨量为83.0mm, 出现在1970年8月5日17∶42~18∶42;历年10min最大暴雨为22.2mm, 出现在1963年8月30日18∶03~18∶13。

2.2 各月暴雨的时空分布与强度

历年濮阳县暴雨出现最早日是在仲春4月18日 (1993年) , 暴雨量为58.8mm;最晚日出现在仲秋10月17日 (1961年) , 暴雨量为52.1mm;5月份出现暴雨3次, 最大日暴雨量72.5mm, 出现在1982年5月12日, 日最小暴雨量为51.0mm, 出现在1964年5月16日;6月份出现暴雨8次, 日最大暴雨140.8mm, 出现在2000年6月22日, 日最小暴雨量50.1mm, 出现在1987年6月1日;7月份出现暴雨31次, 日最大暴雨量183.0mm, 出现在2000年7月5日, 日最小暴雨量50.1mm, 出现在1994年7月3日;8月份暴雨出现24次, 日最大暴雨量232.0mm, 出现在1963年8月3日, 日最小暴雨量56.0mm, 出现在1993年8月4日;9月份出现暴雨8次, 日最大暴雨量119.4mm, 出现在1983年9月8日, 日最小暴雨量50.2mm, 出现在1961年9月3日。

2.3 每10年暴雨连续天数与强度

每10年之中, 都有1个年份在10d内有2~3d暴雨连续出现。如:第1个10年的1963年8月3日降暴雨232.0mm, 8月7日又连降暴雨66.9mm;第2个10年的1974年8月1日降暴雨78.0mm, 8月4日降暴雨73.0mm, 8月8日又连降暴雨78.5mm;第3个10年的1990年7月21日降暴雨50.8mm, 7月30日又连降暴雨84.9mm;第4个10年的2000年7月4日降暴雨108.5mm, 7月5日又连降暴雨183.0mm。

3 结语

时空数据库规范化问题的研究篇7

对于传统关系数据库,一般用函数依赖、多值依赖和连接依赖表示关系模式满足的属性间固有的约束,文献[1,2,3]中基于它们对关系数据库进行的规范化问题作了大量的研究。

对于时态数据库,文献[4,5,6,7]分别提出了各自的时态数据依赖概念。CS.Jensen在文献[4]中讨论了基于BCDM 模型的时态函数依赖;J.Wijsen在文献[5]中定义了4 种类型的依赖:快照函数依赖(SFDs),动态函数依赖(DFDs),时态函数依赖(TFDs)及间隔依赖(IDs);XS.Wang在文献[6]讨论了具有多时间粒度的时态数据库的逻辑设计问题,定义时态三范式和时态BC范式,并提出了相应的分解算法。鉴于此,文献[7]中J.Wijsen又将其扩充到对复杂对象的约束。基于TFD,XS.Wang提出了时态三范式(T3NF)和时态Boyce-Code范式(TBCNF)的概念,并给出了相关模式分解算法。

有关关系数据库函数依赖以及时态函数依赖的论述见文献[8],对于关系数据库的规范化均有详细的论述。Wang在文献[6]中给出了时态模式及时态函数依赖等相应的描述。基于关系数据库和时态数据库规范化理论的成果,结合文献[6,7,8,9]提出了时空一范式、时空二范式、时空三范式,并对它们的规范化程度的高低次序进行了证明。

1 基本概念

由于时空数据库中引入了时间维和空间维,给时空数据库的设计带来了非常大的困难,在进行时态数据库逻辑设计时,传统关系数据库的一些基础理论需要进行相应的扩展和修改。扩展的核心是时态函数依赖(TFD)。

定义1(时态类型):时态类型是一个从确定的整数(时刻)集合到2R(绝对时间集合)的投影μ,使得对所有确定的整数i,j(i<j),满足:

(1) 若μ(i)≠Φ,μ(j)≠Φ,则μ(i)中的每一个实数小于μ(j)中的所有实数;

(2) 若μ(i)=Φ,则μ(j)=Φ。

定义2(细于关系):μ1和μ2是时态类型,如果对每一个确定的整数i,存在整数j满足μ1(i)⊆μ2(j),则称μ1细于μ2,记作μ1≤μ2。

在本文中,经常把μ1(i)⊆μ2(j)描述为:μ2的时刻j覆盖μ1的时刻i。若μ≤ν,μ≠v,则称μ严格细于v,记作:μ<v。

任何时态类型集相对于细于关系都存在最小下界和最大上界,分别记作μBottom和μTop。它们的定义为:①对每个i>1,μTop(1)=R,μTop(i)=Φ。②对每个i,μBottom(i)=Φ。在不产生二义性情况下,用Top和Bottom分别表示μTop和μBottom。对任意一对时态类型μ1和μ2分别存在一个最大下界和最小上界,分别记作glb(μ1,μ2)和lub(μ1,μ2)。由细于关系的定义可知:μ≤μ;若μ1≤μ2,μ2≤μ1,则μ1=μ2;若μ1≤μ2,μ2≤μ3,则μ1≤μ3。由此可知细于关系是自反的、反对称的、传递的,即对于任何时态类型集T,T对于≤是偏序集。

定义3(集细于关系):{μ1,…,μn}是一个时态类型集,v是一个时态类型。如果对每一个确定的整数i,存在1≤k≤n及整数j,使得v(i)⊆μk(j),则称v集细于{μ1,…,μn},记作v≤c{μ1,…,μn}。

空间属性域一般不会作为时空关系的主属性(关键字属性),在函数依赖概念的层次上可以不考虑它的决定作用。因此在研究时空关系的规范化理论时,主要考虑时间属性的作用。

定义4(时空模式与时空模型):一个时空关系模式定义为一个三元组(R,v,μ),其中R是传统的关系模式,v是空间类型,μ是时态类型。相应的时空模块定义为一个四元组(R,v,μ,Ф),Φ是时间窗口函数,是从一个确定的整数(时刻)集合到2Tup(R)的映射(Tup(R)表示R的所有元组的集合),Φ(i)等于在时间μ(i)以及v(i)内有效的元组集合,若μ(i)=Φv(i)=Φ,则Φ(i)=Φ。

例1:考虑一含有时间和空间属性的模式BUS看成是时空模式(Bus,Line,Day)的一个时空模型,其中:Bus=<Time(发车时间),Bno(车次),Cname(司机姓名),Wage(司机工资)>,Line为公交线路,Day为时态类型。则表1所示的实例对应的时间窗口函数Φ为:

如果其中Line=<start(始发站),end(终点站)>,A=<火车站,哈尔滨理工大学>则表1所示的关系实例对应的时间窗口函数Φ为:

Φ(3/4/93)={<6:00, 11,张三,1000,A>}

Φ(3/4/93)={<9:00, 12,马六,1500,B>}

Φ(3/5/94)={<6:00, 11,张三,2000,A>}

定义5(逻辑蕴涵):F是STFD集,若每一个满足F的时空模型M都满足STFD:X→μY,则称F逻辑蕴涵X→μY。

定义6(时空关键字):(R,V,μ)是一个时空模式,F是包含R,V中属性的STFD集,属性集X⊆R∪V,若X→μY被F逻辑蕴涵,则称X是(R,V,μ)的一个时空超关键字。若对每一个属性A∈X,X-{A}都不是(R,V,μ)的时空超关键字,则称X是(R,V,μ)的一个时空候选关键字,简称时空码。

包含有时空候选关键字的属性称为时空主属性,反之,不属于任意一个时空候选关键字的属性称为非时空主属性。

定义7(时空函数依赖):设X,Y是R∪V上的有限集,μ是时态类型且存在i,使得μ(i)≠Φ。X称在时态类型μ上函数决定于Y或Y在时态类型μ上函数依赖于X,记作X→μY。

显然,时空函数依赖X→μY表示:对于任意两个元组t1,t2,若分别使t1,t2有效的时间都被μ的某时刻覆盖,且t1[X]=t2[X],则t1[Y]=t2[Y]。

定义8(闭包):设F是包含R∪V中属性的STFD集,F所逻辑蕴含的函数依赖的全体叫做F的闭包,记为F+;X+F={AX→A能由F导出},X+F称为属性集X关于函数依赖集F的闭包。

定义9(时空完全函数依赖): 设F是包含R∪V中属性的STFD集,如果时空函数依赖X→μY∈F+,存在X的真子集X′⊂X,使得X′→μY∈F+,称Y时空部分依赖于X;若不存在这样的真子集X′,称Y时空完全依赖于X。

现在给出STFD的有效和完备的推导规则,它们是Armstrong公理在时空上的扩展。

STFDIR1(自反规则): 若Y⊆X,则X→μY成立,μ是任意时态类型;

STFDIR2(增广规则):若X→μY,则XZ→μYZ;

STFDIR3(传递规则): 若X→μY,Y→μZ,则X→μZ;

STFDIR4(继承规则): 若X→μ1Y,X→μ2Y,…,X→μnY,且μ≤c{μ1,…,μn},则X→μY。

前面三个规则由传统FD直接扩展得出,第四个由集细于关系得出。同传统的函数依赖集一样,时空函数依赖集也存在冗余现象,根据消除异常的程度,可分为各种不同等级的范式。

定义10(时空一范式):一个时空模式(R,V,μ),若它的每个属性都是原子属性,即属性值域中的值是不可再分的最小数据单元,记为ST1NF。

如果某个时空数据库模式的每一个时空模式都属于时空一范式,则称该时空数据库模式属于时空一范式。

定义11(时空二范式):一个时空模式(R,V,μ)是时空二范式,若它是时空一范式,并且每一非时空主属性都完全依赖于它的每一个时空候选关键字。记为ST2NF。

如果某个时空数据库模式的每一个时空模式都属于时空二范式,则称该时空数据库模式属于时空二范式。

定义12(时空三范式):(R,V,μ)为一时空模式,F是包含R∪V中属性的STFD集。若F逻辑蕴涵的每一个STFD:X→vA(XA⊆R∪V, A∉X,∃i,j使得μ(i)⊆v(j))至少满足以下条件之一,则称(R,μ)是时空第三范式(T3NF)。

(1) A是时空主属性。

(2) X是时空超关键字,并且不存在整数i1,i2(i1≠i2),使得X→A∈πu(i1,i2)(F);除非存在i3≠i1,使得X→A∈πu(i1,i3)(F),X→A∉πu(i1,i2,i3)(F)。

2 相关定理

定理1:STFD推导规则是有效的。

证明:

(1) STFDIR1(自反规则):设X⊆Y,对(R,V,μ)中的任一时空关系r中的两个元组t1,t2,若分别使t1,t2有效的时间都被μ的某时刻覆盖,且t1[X]=t2[X],有t1[Y]=t2[Y]。所以X→μY成立。自反规则得证。

(2) STFDIR2(增广规则):设X→μY,对(R,V,μ)中的任一时空关系r中的两个元组t1,t2,则有t1[X]=t2[X]且t1[Y]=t2[Y]。若t1[XZ]=t2[XZ],则有t1[X]=t2[X]和t1[Z]=t2[Z],所以t1[YZ]=t2[YZ]。增广规则得证。

(3) STFDIR3(传递规则):设X→μY,Y→μZ,对(R,V,μ)中的任一时空关系r的两个元组t1,t2,若t1[X]=t2[X],则有t1[Y]=t2[Y],再由Y→μZ,有t1[Z]=t2[Z],所以X→μZ。传递规则得证。

(4) STFDIR4(继承规则):设X→μ1Y,X→μ2Y,…,X→μnY,对(R,V,μ)中若存在时态类型μ使得μ≤c{μ1,…,μn},则X→μY。继承规则得证。

引理1:X→μY1, Y2,…,Yn,成立的充要条件是X→Ai成立(i=1,2,…,k)。

定理2:STFD推导规则是完备的。

证明完备性的逆否命题,即若函数依赖X→μY不能由F从STFD推导规则导出,那么它必然不为F所蕴含,它的证明分三步。

(1)若V→μW成立,且V⊆XF+,则W⊆XF+。

证:因V⊆XF+,所以有X→μV成立;于是X→μW成立。所以W⊆XF+。

(2)若r不是时空模式上对应的时空关系,记r由{U-XF+}构成。由r的构成可知,V必定是XF+的子集,而W不是XF+的子集,与第(1)步矛盾。所以r必是时空模式上的一个时空关系。

(3)若X→μY不能由F从STFD推导规则导出,则Y不是XF+的子集,因此必有Y的子集Y1满足U-XF+,则X→Y在r中不成立,与第(2)步矛盾。

STFD推导规则的有效性和完备性得证。

定理3:任何时空三范式一定是时空二范式。

证明:考察原命题的逆否命题:一个时空模式(R,V,μ)不是时空二范式,则它一定不是时空三范式。

假设时态模式(R,V,μ)不是时空二范式,则根据定义11,存在非主属性对时空码的部分时态依赖。设时空码为X,R中的非时空主属性A部分时空依赖于时空码X,即有X′⊂X,使得X′→μA成立。

可以看出,X→μX′,X′→μA,X′→/ μX,(若X′→μX,而X′为时空码X的真子集,根据时空码的定义,X不为时空码,与假设矛盾),且A∉X(由于A为非时空主属性)。由上可知,时空模式(R,V,μ)中有非时空主属性时空传递依赖于时空码X,即当i1≠i2,X→μA∈πu(i1,i2)(F),且不存在i3,i1≠i3,使 X→μA∈πu(i1,i3)(F),但X→μA∈πu(i1,i2,i3)(F)。故(R,V,μ)不是时空三范式,定理3的逆否命题成立,因此定理3得证。

3 结束语

在关系数据库和时态数据库中,通常用范式这种形式化的方法来进行数据库的规范化,在时空数据库中也是如此。许多研究人员以及学者在关系和时态范式问题上进行了深入的研究,通过把其规范到某种范式级别来达到消除冗余的目的。本文在关系数据库、时态数据库规范化理论的基础上,提出时空函数依赖,时空关键字,时空完全函数依赖的概念,并定义了时空一范式、时空二范式和时空三范式,为解决实际的时空数据库逻辑设计问题开辟了新道路。

参考文献

[1]严云洋,杨民.关系数据库模式中候选码的求解算法[J].现代计算机,1999,6:89-94.

[2]张旭.关系型数据库的规范化[J].武汉工程职业技术学院学报,2002,4:98-105.

[3]马雪英,冯睿.基于函数依赖的模式分解方法[J].计算机应用与软件,2004,4:123-130.

[4]CS.Jensen,Clifford J.A Glossary of temporal database concepts[J].ACM SIGMOD Record,1994,23(1):52-64.

[5]Wijsen J.Design of Temporal Relational Databases Based Dynamic andTemporal Functional Dependencies[J]//Proc of the International Work-shop on Recent Advances in Temporal Databases,1995:61-76.

[6]Wang X S,Bettini C,jajodia S.Logical Design for Temporal Databaseswith Multiple Granularities[J].ACM Transactions on Database System,1997,22(2):115-170.

[7]Wijsen J.Temporal FDs on Complex Objects[J].ACM Transactions onDatabase System,1999,24(1):127-176.

[8]郝忠孝.关系数据库数据理论新进展[M].北京:机械工业出版社,1998.

时空数据统计篇8

关键词：时空数据索引,延迟更新,公路网络

0 引言

随着3G网络和移动定位技术的迅猛发展，越来越多的应用开始涉及定位服务[1,2]，一些研究人员对空间和时空数据相关领域进行了研究[3,4]。而时空索引结构的主要目标是保证查询性能不受影响情况下提高数据的更新效率。本文旨在提出了一种新的时空数据索引结构，以实现在保证查询性能基本不变情况下尽量提高索引结构的更新效率[5]。

在非约束环境下，当前主流的时空索引结构可以分为两类:一类是延迟更新机制。具体包括延迟插入和延迟删除两种模式，如LUR-Tree[6],FUR-Tree[7],RUM-Tree[8],LUGrid[9]，和LGU-Tree[10]。另外一种是运用移动模式(速度向量矢量)的空间索引结构，如TPR*-Tree[11],BX-Tree[12],Bdual-Tree[13]。这些索引结构的索引更新在一定程度上解决时空索引结构的更新效率。但是，上述索引结构都是基于非约束环境的，许多学者对公路网络下的时空索引结构进行了研究，提出了相关算法[14,15,16]，如imors[14],AUs[15]。但这些算法仅是简单地运动公路网络的特征，在本文中，我们提出了基于公路网络的时空数据索引结构NLUR-Tree(Network Lazy Update R-Tree)。

1 NLUR-Tree概述

在公路网络环境下，移动对象的更新拥有两个特征:(1)所有更新根据更新后移动对象是否还在原来的公路(公路网络的边)分为边内更新和跨边更新;(2)在公路网络中对象之间的距离不再是欧几里得距离，而是边距离。正是基于上述特征，本文提出了基于延迟更新的时空数据索引结构NLUR-Tree。为了方便描述，我们先给出下列定义。

定义1(边内更新和跨边更新):更新后如果移动对象还在原来的边(公路)，那么该次更新成为边内更新，否则成为跨边更新。

另一方面，假设移动对象的上传数据包括上一次更新数据。即索引结构收到每个移动对象的更新为一个7元组。

(objID,curTime,curPos,curVel,oldTime,oldPos,oldVel)

其中obj ID表示移动对象编号，cur Time、cur Pos、cur Vel分别表示移动对象本次更新的时间、位置和速度，old Time、old Pos、old Vel分别表示移动对象本次更新的时间、位置和速度。同时，假设每个移动对象在经过一条马路时至少有两次更新。

1.1 索引结构

NLUR-Tree采用两层R-Tree结构构建。上面R-Tree用来索引公路网络的边，每个叶子节点就是边，其结构包含三个数据项:指向磁盘缓冲的p Disk Buf，指向边缓冲的p Edge Buf，和保存边信息Edge Info(如边编号，边特征等等)。图1描述了索引结构。

内存缓冲每个边都有个内存缓冲，所有更新将会先被缓存在该缓冲。内存缓冲由内存缓冲池统一动态管理，每个内存缓冲的元组是一个5元组:

(objID,curTime,curPos,curVel,curDir)

其中obj ID,cur Tim,cur Pos,and cur Vel的含义与上面元组一致，cur Dir表示对象的移动速度，这里通过边的两个点确定(类似于FNR-Tree)。

磁盘存储每条边都有称为磁盘存储的磁盘存储区，它按照移动对象编号顺序存放边上的所有移动对象信息。它的初始大小为一页，具体大小由磁盘池动态管理。

过时表OT NLUR-Tree不仅允许过时信息和当前信息同时存在磁盘存储，也允许当前信息不存在。OT表就是用来记录最新更新信息。OT表中的所有对象按照对象编号进行排序，每个元组按照4-元组:

(objID,edgeID,numObj,is Flush)

其中obj ID表示对象编号，edge ID表示当前边的编号，num Obj记录过时信息的个数，is Flush则表示对象的当前信息是否已经更新到磁盘存储。

边链接边链接是用来搜索刷新操作的对应实体。边链接是一个5元组的有序链表。

(edgeID,diskNum,insNum,pEdge)

其中，disk Num是磁盘存储的对象个数，ins Num是指上一次刷新之后进入该边的所有对象个数，p Edge是指向对应边的指针。边链接是按照ins Num、或ins Num和disk Num的相除。

内存池该结构是固定大小的内存缓冲池，当某个内存缓冲不足以存储到来的更新数据，内存池会将指定内存块分配给该内存缓冲。当内存缓冲被刷新到磁盘存储时，该内存缓冲的内存空间将被回收。

磁盘池磁盘池用来管理由若干磁盘页组成的磁盘空间。当某个磁盘存储不足以存储新的更新时，会向磁盘池申请一页空间。当磁盘存储的空区域超过一页时，磁盘存储会将空区域释放给磁盘池。

1.2 更新操作

本节讨论NLUR-Tree的更新操作，整个更新操作分为缓冲更新和磁盘刷新两个阶段。缓冲更新就是将接收到更新缓冲到内存缓冲，磁盘刷新则是将内存缓冲中的更新信息刷新到磁盘存储。缓冲更新由接收到一个新更新，而磁盘刷新则是当一个内存缓冲不足以存储存储下一次更新。

内存更新一旦系统收到一个对象更新，内存缓冲就被触发，如算法1所示。首先，系统判断当前更新是边内更新还是跨边更新?如果是跨边更新，执行以下操作:

(1)按照对象编号搜索原先边上的内存缓冲，如果有，则删除该更新对象;

(2)按照对象编号搜索过时表OT，如果有，执行以下操作:(a)如果OT表中该对象的刷新标志is Flush如果为真，num Ob增1(is Flush为真表示磁盘存储中有过时更新项);

(b)更新当前边编号，表示移动对象已经到了新的边;

(c)将刷新标志置为false。

如果OT表找不到该对象，则在OT表中新建该对象的过时数据项，其中边编号为更新项的编号，过时对象数为1，刷新标志为false。

如果更新为边内更新，检查当前对象是否处在匀速运动，如果是匀速的，则直接丢弃本次更新。否则直接将本次更新缓冲到内存缓冲。如果内存缓冲不足以存储本次更新，那么内存池将分配一定空间给内存缓冲。

算法1缓冲更新的伪代码

磁盘刷新磁盘刷新是将内存缓冲中的更新项刷新到对应的磁盘存储中以实现内存的释放，当内存不足或规定时间内该操作将被执行(如算法2所示)。由于内存缓冲，磁盘存储和过时表的对象都按照对象编号进行排序。首先，将磁盘存储的位置信息读到指定内存队列中。按照下列四种情况对每个队列中的对象进行处理。

(1)如果磁盘存储、内存缓冲和过时表都包含某个对象的位置更新。如果过时表中该对象数据项的边编号不是当前叶子节点的边，则直接将这两个位置更新删除，如果过时表的num Obj是2，则直接删除该对象，否则num Obj减去2。如果是当前叶子节点的边编号，并且当前num Obj是1，则直接删除磁盘存储和过时表的该数据项，将内存缓冲的更新位置放在队列，如果num Obj大于1，则num Obj减一(过时对象少了一个)，is Flush置为True(表示最新位置已经更新到磁盘存储)。

(2)如果磁盘存储包含该对象，但内存缓冲没有。在这种情况下，只要检测该对象位置信息是否为过时项，如果is Flush是False，则直接删除该对象位置，否则比较过时表的该对象信息的边编号是否等于当前叶子节点的边编号，如果两者不同，则直接删除该对象，否则保留。

(3)内存缓冲包含该独享，但磁盘存储没有。在这种情况下，过时表必存在该对象信息。如果过时表中该对象的边编号不是当前编号，则直接删除该对象，否则保留该对象。最后修改过时表(num Obj减一，如果0，则删除该对象，is Flush为True)。

(4)如果内存缓冲和磁盘缓冲都有该对象，但过时表没有。则只要将内存缓冲的对象数据保留。

算法2磁盘刷新的伪代码

最后，内存队列的数据项将被写入磁盘存储。同时，按照对象个数调整磁盘存储大小，并释放该叶子节点的内存缓冲。

图2显示了在不同的平均速度情况下，三种算法的更新效率之间的比率基本保持不变。图3显示了不同速度变化比率(匀速运动对象的比率0,50%,100%)算法的平均I/O代价。从两个图中可以发现，NLUR-Tree的更新效率远远高于其他两种算法。

图3则显示了大多数对象处在匀速运动时，NLUR-Tree的更新效率急剧提高。这种情况与前面算法设计理念一致。

2 实验结果和分析

在本节，我们通过实验验证和分析NLUR-Tree的实验性能。为了提高对比性，我们重写了IMORS和Aus算法作为与NLUR-Tree算法的对比。为了体现公平，R*-Tree用来索引IMORS和Aus的边。我们采用一个5000×5000的公路网络(SUMO生成的随机公路网络[17])，包括1000条边，最小边长度为100，平均长度为200。并生成一个综合数据集，里面包含1 000 000对象，使用GSTD[17]生成的轨迹模拟。

图2显示了当移动对象的平均速度分别从40、20、10情况下NLUR-Tree、Aus和IMORS算法的平均I/O代价。从图中可以发现，随着平均速度的降低，三种算法的更新代价也在逐步降低，这是因为随着移动对象平均速度的增加，移动对象在每条公路上的更新次数会减少，这就意味着在跨边更新在所有更新的比率将逐渐增大。因此，随着跨边更新比率的增加，无论是NLUR-Tree，还是Aus和IMORS的更新代价，都会随之增大。但我们也发现我们的算法增加的比率要比其他算法小得多，这是因为内存缓冲的存在，使得跨边更新导致的更新代价的增加也相对较少。

图3显示了在移动对象按平均速度运动的比率(0,50%,100%)情况下，NLUR-Tree、Aus和IMORS之间的算法比较。从图中可以发现，随着平均速度运动的移动对象比率的增加，IMORS的更新代价并没有改变，但NLUR-Tree和Aus算法的更新代价却在急剧下降，这是因为这两种算法都引入了内存缓冲机制，但显然NLUR-Tree算法的效率要比Aus少将近一个数量级的代价。而当移动对象不是按照平均速度运动时，Aus的更新代价接近IMORS，这时其实就是Aus的缓冲机制的效果并不好，而我们算法的效率显然要比Aus和IMORS的效果好得多。

这就证明了在不同条件下，我们的算法要比当前主流算法的效率都要好。

图4显示了不同大小(全区域的1%～5%)的范围查询(空间数据查询最常用的查询方式之一)下三种算法的比较。由于三种算法都采用R*-Tree来索引公路网络，实验结果显示了NLUR-Tree与其他两种算法相比，不管是多少比率，查询性能都没降低。

3 结语

时空数据统计篇9

我们东部大陆地震1970~1975年后、西部1975~1980年后的三级及以上的地震目录资料是基本上完整的。1970~1975我国四级及其以上的地震目录资料是基本完整的。1900~1950后西部的、1500~1550后年东部的五级及以上的地震目录资料近似完整。1500年左右以后的地震目录资料可以认为是完整的。

2 地震时间统计分布特征

根据Poisson模型和ETAS模型对我国的历史破坏性地震及现代仪器记录的地震的时间特征进行深入分析基础上, 采用随机除丛法 (基于ETAS模型) 将余震进行删除, 较之于传统的时空窗法, 并采用多种方法对地震时间分布的独立性、地震时间分布的丛集性以及地震时间分布的相关性进行了检验, 从其结果可以看出我国地震时间统计分布具有以下特征:在删除余震后我国的地震目录与泊松模式完全吻合, 只是在时间上存在不均匀性;仪器记录地震中, 我国川滇、东北和华北震区具有10年尺度的地震活动变化周期;有大约70年尺度的长期丛集性的历史破坏性地震存在于华北地震区;500多年的中强地震目录表明我国的中强地震具有长期丛集性。

在时间上, 导致地震活动不平稳性的原因可能有以下几个: (1) 全球或区域范围内的长期应力变化产生相互影响; (2) 随着时间的变化, 地震构造的蠕动、滑动等活动的速率也有所不同; (3) 形成于强震后的破裂带对该区域的地震活动特征进行长期的控制而导致地震活动的长期丛集。

3 地震的空间分布丛集特征

通过对我国一起记录的地震目录进行研究表明, 各地震带、地震区的空间分布模式具有丛集性, 其丛集程度在某种程度上取决于区域的地震构造环境。

未来大地震潜在震区在已发生过小地震的周围, 这是可测量的真实的物理现象, 这一现象与我国22个地震带和8个研究区的准确测量结果一致;构造环境会对这一现象的测量结果产生一定的影响, 但这一影响并非唯一;同时, "未来大地震潜在震区在已发生过小地震的周围"这一趋势随着时间变化具有稳定性。基于上述结论可以肯定的说, 地震危险性用地震活动的记录资料进行计算是可行的。

4 地震空间点分布模型

研究表明, 我国大陆地区的地震空间分布是丛集的, 其丛集模式可以描述成由一个混合高斯模型 (广义的Thomas模型) , 这个混合模型由丛集尺度不同的两个高斯模型组成。基于地震丛集尺度根据起始震级不同的地震目录计算得到大致相同的事实, 可以认为震级不对我国大陆地震空间丛集分布的尺度产生影响。

5 地震危险性分析结果受余震时空丛集的影响

对余震影响地震危险性结果的情况, 采用蒙特卡洛模拟方法进行了深入研究。结果表明, 余震对于50年超越概率10%下峰值加速度的影响值是1%~6%, 且随着超越概率水平的提高而增大。地震危险较弱的地区受到余震的影响要大于地震危险性较强的地区, 这主要是因为对地震危险性较弱地区的地震危险性的影响主要来自近场小震。余震对地震危险性较强地区的影响要小于地震危险性较弱的地区, 余震后, 小震频度加大, 从而较大的影响着场点的地震危险性。研究表明, 震级上限 (Mu) 越大, 余震对地震危险性的影响越小;而b值发生变化时, 余震对地震危险性的影响基本不变。

当强余震产生的地震动值对地震危险性分析的影响超过主震产生的地震动值时, 可以考虑将强余震影响的计算方法运用到地震危险性的分析中。单一潜在震源区的研究结果表明, 当强余震潜在震在源区一端分布时, 考虑强余震影响的地震危险分析结果会明显大于未考虑强余震的分析结果。对于50年超越概率10%概率水平下的地震动值, 强余震影响可能会超过70%, 对于50年超越概率2%概率水平下地震动值, 强余震影响低于30%。

6 基于空间光滑的地震活动性模型的地震危险性分析方法应用研究

以地震带为统计单元对地震活动性参数进行计算、空间分布函数以空间光滑的地震活动性模型, 采用4个模型对华北地区的地震危险性和地震活动性模型进行了计算, 其结果如下:

1) 通过仪器记录地震计算得到的地震危险性和地震活动性模型结果是对华北地区现今的地震危险性水平和地震活动水平的真实反映, 与人们对对现今华北地区的地震危险性认识相一致。

2) 采用历史强震 (4.7级及以上) 计算的地震危险性结果和地震活动性模型, 能对华北地区中强地震活动区的地震危险性水平进行较好的反映。

3) 用地震应变对于地震活动率进行计算, 并根据线椭圆模型和点椭圆模型计算得到的地震活动性模型, 能对空间大地震的构造特征和活动水平进行较好的反映。

7 结束语

地震时空统计分布特征与地震危险性密切相关, 本文将中国大陆地震目录作为研究的基础资料, 对其进行了研究, 并得到了一些值得借鉴的结果。

摘要：以中国大陆地震资料为依据, 在用不同除丛方法删除余震及对地震目录的完整性进行分析的基础上, 研究了发生地震的时空统计分布特征, 同时对地震危险性分析受余震的影响进行了研究, 试图对如何直接把地震目录应用与地震危险性分析进行探讨。

关键词：地震危险性分析,地震时空统计分布,地震目录资料

参考文献

[1]蔡静谊.台湾地震活动的标度、相关及记忆性探讨[J].台湾中正大学地震研究所, 1999.

[2]国家地震局震害防御司.中国历史强震目录[M].北京:地震出版.1995.

时空数据统计篇10

1 研究区域和研究思路

1.1 研究区域概况

河南省位于我国中东部,地处黄河中下游地区,河南省的地形地貌特征东北与西南差异明显,整体呈西高东低趋势,北西南三面山脉沿省界呈半环形分布,中、东部为黄淮海平原。河南省是我国传统的农业大省,也是重要的经济大省、迅速发展的新型工业大省,在城市化建设中河南省也有较快的发展速度。

1.2 研究思路

本文先收集了2000-2012年间的河南省统计年鉴中的城市建成区数据和DMSP/OLS夜间灯光数据进行比较,证实灯光数据的可用性,进而确定河南省诚征空间扩张的动态变化指标,根据指标从时间上分析各个地市及河南省整体的城镇扩张的变化,从空间上对比分析河南省各市的扩张特征,最终得出影响城镇扩张的因素,为以后的城市化趋势进行预测。

2 基于DMSP/OLS数据的河南省各市城镇空间扩张特征分析

2.1 DMSP/OLS数据预处理

数据源为美国国家地球物理数据中心提供的DMSP/OLS夜间灯光数据,本文选择2000、2004、2008、2012年的无云观测叠加数据,对河南省城市化进程进行研究和分析。统计年鉴中的建成区面积由于缺乏空间信息,难以满足对城市空间格局研究的需求,通过对比相邻年份的DMSP/OLS夜间灯光数据,可以直观地看出城市空间格局的变化情况。本文先对DMSP/OLS数据进行降噪处理,利用河南省边界矢量数据将DMSP/OLS夜间灯光数据在arcgis中进行掩膜处理,根据相关学者所做的研究,本文采用灯光亮度属性指标作为基于DMSP/OLS数据的城市化水平指数。

2.2 夜间灯光亮度的动态变化指标

(3)河南省全境平均亮度:

各市平均亮度距平值:

各市平均亮度距平值=各市平均亮度-河南省全景平均亮度

各市平均亮度增长速率:

其中,DN为像元亮度,pi为像元亮度,ni为各市亮度为pi的像元个数,Nj为各市的像元个数,Nhn为河南省的总像元个数。

2.3 河南省各市城市空间扩张对比分析

从图1可以看出,河南省各市级行政区2000年和2012年的夜景灯光亮度距平值。其中,颜色由浅及深分别代表各市平均亮度与全省平均亮度由高到低的差值。从图1能够看出,相较于2000年各市的平均亮度,2012年超过平均水平的市级行政区个数明显增加,作为省会城市,以郑州市为中心的大型市区的规模扩大了很多,聚集度更加明显,这也说明了河南省的城镇空间增长具有城市群聚集性的特点。从地形上看,高于灯光平均亮度的区域均为地势平坦的平原地区,有利于城镇建设和城市扩张。洛阳市和南阳市等市区,虽然市区的灯光聚集区亮度较高,范围较大,但河南省西南部为伏牛山脉,覆盖了河南省洛阳、南阳、平顶山、三门峡和驻马店5市的15个县,受山脉地形影响,所处区位不利于城市化建设。因此,在图1中所对应的灯光亮度也较暗,受此影响,洛阳、南阳等市区的灯光平均亮度低于全省亮度平均值。信阳市的西部和南部是由桐柏山、大别山构成的豫南山地,同洛阳等市区一样,信阳市的灯光亮度也低于全省平均亮度值。

3 结论

河南省城市化的发展在2000-2012年间有加速发展的趋势,基本模式是以郑州市为中心城市,簇群式外扩,各市自身放射性外扩进而轴线式蔓延进行扩散;受地形影响,西南部山区城市化进程缓慢,以至于该市整体城市化水平不高;交通线路对城市空间扩张也有很大影响,多数城市的扩张都是沿着道路进行的。在之后的若干年,城市化进程中城市空间会继续沿着道路两侧有一定的扩张,以郑州市为中心的城市群将进一步扩大,河南省东部如开封、商丘等市区因所处地形优势,城市空间扩张相较于其他地区将会更明显。

摘要：在研究城市化进程时,基于DMSP/OLS夜间灯光数据获得的城市空间信息基本可以反映我国城市化发展的实际情况。以河南省为例,提取出2000-2012年的河南城市化空间信息,对河南省18个市级行政区的城市化空间扩张进行监测,分析城市空间扩张的格局变化及速率,得出影响城市空间扩张的因素并预测城市空间扩张的方向。

关键词：城市化,空间扩张,DMSP/OLS,河南省

参考文献

【时空数据统计】推荐阅读：

超越时空06-20

时空计算07-01

时空演变07-08

时空观念07-12

时空协调07-13

时空拓展07-23

活动时空07-23

时空穿越08-27

时空资源10-06