矢量数据(精选10篇)
矢量数据 篇1
测绘产品为区域经济规划、国土资源调查以及农林水利、能源交通、城市规划建设等诸多方面提供大量与地理位置有关的基础信息, 因而在整个测绘部门的管理中成果管理显得尤为重要。测绘产业是地理信息产业, 它是地理信息产业的支柱产业。随着计算机技术、空间技术、通讯技术的飞速发展, 测绘科技发展出现了日新月异的变化。测绘产品资料广泛地应用于国民经济建设的各个领域。
但目前, 大部分的测绘产品管理仍处于手工阶段, 人力物力资源消耗大、工作效率低、工作可靠性差。面对着测绘技术的迅猛发展和变化, 面对着凝聚着广大测绘工作者辛勤汗水的大量珍贵的测绘产品, 如何管理好这些测绘产品, 使其接收、存储、管理、供应更加规范和高效就成为我们迫切需要解决的问题。
改革开放以来, 我国城市建设实现了高速、持续的发展。在信息化的时代, 信息已成为一项重要资产。对信息的有效管理和利用, 将大大地提高企业内部运作的效率和对市场需求的快速反应能力, 最终增强市场竞争力[2]。从城市建设规划决策层和各个企业管理决策层角度出发, 决策者需要在宏观上对全市的测绘产品的情况等综合指标有一个全面的了解;对于各种建设工程的设计、施工以及管理操作人员来讲, 实现测绘产品资料管理的全面化和自动化, 才能更好的提高企业的工作效率, 顺应信息化社会的发展潮流。因此, 在测绘产品的管理中, 迫切需要引进一种新型的管理手段, 能够依托计算机对现有数据进行有效的分析。于是, 管理测绘产品的地理信息系统应运而生。
1 城市基础矢量数据的分类分层设计
在城市基础矢量数据库中, 矢量数据采取分类分层存储。按地形图的地形要素内容可分为:测量控制点、居住建筑、工矿设施、交通、管线设施、水系、境界、地质土貌、农田植被等类别 (图1) 。
2 城市基础矢量数据在数据库中的编码
为了更科学地了解、管理和应用城市矢量数据, 保证城市基础地理信息在系统内及其它专业信息系统间采集、存储、检索、分析、输出及交换的一致性, 实现系统兼容、信息共享, 研究和制定地形要素分类与编码的标准, 具有十分重要的意义[10]。
地形要素分类与编码的原则如下。
(1) 科学性:在对城市地理信息进行分类和层次划分时, 要以城市规划发展的趋势、地理信息系统的特点等作为依据和出发点, 进行科学的分类和分层, 不能以一个或几个行业和部门的分类作为标准。
(2) 系统性:将整个城市地理信息作为一个大的系统, 划分为若干个层次, 在各层次的结构、要素的代码编制等方面保证层次清楚、结构合理, 相互协调配合, 形成完整的编码体系。
(3) 适用性:编码要能适应地形图数据采集的作业习惯、数据库建设的要求, 以及多种行业的需要, 做到易记, 适应面广。
(4) 唯一性:列入分类结构体系中的各地理要素的位置唯一, 且只有唯一的一个代码与之对应。
(5) 兼容性:兼顾国家标准和其他单位的分类编码标准为信息跨行业、跨地域共享打好基础。
(6) 可扩展性:考虑到地理要素的发展变化, 在码位的分配上留有充分余地以便要素增加时不致打乱既有的分类编码体系。
以上分类编码原则应综合考虑, 力求使编码的设计能达到最优化的效果。
3 城市基础矢量数据的获取
城市基础地理信息系统建设所使用的矢量数据获取手段总结起来主要有以下几种。
(1) 原图数字化。
图解地图的内容可以通过数字化方式转换成数字地图, 采用数字化仪或扫描仪将地图的图解位置转换成统一坐标系统中的解析坐标, 并应用数字化地图符号菜单或计算机键盘输入地图符号和注记的代码。这种方法建立的数据精度不会高于原图, 不能满足某些工程用图的需要, 随着全站仪的普及和GPS全站仪系统的成熟, 数字化原图将会被摒弃。
(2) 全野外数据采集。
用全站仪、GPS RTK进行实地测量, 将野外采集的数据自动传输到电子手簿、磁卡或便携机内记录, 并在现场绘制地形 (草) 图, 在室内将数据自动传输到计算机, 人机交互编辑后, 由计算机自动生成数字地图。在基础地理信息系统中, 全野外数字测图作为测量与更新数据的主要方法, 具有机动、灵活、易于修改等特点。这种方法也称为内外业一体化地面数字测图。
(3) 部分原图数字化, 部分全野外数据采集。
用一部分实测精确坐标代替数字化坐标的地图数字化方式, 在己有地图地区, 在野外采用电子全站仪和电子记录手簿进行碎部测量, 得到一些建筑物点的精确坐标, 在地图数字化作业中, 可以用这些点的精确坐标代替相应点的数字化方法得到的坐标。这种方法利用了现有地图资料, 又在一定程度上提高了原有图解地图的精度, 随着地图的不断更新, 具有准确坐标的地物点将逐步增加, 地图精度也相应得到提高。
(4) 数字摄影测量方法。
随着计算机软、硬件技术的发展以及摄影测量数据处理手段的不断进步, 摄影测量的方法逐渐在数据采集中采用, 目前很多城市都己经开始利用航空摄影测量的方法来获取l∶500地形图数据。该方法作业速度快、覆盖面积大, 对于大范围、比较开阔地区的基础数据采集来说, 也是一种比较理想的模式, 该方式需要进行像控点测量、航片调绘等工作。另外精度比起野外数据直接采集来说要差一些, 但可以根据具体情况进行选用。国内大多数城市就是通过以上几种方式获取了覆盖城市范围或部分范围的基础地理图形数据, 给城市基础地理信息系统的建设提供了空间数据源。
参考文献
[1]李炼恒, 赵俊三, 赵耀龙.城市基础地理信息系统的功能与总体设计研究[J].科技资讯, 2002, 27 (3) .
[2]田茂义, 卢秀山, 张燕, 等.基于oracle的“数字城市”基础地理空间数据库的实现[J].科技创新导报, 2005, 30 (3) .
[3]孙怡, 陈强, 沈玉英, 等.基于组件对象的地图数据管理方法[J].吉林大学学报 (信息科学版) , 2008 (S1) .
矢量数据 篇2
Microstation V8下矢量数据的坐标转换程序实现
本文针对在Microstation V8平台下的dgn数据编辑处理过程中经常需要进行的矢量数据坐标转换,利用VBA二次开发,应用严密的数学模型进行矢量数据坐标转换程序实现.
作 者:崔菲 张岳 Cui Fer Zhang Yue 作者单位:浙江省第二测绘院,浙江,杭州,310012刊 名:现代测绘英文刊名:MODERN SURVEYING AND MAPPING年,卷(期):32(1)分类号:P226+3关键词:矢量数据 坐标转换 VBA 二次开发
矢量数据 篇3
关键词:地房籍系统;矢量数据;数据质量;GIS技术
中图分类号:TP391
地房籍合一管理信息系统是运用GIS、Web等平台建立的图属合一数据库,通过空间数据和地籍、房籍属性合一构建针对图形和属性能够相互查询,关联管理,地籍和房籍信息无缝结合,并具有图形属性输出功能的管理业务系统。能实现宗地登记、产权登记、交易、拆迁、物业管理、房产开发等高效、互联互动式房地产业务管理。运用先进的信息系统技术优势杜绝传统管理模式上的各种漏洞。
目前,重庆市正在推进“以图管地、以图管房、房地合一”数据管理系统的运行。地房籍信息系统的构建是一项复杂的系统工程,是土地房屋管理部门的工作重点,数据是信息系统的基础,源数据质量的优劣,决定了信息系统实际运用价值的大小。源数据包括矢量数据和属性数据。本文从矢量数据收集手段和汇总流程研究来确保数据质量。
1 土地房屋管理信息收集和存在的问题
地房籍管理对象包括国有土地使用权证、房屋所有权证、他项权利证、商品房预售许可证等权证,及开放商、权利人等实体。涉及到登记机关和处室、业务登记人员、政府部分、金融部门、测绘单位和数据库建设人员。基础数据收集数量大、任务重、且历史材料受存储条件限制,有部分残缺不全。
在调查中以土地权属为核心,以地块为基础,对附着物的权属、位置、数量、质量和利用现状等土地基本信息进行验证。其中,“以地块为基础”中的“地块”是地籍信息的基本载体,是具有固定的位置和明确的边界,并可辨认出属性的最小土地单位。传统的地籍管理在宗地发生变更后,权利人和现状都相应的发生变化,如某单位购买了一块国有存量土地,后转卖给企业,再转卖给开发商,开发商修建了住宅小区,内有高档住宅、小区道路、休闲设施、绿化等,开发商办理房地产权证时反映现状的宗地图与原单位购买国有存量土地时的宗地图相差甚大。单凭图件和权利人查找都无法找到共同点,历史轨迹只能追溯到上一次业务流程办理的情况,恢复某一历史数据过程过于复杂。
历史上房屋和土地分开办理产权证,存在一部分只有房产证,和一部分只有土地证的情况。在数据库中就会出现宗地上的房屋空属性或者已经办理了房产证的房屋无法落地的现象。
2 数据库构建中的矢量数据汇总方法
2.1 常规矢量数据汇总
(1)对于历史上无坐标的纸质或者电子版宗地图,利用图上权属界址点位置和相关地物点距离来判断权属线,制作地块。这样做的优点是界址点位置与原始图件一致,不会产生权属纠纷。缺点是以前测量的面积有可能与矢量化以后的地块面积不一致,造成图块面积与权证面积不匹配的情况;界址点现状如果发生变更就无法准确定位界址点。
(2)按照地房籍管理的宗地号和房籍号的顺序来清理档案,优点是避免漏掉和重复清理原地房档案信息。缺点是未能建立地籍档案的地块无法被清理到。
2.2 利用GIS系统的数据汇总
GIS系统是在计算机硬、软件系统支持下,对空间数据进行采集、储存、管理、运算、分析、显示和描述的技术系统。主要从三个方面来帮助我们进行数据判断汇总:
(1)结合第二次全国土地调查城镇地籍调查数据库。城镇地籍调查是以测量城镇地籍图,建立地籍数据库为目的的调查活动。其成果作为管理土地权属的重要依据。
利用第二次全国土地调查中的城镇调查现状成果,结合土地档案,增加判断位置的正确率。二调中城镇地籍调查成果是按“街道、街坊、宗地号”这样的结构来进行的数据收集,主要体现在城区,具体表现为以“街道办事处—居委会”来体现行政区划关系。与地房籍系统的数据汇总规程一致,可以有效利用。使用二调城镇地籍图的主要目的,是为了各宗地能在控制范围内位置相互接边,以分级控制的形式来确保权属坐标位置的准确性。但二调时间为2009年,会产生调查结果的延时性,部分已经变更的宗地需要单独对待,且城镇地籍调查成果主要集中在规划城区范围以内,对乡镇的地籍调查缺少基础坐标资料。这部分宗地和房屋信息需要测量人员实地外业测绘补充。
(2)结合遥感影像图库。遥感影像图库是具有统一坐标系统的现状影像图件。
影像图经常能帮助我们更直观的感受到房屋周围的情况,比地形图更高的可视化辨识率,让结合遥感影像图的判断几乎没有出现“找不到地方”、“房屋样子看起来差不多,不知道是哪一栋”的情况。使用遥感影像图库的主要目的,是为了给人为的主观判断增加佐证,保证调查质量。调查地籍档案的过程中,因为测量技术的影响,会出现早期的宗地图没有坐标,没有明显的标志性建筑物,且相邻单位权利人早已发生多次变化,无法准确定位的地块。为了节省外业调查的人力和物力,更快的判断地块位置,可以采用遥感影像辅助定位。因其统一坐标系的优势,可以做到影像图和矢量图的结合,大大缩短档案调查时间。
(3)相邻宗地间的拓扑错误修正。拓扑错误是指矢量数据的点,线,面在拓扑上存在肉眼发现不了的坐标点重复,碎线、碎面等错误。如相邻的两宗地存在拓扑错误,会导致面积计算错误,系统判断权属界线交叉的情况。
一般在相邻宗地接合的情况下需要进行拓扑检查,可以采用Arcgis、Mapgis、K9等软件来进行检查。地籍矢量要素在系统中体现为“区”,检查中可能出现“区”的相交情况。
以Mapgis为例,拓扑错误的处理方法一般为平差,
1)在矢量化时,难免会出现一些失误,在该断开的地方线没有断开,这给造区过程带来麻烦,可以使用Mapgis平台中的自动减断线来处理线相交的问题。但该功能是以节点为剪断端点,如果线头刚好超出节点一小段,就会被剪断成微短线。
2)微短线会对拓扑处理和空间分析造成影响,所以这类线是需要清除的,Mapgis平台同样有清除微短线的功能,但是需要自己设置最小线长,以便系统按照用户自己的需要对微短线进行处理。除了微短线,重叠坐标点也属于拓扑错误,这类问题很好处理,删除重叠点就可以了。排除了对区拓扑处理有影响的线和点以后,自然不可避免就会出现线不能闭合的情况。
3)不能形成封闭区域的线被称作悬挂弧段,需要进行节点平差,可以有线节点平差和弧段节点平差两种,平差以后可能造成面积与拓扑处理以前有微小的差异。所以这里需要人为的判断。
只有建立正确的拓扑关系才能构建准确的区文件,保证数据库质量。
3 结束语
总之,矢量数据汇总是数据库建立的基础,它既受地籍测量的技术影响,也受数据调查规程的影响,是地房籍系统构成过程中的重点和难点。地房籍系统作为方便民生,控制管理,交互查询等各方面都信息化的日常管理平台,其基础矢量数据质量不仅会影响今后权属和地块变更的质量,更为权属纠纷、司法调查提供有效的法律依据。一个不起眼的错误可能会造成权利人巨大的经济损失和严重的社会影响。快速准确的完成系统基础数据汇总是今后日常登记变更业务顺利进行的有力保证。
参考文献:
[1]詹长根.地籍测量学[M].武汉:武汉大学出版社,2001.
[2]林增杰,严星,谭俊.地籍管理[M].北京:中国人民大学出版社,2001.
[3]杜海平,詹长根,李兴林.现代地籍理论与实践[M].深圳:海天出版社,1999.
[4]刘家彬,张金亭,胡石元.土地信息系统理论与方法[M].北京:测绘出版社,2002.
作者简介:林芝(1985-),女,重庆万州人,2007年毕业于淮海工学院测绘工程专业,助理工程师,现主要从事地籍测量和地房籍系统运用。研究方向:计算机数据汇总。
基于面积阈值的矢量数据压缩方法 篇4
矢量数据压缩是地理数据处理中的一种常用技术,目前该技术已在更多领域得到应用,如医学图像特征边界的重采样等。曲线矢量数据压缩实质上是一个信息压缩问题,它是从组成曲线的点序集合S中抽取一个点序子集A,也就是说A是S的一部分,而不是一些新的点[1]。其中压缩的主要对象是线状图形要素,因为点状图形要素可以看作线状图形要素的特例,而且面状图形要素的基础也是线状图形要素[2]。压缩的目标是在尽可能保持原有特征的情况下去除数据中的冗余部分,以减少数据的存贮量,加快后继处理速度。已有许多学者对数据压缩这一课题做了深入研究并提出了许多经典的算法,如Douglas-Pecuker算法、圆柱法、垂距限值法等[3]。但上述几种经典的算法都是以距离为判定标准的,且判定完全依据阈值,难免会存在一定局限性。本文分析了经典的矢量压缩算法,并在此基础上针对已有算法的不足和局限性提出一种改进的曲线矢量压缩算法。
1 传统的矢量数据压缩算法
传统的矢量数据压缩方法主要有圆柱法、垂距限值法、Douglas-Pecuker算法等,下面简单地分析这些算法的原理并指出优缺点。
Douglas-Pecuker算法从全局出发,利用递归的方式处理问题。该算法的过程为:首先用直线连接矢量数据的起点p0和终点pn,在此基础上计算其他各点到该直线的距离并找出到距该直线距离最远的点pi,如果点pi到直线的距离小于阈值D则仅保留点p0和pn且算法结束;如果点pi到直线的距离大于阈值则分别对独立的两段进行处理,第一段以p0为起点pi为终点,另一段以pi为起点pn为终点,重新采用上述方式递归处理直到算法结束[4]。
Douglas-Pecuker算法具有平移、旋转的不变性,给定曲线与限差后,抽样结果一致等优点[5]。但该算法的思想是递归实现,实时处理的效率仍不够理想,同时无法保证面积的误差精度[6]。例如对于图1的情况,选择平行线L1与L2之间的距离作为阈值,当仅处理点1,2,3组成的实线部分时,点2被保留,当处理点1,2,3,4组成的部分时,按照Douglas-Pecuker算法点2与点3会被删除,说明该算法仍存在不稳定的情况。
另外的方法如圆柱法和垂距限值法虽然处理过程简单且执行效率高,但存在同样的问题。如利用圆柱法处理图1中的情况也会将点2和点3删除;垂距限值法在处理同一数据集时,从相反的方向进行处理会得到不同的结果,在点密度分布不均匀的情况下很难选择合适的阈值,这是由于该方法只考虑局部情况造成的结果。
2 算法改进
2.1 判定依据
上述几种传统的矢量数据压缩算法有个共同点是以距离作为判定依据。距离在压缩中作为阈值是一个很好的选择,但也存在一些问题,如对地图边界数据压缩时无法对面积误差进行控制。
本文以面积作为判定依据提出了一种新的算法。由于面积具有可扩展性,相邻的面积可以通过简单的相加得到更大区域的信息,因而在压缩中保留面积信息可以有效地减少重复计算。
多边形面积的计算是本算法的基础,矢量的叉乘运算是计算三角形面积的一种快速且有效的方法,并且很容易将它扩展到多边形面积的计算。
其中矢量叉乘的定义如下:
式中
根据叉乘的定义,图2中三角形(p0, p1, p2)的面积S1可以表示为:
同理可求得三角形(p0, p2, p3)的面积:
及三角形(p0, p3, p4)的面积:
需要注意向量的叉乘运算包含符号,因此可能导致上述几个表达式计算出的面积的值为负。虽然面积的负值在实际中没有对应的含义,但在求多边形面积中却十分关键。如图2中多边形面积的绝对值|S|可以表示为|S|=| -|S1|+|S2|-|S3| |。可见图2中多边形的面积S即为多个三角形的面积之和,可表示为S=S1+S2+S3。在计算过程中不能去掉面积的符号信息,不然会重复累加重叠部分的面积,因此只有在对所有面积求和后取绝对值才能正确地获得多边形面积的值。
2.2 算法流程
本文提出以面积为判定阈值的新算法。该算法可以概括为两个主要组成部分:(1) 顺序遍历点集并从中获取一个符合要求的子集;(2) 在得到的子集中选取最优点保留,并删除冗余点。重复这两个步骤直到整个点集处理完毕。
设待压缩的点集SETp由点序列{p0, p1,…,pn}组成,其中各点对应的坐标依次为{(x0,y0), (x1,y1),…, (xn,yn)}。并设SETc为当前读入点的集合,它是SETp的一个子集。下文将对图3中的流程做详细的说明,其中图4作为一个压缩的实例。
算法开始后首先判断压缩前的点集SETp是否为空,不为空则继续一下的步骤,否则算法结束。顺序读取SETp中的点,每次读取一个点并更新点集SETc的面积Sc。面积Sc更新为其原面积加上一个三角形的面积,其中的三角形由原SETc的起点、终点及新加入点组成。如果SETc的点数不足3个构不成多边形时,则定义其面积Sc的值为0。
在图4中,若当前SETc为(p0,p1,p2)时,则Sc为三角形(p0,p1,p2)的面积。如果Sc的绝对值小于阈值,则读取其后续点p3到SETc,并更新面积为Sc=Sc+S(p0,p2,p3)。其实Sc为由SETc顺序构成的多边形的面积。
若SETc的面积Sc大于阈值,则在SETc中寻找一个最优的点保留。首先新增一个临时点集SETct初始化为SETc的一个拷贝,随后扩展SETct。若后续点加入后SETct面积的绝对值增加且其点数不大于SETc中点数的2倍,则将该点加入SETct,否则终止对SETct的扩展。
之后以SETct中的起点及终点为两个确定点,遍历SETc中的点,其中与上述两点组成三角形的面积绝对值最大的点定义为最优点。根据实践,以这种方法寻找局部最优点不仅能提高算法速度,且其选取的当前最优点将保留更多的全局信息。
图4中,若当SETc为{p0,…,p3}时其面积大于面积阈值,则新建SETct并拷贝SETc的信息。此后扩展SETct,但由于扩展p5时三角形面积S(p0,p4,p5)与原Sc的符号相反,因此加入p5只会减小SETct面积的绝对值。最终SETct扩展为(p0,…,p4),之后以p0,p4为三角形的两个确定点在SETc中寻找最优的点。其中S(p0, p2, p4)面积最大,选取p2为最优点。
从SETp中删除最优点与SETc起点间的所有点,清空SETc中除之最优点外的所有点,并以该最优点为新的起点从SETp中读取最优点。
图4中根据上述的假设,则删除p2与p0之间的所有点,即从原点集中删除{p1}。之后SETc中仅保留p2作为其起点。随后读取后续点p3并重复上述几个步骤至SETp中的点都被读取。
待SETp中所有点读取完毕后若SETc不为空,则需要优化处理。如果其面积远小于阈值则仅保留当前SETc的起点与尾点,否则按上述方法寻找其最优点,并重复该优化处理的过程。
2.3 实验结果
本文对算法的评判主要依据以下几个方面:① 算法复杂度(空间及时间复杂度);② 压缩产生的面积误差;③ 压缩产生的偏移误差。
该算法的时间复杂度是O(k×n),一般情况下k为个位数;空间复杂度为O(n),由于算法中没有递归处理,因此大大降低了内存空间需求。通过大量实验对比,该算法在处理点数小于10 000的情况下运行速度约为Douglas-Pecuker算法的2~6倍,且倍数随着处理数据量增加而增大。
面积误差是压缩前后面积差值的绝对值。压缩前的面积是指原曲线与其外一点Pout组成的面积(如图4中Pout与原点集构成的阴影部分面积),同理,压缩后的面积指曲线压缩后与Pout组成的面积。其中点Pout的位置可以任意选取,并且不会影响面积误差。
距离偏移误差采用点位评估法[7],即通过原始曲线上点与压缩后曲线的相对偏差大小来衡量压缩精度。计算方法为各个压缩点到压缩后曲线的距离平方的和。如图4,若保留点为p0,p2,p6,设点p1到(p0,p2)两点构成的直线的距离的平方为D1,(p3…p5) 各点到由(p2,p6)两点直线的距离的平方和为D2。则总的偏移误差D=D1+D2。
表1中,压缩比表示为压缩后点数除以压缩前点数。表1记录了本文算法与Douglas-Pecuker算法的对比数据,其中A列是本文算法的结果,D列是Douglas-Pecuker算法的结果。运行时间的单位为毫秒(ms);偏移误差与面积误差采用与距离相同的数量级的单位,如果距离用单位米(m)表示则偏移误差与面积误差的单位为平方米(m2)。表格中的结果均取多次实验的平均值。
从实验结果中可以看出,在相同的压缩率下该算法提高了运算速度且距离偏移误差并没有太多的增大,并且面积误差要小于Douglas-Pecuker算法。
3 结 语
本文在分析经典的矢量压缩算法基础之上提出以面积为判据的新算法。此算法在整体思路上与传统方法有着较大的差别,主要基于以下几点:
(1) 由于矢量数据压缩广泛地应用在地理信息领域,该领域对面积的误差一般有严格要求,因此如果在地图数据处理过程中仅以距离作为判定依据将难以控制面积的误差。
(2) 传统方法每一步都需要计算该段内所有的点到线距离,计算量大,而本文利用面积的方法可以在很大程度上减少计算次数。
实验证明,该算法较Douglas-Pecuker算法不仅降低了算法的时空复杂度,也大大降低了面积误差。
摘要:曲线矢量数据压缩本质是信息压缩问题,它在计算机制图中具有十分重要作用。在分析传统矢量数据压缩方法的基础上提出一种基于向量运算的曲线矢量压缩的新方法,该方法与传统数据压缩方法的区别在于以面积为判定标准,利用面积的可叠加性提高算法的精度和效率。实验证明该算法容易实现,数据压缩量大,算法时空复杂度低且能有效地控制矢量图形的面积误差在一定范围内。
关键词:矢量数据压缩,Douglas-Pecuker算法,点抽稀
参考文献
[1]黄培之.具有预测功能的曲线矢量数据压缩方法[J].测绘学报,1995,24(4):316-320.
[2]陈飞翔,李华,于文洋.基于多实体的矢量数据压缩改进算法[J].计算机工程与应用,2008,44(19):200-202.
[3]Chen Feixiang,Qi Jiandong,Zhao Ming.An Improved Algorithm of Vec-tor Data Compression[C]//2009 International Symposium on IntelligentUbiquitous Computing and Education,2009:156-159.
[4]翟战强,管华,王双亭.一种快速空间矢量数据压缩方法[J].计算机工程,2003,29(2):94-95.
[5]张胜,朱才连,钟世明.Douglas-Peucker算法的改进及应用[J].武汉理工大学学报:交通科学与工程版,2005,29(5):671-674.
[6]杨得志,王杰臣,闾国年.矢量数据压缩的Douglas-Pecuker算法的实现与改进[J].测绘通报,2002(7):18-19.
矢量数据 篇5
基于二值栅格数据的边界矢量化和面信息生成的一种实现方法
分别针对简单行列结构和游程编码形式表示的栅格数据,研究了面的矢量化方法.在边界矢量化方面,提出一套确定初始追踪段、确定后续追踪点走向、避免边界线交叉、保持边界线光滑的有效方法;通过计算闭合边界曲线之间的嵌套关系,确定复杂面的`外边界与内边界构成信息.该方法可应用于栅格型地理空间分析和遥感图像专题要素类型的边界提取等方面,具有较高的计算效率且易于实现.
作 者:王结臣 刘杰 钱晨晖 WANG Jie-chen LIU Jie QIAN Chen-hui 作者单位:南京大学,地理信息科学系,南京,210093刊 名:科技通报 ISTIC PKU英文刊名:BULLETIN OF SCIENCE AND TECHNOLOGY年,卷(期):23(6)分类号:P237关键词:栅格数据 矢量化 矢量边界 二值化 地理信息系统
矢量数据 篇6
在二次土地调查数据建库中, 矢量数据建库占到整个数据建库工作量的80%以上, 怎样能够充分利用现代计算机技术实现二次土地调查矢量数据质量的自动化检核?依此来大幅度提高二次土地调查矢量数据的建库效率, 已成为一线工程技术人员在数据加工与建库过程中的关键技术问题。
2 数据质量的概念
数据质量是指数据的可靠性和精度, 在测量学中通常用误差来度量, 在二次土地调查建库过程中, 有许多生产环节, 每个环节均产生一定的误差, 按照误差传播理论, 每项误差的传播直接影响到最终数据的质量。而对于数据质量控制, 很多人认为是一个空洞的概念, 是专家与学者研究的理论, 其实, 随着信息技术的应用普及, 数据质量控制在数据加工与建库过程中无处不在, 一般来说, 由于数据采集过程中某些因素的影响, 因此误差总是存在, 通常有位置误差、属性误差、时域误差、逻辑一致性误差、不完整性误差。二次土地调查数据的数据质量是一个相对的概念, 其基本质量要求是国家对土地利用管理和分析的适用性, 即数据精度能够达到二次土地调查后土地利用、管理和分析应用的需要。
3“数据加工”与“质量控制”的关系
按照作者的理解, 质量控制是理论, 数据加工是过程。质量控制理论指导数据加工过程, 数据加工的成果又必须符合质量控制的理论。没有质量控制理论指导, 数据加工的过程只能是盲人瞎马;没有数据加工的质量控制理论, 也只能是“纸上谈兵”。质量控制不仅仅适用于数据加工, 也适用于数据采集, 在数据采集阶段如果能尽可能的遵循质量控制理论, 就能够大大减少后续数据加工的工作量。
4 二次土地调查数据质量控制原则
4.1 统一标准原则:
数据建库中数据内容、分层、结构、质量要求等要严格按照《第二次全国土地调查技术规程》、《土地利用数据库标准》、《城镇地籍数据库标准》中的规定, 扩充部分要严格按照地方统一规定;
4.2 过程控制原则:
要对数据采集、数据入库等过程中的每一重要环节进行检查控制与记录, 以免环节出错造成误差传递、累加等, 同时要保证建库过程的可逆性;
4.3 持续改进原则:
应遵循持续改进原则, 使其贯穿数据采集、检查、入库等各环节中, 不断优化各环节的数据, 保障数据质量;
4.4 质量评定原则:
及时对数据进行质量评定, 准确地掌握数据的质量状况, 尽早发现建库中存在的问题, 保证二次土地调查数据建库成果的质量。
5 次土地调查数据质量控制措施
5.1 严格遵循国家、省、地方二调办发布
的各类规程、规范、细则规范是进行数据质量控制的基础, 具体包括数据库模式规范和数据内容质量规范两个方面。
5.1.1 数据库模式规范
数据库模式规范主要包括数据分层、各层数据的表示类型、数据层之间的关系、表的结构 (字段列表) 、字段名称、数据类型、数据文件命名与数据格式等方面, 简单地说就是图层结构和表结构。数据库设计方案往往确定了最终的数据库模式, 但数据加工过程中可以根据具体情况采用不同的数据库模式, 入库时再转换到目标数据库模式。不论哪种情况, 都必须对相应的数据库模式做出明确规定, 建库各阶段必须严格按相应的数据库模式存放数据。
数据检查时首先检查数据库模式, 这是一种形式 (格式) 检查。数据库模式不正确, 数据内容是没有太大意义的。
5.1.2 数据内容质量规范
二次土地调查数据主要包括空间数据与属性数据, 这两类数据的质量控制各有不同。依据《第二次全国土地调查数据库建设技术规范》和矢量数据质量控制理论, 二次土地调查数据质量要求主要包括:矢量数据几何精度、矢量数据拓扑关系正确、属性数据的完整性和正确性、接边是否完整等内容。
5.2 调查底图处理、数据采集、数据加工过程质量控制
在二次土地调查数据的采集与建库过程中, 每一个环节都可能影响最终数据的质量, 所以必须在调查地图处理、数据采集、数据加工等每个过程严把质量关。
5.2.1 调查底图选择与处理
调查底图或已有的基础资料, 虽然无法选择, 但可以通过资料预处理, 消除其中错误的、有疑义或缺漏的地方, 从而提高这些图件和表格的质量, 奠定采集数据质量的资料基础。
5.2.2 数据采集的定位处理
地图数据采集与处理是影响数据库质量的关键阶段, 为了提高质量应尽量减少甚至取消不必要的中间环节, 避免中间环节引入数据误差。外业调绘图直接用作建库基础资料, 不经过中间清绘环节, 一方面减少了工作量, 另一方面也避免了引入误差。不论是以何种方式进行地图数字化, 除选用高精度的设备和有效的软件之外, 更重要的是以明确的质量标准来控制作业过程, 数据质量取决于作业员执行这些质量标准的情况。
5.2.3 数据加工的质量核查与自动纠正
数据采集过程中无论要求多么严格, 都不可避免地会存在数据质量问题, 因为有些质量问题是人工很难发现的, 这就需要根据具体情况编制计算机程序进行自动化检查。有些数据质量是无法通过计算机来自动核查的, 只有通过一定方法进行人工检核。
6 二次土地调查数据质量检查方法
数据质量控制是个复杂的过程, 数据检查方法必须采用程序方法和人工方法交互检查才能保证数据成果的最终质量。
6.1 程序检查方法
由于空间数据的图形与属性、图形与图形、属性与属性之间存在有一定的逻辑关系和规律, 通过编制计算机程序, 设计模型和算法, 将数据中不符合规律、逻辑关系矛盾的要素自动挑选出来, 这些自动化检查主要包括:数据文件的完整性检查、属性一致性检查、拓扑关系建立检查、异常属性值检查、不符合逻辑关系的属性值检查等。
采用计算机程序进行数据质量自动检核, 不仅可以大大提高工作效率, 而且可以处理数据中许多人工无法处理的错误。
6.2 人工检查方法
人工检查方法是一种低效率、费时、费力的检查方法, 但有些检查项目无法使用程序来完成, 只能采用人工检查方法。最常用的人工检查方法是对照检查法, 即在屏幕上或使用输出图, 对照原始图件或外业调查表格, 检查数字化的地图图形或者表格的数据项是否与原始数据一致。
7 二次土地调查数据质量检查方法的具体应用
针对国家二次土地调查数据建库过程中数据质量检查需要, 笔者依据前述数据质量控制理论, 结合赣州市章贡区第二次土地调查项目开发了基于Auto CAD平台下二次土地调矢量数据采集与质量控制软件 (GZLandSurvey) , 采用程序方法与人工方法相结合, 对数据库模式和数据内容两个方面进行全面检查, 充分保证了赣州市章贡区二次土地调查GIS数据建库质量, 为章贡区二次土地调查提供了一套实用高效、技术先进的自动化处理方案, 取得了很好的应用效果。
结语
由于二次土地调查技术复杂、难度较大, 涉及到很多新的技术, 二次土地调查中的很多技术问题还需要广大科研人员和一线工程技术人员继续不断探索与创新。
参考文献
[1]国土资源部.第二次全国土地调查技术规程 (TD/T1014-2007) [M].北京:中国标准出版社, 2007.
[2]国土资源部.土地利用数据库标准 (TD/T1016-2007) [M].北京:中国标准出版社, 2007.
三维矢量数据结构在采矿中的应用 篇7
矿山地理信息系统 (Mine Geographic Information System) 所处理的空间数据, 从本质上讲是三维连续分布的, 而且垂直方向上的信息和水平方向上的信息具有同等重要的意义。现有的GIS软件虽然可以用数字高程模型来处理空间实体的高程坐标, 但是由于它们无法建立空间实体的三维拓扑关系, 使得很多真三维操作难以实现, 故被称之为二维GIS或2.5维GIS。矿产资源勘探、采矿作业、地表下沉、地下水运移、地应力分布以及环境污染等均为三维现象, 当试图以二维系统来描述它们时, 就不能精确地反映、分析或显示有关数据。如何建立起适应矿山地理信息系统的三维数据结构已成为矿山地理信息系统研究中迫切需要解决的问题。
在矿山地理信息系统三维建模研究方面, 李青元等做了大量工作, 提出的三维矢量数据结构能够较合理地描述矿山地质实体。但该数据结构基本上只适合于互斥、完整体域所构成的自然目标实体。实际上矿山实体中包含大量的人工构造物 (如巷道、井筒等) ;而且矿山实体中体域之间不完全是互斥关系, 还有包含等关系;另外, 矿山实体中不仅有体域, 还有面、线、点域等实体。如何描述这种复杂的目标实体, 现从矿山实际应用出发, 提出一种适合矿山地理信息系统的三维矢量数据结构。
2 三维GIS矢量数据结构的拓扑关系定义
如何建立、维护空间元素的拓扑关系是三维GIS研究领域中的一个核心问题。拓扑关系的建立使得各种空间的操作与信息查询易于实现。然而三维GIS中的三维拓扑关系建立是一个棘手的问题, 因为所研究目标的结构极其复杂和不规则。从侧重于矿山实际应用的三维GIS研究出发, 复杂地物可用充满空间的各种体域、组成体域的曲面、构成曲面的边界环、组成环的弧、弧上的结点来描述;一般来说, 体域是目标实体的基本构成;认为任何复杂的实体都是由体域 (自然的或人工的) 构成的;体、面、线、点是一个动态的概念, 在不同的比例尺或不同的研究重点时可以相互转换。例如对整个矿井来讲, 巷道可认为是线域, 而对某个工作面来讲, 巷道则是体域。按上述思路和观点, 考虑保持拓扑信息的完整性、易扩展性, 提出用以下6组关系来描述矿山GIS三维矢量结构的空间拓扑关系。
2.1 复杂地物-体关系:复杂地物与组成它的体域。在该拓扑关系中加入对复杂地物属性的描述或指向属性记录文件的指针。
2.2 体-复杂地物-曲面关系:
体域与由其所构成的复杂地物, 体域与包围该体域的曲面, 以及与该体域相邻的体域。体拓扑结构中可加入对体域属性的描述。
2.3 曲面-环-体域关系:
曲面与组成曲面的环以及该曲面所包围的体域 (正面邻体) 和包围该曲面的外部体域 (负面邻体) 。一个曲面可能由若干个环构成, 其外环取正, 内环取负值。在曲面拓扑结构中加上若干值样条弧 (如等高弧) 或插值函数, 就可确定该曲面的空间形态。
2.4 环-弧-曲面关系:
环与构成该环的弧以及该环所包围的内部曲面 (内邻曲面) 和包围该环的外部曲面 (外邻曲面) 。
2.5 弧-结点-环的关系:
弧与该弧的起结点、终点及包含该弧的环。环有正负之分, 环方向与弧的方向一致时, 取正号;反之取负。在弧拓扑结构中加一系列坐标串, 可确定该弧的形态。
2.6 结点-弧的关系:
结点及从该结点出发的离开弧段和以该结点为终点的到达弧段。
显然以上6组拓扑关系可转化成二维GIS的拓扑关系。现结合一具体实例说明用以上6组拓扑结构如何进行拓扑描述。
3 三维GIS矢量数据结构拓扑关系的建立
典型的矿山现象。其物理意义如下:煤层上覆岩层为页岩 (V1) , 中间为煤层 (V2) , 煤层底板为砂岩 (V3) 。在煤层中赋存着一层很薄的夹矸 (V5) 。在底板砂岩中开拓了一条运输集中巷 (V4) 。另外, 还探测到在煤层某处有一瓦斯集聚点 (V6) 。
对于这样不太复杂的模型, 按层次分解方法来建立上节所定义的6组拓扑算法。复杂地物分解成若干组体域, 将这些体域分别分解成各自组成的曲面, 再将曲面分解成环, 进而将环分解为弧段和结点。
经过对复杂地物进行的层次树分析, 即可按定义的6组矢量拓扑关系来建立的拓扑描述。其中煤层中夹矸层视为特殊的体域, 仅有面积而无体积概念。对V6瓦斯积聚点视为无体积、无面积概念的特殊体 (点) 域。
如需要详细描述复杂地物的属性, 则用属性记录文件的方式加以记录, 用指针来穿引。曲面以指向所包围的体域方向为正, 远离所包围的体域为负 (右手法则) 。
通过值样条弧 (或插值函数) 可以刻划出曲面空间形态。本例中巷道设为理想巷道 (巷道的断面形状-梯形、拱形或圆形, 可通过弧-结点-环拓扑加以区分和描述) , 故曲面QVUT等不需值样条弧。实际上随着巷道掘进和煤层开采, 巷道不可避免地发生空间形态的变化。这种复杂巷道可通过值样条弧来刻划其空间形态。具体说, 在巷道形态发生较大变化的地段取值样条弧加以描述。通过一系列值样条弧 (这些值样条弧可进一步用结点-弧拓扑加以描述) , 则可刻划出巷道的空间形态的变化;如巷道的空间形态变化具有某种规律, 则可用插值函数近似描述;或值样条弧和插值函数配合使用。
若弧为直线段, 则仅需记录起点与终点坐标即可。若弧为曲线段, 则应记录一系列的中间坐标, 用以刻划曲线段的形态。中间坐标的记录个数则视曲线段的弯曲程度和要求精度的高低而定。
结语
文章从矿业应用实际出发, 提出了采用:复杂地物-体, 体-复杂地物-曲面, 曲面-环-体, 环-弧-曲面, 弧-结点-环, 结点-弧这六组拓扑关系来刻划目标实体, 并以层次树关系图作指导, 就一典型矿山现象生成其拓扑关系。该矢量数据结构描述的中心是体域, 而把面域、线域、点域看作特殊的体域, 并按体域形式存贮。当研究中心变化时, 如原来的线域或点域被视为体域时, 这种数据结构则为以后的数据扩展奠定了基础。初步实验表明, 用六组拓扑关系来描述, 易于生成拓扑关系, 方便检索。
矿山作业实际上是三维而且是动态过程。假设巷道正在底板掘进, GIS将如何描述?随着工作面推进, 矿山压力重新分布, 瓦斯积聚点的形态和位置将发生改变。这种现象三维矢量数据结构如何组织和描述?因此有必要在三维矢量数据结构的基础上, 继续进行时空四维数据结构的研究
参考文献
[1]鲍艳.矿山信息系统中巷道的三维矢量数据结构与可视化.西安科技大学, 2002-12-25硕士.
矢量数据 篇8
1 矢量数据格式及加密
1.1 矢量数据
森林资源空间数据包括栅格数据和矢量数据, 矢量数据结构是通过记录坐标的方式尽可能精确地表示点、线和多边形等地理实体, 坐标空间设为连续, 允许任意位置、长度和面积的精确定义。由于矢量数据具有数据结构紧凑, 冗余度低, 表达精度高, 图形显示质量好, 有利于网络和检索分析等优点。在G I S中得到广泛的应用, 特别在小区域 (大比例尺) 制图中充分利用了它的精度高的优点。
1.2 加密
数据加密技术是保证网络信息安全最常用和最重要的一种技术。数据加密就是对信息进行重新编码将敏感信息转换成不能识别的乱码, 从而达到隐藏信息内容, 使非法用户无法获得信息真实内容的一种技术手段, 从而达到可以保证传输信息的机密性、完整性和确定性, 防止信息被篡改、伪造和假冒。在传统加密技术中, 基于密钥的加密算法不同可以分为两类:对称加密技术 (常规密钥加密) 和非对称加密技术 (公开密钥加密) 。最有名的对称加密技术是数据加密标准 (D E S) 算法和数据加密标准 (A E S) 算法, 非对称加密技术的加密算法主要有R S A算法。
按照加密时对明文的处理方式, 对称密码算法又可分为分组密码算法和序列密码算法。分组密码算法是把密文分成等长的组分别加密, 序列密码算法, 也称流密码算法, 是一个比特一个比特地处理, 即将明文逐位转换变成密文。
2 混沌及混沌系列
混沌现象是非线性系统的一种内在类随机过程的表现, 只要初始条件稍有不同, 其结果就大相径庭, 难以预测, 而且在有些情况下, 反映这类现象的数学模型又是十分简单, 甚至一维非线性迭代函数就能显示出这种混沌特性。除此以外, 混沌系统产生的混沌信号还具有类似噪声、结构复杂、难以分析等特性。
近年来, 混沌理论在信息安全领域的应用研究已经越来越受到人们的关注。混沌序列的非周期性, 连续宽带频谱、类似噪声等特性, 使它具有天然的隐蔽性。另外, 混沌序列对初始条件的高度敏感性使其具有长期不可预测性, 人们认为利用混沌可能更有助于设计有效快速的加密算法。
混沌序列密码即混沌流密码, 使用混沌系统生成伪随机密钥流, 并将其直接用于掩盖明文。其中混沌伪随机数发生器的设计是这类混沌密码算法的核心问题。混沌的一些基本特性可以大大简化密钥序列的生成, 其非线性特性也可以提高生成密钥序列的复杂度, 混沌系统具有良好的伪随机特性、轨道的不可预测性、对初始状态及结构参数的极端敏感性等一系列特性, 这些特性与密码学的很多要求是吻合的。混沌系统产生的序列从严格意义上来讲属于流密码, 但它与传统的流密码又有区别, 而且它有可能是一类具有相当广泛应用前景的加密方式。
3 基于混沌系列的矢量图混沌加密算法
3.1 算法思想
本文采用一维logistic映射, 首先, 通过数据变换处理, 将用户输入的密码系列映射为 (0, 1) 间的某个实数x0, 用x0作为logist i c混沌映射的初值, 通过迭代产生混沌系列, 将该混沌序列与待加密的原始数据进行异或运算, 生成一密文序列在信道中传输, 如图1所示。
3.2 Logistic映射及混沌系列密码的生产
Logistic映射是由美国数学生态学家May.R于1976年提出来的, 它是一个十分简单又具有重要意义的非线性迭代方程, 是最典型的, 也是研究的最广泛的动力系统, 定义如下。
其中, 0≤μ≤4称为Logistic参数, x k∈ (0, 1) 。当3.5 6 9 9 4 5…<μ≤4时, Logistic映射工作于混沌态。也就是说, 由初始条件x0在Logistic映射的作用下所产生的序列{Xk;k=0, 1, 2, 3…}在理论上是非周期、不收敛, 对初始值极其敏感, 并且具有白噪声统计特性及雪崩效应等特性。因此, 适合构造有效的混沌序列密码应用。
3.3 密钥x0的生成
如果直接让用户输入一实数x0作为密码, 是不太方便和友好的, 本文中, 我们首先计算出用户输入的字符串的Hash值, 再通过对Hash值的ASCII码值扩散映射射为 (0, 1) 间的某个实数x0, 用x0作为混沌映射的初值, 即密钥。
3.4 混沌序列密码的生成
以密钥x0为初值, 对 (1) 式进行反复迭代, 生成足够长度的随机数值序列{xk, k=0, 1, 2, 3, ……}, 由于Logistic映射实数的分布是很不均匀的, 而且相邻点有非常强的相关性, 所以直接把实数值序列用于作密钥流的话, 密钥强度肯定不高, 势必影响加密效果。由于Logistic映射迭代序列关于x=0.4的分布是基本对称的, 则可以采用每次根据迭代值是否大于等于或小于0.4域值来输出0或1比特的方法来产生伪随机数序列, 公式如下:
为了增强随机性, 舍弃开始部分长度为n的序列, 即从序列的第n+1位开始作为密钥流, 进行信息的加密。
3.5 加密的实现
将矢量数据转换成二进制文件格式, 依次取出文件各字节流 (pk, k=1, 2, 3, ……) 与密钥系列 (pn, n=1, 2, 3, ……) 进行“异或”操作, 生成乱码形式的密文流 (ck, k=1, 2, 3, ……) 。
在解密断, 采用与加密相反的操作, 即用密文流与密钥系列进行“异或”操作, 得到明文流。
4 结语
随着计算机的普及及林业信息化的发展, 林业信息系统中的空间数据尤其显得重要, 矢量数据作为空间数据中的一种重要的数据形式, 通常用于栅格图像处理及加密的许多方法将不适于矢量地图, 本文采用了矢量数据的混沌序列加密算法。该算法支持不同形式的密钥输入, 提高了密钥强度, 也增加了软件友好性。其安全性依赖于破解混沌序列的难易程度, 由于混沌序列具有不可预测性、初始值高度敏感性等一系列特性, 使得不知道加密密钥的攻击者几乎不可能进行有效的破解, 而知道加密密钥的合法用户则可以很方便地对数据进行解密, 是一种很好的矢量数据的加密算法。
参考文献
[1]邬伦, 等.地理信息系统-原理方法和应用[M].北京:科学出版社, 2002.
[2]关新平, 范正平, 等.混沌控制及其在保密通信中的应用[M].北京:国防工业出版社, 2002.
[3]许克兵.混合混沌序列与混沌图像加密技术研究[D].西南交通大学, 2007.
[4]王化丰, 张桂香, 邵勇.基于Logistic映射的混沌流密码设计[J].计算机工程, 2007, 5.
[5]钟尚平, 高庆狮.网络环境下地图的混沌加密实用算法[J].计算机辅助设计与图形学学报, 2004, 16.
矢量数据 篇9
城市基础地理信息数据库主要应包括以下7个数据库:控制测量成果库 (CSP) ;数字线划矢量数据库 (DLG) ;数字正射影像数据库 (DOM) ;数字高程模型数据库 (DEM) ;数字栅格图数据库 (DRG) ;地名数据库 (PN) ;元数据库 (MD) 。基础地理信息数据库还可包括管线、规划、地质等相关数据。
数字线划地图数据库主要包括道路、境界、水系、土地利用等基本矢量数据, 建立以影像为基底、矢量数据进行分析的城市基础地理信息数据库, 可以直观、方便的完成城市空间信息的查询、分析及各种应用服务。在基本要素中加入各种专业属性信息, 使空间信息与属性信息有机的融合, 实现了空间与非空间信息的统一。对于需求基本要素之外要素的用户, 可以调用航摄影像库及控制成果库中的航摄影像及定向参数, 快速恢复立体模型, 实现其它要素的便捷提取, 满足不同用户对空间信息的需求。
正射影像具有精度高、信息丰富、真实直观、获取快捷等优点, 利用正射影像可以便捷提取城市所需要的各类空间地理信息、自然资源信息及其它派生信息;可以为城市的空间基础设施建设及社会公众提供空间信息等服务。把正射影像与数字高程模型数据进行叠加, 可以真实再现城市自然景观, 并为城市规划、建设等部门提供信息丰富的空间地理数据。
地名作为最直观、高度概括的信息, 是自然和经济信息的特殊载体, 是人们生活、交往不可缺少的工具, 可为语言学、地理学、历史学、民族学等学科的研究提供宝贵资料。地名数据库是一个空间定位型的关系数据库, 它存储和管理各类地名信息, 包括行政区划、居民地、河流、湖泊、风景名胜、自然保护区的名称、行政归属、沿革和历史、类别和级别、审定日期和坐标等。它是联系社会、经济信息和空间信息的纽带, 是空间数据基础设施建设的重要组成部分。
2 矢量数据库的逻辑层次
矢量地形图数据作为数字线划图的主要组成部分, 用以表示城市的基本面貌并作为各种专题数据统一的空间定位载体, 包括测量控制点和城市地形、交通、水系、境界、居民地、植被等核心地理要素。矢量数据库的逻辑关系可以设计如下。
2.1 矢量地形图数据子库
矢量地形图数据子库的划分可以依据城市在建立城市基础地理信息系统时使用的矢量地形图数据的比例尺来进行, 如有的城市有1∶500、1∶2000和1∶10000的矢量数据, 就可划分为3个子库, 分别为1∶500地形图子库、1∶2000地形图子库、1∶10000地形图子库;而有的城市可能只有1∶500和1∶10000的矢量数据, 那其地形图子库就有1∶500地形图子库和1∶10000地形图子库两种了。
2.2 矢量地形图数据大类
根据通常应用的需要, 将基础数据库中的矢量数据按地形实体的大类进行逻辑分组, 每一个逻辑组就是一个矢量地形图数据大类。矢量数据按照国标可以分为控制点、居民地、交通、水系等几个大类。一个大类中的空间实体数据在逻辑上被看作属于同一范围, 其代码的第一位都相同, 往往被同时应用。
2.3 矢量数据图层
一个矢量地形图数据大类通常包含多个空间实体类型, 可以再根据实体的类型 (点、线、面) 和实体在数据中的意义 (辅助信息、主要信息) 划分出具体的逻辑层, 一个逻辑层还可以含有一个注记层。
2.4 矢量数据实体
矢量数据实体作为单个图层中的独立单元, 包含图形数据 (几何属性) 和非图形数据 (非几何属性) 。图形数据一般指实体的地理位置和形状, 非图形数据包括标量属性 (如高程、面积、长度的数据及实体的编码数据等) 和名称属性 (如道路名称、河流名称等) 。地理实体按几何形状分为点、线、面三种基本类型, 这种分类法对于地理实体的特征描述和编码表示很合适。例如点类有控制点、独立地物点等, 线类有道路、地类分界线、管线等, 而面类有行政区域、建筑物、绿化带等。
3 面向更新的矢量时空数据库设计
地理信息系统中, 时间、空间和属性是信息的三种基本成分, 随着地理信息系统应用领域的不断扩大, 对数据的处理提出了更高的要求, 要能够保存并有效地管理历史变化数据, 以方便将来重建历史状态、跟踪变化、预测未来I’91, 这样的地理信息系统应支持信息的时态性, 对时空数据进行统一的模拟和管理, 称为时态地理信息系统 (TGIS) 。基础地理信息系统信息量大, 需要定期对数据进行更新并保存历史数据, 是一种典型的时态地理信息系统。
时空数据按照其生存的时间来分可分为现状数据和历史数据。现状数据是指其生命周期至今还没有终止的目标所产生的信息, 历史数据是指其生命周期到目前已终止的目标所产生的信息。根据常理, 人们关心的一般是现在的情况, 只有当考察区域历史变化或其它特定目的时才对历史数据感兴趣, 应该说将它们分开存储管理比较方便, 数据查询效率较高。
因此, 在基础地理数据库中创建2个表达不同时态的数据库:现状数据库 (现在时态) 和历史数据库 (过去时态) 。
与地籍、地名属性信息很多, 可追溯性很强的信息不同, 矢量地形图着重表示一个区域指定时间的地形面貌。所以在存储地形图时空信息时, 图形信息不可丢失, 至于某个地形图要素是如何变化而来的并不重要。因此本文的研究中, 地形图上某个要素只要其图形信息或属性信息或图形属性之一发生了变化, 就视为该要素的生命周期终止, 改变后的新要素生命周期开始。
现状数据库中保存对象的最新数据, 即现势数据。现状数据库中的对象作为基态, 处于最频繁操作的状态。现状数据库是操作对象的现在时态的空间和属性信息, 数据库中的每个元组都处于“激活”状态, 是数据库当前操作对象。历史数据库保存对象的历史数据。一个对象当由一事件引起变化后, 其最新的状态被存入现状数据库中。当变化的所有条件成立时, 事件将会按时间顺序排列, 将相对基态的修正值存入历史数据库中。此外, 历史数据库还需要存储数据更新的时间、更新的范围和位置、数据存放的位置等信息。历史数据库和现状数据库的划分有利于历史数据的回溯。随着时间的推移, 现状要素不断产生进入现状数据库, 旧的要素不断被更新成为历史要素而进入历史数据库。为了实现对现状数据库的更新与历史数据的回溯, 需要设立临时数据库用来存储用户操作过程中产生的临时数据。用户在对数据库进行某项操作过程中, 某些突发事件可能会造成原始数据的破坏, 如果直接对现状数据库进行操作, 可能会造成不可估量的损失。通过设立临时数据库, 将用户操作中所需数据先转移到临时数据库, 处理过程中所产生的数据也保存在临时数据库, 处理结束后通过检核的数据可以进入现状数据库, 这样可以最低限度地减少对原始数据的破坏。
为了保证数据的准确性与完整性, 不允许直接操作现状数据库, 而将待更新数据复制一份提取到临时数据库, 在临时数据库中进行更新, 当更新符合要求时再确认更新现状数据库。
历史数据回溯时也需要首先将现状数据和历史数据分别从现状数据库和历史数据库中提取出来, 在临时数据库中进行历史的再现。三库之间的功能关系如图1所示。
历史数据库与现状数据库的逻辑结构相同, 矢量数据在其中也是分层存储的, 这样的存储方式便于历史数据的存储和管理, 以及历史数据的回溯。临时数据库只保存数据更新和历史回溯过程中产生的临时数据, 因此不需要有固定的逻辑结构。基础地理信息系统中的时空数据库逻辑设计如图2所示。
摘要:本文基于笔者多年从事地理信息系统的相关工作经验, 以城市基础矢量数据库设计为研究对象, 研究分析了城市时空矢量数据库的设计思路, 全文是笔者长期工作实践基础上的理论升华, 相信对从事相关工作的同行有着重要的参考价值和借鉴意义。
关键词:更新,矢量,数据库,设计
参考文献
[1]东凯, 方裕.空间数据库模型概念与结构研究[J].地理信息世界, 2004 (2) .
矢量数据 篇10
传感器网络一般部署在比较复杂的地形环境中, 并且节点采用干电池进行供电, 这导致节点能源的不可替代性。因此, 如何有效节能是维持无线传感器网络生存周期的核心问题之一。在WSN中通信消耗了网络的绝大部分能量, 因此采用数据压缩能有效降低网络流量从而达到节能效果。而环境监测中所采集的数据 (如温度) 具有很大的冗余性, 这为数据的有效压缩提供了可行性。
传感器节点采集的数据一般包括时间、温度、湿度等感知信息, 针对数据的时间相关性可以把时间表示在二维空间的X轴, 采集的感知信息表示在Y轴。因此, 任何一个采集的数据都可以看成二维平面上的一个点坐标, 这样可以将采集的数据看成一组时间序列, 那么对原数据的压缩问题可以转换为对时间序列压缩处理的问题。本文的主要贡献在于:利用面积矢量叠加原理提出一种新的基于面积矢量的有损压缩算法, 推导面积阈值的计算公式。
常用的时间序列维度约减方法包括离散傅里叶变换 (DFT) 、离散小波变换 (DWT) 、逐段线性描述 (PLR) 等[1]。其中PLR复杂度低、计算速度快、压缩率高, 更适合于WSN中的数据压缩。目前关于PLR算法思想主要包括以下几个方面:将距离作为约束条件, 如文献[2-4];将面积作为约束条件, 如文献[1, 5];通过函数进行线性拟合, 如文献[6-8];采用夹角或斜率作为约束条件, 如文献[9, 10]。本文提出的算法采用将面积作为约束条件, 但本文的新奇之处是采用失量叉乘的方法获取三角形面积矢量。
PLR算法要运用到WSN中必须满足时空复杂度非常低的要求。Douglas–Pecuker算法[11]是一种自顶向下的PLR算法, 虽然该算法从全局选取最优点, 但其复杂度较高, 无法满足无线传感器网络节能要求。SDT算法[12]是Bristol提出的一种具有代表性的在线PLR压缩算法, 其算法简单、计算能耗低、执行速度快。ISDT算法[13]是对SDT算法的改进, 改进后算法压缩率有了很大提高。文献[7]提出一种ULDA压缩算法运用于WSN中, 该算法是用一种近似函数来表示数据近似的方法。文献[14]提出了一直简单快速的在线PLR方法, 该算法对变化较慢的数据具有较高的压缩率而且压缩速度非常快。实验表明, 在最大允许误差相同的条件下, 本文提出的算法与文献[14]中的算法在时间复杂度相当的情况下能够取得更高的点压缩率。
1 基于面积矢量的有损压缩算法
1.1 感知数据在二维坐标系中表示
传感器节点采集数据是每隔单位时间进行采集的, 并且可知采集到的每个感知数据都和一个唯一的时间相对应, 因此我们可以将这些感知数据看作为一组时间序列。
定义1时间序列设时间序列L=< (t0, P0) , (t1, P1) , …, (tn, Pn) >, 其中Pn是在时间tn上的观测值。
这样我们可以将时间序列L表示在一个二维坐标系中, 其中X轴表示时间, Y轴表示感知数据值。为了使坐标系更为简单, 我们设置第一个数据为坐标原点, 后续感知数据用与原点的相对差值表示。图1里列举了一个传感器节点单位时间间隔依次采集到的七个温度数据p0-p6在二维坐标系中的表示, 其坐标依次为< (0, 0) , (T, 40) , (2T, 65) , (3T, 100) , (4T, 80) , (5T, 85) , (6T, 50) >。这里的T为采样周期, 一般可默认T取值为1。
1.2 算法流程图
该算法流程图如图2所示, K代表数据点下标, PS代表每一轮压缩开始的初始起点, Sent代表传感器节点对原数据进行数据压缩后所需发送的感知数据集, 初始只有P0一个元素。其中SΔPSPKPK+1代表按下标递增的三个数据点构成的三角形面积矢量[15], 计算公式如下:
Sp[S, S+1, …, K+1]表示初始点PS与处于PS和PK+1间按下标递增的任意两相邻数据点构成的三角形面积矢量和, 公式如下:
当K=S+1时定义初始值Sp[S, S+1]=0。
当三角形面积矢量和的绝对值超过阈值Areathreshold则本轮数据压缩结束, 将PK加入到发送集合Sent中, 并设置其为下一轮数据压缩的初始起点。
采用三角形面积矢量可以解决计算面积和时产生的重覆叠加问题.并且可知如果数据点分布越接近于直线, 那么求得的Sp[S, S+1, …, K]绝对值越小;如果数据点分布近似曲线, 那么求得的Sp[S, S+1, …, K]绝对值越大。目的节点收到数据后进行解码, 解码算法是以每相邻的两个数据作为起点和终点确定的直线数据插值来取代原始数据。
例如, 采用AVA算法对图1中的数据进行压缩, 压缩过程如下:首先, 设置算法面积阈值Areathreshold=40。算法开始先读入起点P0, 设置其为本轮压缩的初始点, 并放入到发送集合Sent中, 则有PS=P0, Sent={P0}, 然后读取下一个数据P1并判断该数据是否为最后一个数据, 如果不是, 则计算SP[0, 1]=0, 小于面积阈值。继续读取后续点P2, 计算SP[0, 1, 2]=-7.5, 其绝对值仍小于阈值。继续读取后续点P3, 计算SP[0, 1, 2, 3]=-5, 其绝对值小于阈值。继续读取P4, 计算SP[0, 1, 2, 3, 4]=-85, 其绝对值大于面积阈值40, 因此按照算法流程本轮压缩结束, 并回退一步读入操作, 将数据点P3加入到发送集合Sent中, 并设置P3为新的初始起点, 即PS=P3。下一轮开始读入P4, 按照以上方式继续进行。最终可得到发送集合Sent={P0, P3, P6}。
2 AVA算法面积阈值取值公式推导
在以往的一些压缩算法中, 阈值的取值依赖于经验或实验尝试, 这可能会导致阈值和实际数据特性的失配或者压缩误差过大, 从而影响压缩效果[13]。为此, 本文推导出面积阈值的计算公式, 从而选取合适的面积阈值。推导过程如下:
为了保证结果具有普遍性, 这里任意选取压缩后发送数据Sent中的两相邻数据点PM和PN (M
图中PM和PN的位置是任意选取的, 并且假设PK点在直线PMPN的上方 (如果PK在直线PMPN的下方, 可以用以下类似方法证得同样结果, 故不做另外阐述) 。分析如下:
当N=M+1时, 表示数据点PM和PN间没有数据点被压缩, 则可以忽略这种情况。
当N>M+1时, 我们可以找到第一个原数据点Pt在直线MN的下方或刚好落在直线上, 这里下标t是从K+1开始递增。参照文献[15]可知数据点集{PM, PK, PK+1, …, Pt}首尾相连时可以构成一个多边形。那么, 三角形ΔPMPKP'K+1为该多边形面积的一部分。从而, 可以得到如下不等式关系。
另外, 由两直角三角形ΔPKHP'K∽ΔGP″KP'K, 有:
即:
当K=M+1时, 显然可知:
故, 由式 (3) -式 (5) 可得以下不等式成立:
即:
当K>M+1时, 根据算法流程有:
由式 (7) 、式 (8) 和式 (9) 可推出:
故, 由式 (3) , 式 (4) , 式 (10) 可得以下不等式成立:
即:
综上所述, 所有估计值P'K的估计误差dK可用以下不等式表示:
4Area由式 (12) 可知, 当K>M+1时的值随K的增 (K+1-M) T加而递减。所以可知, 当K=M+2时, dK可能取到最大值, 那么设定即 (通常取3T3Tthreshold=E4T=1) , 这样就可以保证所有压缩点的估计误差均在误差允许范围内。
3 实验结果
本文实验对象是通过单个Telos B传感器节点每隔单位时间采集的若干温度数据如图4所示, 其中纵坐标是用十进制表示的温度数据值。实验结果是在同一台计算机上模拟本文AVA算法和文献[14]中Line算法进行对比得出的结论。
本文通过比较两种算法的点压缩率来比较算法压缩性能, 这里定义:
在相同的最大允许误差下, 本文AVA算法和Line算法压缩率对比结果如图5所示。从图中可以看出AVA算法比Line算法具有明显优势, AVA压缩速度更快, 点压缩率更高, 可以更大限度地减少数据冗余, 从而达到节省能量的目的, 延长网络寿命。
同时, 表1列出了AVA算法和Line算法的时空复杂度。从表中可以看出两种算法的时空复杂度均在同一数量级, 并且两者时空复杂度都非常低, 均适合于无线传感器网络的低时空复杂度的要求。
结合图5和表1, 我们可以得出结论, 在同等级的时空复杂度条件下, 在无线传感器网络中运用本文AVA算法比Line算法更具优势。另外, AVA算法不仅能压缩变化较慢的感知数据, 而且还能压缩变化幅度较大的感知数据。
4 结语