矢量数据融合

2024-09-14|版权声明|我要投稿

矢量数据融合(精选8篇)

矢量数据融合 篇1

1 引言

在林地年度变更工作中, 由于西藏2012年二类调查矢量数据和2009林地保护利用规划矢量数据在时效性、空间位置、属性数据等方面均存在较大差异, 需将二者融合形成林地年度变更本底数据库以减少外业现地的核实工作量。

随着二者的叠加分析后需消除小多边形。目前常见的GIS软件中普遍使用的处理方法是按相邻最长边界线合并到临近多边形中去, 或按照相邻最大面积合并到临近小班中, 然而这些方法都是针对由几何位置的不确定性引起的小多边形而提出, 没有考虑属性数据的差异, 具有一定的随机性。

笔者在此引入了基于模糊集的小多边形处理方法, 综合考虑矢量数据几何位置融合和属性数据融合。

2 实验数据

本次研究采用巴宜区 (原林芝县) 2012年二类调查矢量数据和2009林地保护利用规划矢量数据作为研究数据。

其中2012年二类调查矢量数据更新至2012年年底, 采用高斯克吕格投影, 西安80坐标系, 信息量大, 调查大部分为实地调查, 数据可靠。

2009年林地保护利用规划矢量数据更新至2009年年底, 是在2002年二类调查的基础上补充区划加实地验证而得, 采用高斯克吕格投影, 西安80坐标系, 该数据的属性数据更加符合林地年度变更要求。

两种数据坐标系一致, 不存在空间基准的融合[1~3]。

3 研究原理

3.1 矢量边界适宜性判别

假设矢量数据有x种属性, 对于每个矢量面, 其属性值则可能与这x个属性值有关。取各属性值与矢量面相吻合的程度为其隶属度, 表达式为[4~6]:

其中rik表示第k种属性与第i个面要素属性符合的程度;i表示第i个矢量面;j表示矢量面的第j个特征;Ikj为第k种属性类型的第j个特征准则值;ωj则为第j个属性特征的权重。

如果矢量数据是通过n种矢量数据叠置所得, 那么叠置后的矢量面属性与n种类型的属性有关, 由式 (1) 可得

由于n=2, 从而得到叠置图上地理边界适宜性判决函数为:

其中Δrij表示两相邻矢量面属性模糊集对应元素的差值。架设各叠置层上各属性值的权重系数相同, 令各叠置层的权为ω1, ω2, ……, ωn, 其中, λ′ 为参数, 应该适当选取, 使得0≤u≤1;则有:

为了简化计算, 令所有属性值权重系数都相同, 则式 (4) 可以转化为:

参照相关文献参数λ′ 的确定方法[7,8], 可以得到:

因此, 式 (5) 可以转化为:

3.2 属性不确定性的度量

将小多边形进行合并时, 必然引起属性数据的变化, 即小多边形合并之后模糊属性值调整为面域模糊属性值时, 与原模糊属性值的差异。使小多边形在合并前后属性值变化最小的是最理想状态。分析 (3) 式和 (4) 式可知, 此时u取最小值。因此, 进行小多边形合并的时候, 应选其边界中u值最小的边界作为消除边界, 从而达到小多边形在合并前后属性值变化最小的目的。

3.3 小多边形的处理

图1为2012年二类调查矢量数据和2009林地保护利用规划矢量数据叠加分析后产生了小多边形C, 其中A、B、D、E为其相邻的多边形, 关键问题为C与哪个多边形合并最合理。对于C的四条边界ab、bc、cd、ad选其边界中适宜性最小的作为消除边界, 与邻边边界合并。

由于二调数据与林地保护规划利用规划矢量属性数据较多, 如果对每种属性都定义其与矢量面的隶属度工作量巨大, 而且实际意义不大。为了简化计算, 结合叠置后矢量面的实际情况, 以及两种矢量数据的特征, 作如下处理。

从两种不同矢量数据中选取有代表性的属性字段。选取相关属性字段为林地保护林用规划数据的“地类”、“面积”、“林地保护等级”;二类调查数据的 “地类1”, “图形面积”、“小班蓄积”。选取“地类”是因为它们是区划小班的主要属性, 选取“面积”和“蓄积”是为了跟踪小多边形 (进行相交后, 被切碎的细小多边形保留了原始数据的字段和属性) 。

对于每条边界对应的两个不同矢量面的属性模糊集, 定义模糊集相对应元素的差值。若边界对应两矢量面属性一致, 则认为Δrij=0, 若边界对应两矢量面属性不一致, 则认为Δrij=1;涉及到行政界线, 不可合并, 认为Δrij=1。以边界ab为例, 矢量面A和C对应的属性如表1。

由式 (7) , 可知:

同样的方法计算bc、cd、ac的边界适适宜性判别值为0.25, 0.75, 1。其中边界bc适宜性判别值最小, 所以应该消除边界bc, 将矢量面B和C进行合并, 并取B的属性为合并后多边形的属性。

4 批量处理方法

实际操作中, 如果对每个多边形进行不同边界的适宜性判别, 工作量巨大, 可行性不高。下面结合实际, 介绍一种批量处理的方法, 对关键步骤作如下解释。

4.1 转换为coverage格式

Coverage是ArcInfo workstation的原生数据格式。它将空间信息、属性信息分别存放在两个文件夹。cov-erage可以存储拓扑要素类, 支持高级要素类对象:比如多点和多线等。通过小多边形由“shapefile”格式转换成为“coverage”将相邻面的属性赋到公共边界上提供了条件。

4.2 去伪节点

由面转成线后, 在很多线与线交叉的地方存在伪节点, 使得原来一条边界变成了两条, 在国产软件geo-way3.6中可以批量处理该类伪节点。

4.3 计算value值

Value值即为前文提及的边界适宜性判别值。

具体操作流程详见图2。

5 结果与分析

处理完小多边形后重新计算面积, 分地类统计面积变化, 同时按照传统方法“最大边长合并”与“最大面积合并”2种方法进行小多边形的自动处理, 分地类统计不同方法的两种矢量数据面积的变化, 以各树种与原始数据的差平方和为方差, 反映处理前后, 数据的波动。为突出处理前后, 以及不同方法的效果, 面积统一采用“公顷”, 保留两位小数。

从表2和表3可以看出, 无论是二类调查数据, 还是林地保护利用规划数据, 用基于模糊集的方法进行合并, 方差都远远小于最大面积合并和最大边长合并的方差。从表中可以看出, “基于模糊集的方法”优于“最大边长合并”, 效果最差的是“最大面积合并”的方法。

6 结语

从数据分析可以得出, 基于模糊集的小多边形处理方法明显优于传统的最大边长合并、最大面积合并两种方法。基于模糊集的小多边形处理方法在精度损失方面是最小的。但同时也会相应增加数据处理工作量, 根据实验结果, 处理一个县的数据大概要增加工作量一个工日。

随着林地年度变更的全面铺开, 西藏自治区2016年度将有65个县 (区) 需要进行林地年度变更工作, 基于模糊集的小多边形处理方法能明显提高融合数据精度, 减少外业工作量, 能够较好的适合林地年度变更的需求, 提高林地年度变更工作效率。

摘要:以巴宜区为例, 在融合2012二类调查矢量数据和2009林地保护利用规划矢量数据时引入基于模糊集的小多边形处理方法, 对原理和可行性操作步骤进行了阐述。探讨了叠加分析后不同处理方法对处理结果精度的影响, 阐述了基于模糊集的小多边形处理方法在西藏自治区、乃至全国林地年度变更中的应用前景。

关键词:矢量数据融合,模糊集,小多边形处理,林地年度变更

参考文献

[1]郭黎.空间矢量数据融合问题的研究[D].郑州:解放军信息工程大学, 2003.

[2]郭黎, 崔铁军, 王玉海, 等.多源空间数据融合技术探讨[J].地理信息世界, 2007, 5 (1) :62~66.

[3]崔铁军, 郭黎.多源地理空间矢量数据集成与融合方法探讨[J].测绘科学技术学报, 2007, 24 (1) :1~4.

[4]杨伦标, 高英仪.模糊数学原理及应用[M].广州:华南理工大学出版社, 1993.

[5]毛定山.基于计算几何的矢量数据叠加分析分析算法研究[D].青岛:山东科技大学, 2007.

[6]唐文静.海陆地理空间矢量数据融合技术研究[D].哈尔滨:哈尔滨工程大学, 2009.

[7]Sholokhov A.V, Liventsev V.A.Evaluation of the reliability of determining coordlinates in navigation systems correeted for digital road Maps[J].Measurement Techniques.2007, 50 (5) :509~515.

[8]Herve Bronimann, Timothy M.Chan.Space-efficient algoritbms for computing the convex hull of simple Polygonal line in linear time[J].Computational Geometry:Theoryand Applications, 2006, 34 (2) :101~105.

矢量数据融合 篇2

根据灰度图像信息量大、可视化效果好等特点,提出一种基于灰度图像水印的.空间域矢量地理空间数据水印算法,即先将灰度图像水印信息按一定法则进行处理,再将处理后的水印信息嵌入到空间域矢量地理空间数据中,最后对嵌入水印信息的矢量地理空间数据进行检测.文中还对矢量地理空间数据进行了攻击实验,分析表明,提取出的灰度图像水印具有较好的鲁棒性效果和一定的实用价值.

作 者:郭思远 朱长青 GUO Si-yuan ZHU Chang-qing 作者单位:郭思远,GUO Si-yuan(信息工程大学,测绘学院,河南,郑州,450052)

朱长青,ZHU Chang-qing(信息工程大学,测绘学院,河南,郑州,450052;南京师范大学,虚拟地理环境教育部重点实验室,江苏,南京,210097)

矢量数据融合 篇3

针对目前基于颜色的图像检索算法在提取颜色特征失真较大的问题,提出融合颜色特征和纹理特征的检索算法,在颜色特征提取时采用矢量量化提取颜色特征,将彩色图像转化到HSI颜色空间,对查询图像矢量量化,形成码书,统计查询图像各个码字出现的频数,形成颜色直方图,完成颜色特征提取。当前将矢量量化应用于颜色空间量化实现图像检索的相关研究并不多,将矢量量化融合其他特征检索方法也并不常见。考虑到矢量量化在颜色提取过程中计算量较大,本文在纹理特征提取时,采用容易理解、计算复杂度较低、鉴别能力较强的局部二进制算法( LBP)[5],采用灰度空间圆形邻域的LBP( P,R)算子,得到图像中每个像素点的LBP值,利用直方图形式展现纹理特征,解决了传统的依靠单一特征来检索图像的不足。最后,相似度计算通过颜色相似度和纹理相似度加权平均来度量,通过改变颜色特征和纹理特征的权值,得到最佳的查准率。本文以检索金针花为例,对算法进行了详细阐述,同时还对检索结果进行了客观评价,整体算法的检索流程如图1 所示。

1 颜色特征提取

图像中广泛存在的RGB彩色空间是一种与硬件相关的颜色模型,但它与人类的视觉感官差距比较大[6]。所以直接在RGB颜色空间提取颜色特征、计算相似度,最终达到的检索结果不太理想。因此为了满足人类视觉的需求,选用HSI颜色模型。

1. 1 HSI颜色空间及矢量量化

1. 1. 1 HSI颜色空间

HSI( Hue - Saturation - Intensity) 模型用H、S、I 3 个参数描述颜色特性,它是由Munseu提出的一种颜色模型,其中H为色调,S为饱和度,I为亮度或强度[7]。在HSI颜色空间处理图像,处理结果更符合人类的视觉感知。RGB到HSI转换公式为

1. 1. 2 矢量量化

矢量量化是从k维欧几里得空间Rk映射到其一个有限子集C的过程,即: Rk→C,其中C = { Y1,Y2,…,Yi,…,YN|Yi∈Rk} 称为码书,N为码书长度[8]。映射关系应满足: Q( X |X∈Rk) = Yi,其中X = ( x1,x2,…,xk) 为Rk中的k维矢量,Yl= ( yl1,yl2,…,ylk) 为码书C中的码字,并且满足:d( X,Yl) = min( d( X,Yi) ) 其中d( X,Yi) 为矢量X与码字Yi之间的失真度。因而只要输入一个矢量X必然能在码书C中找到合适的码字Yi与它对应,使该码字与输入矢量X的失真度达到码书中所有码字最小。

1. 2 颜色特征提取

1. 2. 1 生成查询图像码书

本文选取的查询图像为256 × 256 的JPG格式金针花彩色图像,如图2 所示。

以下是生成码书的过程:

1) 生成查询图像的初始码书。 设定码书长度N = 32。MATLAB中读入图像是由RGB形式保存,转换为HSI模型,形成3 × 256 × 256 矩阵。在仿真实验中,将训练样本( 3 ×256 × 256 矩阵) 通过随机函数( randn) 选择32 个样本作为初始码书。

2) 进行迭代训练。 每次迭代中,每一个训练矢量Xi=(Hi,Si,Ii)(i = 1,2,3)( 注: 每一点HSI三个参量作为一个训练矢量) 与码书中的各个码字Yj( j = 1,2,…,32) 相比较,找到与该训练矢量最相近的一个码字Yk,并把所有与Yk最相近的训练矢量归为一类,这样一共有32 类,这一步叫划分胞腔过程。然后求出每个胞腔中训练矢量与其对应在码书中最相近的码字Yk的距离平方之和,得到此次划分胞腔进行迭代的平均失真Ln。若此次划分的平均失真Ln与上次划分的平均失真Ln - 1之间的相对误差 εn符合设定的失真误差 ε,则停止划分,否则求出各胞腔的中心矢量作为新的迭代码书,重新划分胞腔。本文失真相对误差为 ε = 0. 001。查询图像的码书生成过程如图3 所示。

1. 2. 2 形成颜色直方图

通过矢量量化查询图像,得到查询图像的码书,按照码书对查询图像进行编码,统计查询图像中各个码字出现的频数,并用直方图形式直观地表达出来,完成对图像颜色特征的提取,其中直方图的横坐标为码书中码字编号( 1,2,…,32) ,直方图的纵坐标为图片矢量量化后,统计得出码字的频数。在MATLAB7. 11. 0( R2010b) 中仿真,对图2 提取出的颜色直方图如图4 所示。

2 纹理特征提取

纹理是一种普遍存在的视觉现象,可认为是灰度在空间以一定的形式变化而产生的图案模式[9]。纹理特征不同于颜色特征,它所反映的信息不仅仅是单一的像素点,还与该像素点周围其他灰度分布情况联系紧密。图像中纹理特征提取的方法主要有基于分形维数提取法、小波提取法、灰度共生矩阵提取法等[10]。本文使用局部二进制模式( LBP) 算法提取纹理特征。

2. 1 LBP算法

局部二进制模式( Local Binary Patterns,LBP) 最早是为一种有效的纹理描述算子提出的,由于其对图像局部纹理特征的卓越描绘能力而获得广泛使用[11]。基本的LBP算子思路是: 以图像中某一像素点为中心,将该点的灰度值作为阈值,大于此阈值的记作1,小于此阈值的记作0,对其周围3 × 3 的8 个邻域进行二值化,按照约定的顺序( 以邻域的某一点开始顺时针或者逆时针) 二值化,最终得到一个8 位二进制数,将此8 位二进制数转化为十进制数( 0~255) 作为该点的LBP值[12]。本算法使用的是基本LBP算子推广以后的圆形邻域的LBP( P,R)算子,其中下标P表示P邻域,R表示圆形邻域的半径,图5 给出了一个半径为2 的8 邻域像素的圆形邻域。每个方格对应一个像素,对于正好处在方格中心的邻域点( 左、上、右、下4 个黑点) ,直接以该点所在方格的像素值作为它的值; 对于不在像素中心位置的邻域点( 斜45°方向的4个黑点) ,通过双线性插值确定其值。

例如,图5 所示,位于图像中第i行和第j列的中心点灰度为I( i,j) 和8 个邻域点,为计算左上角2 点的值,需要利用其周围4 个像素点( 4 个空心点) 进行双线性插值。首先分别算出2 个十叉点A、B的水平插值,A点的值根据与之同一行的I( i - 2,j - 2) 以及I( i - 2,j - 1) 的线性插值得到

同理B点值为

左上角2 点灰度值为点A和点B的竖直线性插值

当所有8 个点的灰度值都求出以后,计算中心点I( i,j)的LBP值公式为

式中:gc为中心点I( i,j) 的灰度值; gp为邻域点的灰度值。

例如,图6 每个方格中的数字代表灰度值,中心灰度值为5。利用上面的方法得出邻域8 个点的像素值,从中心点正左侧对应点开始顺时针依次是2,6,6,8,4,5,4,8。所以该中心点对应的二值模式是01110101。根据式( 2) ,LBP( 8,2)= 117。

2. 2 纹理特征提取

首先在MATLAB中通过rbg2grey函数将彩色图像转化为灰度图像。其次利用圆形邻域的LBP( 8,2)算子,逐一扫描图像,得出每一个像素点的LBP( 8,2)值。最后生成LBP图,结果如图7。

在实验中,把LBP值( 0~255) 平均分成32 个区间,求出查询图像中LBP值落在每个区间的频数,得到LBP直方图如图8,完成纹理特征的提取。

3 图像相似度计算

图像颜色特征和纹理特征提取之后,接下来的问题是如何将这两特征融合计算特征相似度。本文在结合两特征相似度时,采用加权平均的方法。

由于两种特征最后都形成特征直方图,所以两种特征在计算相似度的时候,采用相同的度量方法。查询图像经过特征提取获得特征向量X为32 维,图库中第k个图像经过特征提取得到32 维的特征向量Y。则二者的距离公式为

分别求出查询图像与图库中图像的相似度距离dk( k =1,2,3,…,n) ,再将所有距离分别除以最大距离,得到最终的特征距离距离Dk为一组0~1 之间的一维组数,用Dk来衡量图像特征相似度。为了好区别颜色与纹理特征相似度,记Dkc为图库中第k个图像与查询图像的颜色特征距离,Dkt为图库中第k个图像与查询图像的纹理特征距离。采用加权平均来融合颜色和纹理的特征距离,最终图库中第k个图像与查询图像的距离为

式中,wc为颜色特征的权值,wt为纹理特征的权值,且wc+wt= 1,经过距离计算得到Sk是0~1 之间的数,Sk越小越相似,Sk= 0 所对应的图像为查询图像,Sk= 1 为与查询图像最不相似的图像。根据Sk从小到大排序输出查询结果。

4 实验结果及算法分析

首先,为了验证检索算法的可行性,在MATLAB7. 11. 0( R2010b) 中,采用融合矢量量化和LBP的检索算法对金针花进行检索仿真,实验结果如图9 所示。

其次,为了验证算法检索的精准度,实验对植物、动物、风景分别进行检索。为了达到算法性能评价的可靠性,植物类选取了花100 幅图片( 其中花的种类不同、形状不同、颜色不同) ,动物类同样选取了100 幅图片,风景类也选取了100 幅图片进行检索。通过改变颜色特征权值wc和纹理特征权值wt,统计出各类图片的查准率,计算出整体平均查准率。平均查准率( Averprecision) 计算公式为

实验结果统计数据见表1。

由表1 数据可见,当颜色特征与纹理特征比重相等即wc= wt= 0. 5 时,平均查准率达到最高为0. 86。

最后,为了验证算法的检索性能,将本算法与传统颜色直方图算法和文献[13]检索算法进行对比,通过计算查全率和查准率,绘制曲线如图10 所示,显然本算法要优于其他两种算法。原因: 1) 颜色特征提取采用矢量量化算法,在量化时按照查询图像来生成码书,在检索不同的图像时,查询图像码书是按照查询图像变化而变化的,提取出的颜色特征更能体现出查询图像本身存在的颜色信息; 2) 纹理提取采用LBP算法,通过双线性插值确定LBP值; 3) 本算法融合了颜色和纹理特征,弥补依靠单一特征来检索图像的不足。

5 小结

本文针对图像检索,提出了基于矢量量化与LBP的图像检索算法。本算法通过矢量量化,根据检索图像来形成检索码书,能够很好地保留图像的颜色信息,融合LBP算法完成纹理特征,弥补颜色特征忽略空间分布不足。在MATLAB7. 11. 0( R2010b) 中仿真本算法,实验结果表明本算法的查准率和查全率远高于单一的基于颜色的图像检索算法,同时,证明了本算法的可行性和可靠性。

摘要:基于内容的图像检索算法一直是图像领域研究的热门课题,因此提出一种新的融合矢量量化与LBP的图像检索算法。首先,将彩色图像转化到HSI颜色空间,进行矢量量化编码,统计图像码字出现的频数,形成颜色直方图,完成颜色特征的提取;然后,再将彩色图像转化成灰度图像,利用局部二进制模式(LBP)算法提取纹理特征;最后,相似度计算采用颜色特征和纹理特征相似度加权平均,并且改变颜色特征和纹理特征的权值,多次实验得到使查准率最高的权值。实验结果表明,算法能有效地提升图像检索性能。

城市基础矢量数据组织与处理研究 篇4

但目前, 大部分的测绘产品管理仍处于手工阶段, 人力物力资源消耗大、工作效率低、工作可靠性差。面对着测绘技术的迅猛发展和变化, 面对着凝聚着广大测绘工作者辛勤汗水的大量珍贵的测绘产品, 如何管理好这些测绘产品, 使其接收、存储、管理、供应更加规范和高效就成为我们迫切需要解决的问题。

改革开放以来, 我国城市建设实现了高速、持续的发展。在信息化的时代, 信息已成为一项重要资产。对信息的有效管理和利用, 将大大地提高企业内部运作的效率和对市场需求的快速反应能力, 最终增强市场竞争力[2]。从城市建设规划决策层和各个企业管理决策层角度出发, 决策者需要在宏观上对全市的测绘产品的情况等综合指标有一个全面的了解;对于各种建设工程的设计、施工以及管理操作人员来讲, 实现测绘产品资料管理的全面化和自动化, 才能更好的提高企业的工作效率, 顺应信息化社会的发展潮流。因此, 在测绘产品的管理中, 迫切需要引进一种新型的管理手段, 能够依托计算机对现有数据进行有效的分析。于是, 管理测绘产品的地理信息系统应运而生。

1 城市基础矢量数据的分类分层设计

在城市基础矢量数据库中, 矢量数据采取分类分层存储。按地形图的地形要素内容可分为:测量控制点、居住建筑、工矿设施、交通、管线设施、水系、境界、地质土貌、农田植被等类别 (图1) 。

2 城市基础矢量数据在数据库中的编码

为了更科学地了解、管理和应用城市矢量数据, 保证城市基础地理信息在系统内及其它专业信息系统间采集、存储、检索、分析、输出及交换的一致性, 实现系统兼容、信息共享, 研究和制定地形要素分类与编码的标准, 具有十分重要的意义[10]。

地形要素分类与编码的原则如下。

(1) 科学性:在对城市地理信息进行分类和层次划分时, 要以城市规划发展的趋势、地理信息系统的特点等作为依据和出发点, 进行科学的分类和分层, 不能以一个或几个行业和部门的分类作为标准。

(2) 系统性:将整个城市地理信息作为一个大的系统, 划分为若干个层次, 在各层次的结构、要素的代码编制等方面保证层次清楚、结构合理, 相互协调配合, 形成完整的编码体系。

(3) 适用性:编码要能适应地形图数据采集的作业习惯、数据库建设的要求, 以及多种行业的需要, 做到易记, 适应面广。

(4) 唯一性:列入分类结构体系中的各地理要素的位置唯一, 且只有唯一的一个代码与之对应。

(5) 兼容性:兼顾国家标准和其他单位的分类编码标准为信息跨行业、跨地域共享打好基础。

(6) 可扩展性:考虑到地理要素的发展变化, 在码位的分配上留有充分余地以便要素增加时不致打乱既有的分类编码体系。

以上分类编码原则应综合考虑, 力求使编码的设计能达到最优化的效果。

3 城市基础矢量数据的获取

城市基础地理信息系统建设所使用的矢量数据获取手段总结起来主要有以下几种。

(1) 原图数字化。

图解地图的内容可以通过数字化方式转换成数字地图, 采用数字化仪或扫描仪将地图的图解位置转换成统一坐标系统中的解析坐标, 并应用数字化地图符号菜单或计算机键盘输入地图符号和注记的代码。这种方法建立的数据精度不会高于原图, 不能满足某些工程用图的需要, 随着全站仪的普及和GPS全站仪系统的成熟, 数字化原图将会被摒弃。

(2) 全野外数据采集。

用全站仪、GPS RTK进行实地测量, 将野外采集的数据自动传输到电子手簿、磁卡或便携机内记录, 并在现场绘制地形 (草) 图, 在室内将数据自动传输到计算机, 人机交互编辑后, 由计算机自动生成数字地图。在基础地理信息系统中, 全野外数字测图作为测量与更新数据的主要方法, 具有机动、灵活、易于修改等特点。这种方法也称为内外业一体化地面数字测图。

(3) 部分原图数字化, 部分全野外数据采集。

用一部分实测精确坐标代替数字化坐标的地图数字化方式, 在己有地图地区, 在野外采用电子全站仪和电子记录手簿进行碎部测量, 得到一些建筑物点的精确坐标, 在地图数字化作业中, 可以用这些点的精确坐标代替相应点的数字化方法得到的坐标。这种方法利用了现有地图资料, 又在一定程度上提高了原有图解地图的精度, 随着地图的不断更新, 具有准确坐标的地物点将逐步增加, 地图精度也相应得到提高。

(4) 数字摄影测量方法。

随着计算机软、硬件技术的发展以及摄影测量数据处理手段的不断进步, 摄影测量的方法逐渐在数据采集中采用, 目前很多城市都己经开始利用航空摄影测量的方法来获取l∶500地形图数据。该方法作业速度快、覆盖面积大, 对于大范围、比较开阔地区的基础数据采集来说, 也是一种比较理想的模式, 该方式需要进行像控点测量、航片调绘等工作。另外精度比起野外数据直接采集来说要差一些, 但可以根据具体情况进行选用。国内大多数城市就是通过以上几种方式获取了覆盖城市范围或部分范围的基础地理图形数据, 给城市基础地理信息系统的建设提供了空间数据源。

参考文献

[1]李炼恒, 赵俊三, 赵耀龙.城市基础地理信息系统的功能与总体设计研究[J].科技资讯, 2002, 27 (3) .

[2]田茂义, 卢秀山, 张燕, 等.基于oracle的“数字城市”基础地理空间数据库的实现[J].科技创新导报, 2005, 30 (3) .

基于面积阈值的矢量数据压缩方法 篇5

矢量数据压缩是地理数据处理中的一种常用技术,目前该技术已在更多领域得到应用,如医学图像特征边界的重采样等。曲线矢量数据压缩实质上是一个信息压缩问题,它是从组成曲线的点序集合S中抽取一个点序子集A,也就是说AS的一部分,而不是一些新的点[1]。其中压缩的主要对象是线状图形要素,因为点状图形要素可以看作线状图形要素的特例,而且面状图形要素的基础也是线状图形要素[2]。压缩的目标是在尽可能保持原有特征的情况下去除数据中的冗余部分,以减少数据的存贮量,加快后继处理速度。已有许多学者对数据压缩这一课题做了深入研究并提出了许多经典的算法,如Douglas-Pecuker算法、圆柱法、垂距限值法等[3]。但上述几种经典的算法都是以距离为判定标准的,且判定完全依据阈值,难免会存在一定局限性。本文分析了经典的矢量压缩算法,并在此基础上针对已有算法的不足和局限性提出一种改进的曲线矢量压缩算法。

1 传统的矢量数据压缩算法

传统的矢量数据压缩方法主要有圆柱法、垂距限值法、Douglas-Pecuker算法等,下面简单地分析这些算法的原理并指出优缺点。

Douglas-Pecuker算法从全局出发,利用递归的方式处理问题。该算法的过程为:首先用直线连接矢量数据的起点p0和终点pn,在此基础上计算其他各点到该直线的距离并找出到距该直线距离最远的点pi,如果点pi到直线的距离小于阈值D则仅保留点p0和pn且算法结束;如果点pi到直线的距离大于阈值则分别对独立的两段进行处理,第一段以p0为起点pi为终点,另一段以pi为起点pn为终点,重新采用上述方式递归处理直到算法结束[4]。

Douglas-Pecuker算法具有平移、旋转的不变性,给定曲线与限差后,抽样结果一致等优点[5]。但该算法的思想是递归实现,实时处理的效率仍不够理想,同时无法保证面积的误差精度[6]。例如对于图1的情况,选择平行线L1与L2之间的距离作为阈值,当仅处理点1,2,3组成的实线部分时,点2被保留,当处理点1,2,3,4组成的部分时,按照Douglas-Pecuker算法点2与点3会被删除,说明该算法仍存在不稳定的情况。

另外的方法如圆柱法和垂距限值法虽然处理过程简单且执行效率高,但存在同样的问题。如利用圆柱法处理图1中的情况也会将点2和点3删除;垂距限值法在处理同一数据集时,从相反的方向进行处理会得到不同的结果,在点密度分布不均匀的情况下很难选择合适的阈值,这是由于该方法只考虑局部情况造成的结果。

2 算法改进

2.1 判定依据

上述几种传统的矢量数据压缩算法有个共同点是以距离作为判定依据。距离在压缩中作为阈值是一个很好的选择,但也存在一些问题,如对地图边界数据压缩时无法对面积误差进行控制。

本文以面积作为判定依据提出了一种新的算法。由于面积具有可扩展性,相邻的面积可以通过简单的相加得到更大区域的信息,因而在压缩中保留面积信息可以有效地减少重复计算。

多边形面积的计算是本算法的基础,矢量的叉乘运算是计算三角形面积的一种快速且有效的方法,并且很容易将它扩展到多边形面积的计算。

其中矢量叉乘的定义如下:

Ρ0Ρ1×Ρ0Ρ2=[(x1-x0)(y2-y0)-(x2-x0)(y1-y0)]=|Ρ0Ρ1||Ρ0Ρ2|sin((Ρ0Ρ1,Ρ0Ρ2))

式中(Ρ0Ρ1,Ρ0Ρ2)表示向量Ρ0Ρ1按逆时针方向旋转到与向量Ρ0Ρ2同向经过的角度。

根据叉乘的定义,图2中三角形(p0, p1, p2)的面积S1可以表示为:

S1=Ρ0Ρ1×Ρ0Ρ2/2

同理可求得三角形(p0, p2, p3)的面积:

S2=Ρ0Ρ2×Ρ0Ρ3/2

及三角形(p0, p3, p4)的面积:

S3=Ρ0Ρ3×Ρ0Ρ4/2

需要注意向量的叉乘运算包含符号,因此可能导致上述几个表达式计算出的面积的值为负。虽然面积的负值在实际中没有对应的含义,但在求多边形面积中却十分关键。如图2中多边形面积的绝对值|S|可以表示为|S|=| -|S1|+|S2|-|S3| |。可见图2中多边形的面积S即为多个三角形的面积之和,可表示为S=S1+S2+S3。在计算过程中不能去掉面积的符号信息,不然会重复累加重叠部分的面积,因此只有在对所有面积求和后取绝对值才能正确地获得多边形面积的值。

2.2 算法流程

本文提出以面积为判定阈值的新算法。该算法可以概括为两个主要组成部分:(1) 顺序遍历点集并从中获取一个符合要求的子集;(2) 在得到的子集中选取最优点保留,并删除冗余点。重复这两个步骤直到整个点集处理完毕。

设待压缩的点集SETp由点序列{p0, p1,…,pn}组成,其中各点对应的坐标依次为{(x0,y0), (x1,y1),…, (xn,yn)}。并设SETc为当前读入点的集合,它是SETp的一个子集。下文将对图3中的流程做详细的说明,其中图4作为一个压缩的实例。

算法开始后首先判断压缩前的点集SETp是否为空,不为空则继续一下的步骤,否则算法结束。顺序读取SETp中的点,每次读取一个点并更新点集SETc的面积Sc。面积Sc更新为其原面积加上一个三角形的面积,其中的三角形由原SETc的起点、终点及新加入点组成。如果SETc的点数不足3个构不成多边形时,则定义其面积Sc的值为0。

在图4中,若当前SETc为(p0,p1,p2)时,则Sc为三角形(p0,p1,p2)的面积。如果Sc的绝对值小于阈值,则读取其后续点p3到SETc,并更新面积为Sc=Sc+S(p0,p2,p3)。其实Sc为由SETc顺序构成的多边形的面积。

SETc的面积Sc大于阈值,则在SETc中寻找一个最优的点保留。首先新增一个临时点集SETct初始化为SETc的一个拷贝,随后扩展SETct。若后续点加入后SETct面积的绝对值增加且其点数不大于SETc中点数的2倍,则将该点加入SETct,否则终止对SETct的扩展。

之后以SETct中的起点及终点为两个确定点,遍历SETc中的点,其中与上述两点组成三角形的面积绝对值最大的点定义为最优点。根据实践,以这种方法寻找局部最优点不仅能提高算法速度,且其选取的当前最优点将保留更多的全局信息。

图4中,若当SETc为{p0,…,p3}时其面积大于面积阈值,则新建SETct并拷贝SETc的信息。此后扩展SETct,但由于扩展p5时三角形面积S(p0,p4,p5)与原Sc的符号相反,因此加入p5只会减小SETct面积的绝对值。最终SETct扩展为(p0,…,p4),之后以p0,p4为三角形的两个确定点在SETc中寻找最优的点。其中S(p0, p2, p4)面积最大,选取p2为最优点。

SETp中删除最优点与SETc起点间的所有点,清空SETc中除之最优点外的所有点,并以该最优点为新的起点从SETp中读取最优点。

图4中根据上述的假设,则删除p2与p0之间的所有点,即从原点集中删除{p1}。之后SETc中仅保留p2作为其起点。随后读取后续点p3并重复上述几个步骤至SETp中的点都被读取。

SETp中所有点读取完毕后若SETc不为空,则需要优化处理。如果其面积远小于阈值则仅保留当前SETc的起点与尾点,否则按上述方法寻找其最优点,并重复该优化处理的过程。

2.3 实验结果

本文对算法的评判主要依据以下几个方面:① 算法复杂度(空间及时间复杂度);② 压缩产生的面积误差;③ 压缩产生的偏移误差。

该算法的时间复杂度是O(k×n),一般情况下k为个位数;空间复杂度为O(n),由于算法中没有递归处理,因此大大降低了内存空间需求。通过大量实验对比,该算法在处理点数小于10 000的情况下运行速度约为Douglas-Pecuker算法的2~6倍,且倍数随着处理数据量增加而增大。

面积误差是压缩前后面积差值的绝对值。压缩前的面积是指原曲线与其外一点Pout组成的面积(如图4中Pout与原点集构成的阴影部分面积),同理,压缩后的面积指曲线压缩后与Pout组成的面积。其中点Pout的位置可以任意选取,并且不会影响面积误差。

距离偏移误差采用点位评估法[7],即通过原始曲线上点与压缩后曲线的相对偏差大小来衡量压缩精度。计算方法为各个压缩点到压缩后曲线的距离平方的和。如图4,若保留点为p0,p2,p6,设点p1到(p0,p2)两点构成的直线的距离的平方为D1,(p3…p5) 各点到由(p2,p6)两点直线的距离的平方和为D2。则总的偏移误差D=D1+D2。

表1中,压缩比表示为压缩后点数除以压缩前点数。表1记录了本文算法与Douglas-Pecuker算法的对比数据,其中A列是本文算法的结果,D列是Douglas-Pecuker算法的结果。运行时间的单位为毫秒(ms);偏移误差与面积误差采用与距离相同的数量级的单位,如果距离用单位米(m)表示则偏移误差与面积误差的单位为平方米(m2)。表格中的结果均取多次实验的平均值。

从实验结果中可以看出,在相同的压缩率下该算法提高了运算速度且距离偏移误差并没有太多的增大,并且面积误差要小于Douglas-Pecuker算法。

3 结 语

本文在分析经典的矢量压缩算法基础之上提出以面积为判据的新算法。此算法在整体思路上与传统方法有着较大的差别,主要基于以下几点:

(1) 由于矢量数据压缩广泛地应用在地理信息领域,该领域对面积的误差一般有严格要求,因此如果在地图数据处理过程中仅以距离作为判定依据将难以控制面积的误差。

(2) 传统方法每一步都需要计算该段内所有的点到线距离,计算量大,而本文利用面积的方法可以在很大程度上减少计算次数。

实验证明,该算法较Douglas-Pecuker算法不仅降低了算法的时空复杂度,也大大降低了面积误差。

摘要:曲线矢量数据压缩本质是信息压缩问题,它在计算机制图中具有十分重要作用。在分析传统矢量数据压缩方法的基础上提出一种基于向量运算的曲线矢量压缩的新方法,该方法与传统数据压缩方法的区别在于以面积为判定标准,利用面积的可叠加性提高算法的精度和效率。实验证明该算法容易实现,数据压缩量大,算法时空复杂度低且能有效地控制矢量图形的面积误差在一定范围内。

关键词:矢量数据压缩,Douglas-Pecuker算法,点抽稀

参考文献

[1]黄培之.具有预测功能的曲线矢量数据压缩方法[J].测绘学报,1995,24(4):316-320.

[2]陈飞翔,李华,于文洋.基于多实体的矢量数据压缩改进算法[J].计算机工程与应用,2008,44(19):200-202.

[3]Chen Feixiang,Qi Jiandong,Zhao Ming.An Improved Algorithm of Vec-tor Data Compression[C]//2009 International Symposium on IntelligentUbiquitous Computing and Education,2009:156-159.

[4]翟战强,管华,王双亭.一种快速空间矢量数据压缩方法[J].计算机工程,2003,29(2):94-95.

[5]张胜,朱才连,钟世明.Douglas-Peucker算法的改进及应用[J].武汉理工大学学报:交通科学与工程版,2005,29(5):671-674.

[6]杨得志,王杰臣,闾国年.矢量数据压缩的Douglas-Pecuker算法的实现与改进[J].测绘通报,2002(7):18-19.

矢量数据融合 篇6

在二次土地调查数据建库中, 矢量数据建库占到整个数据建库工作量的80%以上, 怎样能够充分利用现代计算机技术实现二次土地调查矢量数据质量的自动化检核?依此来大幅度提高二次土地调查矢量数据的建库效率, 已成为一线工程技术人员在数据加工与建库过程中的关键技术问题。

2 数据质量的概念

数据质量是指数据的可靠性和精度, 在测量学中通常用误差来度量, 在二次土地调查建库过程中, 有许多生产环节, 每个环节均产生一定的误差, 按照误差传播理论, 每项误差的传播直接影响到最终数据的质量。而对于数据质量控制, 很多人认为是一个空洞的概念, 是专家与学者研究的理论, 其实, 随着信息技术的应用普及, 数据质量控制在数据加工与建库过程中无处不在, 一般来说, 由于数据采集过程中某些因素的影响, 因此误差总是存在, 通常有位置误差、属性误差、时域误差、逻辑一致性误差、不完整性误差。二次土地调查数据的数据质量是一个相对的概念, 其基本质量要求是国家对土地利用管理和分析的适用性, 即数据精度能够达到二次土地调查后土地利用、管理和分析应用的需要。

3“数据加工”与“质量控制”的关系

按照作者的理解, 质量控制是理论, 数据加工是过程。质量控制理论指导数据加工过程, 数据加工的成果又必须符合质量控制的理论。没有质量控制理论指导, 数据加工的过程只能是盲人瞎马;没有数据加工的质量控制理论, 也只能是“纸上谈兵”。质量控制不仅仅适用于数据加工, 也适用于数据采集, 在数据采集阶段如果能尽可能的遵循质量控制理论, 就能够大大减少后续数据加工的工作量。

4 二次土地调查数据质量控制原则

4.1 统一标准原则:

数据建库中数据内容、分层、结构、质量要求等要严格按照《第二次全国土地调查技术规程》、《土地利用数据库标准》、《城镇地籍数据库标准》中的规定, 扩充部分要严格按照地方统一规定;

4.2 过程控制原则:

要对数据采集、数据入库等过程中的每一重要环节进行检查控制与记录, 以免环节出错造成误差传递、累加等, 同时要保证建库过程的可逆性;

4.3 持续改进原则:

应遵循持续改进原则, 使其贯穿数据采集、检查、入库等各环节中, 不断优化各环节的数据, 保障数据质量;

4.4 质量评定原则:

及时对数据进行质量评定, 准确地掌握数据的质量状况, 尽早发现建库中存在的问题, 保证二次土地调查数据建库成果的质量。

5 次土地调查数据质量控制措施

5.1 严格遵循国家、省、地方二调办发布

的各类规程、规范、细则规范是进行数据质量控制的基础, 具体包括数据库模式规范和数据内容质量规范两个方面。

5.1.1 数据库模式规范

数据库模式规范主要包括数据分层、各层数据的表示类型、数据层之间的关系、表的结构 (字段列表) 、字段名称、数据类型、数据文件命名与数据格式等方面, 简单地说就是图层结构和表结构。数据库设计方案往往确定了最终的数据库模式, 但数据加工过程中可以根据具体情况采用不同的数据库模式, 入库时再转换到目标数据库模式。不论哪种情况, 都必须对相应的数据库模式做出明确规定, 建库各阶段必须严格按相应的数据库模式存放数据。

数据检查时首先检查数据库模式, 这是一种形式 (格式) 检查。数据库模式不正确, 数据内容是没有太大意义的。

5.1.2 数据内容质量规范

二次土地调查数据主要包括空间数据与属性数据, 这两类数据的质量控制各有不同。依据《第二次全国土地调查数据库建设技术规范》和矢量数据质量控制理论, 二次土地调查数据质量要求主要包括:矢量数据几何精度、矢量数据拓扑关系正确、属性数据的完整性和正确性、接边是否完整等内容。

5.2 调查底图处理、数据采集、数据加工过程质量控制

在二次土地调查数据的采集与建库过程中, 每一个环节都可能影响最终数据的质量, 所以必须在调查地图处理、数据采集、数据加工等每个过程严把质量关。

5.2.1 调查底图选择与处理

调查底图或已有的基础资料, 虽然无法选择, 但可以通过资料预处理, 消除其中错误的、有疑义或缺漏的地方, 从而提高这些图件和表格的质量, 奠定采集数据质量的资料基础。

5.2.2 数据采集的定位处理

地图数据采集与处理是影响数据库质量的关键阶段, 为了提高质量应尽量减少甚至取消不必要的中间环节, 避免中间环节引入数据误差。外业调绘图直接用作建库基础资料, 不经过中间清绘环节, 一方面减少了工作量, 另一方面也避免了引入误差。不论是以何种方式进行地图数字化, 除选用高精度的设备和有效的软件之外, 更重要的是以明确的质量标准来控制作业过程, 数据质量取决于作业员执行这些质量标准的情况。

5.2.3 数据加工的质量核查与自动纠正

数据采集过程中无论要求多么严格, 都不可避免地会存在数据质量问题, 因为有些质量问题是人工很难发现的, 这就需要根据具体情况编制计算机程序进行自动化检查。有些数据质量是无法通过计算机来自动核查的, 只有通过一定方法进行人工检核。

6 二次土地调查数据质量检查方法

数据质量控制是个复杂的过程, 数据检查方法必须采用程序方法和人工方法交互检查才能保证数据成果的最终质量。

6.1 程序检查方法

由于空间数据的图形与属性、图形与图形、属性与属性之间存在有一定的逻辑关系和规律, 通过编制计算机程序, 设计模型和算法, 将数据中不符合规律、逻辑关系矛盾的要素自动挑选出来, 这些自动化检查主要包括:数据文件的完整性检查、属性一致性检查、拓扑关系建立检查、异常属性值检查、不符合逻辑关系的属性值检查等。

采用计算机程序进行数据质量自动检核, 不仅可以大大提高工作效率, 而且可以处理数据中许多人工无法处理的错误。

6.2 人工检查方法

人工检查方法是一种低效率、费时、费力的检查方法, 但有些检查项目无法使用程序来完成, 只能采用人工检查方法。最常用的人工检查方法是对照检查法, 即在屏幕上或使用输出图, 对照原始图件或外业调查表格, 检查数字化的地图图形或者表格的数据项是否与原始数据一致。

7 二次土地调查数据质量检查方法的具体应用

针对国家二次土地调查数据建库过程中数据质量检查需要, 笔者依据前述数据质量控制理论, 结合赣州市章贡区第二次土地调查项目开发了基于Auto CAD平台下二次土地调矢量数据采集与质量控制软件 (GZLandSurvey) , 采用程序方法与人工方法相结合, 对数据库模式和数据内容两个方面进行全面检查, 充分保证了赣州市章贡区二次土地调查GIS数据建库质量, 为章贡区二次土地调查提供了一套实用高效、技术先进的自动化处理方案, 取得了很好的应用效果。

结语

由于二次土地调查技术复杂、难度较大, 涉及到很多新的技术, 二次土地调查中的很多技术问题还需要广大科研人员和一线工程技术人员继续不断探索与创新。

参考文献

[1]国土资源部.第二次全国土地调查技术规程 (TD/T1014-2007) [M].北京:中国标准出版社, 2007.

[2]国土资源部.土地利用数据库标准 (TD/T1016-2007) [M].北京:中国标准出版社, 2007.

三维矢量数据结构在采矿中的应用 篇7

矿山地理信息系统 (Mine Geographic Information System) 所处理的空间数据, 从本质上讲是三维连续分布的, 而且垂直方向上的信息和水平方向上的信息具有同等重要的意义。现有的GIS软件虽然可以用数字高程模型来处理空间实体的高程坐标, 但是由于它们无法建立空间实体的三维拓扑关系, 使得很多真三维操作难以实现, 故被称之为二维GIS或2.5维GIS。矿产资源勘探、采矿作业、地表下沉、地下水运移、地应力分布以及环境污染等均为三维现象, 当试图以二维系统来描述它们时, 就不能精确地反映、分析或显示有关数据。如何建立起适应矿山地理信息系统的三维数据结构已成为矿山地理信息系统研究中迫切需要解决的问题。

在矿山地理信息系统三维建模研究方面, 李青元等做了大量工作, 提出的三维矢量数据结构能够较合理地描述矿山地质实体。但该数据结构基本上只适合于互斥、完整体域所构成的自然目标实体。实际上矿山实体中包含大量的人工构造物 (如巷道、井筒等) ;而且矿山实体中体域之间不完全是互斥关系, 还有包含等关系;另外, 矿山实体中不仅有体域, 还有面、线、点域等实体。如何描述这种复杂的目标实体, 现从矿山实际应用出发, 提出一种适合矿山地理信息系统的三维矢量数据结构。

2 三维GIS矢量数据结构的拓扑关系定义

如何建立、维护空间元素的拓扑关系是三维GIS研究领域中的一个核心问题。拓扑关系的建立使得各种空间的操作与信息查询易于实现。然而三维GIS中的三维拓扑关系建立是一个棘手的问题, 因为所研究目标的结构极其复杂和不规则。从侧重于矿山实际应用的三维GIS研究出发, 复杂地物可用充满空间的各种体域、组成体域的曲面、构成曲面的边界环、组成环的弧、弧上的结点来描述;一般来说, 体域是目标实体的基本构成;认为任何复杂的实体都是由体域 (自然的或人工的) 构成的;体、面、线、点是一个动态的概念, 在不同的比例尺或不同的研究重点时可以相互转换。例如对整个矿井来讲, 巷道可认为是线域, 而对某个工作面来讲, 巷道则是体域。按上述思路和观点, 考虑保持拓扑信息的完整性、易扩展性, 提出用以下6组关系来描述矿山GIS三维矢量结构的空间拓扑关系。

2.1 复杂地物-体关系:复杂地物与组成它的体域。在该拓扑关系中加入对复杂地物属性的描述或指向属性记录文件的指针。

2.2 体-复杂地物-曲面关系:

体域与由其所构成的复杂地物, 体域与包围该体域的曲面, 以及与该体域相邻的体域。体拓扑结构中可加入对体域属性的描述。

2.3 曲面-环-体域关系:

曲面与组成曲面的环以及该曲面所包围的体域 (正面邻体) 和包围该曲面的外部体域 (负面邻体) 。一个曲面可能由若干个环构成, 其外环取正, 内环取负值。在曲面拓扑结构中加上若干值样条弧 (如等高弧) 或插值函数, 就可确定该曲面的空间形态。

2.4 环-弧-曲面关系:

环与构成该环的弧以及该环所包围的内部曲面 (内邻曲面) 和包围该环的外部曲面 (外邻曲面) 。

2.5 弧-结点-环的关系:

弧与该弧的起结点、终点及包含该弧的环。环有正负之分, 环方向与弧的方向一致时, 取正号;反之取负。在弧拓扑结构中加一系列坐标串, 可确定该弧的形态。

2.6 结点-弧的关系:

结点及从该结点出发的离开弧段和以该结点为终点的到达弧段。

显然以上6组拓扑关系可转化成二维GIS的拓扑关系。现结合一具体实例说明用以上6组拓扑结构如何进行拓扑描述。

3 三维GIS矢量数据结构拓扑关系的建立

典型的矿山现象。其物理意义如下:煤层上覆岩层为页岩 (V1) , 中间为煤层 (V2) , 煤层底板为砂岩 (V3) 。在煤层中赋存着一层很薄的夹矸 (V5) 。在底板砂岩中开拓了一条运输集中巷 (V4) 。另外, 还探测到在煤层某处有一瓦斯集聚点 (V6) 。

对于这样不太复杂的模型, 按层次分解方法来建立上节所定义的6组拓扑算法。复杂地物分解成若干组体域, 将这些体域分别分解成各自组成的曲面, 再将曲面分解成环, 进而将环分解为弧段和结点。

经过对复杂地物进行的层次树分析, 即可按定义的6组矢量拓扑关系来建立的拓扑描述。其中煤层中夹矸层视为特殊的体域, 仅有面积而无体积概念。对V6瓦斯积聚点视为无体积、无面积概念的特殊体 (点) 域。

如需要详细描述复杂地物的属性, 则用属性记录文件的方式加以记录, 用指针来穿引。曲面以指向所包围的体域方向为正, 远离所包围的体域为负 (右手法则) 。

通过值样条弧 (或插值函数) 可以刻划出曲面空间形态。本例中巷道设为理想巷道 (巷道的断面形状-梯形、拱形或圆形, 可通过弧-结点-环拓扑加以区分和描述) , 故曲面QVUT等不需值样条弧。实际上随着巷道掘进和煤层开采, 巷道不可避免地发生空间形态的变化。这种复杂巷道可通过值样条弧来刻划其空间形态。具体说, 在巷道形态发生较大变化的地段取值样条弧加以描述。通过一系列值样条弧 (这些值样条弧可进一步用结点-弧拓扑加以描述) , 则可刻划出巷道的空间形态的变化;如巷道的空间形态变化具有某种规律, 则可用插值函数近似描述;或值样条弧和插值函数配合使用。

若弧为直线段, 则仅需记录起点与终点坐标即可。若弧为曲线段, 则应记录一系列的中间坐标, 用以刻划曲线段的形态。中间坐标的记录个数则视曲线段的弯曲程度和要求精度的高低而定。

结语

文章从矿业应用实际出发, 提出了采用:复杂地物-体, 体-复杂地物-曲面, 曲面-环-体, 环-弧-曲面, 弧-结点-环, 结点-弧这六组拓扑关系来刻划目标实体, 并以层次树关系图作指导, 就一典型矿山现象生成其拓扑关系。该矢量数据结构描述的中心是体域, 而把面域、线域、点域看作特殊的体域, 并按体域形式存贮。当研究中心变化时, 如原来的线域或点域被视为体域时, 这种数据结构则为以后的数据扩展奠定了基础。初步实验表明, 用六组拓扑关系来描述, 易于生成拓扑关系, 方便检索。

矿山作业实际上是三维而且是动态过程。假设巷道正在底板掘进, GIS将如何描述?随着工作面推进, 矿山压力重新分布, 瓦斯积聚点的形态和位置将发生改变。这种现象三维矢量数据结构如何组织和描述?因此有必要在三维矢量数据结构的基础上, 继续进行时空四维数据结构的研究

参考文献

[1]鲍艳.矿山信息系统中巷道的三维矢量数据结构与可视化.西安科技大学, 2002-12-25硕士.

矢量数据融合 篇8

1 矢量数据格式及加密

1.1 矢量数据

森林资源空间数据包括栅格数据和矢量数据, 矢量数据结构是通过记录坐标的方式尽可能精确地表示点、线和多边形等地理实体, 坐标空间设为连续, 允许任意位置、长度和面积的精确定义。由于矢量数据具有数据结构紧凑, 冗余度低, 表达精度高, 图形显示质量好, 有利于网络和检索分析等优点。在G I S中得到广泛的应用, 特别在小区域 (大比例尺) 制图中充分利用了它的精度高的优点。

1.2 加密

数据加密技术是保证网络信息安全最常用和最重要的一种技术。数据加密就是对信息进行重新编码将敏感信息转换成不能识别的乱码, 从而达到隐藏信息内容, 使非法用户无法获得信息真实内容的一种技术手段, 从而达到可以保证传输信息的机密性、完整性和确定性, 防止信息被篡改、伪造和假冒。在传统加密技术中, 基于密钥的加密算法不同可以分为两类:对称加密技术 (常规密钥加密) 和非对称加密技术 (公开密钥加密) 。最有名的对称加密技术是数据加密标准 (D E S) 算法和数据加密标准 (A E S) 算法, 非对称加密技术的加密算法主要有R S A算法。

按照加密时对明文的处理方式, 对称密码算法又可分为分组密码算法和序列密码算法。分组密码算法是把密文分成等长的组分别加密, 序列密码算法, 也称流密码算法, 是一个比特一个比特地处理, 即将明文逐位转换变成密文。

2 混沌及混沌系列

混沌现象是非线性系统的一种内在类随机过程的表现, 只要初始条件稍有不同, 其结果就大相径庭, 难以预测, 而且在有些情况下, 反映这类现象的数学模型又是十分简单, 甚至一维非线性迭代函数就能显示出这种混沌特性。除此以外, 混沌系统产生的混沌信号还具有类似噪声、结构复杂、难以分析等特性。

近年来, 混沌理论在信息安全领域的应用研究已经越来越受到人们的关注。混沌序列的非周期性, 连续宽带频谱、类似噪声等特性, 使它具有天然的隐蔽性。另外, 混沌序列对初始条件的高度敏感性使其具有长期不可预测性, 人们认为利用混沌可能更有助于设计有效快速的加密算法。

混沌序列密码即混沌流密码, 使用混沌系统生成伪随机密钥流, 并将其直接用于掩盖明文。其中混沌伪随机数发生器的设计是这类混沌密码算法的核心问题。混沌的一些基本特性可以大大简化密钥序列的生成, 其非线性特性也可以提高生成密钥序列的复杂度, 混沌系统具有良好的伪随机特性、轨道的不可预测性、对初始状态及结构参数的极端敏感性等一系列特性, 这些特性与密码学的很多要求是吻合的。混沌系统产生的序列从严格意义上来讲属于流密码, 但它与传统的流密码又有区别, 而且它有可能是一类具有相当广泛应用前景的加密方式。

3 基于混沌系列的矢量图混沌加密算法

3.1 算法思想

本文采用一维logistic映射, 首先, 通过数据变换处理, 将用户输入的密码系列映射为 (0, 1) 间的某个实数x0, 用x0作为logist i c混沌映射的初值, 通过迭代产生混沌系列, 将该混沌序列与待加密的原始数据进行异或运算, 生成一密文序列在信道中传输, 如图1所示。

3.2 Logistic映射及混沌系列密码的生产

Logistic映射是由美国数学生态学家May.R于1976年提出来的, 它是一个十分简单又具有重要意义的非线性迭代方程, 是最典型的, 也是研究的最广泛的动力系统, 定义如下。

其中, 0≤μ≤4称为Logistic参数, x k∈ (0, 1) 。当3.5 6 9 9 4 5…<μ≤4时, Logistic映射工作于混沌态。也就是说, 由初始条件x0在Logistic映射的作用下所产生的序列{Xk;k=0, 1, 2, 3…}在理论上是非周期、不收敛, 对初始值极其敏感, 并且具有白噪声统计特性及雪崩效应等特性。因此, 适合构造有效的混沌序列密码应用。

3.3 密钥x0的生成

如果直接让用户输入一实数x0作为密码, 是不太方便和友好的, 本文中, 我们首先计算出用户输入的字符串的Hash值, 再通过对Hash值的ASCII码值扩散映射射为 (0, 1) 间的某个实数x0, 用x0作为混沌映射的初值, 即密钥。

3.4 混沌序列密码的生成

以密钥x0为初值, 对 (1) 式进行反复迭代, 生成足够长度的随机数值序列{xk, k=0, 1, 2, 3, ……}, 由于Logistic映射实数的分布是很不均匀的, 而且相邻点有非常强的相关性, 所以直接把实数值序列用于作密钥流的话, 密钥强度肯定不高, 势必影响加密效果。由于Logistic映射迭代序列关于x=0.4的分布是基本对称的, 则可以采用每次根据迭代值是否大于等于或小于0.4域值来输出0或1比特的方法来产生伪随机数序列, 公式如下:

为了增强随机性, 舍弃开始部分长度为n的序列, 即从序列的第n+1位开始作为密钥流, 进行信息的加密。

3.5 加密的实现

将矢量数据转换成二进制文件格式, 依次取出文件各字节流 (pk, k=1, 2, 3, ……) 与密钥系列 (pn, n=1, 2, 3, ……) 进行“异或”操作, 生成乱码形式的密文流 (ck, k=1, 2, 3, ……) 。

在解密断, 采用与加密相反的操作, 即用密文流与密钥系列进行“异或”操作, 得到明文流。

4 结语

随着计算机的普及及林业信息化的发展, 林业信息系统中的空间数据尤其显得重要, 矢量数据作为空间数据中的一种重要的数据形式, 通常用于栅格图像处理及加密的许多方法将不适于矢量地图, 本文采用了矢量数据的混沌序列加密算法。该算法支持不同形式的密钥输入, 提高了密钥强度, 也增加了软件友好性。其安全性依赖于破解混沌序列的难易程度, 由于混沌序列具有不可预测性、初始值高度敏感性等一系列特性, 使得不知道加密密钥的攻击者几乎不可能进行有效的破解, 而知道加密密钥的合法用户则可以很方便地对数据进行解密, 是一种很好的矢量数据的加密算法。

参考文献

[1]邬伦, 等.地理信息系统-原理方法和应用[M].北京:科学出版社, 2002.

[2]关新平, 范正平, 等.混沌控制及其在保密通信中的应用[M].北京:国防工业出版社, 2002.

[3]许克兵.混合混沌序列与混沌图像加密技术研究[D].西南交通大学, 2007.

[4]王化丰, 张桂香, 邵勇.基于Logistic映射的混沌流密码设计[J].计算机工程, 2007, 5.

[5]钟尚平, 高庆狮.网络环境下地图的混沌加密实用算法[J].计算机辅助设计与图形学学报, 2004, 16.

注:本文为网友上传,旨在传播知识,不代表本站观点,与本站立场无关。若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:iwenmi@163.com

上一篇:提高数学思维能力下一篇:透析方式

付费复制
期刊天下网10年专业运营,值得您的信赖

限时特价:7.98元/篇

原价:20元
微信支付
已付款请点这里联系客服
欢迎使用微信支付
扫一扫微信支付
微信支付:
支付成功
已获得文章复制权限
确定
常见问题