点云数据提取论文(精选7篇)
点云数据提取论文 篇1
0 引言
由点云数据进行三维目标识别现已成为三维视觉领域研究中的重要内容, 针对点云数据的处理在许多计算机视觉任务中扮演着越来越重要的角色[1,2,3]。而对点云的分割作为三维特征提取及识别中一个十分重要的步骤, 已经受到了国内外很多研究者的关注, 也成为非常活跃的领域[4,5]。
近些年研究者提出了各种关于点云数据的分割算法, 这些算法通常可分为基于边缘的算法和基于表面的算法, 以及这两者的混合算法[6,7,8]。Demarsin等[9]基于边缘提取的方法提出产生闭合曲线网络的算法, 提取了闭合的特征线条, 为点云的表面模型重建奠定了基础;Lai等[10]将提取特征区域分成两个阶段, 通过第一阶段来确定待增长的特征类型, 由之后的重新生长阶段进行相同特征类型点的合并, 整个过程有效地实现了平面、球面、圆柱面等的分割提取工作。考虑到点云在获取方式上的特点, 通常数据中包含有大量的不连续性及噪声, 而基于边缘检测的方法对噪声敏感性很强, 因此, 点云数据的分割方法也主要集中在基于区域的分割方法上。
本文针对公共数据库ABW进行研究, 其中被扫描对象主要由一些平面片组成, 因此, 研究重点就集中于如何从这些点云数据中提取出有效的平面基元。基于此, 本文提出了一种基于平面提取的方法近似地重建平面, 通过构建不同的局部邻域点云分布模型, 确定有效的种子平面基元, 结合一系列的相似度准则对所获得的基元进行区域增长, 最终达到分割的目的。采用本文方法进行了多组实验, 对所提出的平面提取算法进行完整的分析和性能评价。结果表明, 基于平面提取的分割算法不仅能较好地得到分割结果, 有效地获得数据本身含有的几何信息, 而且具有较强的抗噪性和鲁棒性。
1 基于PCA的平面基元定义
PCA是利用降维的思想, 在保持原始变量中更多信息的前提下, 把多个指标转化成几个综合性指标的多元统计方法[11]。常用于分析数据集, 找到能表示出数据分布模式的主元, 从而有效地反映数据的本质结构, 由于其具有不受参数限制、使用简单等特点, 因此被广泛地应用于提取主特征、数据分析、图像处理等领域。
1.1 基于PCA的点云法向量估计
在法向量估计的过程中, 研究者通常将估算方法分成以下三类[12]:基于Delaunay的方法、基于鲁棒性统计的方法以及基于局部表面的方法。由于在局部表面上采用主成分分析的方法具有抗噪性强及性能开销低等优点, 本文采用此种方法进行点云法向量的估计。
假设局部邻域由N个点构成, 组成的近似平面为P, 则此近似平面经过N个点的质心μ, 且其法向量可采用主成分分析的方法, 构造邻域点的协方差矩阵。协方差矩阵中的协方差计算公式为:
对矩阵进行特征值分解, 其中法向量可视为最小特征值所对应的特征向量。图1所示为所构建的协方差矩阵。
1.2 局部邻域取样分布模型
尽管场景中有各种物体的组合, 但局部邻域点集总是由一些简单的面域构成[13]。结合实际数据的分布特征, 定义了如图2所示的三种点云取样分布简化模型, 分别是:分布于同一平面、分布于两个相邻平面以及分布于三个相邻平面。
引入协方差矩阵特征值参数λ1、λ2、λ3, 其依次为第一、第二及最小特征值, 特征值阈值σ, 根据特征值的特点, 定义了以下三种情况:
当时, 对应点云取样分布于一个平面的情况;
当时, 对应点云取样分布于两个相邻平面的情况;
当时, 对应点云取样分布于三个相邻平面的情况。
通过这几种情况的分析, 筛选出分布于同一平面的情况, 即得到拟合成功的局部平面。通过此局部邻域点云所构成协方差矩阵的最小特征值λ3, 确定出此类平面的法向量珗n= (A, B, C) , 得到平面方程:
并且平面经过质心μ, 以此作为最小单位的平面基元, 最终确定参数D, 得到近似平面P。
2 基于区域增长的分割
区域增长的主要目的就是将具有共同几何属性的点云归入到同一片区域中。在确定了平面基元之后, 给定一个合理有效的区域增长判断准则至关重要。
2.1 基本概念
假设扫描得到的点云数据可用如下形式表示:
其中n与m分别为扫描线的行数及列数, i与j对应扫描点的索引号, 每个索引号对应了点云三维坐标 (x, y, z) 。
针对式 (3) 中点集, 对点云数据的平面分割进行数学化描述, 分割的最终目标即为对集合I进行有效划分, 获得一系列I的子集合{I0, I1, …, In-1, Inull}, 使得此集合满足以下条件:
此处的Ii (i≥0) 定义了点云数据的各个连通区域, 即每个相同i的区域中所有点都位于同一平面, 而当i=null时, 此点集中的所有点云不属于任何有效子平面。
2.2 区域增长模型和系数定义
为进行更加准确的数学化描述, 本文构建了区域增长模型如图3所示, 并定义了几个新的系数以便详细说明。
(1) 平面接纳强度 (PAS:Plane Accepting Strength)
点云任意点p0 (x0, y0, z0) 到平面P的欧氏距离为dp, 当前点与局部邻域质心距离为dμ, 两者的计算公式由式 (6) 和式 (7) 给出。
属于点p0处的距离dp与点到面阈值K1关系为K1 (dp) , 距离dμ与点到点阈值K2关系为K2 (dμ) , 平面归属强度即由这两者共同决定, 记作:
当这两个阈值同时满足时, 就可以接纳此点, 并根据符合阈值的程度, 为其标示出平面接纳强度PAS。
(2) 平面有效性系数 (EFP:Effectivity For Plane)
假设得到的某平面点集为P={ (i0, j0) , (i1, j1) , … (in, jn) }, 对此类点集首先进行位置的判断, 保证其为空间相邻;对每一个平面点集进行总数检验, 当总点数达到阈值Knum (thresh) 时, 记为通过此项检验。
(3) 平面合并系数 (PMC:Plane Merging Coefficient)
在平面的初步增长之后, 得到最初的平面分类结果。由于采集数据波动等带来的误差, 导致相同平面被识别成两个部分甚至多个部分, 此时需要对相邻的误差平面进行合并。
首先进行同向性判断, 即对拟合平面法向量的一致性程度进行度量。假设平面α及平面β的法向量分别为珗n1和珗n2, θ为两个平面的夹角 (如图4所示) , 可由式 (9) 得到:
同时设定阈值θthresh, 当θ比这个阈值小时, 认为这两个平面满足同向性条件。
然后进行共面性判断, 即对拟合平面在空间距离上的靠近程度进行度量。假设Lαβ为平面α与β上两点之间的距离, 计算其在平面法向方向上的投影, 得到最大的平面间距离dαβ:
为dαβ设定阈值dαβ (thresh) , 当dαβ小于此阈值时, 即认为其满足共面性条件。
当θ和dαβ均满足条件时, 说明两个拟合平面几乎平行且空间位置相邻, 那么就将这两个平面集合进行合并。
3 算法实现
在上述点云取样模型分析以及平面基元定义的基础之上, 结合分割任务进行平面的区域增长, 即给出点云数据分割算子的设计方法, 利用此算子将点云划分成具有相同几何特性的各个子集合, 最终达到分割的目的。
采用基于平面提取的点云数据分割算法对扫描出来的点云进行分割, 算法基本流程如图5所示。
算法的基本步骤以及核心算法描述如下:
步骤1选取局部邻域点集M, 构造其协方差矩阵C, 并得出特征值;
一般地, 所希望选取的局部邻域既不能太小以至于不能代表初步的平面信息, 也不能太大而导致数据跨越了过多平面组合。
步骤2判断平面基元是否拟合成功。根据点云取样分布模型的说明, 检查所得特征值关系;
若, 即符合同一平面的分布特征, 则表明平面基元拟合成功, 转步骤3;
否则, 就表明拟合失败, 重新转入步骤1;
在拟合成功的情况下, 将λ3所对应的特征向量作为拟合平面的法向量, 结合质心μ得到理论平面。
步骤3进行平面的区域增长。沿扫描线从左到右遍历点云数据, 根据上文中对区域增长的定义, 计算当前点p0到平面P的欧氏距离为dp, 与局部邻域质心μ的距离为dμ;
若dp
步骤4对得到的平面进行有效性检验。
若得到的这组平面点集满足连续性准则, 且点数Knum
否则, 对此处得到的平面点集不作标记, 仍重新转入步骤1。
步骤5对所提取平面进行平面合并系数的判断。
计算各平面的同向程度θ和共面程度dαβ, 如果θ<θthresh且dαβ
步骤6如果所有点云均已处理完毕, 则结束检测过程, 得到最终分割结果;否则, 转入步骤1, 输入新的局部邻域点集。
4 实验结果
4.1 实验设计
为了对本文分割算法的有效性进行验证并便于同其他方法进行对比, 选用了网络公共数据库———由伯尔尼大学Hoover和Jiang等人提供且被本领域众多研究者所使用[14,15]的ABW数据集进行实验。此数据为激光扫描仪所采集的包含有一些几何物体模型的场景, 扫描得到的是一组512×512的点云数据, 其中每个点包含了场景上被扫描点的距离信息。实验采用了Pentium (R) Dual CPU 2.2GHz, 2.00GB内存的PC机, 软件以VC++6.0为开发环境, MFC类库为开发框架, OPENGL图形库为基础, 有效地实现了三维信息的可视化。
将ABW数据分为两类, 其中一类为训练数据用于确定相关参数, 一类为测试数据在参数确定之后用于测试。采用本算法对训练数据进行实验, 经训练学习得到的算法参数为:局部邻域点集为100点;点集特征值反映了所在平面的起伏程度, 考虑到数据噪声对平面采集准确度的影响, 设定特征值阈值σ为1, 确定出待增长平面基元;在平面增长的过程中, 鉴于平面的一般起伏程度, 将点到面阈值K1设定为3, 最大程度地降低过分割和欠分割效果, 考虑到几何模型中一个平面的最大规模, 将点到点阈值K2为120, 这两者共同确定了局部区域内点云的平面接纳强度;观察测试数据的结果, 获得一般平面区域的最少点数, 将Knum (thresh) 定为1 000点, 即超过这么多点数即满足平面有效性检测;同向性条件θthresh设定为5°, 共面性条件dαβ (thresh) 设定为2, 同时小于这两个阈值时即满足了平面合并的条件。最终, 为不同的平面区域以不同的灰度来标示区分, 得出数据的分割结果。
4.2 结果分析
图6显示了利用本文提出的算法进行点云数据分割后的结果, 其中第一行为原始数据图, 第二行为分割的结果图。由结果图可见, 本算法能有效地进行点云数据的分割, 检测出场景中物体的各个平面, 大部分平面区域定位准确, 能清晰地识别出边缘部分。
将本算法的分割结果与ABW数据库中提供的Ground Truth图像作对比。由对比可知, 本算法对所测试数据库中场景平面的提取率达到98%以上, 对可见面上平面提取的准确率达到95%, 而无论场景情况或者采集视角情况如何, 总是能将场景的水平平面和竖直平面相对准确地提取出来。
数据的采集是激光扫描仪扫描得到, 所以由于采集角度、传感器精度等问题, 带入了一定的观测噪声。本算法采用基于平面提取的方法, 能有效地降低局部噪声的影响。从实验结果图显示, 能有效地抑制散乱噪声的影响, 具有较强的抗噪性能。在算法测试的过程中, 对多组数据进行了测试, 测试结果也表明本算法能适应不同场景下的分割工作, 具有良好的鲁棒性。
为进一步客观评价本算法效率, 又与经典的UB算法作了对比, 分别将这两种算法在相同配置的Windows平台下实现, 对比可知本算法在计算速度上占了明显的优势。通过理论分析, UB算法从行列以及45°对角线方向作四次运算后筛选整合得出最终结果, 而本文算法从一个局部邻域开始, 只需作简单的阈值判断和平面增长就可得到较满意的分割结果, 所以本算法在计算的速度上优于前者。如表1所示。
5 结语
本文提出了一种基于平面提取的点云数据分割算法, 对场景中的平面基元进行了深入研究。在确定平面基元的基础上, 构建相关的平面增长模型。通过定义三个区域增长系数, 融合点云与平面基元的相应关系, 有效地实现分割过程。实验结果表明, 基于平面提取的点云数据分割算法改善了分割效果, 明显地降低了处理数据的时间, 且具有较高的抗噪性与鲁棒性。基于本算法的分割方法在无人化气压沉箱的操作过程中为场景的重建工作奠定了基础[1], 在文物保护及城市场景三维建模等方面也具有良好的应用前景。下一步工作将深入研究多尺度的平面检测方法, 针对不同规模的场景调整出不同的阈值, 以利于更准确地确定出不同尺度场景中的平面区域, 从而在一定程度上改善平面相交处的欠分割和过分割比例, 并根据不同尺度的标示结果对分割场景进行一定程度的识别。
点云数据提取论文 篇2
随着我国城市现代化建设进程的加速和信息技术的不断发展,数字化城市管理被日益重视,建立数字城市的三维模型在城市规划、三维地图、智能交通、城市监控、应急指挥等领域占有重要地位,而且随着城市信息化程度的提高,城市场景的三维模型也将得到更加宽广的应用,因此建立数字化城市的三维模型对于我国的现代化发展有着极其重要的意义。一方面城市建设进展越来越快,另一方面传统城市三维建模手段效率低下,其技术瓶颈问题越来越凸现,因此,寻求一种新型、高效的三维快速建模手段,克服数字城市建设的困难,为城市规划、设计、管理和决策分析提供重要支撑,其意义和价值不言面喻。机载激光雷达技术(LIDAR)已被看作是提取城市建筑物三维模型的重要途径之一,靠它可以迅速获取城市数字表面模型,进一步处理可提取出城市建筑物三维模型。文章对已有的机载激光雷达提取建筑物的算法进行了解析,并介绍了一种适合大规模、精度要求不高的快速提取建筑物的算法。
1 激光雷达技术
激光雷达(Light Detection and Ranging,LIDAR)是依据反射时间的激光扫描仪。LIDAR作业时是依靠发射的激光脉冲在物体表面反射后被接收,通过计算两者的时间差,就能够获取物体表面与激光器之间的距离。依据物体表面与激光器间的距离、飞机的位置和飞行姿态,就可以解算出物体表面的三维坐标信息。目前,激光雷达所能获得的物体采样点横纵坐标的精度大致20厘米和10厘米左右。通过将激光雷达与载体相结合,可以高速、准确、清晰地获取物体表面大量采样点的空间坐标信息。这种设备被称为激光扫描仪。目前,欧美等国公司推出的扫描仪主要有Optech、Top Scan、Top Eye、Saab、Leica ALS、Topo Sys、Hawk Eye等。这些LIDAR设备具有工作速度快、精度高的特点,其可以每秒采集到成千上万个采样点。当中一些扫描仪还能够快速地获取距离比较远的物体表面(千米之外)的采样点空间坐标信息,但这都是大功率设备,比较笨重不方便于人携带。对于一些较轻,容易携带的激光雷达设备其获取采样点空间坐标的速度相对较缓,并且不能远距离工作。
激光雷达系统(LIDAR),主要有激光器、全球定位系统和惯性导航系统以及高分辨率数码相机四部分组成。该系统能够达到实时、迅速、精确获取物体空间坐标信息的目的,并结合摄影技术获取的照片,通过计算机构造技术来提取大型物体或区域目标的三维数据模型,再现真实物体的空间形状。激光雷达系统的高程测量原理是依据激光扫描仪的发射脉冲与接收脉冲的时间间隔、飞机的空间位置坐标以及飞机的飞行姿态信息解算出目标物体的空间坐标和高程。当前的机载激光雷达地面扫描密集情况为每平方米0.5到3个数据点,点云数据的高程误差取决于全球定位系统的精度,最小可达到20cm内,水平误差微乎其微。基于激光雷达点云数据的高密度和高精度特点,可以获取数字高程模型(DEM)、数字表面模型(DSM)、数字城市模型(DCM)等数据产品。
随着“数字城市”的深入,寻求自动化采集三维城市数据技术手段是数字城市建模的核心任务,除了可以利用传统的数字摄影测量技术外,基于激光雷达较高的角度辨析功能、距离辨析功能以及抗干扰功能,激光雷达技术可以扮演快速获取地表物体的高精度三维空间位置等信息角色,因此从激光扫描测距数据直接提取建筑物的三维信息成为重要的技术手段。目前可以采样的激光点密度很高,对于较高的激光点不仅能过滤出建筑物的近似形状,还能拟合出平面屋顶,从而能获得正确反映屋顶形状的模型。
2 依据激光雷达点云数据分离建筑物的进展分析
利用LIDAR点云数据自动提取建筑物可归结为两种,一种是直接利用机载激光雷达系统获得的点云数据分离出目标建筑物,一种是结合激光点云数据和其它有关测量数据提取出目标建筑物,像结合航拍影像、高分辨率卫星影像等分离建筑物。国内外对于利用机载激光雷达点云数据提取建筑物已经进行了大量的试验和研究,并且提出了许多不同的提取方法,以下分析一下近些年在这两方面提取建筑物的试验方法。
2.1 依据LIDAR点云数据快速分离建筑物的研究近况
依靠单一的激光雷达数据来滤出建筑物,一般采取滤波和重采样的办法来分割激光雷达点云数据,从而从繁杂的地物中将隶属建筑物的点云过滤出来。对此普渡大学Alharthy团队提出了依据两次回波信息的渐进滤波方法直接从LIDAR点云数据中分离建筑物。该方法主要是依靠激光能穿过一些物体的特点而设计出来的。从LIDAR系统中发射的激光,碰到可以被穿过的植被等地物时会发生两次回射波,能够测得两个激光距,而碰到穿不过的地物时则仅有一次回射,只能测得一次激光距。建筑物边缘也具有两次回波特点,利用这一点,可以通过滤波方法粗略地得到建筑物区域,但该区域还包含一些浓密植被区域等噪声。为此他们又运用局部方差统计的方法去除该区域内的植被等噪声,从而提取出地面数字高程模型。由于建筑物的点云数据高程值要比其它地物高程值要大的多,因此采用设置阈值的方法从而粗略的分离出建筑物点云。[1]代夫特大学Vosselman团队提出了采用三维霍夫变换(Hough Transform)算法和狄洛尼三角网算法从激光雷达点云数据中快速分离建筑物。该方法预先采取Hough Transform直接分离出建筑物每一个平面,接着利用每一个平面内的点构造狄洛尼三角网并算出每个平面面积,然后设置一定的面积阈值分离出建筑物的实际平面。这两种建筑物提取方法的共同点是高效、快速,但对激光点的密度要求较高,实验结果证明,提取的建筑物精度与激光点密度成正比。[2]
近些年,我国也加大了对LIDAR扫描系统研发的投入,尽管研发了国产的LIDAR扫描系统,但是受制于扫面系统核心部件的制约,激光点密度普遍低下,最高也仅有3-4m2,因此所测得的点云数据比较稀疏,对此中国科学院遥感应用研究所的尤红建等人对稀疏激光点云提取建筑物进行了研究,并取得了初步的成果。该方法预先通过对激光雷达点云设置一定的高度阈值和距离阈值实施内插处理进而过滤出隶属同一建筑物的点云。针对同一座建筑物的全部点云,还需将建筑物边缘的那部分点云提取出,以得到建筑物的大致形状和位置。为此专门针对城市数字地面影像,提出顾及图像均方差的自适应迭代阈值分割算法,来提取建筑物的边界线。该过滤算法只能得到粗略的建筑物模型,得不到比较规格化的建筑物模型,因此又针对边缘点进一步做了规格化处理。基于临近的边缘点方位角的改变将边缘点准确分组是轮廓规格化的前提,然后按照每组内的边缘点解算出该边界线的最恰当的方向角和位置角。找出建筑物的主干方位是确保分离出的建筑物正确与否的关键,由于建筑物的主体分布状况受主干方位制约。在划组求取出的方向角和位置角基础上,将建筑物的主干方位设定为拟合时残差值最小且线段长度较长的直线方向。接下来,就能够凭借建筑物的性质做外形的规格化处理。实验结论说明该方法针对长方形建筑物、U型建筑物的提取效果是非常好的。[3]
2.2 融合激光点云数据和影像数据提取建筑物方法研究状况
虽然激光雷达点云可以解算出地物的高程和方位信息,但得不到地物的外貌等直接信息。而多光谱影像具有光谱、纹理和形状等信息,将点云数据与光谱影像融合使用,可以极大地提高提取目标物的精度和效率,在提取建筑物模型中普遍使用。根据数据和多光谱影像侧重程度的不同,这类研究可以分为以下两类:以数据为主和以多光谱影像为主。
(1)以数据为主的研究主要先利用地物点云中的高程信息将建筑物和高大植被从数字表面模型(DSM)中提取出,再参照影像数据分离这两种地物。东京大学GUO TAO团队针对树木和建筑物分开困难,提出了组合高分辨率卫星图像和雷达点云数据来分离城市建筑物的办法。该方法预先按照高分辨卫星图像提取出NDVI指数,接着依据NDVI指数将草坪、裸露地表和建筑物分离开来;再依据LIDAR点云提取出的数字高程模型(DEM)和原始的LIDAR点云生成的DSM就能建立规格化后的DSM,最后将DSM模型做分割处理就得到了建筑物DSM点云。该方法只能粗略提取建筑物点云。南京大学的陈磊等人(2011)对激光雷达点云数据融合光谱信息提取建筑物也做了探究,他们提出一种融合机载激光雷达数据和高分辨率遥感影像来提取城区建筑物的分层分类算法。该算法主要利用原始点云数据进行内插处理提取出DSM,通过与提取出的DEM做差值运算得到规格化后的数字表面模型(n DSM),并基于对扫描区域的先验知识,选取研究区的最小建筑高度作为阈值滤除部分地面物体。接着,将高程滤波后的n DSM采用区域生长算法划割成彼此不重复的区块。最后,采用基于归一化植被指数(NDVI)的方法和基于空间关系的方法将夹杂在建筑物里的树木过滤掉。该算法提取建筑物的效率达到了90.20%。[4,5]
(2)以多光谱影像为主的方法与常用的影像提取建筑物的方法类似,首先基于多光谱影像提取建筑物的边缘信息,再按照数据中的高程信息将建筑物与道路分离开。德国Martin团队对此进行了尝试。他首先采用图像处理方法对航空影像进行处理,得到同类区和灰度变化的边缘。再结合LIDAR数据就能够提取出建筑物模型。实验证明该方法适合于平面楼顶、尖型楼顶及组合楼顶的提取。尤红建和张世强(2006)则提出了自适应的Canny边界提取算法来提取CCD影像上的边界线;程亮和龚健雅(2008)借助机载激光雷达扫描数据估算建筑物概略主方向,并在该方向的限制下,自动、鲁棒地检测出建筑物的方位和建筑物的边界线。[6,7,8]
3 基于数学形态学的激光雷达点云数据自动提取建筑物的研究[9]
生活中,许多时候对建筑物模型精度需求不太高,但对点云数据处理时速度需求却很高,需要在短时间内计算大量点云。基于数学形态学算法适合计算机进行大数据计算,通过限定建筑物轮廓,能够迅速建立起建筑物空间模型。这种方法对于处理大量点云数据、提取精度需求不高的建筑物情形非常合适。鉴于此,我们基于数学形态学的算法对大范围点云数据提取建筑物空间模型进行了探究,并取得了一定的成果。
3.1 提取建筑物区域的基本轮廓
首先采用滤波算法对激光雷达原始点云进行过滤处理,将点云数据中的地面点与地物点分开,从而提取出数字地形模型(DTM)。自动提取建筑物的首要任务就是获得正规化数字表面模型(n DSM),为此我们依据Top-Hat变换原理,将DSM与DTM做差去除掉DSM中比较暗的点云,因为暗的区块一般为地面点,这样即过滤掉了较大的地面区块,从而得到了规格化的n DSM。余下的点云中除建筑物外还含有少量的高大植被和一些矮小的土堆等噪声。为了滤除那些低矮噪声,可根据建筑物的高程信息,通过设置一定的高度阈值的方法去除这些低矮噪声,低于该阈值的点认为是噪声点。为了剔除植被等噪声,将利用高程阈值过滤的结果视为二值图像,利用二值形态学中的开运算和闭运算级联使用搭建双边滤波器对二值图像进行双边滤波,通过设定恰当的结构元素滤除植被等噪声同时还能补足建筑物区块中因偏差引起的空洞。至此粗略的提取出了建筑物区域的基本轮廓。
3.2 建筑物三维模型提取
经上面横、纵双向滤波后,建筑区域的基本轮廓就提取出来了,现我们将每栋建筑都视为是有多个底面边界为多边形的柱体构建的子建筑的组合体,每个子建筑被视为一层,则此时的建筑物的粗略轮廓就是由多“层”子建筑组成的最大边界轮廓。假如用它近似取代整座建筑物,则在后续建立模型时会引起很大偏差。鉴于此,在提取多层建筑物时可根据三维点云数据求解出其“层”数和每“层”的高程信息。然后依据每层的点云数据,分别对各层子建筑物进行边界提取。此时提取得到的边界尽管能反映子建筑物的大致轮廓,但具有一定的边界误差。为减小边界误差,又对边界点云做规格化处理,得到规则化的建筑物边界。该边界形状为直线段组合而成的多边形,根据多边形顶点处点云数据可以求解出建筑物边界矢量及其高程值。由于可能某边界线上所有顶点的高程值大小不同,所以将该边界线上所有顶点的高程均值设定为此边界的高程值。故此该子建筑物的三维模型应是由底边边界矢量与其对应的高程值生成的柱体。鉴于上述分层处理,可以建立起每个子建筑物的空间模型,然后经过多“层”数据处理的叠加整合,最终得到该区域的建筑物矢量模型。
图1为三维显示的所提取成都市区的建筑物群。从图1中可以看出提取出的大部分建筑物的模型都是规则的。这是因为该提取算法,已经约定了建筑物的几何形状,从而使建筑物的提取变得容易了,也就使模型提取速度加快了,但这也使得模型精确度降低了,因此,该方法适用于对提取模型精确度需求不高、大规模、自动、快速的建筑物三维模型提取,不适合建筑物三维精准模型提取。
4 结束语
鉴于上述分析,可知激光雷达系统在城市建筑物的自动提取领域扮演着越来越重要的角色,对于建筑物的提取,一些学者又根据建筑物自身的特点、点云数据的几何特征以及结合其他影像数据等方面进行探讨。尽管当前激光雷达系统的数据处理软件方面的开发相对滞后于系统硬件的发展,目前提出的算法都有其不足之处,使其在追求快速性的同时失去了精确性,追求精确性的同时又失去了快速性,在某种程度上限制了其应用。但是伴随遥感技术的快速进步,多源数据融合技术的不断进步以及数据处理算法的逐步完善,机载激光雷达技术一定会在未来的航空遥感领域处于核心地位。
摘要:伴随遥感技术的不断进步,激光雷达技术早已普遍应用到城市数字化处理中。激光雷达技术因其在测距方面占有优势,因此在城市建筑物提取中做了大量的实验,而且取得了重大成果。文章主要概述了机载激光雷达的发展状况以及机载激光雷达点云数据提取建筑物的最新研究进展,同时也尝试了一种适合大规模、快速、对精度要求不高的建筑物提取方法。
关键词:激光雷达技术,建筑物提取,研究进展
参考文献
[1]Abdullatif Alharthy,James Bethel.Heuris-tic Filtering and 3D Feature Extraction fr-om LIDAR Data[A].In:ISPRS Commission III,Symposium 2002[C].Graz,Austria:2002,Sept-ember,9-13:A-29.
[2]Vosselman G and Sander Dijkman.3D buil-ding model reconstruction from point cloud and ground plan[J].International Archives of Photogrammetry and Remote Sensing,2001,XXXIV-3/W4:37-43.
[3]尤红建.基于三维遥感数据的快速处理与建筑物提取研究[D].中国科学院遥感应用研究所,2001,5.
[4]Guo Tao,Yoshifumi Yasuoka.Combining hi-gh resolution satellite imagery and airbor-ne laser scanning data for generating bare-land and DEM in urban areas[A].In:Intern-ational Workshop on Visualization and Anim-ation Of Landscape[C].Kunming,China:2002,26-28 February,XXXIV Part:5/W3.
[5]陈磊.基于机载LIDAR和高分辨率遥感影像的城区建筑物提取研究[D].南京:南京大学,2011.
[6]Martin Huber,Wolfgang Schickler,Stefan Hinz,Albert Baumgartner.Fusion of LIDAR dat-a and aerial imagery for automatic reconstruction of building surfaces[A].In:May 2003 2nd Joint Workshop on Remote Sensing and Data Fusion over Urban Areas[C].Berlin,Germany.
[7]尤红建,张世强.组合CCD图像和稀疏激光测距数据的建筑物三维信息提取[J].光学精密工程,2006,14(2):297-302.
[8]程亮,龚健雅.LIDAR辅助下利用超高分辨率影像提取建筑物轮廓方法[J].测绘学报,2008,37(3):391-399.
点云数据提取论文 篇3
逆向工程(RE,Reverse Engineering)是产品迅速开发过程中的重要支撑技术之一,根据测量方式的不同,分为接触式测量和非接触式测量。非接触式测量方法数据获取速度快、精度高。然而,在快速获取被测物体表面信息的同时,由于被测对象的复杂性,其测量数据密集而无序,并且随着激光扫描技术的不断提高,采样点精度达到亚毫米级,也因此产生了大量冗余数据,降低了点云三角网格化和曲面重构的运算速度,特别是在被测曲面的曲率较小处,点云过密可能会影响其光顺性。因此,在保持被测物体几何特征的同时,简化点云数据是十分必要的。
1 点云数据简化
简化数据的原则是在保证一定的信息损失限度内,花费尽可能短的时间,最大限度地减少原始数据,以达到压缩数据的目的。
(1)三角网格数据进行简化
人们在研究空间散乱点的三角剖分的同时,提出了三角网格简化问题。三角网格的简化是指在保证三角网对形体表面的逼近精度的条件下,删除对模型特征影响相对较小的几何“图元”(点、线、面),以达到减少三角形片数量的目的[1]。1992年,Schroeder提出了顶点删除的网格简化方法,此后基于边折叠、三角形折叠等几何元素删除的方法被相继提出。
(2)对原始点云直接进行简化
这种方法比较直观,是以两测点间的最短距离建立优先队列,用d(X,Y)表示两个测量点集X和Y间的Hausdorff距离,即X和Y中最近两点间的距离。如果满足d(xi,X-xi)≤d(xj,X-xj),(j=1,2,…n(j≠i))则删除点xi,直到数据点集达到预先指定的个数[2]。
由于这种采样方法不考虑点云的形状特征,无法很好地保留曲率剧烈变化部分的细节,平坦部分的数据冗余仍然存在,所以我们希望有一种方法能够使简化后曲面曲率较小的区域分布较少的点,而曲率较大或尖锐棱边处保留较多的点。
2 保留边界的点云简化
许多算法中没有进行针对边界点的检测,当点云数据包含边界时,边界点可能丢失,从而影响后续的曲面重建。文献[3]认为如果数据点Pi的k邻近点偏向一侧,则Pi就为边界点。本文以此为根据,提取出点云的边界数据,并保留所有边界点,然后通过设定一个合适的曲率阈值并兼顾邻域内已保留点的情况对非边界点进一步简化,这样在平坦区域保留较少的点,在特征区域保留较多的点,既能降低特征信息的损失,又保证了足够的精度,同时输出的点集也不会产生孔洞。
2.1 数据点的k邻域检索
随机扫描方式下的原始点云呈现散乱状态,没有规律性,简化前一般需要先求出点云的k近邻信息,建立拓扑关系。由于点云数据量极其庞大,如果直接计算一个点到其它所有点的距离再按距离排序取前k个,计算太过复杂,而从直观来看,假设Pi点的第k个近邻点到它的距离为d,则Pi点所有近邻的X、Y、Z坐标与该点相应坐标的差都不能超过d,也就是说,一点的所有近邻的每一个坐标都应该处在该点相应坐标的邻域内,当分别将X、Y、Z坐标排序,然后再用一个适当的距离阈值分别取得三个序列中位于该点前后的点,得到的点集必然包括了它的k近邻[2]。
2.2 曲率估算
曲率表明了曲线偏离直线的程度,而曲面上一点的曲率则反映了曲面在该点处的弯曲程度。空间数据点的曲率计算常采用稳定性较好的CT(Coordinate Triangulation)法。CT法的基本思路是利用数据点Pi的k邻近点进行局部抛物面S(u,v)=(u,v,au2+buv+cv2)拟合,由抛物面的主曲率及其主方向,来确定该数据点的曲率特性[5]。
3 算法步骤
(1)k邻域搜索:读取点云数据的坐标以及索引,将点云的XYZ坐标值分别从小到大排序,并以此相应调整点索引;以X(i)为中心,前后每隔num个点计算一次到i点的距离,给定一个距离阈值DISC,小于DISC的点就把索引存入一个临时数组,同理,将该中心点YZ方向上小于DISC的点索引分别存入另两个临时数组;最后,只保留三个临时数组中的共同点,并计算这些点到i点的三维距离,取值最小的k个点为i点的k近邻。值得注意的是,边界点的邻近数有可能小于k。
(2)边界点的提取:求出Pi点的k邻域后,用最小二乘法构建曲面在Pi处的近似切平面,并将Pi的近邻点投影到该平面上,然后过Pi点作平行于坐标轴平面xoy、yoz、zox的平面xpy、ypz、zpx,并计算出位于这三个平面两侧的点数,只要其中一个平面的两侧点数差与k的比值大于一定的阈值f,该点即为边界点。
(3)曲率估算
1)在点Pi处建立局部坐标系(u,v,h):坐标原点设在Pi处,拟合平面的法矢珗n为h轴,在平面内选择任一投影点与Pi相连作为u轴,垂直于u轴方向为v轴。
2)投影点的参数化:将投影点与Pi相连,得到k条有向线段,把这些线段分别与u矢量作点积记为dj,并记最大值为dmax,通过求出各投影点的u参数值。用类似的方法得到各投影点的v参数值。
3)用坐标转换后的k个邻域点拟合抛物面S,得到抛物面在点Pi处的曲率特性,求出的高斯曲率K=4ac-b2,并将所有点的高斯曲率求平均,作为曲率精简的阈值。
(4)非边界点简化
1)用步骤(2)的方法判断一点是否为边界点,是则保留,不是跳至下一步;
2)将该点的曲率与阈值比较,如果小于阈值跳至下一步,如果大于阈值则考虑该点的k近邻中已保留点的情况,若小于期望的简化比例h则保留该点,否则删除;
3)判断该点的k近邻中有没有保留点,没有则保留该点,有则删除;
重复执行上述步骤,直至遍历点云的所有点。
4 实验计算结果和分析
计算程序采用VB6.0在P4 3.0GHz、内存1G的计算机上实现,使用的“Stanford Bunny”点云数据,是斯坦福大学计算机图形实验室使用Cyberware MS3030扫描仪得到的。为了更好地验证基于保留边界点的精简方法是否能达到预期效果,这里将Bunny点云割出前半部分,以外轮廓作为模型的边界。
图1(a)截取了兔子的耳朵,(b)为边界提取后在Auto CAD上的效果图。图2对整个兔子模型进行简化处理,(b)是在保留边界基础上根据曲率进行简化的效果图,同时,出于比较的目的(c)采用文献[2]的算法,将最后保留的点数调至与本文算法相近。表1给出了具体参数。
对比实验的几幅效果图可以看出两种算法都完成了简化的任务,但文献[2]的算法点云分布均匀,无法突出特征区域,并且边界缺失严重;而本文算法边界清晰,能够较好地表现模型的特征。然而,我们发现在一些曲率变化较大的地方,这些特征点被误认为是边界点而完全保留,没有按预期的要求进行精简,而一些曲率变化较小处的边界容易被忽略,或者得到的边界较宽,需要进行细化处理,这说明算法有待改进。同时,实验也证明本文使用的单坐标轴k邻近搜索方法快捷有效,减少了最后参与计算三维距离的点数,提高了效率。
5 总结
通过实验可以看到,保留边界点的非均匀简化算法避免了当点云数据包含边界却没有进行针对边界点的检测,造成边界点丢失的情况,并在保留所有边界点的基础上结合曲率阈值与k邻近中保留点的比例对点云进一步简化,保证了原始特征信息,同时输出的点集也不会产生孔洞,虽然还存在遗漏和误判的情况,但是总体说来算法在保证模型重建所需信息的前提下,能够对点云数据进行直接、有效的精简。值得一提的是,本文使用的边界点提取方法并不能区别模型本身的孔洞或是点云的缺失,在进行点云三角网格化和曲面重构之前,需要用人工交互的方式对提取出的边界进行选择性的修补。
摘要:逆向工程中点云密集而无序,大量的冗余数据为后续的数据处理工作带来困难。本文采用单坐标轴搜索方法快速确定点云的k近邻信息,然后在保留所有边界点的基础上,结合测点的曲率特征以及k邻域内保留点的情况对点云进行非均匀简化。由实验结果表明,该算法对边界点具有较强的识别能力,能够在快速、有效地简化点云数据的同时保持原始特征的信息。
关键词:散乱点云,单坐标轴搜索,边界,曲率
参考文献
[1]吴捷.基于网格简化的细分曲面拟合技术研究[D].苏州:苏州大学,2008.
[2]袁夏.三维激光扫描点云数据处理及应用技术[D].南京:南京理工大学,2006.
[3]黄文明,肖朝霞,温佩芝等.保留边界的点云简化方法[J].计算机应用,2010,30(2):348~349.
[4]贺美芳.基于散乱点云数据的曲面重建关键技术研究[D].南京:南京航天航空大学,2006.
点云数据提取论文 篇4
关键词:LiDAR点云,提取,地形特征点,水文模拟,简化
0 引言
特征线通常用于定义溪流、山脊、海岸线、地基、大坝等模型表面高程突变的地方。地表模型中,特征线相当于是两种不同地表类型的边界。例如,一个光滑地表面遇到湖岸时突然被中断,特征线两边地表都很平滑,但是坡度变化剧烈。特征线可以描述出起伏不定、形态复杂的地形骨架结构,能揭示地貌形态的本质,对地貌综合和水文分析有着重要的意义。将特征线保留和整合到DEM的生成中,能显著地获取可靠的、形态学上正确的,水文上增强的DEM。此外,特征线在DEM简化过程中扮演了重要角色,DEM中如果嵌入有特征线,表达地形信息的点数量就可以减少。
1 基于不规则三角网提取地面特征点
Arc GIS中TIN表面数据模型由结点、边、三角形、包面和拓扑组成。利用TIN node,以最少的数据点模拟各种地形结构,如山脊线和山谷线。TIN要素的组织和管理,涉及地理对象及其特征之间的空间关系、关联关系、依赖关系等,是关系表之间连接的基础。专业空间数据模型Geodatabase,能更方便地表达空间要素和属性要素,更清晰地模拟要素间的作用和行为[1]。
不规则三角网数据模型的设计,会影响后续算法的灵活性,从而决定建模的水平。本文的数据模型设计就是为了更好地表达不规则三角网要素数据集的空间位置、属性信息及其空间关系[2]。针对不规则三角网的每个顶点Pi,可以依据不规则三角网特征提取算法的要求,将每一个顶点和其空间邻接的三角面内 ( 见图1) 的坡度、坡向、法向量等信息关联起来,以三角面△ABPi为例,关联示例见表1。
在不规则三角网要素数据集的逻辑设计中,以原有的点要素集为基础,根据不规则三角网所包含的性质,增加了三角面要素集、三角节点要素集。三种要素集通过Point_ FID、Node_ FID和Triangle_ FID来建立如图2所示关系,目的是把基础点数据与TIN的三角网相关联,从而实现TIN中结点和三角面的遍历。
2 基于地表流水物理模拟方法提取粗略的矢量地形特征线
地形特征线的提取等同于河网中分水线和汇水线的提取,一般是利用水文河网分析的方法提取山脊线和山谷线。本文主要基于Arc Hydro做地形特征线提取,与Arc Hydro相关的一个重要的前提是同时使用格网和矢量方法来拓展河流网络。这两种方法的长处在于格网层可以确保排水,矢量层定义特征之间的关系[3]。
基于DEM的水文模拟分析的方法应用很普遍,其主要原理是在自然表面上,雨水总是沿着最陡的方向从高处流向低处,并在下游不断汇集。首先逐一计算出每个格网点的汇水量,并根据汇水量逐渐递增这一原则判断出在山脊上点的水流是不累积的,即得到分水线; 与之相反的是在山谷线上的点的水流累计不断变大,即汇水线[4]。以此来逐步识别地形特征点,可以用来跟踪山脊线和山谷线,提取原理分别类比于分水线和汇水线。即所在位置的高程值越大,相应位置的地形特征线上的汇水量就越小; 相反,高程值越小的位置,地形特征线上的汇水量越大。由于地形噪音的存在,导致位置较高区域的非地形特征点线上的点部分遗漏,主要是因为汇水量较小,而在位置较低区域的非地形特征点线上的点有比较大的汇水量,导致误将其认为是汇水线上的点[5]。
针对原始DEM数据做洼地填充后,利用地表径流模拟计算,生成的栅格水流方向只具有流出方向而不存在流入方向,也即栅格的汇流单元值累计为0。提取栅格图像的0值,就可得到山脊线[6,7]。山谷线的提取需要利用反地形原理,在栅格计算器中用一个很大的数值减去原始DEM数据,会生成与原始DEM地形刚好相反的反地形DEM,反地形DEM中原先的山脊变成山谷,而原来的山谷变成山脊。此时,同样使用提取山脊线的步骤,就可以提取山谷线[8]。具体流程如图3所示。
栅格模型中,地形特征线是由单元分辨率决定的,在地形的表达中,栅格单元的固定尺度会产生误差,因此不能很好地表现地形特征。用矢量数据和TIN对地形特征线表达可以提高几何表达精度。如果使用栅格和矢量结合的方法,通过矢量对栅格表达不足的调整,可以确保山脊谷线位于山脊谷轴线上,最大限度减少地形特征表达的问题。
粗略的矢量地形特征线的生成过程可以调用水文分析工具在Model builder实现建模提取。其中,使用Fill工具将洼地填平,采用Flow Direction工具计算水流方向,采用Flow Accumulation计算汇水量,使用Raster Calculator提取符合条件的栅格区域,最后使用Raster to Polyline工具生成矢量山脊谷线。
3 算法实施
算法的基本思路是: 1将点云滤波后的地表模型数据转换为栅格图像; 2采用水文工程学中常用的地表流水物理模拟方法提取粗略的矢量地形特征线; 3对矢量地形特征线做缓冲分析,提取缓冲区域内Li DAR点云数据,并构建TIN模型; 4提取TIN的节点,通过筛选法来精确确定区域的地形特征点,最后人工连接成地形特征线。
GIS中缓冲分析可以处理山脊线和山谷线,生成山脊线和山谷线缓冲带,然后提取缓冲区域内的Li DAR点云并构建TIN,遍历TIN的每个节点,并寻找包含当前节点的所有三角面,取出构成三角面的所有三角点,将当前节点和周边的三角点构成如图4所示的O-A-B-C-D点集,作为一个处理单元,其中实线为穿过的概略山脊线。
考虑到Li DAR点云密度的大小,本文作如下两条规定,将特征点分离出来:
规定1: 沿着概略断裂线升降的方向 ( C-OA) ,如图4所示,若A点高程值最大,则山脊点为A; 反之,则山脊点为C。
规定2: 当前节点 ( O点) 的高程值若是最大则属于山脊点; 如果是最小则属于山谷点。
具体算法思路: 为了得到山脊线变化的趋势,首先对缓冲带内点云按高程值从大到小排序,依据排序的序号,利用空间邻接关系得到多边形处理单元。读取多边形处理单元内的中间点高程值和轮廓点高程值,一种情况是如果中间点高程值最大,则判定为山脊点; 另一种情况是当多边形处理单元内包含了上一个多边形处理单元中的最高点时,若是中间点高程值为第二大,也可判定为山脊点。若是山谷线,排序时从小到大,其它处理相同。技术流程如图5所示。
4 结果分析
本文采用的数据为占地约120公顷的480万个数据点。研究区位于西华盛顿附近的奥林匹亚,原本旨在研究森林管理方案的影响,先采集了大小为1∶ 12000的彩色航空摄影,后来使用安装在直升机Top Eye Li DAR系统收集 该研究区 的地形数 据[41]。表2中列出了数据采集的飞行参数和仪器设置。每个返回包含的脉冲数,X,Y,高度,最低偏离角,并返回强度。使用分类好的Li DAR地面返回点创建地表模型。地表模型的点间距为1. 524m,点的个数为67万。
针对研究区域,基于栅格图像的流水物理模拟方法提取的山脊线特征不明显,而山谷线特征明显。本文采用地形特征明显的山谷线构建缓冲带,缓冲带内的山谷点集如图6所示,底图是Li DAR点云数据生成的原始TIN模型。
利用Model builder和自己编写的Python脚本建模,对缓冲带点集数据的处理流程如图7所示,包括三个部分: 1将缓冲带内点数据集人工分割成若干子集; 2针对每个子集,取出TIN Triangle和TIN node做两次空间连接; 3导入数据到提取特征点脚本中,标记出最低点或者最高点。
处理后的结果如图8所示,对比之前缓冲带中的12794个Li DAR点,提取后的Li DAR点数为1939个。一方面说明本文提出的基于TIN的几何特性精确提取特征点算法可以有效识别出最低点和最高点。另一方面,基于栅格图像的流水物理模拟方法提取的概略线,很大程度决定着后续特征点的提取效果。
由于Li DAR地面点误差的影响,提取的山谷点会出现个别的点,明显偏离了山谷线的走向; 有鉴于Li DAR点云密度的大小,Li DAR点不一定恰好落在真实的山脊点上,当出现图9中矩形方框内的两点,或者图中数据点含有两个走向时,很难取舍。当需要将地形特征点自动连接成地形特征线时,带来很多麻烦,需要人工判断。
5 结论
点云数据滤波方法综述 篇5
关键词:点云,滤波,离群点
1 网格滤波问题
目前网格的光顺算法已经得到广泛研究。网格曲面光顺算法中最经典的算法是基于拉普拉斯算子的方法[1]。通过求取网格曲面的拉普拉斯算子, 并且对网格曲面迭代使用拉普拉斯算法, 可以得到平滑的网格曲面。这种算法的本质是求取网格曲面上某点及其临近点的中心点, 将该中心点作为原顶点的新位置。Jones等根据各顶点的邻域点来预测新顶点位置, 该方法的优点是不需要进行迭代计算。但是上述两种方法的缺点是经过平滑处理后, 得到的网格模型会比原来的网格模型体积变小, 并且新的模型会出现过平滑问题, 也就是原有的尖锐的特征会消失。为了克服这两个问题, Wu等提出一种基于梯度场的平滑方法, 该方法区别于前述的基于法向或顶点的平滑方法, 而是通过求解泊松方程来得到平滑的网格曲面。等提出一种保持原有特征的网格曲面滤波算法, 这种滤波方法的目的在于提高滤波后模型的可信度;Fan等提出一种鲁棒的保特征网格曲面滤波算法, 这种算法基于以下原则:一个带有噪声的网格曲面对应的本原的曲面应该是分片光滑的, 而尖锐特征往往在于多个光滑曲面交界处[2]。
2 点云滤波问题
以上网格曲面光顺算法都需要建立一个局部的邻域结构, 而点云模型中的各个点本身缺乏连接信息, 因此已有的网格光顺算法不能简单的推广到点云模型上来如果仅仅简单地通过最近邻等方式在点云数据中引入点与点之间的连接关系, 那么取得的光顺效果很差。所以, 相对于网格模型来说, 对点云模型进行滤波光顺比较困难, 而且现有针对点云模型的滤波算法也较少。
逆向工程中广泛采用的非接触式测量仪为基于激光光源的测量仪。其优点在于能够一次性采集大批量的点云数据, 方便实现对软质和超薄物体表面形状的测量真正实现“零接触力测量”。在激光测量仪数据采集过程中, 噪声产生的主要因素是被测物体的位置、物体表面的粗糙度和波纹等反射特性、物体颜色和对比度、环境光照条件和测量系统的误差等。
3 点云滤波方法
对于不同类型的点云数据有着相对应合适的滤波方法。对于扫描线式点云数据和阵列式点云数据来说, 现有的三维点云数据的滤波光顺算法可以从以下两个方面进行分类:根据噪声在各个方向上的扩散方式不同可分为各向同性和各向异性算法;根据算法的复杂度分析可分为基于Laplace算子的方法、基于最优化的方法和简单的非迭代方法。各向同性算法优点是算法简单, 但对噪声和模型的尖锐特征不能加以区分, 在去除噪声的同时, 尖锐特征不能得到保持。为了区分尖锐特征和噪声各向异性算法修改了扩散方程, 在去除噪声的同时, 可保持模型的尖锐特征。这些算法需要计算大量的模型结构信息以保持细节, 因此计算量非常大。其他可以采用的滤波算法有:最小二乘滤波、卡尔曼滤波和平滑滤波等。针对于散乱点云数据, 许多相关学者也进行了深入的研究, 提出了拉普拉斯 (Laplacian) 算子、平均曲率流、移动最小二次曲面等方法。
4 点云滤波中的离群点检测
离群点检测问题越来越受到重视, 出现了很多有效的算法, 本节将分别介绍基于统计的方法, 基于距离的方法和基于密度的方法。
基于统计方法的离群点检测基本思想为:对于整个点集来说, 假设其分布符合某种统计模型, 那么离群点就是点集中那些不符合该种统计模型的一些点。
这种基于统计的方法的前提假设是数据点集基本符合某种统计模型, 离群点严重地偏离这个统计模型。因此基于统计的方法具有很多缺点。首先, 这种算法鲁棒性不强, 均值$mu$和协方差矩阵$Sigma$的计算受离群点影响很大, 所以得到的模型不一定真实地反映数据分布情况。之后再用这个误差很大的分布去判断离群点, 必将导致判断的不准确。该方法的第二个缺点是对数据分布的先验知识过于依赖, 如果预先不能正确设定数据分布模型, 则检测结果会有极大的误差。
基于距离的离群点检测方法基本思想为, 通过一个点与其周围相邻点的距离来判断该点是不是离群点。这种判断方法的最基本假设是正常数据点周围存在许多距离较近的数据点;离群点远离它们的最近的邻居。
这种基于距离的方法当数据点集的密度十分不均匀时, 就会得到错误的检测结果。
考虑到基于距离的方法在数据点集的密度不均匀时容易导致离群点检测错误breunig等提出一种基于密度的离群点检测方法。该方法与基于距离的方法根本区别在于, 一个数据点的是否为离群点, 不再是一个布尔型的属性, 而是一个介于0和1之间的有理数, 这个数值越大, 该点就更可能是离群点。这个数值被称为“局部离群系数” (local outlier factor, LOF) 。
5 结论与展望
点云数据滤波问题在逆向工程、三维重建等问题中具有重要的意义。本文研究了点云数据滤波问题及离群点检测问题分析了离群点检测的三种方法。
点云数据的滤波和离群点检测问题还有很多难点没有克服, 未来的研究方向主要包括: (1) 根据目前的点云数据量越来越大, 考虑到现有计算机系统的效率, 寻找快速有效的滤波方法具有重要的意义。 (2) 随着kinect等设备的应用, 动态点云数据的滤波问题显得越来越重要。对动态点云数据开展滤波和离群点检测研究具有重要意义。 (3) 目前的滤波和离群点检测方法主要表现为无监督学习方法[3], 开展半监督和全监督的滤波和离群点检测算法研究有着广泛的应用前景。
参考文献
[1]Vollmer, J.and Mencl, R.and Mueller, H.Improved Laplacian smoothing ofnoisy surface meshes[J].Wiley OnlineLibrary, 1999, 10.
[2]罗大兵, 高明, 王培俊.逆向工程中数字化测量与点云数据处理[J].机械设计与制造, 2005, 4.
LIDAR点云数据处理与应用 篇6
1 LIDAR点云数据获取原理
LIDAR系统是一个主动传感系统, 该系统不依靠太阳光照, 其本身发射激光脉冲照射地面上的目标地面, 并通过接收激光脉冲的回波信号, 经过相应的处理直接获取地面三维数据 (见图1) 。与传统测量方法相比, 具有快速高效、精度高、数据密集高的优点。覆盖在地球上的目标如建筑物、植被及地面等都可以反射电磁波。获取地表地物的三维空间点坐标集是LIDAR系统的主要工作目标, 该系统以传感器所发出的测量脉冲到传感器接收由地表目标物反射回的脉冲回波所需的时间 (t) , 以及激光传播的速度 (c) 为依据来确定被测目标与传感器间的距离。在数据采集过程中, LIDAR传感器不断地向地面发射测量脉冲, 监控器实时地记录每束测量脉冲回波发生点的三维坐标, 这些三维点集的坐标信息就是LIDAR系统提供的主要测量结果。三维点云就是该系统所获取的数据, 它包括每一点高程信息对应的位置信息, 具有地物类别信息及丰富的目标多次回波信号及强度信息, 还包含地物对象的高程信息等。
2 LIDAR点云数据分类与DEM生成
2.1 点云数据分类
在对点云数据进行分类处理前应对数据进行检验, 剔除如特别高的点 (云或飞行中的鸟) 或特别低的点 (地面以下的点) 等错误及高程异常的点。激光点的分类是进一步处理的基础。一束激光打到地面上, 可以有若干次的信号反射, 我们既需要得到地表的信息, 也需要将这些不同地物反射的激光点数据区分开。LIDAR点云数据的分类实质是一个人机交互的过程, 需要依靠人为经验进行判断, 并分出详细类别。首先应该对自已所处理的数据有一个全面的了解和分析, 了解你所要处理的数据类型, 是平地、丘陵地还是山地。了解地形后, 就可以运行相应的参数, 该参数就是根据不同的地形类别得出的系数值, 在每个项目中都会有根据项目设定的一套针对不同地形而设置的粗分参数, 即宏命令, 例如平地、山地、梯田、养殖区等地形参数。在参数运行后进行的数据分类中, 如参数不合理, 在命令窗口中可先进行粗分参数的编辑, 然后再运行并自动化取点。数据粗分完成后要对整块数据进行全面检查, 看是否有数据丢失或异常等数据缺陷问题, 确定没有后再进行仔细编辑, 找回地面点并且尽量还原地形 (见图2) 。
2.2 DEM的生成
DEM即数字高程模型 (digital elevation model的缩写) , 通常定义在x、y域的离散点 (规则或不规则) 上, 并以高程表达地面起伏形态的数字集合, 是一种对空间起伏变化进行连续表示的方法。DEM的制作前提是地面点的精确提取, 由于地表一般为坚硬的固体表面, 激光点不会穿透, 除去由于其他原因引起的低点外, 一般认为最低层的点即为地面点。打在树上的点会被反射回去, 这样反复3~4遍直至打到地面上被地面吸收为止。通常具有明显的曲面形状的点都是地面点, 而没有形成明显的曲面形状的都是废点。当然也会有例外, 那种比较密集的灌木丛有时候看起来比较有规律, 要参照影像进行区分。利用激光点云数据生成DEM的关键是对其进行过滤计算, 即滤掉那些并非由地面点的回波信号而产生的数据, 如房屋、植被、交通工具及桥梁等, 以得到DEM。
3 点云数据的编辑处理
尽管软件可以对点云数据进行大部分的自动分类处理, 但是自动处理算法因地面的复杂性和点云数据的随机性而无法保证完全的可靠性, 因此, 自动分类完成后, 对于一些物体的交界处、植被、陡坎、建筑以及水域等比较特殊及复杂的目标仍需进行人工交互编辑。人工编辑的目的是剔除自动滤波、自动分类没有滤掉的粗差和激光点, 从而达到数据处理的质量控制目的。
设定了最适用的参数值也就得到了最省时的半成品, 但在特殊的地方如陡坎、居民地、植被茂盛区还需要用手动的方式找回地面点, 即细编辑。也就是需要不断地手动拉剖面找回地面点, 拉剖面时应从低到高, 垂直于地物拉剖面, 剖面拉的不要太宽, 这样可以直观地看清剖面。
3.1 居民地
房屋下的房基形状完整, 在能满足精度要求的前提下, 较好地保留和取舍:形状不完整的在确定地形的形状或位置时可降点保持地基完整, 较小的单独地基可以删掉。房区中的所有道路点都要保留, 房区里的围墙、树木、草堆、杂物都需去掉, 大型人为堆出来的临时性土堆可以不保留 (见图3) 。
3.2 带有低矮、密集植被和农田的平地
编辑植被时影像只能作为参考, 判断有无植被, 并通过影像来判断植被的高低, 原则是只要有植被, 能拿走的就要拿走, 如果在剖面上分析, 植被不是很高, 并且很密集, 分不出是植被点还是地面点的, 可以认为植被很低, 可以不处理, 但只要在剖面上能辨别出有高差的植被点, 就应取走。路两侧的行道树去掉, 树下有渠且形成一定规模, 则渠的点要保留 (见图4) , 无论在什么情况下, 只要确定为渠点就要保留。农田的田埂要保留, 田埂上的植被应去掉, 高出田埂的植被点尽量去掉, 如去掉后导致地形失真的, 可用降点的方法来补充。
3.3 带有植被和石头的山
石头和植被共有的地方需看清楚影像中是石头多还是植被多, 如果石头多植被少, 而且还是低矮的植被, 就可以忽略植被不处理;如果植被比石头多, 而且石头又是一些不太大的碎石, 可以将植被和石头图像一起去掉。如果是大石头, 就要保留石头去掉植被, 全部都是大石头的山就把点全部保留。山中小路要保留, 不能少点。山中存在地形的地方必须要保证地形的完整, 如沟、坎、山包等地形都需要保留。
4 结语
LIDAR技术在农业、水利电力设计、公路铁路设计、国土资源调查、交通旅游与气象环境调查、城市规划等各大领域中可以得到广泛的应用。激光雷达以其高超的性能已成为各种测量应用中深受欢迎的一种高新技术, 可以快速地完成地面高程模型DEM及数字正射影像图DOM的大规模生产, 大大提高了航测成图的作业生产效率, 减少生产环节, 缩短生产周期, 提高成图精度, 可提供更为丰富的地理信息。
摘要:机载雷达测量技术作为一种主动、快速、精确的新型遥感测量方法, 自出现以来便受到广泛关注, 其获取空间数据的后处理也已成为研究热点。分析LIDAR点云数据的获取原理及分类, 探讨Microstation的terra模块数据及LIDAR点云数据的分类处理方法。
关键词:LIDAR系统,激光雷达,数字高程模型,点云数据
参考文献
[1]于明旭, 纪志浩, 林乐胜.点云数据配准算法的研究[J].交通科技与经济, 2013, 15 (5) :122-124.
[2]赖旭东.机载激光雷达数据处理中若干关键技术的研究[D].武汉:武汉大学, 2006.
[3]马琳.基于Erdas软件对立体SAR数据提取DEM的方法[J].交通科技与经济, 2014, 16 (1) :118-121.
[4]吕磊, 邢汉发, 王叙泉.基于地面LiDAR技术的异型建筑竣工测量方法研究[J].测绘工程, 2014, 23 (1) :78-80.
[5]张汉德, 潘中杰, 别君.LiDAR系统中偏心矢量的误差分析与研究[J].测绘工程, 2013, 22 (5) :1-4.
[6]陈云, 丁思磊, 王铁军.基于Terra Solid软件的Lidar数据处理初探[J].测绘与空间地理信息, 2009 (4) :48-50.
[7]陈永枫, 徐青, 邢帅, 等.基于扫描线和虚拟格网的LiDAR点云数据非兴趣点剔除方法[J].测绘工程, 2013, 22 (6) :27-30.
基于激光雷达点云数据生成等高线 篇7
关键词:激光雷达,点云数据,等高线,DEM,DSM,高程点
随着航空摄影、卫星遥感等新技术的相继拓展,制图的工艺手段和精度都发生了巨大的变化,机载激光扫描系统(雷达)已经成为一门独立的新兴技术。机载激光扫描系统是基于激光测距技术,GPS技术和惯性导航技术这三种技术集成的一个软硬件系统,其主要目的是为了获取高精度的数字表面模型(DSM)。激光雷达点云数据就是由机载激光扫描系统得到的高精度的数字表面模型数据[1,2,3,4]。
1 利用激光雷达点云数据生成等高线的流程
1.1 坐标转换
点云数据经过处理,去除房屋、树冠等非地面点之后才是一幅可以使用的DSM数据。DSM资料准备好之后要注意本次数据更新所采用的地图投影参数椭球体是IAG75椭球还是WGS84椭球,中央经度或投影带是否一致。
1.2 点云数据重新分幅
为解决图幅之间的接边问题,需把坐标转换统一之后的点云数据按照西安1980坐标系标准分幅的图幅坐标进行重新裁切点云,形成新的图幅点云数据。
1.3 内插DEM
将重新裁切之后的点云数据可经过ERDAS进行内插形成影像DEM,格式为*.img,数据类型为DOUBLE。
1.4 DEM数据格式转换
山地丘陵地等高线自动生成效果较好,平地可将影像DEM批量转换成能进入数字摄影测量平台便于编辑的DEM数据格式,以便在数字摄影测量平台下进行DEM的编辑。
1.5 等高线的生成
1.5.1 山地丘陵地等高线的自动生成
山地丘陵地等高线的自动生成可在ERDAS,JX4,Virtuozo,Global Mapper,GeoTIN等一些软件中生成,但均应以满足用户的要求生成好的等高线为原则。
1.5.2 平地等高线自动生成
平地直接自动生成的等高线效果较差,所有不必要的微地貌均会生成小的等值线圈,因此平地在自动生成之前最好对DEM的数据进行立体编辑,编辑好的平地生成等高线与山地丘陵地的相同。
1.5.3 等高线与原图坎线的自动处理
等高线与原图坎线的自动处理可在arcgis里提取原图中的地形断裂线要素,输出地形断裂线的作用面,利用作用面搽除等高线即达到等高线遇坎自动处理断开。
1.5.4 等高线加GB
等高线如需加GB时,可在arcgis里打开属性表加入GB字段。
1.6 高程点制作
可在arcgis里提取老图中的高程注记点,按照层名属性选择“‘Layer’=‘高程点所在层码’”并导出SHP文件,利用点位和DEM数据生成新的和DEM对应得三维高程点。也可把DEM转换成制图软件内部的格式加载上去,根据DEM实时采集获取高程注记点。
1.7 等高线的后期处理
生成的等高线数据格式和数据量受到限制时,可在Geoway中抽稀等高线结点,再导出DXF格式的数据或其他类型的数据格式。
2 等高线生成后的精度校验
统计资料说明,在原始地面点云为检测基准的情况下,直接利用地面点云进行内插DEM之后,插值精度中误差在0.17 m见图1-a,对DEM进行乘常数为4.0的统计滤波处理之后的精度中误差为0.20 m见图1-b。
3 结束语
通过实践可知,基于激光雷达点云数据生成的等高线完全可以满足制图的要求,中间过程还可以在保证精度的前提下灵活的选择不同的软件和技术方法,在科技不断发展的未来,制图技术也将从低精度向高精度发展,一些新技术的应用将大大提高人们的工作效率,减轻人们的劳动强度。
参考文献
[1]张玉方,程新文,欧阳平,等.机载LIDAR数据处理及其应用综述[J].工程地球物理学报,2008,5(1):119-124.
[2]王刃,徐青,朱新慧.从机载LIDAR数据中提取DEM[J].仪器仪表学报,2007,28(增刊):273-276.
[3]祝国瑞,郭礼珍,尹贡白,等.地图设计与编绘[M].武汉:武汉大学出版社,2002.
【点云数据提取论文】推荐阅读:
数据提取与显示12-11
Eisco DiskGenius提取无法读取硬盘中的数据10-17
提取开发论文06-20
直接提取论文10-04
故障特征提取论文01-15
动态信号提取论文06-26
特征提取方法论文09-04
纹理特征提取论文11-08
自动识别与提取论文05-21
图像特征提取研究论文06-30