计算机遥感图像分类法(共7篇)
计算机遥感图像分类法 篇1
摘要:本文以锡林郭勒草原国家级自然保护区为例, 利用计算机遥感图像分类法对研究区2005年的TM遥感影像进行了解译, 并对其进行了分类精度评估, 得出 (1) 将该方法应用于景观单一、面积较大的草原地区土地利用分类中, 具有较高的精确度, 能够较好地反映土地利用类型空间分布特征 (。2) 利用该方法, 可以在较短的时间内得到较准确的结论, 具有很高的实用性。
关键词:计算机遥感图像分类法,天然草原,土地利用,分类精度
1 研究背景和思路
遥感手段以其客观、真实和快速获取地球表层信息的特点, 已成为土地利用研究的重要手段和数据来源。目前在遥感影像数据的获取方面人们常用的方法是人工目视解译法, 但随着3S技术和计算机自动分类技术的进一步发展, 计算机遥感图像自动分类法逐渐被应用到遥感影像的解译当中。利用计算机进行遥感图像智能化解译, 能快速获取地表不同专题信息。这对利用这些专题信息迅速地更新地理数据库具有重要的理论和现实意义, 是土地利用研究的一种新方法。
天然草原面积大, 景观单一, 土地利用类型较少, 采用人工目视解译法将会投入大量的人力、物力和财力。本文尝试性地使用计算机遥感图像分类方法, 对锡林郭勒草原国家级自然保护区2005年的遥感影像进行解译, 并基于所得数据对研究区土地利用现状进行了分析。
2 研究区概况
锡林郭勒草原自然保护区是我国成立最早的草地类自然保护区之一[1], 是欧亚大陆草原区亚洲东部草原亚区保存比较完整的原生草原——锡林郭勒草原的核心地带。早在30年代就引起了国内外专家学者的极大关注, 在国际上被确认为欧亚大陆最典型的草地类样板[2]。
锡林郭勒草原自然保护区位于内蒙古自治区锡林浩特市境内, 总面积为580, 000公顷, 主要保护锡林河流域典型草原生态系统、草甸草原生态系统、草原地带沙地森林生态系统以及河谷湿地生态系统的结构与功能的完整性;保护野生动物、植物、菌类的多样性, 其中对濒危物种实行特殊保护;同时还要保护和管理保护区的自然和人文景观资源[3]。保护区现有总人口39608人。
3 计算机遥感图像分类方法
3.1 一般原理
计算机遥感图像分类是计算机模式识别技术在遥感领域的应用, 它是利用模式识别技术对遥感图像上的信息进行属性的识别和分类, 从而达到识别图像信息所对应的实际地物, 提取所需地物信息的目的。
具体的说, 遥感图像是把图像的每个像元或区域规划为若干类别的一种, 即通过对各类地物的光谱特征分析来选择特征参数, 将特征空间划分为互不重叠的子空间, 然后将影像内各个像元划分到各子空间中去。假设多光谱图像有n波段, 则 (i, j) 位置的像元在每个波段上的灰度值可以构成一个矢量
X= (xi, x2, …, xn) T, X称作该像元的特征值, 包含X的n维空间称为特征空间。如果多光谱图像的每个像素用特征空间中的一个点表示, 则由于一类地面目标的光谱特性比较接近, 因此在特征空间的点会聚集在该类的中心附近, 多类目标在特征空间中形成多个点族。遥感图像分类的任务就是找到判别函数f (x) 当f (x) 满足某个条件时就把像元点划分为某一类[4]。
本文采用监督分类方法, 在分类前, 对遥感图像上某些抽样区中映像地物的类别属性有了先验知识, 即先从图像中选取所有要区分的各类地物的样本, 用于进行建立判别函数, 然后再对整个研究区域进行分类[5]。先验知识来自于实地野外考察。
3.2 最大似然法分类
最大似然法是应用最广泛的分类方法, 采用的判别函数是每个像元值每一类的概率或可能性。它的基本前提是认为每一类地物点在特征空间的概率分布都是正态分布。判别函数:
P (ωi) 是每一类) (ωi) 在图像中的概率, 在事先不知道P (ωi) 是多少的情况下, 可以认为所有的P (ωi) 都相同, Si为第i类协方差矩阵, Mi为该类的均值向量, 这些数据来源于由训练组所产生的分类统计文件。对于一个像元值x, 在哪一类的gi (x) 最大, 就属于哪一类[4]。
4 分类过程
4.1 原始图像的预处理
对2005年TM遥感影像进行几何校正、辐射校正、去噪声等处理, 最终获得一幅清晰、对比度强、位置准确的图像。
4.2 根据先验知识确定要分的类别数
通过野外考察和对图像的观察分析, 确定土地利用类型为:低覆盖度草地、中覆盖度草地、高覆盖度草地、水域、芦苇地 (沼泽地) 、沙地、盐碱地。没有进行居民点以及林地划分的原因是, 本区的居民点和林地数量较少, 该区域的林地覆盖率不高, 在分类的时候极易与草地发生混淆。
4.3 在图像上选取各类别的样本
在ENVI软件中, 打开roi tools功能即进行各类别样本的勾画, 每勾画一个图斑就是一次样本输入, 每一个类别都可以进行若干次输入, 也可以将野外考察时候GPS记录的点输入进来, 形成图斑后作为样本。每当一个类别的样本采集完毕, 就在roi name中记录类别名称, 如图1。
4.4 分类精度评估
在被分类的图像上选取一定数量的像元, 验证其是否被准确分类, 方法仍然是用roi tools功能随机抽取样本, 最后通过计算得到误差矩阵以及总体分类精度和kappa系数。选取了14678个像元, 最终得到的总体分类精度为84.43%, kappa系数为0.78, 说明分类精度很高。具体误差矩阵, 见表1。
表1显示各类别的分类准确度分别为:高覆盖度草地83.80%;中覆盖度草地84.99%;低覆盖度草地73.98%;水域98.61%;芦苇地91%;沙地86.95%;盐碱地77.26%。低覆盖度草地分类精度较其它类别低, 其原因是它与盐碱地混淆严重, 实地野外调查的结果显示:研究区北部低覆盖度草地占绝大比重, 几乎无盐碱地, 这证明在图2上北部区大量的低覆盖度草地被误分为盐碱地。
5 结语
本文利用计算机遥感图像分类方法对锡林郭勒草原自然保护区2005年的TM影像进行土地利用分类, 也是一种方法的尝试。以往人们把这种方法应用于小范围的土地利用分类当中取得了很好的效果, 但利用计算机遥感图像分类方法对较大面积的草原进行土地利用分类还很少见。本文利用该方法对面积近600, 000公顷的锡林郭勒草原自然保护区的TM影像进行土地利用分类, 并通过与实地对比对其进行了分类精度评估, 同时和目视解译的结果进行对比后得出: (1) 将计算机遥感图像分类方法应用于景观相对比较单一的较大面积的草原地区的土地利用分类中, 具有较高的精确度, 除个别地区的土地利用类型不够准确以外, 总体上能够反映土地利用的空间分布特征, 数据结果也比较科学合理。 (2) 利用该方法可以节省时间, 在较短的时间内可以得到较准确的结论, 尤其适用于景观比较单一的广阔的草原地区的研究中。 (3) 本文只是尝试性的利用该方法对研究区2005年的TM影像进行了自动分类, 并取得了很好的效果, 也证明了该方法在草原地区土地利用数据的获取中具有较高的可行性和发展潜力。
参考文献
[1]杨爱莲.我国草地自然保护区的建设与成就[J].中国草地, 1994, 2:57~60.
[2]张民.国家级草原自然保护区生态游[EB/OL].内蒙古新闻网, 2004-1-14.
[3]张树礼, 等.内蒙古自治区锡林郭勒草原自然保护区总体规划[R].呼和浩特:内蒙古自治区环境科学研究院, 内蒙古锡林郭勒盟环境保护局, 20004, 4:1~18.
[4]汤国安, 张友顺, 刘咏梅.遥感数字图像处理[M].北京:科学出版社, 2004, 5:162~211.
[5]徐冠华, 徐吉炎.再生资源遥感研究[M].北京:科学出版社, 1988, 11:1~260.
遥感图像分类方法比较研究 篇2
1.遥感图像分类原理简介
遥感图像分类的理论依据是:遥感图像中的同类地物在相同的条件下 (纹理、地形、光照及植被覆盖等) , 应具有相同或相似的光谱信息特征和空间信息特征, 从而表现出同类地物的某种内在相似性, 即同类地物像素的特征向量将集群在同一特征空间区域; 而不同的地物其光谱信息和空间信息特征不同, 将集群在不同的特征空间区域。由于地物的成分、性质、分布情况的复杂性和成像条件, 以及一个像素或瞬时视场里往往有两种或多种地物的情况, 即混合像素, 使得同类地物的特征向量不尽相同, 而且使得不同地物类型的特征向量之间的差别不都是截然相反的。
遥感图像分类方法可分为非监督分类和监督分类。非监督分类是在没有先验类别知识的情况下, 根据图像本身的统计特征及自然点群的分布情况划分地物类别的分类处理, 它并不需要具体地物的已知知识, 可更好地获取目标数据内在的分布规律, 主要方法有:K均值分类 (K-means) 、ISODATA方法。
监督分类是一种常用的精度较高的统计判决分类, 它是在已知类别的训练场地上提取各类训练样本, 通过选择特征变量、确定判别函数或判别规则, 把图像中的各个像元划归到各个给定类的分类方法。其主要步骤包括:选择特征波段;选择训练区;选择或构造训练分类器;对分类精度进行评价。主要方法有:平行六面体分类 (Parallelepiped) 、最小距离分类 (Minimum Distance) 、马氏距离分类 (Mahalanobis Distance) 、最大似然分类 (Maximum Likelihood) 、人工神经网络分类法等。
2.案例分析
本文以呼和浩特市地区7个波段组成的TM影像为原始数据, 以波段5、4、3模拟真彩色RGB合成, 选取凉城县岱海区域做分类实验, 以确定该区域土地覆盖应采取的分类方法。
2.1遥感影像的目视解译。
在利用ENVI进行监督分类之前, 首先在ArcGIS中进行遥感影像的矢量化操作, 利用目视解译画出各类地物的边界, 并统计其面积, 以此评定各种分类方法的分类精度。
2.2遥感图像的平行六面体法、最小距离法、马氏距离法、最大似然法分类。
采用ENVI软件监督分类模块进行平行六面体法、最小距离法、马氏距离法、最大似然法分类, 分类时训练区相同, 以比较不同分类方法的精度。分类后对原始分类图像进行聚类、过滤、去除后处理工作, 并采用总体分类精度、Kappa系数 (结果略) 评定分类精度, 发现最大似然法分类精度最高。图1~图4为四种方法原始与后处理分类图像。
2.3遥感图像的人工神经网络分类。
2.3.1在ENVI主菜单中 选择Classification→Supervised→Neural Net Classification, 弹出Classification Input File对话框, 选择分类影像shilianghua.tif。点击“OK”打开Neural Net Parame- ters对话框, 如图5所示。
2.3.2参数设置 :Select Classes from Regions:单击Select All Items按钮, 选择全部的训练样本。
Activation:选择活化函数。备选函数为对数 (Logistic) 和双曲线 (Hyperbolic) 函数, 此处选择对数函数;Training Threshold Contribution:输入训练贡献阈值 (0~1) 。该参数决定了与活化节点级别相关的内部权重的贡献量, 它用于调节节点内部权重的变化, 训练算法交互式地调整节点间的权重和节点阈值, 从而使输出层和响应误差达到最小。将该参数设置为0, 不会调整节点的内部权重, 适当调整节点的内部权重可以生成一幅较好的分类图像, 但是如果设置的权重太大, 对分类结果就会产生不良影响, 此值需多次试验选择;Training Rate:设置权重调节速度 (0~1) 。参数值越大则训练速度越快, 但也增加摆动或者使训练结果不收敛;Training Momentum: 输入一个0~1的值。该值大于0时, 在“Training Rate”文本框中键入较大值不会引起摆动, 该值越大, 训练的步幅越大, 该参数的作用是促使权重沿当前方向改变;Training RMS Exit Criteria: 指定RMS误差为何值时训练应该停止。RMS误差值在训练过程中将显示在图表中, 如图6所示。当该值小于输入值时, 即使没有达到迭代次数, 训练也会停止, 然后开始分类;Number of Hidden Layers:所用隐藏层的数量。要进行线性分类, 键入值为0 (没有隐藏层) , 不同的输入区域必须与一个单独的超平面线性分离。要进行非线性分类, 输入值应该大于或等于1, 当输入的区域并非线性分离或需要两个超平面才能区分类别时, 必须拥有至少一个隐藏层才能解决这个问题, 两个隐藏层用于区分输入空间, 空间中的不同要素不临近也不相连;Number of Training Iterations:输入用于训练的迭代次数。这里选默认值1000;Min Output Activation Threshold:输入一个最小输出活化阈值。如果被分类像元的活化值小于该阈值, 在输出的分类中, 该像元将被归入未分类 (unclassified) 中。
2.3.3输入文件输出路径 , 单击“OK”执行分类 , 分类结果如图7所示。
2.4五种遥感图像分类方法比较。
将目视解译、平行六面体、最小距离、马氏距离、最大似然及神经网络分类法统计的面积进行对比, 结果如图8所示。
将五种分类结果与目视解译的结果求差, 可看出神经网络分类结果与目视解译结果最为接近。差值图如图9所示。神经网络分类精度比最大似然法高, 且高于其他三种分类方法。
3.结语
如何提高遥感影像的分类精度, 一直是关注的热点。本文通过对五种监督分类方法的对比分析, 发现人工神经网络土地利用分类与实际情况最接近, 分类精度最高。最大似然法次之, 两者分类精度皆高于平行六面体、最小距离法、马氏距离法分类方法。
人工神经网络与传统分类方法相比, 有其明显优点。
一方面, 神经网络方法没有对数据分布特征的任何假设前提。它不考虑数据是正态分布或是不连续分布, 可以在特征空间上形成任意边界的决策面, 并在每次迭代过程中动态调节决策区域, 显示统计方法强大的稳定性和优越性。神经网络的监督分类和标准的统计监督分类非常相似。主要区别在于 训练和分类在实现的细节上。神经网络的训练过程和最大似然法计算均值和方差类似。所不同的是, 最大似然法的均值和方差只计算一次, 而神经网络法采用迭代算法, 直到计算结果和实际结果的差异满足要求。
另一方面, 神经网络方法是非线性的, 同传统分类方法相比较, 它可以处理复杂的数据集, 识别精细的模式, 且能利用多源数据, 将潜在的信息提取出来。
计算机遥感图像分类法 篇3
遥感技术是当前人类研究地球资源环境的一种主要技术方法,遥感图像的分类一直被从事地理信息研究人员所重视。早期的图像分类是依靠研究人员的目视,这种分类方法主要依靠个人经验,但存在着时效性差,容易受人为因素干扰等缺点20世纪90年代以来,人们将人工神经网络模型应用到遥感图像分类中并取得了很大的进展,但神经网络算法有其固有的缺点,如网络结构的确定尚无可靠的规则,易陷入局部极小等。为了提高遥感图像分类精度,有必要寻找一些新的遥感图像分类算法。
支持向量机作为一种新的也是有效的统计学习方法,近年来成为模式识别与机器学习领域一个新的研究热点。SVM具有小样本学习、抗噪声性能、学习效率高、推广性好等优点[1,2]。它根据Vapnik的结构风险最小化原则,由有限训练样本得到的决策规则对独立的测试集仍能够得到较小的误差。SVM算法是一个凸二次优化问题,能够找到的极值解就是全局最优解[3]。本文研究了基于支持向量机的遥感图像分类,建立了一种基于支持向量机的遥感图像分类模型,结果表明,该分类器具有一定的优势,是一种有效的遥感图像分类方法
1支持向量机
1.1线性和非线性
支持向量机的基本思想是将实际问题通过非线性变换将输入空间变换到一个高维的特征空间,然后在这个新的高维特征空间中构造线性判别函数来实现原空间中的非线性判别函数,求取最优分类超平面,该分类超平面不但能够将训练样本尽可能正确分类,而且使训练样本中离分类面最近的点到分类面的距离最大,即分类间隔最大[4]。
应用SVM理论对线性问题分析评估时,设给定训练集为{(x1,y1),…,(xi,yi)},其中xi∈Rn,yi∈{+1,-1}。假设该训练集可被一个超平面线性划分,该超平面记为:w·x+w0=0。其中w为权向量,w0为阈值。其中一类ω1中yi=+1,另一类ω2中y=-1,这个超平面方程为:
将许多超平面拟合成一个超平面使其将两个类分开,这个超平面优于其它任何一个超平面(见图1)。我们的目的就是在分类间隔中找到这个最优分类超平面,支持向量到超平面的距离叫做分离间隔,间隔等于,因此构造最优超平面使分类间隔最大问题转化为:
目标函数是严格上的凹的二次型,约束函数是下凹的,这是一个严格凸规划。按照最优化理论中凸二次规划的解法,可以把它转化为Wolfe对偶问题来求解。
构造Lagrange函数:
最终得到最优分类超平面判别函数为:
若训练集是线性不可分的,或之前不知道它是否线性可分情况下,我们可以引入非负松弛变量ξ,同时通过惩罚因子C来控制对错分样本惩罚的程度,此时分类间隔和约束条件转化为:
求解这个二次规划问题,最终推导所得的Wolfe对偶问题与线性可分的情况类似,唯一的区别是对加了一个上限限制
在非线性问题中,SVM采用映射方法解决非线性问题,即通过非线性变换将输入空间不可分问题转化为某个高维空间中的线性问题,在变换空间中求解最优分类面。只要满足Mercer条件的核函数K(xi·xj)就可以实现某一非线性变换后的线性
1.2 核函数
支持向量机的基本思想可以概括为:首先通过非线性变换将输人空间变换到一个高维空间,然后在这个新空间中求取最优线性分类面,而这种非线性变换是通过定义适当的内积函数实现的。常用的核函数有以下几种[5]:
(1) 线性核函数:K(xi,xj)=(xi·xj);
(2) 多项式形式内积函数:K(xi,xj)=(xi·xj+1)q;
(3) RBF函数:K(xi,xj)=exp(-γ‖xi-xj‖2),γ>0;
(4) S型函数:K(xi,xj)=tanh(γ(xi,xj)+c)。
1.3 分类器
对于多分类问题,通常可以按照两种算法来构造或组合多个两类分类器来进行分类。一是将多个分类面的参数求解合并到一个最优化问题当中,通过求解最优化问题一次性的实现多类分类。二是通过某种方式构造一系列的二类分类器将它们组合在一起从而实现多分类。实际常用SVM多类别分类是第二种方法,二类别的分类器组合有一对一,一对多组合方法。一对一方法一般在N类分类中,需构造N(N-1)/2个分类器,计算量较大且存在混分样本问题[6];本文使用一对多方法,该方法是用一类和剩下其它所有类判别分类,一个分类器分出其中某一类。在N类中构造N个分类器,这种方法相对计算量较小,比较简单且达到同样多类别分类效果,缺点就是存在混分和漏分样本问题。
2 图像特征提取
图像特征包含图像的灰度特征、纹理特征以及结构特征等[7]。由于遥感影像中的空间特征信息单元不仅是光谱属性的反映,更主要是空间域上多个像元的光谱特性的组合,因此空间特征信息的提取和分类一般是通过目标像元为中心的一定大小的窗口区域来表示空间特征单元[8]。本文采用灰度和纹理共生矩(记为W阵)的方法,为了获取某波段的纹理特征,需要计算灰度共生矩阵P(i,j,δ,θ),对灰度共生矩阵作归一化处理, 灰度共生矩阵用数学公式表示则为:
P(i,j,δ,θ)={[(x,y),(x+Dx,y+Dy)]|f(x,y)=
i,f(x+Dx,y+Dy)=j}。
式中x=0,1,2,…,N-1是图像的像元坐标, Dx、Dy是位置偏移量,i,j=0,1,2,…是灰度级数,δ为W阵的生成步长,θ为W阵的生成方向,取0°、45°、90°、135°四个方向偏移参数,作为其灰度共生矩阵,然后分别求取其特征值,再对这些特征指标计算其均值和方差。这样处理就抑制了方向分量,使得到的特征与方向无关。利用灰度共生矩阵可以定义图像的纹理特征,其目的就是使用所得的纹理特征辅助遥感影像纹理分类。以下三种统计量为[9]:
(1) 角二阶矩:
(2) 对比度:
(3) 相关:
计算特征f1、f2、f3关于θ四个方向的平均值和方差:[
x=[
3 实验及结果分析
实验按照支持向量机的分类原理进行。实验数据采用google地图采集的图像,针对四大类土地利用类型,即水域(A类)、绿地(B类)、居民地(C类)、交通用地(D类)。共选取了1 500个标注样本,将其中的500个作为训练样本,其余1 000个样本作为测试样本。使用一对多分类器划分四类,需要构造四个分类器,实验中选择使用RBF核函数,此类SVM的训练模型效果取决于两个参数,其一是惩罚因子C,其二是核参数γ。
在支持向量机的训练过程中,加载训练样本,确定分类目标(根据训练目标的不同,得到每一类与另三类的分类器),先给出一个初始的训练参数,按交叉选择方式确定参数C和γ,训练四个SVM分类器。以某个分类器为例,训练以后测试这四类共1 000个样本,不仅要保证正类样本被正确分类,还要保证负类样本尽量不被错分,反复调整训练参数,重复训练直至在测试集中达到满意效果,也即找到了较优的支持向量机参数。经过测试参数值分别为C=2.0,γ=0.125,测试样本的分类精度较高。最后利用调整好的参数对整幅图像进行测试,以原始图像中未知空间单元特征向量作为各类别特征判别函数的输入,然后输出属于各类别的结果,最后通过分类后的矩阵反演为图像。分类效果明显。说明加入了灰度值和纹理的空间特征单元具有比较好的分类性(见图2)。
输出分类结果。统计出四类样本测试结果如表1所示。将SVM方法实验分类精度结果与神经网络方法和最大使然方法分类精度对比,对比结果见表2。
4 结论
针对遥感图像的支持向量机分类法、神经网络法和最大似然法分类实验结果表明:
利用支持向量机分类方法进行遥感图像分类精度为96.90%,明显高于神经网络方法和最大似然方法。
利用灰度特征与纹理特征相结合的方法进行特征提取适合支持向量机分类中特征向量条件的选择。
该方法首先要人工标注大量的样本,工作量相对来说比较大,下一步要在如何减少人工干预量方面进行研究。
参考文献
[1] Anthony G,Ruther H.Land cover mapping:optimizing remote sensingdata for SVMClassification.遥感学报,2007;11(5):694—701
[2](美)Cristianini N,(英)Shawe-Tayor J.支持向量机导论(英文版).北京:机械工业出版社,2005
[3]徐磊,李朝峰,杨蒙召.SVM结合模糊方法在遥感图像分类中的应用.计算机工程与应用,2005;36(4):79—82
[4]李晓宇,张新峰,沈兰荪.支持向量机(SVM)的研究进展.测控技术,2006;25(5):7—12
[5]张学工.关于统计学习理论与支持向量机.自动化学报,2001;26(1):32—41
[6]骆剑承,周成虎,梁怡,等.支撑向量机及其遥感影像空间特征提取和分类的应用研究.遥感学报,2002;6(1):50—55
[7]汪闽,骆剑承,周成虎,等.结合高斯马尔可夫随机场纹理模型与支撑向量机在高分辨率遥感图像上提取道路网.遥感学报,2005;9(3):271—276
[8]李朝峰,曾生根,徐磊.遥感图像智能处理.北京:电子工业出版社,2007
计算机遥感图像分类法 篇4
遥远的感知, 解释为运用现代光学、电子学探测仪器, 不与目标物相接触, 从远距离把目标物的电磁波特性记录下来, 通过分析、解译揭示出目标物本身的特征、性质及其变化规律。遥感技术的特点归结起来, 主要有三点: (1) 涉猎范围广, 可以进行大范围探测, 精准高效。 (2) 高光谱、高分辨率, 可以满足大多数研究要求。 (3) 多分辨率影像结合, 从不同角度描述问题。 (4) 全天候, 高时间分辨率。 (5) 斜视、立体观测等全方位观测。遥感技术是目前国土资源调查中最常规的方法, 很多方面也是其他技术无法比拟的。
土地覆盖研究是关系全球生态建设、经济建设、民生建设的重要组成部分, 也是现阶段遥感技术研究的重点。随着科学技术的发展, 遥感技术的应用使得地表覆盖类型的研究从人工解译发展到计算机解译。遥感影像通常是通过像元的亮度值和灰度值来反应地物的空间差异。遥感影像解译是利用计算机来分析不同地类的光谱特征和空间信息, 按照一定的规则来划分影像。早期应用最多的人工解译, 工作量大, 比较耗时, 但是精度却是最高的。李英利[9]等利用XML的简洁和灵活特性, 将高分影像目视解译为乔木林、灌木林、绿化林地、人工那个幼林等十多种类型。接下来是基于光谱的计算机自动分类, 是人们根据不同的亮度值将地物进行分类, 常用于中等分辨率大范围的分类。李素[10]结合南京市的具体情况, 利用中等分辨率遥感影像, 通过混合相元分解获取亚相元尺度上土地覆盖组分丰富度图像。基于专家知识树的决策树分类, 除了可以利用光谱信息之外, 还可以结合其他遥感影像源, 比如DEM、土地规划图。Paul V.Bolstad[11]在TM数据基础上加上地质地形专题信息, 提高了土地利用分类精度。针对高分辨率影像发展的面向对象特征提取, 是利用影像分割与合并技术, 来充分利用高分辨率影像的优势。孙艳霞[12]应用均值方差法、最大面积法方法, 结合理论研究理念, 获取高分影像的最优分割尺度, 采用面向对象方法进行分类, 为高分分类可行性提供依据。地物的识别与地表的反演, 主要利用微量元素来反演, 由于肉眼无法判断某种元素含量多少, 比如地表温度、水体叶绿素、土壤重金属含量等, 可以通过不同波段繁衍出含量, 进而做变化检测。黄金国[13]等对鄱阳湖叶绿素a浓度进行反演, 得出BP网络反演模型试验精度高于统计回归构建遥感反演模型。地形信息提取, 利用光学影像可以从立体像对中提取出地形信息。本文, 主要介绍通过DEM数据和TM数据结合, 来分类山地植被, 区分陡坡和缓坡、朝南和朝北。
1. 研究区概况及图像预处理
本文选取詹姆斯敦的一小块山体作为研究区, 詹姆斯敦以山地为主, 全境只有一条街道, 山体走势明显。从USGS上下载TM影像和DEM数据, 均为30m分辨率。TM数据具备较高空间分辨率, 可以满足一般地物信息提取。王建平[14]等人用TM卫星影像反演悬浮物、CODMn、溶解氧、总磷、总氮和叶绿素浓度, 反演结果相对误差在0.25左右。本文对TM影像多光谱信息进行预处理。
辐射校正是指对由于外界因素, 数据获取和传输系统产生的系统的、随机的辐射失真或畸变进行的校正, 消除或改正辐射误差而引起的影像畸变的过程[1]。图像滤波是一种图像增强的一种方法, 目的是提取和突出图像空间信息, 压抑或去除无用的信息[2]。
2. 决策树规则定义
基于知识的决策树分类是基于遥感影像数据及其他空间数据, 通过专家经验总结、简单的数学统计和归纳方法等, 获得分类规则并进行遥感分类[3]。分类规则易于理解, 分类过程也符合人的认知过程, 最大的特点是利用的多源数据。规则定义有两种方法, 经验总结和样本统计。刘晓娜利用TM和Modis数据, 提取了中缅交接处的橡胶树, 并分析其生长情况[7]。吴健生运用QUEST决策树方法得出, 在地形复杂的山地地区, 针对TM影像数据, 选择基于QUEST决策树分类能够有效提高土地利用分类结果精度[8]。
根据研究区域现状, 将地表覆盖类型分为水体、裸地、无数据和背景、缓坡植被、陡坡朝南植被、陡坡朝北植被。根据遥感影像结合谷歌地球, 均匀选取影像上的水体、裸地、缓坡植被等样本, 通过分析样本光谱信息, 总结如下:根据ndvi区分植被和非植被, 当ndvi小于等于0.3时, 为非植被, 大于0.3时为植被;由于多光谱数据的第四波段, 近红外波段, 处于水体强吸收区, 用来区分水体和裸地及背景。根据研究区具体情况, 当b4大于0小于20时, 判为水体, 大于等于20时, 判为裸地;等于0时, 判为背景。结合DEM数据, 坡度大于等于20时, 为陡坡, 小于为缓坡。坡向大于90小于270时, 为朝南, 其次为朝北。决策树构建如图1所示。
3. 分类结果
按照规则, 对影像进行分类, 结果如下图2左图所示。可以明显看到, 随着山体走势, 植被的颜色变化。浅绿色为缓坡植被, 深蓝色为朝南陡坡植被, 深绿色为朝北陡坡植被。运用envi的3D查看效果, 可以旋转观察山体植被分布, 截取一部分如下图2右图所示。山体植被分布较多, 占总研究区的百分之三十以上, 陡坡朝南植被比朝北植被数量多。
4. 总结
决策树分类方法, 是基于二叉树分支的思想, 将不同的地物一层一层, 按照特性不同, 分离开来。与研究人员对地物的了解程度紧密相连, 根据不同波段的组合, 进行实验验证, 最终得出结论。本文根据ndvi大小, 比较精确的区分了山体植被的缓坡与陡坡, 朝南和朝北。并充分利用DEM的立体特性, 展示地貌的三维状况。在以后的研究中, 可以考虑结合高分数据, 综合利用多种分类方法, 来提高分类精度。也可以在分类算法和波段组合方面进行更深入的研究, 达到提高分类精度的目的。
参考文献
[1]陈趁新, 胡昌苗, 霍连志, 等.Landsat TM数据不同辐射校正方法对土地覆盖遥感分类的影响[J].遥感学报, 2014, 18 (02) :320-334.
[2]周雨薇, 陈强, 孙权森, 等.结合暗通道原理和双边滤波的遥感图像增强[J].中国图象图形学报, 2014, 19 (02) :313-321.
计算机遥感图像分类法 篇5
遥感技术作为人类研究地球资源环境的一种技术手段, 遥感图像计算机分类是遥感技术应用的重要组成部分[1]遥感数字图像的处理就是将遥感图像的模拟或数字形式的信息输入计算机中, 利用某种遥感图像处理软件, 按照一定的数学模型, 进行变换、加工产生可为专业人员判读的图像或者资料[2]。20世纪70年代之后, 图像分类成为遥感领域研究的热点问题, 在诸多领域中应用越来越广泛, 如测绘行业中地理国情监测, 铁路行业中用图像分类进行环境监测, 水利部门用图像分类技术监测河道或者湖泊周围的自然环境。近年来许多学者对图像分类进行了大量的研究和探索, 并提出了多种方案。如Huang等人[3]通过获取图像颜色的空间相关性等信息, 通过用分类树来对图像进行分类。
目前常用的图像分类方法是最大似然法, 它是以贝叶斯的主观理论为代表的, 运用最大似然法前提条件是图像数据呈正态分布, 而且主要存在的问题是反映不出对知识的不知道信息[4]。
采用传统的分类方法, 会出现很多错分, 漏分的情况, 且分类精度也比较低。在此种情况下, 许多人找寻新的分类方法, 支持向量机的分类方法应运而生。近些年来, 支持向量机被应用到了很多领域, 支持向量机的研究已经被越来越多的学者所重视, 这种技术在人脸特征检测、文字体识别、图像处理以及其他领域都取得了大量的研究成果。图像分类结果是将图像空间划分为若干个子区域, 每个区域代表一类地物[5]。
1 支持向量机的原理与方法
支持向量机的基本思想如 (图1) 所示。在图中直线附近不同的图形代表不同的训练样本, H为把两类训练样本没有错误分开的分类面, H1和H2表示超平面, H1和H2之间的距离△被称为分类间隔 (margin) 。
如果给定分类间隔△的值, 可以确定相应的分类超平面, 当分类面变化时, 分类间隔△也随之发生变化。在分类间隔△存在下, 超平面几何的VC维h满足下面关系:
因为f (x) 是单调递增函数, h随着△2的递增而递减。因此如果训练样本数固定后, 两类训练样本之间的分类间隔越大, 则与之对应的VC维就会越小。
分类超平面方程为w Tx+b=0, 如果线性可分, 则样本集 (xi, yi) , 其中i=1, 2, …, n, x∈Rd, y∈{-1, 1}, 满足:
最优超平面问题在线性可分情况下, 可以表示为下面的约束优化问题, 在条件的约束下, 求下列函数的最小值
2 支持向量机模型的建立及算法实现
在前面介绍SVM算法的基础上, 本文采用了台湾林志仁老师开发的一个基于C和C++的LIBSVM开源代码, 并在其上添加许多新的特性。本次设计利用SVM进行图像分类的流程是:添加数据, 新建训练样本, 图像分类, 分类后处理。本软件设计程序主要包括以下几个模块:样本采集模块, 样本训练模块, 算法分类模块, 图像显示模块。在设计时结合Windows系统下特有图形设备接口, 实现图像显示, 分析功能, 并可以将分类后的结果以一种直观的形式呈现在用户面前。
2.1 样本采集模块的设计与实现
利用别的商业软件对测区的遥感影像进行预处理, 如;几何校正, 影像镶嵌, 影像裁切等, 然后将预处理后的数据加载到样本采集模块中。用户可在此模块中对此影像中设计不同的波段组合显示, 同时需要在此设计不同的训练样本, 并确定分类地物的类别。
2.2 算法训练模块的设计与实现
本软件设计的最核心, 最复杂的本分就是算法模块。该算法模块需要先输入待处理的文件, 输出的文件路径, 以及先前做的训练样本文件。见图2。
2.3 分类模块的设计与实现
分类模块实现对数据的分类, 在分类时需设置需要分类的影像, 训练样本以及输出的文件。经过分类后即可将影像分成多个类别。分类模块如图3所示。
在这次试验中, 分别采用多项式核函数、线性核函数、径向基核函数, Sigmoid核函数对测区数据进行分类。然后将分类后的数据利用分类误差矩阵和Kappa系数来测试分类的精度, 并与真实材料比对查看分类的精度。
3 试验区测试结果与分析
此次选择了一景空间分辨率为1.25米的Resurs DK1数据为实验数据, 影像成像时间为2009年11月。首先利用ERDAS软件对测试数据进行预处理操作, 图4是经过ERDAS预处理之后, 真彩色合成图。
3.1 四种核函数的分类结果比较
本次实验针对测试数据利用核函数的四种不同函数对图像进行分类, 将测区数据分为房屋、主干道、植被, 小路、草地, 水池六类地物, 下图是利用SVM的不同核函数对影像进行分类的效果图。
从上面几幅图用肉眼可以看出, 对于SVM的四种核函数都可以实现对影像的正确分类, 为了更好的区分各种不同核函数的分类效果, 采用误差矩阵和Kappa系数对四种分类效果进行量化评价, 表1和表2是利用分类结果误差 (Error matrix of classification) 矩阵和Kappa系数对以上各种分类效果精度评价。
通过以上各个核函数的分类结果评价分析可以看出, 径向基核函数的分类精度略高于多项式核函数、线性核函数和Sigmoid核函数的分类精度。
4 结论
本次对SVM在遥感影像上的图像分类做了深入的研究, 并在此基础上编制了图像分类软件。通过实验发现, 利用SVM对影像进行分类, 分类的精度比较高。
论文主要对SVM算法进行了深入的研究, 并将SVM算法应用到图像分类中并进行编程实现。且对支持向量机在图像分类中的若干问题作了研究, 通过实验证明不同的核函数会产生不同的分类效果, 针对传统遥感图像分类方法的缺点, 在分析SVM分类方法的基础上, 对SVM算法表达式的核函数进行了分析, 而且针对小样本的学习, 构建了基于支持向量机的图像分类模型。根结实验结果通过分类效果图以及混淆矩阵和Kappa系数表明了采用支持向量机算法建立的模型有很高的分类精度, 与最小距离法和最大似然法相比, 是一种更加有效的遥感图像分类方法。
摘要:图像分类是人们获取信息的一种重要的手段, 传统的分类方法是以经验风险最小化为归纳原则, 只有当训练样本数趋于无穷时, 其性能才能达到理论上的最优。当样本不足时, 传统的分类方法往往不能达到理想的分类精度。与传统的人工神经网络相比, 支持向量机理论体现了结构风险最小化原则, 它不仅结构简单, 泛化能力强, 而且能较好的解决小样本、高维数据和局部极小等实际问题。本文以试验区的地物分类为研究背景, 建立了支持向量机的算法框架, 并分别使用多项式核函数, 径向基核函数、Sigmoid核函数以及线性核函数四种核函数对图像进行了多类别分类实验。
关键词:支持向量机,统计学习理论,图像分类,核函数
参考文献
[1]孙家槟.遥感原理与方法[M].武汉:武汉大学出版社, 2003.
[2]袁金国.遥感图像数字处理[M].北京:中国环境科学出版社, 2006.
[3]Vapnik V N.The Nature of Statistical Learning Theory[M].New York SpringVerlag, 1995.
[4]Richards A.Remote sensing digital image analysis:an introduction[M].2nd ed.Berlin:Springer-Verlag, 1993.
计算机遥感图像分类法 篇6
遥感图像具有较高的光谱分辨率,在航天、地质勘探、农业等领域获得了越来越多的应用,遥感图像分类在遥感图像应用中具有重要的作用。但对遥感图像分类也面临以下难题:其一是如果采用传统的非监督方法对遥感图像直接分类,因遥感图像的复杂性和特殊性,很难获得比较满意的结果;其二采用监督方法,需要运用大量的训练样本才能获取较好的分类结果,而标记样本的获取代价高昂,也容易出现分类器过拟合与训练样本的问题。
半监督学习[1]可以很好地解决上述问题,首先大量的廉价的无标记样本也包含样本特征信息,其次遥感图像中标记样本的获取十分昂贵。半监督学习可以利用少量的已标记样本,结合大量的无标记样本建立分类器完成学习任务。基于图的半监督图像分类在近年来图像研究领域成为了一个研究热点,此方法结合图理论,能够充分利用图像中的无标记样本信息,分类性能较好,且目标函数优化简单,因此更加高效,目前也有许多基于图的半监督分类方法[2,3,4,5,6]。
基于图的半监督图像分类方法是建立在图理论的基础上,但算法计算速度依赖于所构建图的规模大小,当数据规模过大时,如果还是每一个图节点代表一个样本点,图规模就会很庞大,计算的时间复杂度会很高,例如线性近邻传递算法(Linear Neighborhood Propagation)、局部与全局一致性算法(Local and Global Consistency),其计算复杂度为O(n3),n为样本个数。为了降低算法的复杂度,Blum和Chawla提出了图的最小割(Mincut)算法,并将其时间复杂度降低到了O(cn2),这里c为类别数。但最小割算法可能存在多个解,得到不同的分类结果。
2010年Liu等提出基于锚点建图的半监督分类方法[7](Anchor Graph Regularization,AGR)。首先采用K-means算法对数据聚类,将聚类中心作为锚点得到锚点集,其次利用锚点与已标记样本建图,缩小了图规模,时间复杂度降为O(m2n),m≪n,n为样本总数,m为聚类个数。但K-means聚类算法消耗时间过长,且遥感图像混合像元问题使部分像元很难进行非此即彼的划分,部分区域地物类别边界是过渡性的,没有明显边界划分,因此K-means不适宜对遥感图像聚类。针对上述问题,本文采用mean shift聚类算法代替K-means算法对遥感图像聚类,缩短了聚类时间,mean shift算法对噪声也有一定的鲁棒性,可以解决噪声点带来的干扰,提高聚类的有效性。其次在每个聚类中随机选取一个点作为锚点,得到锚点集,并与标记样本集建立图。该方法不仅降低了算法复杂度,可以处理大规模图像分类问题,同时在遥感图像分类中具有较好的分类结果。
1 AGR图像分类方法
设样本数据集为,共有n个样本,l个是已标记样本,剩余的为未标记样本。为了解决大规模数据问题,将标记预测函数定义为一个对锚点的加权平均函数,当得到锚点的类别信息后,就可以通过映射关系得到与锚点密切相关的无标记样本的类别信息。将锚点加权平均函数表示为:,其中uk代表锚点,标记预测函数为:
在这里定义两个向量f=[f(x1),f(x2),···,f(xn)]T和a=[f(u1),f(u2),···,f(um)]T;a为锚点的软标签预测矩阵;m为锚点个数。式(1)可以写成:
其中Z是一个权值矩阵,表示了锚点与所有样本点的线性关系:
这里使用的是高斯核函数。<i>⊂[1:m]是一个保存xi的s个最近邻锚点的索引,为了提高计算效率,规定每一个样本xi只与s个Zik中值最大的锚点具有连接关系,其他连接均为0。
由Z矩阵可以得到邻接矩阵:
式中,Λ∈Rm×m是一个对角矩阵:
由s的取值可以知道,所有的样本点都只与部分近邻锚点存在连接关系,所以矩阵W是稀疏的。Zhu提出稀疏图对算法的性能的影响优于全连通图[1]。因为全连通图中,每个样本的邻接信息中含有大量重复的、干扰的信息,而稀疏图在连接不同样本时含有较少的错误信息,对算法结果有正确的指导。由式(4)定义的邻接矩阵所构造的图就是Anchor Graph。最后Anchor Graph的图拉普拉斯矩阵为:
式中:D为对角线矩阵,
2 本文方法流程
假设已标记样本xi(i=1,2,···,l),其标记信息为yi∈{1,2,···,c},c为类别个数。用Y=[y1,y2,···,yc]∈Rl×c表示已标记样本的标记信息,如果yi=j,Yij=1,否则Yij=0。用mean shift聚类算法对遥感图像进行聚类,得到各个类别的聚类中心,把每个聚类中心作为一个锚点,得到AGR方法中的锚点集合。此时就需要求得锚点的标签预测矩阵A=[a1,a2,···,ac]∈Rm×c。选择被广泛应用的图拉普拉斯正则化项,可得到半监督学习框架:
式中:Zl∈Rl×m是Z矩阵的子矩阵,只包含标记样本;是Frobenius范数;取γ>0,为正则化参数。那么缩小后的拉普拉斯矩阵为:
缩小后的拉普拉斯矩阵存储空间更小,易于计算,空间复杂度为O(m2),时间复杂度为O(m3+m2n)。这时,目标函数Γ(A)进一步简化为:
最后,就可以得到全局最优解:
得到了锚点的标记信息,那么未标记样本的标记信息就可以通过下式得到:
式中:Zi∈Rl×m表示Z矩阵的第i行。λj=ITZaj表示归一化因子,作用是平衡倾斜的类分布。
具体的算法步骤如下:
输入:已标记样本xi(i=1,2,⋯,l),标记信息
输出:图像分类结果
(1)用mean shift算法对遥感图像进行聚类,得到m个类,从每一个聚类中选取一个点作为锚点;
(2)选择合适的γ;近邻锚点个数s取3;
(3)计算Z矩阵,根据式(4)计算邻接矩阵W;
(4)根据式(6)计算图拉普拉斯矩阵L;
(5)根据式(10)计算锚点标签预测矩阵A*;
(6)根据式(11)计算未标记样本的标记。
3 算法复杂度分析
基于图的半监督分类方法,大多数方法中是每个样本作为一个图节点建立图,所以计算复杂度为O(n3),其中n是样本个数。本文方法中,mean shift的计算复杂度是O(dn2t),其中d是数据的空间维度,t是迭代次数;基于锚点的算法的计算复杂度[7]是O(m2n),所以本文方法的计算复杂度是O(dn2t)+O(m2n),且m是聚类后得到的聚类中心个数,m≪n,所以本文方法的计算复杂度是远小于原始基于图的半监督分类方法的计算复杂度O(n3)。
4 实验结果与分析
本文在Matlab R2012a下计算机内存为2 GB,CPU为Intel Core i3,频率为2.53 GHz的机器上运行实验。实验采用的遥感图像是IKONOS卫星图像,IKONOS卫星图像包含一个全色波段,分辨率为1 m,四个多光谱波段,分辨率为4 m。图像大小为400×400,实验中对四个多光谱波段构成的遥感图像进行分类,3个RGB多光谱波段构成的真彩色图像如图1所示。根据实验区的特点,具体样本分类类别如表1所示。
图1中最左侧两片颜色灰白的区域是水泥建筑场地,右上侧灌木林中间的一个蓝色区域是一个房屋,这两片区域在本文实验中都归为“公路居民区”类别。因此本次实验样本类别个数为:“农田”像元点数32 433,“荒裸地”像元点数41 825,“植被”像元点数67 978,“公路居民区”像元点数17 764。
原文方法采用K-means聚类算法,不适应对遥感图像聚类,所以本文对遥感图像的分类结果并未与原文方法进行对比,而与遥感图像处理平台ENVI自带的监督支持向量机(SVM)方法进行对比。
本文实验SVM方法参数取值:核类型(Kernel Type)选择Polynomial,核心多项式的次数取4,Classification Probability Threshold取0,其他参数采用默认值。
本文实验中标记样本均为人工选取,实验分四次,四次实验中每类标记样本个数分别为5,20,50,100,每一次实验中所有实验方法均采用相同的标记样本,且每次实验都在上次已有标记样本的基础上添加新的标记样本。本文对实验结果的评价采用了Kappa系数和像元分类正确率(Pixel Classification Rate,PCR):
图2和图3分别为每类标记样本为50和100时,本文方法和监督SVM方法的实验结果。遥感图像中样本分为四类,红色代表“荒裸地”的样本点,绿色代表“植被”的样本点,蓝色代表“农田”的样本点,黄色代表“公路居民区”的样本点。对比图2和图3,可以发现,本文方法优于监督SVM方法,图4中区域标号图像为1的区域是农田和没有农作物荒裸地区域,没有灌木植被,本文方法明确地分为农田和荒裸地两类,而SVM方法中将一部分样本错分为植被;在标号为2的区域与右上角的空白区域一样均为裸地,本文方法分类效果很好,而SVM方法分类效果显然较差,部分样本错分为农田类别;标号为3的区域中,有一排灌木植被在农田中间,即右侧的很少一部分还属于农田,可以看到还有农作物存在,SVM方法中将此少部分农田错分为裸地,本文方法大部分样本分类正确;在标号4的区域,可以看到是农田和裸地的分界处,而可以明显看到此处属于农田,只不过左侧部分不存在农作物,所以归为裸地类别,在SVM方法分类结果中许多样本点被错分为植被,而本文方法只有极少量样本分错,这是因为半监督学习的流形假设,处于很小局部区域内的样本可能具有相似的标记,此处的样本明显与邻近的农田相似性更大。
对遥感图像的分类精度的评价指标是以分类结果的混淆矩阵为基础,总体分类精度和Kappa系数都要通过混淆矩阵计算得到,而为了更直观地评价两种方法的分类效果和优缺点,本文列出了每类标记样本数为100的分类结果的混淆矩阵:两种方法在每类标记样本为100时的分类结果见表2和表3。
混淆矩阵中每行的总和为每一类样本的真实样本数,每一列的总和为分类结果中每一类的总样本数,括号内的值为混淆矩阵对角线的和,即分类正确的样本总数。漏分误差即每类真实样本中没有被正确识别出来的样本比例;错分误差为分类结果中其他类别样本被错分为此类的样本占总和的比例。
通过混淆矩阵的数字可以直观地看到,本文方法的每一类样本的错分误差都小于SVM方法的错分误差;本文方法对“植被”类别的分类正确率不如SVM方法的分类结果,但本文方法对细节处的分类效果更优于SVM方法,例如在图4中右侧的灌木林,本文方法的分类结果中,琐碎的极少量的裸地都被分出来;“荒裸地”和“农田”类别的样本分类正确率都明显优于SVM方法;而“公路居民”类别正确率低于SVM方法,由混淆矩阵可以看到是错分为“荒裸地”的样本较多,这是因为图4中最左侧的居民区建筑因为曝光太强,错分为“荒裸地”;“公路居民区”类别和“农田”类别样本差别明显,本文方法把“公路居民区”错分为“农田”的样本数为零,而SVM方法的错分数是9,本文方法对类别“公路居民区”和“农田”之间的区分更优;本文方法总体精度和Kappa系数也明显高于监督SVM的。具体的分类结果统计如表4所示。
从表4可以看出,本文方法分类结果明显优于监督SVM方法,而监督SVM方法是ENVI软件的监督分类方法中效果最优的方法[8],且监督SVM方法在小样本时具有良好的分类效果。但半监督的学习方法,结合无标记样本,优于监督学习方法,提高了分类性能。如标记样本数较少,为5和20时,无标记样本作用明显,分类精度和Kappa系数提高较大。通过观察图像和实验发现,本此实验的遥感图像中样本比较复杂,地物交错比较严重,边界过度不明显,不同于城市居民区边界清晰,这就给分类增加了难度,这也是分类精度不是很高的原因之一。实验结果验证了本文方法在遥感图像分类中的有效性,相比监督SVM方法获得了更好的分类效果。
本文方法在图像聚类选取锚点时采用mean shift聚类算法,聚类样本数160 000,平均用时9.4 s。原文[9]方法采用K-means聚类算法选取锚点,文中给出了两次实验结果中的聚类时间,7 291个样本聚类时间是7.65 s;630000个样本聚类时间是195.16 s。因此mean shift聚类算法相比K-means算法缩短了聚类时间。
5 结语
基于图的半监督图像分类方法通常因为数据规模大而导致内存空间不足和分类时间过长,而遥感图像通常规模较大且地物复杂、信息量大,所以影响了其在遥感图像分类中的应用。本文首先采用mean shift算法对遥感图像聚类得到锚点集,利用锚点集和标记样本集建图,缩小了图规模,降低了计算复杂度,其次通过分类方法得到锚点的类别信息,最后映射还原到整个样本集,得到遥感图像分类结果。AGR方法解决了大规模图像分类,本文采用mean shift算法缩短了锚点选取时间。实验结果表明,本文方法在遥感图像分类中获得了较好的分类结果,验证了其对遥感图像分类的有效性。
参考文献
[1]HUANG G,SONG S,GUPTA J,et al.A second order cone programming approach for semi-supervised learning[J].Pattern recognition,2013,46(12):3548-3558.
[2]XIE W,LU Z,PENG Y,et al.Graph-based multimodal semisupervised image classification[J].Neuro computing,2014,138:167-179.
[3]BLUM A,CHAWLA S.Learning from labeled and unlabeled data using graph mincuts[C]//Proceedings of 2001 International Conference on Machine Learning.San Francisco:ACM,2001:19-26.
[4]WANG F,ZHANG C.Label propagation through linear neighborhoods[J].IEEE transactions on knowledge and data engineering,2008,20(1):55-67.
[5]ZHOU D,BOUSQUET O,LAL T N,et al.Learning with local and global consistency[J].Advances in neural information processing systems,2004,16(4):321-328.
[6]ZHU X J,GHAHARMANI Z,LAFFERTY J.Semi-supervised learning using Gaussian fields and harmonic functions[C]//Proceedings of 20th International Conference on Machine Learning.Menlo Park:AAAI,2003:912-919.
[7]LIU W,HE J,CHANG S F.Large graph construction for scalable semi-supervised learning[C]//Proceedings of the 27th International Conference on Machine Learning.Haifa:ACM,2010:679-686.
[8]闫琰,董秀兰,李燕.基于ENVI的遥感图像监督分类方法比较研究[J].北京测绘,2011(3):14-16.
[9]YU G,ZHANG G,DOMENICONI C,et al.Semi-supervised classification based on random subspace dimensionality reduction[J].Pattern recognition,2012,45(3):1119-1135.
[10]CHENG Y.Mean shift,mode seeking,and clustering[J].IEEE transactions on pattern analysis and machine intelligence,1995,17(8):790-799.
[11]WANG Y,CHEN S,ZHOU Z H.New semi-supervised classification method based on modified cluster assumption[J].IEEE transactions on neural networks and learning systems,2012,23(5):689-702.
计算机遥感图像分类法 篇7
云与雾是常见的自然天气现象, 其能降低大气的能见度, 导致遥感平台不能获取到清晰图像, 最终无法读取到图像中的地物信息, 降低了遥感图像的应用价值。因此, 有必要对遥感图像进行去薄云去薄雾处理。
2 去薄云计算机算法
2.1 基于高维空间几何信息学的遥感图像去薄云算法原理
薄云引起的干扰主要集中于图像的低频位置, 很大程度上削弱了遥感图像的高频信息。为了有效降低干扰, 恢复高频信息的呈现, 有研究者提出了高维空间几何信息学理论, 以此实现去薄云目的。
首先, 将原始向量与不同参数设置的滤波器进行卷积运算, 得到高维空间中子空间下能够清晰显示通过滤波器分离出的近似于低频信息的低频分量;其次, 利用向量C与向量D的算法将原始的遥感图像矢量向近似低频信息的低频分量方向做几何映射, 以此将原始图像空间分解为低、高频子空间;最后, 对高、低尺度子空间分别进行抑制与增益, 恢复遥感图像的高频信息, 实现去除遥感图像中薄云的目的。
2.2 基于高维空间几何信息学的遥感图像去薄云算法
3 卫星遥感去薄雾的算法
3.1 Retidx算法
Retidx算法又分单尺度Retidx算法与多尺度Retidx算法, 其中, 单尺度Retidx算法可表示为:L (χ, У) =I (χ, У) ·R (χ, У) , 其中L (χ, У) 、I (χ, У) 及R (χ, У) 分别表示图像中 (χ, У) 位置上的像素亮度值、照明强度函数及反射函数。存在较小标准差σ的图像经增色后, 能有效突出图像的细节信息, 但存在较大标准差σ的图像, 其却只能显示出原图像的色调, 因此, 其去雾效果不明显;多尺度Retidx算法可表示为其中, l=1、l=2及l=3分别对应红色、绿色及蓝色通道, Wk与k分别表示Fk计算结果的对应权重值与尺度常数。
多尺度Retidx算法比单尺度Retidx算法的图像增强效果更理想, 能呈现原图像的色调及细节信息, 再现彩色图像。
3.2 基于Retidx算法和色度比的图像增强算法
Retidx算法虽然对灰度、彩色图像具有一定色彩增强作用, 但其无法提高含雾图像的对比度, 因此, 必须对Retidx算法处理过的图像直方图进行校正。当处理过的图像超出了显示设备所能显示的灰度范围, 其相应的图像对比度将会降低, 从而影响观察者对图像中细节信息的捕获, 为此, 可对其进行对比度的线性拉伸;针对分辨率为M×N的8位量化图像, 可将图像的灰度范围拉伸至[0, 255]。
在正态分布中, 若图像的灰度均值为μ, 标准差为σ, 其大部分像素将落于[μ-3σ, μ+3σ]区间内, 采用多尺度Retinex算法对上述图像进行直方图的线性拉伸, 尺度常数分别取15、80、250, 便可实现简单去雾效果图。
多尺度的Retinex算法无法有效去除彩色图像中的含雾部分, 导致图像色彩偏灰, 因此, 笔者给每个像素加入了色度比信息, 假设其尺度常数分别为15、80、250, 则可计算出R、G、B三个谱段的去雾结果, 对计算结果中每个谱段进行一定的线性拉伸并合成彩色图像, 实现去雾, 如下图所示:
4 结束语
高维空间几何信息学下去薄云算法能有效去除薄云对图像清晰度的影响, 增强图像边缘信息, 基于Retinex算法和色度比的图像增强算法克服了图像色彩畸形与色彩偏灰等问题, 实现去薄雾。
摘要:遥感图像中存在的薄云薄雾在很大程度上影响着遥感图像清晰度, 因此, 本文针对含薄云薄雾的遥感图像分别提出了基于高维空间几何信息学的去薄云及基于Retidx算法和色度比的图像增强去雾算法。
关键词:遥感图像,去薄云薄雾,计算机算法
参考文献
[1]周雨薇.基于多分辨率分析和变分的遥感图像增强与融合算法研究[D].南京理工大学, 2014 (08) :67-69.
[2]王敏, 周树道, 刘志华, 黄峰, 梁妙元.遥感图像薄云薄雾的去除处理方法[J].实验室研究与探索, 2011 (02) :56-58.