快速分割算法论文(精选9篇)
快速分割算法论文 篇1
0 引 言
多相图像分割是目前计算机视觉、图像处理等领域研究的难点和热点,在医学图像分割、遥感图像处理等方面具有重要的应用价值。其基本任务是根据图像的特征将图像自动划分为彼此邻接而且不互相重叠的多个区域,即将定义于矩形区域Ω上的图像划分为 一系列子 区域,这些子区 域应满足:。
近年来,变分方法为多相图像分割奠定了良好的理论基础[1],而源于统计力学的Potts模型[2]为多相图像分割提供了统一框架。若I( x) : Ω→R是定义于拟分割图像区域Ω上的图像强度,则多相图像分割的Potts模型可表达为如下能量泛函的极值问题:
且满足约束条件:
其中,表示各子区域的边界长度或曲面面积,Di( mi,x) 为各子区域特征参数mi的估计函数,βi和δi分别为参数估计项与长度项的惩罚参数。
在变分框架下,各子区域表达的自然选择是特征函数,即定义,且约束条件式( 2) 要求1。从而式( 1) 转化为如下可计算的能量泛函极值问题:
且满足约束条件:
当特征函数采用不同设计的方法时,上述模型可转化为变分水平集模型、离散标记函数模型以及Gamma收敛模型。下面简单介绍一下这三种模型框架。第一种,变分水平集方法[3]充分利用了光滑水平集函数的Heaviside函数为二值标记函数的特性,其定义为,其中水平集函数φi( x)通常定义为符号距离函数。Vese等[4]提出了用m个水平集函数的零水平集相 互交叉定 义2m个区域的 方案,约束条件式( 4) 、式( 5) 自然满足。Samson等[5],潘振宽等[6],Chung等[7]分别提出了采用n个、n - 1个和1个水平集函数来划分n个区域等价模型。第二种,离散标记函数方法则是采用具有离散值的标记函数来定义各区域的特征函数。标记函数既可以设计为多个二值的函数[8,9],也可以由取多个离散值的一个函数[10]来充当。第三种,基于Gamma收敛理论的方法则是依据物理学中相迁移的Modica-Mortola模型[11]等。当该模型取极值时,用其解逼近特征函数。
本文采用的是上述第二种方法,即离散标记函数方法,使用二值函数u∈{ 0,1} 作为特征函数。由于这类方案的特征函数是不连续的,故通常的方法是在计算时对离散变量进行凸松弛,并需对求取的结果重新阈值化后恢复出原问题的解。而本文提出的方法则无需凸松弛和阈值化的处理过程。
式( 3) 具有一般形式,其解法研究引起国内外许多学者的关注[12,13,14]。Lellmann等[12]为总变差项引入了一种线性加权变量形式,凸松弛后求解。Zach等[13]先凸松弛标记函数,通过引入辅助变量,交替迭代优化得到解。Bae等[14]提出了主 - 对偶模型,采用投影梯度算法求解。这其中最常用的方法为梯度降方法[4]、Split Bregman迭代算法[15]、对偶方法[16]等。其中,对偶方法和Split Bregman方法的计算效率都比传统的梯度降方法提高了很多。而本文以对偶方法为基础,充分利用KKT的条件和二值标记函数的特征设计出了较前面几种更快的算法,即改进对偶方法。
1 Potts 模型的传统算法
为了进行计算效率上的比较,本文的参数估计函数限于分段常值图像分割时[17]的形式,即Di( mi,x) = ( mi- I)2。由于式( 3) 为多变量优化问题,通常采用交替优化方法求解。即先固定特征函数,求出当前各区域的参数mi( i = 1,2,…,n) ; 然后固定mi,求关于特征函数ui( i = 1,2,…,n) 的极值问题。在以下讨论的各方法中,对参数mi的估计公式均相同,即:
式( 3) 为典型的受等式约束的优化问题。当对其特征函数u( x)∈{ 0,1} 凸松弛为u( x) ∈[0,1]后,其对应的关于{ ui}ni = 1的惩罚函数方法模型为:
其中ρ为惩罚参数。为简化计算,以下对于ui∈[0,1]的约束采用梯度投影法。
1. 1 梯度降方法
当采用标准的变分方法和梯度降策略时,式( 7) 的解为如下演化方程的稳态解:
对应ui∈[0,1]的投影公式为:
当迭代结束后,对的阈值化公式为:
1. 2 Split Bregman 方法
该方法源于图像扩散TV( Total Variation) 模型的研究[15]。其基本思想是引入辅助变量vi,使得新的能量泛函取极值时vi≈▽ui。同时,为避免惩 罚参数对 计算结果 的影响,引入Bregman迭代参数对结果进行修正。针对式 ( 7 ) ,相应的SplitBregman迭代优化公式为:
在计算过程中,式( 12) 的结果需采用式( 9) 将其解投影到[0,1]上。当迭代结束后,需采用式( 10) 对新的结果阈值化。
1. 3 对偶方法
对偶方法[16]是将式( 7) 的长度项表达为如下极大值问题:
从而将式( 7) 转化为如下极大极小值问题:
对于ui有:
对于可根据Chambolle[16]采用的KKT条件和半隐式迭代方法得到。
同前两种方法一样,式( 16) 的结果需采用式( 9) 将其投影到[0,1]上。当迭代结束后,需采用式( 10) 对新的结果进行阈值化处理。
2 Potts 模型的改进对偶方法
当不对ui进行凸松弛处理时,将式( 14) 代入式( 7) 并对ui∈{ 0,1} 采用Lagrange乘子法,得到能量泛函为:
且必须满足约束条件:
式( 17) 中λ为Lagrange乘子。
当→qki固定时,对ui求变分得:
由式( 17) 、式( 18) 的极值问题的KKT条件知λi≥0,且由ui∈{ 0,1} 可知|2ui- 1 | = 1,故由式( 19) 可得λi= | Aki| ,其中:
从而由式( 19) 得:
当ui固定时,由式 ( 17) 和Chambolle[16]采用的KKT条件知:
且ηi≥0。当ηi= 0,ηi≥0时分别得:
即|。对于i用梯度降方法由式( 22) 得:
再由半隐式差分迭代方法得:
从而有:
Potts模型改进对偶方法的简明算法描述如下: ( 其中n为划分区域的个数,I为图像强度)
3 实验结果与分析
为验证算法的有效性,本节对3幅灰度图像使用梯度降方法、Split Bregman方法、传统对偶方法和本文提出的改进对偶方法进行图像分割实验。所有实验均在Intel Core2-i3-2105 CPU双核3. 1GHz,4GB内存PC机上,Matlab7. 0. 1环境下完成。迭代次数的选择依据为能量函数下降到达收敛态,即满足| Ek + 1Ek| / Ek≤ε,其中ε是一个非常小的正数。
对于本文所用多相图像分割模型式( 7) 来说,分割结果依赖二值标记函数初始化的位置,即存在局部极值。为了减小对初始化位置的过分依赖,本文采用具有全局特征的种子点初始化方法[5]。为了获得客观的比较结果,每一幅图像应用四种方法时,均采用相同的种子点初始化轮廓线。在计算中,以下参数取值固定: Δh = 1,Δt = 0. 1,ω = 1,τ = 0. 25,ε = 0. 001。
图1( a) 为人工合成的分段常值图像,图像大小为120×120,使用3个二值标记函数进行演化。图1. b为高斯噪声图像,噪声均值为0,方差为0. 01,图像大小为256×128,使用3个二值标记函数。图1( c) 为人脑MRI图像,大小为256×256,使用了4个二值标记函数进行演化。这三幅原始图像来源于文献[5]的实验图例。在分割结果图中,每个标记函数演化结束后所分割的区域将用不同的灰度加以表示。
图2所示为对图1( a) 的分割结果对比,相关系数取值为βi= 1,ρ = 10,δi= 10。图3所示为对图1 ( b) 的分割结果对比,因为存在噪声,所以长度项参数δi的值需要取得较大,相关系数取值为βi= 0. 2,ρ = 1800,δi= 1000。图4所示为对图1( c) 的分割结果对比,相关系数为βi= 0. 01,ρ = 110,δi= 200。从图2、图3和图4中可以看出改进对偶方法不但可以分割人工合成的分段常值图像、噪声图像,而且能够分割来源于实际的MRI图像。综合来看,改进对偶方法分割结果好于另外三种方法。
实验的运算时间以及迭代次数如表1所示。因为图1( b)是噪声图像,所以需要更多的迭代次数才能使能量下降趋于稳定。而图1( c) 的尺寸大于其它两幅图像,并且划分的区域个数也多于它们,所以在运算时间上是最长的。从表1中,可以清晰地看到梯度降方法、Split Bregman方法、对偶方法与改进对偶方法在计算效率上的差别。梯度降方法的演化方程中包含复杂的曲率项,所以收敛速度较慢,迭代次数最多,运算总时间最长。Split Bregman方法是通过构造简单快速的软阈值公式来替代传统方法的演化方程中的曲率项,并通过多变量的交替迭代来实现效率上的提高。对偶方法则是通过对偶变量的引入,克服演化方程由于半隐式固定点迭代方法引入规则化参数对结果造成的影响,来提高计算精度。而改进对偶方法无需通过上述三种方法中都包含的凸松弛和阈值化过程就能直接获取二值标记函数,所以计算效率更高。从表1中可以得出,不论是收敛速度还是计算时间,改进对偶方法都快于Split Bregman方法、对偶方法和梯度降方法,并且在处理噪声图像、MRI图像等灰度分布复杂的图像时,这种优势更为明显。
虽然改进对偶方法在计算效率上比另外几种方法提高了很多,但它在分割质量上并没有下降。图5为噪声图像图1( b) 的理想分割结果。为了便于从细节上判断各种方法分割质量的优劣,在图6中将图3和图5进行了局部放大。从图6的( b) 、( c) 、( d) 中可以很清楚的看到深灰色区域的边界上都不同程度有一些离散的黑色点( 黑色表示不属于任何区域,是漏分的) ,边界的形状也与图6( a) 有很明显的不同。而改进对偶方法的分割结果图6( e) 与理想结果图相似程度是极高的。我们可以进一步进行各方法分割结果准确性的定量分析和比较。表2列出了各分割结果图( 图3) 与理想分割结果图像( 图5) 对比的误差率( 分割结果与理想结果不一样的像素数与总像素数的比率) 。改进对偶方法的误差率要比其他方法低一个数量级。这样,无论是对分割结果图进行目测还是根据表2中的数据,都可以看出改进对偶方法的结果与理想分割结果是最为接近的。
4 结 语
本文对于采用了多个离散二值标记函数作为特征函数的Potts模型,提出了一种无需凸松弛和阈值化的改进对偶方法,详细给出了该方法的理论分析和求解算法,并通过实验将其与梯度降方法、对偶方法和Split Bregman方法相比较。数值实验表明该方法具有较高的计算效率,且实施简单。由于本文提出的算法在处理灰度分布较复杂、分割区域较多的图像时,计算效率上的优越性更为明显,所以对于医学影像的多器官分割与三维重建、卫星遥感图像的多资源分类等方面有着很好的应用前景。本文后续工作拟将该模型以及相应快速算法推广至纹理图像分割、隐式曲面图像分割和运动图像分割等更为复杂的图像分割问题。
摘要:Potts模型是一种通用的多相图像分割的变分模型,其极值问题需要迭代求解一系列偏微分方程。针对其求解过程计算效率较低的问题,提出一种基于对偶方法的快速算法。采用离散二值标记函数作为特征函数,利用Lagrange乘子法把对特征函数的约束加入能量泛函,然后引入对偶变量改写模型中的长度项,利用KKT的条件得到特征函数的二值解以及对偶变量的简单迭代格式。通过数值实验将该方法与梯度降方法、对偶方法和Split Bregman方法进行比较。实验结果表明,该算法的计算效率和分割准确性都高于其他三种方法。
关键词:多相图像分割,Potts模型,变分方法,对偶方法
图像区域生长分割算法研究 篇2
关键词:图像分割 种子区域生长 分割算法 NSP参数
中图分类号:TP31 文献标识码:A 文章编号:1674-098X(2015)06(c)-0066-02
Image Segmentation Algorithm Based on Region Growing
Wang Huasong
(School of Computer and Information Engineering ,Henan university,Kaifeng Henan,475000 China)
Abstract:Development of image processing technology makes more and more subjects need image processing.Color image processing technique is a new discipline, and it will occupy an important position in the later scientific development.In this paper,we introduced some current situation of image segmentation algorithm.we refer to some traditional image segmentation methods ,such as regional grow, threshold segmentation, edge segmentation, character segmentation.The partial similarity characteristic of pixels are used to build color histogram and analysis image segmentation algorithm based on seed region growing that makes the effect of color image is improved.The experimental results show the algorithm in this paper for the initial seed point selection of adaptability and more robust.
Key Words:Image Segmentation;Seed Region Grow;Segmentation Algorithm;Neighborhood Similarity Parameter
随着各种科技的发展以及图像的应用,人们越来越关注图像的处理。如生活中的超市和商场,为了有效的分类和管理库存,对商品进行存储编排;还有网络信息的传播管理使用数据在传输,由于设备限制需要对数据进行压缩,这里也需要对图像和视频进行分割。
计算机的发展的迅速,为人们的生活带来了便捷,同时也带动了一大批科技的突飞猛进,在近代军事、科教、工程建设、工农业生产、气象预测、天文学、地理测绘以及医学等领域中,人们更多的选择处理的方式是利用图像信息来解决改善问题,做出判断。在图像研究应用里,人们一般对图像中某些特定部分感兴趣,笔者称它为“感兴趣区域”或者“研究区域”。图像分割就是把图像分成若干个特定的、具有独特性质的区域并划分感兴趣目标区域的技术和过程。现在已经有了许多各种用途的分割算法。
1 分割算法简介
人眼能够识别很多颜色,所以在人们眼中有大千世界的姹紫嫣红,我们能够从一大堆物品中寻找到感兴趣的物品也得益于人眼的这一特性。但却很难在灰度图片——譬如黑白照片中找到想要的东西,因为在这些图像中,想要找的部分和整体背景很难区分开来。
常用方法如表1所示。
综上所述,解决彩色图像分割问题要处理好以下几个问题。
(1)怎样把每个像素的全部信息解构出来,然后运用算法将这些离散的信息整合,避免过多丢失。
(2)分割色彩空间选择,不同的空间优劣不同,这里并没有一种统一的、大众化的彩色空间来处理所有的目标图像。
(3)分割算法的选择,随着时间技术的发展,发展出很多类型和效用的算法,运用哪种算法处理图像也是一个难以抉择的问题。
这些问题是相互联系的,并不能一味解决某个问题而忽略另外的问题。使用者要用发展的眼光科学地同时看待这些影响,尽力选出能匹配三者的最优算法。目前没有这样的算法,这就要求使用者需要在解决图像分割问题的过程中,根据情况根据环境影响来选出最适合的算法。
2 基于种子点区域生长的分割算法
2.1 区域生长算法
区域生长(region growing)是指将目标区域中的某个感兴趣区域通过生长来得来完全的目标区域的算法。
它的基本做法是:将具有同质性(具有共同性质,一般指像素区域之间)的像素区域集合起来生长出更大的区域。在每一个感兴趣区域先选一个种子,然后根据人为需要的准则把种子区域以及它的具有同质性的邻域包含进来,进而一步步生长。然后重复迭代这一过程,一直到所有的像素都检测过却没有再符合的,然后确立我们的目标区域。
2.2 使用同质性参数的区域生长算法
该文选择的算法有两个要求:一是种子点的选取,可以采用更具适应性的自动选取;二是种子生长过程中,邻域相似性阈值的取值,我们在这一步进行优化处理,使用NSP参数来作为同质性与否的标准,在目标邻域中找出符合条件的同质性区域来持续生长。
现有的区域生长分割的算法有很多,一般是基于灰度图像的处理,但是彩色图像拥有的信息是灰度图像远远不及的,这也使得彩色图像的处理上有很多改进的地方。一般对于彩色图像的处理是根据灰度图像的分割算法,再结合其他的多种分割方式,这里并没有一个统一的行之有效的彩色图象分割算法。
3 结语
相较于传统的种子生长算法,本文算法中以NSP参数来选取种子点,从算法时间复杂度的角度来说算法效率有较大提高,有利于之后的区域生长,因而能取得更好的分割效果。实验的结论也证明了文中的算法在彩色图像分割上,取得较好的效果。
参考文献
[1]章毓晋.图像处理和分析[M].北京:清华大学出版社,1999.
[2]冈萨雷斯,伍兹著.数字图像处理[M].2版.阮秋琦等,译.北京:电子工业出版社,2004.
[3]薛丽霞,罗艳丽,王佐成.基于帧间差分的自适应运动目标检测方法[J].计算机应用研究,2011(4):1551-1552.
[4]H D Cheng,X H Jiang,Y Sun et al.Color image segmentation:advances and prospects[J].Pattern Recognition,2001,34(9):2259-2281.
[5]林开颜,吴军辉,徐立鸿.彩色图像分割方法综述[J].中国图像图形学报,2005,10(1):1,10.
快速分割算法论文 篇3
立体匹配是双目立体视觉系统中最重要也是最困难的一部分, 是三维重建的核心技术。立体匹配实际上是对左右两台摄像机从不同视点看同一景物, 在左右两幅图像重叠区域寻找对应点的过程。它利用空间物体点在左右摄像机中的成像模型来获取成像偏差的过程。按照约束方式的不同, 立体匹配算法可分为区域匹配算法和全局匹配算法。按照匹配基元的不同, 立体匹配算法分为基于区域的匹配算法、基于特征的匹配算法和基于相位的匹配算法[1]。然而, 基于区域的匹配算法对光照强度和对比度的变化非常敏感, 同时匹配窗口的选取也是一个难点, 当图像存在纹理特征重复和遮挡现象比较严重的情况下, 会引起匹配混淆, 错误匹配概率较高。基于全局的匹配算法, 如图割算法[2]、置信度扩展[3,4]和动态规划[5]等算法能够对整个图像进行有效的约束, 匹配结果也较局部匹配算法精确, 但是实时性不好, 匹配时间过长。
本文主要是针对局部匹配算法和全局匹配算法的缺点和不足, 采用了一种基于区域匹配与全局匹配算法相结合的算法, 来提高双目立体匹配的效率, 增强立体匹配算法的实时性。首先, 利用均值漂移算法[6]对左右两幅图像进行彩色图像分割, 再使用NCC相似度测量计算相关度, 得到初始匹配视差图;其次, 引入置信度的概念, 针对大的遮挡区域和低纹理区域中置信度低的区域, 取邻域相关系数最大的视差值;最后, 对边缘像素进行修正, 并对整个视差图进行滤波从而得到效果精确的视差图, 用来检验匹配算法的精确性。
2 基于均值漂移算法的彩色图像分割
在双目立体匹配中, 图像分割对获取视差平面方程有着重要作用。图像分割主要是根据图像中的颜色信息, 将颜色相同或者相似的相邻像素点划分为同一个区域, 从而将整幅图像分割成颜色相同或者近似的区域, 并将同一个区域内所有像素点的视差分布用某个视差平面方程来表示, 以此得到图像的视差图。Fukunaga[7]首先提出了均值漂移算法, Cheng[8]改进了均值漂移算法中的核函数和权重函数, 并将其应用于聚类和全局优化, 从而扩大了该算法的应用范围。近年来, 均值漂移算法也被广泛应用于图像分割和追踪等计算机视觉领域, 并取得了较好的效果。
均值漂移算法是结合图像像素点的颜色信息和周围空间的分布特性之间的关系, 沿着平均梯度方向找出每个像素点的相似颜色收敛点, 根据收敛点的不同而划分不同的区域, 从而实现图像分割。
改进的均值漂移定义如下:
其中, GH (xi-x) 为不同样本点ix到中心样本点x的不同距离对偏移向量的不同贡献而引入的核函数权值,
H为一个对角矩阵,
从而, (1) 式可以变为
G (x) 为核函数, 它决定了采样点ix与核中心x之间的相似性度量;本文采用单位高斯核函数, 令
前面 (5) 式可以变为如下,
Mh (x) 表示加权平均偏移向量, 指向概率密度梯度方向, 则mh (x) 可以看成是样本点x沿着概率密度梯度方向偏移后的样本点。在已知G (x) 和w (xi) 的情况下, 根据式 (8) 进行迭代会收敛到待漂移样本点附近的概率分布密度峰值处。迭代步骤如下:
(1) 首先, 在特征空间中任意选择初始搜索区域圆, 设置其搜索半径和误差阈值;
(2) 根据式 (8) 计算圆中采样点的均值mh (x) , 判断是否满足||mh (x) -x||<ξ, 则停止循环, 否则进入步骤3) ;
(3) 令x=mh (x) , 继续返回第一步开始循环。
采用均值漂移算法对图像进行分割之后的效果图如图1所示。
3 区域匹配
区域匹配算法主要是以一幅图像中某一个待匹配点的灰度邻域作为匹配模板, 然后在另外一幅待匹配的图像中搜索具有相似灰度值分布的对应点邻域, 从而完成两幅图像的匹配。区域匹配效率高, 而且实现也比较简单。但在匹配的过程中也需要考虑匹配窗口的大小, 而且搜索过程也需要满足一定的阈值条件。区域匹配中代价函数是用来计算图像间像素的相似性的测量函数。常用的代价函数主要有绝对灰度差和SAD (sum of absolute difference) , 归一化互相关NCC (normalized cross correlation) , 灰度平方差和SSD (sum of square difference) 等。
对于立体图像对, 假设I1和I2分别表示左右图像对的灰度函数, I1 (x, y) 和I2 (x, y) 分别表示左右图像坐标为 (x, y) 的像素点的灰度值, (x, y) 为左图像中心像素点, d表示该点的视差值, 那么, 上述相似性度量函数公式为:
绝对灰度差和S A D
归一化互相关N C C
灰度平方差和S S D
经过实验结果对比, 决定选用NCC作为区域匹配的测度函数。各代价函数求得的视察效果图如图2所示。
区域匹配中, 匹配窗口的大小难以选择, 所以本文采用自适应窗算法, 该算法详细步骤如下:
(1) 设定初始匹配窗口的大小为3*3;
(2) 将窗口的沿上、下、左、右四个方向分别向外扩展一个像素点的大小, 判断此时窗口内包含的像素点是否超过规定阈值, 若超过, 则停止, 否则继续执行下一步;
(3) 记录此时窗口的大小, 以左图像的该像素区域窗口作为模板, 在右图像中进行匹配, 记录此时得到的视差值为d1, 之后再以右图像的该像素区域窗口作为模板, 在左图像中进行匹配, 记录此时得到的视差值为d2;
(4) 比较d1和d2的大小, 若d1=-d2, 则记录此像素点视差值为d=d1, 否则令d=0。
4 置信播算法进行模板视差最优分配
通过区域匹配得到的视差平面模板不够精确, 只考虑了模板内像素点之间的影响, 而没有考虑到区域块间的相互影响。本文采用全局匹配算法—置信传播算法对初始视差平面模板进行全局优化, 从而得到更加精确稠密的视差图。置信传播算法主要是利用消息传输和置信度传输机制来实现全局能量函数的最小化的。
4.1 置信传播算法原理
将马尔科夫随机场应用于立体图像对中, 将立体图像对中的参考图看成是一个无向图V, 每个像素点看成一个节点X, 每个像素点的视差值看成是该像素点的状态, 即无向图的势函数, 建立图像的马尔科夫随机场模型。此时, 求取立体图像的最优视差分布即可看成是求马尔科夫随机场的最大概率分布。通过对立体匹配过程中不同区域视差规律的分析, 利用贝叶斯定理得到的马尔科夫随机场后验概率分布可简写为:
其中D为图像的视差分布, I为立体图像对, E为全局能量函数。
由 (12) 可知, 求取马尔科夫随机场的最大概率分布的过程即是求立体匹配全局能量函数最小化的过程。即求马尔科夫随机场分布最大后验概率就相当于通过置信传播算法求取图像的精确稠密视差图。采用置信传播算法就是采用消息传输机制实现置信度最大化, 即实现马尔科夫随机场最大概率分布, 即是实现全局能量函数的最小化。
定义全局能量函数为:
其中d表示整幅图像的视差分配, N表示图像中所有像素的四邻域点集, dp表示点p所分配的视差值, 平滑项V (dp, dq) 表示两相邻像素点p和点q分配视差dp和dq时的视差不连续惩罚量, P表示图像中像素点的集合, 数据项Dp (dp) 表示p点视差为dp时非相似性测度。若某个视差分配使该全局能量函数最小, 则该视差分配即为图像的最终视差图。
置信传播算法的消息迭代传输:
mtp→q (dq) 表示第t次迭代时点p传输给视差值为dp的邻域点q的消息, Ω表示视差搜索空间范围, N (p) 表示点p的四邻域集, N (p) q表示点p的三邻域集, 它不包括接收消息的点q。
经过T次迭代后, 消息传输趋于稳定, 此时可通过置信度传输计算图像中各个像素点的置信度, 计算点p置信度的公式为:
图中各个像素点的最佳视差可以通过最小化置信度获得, 计算点p的最佳视差d*p的公式为:
4.2 置信传播算法的改进
置信传播算法是在像素点之间的置信度传播, 图像中像素点多, 数量庞大, 也大大增加了算法计算量。而且图像中可能存在单个像素点畸变, 如果使用这些畸变像素点进行消息传输, 会大大降低算法的精度。
本文引入图像分割的思想, 采用基于分割区域之间的置信度传播, 用每个分割区域代替单个像素点, 显著提高了立体匹配的速度。
5 实验结果
本文实验所采用的立体图像对来自于美国Middlebury大学计算机视觉研究中心提供的立体图像数据库。其中主要对384x288的Tsukuba测试图像进行求取视差图的仿真实验。计算机硬件条件为:双核CPU, 主频为1.99GHz, 内存为2G。软件编译环境为VC2008和Matalb2008。本文采用BM (Block Matching) 、SGBM (Semi-global BM) 以及GC (Graph Cut) 算法求得的视差图分别与本文算法所求得的视差图效果以及时间上进行比较, 视差效果图对比如图3所示, 匹配耗费时间对比列于表1。BM、SGBM速度快, 但视差图效果不好, GC视差效果好, 但熬时多, 本文匹配算法结合各种匹配算法的优缺点, 在精度和速度之间进行权衡, 得出的视差图更加精确, 且速度与单独使用全局匹配算法—GC图割算法相比, 有了很大的提高。
6 结语
本文采用的是区域匹配与全局匹配相结合的立体匹配算法, 解决了区域匹配算法存在的一些问题, 如匹配窗口的大小难以选择、若左右两幅图像存在重复结构的纹理特征或者存在遮挡现象引起的匹配混淆等。采用改进的置信传播算法, 用分割的区域块代替原始的像素点之间的匹配计算, 减少了匹配所用的时间, 同时也可以得到精确稠密的视差图。
参考文献
[1]邓红梅, 吴四夫.基于相位相关算法的研究与实现.信息技术.2005 (4) :19-20.
[2]Pedro F.Felzenszwalb, Ramin Zabih, Dynamic Programmingand Graph Cut Algorithms in Computer Vision[J].In IEEE Trans-actions on Pattern Analysis and Machine.Intelligence, 2011:721-740.
[3]Q.Yang, L.Wang, R.Yang, H.Stewenius, and D.Nister“, Stereomatching with color-weighted correlation, hierarchical beliefpropagation, and occlusion handling, ”[J].IEEE Transactions onPattern Analysis and Machine Intelligence, 2008 (31) :492-504.
[4]Klaus, A.Sormann, M.Karner, K.Segment-Based Stereo Match-ing Using Belief Propagation and a Self-Adapting DissimilarityMeasure.Pattern Recognition, 2006.ICPR2006.18th Interna-tional Conference, 2006:15-18.
[5]Y.Deng.X.Lin“.A fast line segment based dense stereo algo-rithm using tree dynamic programming”[J].In ECCV, 2006:201-212.
[6]Comaniciu D, Meer P.Mean shift analysis and applications[C].International Conference on Computer Vision, 1999:1197-1203.
[7]Fukunaga K, Hostetler L D.The estimation of the gradient ofa density function with applications in pattern recognition[J].IEEE Trans on Information Theory, 1975, 21 (1) :32-40
[8]Cheng Y Z.Mean shift, mode seeking, and clustering[J].IEEE Trans on Pattern Analysis and Machine Intelligence, 1995, 17 (8) :790-799.
二维Otsu阈值分割算法的改进 篇4
关键词:图像分割;阈值分割;Otsu算法
中图分类号:TP312
在图像处理、模式识别和计算机视觉领域,图像分割对于许多图像分析和处理的任务来说是一个基石。因为人们往往仅对图像中的某些部分感兴趣,所以希望将这些相关区域分离并提取出来以进行进一步的应用,如进行特征提取和测量。图像分割是解决此类问题的方法。图像分割是把图像分成各具特征的区域并提取出感兴趣目标的技术和过程。图像分割技术是一项计算机领域里的经典的研究课题,计算机视觉中的图像理解包括目标检测、特征提取和目标识别等,都依赖图像分割的质量。
因为分割质量的好坏将直接影响图像处理的后续工作的进行,所以对图像分割的研究一直是图像技术研究中的热点和难点之一。到目前为止已经出现了许多图像分割技术,如:基于阈值的分割方法、基于区域的分割方法、基于边缘的分割方法以及基于特定理论的分割方法等。其中阈值分割算法是应用在图像分割领域的最流行的技术。阈值分割是最早提出的图像分割方法之一,具有简单、快速的优点。阈值分割算法的基本思想是通过处于图像灰度取值范围之中的灰度阈值将图像划分成不同的区域,从而达到分割的目的,其中最常见的一种方法,是将图像划分为两部分,即前景和背景。阈值分割的关键是阈值的选取。阈值分割算法具有悠久的历史,并广泛应用于图像分析与目标识别等方面。常用的阈值分割算法有最小误差法、最大类间方差法、P-tile法、双峰法、灰度直方图凹度分析法、最大熵法与Otsu方法等。
在这些阈值分割算法中,Otsu法是最流行的方法之一。由于Otsu法拥有计算简单、实时性高、鲁棒性强等优点,所以被广泛使用。Otsu法是由日本人大津首先提出的,也称“大津阈值法”或“最大类间方差法”。该方法是基于图像中前景和背景两类别的可分离性提出的。在一些免费的或是商业的软件上,如GIMP或是MATLAB,都采用Otsu法来进行图像的自动阈值分割。在图像阈值分割中,确定最佳的阈值t*往往是基于估计的位置和散度。像其他的方法一样,Otsu方法采用取样的方式和样本分布的偏差来估计位置和散度。然而,如果这些图像的分布是非常倾斜的或是有异常数据等情况出现时,Otsu分割算法提供的结果通常不令人满意。为了解决这一问题,我们提出了一种基于中值的Otsu分割方法,并且它与原来的Otsu方法相比可以得到非常令人满意的结果。
假设在灰度值为L的灰度图像中,灰度值为i的像素个数用ni表示,总的像素个数用n表示;pi表示灰度图像中灰度值i出现的频率,则pi=ni/n。将图像中的像素按灰度值用阈值t分成两类,设为C0和C1,其中C0={0,1,…,t},C1={t+1,t+2,…,L-1}。
则这两类像素出现的概率分别是:
ω0= pi= ω(t),ω1= pi=1- ω(t)
这两类像素出现的均值分别是:
μ0= i = ,μ1= i =
图像总均值表示为:
而且我们可以发现:
设ω0和ω1代表前景和背景的概率。μ0,μ1,μT表示前景,背景和整个图像的灰度值的平均值。设表示两类的类间方差,则
最终,最佳阈值t*为
传统的二维Otsu法是通过均值来确定最佳阈值,对于那些直方图呈双峰分布的图像,该算法具有十分优秀的分割效果。然而,因为均值的鲁棒性较差,若直方图是单峰的或是接近单峰的时候,亦或是有异常数据时会失败。
我们知道,当直方图的分布是倾斜的,或当有异常数据等情况出现时,中值比均值具有更强的鲁棒性。所以我们用中值来代替原式中的均值,以尝试获得更好的阈值和分割结果。
原式中的μ0,μ1,μT可以被中值m0,m1,mT所替代,于是在C0和C1的类间方差可以重写为
最优的阈值t*为
在验证本文的实验中,传统的Otsu方法和我们改进的Otsu方法都在Visual C++ 2008软件上进行测试,应用的计算机的CPU型号是AMD Athlon 7750 Dual-Core 2.7GHz,内存是2G RAM,系统是Windows XP platform。通过实验我们可以发现改进的Otsu方法得到的阈值分割的结果是令人满意的,而传统的Otsu方法得到的阈值分割的结果并不理想。
结论:在本文中,我们提出了一种基于中值的Otsu图像阈值分割算法。传统的二维Otsu方法对于双峰分布的直方图提供了令人满意的结果,但是,如果直方图是单峰的或是接近单峰时所得到的结果并不理想。我们知道,当直方图的分布是倾斜的,或当有异常数据等情况出现时,中值比均值具有更强的鲁棒性。在这样的情况下,我们用中值取代均值来进行背景和前景以及整个图像的Otsu法分割。与原来的Otsu方法相比,这种方法提供了更优的阈值和令人满意的阈值分割的结果。
参考文献:
[1]W Niblack.An Introduction to Digital Image Processing[M].Prentice Hall,Englewood Cliffs,NJ,1986:115-116.
[2]J Sauvola and M Pietikainen.Adaptive Document Image Binarization[J].Pattern Recognition,2000,33(2):225-236.
[3]B Gatos,I Pratikakis and S J Perantonis.Adaptive Degraded Document Image Binarization[J].Pattern Recognition,2006,39(3):317-327.
[4]F Moghaddam and M Cheriet.A Multi-scale Framework for Adaptive Binarization of Degraded Document Images[J].Pattern Recognition,2010,43(6):2186-2198.
[5]C H Chou,W H Lin and F Chang.A Binarization Method with Learning-build Rules for Document Images Produced by Cameras[J].Pattern Recognition,2010,43(4):1518-1530.
[6]Y T Pai,Y F Chang and S J Ruan.Adaptive Thresholding Algorithm:Efficient Computation Technique Based on Intelligent Block Detection for Degraded Document Images[J].Pattern Recognition,2010,43(9):3177-3187.
[7]Chierr Hsing.Chou,Werr Hsiung Lin,Fu Chang.A binarization method with learning build rules for document images produced by cameras[J].Pattern Recognition,2010,43(4):1508-1530.
作者簡介:杨小鹿(1991-),男,吉林省长春市人,本科,研究方向:计算机科学与技术学院。
快速分割算法论文 篇5
图像分割是图像处理中基本而关键的技术,其目的是把图像分成各具特性的区域并提取出感兴趣的目标,为后续的分类、识别和检索提供依据,分割结果影响甚至决定图像分析与理解的准确程度。图像分割方法主要包括阈值法、边缘检测和区域跟踪法等,其中,阈值法是图像分割中最基本,使用最为简单的方法。常用的阈值法有最大类间方差法、最大熵原则法,最小误差法及最小偏态法以及这些方法在二维空间上的推广方法等[1]。在这些方法中,最大类间方差法是一种统计判决法,这种方法不需要人为设定其他参数,是一种自动选择阈值的方法。根据阈值的个数,图像阈值分割可分为单阈值分割和多阈值分割,而多阈值分割问题可转化为一系列单阈值分割问题来解决,但这需要在全灰度范围内搜索一个最佳门限组合,耗时较多,难于实际应用,为了简化计算,可利用遗传算法[2]、粒子群算法[3]等来搜索最佳阈值,提高处理速度,满足实时性要求。
本文先使用独立峰值对图像的直方图划分为若干灰度区域,缩小搜索范围;然后在分割后的区域内采用改进粒子群优化的最大类间方差求出各个区域的最佳阈值,取得较好的分割效果。对标准粒子群算法改进包括采用基于雁群启示的线性递减惯性权重,其优点在于使粒子飞行方向有较好的的多样性;而且加入变异概率,变异作为一种随机搜索,可以使微粒群体获得新的个体,使算法有可能搜索未知的空间,增强全局搜索能力,迭代后期仍有可能继续搜索下去,减小陷入局部最优解的可能性,提高优化结果的质量。
1 基于最大类间方差的阈值选择
最大类间方差即大津法(Otsu)[4],其基本思想:灰度图像由目标与背景两大类构成,由于类与类之间的差异较大,而类的内部具有相似性,所以当以一个阈值将图像分割为背景和目标并分别求出它们的方差,若方差之和最大,则此时的阈值即为最佳阈值。
假设一幅具有灰度级为L的图像,被阈值为t分割,g(i) 表示灰度为i的像素数,目标部分的像素数为M0(t),背景部分的像素数为M1(t),目标部分的均值为μ0(t),背景部分的均值为μ1 (t),则两组间的方差公式:
最大方差
从另一个角度理解Otsu,其实就是寻找两个波峰之间在统计意义上的最佳波谷。因此,为了提高分割速度,可以先将图像分割为若干个待分区域。如图1所示,在区间(A,B),(B,C),(C,D)各个区域内分别用Otsu算法求阈值,可以很快地将图像进行多阈值分割。
由上面的分析可知,实现准确的多阈值划分,对直方图进行准确的峰值定位是很重要的,这一过程称为“独立峰值划分”[5]。由于受噪声和光线的影响,通常在图像的直方图中会出现局部最大,即“伪峰值”,如图2所示。其中A,D均为伪峰值,应该舍弃,为此必须进行筛选,按照以下法则进行:当搜索到一个疑似峰值时,先与其左右相邻的两个极小值比较,若差值大于一定的阈值,则认为是峰值,否则用与其相邻两个峰值中最大那个代替。按照这个法则,A,D将分别被B,C取代,只需要在(B,C)内寻找最佳阈值。
假设图像直方图可以分为N个区域,其中每一个区域又可以分为目标和背景两类,按照式(1)计算出各自的最大类间方差,则整个图像对应最大类间方差总和为:
对应的最佳阈值:
2 标准粒子群优化算法
粒子群优化算法(Particle Swarm Optimization,PSO)是基于群体智能(Swarm Intelligence)理论的优化算法。粒子群算法是 Kennedy等于1995 年提出的它模拟了鸟群飞行觅食的行为,通过鸟之间的集体协作使群体达到所期望的目的[6]。粒子群算法已成功地应用于优化问题,解决了大量的工程实际问题,如无功优化、多边形近似、组合优化。实践表明,粒子群算法是一种高效的优化算法。
PSO算法核心思想就是“速度-位移”搜索。优化问题的每一个可能的解都是搜索空间中的一只“鸟”,算法中称之为“粒子”,根据粒子对环境的适应度将群体中的个体移动到好的区域。这些粒子在搜索空间中根据自身和同伴积累的经验调整自己的搜索速度,由搜索速度改变其在搜索空间的位置,以期最终进入中可能的最优解空间区域。
在一个N维的搜索空间中有m个粒子,粒子i(i=1,2,…,m)的位置Xi=(xi1,xi2,…,xiN),其飞行速度记为Vi=(vi1,vi2,…,viN),搜索到的最优位置为Pbesti=(pbesti1,pbesti2,…,pbestiN),整个粒子群所经历过的最好位置为Gbesti=(gbesti1,gbesti2,…,gbestiN)即为目前搜索到的最优解,同时粒子按照如下公式更新自己的速度和位置:
式中:ω是为惯性权重;c1和c2为加速常数;r1d和r2d是两个在闭区间[0,1]的随机数。
由式(3)可知:粒子当前的搜索速度由三部分组成:第一部分为粒子先前的搜索速度,它反映了粒子具有记忆(Memory)的特点;第二部分为“认知(Cognition)”部分,反映粒子对自身的思考;第三部分为“社会(Social)”部分,反映粒子间的信息共享与相互合作,粒子自身的认知将被其它粒子所模仿。
3 改进PSO优化的Otsu多阈值选择
3.1 PSO适应度函数的选取
最佳阈值的选取可以归结于无约束的最优化问题,在目标区域搜索一组阈值使得图像分割时的指标达到最优,在本文主要是通过式(2)来计算最大类间方差作为适应度函数。
3.2 粒子群算法分析及改进
设
写成矩阵形式:
式中:
由矩阵A得到其特征多项式:f(λ)=λ2+(φ-ω-1)λ+ω=0,则对应的特征值λ1,λ2为:
由式(5)及矩阵论相关知识可知,迭代收敛条件为:
由式(6)绘制出ω从0依次递增0.1直到1时的max(‖λ1‖,‖λ2‖)与φ的关系图如图1所示。同时绘制了max(‖λ1‖,‖λ2‖)在ω-φ平面的等值线[7],如图3所示。
由图3,图4得出的结论:
(1) ω=1时,max(‖λ1‖,‖λ2‖)不随φ变化,PSO处于收敛与发散的临界状态。
(2) ω=0.9时,max(‖λ1‖,‖λ2‖)几乎以1的概率收敛,ω越大收敛概率越大。
(3) φ较小时,max(‖λ1‖,‖λ2‖)<1的概率就越大。
(4) 由式(6)和式(7)得到,当φ满足条件φ<2(ω+1)是收敛的。
结合以上分析对标准粒子群算法作如下改进:
(1) 惯性权重ω。它反映了前一时刻的速度对当前速度的影响,ω越大,则当前速度越依赖于前一时刻的速度,同时搜索的步长会变大,使得全局搜索功能加强,ω越小,则相反,表现出局部搜索功能加强,结合上面的结论,以采取线性调制的办法:
其中由图3可选ωmax=0.9,ωmin=0.4,iter为当前的迭代次数,itermax为最大迭代次数。
(2) c1反映了粒子所记忆的最好位置对粒子当前速度的影响,c2反映了粒子群所记忆的最好位置对粒子当前速度的影响,在这里可以结合结论(4)选取:
即保证φ∈[4,4.1],其中:r1d,r2d为[0,1]的随机数。
(3) 最大速度vmax。它体现了粒子在一次飞翔中所经历的最大位置改变,若vmax太大,则粒子可能错过最优解,反之,粒子可能进入局部最优解,为此,在早期可以让搜索步长大些,这样能够迅速找到最优解存在的区域,到了搜索后期时应该减小搜索步长,进入局部搜素,提高搜索精度。为此可设:
iter为当前的迭代次数,itermax为迭代的最大次数:
(4) 群体规模M,它是算法搜索的起始点的个数,当M较大时一次搜索的范围就大,同时计算量变大,当M过小,容易出现粒子群“早熟”,本文取M=20。
(5) 速度更新公式的调整为:
由于式(3)中粒子飞行时总是从当前位置向当前粒子群的最优位置靠近,容易进入局部最优,为此可以使用雁群启示线性递减惯性权重(Geese-LDW)[8]的飞行方式,即适应度最优的粒子作为粒子总体的飞行方向,而后将粒子按适应度排序,各个粒子飞行时总是跟踪适应度排在它前面的且最近的粒子的飞行方向,也就是用gbest(i-1)d代替gbest(i-1)d,确定自己的飞行方向,这样就可以提高搜索精度。
(6) 具有变异特性的位置更新。
为了进一步提高粒子的局部搜索能力,可以在算法中引入变异,同时为了避免均匀变异的无法重点搜索的缺点,本文采用非均匀变异,即在一个区间[ci,di]中的粒子位置xi按如下式调整:
式中:δ,α均为[0,1]的随机数;β为非均匀变化程度的参数,一般取β=2,同时由于变异一般比较小,因此只需要对极少的一部分粒子进行变异,通常取粒子总数的0.02~0.05。
3.3 算法实现步骤
变量:粒子群规模M;第 i个粒子的位置X [i];速度V[i];适应值Fitness[i];最佳适应值FPbest[i];最佳位置XPbest[i]; 种群中粒子的最佳适应度FGbest;最佳位置XGbest;最佳粒子索引号Index;粒子的变异概率pm;最大迭代次数itermax。
Step1:初始化。首先将直方图划分为N个[Peaki,Peaki+1] (i=1,2,…,N) 区域,在各个[Peaki,Peaki+1]内进行随机分配粒子的位置X[i],用X[i]初始化XPbest[i]( 粒子历史最优位置);由式(10)计算v
Step2:迭代并更新参数。
① 用式(1)计算粒子适应度Fitness[i];
② 更新粒子的历史最优适应度和位置,if(Fitness[i]>FPbest[i]) { FPbest[i]= Fitness[i];
XPbest[i]=X[i];}else {FPbest[i],Fitness[i], XPbest[i]都不变;}。
③ 粒子群排序:将所有粒子按历史最优适应值排序,选出历史最优适应值最大的粒子作为头雁,其他大雁(粒子)依次向后排,整个种群所有粒子的历史最优适应值也要按照排列后的顺序进行更新。
④ 计算新的全局最优:头雁(适应度最好的粒子)的全局极值保持不变,后面每只大雁均以其前面那只较优大雁的个体极值作为其全局极值。
⑤ 更新粒子的速度:按照式(11)进行更新,在更新时,对当前种群的适应度情况进行判断,如果当前群体中有超过一半粒子的当前适应度比种群的历史适应度差,则用gbest(i-1)d代替gbestid,否则仍然使用式(3)更新自己的速度,同时检查速度是否越界。
⑥ 更新粒子的位置:先按照式(4)计算出粒子的位置,随机从粒子群中找出M×pm个粒子按照式(12)变异自己的位置。
⑦ 若迭代达到最大次数,就终止迭代,返回XGbest,即当前区域的最优值阈值,就是要获取的各个区域的最优阈值
Step3:阈值分割。
用得到的最佳阈值
4 实验结果与分析
该实验将改进PSO的Otsu多阈值图像分割与常规最大类间方差法进行了对比,并用VS 2008,Matlab 7.8和OpenCV 2.1软件进行了实现。实验环境:AMD AthlonⅡ2.0 GHz,内存2.0 GB;实验对象:256 ×256的 Lena图像(如图5)和 256 × 256的 Camera图像(如图6所示)。
表1给出了两种算法用于单阈值、双阈值和三阈值图像分割时的结果。从实验结果中可以看出粒子群算法能找到最优阈值,且通过比较运行时间,可以看出当进行单阈值分割时,常规算法比粒子群算法速度快,但是当进行多阈值分割时,粒子群算法明显小于常规算法,且并没有随着阈值数的增加而显著增加。这说明新算法大大提高了图像处理速度,体现了改进型粒子群算法在图像分割多阈值选取中的优越性。
图7和图8的图(a),(b),(c)分别为用最优阈值对图像进行处理后的单阈值、双阈值和三阈值分割结果。
5 结 语
本文将标准粒子群优化算法加入了变异因子,并且使用雁群启示的线性递减权重的位置更新方法,使得粒子群算法具有更好的搜索精度和较好的搜索速度。同时在确定最优阈值前进行了直方图的分割,进一步缩小了算法的搜索范围,加速了运算。将改进粒子群算法应用于最大类间方差多阈值图像分割中,较好地解决了多阈值选取中计算量过大的问题,并通过实验将其与传统最大类间方差法相比较,实验结果表明,新算法能更好地收敛到最佳阈值且结果稳定,大大缩短了寻找最佳阈值的时间,提高了图像处理速度,从而有利于图像的后续处理。但最大类间方差法是一种依据均匀性度量得到最佳阈值的方法,对信噪比较高的图像有很好的分割效果,而对信噪比较低的图像分割效果不是很理想,所以该算法有一定的局限性。因此,对最大类间方差法进行改进并与改进的粒子群优化算法相结合的图像多阈值分割方法将是作者今后研究的方向。
摘要:为了确定图像分割的最佳阈值,基于改进粒子群优化算法,提出了一种快速多阈值图像分割方法。首先引入独立峰值将直方图划分为若干区域,然后在各个区域使用最大类间方差法得到优化的目标函数,用具有非均匀变异特性和雁群飞行启示的线性递减惯性权重粒子群算法对目标函数进行优化,得到分割的最佳阈值,并用该阈值对图像进行分割。将分割结果与常规最大类间方差法的多阈值分割结果相比较,证明该算法不仅可以正确地实现图像分割,并可使分割速度大大提高。
关键词:图像分割,粒子群算法,非均匀变异,线性递减惯性权重,独立峰值,多阈值,最大类间方差
参考文献
[1]章毓晋.图像分割[M].北京:科学出版社,2001.
[2]薛岚燕,程丽.基于最大方差法和改进遗传算法的图像分割[J].计算机应用与软件,2008,25(2):221-222,247.
[3]徐小慧,张安.基于粒子群优化算法的最佳熵阈值图像分割[J].计算机工程与应用,2006(10):8-11.
[4]OTSU N.Athreshold selection method fromgray-level his-togram[J].IEEE Trans.on Systems,Man and Cybernet-ics,1979,9(1):62-66.
[5]王祥科,郑志强.Otsu多阈值快速分割算法及其在彩色图像中的应用[J].计算机应用,2006,26(1):14-15.
[6]KENNEDYJ,EBERTHART R C.Particle swarm opti mi-zation[C]//Proceeding of the IEEE International Confer-ence on Neural Networks.Piscataway,NJ:IEEE ServiceCenter,1995,Ⅳ:1942-1948.
[7]余欣梅.电网电容器优化模型及相关算法研究[D].武汉:华中科技大学,2004.
快速分割算法论文 篇6
1.1 毫米波成像技术概述
近年来, 极端主义和恐怖主义的出现, 使得新型反恐武器系统和特种装备需求大幅增加, 世界各大国都加大投入, 积极研制, 特别是用于反恐部队的新装备, 非常引人关注。毫米波成像技术在国际上属于领先技术, 欧美等国对我国也进行技术封锁。而成像算法是毫米波成像的关键技术, 它直接影响成像技术的水平。目前, 国内也开展了相关方面的研究, 但这些检测技术都需要配有复杂庞大的控制以及信号处理系统, 成本高昂, 而且检测时间都在秒的数量级;更关键的一点的是这些设备根本无法满足远距离检测的需要。
1.2 毫米波成像技术特点
毫米波的工作频率介于微波和光之间, 因此兼有两者的优点, 它具有以下主要特点:
1.2.1 极宽的带宽。
通常认为毫米波频率范围为26.5~300GHz, 带宽高达273.5GHz。超过从直流到微波全部带宽的10倍。即使考虑大气吸收, 在大气中传播时只能使用四个主要窗口, 但这四个窗口的总带宽也可达135GHz, 为微波以下各波段带宽之和的5倍。这在频率资源紧张的今天无疑极具吸引力。
1.2.2 波束窄。
在相同天线尺寸下毫米波的波束要比微波的波束窄得多。例如一个12cm的天线, 在9.4GHz时波束宽度为18度, 而94GHz时波速宽度仅1.8度。因此可以分辨相距更近的小目标或者更为清晰地观察目标的细节。
1.2.3 全天候特性。
与激光相比, 毫米波传播受气候的影响要小得多, 可认为具有全天候特性。
1.2.4 元器件小。
和微波相比, 毫米波元器件的尺寸要小得多。因此毫米波系统更容易小型化。
2 图像分割算法及图像预处理
2.1 基于最大类间方差的分割算法
该算法首先通过灰度图像获取图像的灰度直方图信息, 然后利用这些信息进行类间方差运算自动寻找最佳阈值, 最后将目标从图像进行分割出来。图像二值化处理是一种灰度处理, 二值化图像可以通过适当地分割灰度图像得到。如果物体的灰度值落在某一区间内, 并且背景的灰度值在这一区间之外, 则可以通过阈值运算得到物体的二值图像, 即把区间内的点置成1, 区间外的点置成0。
2.2 图像预处理的一般方法
图像预处理的一般有图像去噪、图像增强等方法。
2.2.1 图像去噪。
图像去噪的一般方法为滤波, 而中值滤波则是滤波中的典型。中值滤波是一种常用的非线性滤波技术, 其基本思想是用像素点邻域灰度值的中值来代替该像素点的灰度值。中值滤波一般采用一个m×n的滑动窗口, 从左至右, 从上到下逐行移动, 其中m为滑动窗口行数, n为滑动窗口列数。对滑动窗口内像素点灰度值进行排序, 选择排序像素集的中间值作为指定像素点的灰度值。
2.2.2 图像增强。
图像锐化是图像增强的一种, 它处理的目的是使模糊的图像变得更加清晰。在实际操作中, 针对引起图像模糊的原因进行相应的锐化处理。图像模糊的实质就是图像受到平均或积分运算造成的, 因此可以对图像进行逆运算, 使图像清晰化。但是能够进行锐化处理的图像必须有较高的信噪比, 否则锐化后图像中噪声的增加比信号还要多。因此在实际应用中要先去除或减少噪声, 再进行锐化处理。图像增强还有图像亮度增强, 轮廓增强等等。
3 图像分割方法
3.1 图像分割定义
图像分割, 就是把一个图像分解成它的构成成分, 以便对每一目标进行测量。图像分割是一个十分困难的过程。但其测量结果的质量却极大地依赖于图像分割的质量。有两类不同的图像分割方法。一种方法是假设图像各成分的强度值是均匀的并利用这种均匀性;另一种方法寻找图像成分之间的边界, 因而是利用图像的不均匀性。
3.2 常用分割方法
图像分割是图像由预处理转入分析的关键一步, 它作为一种基本的计算机视觉技术, 它在图像分析及模式识别中起着重要的作用。常用的图像分割方法:有基于直方图的分割方法, 有基于区域生长分割方法, 有基于边缘检测的分割方法。虽然已经提出了这几种图像分割方法, 但如果所处理的图像不同, 每种方法都会受到一定的局限。
3.2.1 直方图分割。
最简单的方法是建立在亮度值的直方图分析的基础上的。如果一个图像是由明亮目标在一个暗的背景上组成的, 其灰度直方图将显示两个最大值:一个是由目标点产生的峰值, 另一个峰值是由背景点产生。如果目标和背景之间反差足够高, 则直方图中的两个峰值相距甚远, 可选一个强度阈值T将两个最大值隔开。如果图像由两个以上成分所组成, 则直方图将显示多重峰值, 分割可以取多重阈值来完成。最大类间方差算法就是基于灰度直方图的图像分割算法。
3.2.2 区域生长。
区域生长 (region growing) 是一种根据事前定义的准则将像素或子区域聚合成更大区域的过程。基本方法是先在图像中挑选一个或一个以上的种子点 (因为毫米波图像中目标区域的灰度总是高于背景的灰度, 灰度最大点即是目标中温度最高的地方, 因此, 在应用区域生长法时, 一般选择灰度值最大的点作为初始种子像素点, 进行图像分割) , 种子点的数目等于被检测区域的数目;然后规定像素之间的相似性的准则, 最简单的是基于像素灰度值的准则。
3.2.3 梯度法。
第三种图像分割法建立在图像的不连续性基础上。此方法一般采用某种梯度运算 (边缘检测) 。从向量分析中知道, 梯度向量指向在坐标 (x, y) 的f的最大变化率方向。计算图像的梯度要基于在每个像素位置都得到了偏导数藜f/藜x和藜f/藜y。梯度运算最常用的是Prewitt和Sobel算子。Prewitt模板实现起来比Sobel模板更为简单, 但后者在噪声抑制特性方面略胜一筹。正如上文所说, 问题是一般边缘检测并不生成一条连续的边界, 故此法往往借助于一些边缘连接法以获得满意的连续边界。
结束语
随着毫米波成像技术的不断发展, 毫米波成像处理越来越受到人们的重视。各种各样的图像分割算法层出不穷, 而随着各种新的方法被引入到毫米波图像处理中, 毫米波成像算法的应用面将越来越广。
摘要:通过对毫米波技术与成像算法的研究, 重点研究了基于最大类间方差的快速图像分割算法。该算法根据最大类方差原理, 通过二分逼近逐次逼近最佳分割阈值, 相对于传统的最大类间分割方法提高了速度, 该算法也可以扩展到一般数字图像的分割, 其效果也较好。
关键词:最大类间方差,图像分割,成像算法
参考文献
[1]陶唐飞, 韩崇昭等.综合边缘检测和区域生长的红外图像分割方法[J].光电工程, 2004, 31 (10) :50-52.
[2]刘正东等.具有规则度约束的红外图像多层阈值分割方法[J].计算机工程, 2005, 31 (14) :13-15.
C#快速分割阈值灰度图像 篇7
图像分析在实际中已得到广泛的应用, 例如工业自动化, 在线产品检验, 文档图像处理等等。图像分割更是起到越来越重要的作用, 好像我们熟悉的计算机断层图像CT, X光透。
图像分割是从图像处理到图像分析的关键步骤, 可以从图像分割的结果的好坏直接影响对图像的理解。
在对图像的研究和应用中, 人们往往只对图像中的某部分特别感兴趣。这些部分通常称为目标或前景 (其他部分称为背景) , 它们一般对应图像中特定的、具有独特性质的区域。为了辩识和分析目标, 须要将它们分别提取出来, 在此基础上有可能对目标进一步利用。
2、图像分割的定义
用计算机进行数字图像处理的目的有两个, 一是产生更适合人类视觉观察和识别的图像, 二是希望计算机能够自动进行识别和理解图像[1]。无论是为了何种目的, 图像处理的关键一步是对包含有大量各式各样景物信息的图像进行分解[2]。从概念上来说, 所谓图像分割就是按照一定的原则将一幅图像或景物分为若干个部分或子集的过程。
在图像中用来表示某一物体的区域, 其特征都是相近或相同的, 但是不同物体的区域之间, 特征就会急剧变化。目前已经提出的图像分割方法很多, 从分割依据的角度来看, 图像的分割方法可以分为相似性分割和非连续性分割。相似性分割就是将具有同一灰度级或相同组织结构的像素聚集在一起, 形成图像的不同区域;非连续性分割就是首先检测局部不连续性, 然后将它们连接在一起形成边界, 这些边界将图像分成不同的区域。
图像分割研究领域和其他领域的发展过程类似, 发展至今, 人们对图像分割提出了不同的理解和解析。在不同的阶段, 研究者们根据研究的水平和实际要求提出了很多图像分割的定义, 目前广为人接受的是通过集合定义的图像分割[3]。
令集合R代表整个图像区域, 对R的图像分割可以看作是将R分成N个满足以下条件的非空子集R1, R2, R3……Rn:
(1) ∪Ri=R
(2) 对i=1, 2, 3……N, P (Ri) =TRUE
(3) 对任意i, j;i≠j, 有对Ri∩Rj=∅
(4) 对任意i, j;i≠j;P (Ri∪Rj) =FALSE
(5) 对i=1, 2, 3……N, Ri是连通的区域
3、图像阈值分割法
事实上, 到目前为止, 还没有一种完善的分割方法可以按照人们的意愿准确的分割任何一种图像。所以我们要根据实际图像中景物情况各异, 具体问题具体分析, 需要根据实际情况选择适合的方法。
阈值法是比较常用也比较简单的一种分割方法。根据统计, 当灰度图像有变化灰度的背景或本身有较大灰度范围的区域时, 进行视觉图像的分割会非常困难。这是因为对于灰度图像的分割来说明亮度是惟一的可用信息, 故这种问题是灰度图像本身固有的。阈值法是一种按灰度的幅度分割的方法。它把图像的灰度分成不同的等级, 然后用设置灰度门限的方法确定有意义的区域或欲分割的物体的边界[6]。
阈值法分割有两个主要步骤:
(1) 确定需要的分割阈值;
(2) 将分割阈值与像素值相比较以划分像素。
阈值处理的主要思路是, 对于输入图像的各个像素, 先确定某个亮度值 (即阈值) , 当像素亮度超过该阈值时, 则对应输出的像素设为0。所得到的也就是二值图像, 就是指图像上的所有点的灰度值只用两种可能, 不为“0”就为“255”, 也就是整个图像呈现出明显的灰度效果。
由此, 我们的做法是当f (x, y) 大于阈值t时, 令g (x, y=1;当f (x, y) <t时, 令g (x, y) =0。其中f (x, y) , g (xy, ) 分别为处理前、处理后的图像中处于 (x, y) 位置上的某个像素浓度值, t为阈值。而阈值处理后的值, 并非是1或者0, 而是采用HIGH与LOW。当要显示与原图像相同的效果时, 只需在程序中令HIGH=255, LOW=0即可。
4、直方图确定阈值
直方图能比较直观地看出阈值[5]。直方图 (histogram) 就是表示具有浓度值为i的像素有多少个的频度分布直方图。从数学上来说图像直方图是图像各灰度值统计特性与图像灰度值的函数, 它统计一幅图像中各个灰度级出现的次数或概率;从图形上来说, 它是一个二维图, 横坐标表示图像中各个像素点的灰度级, 纵坐标为各个灰度级上图像各个像素点出现的次数或概率。
在显示的直方图中, 我们可以看到有两个峰值, 这就是我们在图像中所谓的背景色和前景色。在日常应用中我们经常要把前景色跟背景色分离开来。那么我们的阈值就通常选两个峰值之间的谷底值。有时候目标和背景的灰度值有部分交错, 用一个全局阈值并不能将它们绝然分开。这时常希望能减少误分割的概率而选取最优淤滞是一种常用的方法。设一幅图像仅包含两类主要的灰度值区域 (目标和背景) , 他的直方图可看成灰度值概率密度函数的一个近似。这个密度函数实际上是目标和背景的两个单峰密度函数之和。如果已知密度函数的形式。那么就有可能选取一个最优阈值把图像分成两类区域而使误差最小[4]。
在实际的程序编译中, 考虑到即使有直方图显示要看出阈值也会多少有点误差, 所以本文采用了OTSU提出的类判别法算出阈值。使得程序不单只能显示直方图, 还能算出一个阈值给我们作参考。
C#实现OTSU计算阈值代码如下:
实际程序的灰度分割效果如下:
程序基于图1生成的直方图如图3:
两个主峰的山谷刚好差不多就在中央像素127.5的位置, 与程序生成的阈值121很接近。进一步说明程序的参考价值。
5、小结
本文主要介绍了灰度图像的阈值分割法, 采用的是直方图方法, 并通过程序运用OTSU算法算出一个阈值以作参考, 使得程序更加准确。程序实验结果表明, 本程序使用C#准确、稳定实现了灰度图像阈值分割, 为图像分割领域提供一种较通用的分割方法。
参考文献
[1]扬枝灵, 王开VISUAL C++数字图像获取.处理及实践应用[M]北京, 人民邮电出版社, 1998, 25-26
[2]钟志光, 卢君, 刘伟容等VISUAL C++NET数字图像处理实例与解析[M]北京:清华大学出出版社1999, 21
[3]井上诚嘉, 八木伸行, 林正树等C语言实用数字图像处理[M]北京:科学出版社, 1999, 16-18
[4]李兰友, 王学彬等VISUAL C#图像处理程序设计案例[M]北京:国防工业出版社, 1997, 153-154
[5]Philipsty, rosenfelda, sheraco (logn) bimodality analysis[J].patternrecognition, 1994, 13 (2) :208-210
新闻单元的自动快速分割方法 篇8
关键词:新闻视频,新闻单元,镜头检测,主持人镜头
1 引言
对于视频信息处理的关注正从低层特征转向视频内容中高层语义,然而,寻找一种通用的视频内容分析和理解方法非常困难。对于特定领域的视频,结合相应领域中的先验知识,可以使底层特征与高层语义建立某种联系变得相对简单。新闻视频是一种非常重要和常见的视频类型,在结构和内容上都有着显明的特征,这些特征为分析新闻视频的高层语义提供了重要线索[1]。
新闻节目由多个独立的新闻单元(News Story)组成,分割新闻视频中的新闻单元是新闻视频结构化、编目检索和语义信息分析的基础。新闻视频有比较固定的结构特征,除去片头和可能出现的广告外,其主体由一系列内容相互独立、具有完整的新闻要素并可单独理解的新闻单元组成。根据这一特点和新闻单元的语义,把1个视频新闻节目划分成5层结构,如图1所示,每个新闻单元由一个或多个视频场景组成。
新闻视频的特点是视频分析的重要线索,如果能够在原始的视频数据中找到与上述特征相关联的事件,利用上述特征可分析新闻视频,可进行报道划分。
2 视音频事件检测
2.1 镜头分割
镜头是视频的基本单元。根据镜头之间连接方式的不同,可以把镜头分为切变和渐变。2个镜头间的切变是将2个镜头直接连接在一起得到的,中间未使用任何视频编辑特效。镜头切变对应前一镜头的最后一帧图像与相邻镜头的第一帧图像之间视觉内容的突然变化。对镜头切变的检测一般采用特征量的变化来衡量视觉内容的变化,将视觉上的镜头切变转化为数学量上的变化。
在新闻视频中,镜头间的连接基本采用切变,这里采用基于投影函数的检测方法,投影函数具有很低的时间复杂度,对视频中的随机噪声有很好的抑制作用[2]。该方法中选取基于投影函数的特征,采用视频帧间差向量的欧氏距离FFD作为帧间距离,通过帧间距离与一自适应阈值的比较来判定镜头切变的存在。
首先将帧间差向量的长度作为帧间距离,即
式中:DHi,j是视频中第i个帧的第j个水平投影函数,DVi,j是视频的第i帧的第j个垂直投影函数值。
判断第i与i+1帧之间是否为边界的自适应阈值T(i)按如下方式确定:在视频帧序列中取第i帧为中心的一个滑动窗口,分别找出窗口范围内最大和次大的相邻帧的帧间距离,记为Dmax和Dsec-max,取自适应阈值
式中:a为某一常数,可根据视频类型的实际情况确定。镜头按下列条件判断第i和第i+1帧是否为边界
式中:N为滑动窗口的宽度。如果是滑动窗口中的最大值,并且大于滑动窗口中第2大值的a倍,则认为第i帧和第i+1帧之间存在镜头切变。该方法使用了镜头切变在时间轴上形成的模式信息,a相当于镜头切变形成的帧间差曲线的形状参数。
2.2 主持人镜头检测
主持人镜头检测主持人镜头是新闻单元检测的最重要依据,在自动处理大量视频时,为了避免事先为不同的新闻节目指定特定的主持人模板,需要构造一个通用模板和相应的算法。一般,通用模板算法比较复杂,检测精度也相对较低,而采用专用模板则可大大降低检测算法的复杂性,提高检测精度和检测速度。本文结合通用模板和专用模板检测算法,在检测新闻视频的第一个主持人镜头时,先采用通用模板检测算法检测第一个主持人镜头,当检测到第一个主持人帧时,把该主持人帧作为专用模板,采用基于专用模板的检测算法进行匹配。
通用模板可以预先选定,提取图像特征,并将特征数据集成在系统中作为检测依据。通用模板的构造可以采用推广的广义Hough变换[3],步骤如下:任意截取标准的主持人帧灰度图像,检测图像边缘,生成边缘图像,并去除边缘图像中的噪声和短小边缘;在边缘图像中边缘曲线的采样点上提取一组参数构成R数组,作为通用模板的特征数据。
专用模板与当前被检测视频序列相关,采用彩色直方图交运算(Color Histogram Intersection,CHI)。当采用CHI算法进行相似度的比较时,画面上不同位置的区域对检测所起的作用是不同的,因此对CHI算法作如下改进:将图像划分成若干个矩形区域,根据各个区域在检测中的重要性赋予[0,1]的权重,由于主持人居于画面中间或中间附近,一般给中间区域赋予较大的权重,而对边缘区域赋予较小的权重。
式中:Sim(A,B)∈[0,1],表示相似度,A和B分别为两幅图像的彩色直方图,n为彩色直方图bin的个数,而Ai(Y,U,V)和Bi(Y,U,V)则分别是直方图中第i个bin中的像素数目,r表示区域个数,wj则是第j个区域的权重。
2.3 语音检测
在音频方面,和新闻单元检测关系密切的音频事件为静音、环境音、语音3个类型。
第一步,静音与非静音的判别。静音与非静音的特征相对明显,较容易识别。利用音频短时能量和过零率特征可以有效识别静音[4],如果短时段的短时能量和过零率低于一个事先设定的阈值,则认为该段为静音。
第二步,语音与环境音识别。首先,根据前面特征分析,过零率、短时能量和频谱流是识别语音的有效特征,以这3个特征为分量组成特征向量,构造分类器,识别语音与非语音。音频流是连续的,通常音频类型不会频繁或突然交替改变。基于这个特性,可以识别类型的短时段进行平滑处理,尽可能地消除错误识别[4]。
3 新闻单元分割
在处理事件流时有两种方案:对视音频事件分别单独处理或先把视音频事件流合并,再对合并后的混合事件流处理[5]。前者需要2个事件流进行实现同步,对2个流中的事件起止点有一定限制,本文把视频和音频事件流合并为一个混合事件流,并且约定当视频事件和音频事件开始时间相同时,视频事件出现在事件流的前面。
为了在混合事件流中保持事件的时域信息,参考文献[5]把一个新闻节目转化为视音频事件的混合流。例如,在图2中,用字母(A,B,C,D)分别表示事件(主持人,非主持人,解说,静音),用字母后面的数字(0,1,2)分别表示相邻事件的关系(包含,重叠,相邻),图2显示了一个典型的新闻单元的原始视频转换成混合事件流,字母代表事件,数字表示和相邻的事件之间的时序间隔。
在图2所示的新闻单元中,首先是主持人场景,对该新闻作了简要报道,因此,该片断包含主持人和播音事件,这2个事件在时间上是重叠的,当视频事件和音频事件在时间上重叠时,视频事件排在音频之前,图中用A2,C1表示,其中数字2表示主持人场景和其前面的事件在时间上相邻关系,数字1则表示播音事件和主持人场景是重叠关系;接着是3个现场镜头组成的一个场景和一段解说、一段静音,由于现场场景和前面的播音在时间上是相邻关系,所以把现场场景表示成B2,而后的一个解说和现场场景是包含关系,静音则和解说是相邻关系,因此它们分别是C2和D1。
生成对应的数据流以后,根据事先对新闻节目的分析,归纳新闻单元对应的模板,利用字符串匹配算法,搜索与这些模板匹配的字符片断,确定新闻单元的出点和入点。对于匹配的片断,系统记录并统计,对于多次出现的未匹配片断,系统自动加入到匹配模板中。
4 实验结果
采用上述算法,对多个新闻节目进行单元划分,这些节目分别来自2个电视台在历史节目数字化和编目中的新闻节目,并截取新闻的详细报道部分(去除片头、提要及回顾等)。
首先对节目音频事件检测和视频进行镜头划分和关键帧提取,以镜头为单位检测视频事件,合并属同一事件的相邻镜头,并记录视音频事件的起止时间,分别生成视音频事件序列;然后按第3节的方法根据事件之间的时序关系合并视音频事件序列,生成事件数据流;最后,利用匹配算法在数据流中匹配各种可能序列,从而确定对应的新闻单元。表1给出了实验的部分结果。
实验结果表明,本文的算法对新闻节目单元检测较好的效果。不仅适用同类新闻节目,也同样适合多种类型混合的新闻节目库。
对实验中的错误分析,发现引起错误的原因有2个方面:1)事件检测错误导致的数据流错误;2)新闻单元结构和新闻单元边界的多样性。前者可以通过提高事件检测精度得到改善;而后者引起的错误应该采用其他辅助方法,单一采用本文算法有一定的局限性。
5 小结
新闻单元的计算机自动划分是新闻视频结构化的重要环节,是基于内容的视频检索、视频新闻主题检测和跟踪等研究的基础。本文通过检测特定的视频和音频事件,利用新闻节目中这些视音频事件出现的规律,通过与预先设定的模式匹配来分割新闻单元。采用该方法的新闻单元的自动定位,在某电视台保存的历史新闻节目编目工作中,发挥了很好的作用。
随着视音频处理技术的发展和节目制作水平的提高,新闻节目从内容到编排方式日益丰富,如果在本文的算法基础上,配合对节目部分视频画面和语音内容的理解,将提高划分准确性和对节目变化的适应性。
参考文献
[1]ZHUANG Y T,XIAO R G,WU F.Key issues in video summa-rization and its application[C]//Proc.Pacific-Rim Conference on Multimedia.Singapore:[s.n.],2003:885-889.
[2]LING J,LIAN Y,ZHUANG Y T.A new method for shot gradual transition detection using support vector machine[C]//Proc.4th International Conference on Machine Learning and Cybernetics.Guanzhou:[s.n.],2005,9:5599-5604.
[3]马宇飞,白雪生,徐光祐,等.新闻视频中口播帧方法研究[J].软件学报,2001,12(3):377-382.
[4]LIU Z,HUANG J,WANG Y,et al.Audio feature extraction and analysis for scene classification[C]//Proc.IEEE multimedia Work-shop.[S.l.]:IEEE Press,1997:343-348.
火焰图像分割算法研究 篇9
火灾识别中常用的图像分割方法有基于边缘检测的方法、阈值法、运动检测、颜色分割等。Qin Jiang将Ostu阈值选取与Canny结合检测大空间带噪声图像的火区[1];王思嘉等根据火焰的高亮特点使用温度阈值分割可疑火区[2];Qing Liu等使用自适应背景更新的背景差法分割火焰区域[3];文献[4]用改进的背景差法区分前景和背景[5];文献[6]提出了一种将背景差法与帧差法结合在一起的算法[5]。彩色图像的颜色分割也被广泛的用于火灾识别中。本文对火焰图像的边缘检测的方法、阈值法、运动检测、颜色分割等进行研究、仿真及对比分析。
1 火焰图像分割算法
1.1 基于边缘检测的分割
Canny边缘检测目前公认的经典边缘检测算法, 该算法已在数字图像处理中获得了广泛应用。应用Canny算法的步骤是:
(1) 用一个二维的高斯滤波器与原始图像做卷积来平滑图象, 其时域表达式为:
高斯滤波函数中的标准差σ决定了滤波器的大小;
(2) 计算梯度, 包括梯度的幅值和方向, 可使用微分算子;
(3) 遍历梯度图, 对梯度幅值进行非极大值抑制;
(4) 用双阈值算法检测和连接边缘。
部分学者尝试采用Ostu算法来选取Canny边缘检测的高低阈值, 取得了一定效果, 但其实验对象的场景往往比较简单。另外边缘检测得到的边缘往往不闭合, 这很不利于火焰识别的进一步处理, (例如区域特征的提取等) 需要进行边缘连接。目前边缘连接问题并没有很好的、统一的解决方法。如果火焰识别较多利用火焰的区域特征, 那么用边缘检测和边缘连接的方法来进行火焰图像分割并不十分适合。
1.2 灰度阈值分割
利用像素灰度值特点, 通过取阈值进行分类的过程就是灰度阈值分割[6]。通常利用火焰的高温高亮特征, 在表征温度的灰度图上进行火焰区域分割。火焰区域像素的灰度值要明显高于非火焰区域。根据这个特点, 可设置1个阈值将图像中的火焰区域和非火焰区域分割开来, 并生成仅有两种灰度的二值图像。即:
如果阈值T仅仅取决于灰度级值f (i, j) , 就称其为全局阈值, 如果T取决于f (i, j) 和像素点的局部性质 (如临域内的平均灰度级) 时, 阈值就是局部的;如果阈值T取决于空间坐标x和y, 阈值就是动态的或自适应的。
1.3 运动检测
火焰往往是闪动的, 因此用于运动检测的一些方法可以用来分割火焰。运动检测的方法有背景差法、帧差法。
1.3.1 背景差法
背景差法通过当前帧与背景帧相减的方法提取运动前景, 二值化后得到目标区域, 用公式可表示为:
其中, cur (x, y) 、bk (x, y) 、diff (x, y) 、object (x, y) 、th分别为当前帧、背景帧、差值图像、目标图像和二值化阈值。
背景不是一成不变的, 故需要通过一定方法进行背景更新。为了防止背景图像被前景“污染”, 首先利用二值目标图像object (x, y) 作为掩膜, 从当前帧cur (x, y) 和当前背景帧bk (x, y) 中提取即时背景ibk (x, y) :在目标图像像素值为0的位置, 对当前帧采样;在目标图像像素值为1的位置, 对当前背景帧采样。最后对即时背景ibk (x, y) 和当前背景bk (x, y) 做加权平均来更新背景帧。背景更新公式:
其中, 权值因子α的经验值为0.1。
因背景是变化的, 且二值目标图用于背景更新, 所以不能使用固定阈值来做二值化。对于视频序列中背景占大部分的情况, 可以按照如下方式更新阈值:
其中, peak为差值图像diff (x, y) 的直方图峰值。
1.3.2 帧差法
帧差法与背景差法类似, 只是用前一帧来代替背景帧做差。帧差法认为连续两帧的差值图像中的高亮区域就是运动目标。差值图像和目标图像分别为:
可根据属于某目标的像素位于一个连通域的特点来抑制噪声。如果背景是移动的, 需要进行全局运动估计和补偿。
1.4 颜色分割
可见光图像包含了很多火焰信息, 颜色是火焰除温度外另一个显著特征。火灾火焰的颜色往往给人以发红发亮的视觉感受, 这是因为火焰的红色分量和绿色分量较高, 特别是红色分量常常饱和, 而蓝色分量稍低。火焰区域在RGB三个通道上均具有较高的像素值, 这也是火焰颜色的普遍特征。对大量火焰图片统计分析, 即可确定火焰图像RGB三个通道的阈值thr、thg、thb, 从而给出火焰颜色模型:
其中fR (x, y) 、fG (x, y) 和fB (x, y) 分别代表图像像素中的红色、绿色和蓝色分量, 这就是简单颜色模型。
若进一步分析各通道间的关系, 可以得出火焰颜色的不等式约束。带约束的颜色模型之一为:
其中fR (x, y) 、fG (x, y) 和fB (x, y) 分别代表图像像素中的红色、绿色和蓝色分量, kG和kB两个参数界定了RGB的范围。其依据为: (1) 火点的可见彩色图像在RGB分量坐标中红色分量有很高的绝对值。 (2) 火中红色分量与蓝色、绿色分量的比值具有一定规律性。
2 分割方法算法比较
2.1 红外图像分割比较
对一段红外视频分别应用canny边缘检测、全局阈值分割和背景差法分割, 其中一帧图片的分割结果如图1、图2和图3所示。
图1所示图片依次为原始图片和Canny边缘检测结果。由图1可见, Canny可以较完整的检测出目标边缘, 但是其边缘断续、不完整的情况仍然严重, 而且对于较复杂的场景, Canny边缘检测保留了很多背景边缘信息。
图2所示为图1 (a) 图像的全局阈值分割结果。该图像为8位灰度图, 灰度级最大值为255, 通过分析图像的灰度级直方图发现, 火焰、白炽灯等高灰度级的前景, 其灰度值集中在250灰度级附近, 地面、墙面等的灰度值集中在[100, 130]区间, 其他背景的灰度值低于100;因此设置阈值为240/255, 完整的提取出了火焰区域, 可见灰度阈值分割是十分有效的。对于白炽灯这样的高温干扰物, 可以在后续的处理中, 利用火焰的其他特征进行排除, 例如颜色、轮廓特征等等。
图3所示分别为背景帧、当前帧和二值化的差值图片。可见, 背景差法可以较好的提取出火焰的运动区域, 但是造成了火焰区域的内部空洞, 并将两帧重叠部分错误的当做背景, 造成分割后的目标不完整 (如火焰区域出现空洞) , 不利于提取火焰的区域特征, 例如圆形度、尖角特征等;此外, 背景差法对于背景固定或背景变化不大的情况比较好, 而对摄像头或场景的移动比较敏感, 针对运动场景的相关研究中, 自适应背景更新或背景补偿的方法还不成熟。帧差法有类似的问题。
比较发现, 阈值法可准确的分割出火焰区域, 同时保留较少干扰区域, 比边缘检测和运动检测法更适合火焰图像的分割。这是因为高温特征是火焰显著的特征, 反映在红外图上就是高灰度值。
2.2 颜色分割比较
选取CCD摄像头拍摄的一段视频进行仿真分析。经过统计分析确定RGB三个通道的阈值, 建立简单颜色模型如式 (12) :
进一步分析火焰像素RGB通道间的关系, 建立不等式颜色模型如式 (13) :
图4为颜色分割抓图。可见, 简单颜色模型和不等式颜色模型均可以较完整的分割出火焰区域。简单颜色模型排除了大部分干扰, 只保留了白色灯光干扰区;不等式颜色模型分割保留了很多干扰区域, 比如泛红光的水泥面。
与带不等式约束的颜色模型相比, 简单颜色模型的分割效果更好, 其保留的白色干扰可以通过火焰的其他特征排除, 如温度等。
3 结论
本文对火焰识别中常用的分割方法进行了研究, 并分析了各自的优劣。Canny边缘检测虽然可以提取较完整的边缘, 但是基于区域特征的火焰识别不宜选用;阈值分割可以简单有效的分割出红外图中的火焰区域;运动检测的方法对于剧烈运动的火焰可以有效分割出运动区域, 但是容易造成火焰区域的不完整;颜色分割是可见光图像中一种有效的火焰分割方法, 其中的简单颜色模型简单实用。实际使用中应根据识别目的、图像特征和算法需要进行选择。
参考文献
[1]Qin Jiang, Qiang Wang.Large Space Fire Image Processing of Improving Canny Edge Detector based on Adaptive Smoothing[C]//2010 International Conference on Innovative Computing and Communication and 2010 Asia-Pacific Conference on Information Technology and Ocean Engineering.Macao, 2010:264-267.
[2]王思嘉.无人机火灾检测平台的设计和构建[D].广州:华南理工大学, 2010.
[3]Qing Liu, Sun’an Wang, Xiao Hui Zhang, etc.Flame Recognition Algorithm Research under Complex Background[A].2010 10th IEEE International Conference on Computer and Information Technology (CIT 2010) [C].Bradford, 2010:503-510.
[4]Juan Chen, Yaping He, Jian Wang.Multi-feature Fusion Based Fast Video Flame Detection[J].Building and Environment, 45 (2010) :1113-1122.
[5]Jie Hou, Jiaru Qian, Weijing Zhang, etc.Fire Detection Algorithms for Video Images of Large Space Structures[J].Multimed Tools Appl, (2011) 52:45-63.
【快速分割算法论文】推荐阅读:
快速标注算法论文06-04
聚类分割算法05-12
火焰图像分割算法研究06-14
彩色图像分割算法研究08-31
快速收敛算法08-22
快速搜索算法10-05
快速调度算法12-05
车牌字符分割论文05-28
快速子空间算法08-13
快速正交搜索算法10-22