背景分割

2024-07-01

背景分割(精选4篇)

背景分割 篇1

1 空域单帧分割

为了将动态背景下的图像分割出来, 本文采用时空联合[1 - 3]的分割方法, 先用相应的空域分割技术对视频图像序列进行分割, 然后再使用相应的时域分割技术分割出最终的图像。本节描述空域分割采用的技术。

本文在进行空域分割时采用图论[4,5]中的等周算法。先将一帧图像用矩阵形式表现出来, 图像中的像素点用矩阵中的元素表示, 像素之间的关联程度使用权值表示。建立拉普拉斯矩阵和方程, 通过求解极值二分图像。单帧图像分割具体步骤如下:

( 1) 权值的求法

其中Ii和Ij分别为两个相邻像素点的灰度值, β 为可变量, 可以根据具体的图像情况进行调整, 如果要粗分, β 取较小的值; 如要细分, β 取较大的值。

( 2) 等周常数h的求法

分子为两个区域之间的权值, 分母为其中一个区域内的权值之和。也即一个区域的边界和这个区域的体积之比。

( 3) 利用权值建立Laplacian矩阵, 求解方程为:

矩阵L被称为Laplacian矩阵。定义一个状态向量

通过转化, 于是问题转化为求解极值问题, 等周常数定义为:

最终问题归结为求解线性方程:

这里需要设定一个接地点, 在矩阵中将此接地点的行和列去掉, 求解方程得到唯一解。通常选度最大的点作为接地点。

( 4) 设定分割点, 将图像分割成两个区域。

(5) 采用迭代法递归分割, 通过设置分割极限值停止迭代。

本算法计算量小, 分割出的边界准确清晰, 为时域帧间分割打下了良好的基础。

2 时域帧间分割

现实世界是运动的世界, 静止只是相对的, 所以研究图像分割大多以研究图像序列[6 - 8]为主, 通过分析多帧之间的运动变化, 找到目标的运动轨迹。

本文采用超松弛迭代算法进行背景运动估计的参数获取;再运用全局运动补偿, 得到补偿帧, 与当前帧进行差分运算, 得到局部运动区域。最后进行区域合并得到运动目标。

2. 1 背景运动估计

本文采用的参数模型为6 参数仿射模型, 可以对平移、旋转和缩放运动进行建模。运用超松弛迭代算法得到仿射模型参数。算法步骤如下:

( 1) 迭代公式为:

其中ai (0) 为预先假设的运动参数初值。

( 2) 求每个参数的偏导数:

其中Ufb为目标函数; fx为图像函数对坐标x的偏导数; fy为图像函数f对坐标y的偏导数:

( 3) Tai求解的计算公式:

Tai为Ufb对ai的二阶偏导数的最大值, 。

超松弛迭代算法的matlab代码如下:

其中A为线性方程组的系数矩阵, b为自由项, p为迭代初始值, w为松弛因子, del为精度, max为循环的限制次数。

超松弛迭代法计算量小, 计算出的运动参数比较准确。

2. 2 全局运动补偿

全局运动补偿算法如下: 取当前帧t时刻和上一帧t + 1 时刻的运动场景估算出物体运动的变移量, 之后进行运动补偿。图像在t时刻的形式I' ( x, y, t) 为:

这个过程称为运动补偿。运用可分离的双线性内插算法, 重建变换后的像素点的亮度。其原理如下:

运动补偿后的坐标为 ( x', y') 。 ( x', y') 满足x' = x + u, y' =y + v。取 ( x', y') 整数部分坐标 ( i, j) 。令r = x' - i, s = y' - j, 则:I' ( x, y, t) = I ( x + u, y + v, t + 1)

算法的matlab代码如下:

这样在准确的运动估计和补偿之后, 用帧差方法消除背景区域, 显露出局部运动区域。

3 实验结果

本文的程序运行环境如下: 处理器Pentium4 3. 00GHz; 内存512M; 操作系统Windows XP。所使用的图像序列是从网上下载的被广泛使用的汽车图像案例。图像的属性为宽度362 像素, 高度240 像素, 分辨率为96 DPI。当图像比较复杂需要细分时, β 需要取大一些的值。运行算法进行测试, 得到以下结果。

图1 和图2 分别是car_brad序列的相邻两帧, 图3 为针对图1 的空间单帧分割结果, 图4 全局补偿后的图像, 图5 为差分后的图像, 图6 为最终分割结果。

4 结语

实验结果表明, 本文算法很好地克服了过分割的问题, 并且边缘定位准确, 可获得更为精确的分割结果。本算法针对大型运动物体分割效果明显。针对细小物体的分割还需要改进。

参考文献

[1]Chien S Y, Ma S Y, Chen L G.Efficient Moving object Segmentation Algorithm Using Background Registration Technique[J].IEEE Trans.on Circuits system And Video Technology, 2002, 12 (7) :577-586.

[2]Muriel G, Michel B.Combining shape prior and statistical features for active contour segmentation[J].IEEE Trans.on Circuits and Systems for Video Technology, 2004, 14 (5) :726-734.

[3]杨文明.时空联合的视频对象分割[D].浙江大学, 2006.

[4]Celina M Hde Figueiredo, Jayme L.Szwarcfiter.Graph theory and algorithms[J].Journal of the Brazilian Computer Society, 2012, 18 (2) :83-84.

[5]刘琦, 邢志栋, 董建民.等周图像分割算法的一种加速改进[J].计算机工程与应用, 2010, 46 (13) :154-157.

[6]Hartley R, Zisserman A.Multiple View Geometry in Computer Vision[J].Cambridge University Press, 2006:26-28.

[7]Thomas Rauber, Gudula Runger.Parallel Programming[M].Springer Berlin Heidelberg, 2010:359-440.

[8]Munchurl K, Jinwoong K.Moving video object segmentation using statistical hypothesis testing[J].Electronics Letters, 2007, 36 (2) :128-129.

背景分割 篇2

在计算机视觉系统中,运动目标的分割是一个非常重要的问题,应用于视频监视、交通监测、图像压缩等许多方面。根据分割目标的类型,可分为刚体和非刚体的分割,刚体是指具有刚性结构、不易变形的物体,而非刚体则存在外形容易变化的特点,因此序列图像中非刚体目标的精确分割是一个较难的问题。根据分割所采用的物理依据,可简单地分为两类:一类以时序属性为分割依据,它们根据视频的时序属性来分割运动目标,主要有光流法、相邻帧差法和背景差法。光流法[1,2]在不需要背景区域的任何先验知识条件下就能够实现对运动目标的检测和跟踪,但是光流法的计算量非常大,而且对噪声比较敏感。相邻帧差法[3,4,5]能够适应环境的动态变化,但分割出的目标内部容易产生空洞。背景差法[6,7,8,9,10,11,12,13,14,15,16,17,18,19]能得到较完整的目标,具有实现容易和计算量小等特点,但是当目标中有部分区域与对应背景区域的灰度值很接近时,仍会使分割出的目标产生缺口、空洞和分离。另一类以空间属性为分割依据,它们主要根据图像的区域或是边缘信息来分割运动目标,主要有活动轮廓模型、边缘检测算子等。近年来,应用主动轮廓模型和水平集的图像分割方法在运动目标的检测和跟踪领域得到了广泛的研究和应用[20,21,22,23],该方法能够适应目标拓扑结构的变化、获得封闭和完整的目标轮廓信息,适应于刚体或非刚体目标的分割,但其主要缺点是计算量大。

本文根据上述两类分割方法的优缺点,采用背景差和水平集相结合的方法研究固定摄像机监控视频中刚体或非刚体的多运动目标检测与分割问题,总体算法流程图如图1所示。算法中先进行初始背景的重构和背景更新,采用减背景法得到背景差图像并二值化,然后进行去噪、连通域检测和分析并提取出图像中的运动目标区域,最后对各运动目标区域块分别作水平集图像分割,得到封闭和完整的目标轮廓。

1 基于像素灰度频率统计的背景重构及更新算法

初始背景的重构和背景的实时更新是背景差法的核心和难点。经典方法是时间平均法,但该方法易将前景运动目标混入到背景当中,产生混合现象。近年来,人们对如何实现背景的自适应更新进行了大量研究,主要可分为两类:第1类是建立背景模型并采用自适应方法对模型参数进行调整,从而获得新的背景图像[6,7,8,9,10,11,12,13,14];第2类是从过去的一组观测图像中按照一定的假设选择像素灰度构成当前的背景图像[15,16,17,18,19]。第1类方法都需要进行模型初始化,通常假定在初始化阶段,背景中不含有运动前景,这种假设在实际的公共场合很难满足;其次,所建立的模型很难充分表示实际的背景,使运动前景很容易混入背景图像当中,产生混合现象。第2类方法的优点是,不需要对场景中的背景和目标建立模型,直接从含有运动前景的场景图像中重构背景,有效地避免了混合现象。但是,由于这类方法是从过去一段图像序列中重构背景图像,因此不如第1类方法能够适应迅速的场景变化,而是产生一定的时间延迟,但这个问题对于长时间图像监视和跟踪系统的影响并不大。本文的背景重构算法属于第2类方法,受文献[19]的启发,提出了一种基于像素灰度频率统计的背景重构算法,该算法保留了该类方法的优点,并且能以相对较少的帧提取出较好的背景。

1.1 背景重构

本文的背景重构算法是从过去的一组观测图像中,在“背景在图像序列中总是最经常被观测到的”假设的前提下,通过求解连续三帧图像的对称差分,确定出当前帧中的背景像素点,并只对背景像素点的灰度值进行统计,最后选择出现频率最高的灰度值作为该点背景像素的灰度值。算法分为4步,具体如下:

步骤1:建立灰度值统计矩阵LHW×H×256。设输入视频的分辨力为W×H,则建立一个W×H×256的3维矩阵,该矩阵中的每个元素LM(x,y,l)的值代表图像中(x,y)处像素点的灰度级l(0≤l≤255)出现的总次数。

步骤2:用对称相邻帧差分确定当前帧的前景及背景像素点。已知图像序列(I1,I2,…,IM),从中等间隔抽取N+2帧图像,记为(f0,f1,f2,…,fN+1)。fi-1(x,y)、fi(x,y)、fi+1(x,y)表示第i-1、i、i+1帧(i=1,2,…,N)像素点(x,y)处的灰度值,则第i帧的前向和后向差掩模图分别为

式(1)、(2)中,Ti-1、Ti+1分别为判断像素点(x,y)处的灰度值是否发生变化的阈值,通过Ostu法(最大类间方差法)自适应计算得到。则运动像素点的掩模图为

式(3)中,如果对于某一点(x,y),若OBi(x,y)=1,则可以判断这一点在当前连续三帧图像中都是运动的,因而该像素点为前景像素点,反之,若OBi(x,y)=0,则为背景像素点。

步骤3:根据OBi(x,y)所确定的背景像素点,统计并更新灰度值统计矩阵LHW×H×256。若像素点(x,y)处OBi(x,y)=0,灰度值为l(0≤l≤255),则将(x,y)处灰度值l的出现次数加1,即LM(x,y,l)=LM(x,y,l)+1;若像素点(x,y)处OBi(x,y)=1,则不做处理。

步骤4:对抽取的N+2帧图像重复进行步骤2和步骤3,最后根据灰度值统计矩阵LHW×H×256,对于每个像素点用出现频率最高的灰度级作为该像素点的初始背景灰度值,从而构建整个初始背景。

对上述算法要说明的是,实际使用中只需要开辟W×H×256大小的固定内存空间,而不需要对采样图像进行存储,若将灰度级缩减为128级或64级则占用的内存空间进一步减小为原来的1/2和1/4。

1.2 背景更新

本文主要采用两种方法进行背景更新。第1种是定时背景更新,即在规定时间段中(通常5~10 min),抽取最后10~20 s图像序列,利用本文的算法重构背景,作为下一个时间段的背景参考帧。这种方式适用于背景缓慢变化的情况,如一天当中太阳光照的缓慢变化。第2种方法借鉴了文献[17]中的背景更新策略,若在当前帧与背景参考帧差分后所得差分图像中,发生变化的像素数与全部像素数的百分比大于某一个阈值(通常取80%),则背景发生了变化;若连续多帧中这一比值依然很大,则重新抽取此时的图像序列,按照本文算法重构背景。这种方式适用于背景发生突变时的情况,如室内突然开灯或关灯。

1.3 实验结果

以Highway视频序列为测试对象,采用前50帧重构背景,图2为采用本文算法进行背景重构的示意图。从图2(a)~(e)可以看出,随着输入帧的增多,前景物体逐渐消隐,从而背景也逐步地重构出来,第30帧时已初步重构出背景,到第50帧时基本上重构出完整的背景图。图2(f)是(160,200)位置处像素点在前50帧中的各灰度值,从图中看出在第5、11、15等帧时由于有车辆经过,因此灰度值变化较大,但是在大部分的帧中该像素点的灰度值基本在138左右变化。相应地,图2(g)给出了(160,200)位置处像素点在前50帧中各灰度值出现的频次,从图中看到,由于在5、11、15等帧时通过运动检测判别为前景像素点,灰度统计时被略去,即在图(g)中灰度值低于100的各灰度值出现次数都为0,同时灰度值138出现频率最高为9次,且与138相临近的灰度级出现次数也较多,因此(160,200)位置处像素点的背景像素值最终取为138。

2 基于背景差的运动目标区域检测

2.1 基于背景差的运动检测

若将背景参考帧记为B(x,y),当前帧记为I(x,y),背景差掩模图像记为F(x,y),则:

式中:Tb为二值化阈值,由Ostu法自适应计算得到。当F(x,y)为1时,对应的是前景图像及部分噪声。

2.2 背景掩模图的去噪、连通区域检测和分析及运动目标区域标定

从背景差掩模图像F(x,y)到运动目标区域的标定主要包括三个方面的工作:

1)采用数学形态学滤波的方法去除孤立噪声点。

2)采用基于8-邻域搜索的区域生长算法完成连通区域的检测,并通过设置连通区域面积的阈值将小块背景噪声连通区域消除。

在二值图像连通区域的检测上,本文提出了一种基于8-邻域搜索的区域生长算法。该算法采用一种类似区域生长的思想,避免了重复标记的问题,其基本思路是一次标记整个连通区域,然后再标记下一个区域,直到所有的连通区域都被标记。具体步骤如下:

步骤1:创建与F(x,y)(分辨率为W×H)大小相同的标记矩阵flagW×H,并初始化为0。

步骤2:对背景差掩模图像F进行逐行、逐列扫描,找到第一个F(x,y)=1且flag(x,y)=0的种子点(x1,y1),标记该点,即置flag(x,y)=1,表明该点已检测过;检查该点的8-邻域点,对F(x,y)=1的邻域点再进行8-邻域搜索,通过如此不断迭代的8-邻域搜索,逐步标记包含点(x1,y1)的整个连通区域,即将该连通区域中的所有点对应的flag(x,y)都置1,并记录该连通区域面积以及最小和最大的行、列号等信息。

步骤3:从(x1,y1)的下一个像素点开始,继续对F(x,y)进行逐行、逐列扫描,找到下一个F(x,y)=1且flag(x,y)=0的点,即未检测的种子点(xi,yi)(i=2,3,...,M,M为连通区域的总个数),重复步骤2直至扫描完整个F(x,y)。

该算法通过一次扫描即可实现全部连通区域的检测,具较高的效率;同时,这种基于8-邻域搜索的区域生长方法不受连通区域几何形状及数量的影响,具有很好鲁棒性。

在小块背景噪声的消除上,考虑到在实际应用中,噪声的连通区域远远小于实际运动目标的连通区域,故而将最大连通区域面积Amax的3%作为阈值,将面积小于该阈值的连通区域看作噪声并予以清除。

3)分析各连通域间的位置关系,消除背景差法造成的目标区域的缺口、空洞和分离所带来的虚假多目标,并正确标定出运动目标区域。

设[rmini,rmaxi,cmini,cmaxi]、[rminj,rmaxj,cminj,cmaxj](i,j=,1,2…,M,且i≠j,M为连通区域的总个数)分别为检测出的第i和第j连通区域的行列位置坐标,若满足式

则将i、j连通区域合并为一个,合并后连通区域的行列位置坐标为

式(5)表示,若两个连通区域的中心距小于各自长边半径之和时,则认为这两个连通区域属于同一个目标并将其合并,合并后的区域取二者的最大区域,即式(6)。

2.3 实验结果

以Highway视频序列第30帧为例,图3给出了运动目标区域检测示意图。其中(a)为原始图;(b)为形态学滤波后的背景差掩模图;(c)给出了连通区域检测和小块背景噪声区域消除后的目标图,(b)中最大连通域面积为981个像素点则阈值取为29,小于该值的连通区域认为是背景噪声予以消除,对比(b)和(c)看到在图像右上角处的小块背景噪声得到了消除;(d)为连通域分析后最终得到的运动目标区域图,对比(b)、(c)和(d)可看出,油罐车在(b)图中,存在缺口、空洞和分离,形成6个分离的连通区域,即(c)图中被检测为6个目标区域,但通过连通域分析后重新合并为一个目标,消除了背景差法造成的虚假多目标,如图(d)所示。

3 基于水平集的运动目标轮廓分割

传统水平集方法中,水平集函数通常取由初始闭合曲线C0生成的符号距离函数SDF,再以水平集等式:∂φ/∂t+F|∇φ|=0,演化水平集函数φ。但在演化过程中,水平集函数会逐渐变形,不再保持为符号距离函数,这对计算的稳定性和准确性有很大影响。因此,每次更新水平集后,都需要将水平集重新初始化为符号距离函数,这是水平集方法计算量的重要组成部分。为提高计算速度,本文采用文献[23]中提出的无需重新初始化的水平集方法。

3.1 无需重新初始化的水平集方法

该方法首先提出式(7)来表征函数φ在Ω⊂R2中与SDF的接近程度,并定义式(8)的能量函数:

其中:µ>0是一个参数,用于控制惩罚φ偏离符号距离函数的效果;εm(φ)是驱动φ的零水平集移动的某种能量。以∂ε/∂φ标识函数ε的第一变分,则进化等式:

为用于最小化函数ε的梯度流。在基于水平集图像分割中,能量εm将被定义为一个依赖于图像数据的函数,称之为外部能量。相应地,能量P(φ)称之为函数φ的内部能量。按照梯度流式(9)在φ的进化中最小化了函数(8),零水平集曲线将会在外部能量εm作用下移动,同时由于内部能量的惩罚作用,进化函数φ根据进化(9)在进化过程中将会自动地保持为一个近似符号距离函数,因此重新初始化过程可完全去除。

在图像分割中,定义边缘指示函数g,及外部能量εm如下:

其中:I是图像,Gσ是标准差为σ的高斯核,λ>0且v为常量,δ是Dirac函数,H是Heaviside函数。则由式(7)、(8)、(11),通过变分的微积分,得到用于最小化函数ε的梯度流为

其中:∆是拉普拉斯算子,这个梯度流即为水平集函数的进化等式。式(12)右边的第二和第三项分别对应于能量函数λLg(φ)和vAg(φ)的梯度流,并负责驱动零水平集曲线靠近目标边界。

3.2 实验结果

为测试本文算法的实际性能,采用Matlab7.01开发环境及Matlab编程语言,在Windows XP SP3,CPU为Intel Pentium M 1.5 GHz,内存为512 MB的计算机上对Highway及Shop视频序列进行了测试,测试参数及结果如表1所示,其中处理时间和速率都为平均值,目标检测及分割效果如图4和图5所示。Highway序列中汽车为刚性目标但运动目标较多,如第30帧中存在12个目标,所以在背景建模不是很准确的情况下容易造成运动目标的误分割;图4中给出了从不同时段分别抽取的第30、125、235、350帧的分割结果,其中第30帧中部分目标与背景的灰度值较近,背景差掩模图像中存在的目标区域的缺口、空洞和分离,但通过连通域分析确定出完整的目标区域,并通过水平集分割得到目标轮廓,由于刚性目标轮廓相对固定简单,实验中水平集迭代步数设为30即可。Shop视频序列中行人是一种非刚性的运动目标,存在外型容易变化的特点,采用传统的方法很难得到满意的结果,但本文通过水平集分割的方法都得到了封闭、完整的目标轮廓,如图5所示,由于人体的轮廓相对复杂、变换快,实验中水平集迭代步数设为50;同时,图5中第130、810、840、860帧给出了本文算法处理目标的合并和分裂的全过程,一方面通过可靠的背景建模能实现了较准确的目标检测,另一方面水平集分割本身对目标的几何拓扑变化具有自适应性,能很自然的处理目标的分裂和合并。

在算法的处理时间和速率上,从表1可看出,对于320×240大小的Highway和384×288大小的Shop视频序列,在未对本文算法进行任何优化的情况下,目标区域的检测均能达到25 fps以上,整个轮廓分割算法的处理速率也分别能达到1.3 fps和0.5 fps。同时,本文算法各模块又相对独立,具有较好的灵活性,对于无需精确轮廓分割的应用场合,只需采用本文的目标区域检测分割算法即可达到实时应用的要求。

4 结论

本文讨论了一种固定摄像机监控视频序列中多运动目标的检测和分割方法。该方法先采用背景差法进行运动检测并提取当前帧中运动目标区域,然后对各运动目标区域块分别采用基于水平集的活动轮廓算法进行轮廓分割。实验结果表明,本文算法具有以下特点:该算法能够在包含前景的一段视频序列中较好地提取出背景图像;基于8-领域搜索的区域生长算法能实现任意形状和数量的连通域的快速检测;连通域分析的方法能消除背景差掩模图像中的缺口、空洞和分离所带来的虚假多目标;采用水平集对目标进行轮廓分割,可分割出刚体或非刚体运动目标的封闭而完整的轮廓;与传统方法不同,水平集分割不是对整幅图像而是对检测出的较小目标区域块进行处理,极大地减少了计算量。本文方法在有阴影的情况下无法提取出正确的目标轮廓,同时若图像中目标较大且数目较多会增加水平集分割的处理时间,因此,阴影的消除及水平集快速算法是下一步的研究方向,其中,文献[22]在水平集快速算法的研究上取得了较大进展。

摘要:针对固定摄像机监控中多运动目标自动分割问题,本文提出了一种基于背景差分和水平集的新方法。首先,该方法通过求解连续三帧图像的对称差分,确定出当前帧中的背景像素点,并对背景像素点的灰度值进行统计,最后选择频率最高的灰度值作为该点背景像素灰度值来重构背景。其次,提出了基于8-邻域搜索的区域生长算法完成连通区域的检测,并通过设置阈值和连通域分析,消除背景块噪声并标定出运动目标区域。最后,对所有运动目标区域块,分别采用无需重新初始化的水平集算法作分割,得到封闭和完整的目标轮廓。实验结果表明,该算法能实现固定摄像机监控中刚体或非刚体的多运动目标的自动检测和轮廓分割。

背景分割 篇3

合成孔径雷达(Synthetic Aperture Radar,SAR),由于其成像过程中必然带来的相干斑(Speckle)现象会使具有均匀散射系数目标的SAR图像并不具有均匀灰度,而出现许多斑点[1]。斑点噪声的存在使得图像的局部相关性减弱,常规基于灰度特征的图像分割方法,不能有效克服斑点噪声对分割结果的影响。MRF分割方法基于图像数据的局部相关性,具有一定的消除噪声和保护图像边缘的能力。但在强噪声情况下算法也难以兼顾噪声和边缘,因为MRF分割方法消除噪声和保护边缘的能力均依赖于其邻域系统,当邻域系统较复杂时消除噪声的能力较强,但图像边缘易被过分平滑。反之,当邻域系统简单时边缘能够得到有效保持,但不能够有效抑制噪声对分割结果的影响。为解决MRF分割方法中边缘保护和噪声抑制间的矛盾,文本提出了一种新的分割策略:首先,将待分割图像划分为若干个内部连通且具有一定灰度相似性和良好边缘的小区域块;然后,将每个小区域块内像素灰度的均值作为该区域内像素的灰度值。通过将小区域块内的灰度均值作为对应像素的灰度强度,一方面实现了在每个区域块内自适应地抑制斑点噪声加强图像的局部相关性,另一方面对受强斑点噪声污染的SAR图像,区域块内的均值更能反映对应场景的真实灰度,从而进一步提高了算法抗噪声的能力。因为每个小区域都具有良好的边缘,所以可以通过连接区域块的边缘来得到最终分割结果的边缘,这样得到的边缘更接近图像的真实边缘。

有多种能够快速地将图像划分为若干个内部封闭、连通且具有较好边缘的区域块的方法。比如,Pedro等人提出的最小生成树(MST)方法[2]、Vincent等人提出的分水岭算法[3]等。该类方法的优点是在其分割结果中每个区域块都能较好的保持图像边界,缺点是对噪声敏感容易导致过分割。但是在新算法中这缺点变成了优点,可提供较小的区域块。MST方法需要人为地设置阈值将图像中的区域分隔开,阈值过小则过分割严重生成的区域块数目较多会加重新算法的计算负担,阈值过大则区域块较大不利于新算法消除噪声。因此,MST方法难以自适应地确定阈值,故而采用分水岭算法作为预处理将图像划分为若干个小区域。为减少噪声对分水岭的影响,使得生成的小区域块数目不至于过多,先将图像进行开形态重建[11]滤波器消除部分斑点较小的噪声,然后将图像通过滤波窗口为3×3的中值滤波器来降低噪声的影响,并且利用形态梯度[7]作为分水岭算法的输入。形态梯度与普通基于微分算子的边缘检测算法相比,速度更快,边缘定位更准确。

迭代优化阶段是MRF分割方法中最耗时的部分,在该阶段可从两方面来提高算法效率。一方面是选择一种速度快且能够收敛到全局最优的优化算法。Besag[1]提出的ICM优化方法和Geman[1]提出的模拟退火算法都是MRF分割方法中较为常用的优化方法,但它们都各有不足:ICM是种贪婪算法,对初始分割敏感易陷入局部最优,而在强噪声的SAR图像中难以获得较好的初始分割;模拟退火算法在理论上能保证找到全局最优解,但计算量大优化速度慢,难以满足实际要求。最近,在计算机视觉领域,Boykov等提出的图割优化算法[5,6]几乎达到了实时处理的效果,并且可以保证其收敛点接近全局最优。另一方面是减少迭代时处理单元的数目。为减少处理单元的规模,以分水岭算法得到的小区域块代替像素作为该阶段的输入,为此需要在区域块间定义MRF得到优化的目标函数。通常地,对二维图像,其像素的大小、形状及排列都是规则的,从而MRF都建立在与图像对应的二维网格上。而由分水岭得到的区域块的形状、大小和排列都是不规则的,为此本文的主要工作是在非网格的区域块间建立对应的MRF以得到优化的目标函数。

本文的第一部分详细给出了非网格情况下MRF的实现方法,包括邻域系统的建立和目标函数的表示。第二部分给出了目标函数的未知参数的估计方法,第三部分是新算法的总体流程,第四部分给出了实验结果,最后是总结。

1 基于区域块的MRF图像分割模型

1.1 网格MRF的分割方法

定义两个随机场,一个是灰度场Y={Y1,...,YN},另一个是标号场X={X1,...,XN}(此时N代表像素数目)。灰度场Y中每个随机变量Yi的现实yi为图像中对应像素的灰度强度;标号场X的每个随机变量Xi的现实xi代表对应像素的类别标号,取值范围为{0,1,...,L-1},其中L代表类别数目。因此,灰度场的现实y即是图像的灰度矩阵,标号场X的一个现实x对应一个分割结果。

通常地,定义标号场X为MRF,即满足[13]

式中:N(Xi)表示Xi的邻域,X-i表示X中除Xi外的所有随机变量。Hamersley-Clifford定理[1]确定了Markov随机场和Gibbs随机场之间的等价关系,从而给出了Markov随机场的先验伪似然概率:

式中:Z是一个归一化常量,U(Xi|N(Xi))表示局部能量,一般采用Potts模型[1]表示。有了先验概率后在贝叶斯框架下,图像分割问题转换为在已知观测图像y的情况下,寻找使得下式能量函数最小时的标号场x的组合优化问题[2]

式中:右边第一项只与像素的灰度有关,称为数据能量项;第二项只跟邻域标号相关,称为平滑能量项。

1.2 非网格MRF的分割方法

网格下的MRF图像分割模型[3,4,12,13,14]都建立在与图像I对应的网格G上,网格G定义了MRF的邻域结构,常见的如8邻域、4邻域结构。然而,新算法迭代优化阶段的输入是由形态学分水岭算法过分割得到的小区域块,每个区域块的大小、形状都是不规则的。因此,无法再在网格上定义邻域结构。

为在非网格下定义邻域结构,本文将每个区域块看成一个节点,将区域块的重心作为对应节点的位置坐标,以节点间的距离来确定邻域结构。区域块的重心定义为该区域内像素横、纵坐标的平均值

式中:rB(i)表示第i个区域块重心的行坐标,cB(i)表示第i个区域块重心的列坐标,B(i)表示第i个区域块的像素集合,nB(i)表示第i个区域包含的像素数目,rp表示像素p的行坐标,cp表示像素p的列坐标。如图1(a)中第0个区域块重心的浮点坐标为(1.83,1.17)。在区域块数量较多的情况下,因为需要计算任意两区域块间的距离,所以计算量会比较大。为降低计算负担,采用最大值距离而不是通常的欧式距离作为两区域块间的距离

最后,通过给定一个阈值来确定两区域块是否互为邻域,如果区域间的距离小于阈值则它们互为邻域,否则两区域互不相关。图1给出了非网格下的一个邻域结构,每个节点代表一个区域块,节点之间有边相连接表示这两个节点互为邻域。图1(a)是分水岭过分割得到的6个区域块。图1(b)的邻域结构是通过将拥有共同边界的区域块设为邻域而建立的,这种邻域结构过于简单在实验中证明不能有效地抑制斑点噪声。图1(c)是在阈值为3.70时建立的邻域关系,它的邻域结构比图1(b)更为简单。图1(d)是在阈值大于5.33时(区域块间的最远距离为5.33),建立的邻域结构,其中任意两个区域块间都互为邻域。阈值越大,则邻域关系越复杂,后续的计算量也越大。反之,阈值越小,则邻域关系越简单,计算量越小,但不能够有效地引入上下文信息消除斑点噪声。极端情况下,当阈值为0时,则区域块间不存在邻域关系,分割只利用了灰度信息。

图1非网格下MRF的邻域系统(两个节点之间有边相连接表示这两个节点互为邻域)(a)分水岭的结果;(b)几何结构;(c)阈值为3.70时的邻域结构;(d)阈值大于5.34时的邻域结构Fig.1 Example of neighbor system under non-grid MRF(If there is a edge between two nodes,then they are neighbored)(a)Image gained using watershed method;(b)Geometry structure;(c)Neighbor structure when threshold is 3.70;(d)Neighbor structure when threshold is large than 5.333.

非网格下,每个处理单元变成了区域块。定义灰度场Y={Y1,...,YN}的每个随机变量Yi的现实yi为第i个区域块内像素的平均灰度(此处N表示分水岭算法过分割得到的区域块数目)

式中:gp代表像素p的灰度。标号场X={X1,...,XN}的每个随机变量Xi的现实xi代表第i个区域块的标号,其取值范围为{0,1,...,L-1},其中L代表类别数目。简单的边缘Potts模型在非网格下不能很好的描述边缘,这是因为Potts模型是建立在邻域中的每个像素对中心像素的影响相同的假设条件下的,而以区域块为处理单元的情况下,每个区域块代表的是一像素集合,这种简单的假设会导致误分概率增大。为此,本文根据邻域区域块间的距离来重新定义节点间的相互关系,使其满足相距较远的节点间相互影响较小,距离较近的节点间相互影响较大。

式中:α控制着邻域节点间相互影响的大小。对相同距离的邻域区域,α越大则节点间边的权重V(xi,xj)越小;反之α越小,则节点间的相互影响越大。固定α,两个区域如果相距越近则它们之间边的权重就越大,反之越小。

通过重新建立邻域结构和边缘模型,非网格上的MRF图像分割方法可以转换为求式(8)的能量函数最小时的标号场x的组合优化问题:

式中:β是一个给定的常数,实验中设置为1.5。为方便表示式中的-log(P(Yi|Xi))用D(Yi|Xi)表示,称D(Yi|Xi)为节点i在标号为Xi时的数据项能量。

2 迭代优化与参数估计

最小化式(8)的能量函数是一个NP-难的组合优化问题[7],无法在多项式时间内得到最优解。图切割优化算法是最近提出的一种能够获得能量函数近似全局最优解的方法。Boykov等人[6]提出了两种图切割优化算法:alpha-beta swap方法和alpha-expansion方法。其中,alpha-beta swap方法只能处理两类分割问题,而alpha-expansion方法能够处理多类分割问题。但是,alpha-expansion方法需要添加辅助节点,在非网格情况下两节点间边的大小是根据其几何坐标来确定的,新添加的辅助节点不存在几何坐标,故alpha-expansion算法无法优化非网格下MRF的能量函数。文献[8]提出的SAE优化算法是alpha-expansion方法的一个简化版本,它避免了添加辅助节点,在保证优化精度的前提下具有更快速的收敛速度。因此,本文采用SAE优化算法来最小化式(10)的能量函数。

通常地,假设式(8)右边的似然概率P(Yi|Xi)服从高斯分布[14],即对每个节点在给定类别标号的情况下其灰度值服从高斯分布,从而

式中:ixm和δ2ix分别是ix类对应的高斯分布的均值和方差。因此,数据能量项中总共包含了L对的未知参数。平滑能量项只含有一个未知参数α,从而所有的待求参数可表示为Θ={m0,σ0,...,mL-1,σL-1,α,β}。对包含观测数据和隐藏变量的不完整数据的参数估计问题,EM算法[15]可以取得较好的结果。EM算法是通过E步和M步的交替迭代来实现概率期望的最大化。

E步:计算后验概率

M步:更新高斯分布的均值和方差

式中:t代表迭代次数。对参数α的估计,本文采取了一种类似于文献[3][4]的学习策略:在迭代过程中逐步添加平滑能量项的比重。

随着迭代的进行,α的值越来越小,相离较远的区域之间的边的权重变得越来越大,从而逐步增加了平滑能量项的比重。

3 算法具体实现

图切割优化算法需要一个初始分割。本文采用一种基于灰度阈值的方法,可快速获得图像初始分割。首先,利用快速排序算法将区域块节点按照其灰度值从小到大排列;然后,以N/L为步长将区域节点划分为L个区间并求得每个区间内节点的灰度平均值;最后,以这些均值作为阈值将节点划分为L个类别。根据初始分割,可以获得各个参数的初始值:

SAE优化算法是一种迭代优化方法,在每次迭代结束之后根据式(10)到式(12)更新参数。更新完参数之后继续进行迭代。通过多次实验经验可知,迭代的次数为20左右时就能够取得较满意的结果。

虽然分水岭算法得到的区域块具有较好的图像边界,但在强噪声图像中真实的边界受到破坏的情况下,区域块的边界也会受到轻微的影响。为此,在分割结束后我们采用开形态滤波器[10]来消除边界上的奇异点,平滑图像边缘。

4 实验结果及分析

4.1 合成图像的分割

因为目前尚无有效地方法来评估分割算法的性能,为此本文采用类似于文献[14]、[16]和[17]的方法:在人工合成图像上定量评估算法的性能。如图2所示,图2(a)是一幅人工合成的图像,包含了常见的弧状、斜线状和水平垂直状的边缘,将其视为图像的理想分割结果。图2(b)是在图2(a)上添加高斯噪声得到的观测图像。通过比较观测图像的分割结果和真实图像间的差异,即误分率[18]MCR(误分像素数目与总像素数目的比值),来评价一个算法的分割精度。为评价算法对噪声的鲁棒性,分别对图2(a)添加了三种不同程度的高斯噪声(均值为0,方差依次为0.01,0.03和0.15),如表1的第一行所示在这三种噪声下图像的信噪比SNR(噪声的均值与观测图像的均值的比值)依次较少。

参与比较的算法都是基于网格MRF的分割方法:文献[8]的SAE算法和文献[3-4]的快速模拟退火算法。为得到较满意的结果,像素SAE算法的邻域设为7×7大小的窗口,迭代5次,像素FSA算法的邻域为5×5的窗口,迭代50次。

图2给出了在信噪比最低时,各算法的分割结果。表1给出了在不同噪声背景下各个算法的误分率,可以看到各算法均有一定抑制噪声的能力,但是本文算法在分割精度上要高于另外两种基于像素的MRF分割方法。通过对三种噪声下算法的运行时间取平均可得到每个算法的平均运行时间依次为像素SAE算法为1.469 s,像素FSA算法为3.656 s,本文算法为0.204 s。

(a)理想分割;(b)添加噪声的图像(高斯噪声的方差为0.15);(c)SAE算法的分割结果;(d)SMRFV的分割结果;(e)本文算法的分割结果.(a)Ideal segmentation result;(b)(a)image added noise;(c)Segmentation result using SAE algorithm;(d)Segmentation result using SMRFV method;(e)Segmentation result using proposed method.

4.2 MSTAR SAR图像的分割

MSTAR SAR是一个常用的SAR图像库,如图3(a)所示MSTAR图像中存在三类目标场景:坦克、阴影和背景杂波。为测试新算法自适应克服噪声的能力,分别以本文算法的中间结果图3(b)和原始SAR数据图3(a)作为文献[8]提出的算法的输入,比较它们的分割结果中抑制噪声的情况。图3(b)是通过将新算法中以分水岭算法过分割得到的区域块的均值作为对应区域像素的灰度强度得到的。图3(c)是原始SAR数据的分割结果,图3(d)是图3(b)的分割结果,在图3(c)的背景中尚有大量未被消除的噪声,而图3(d)中已经没有斑点噪声。这是因为在强噪声的SAR图像中,数据的局部相关性减弱,每个像素本身的灰度值不能够有效地反映雷达后向散射系数的真实值。而通过将每个区域块内的均值作为对应区域像素的灰度值,一方面可以增强图像的局部相关性,另一方面区域内的均值更能反映图像的真实灰度,从而提高了算法抑制噪声的能力。

(a)原始SAR数据;(b)将分水岭得到的区域内的均值作为对应像素的灰度强度得到的图像;(c)以图(a)作为SAE算法输入得到的分割结果;(d)以图(b)作为SAE算法输入得到的分割结果.(a)Original SAR image;(b)Filtered image using region filter;(c)Segmentation result using image(a)as SAE method’s input;(d)Segmentation result using image(b)as SAE method’s input.

以像素作为处理单元的网格MRF分割方法在强噪声背景的SAR图像中,不能够兼顾图像的边缘和噪声。在保护边缘的同时往往不能够有效地抑制噪声,如图4(a)是文献[3]的算法对图3(a)的分割结果,由于采用了较为简单的邻域结构(8邻域),所以图中坦克和阴影的边缘都没有遭到过多的破坏,但是分割结果中含有大量未被消除的斑点。图4(b)是文献[3]的算法采用5×5的邻域结构对图3(a)的分割结果,由于邻域结构复杂从而可以有效地消除斑点噪声对分割结果的影响,但是坦克和阴影的边缘都被过分平滑了。为解决以像素作为处理单元的网格MRF分割方法中保护边缘和抑制噪声间的矛盾,本文提出的以区域块作为处理单元的非网格MRF分割方法,一方面有效抑制了噪声对分割结果的影响,另一方面也较好地保护了图像的边缘信息。如图4的(c)和(d)中都能够较好地抑制斑点噪声,在图4(c)中坦克和阴影的边缘都不够平滑,这是由于图像的噪声比较强,分水岭过分割的定位边缘时会出现轻微的不准确,为此我们采用开形态重建滤波器来平滑这些边缘以得到更为准确的分割结果,如图4(d)。

新算法不仅在保护边缘和抑制噪声方面较网格MRF分割方法有了很大提高,而且在算法的效率方面也有了明显的改善。在对图3(a)的分割中,文献[8]的算法花费了2.298 5 s,文献[3]的算法花费了3.927 0 s,而本文算法只花费了0.605 5 s,较前两种方法提高了大约4~7倍。这是主要因为非网格MRF在迭代优化时处理单元数量要远少于网格MRF的处理单元的数量,比如对图3(a)网格下的处理单元数目是16 384,而经过分水岭过分割得到的区域块数目(即非网格MRF的处理单元数目)为1 312,只有前者的8%。

(a)对图3(a)应用文献[3]的分割方法,采用8邻域结构;(b)文献[3]采用5×5大小的邻域的分割结果;(c)本文算法的未形态重建滤波前的分割结果;(d)本文算法的最终分割结果.(a)Segmentation result by applying the algorithm presented in literature[3]using 8 neighborhood structure;(b)The segmentation result by applying the algorithm presented in literature[3]using 5×5 neighborhood structure;(c)Segmentation result by proposed algorithm before filtering;(d)Segmentation result by proposed algorithm.

5 总结

背景分割 篇4

QR二维码因其信息存储能力强、识读方便、保密性好等优点被广泛应用于制作业、物流等行业中。而在实际应用过程中,QR二维码经常被放置于各式商品之上,导致其所处的环境条件较为复杂,同时对其快速有效地识别产生了很大的影响。在条码识别的特定应用环境和要求下,消除复杂背景对二维码区域影响进行准确分割是保证二维码有效识别的基础。

在QR二维码识别过程中,对采集的图像进行分割是稳定、快速地识读二维码内信息的关键。图像分割方法主要以阈值分割为主,该方法具有计算简单、运算效率高、速度快等特点,但对于所处背景信息复杂的QR二维码图像,人们很难确定一个统一的阈值将QR二维码与复杂背景完全分离。为了实现复杂背景下目标区域的有效分割,研究者提出了多种能够实现不同目标的图像分割算法。宿丁[1]等针对复杂背景下多源多目标图像的分割问题,提出了综合利用红外图像灰度特征与可见光图像灰度以及分维数方差特征的分割算法。李敏花[2]等针对复杂背景图像中的文本抽取问题,提出了基于条件随机场的图像文本抽取方法,通过条件随机场的两个势函数分别描述图像的特征和上下文信息。王萍[3]等针对复杂背景下非规则带状区域提取问题,提出了“探测窗”协同加深“印象”算法。李丹[4]等针对复杂背景下激光图像三维表面重建中光条中心坐标提取问题,提出了两帧平均再相减的改进差影法,实现了复杂背景下激光条图像的分割。杨娜[5]等人针对多个车辆车牌的分割问题,引入视觉注意机制,利用不变性特征实现多目标的定位及最优分割尺度的选取。

面对一个复杂场景,人类视觉注意系统能够迅速将注意力集中在少数几个显著的视觉对象上,对其进行优先处理,该过程被称为视觉注意,并且该显著的视觉对象被称为感兴趣区域[6]。该区域的准确提取可以大大提高图像处理和分析的效率和准确度。如今,感兴趣区域(Region of Interest,ROI)提取技术已经应用于诸多领域,如视频图像质量的评估[7],彩色自然场景中视觉显著对象的检测[8],图像显著区域的提取[9],视觉假体的视觉显著图提取[10],人脸区域预检测[11]和复杂背景下红外小目标检测[12]等。

为了解决复杂背景下QR二维码图像的准确分割问题,本文研究了复杂背景下QR二维码图像的有效分割算法。首先,研究常见图像分割算法对复杂背景下QR二维码的分割效果,如基于灰度特征的Otsu算法、基于颜色信息的色差算法以及K-means聚类算法;其次,研究基于视觉注意机制的感兴趣区域提取算法对复杂背景下QR二维码的分割效果,如Itti模型和GBVS模型,以期消除复杂背景对QR二维码有效识别的影响,提高复杂背景下QR二维码的有效识别率和识别效率,实现复杂背景下QR二维码的有效识别。

1 基于常见图像分割算法的复杂背景下QR二维码分割处理

常见的图像分割算法有基于灰度特征的Otsu算法、基于颜色信息的色差算法和K-means聚类算法等。采用此3种方法分别对复杂背景下的QR二维码图像进行分割处理,获得的分割结果如图1所示。图1中(a)和(e)为复杂背景下的QR二维码图像;(b)和(f)分别是利用Otsu算法分割的结果;(c)和(g)分别是利用色差法分割的结果;(d)和(h)分别是利用K-means算法的分割结果。实验表明Otsu算法不能消除复杂背景,而色差算法在消除复杂背景的同时也消除了目标区域,K-means聚类算法也不能消除复杂背景或直接消除了目标。总之,常见图像分割算法都不能从复杂背景中分割出QR二维码图像,所以仍需要考虑性能更加优良的分割方法。



2 基于视觉注意机制的复杂背景下QR二维码图像分割处理

基于ROI的图像提取算法不仅能够提高图像的清晰度,还可以保留图像中的重要信息,本节旨在实现复杂背景图像中的QR二维码区域的准确分割,以减少复杂背景对QR二维码识别的快速性和准确性的影响。

2.1 Itti视觉注意模型

Itti模型[12]是最经典的视觉注意力模型之一。该模型首先从输入图像中提取多种特征,如亮度、颜色和方向;其次,通过高斯金字塔和中央周边差对图像进行处理形成各特征的关注图;再次,把得到的各个关注图归一化、融合得到总的显著图;然后,在此基础上,通过赢者为王神经网络相互竞争吸引注意焦点,使得最显著区域胜出,即得到感兴趣区或注意区;最后,通过返回抑制机制抑制当前显著区域,使注意力转向下一个最突出的区域。Itti模型的实现步骤如下:

1)视觉预处理。从输入的彩色图像中获得红、绿、蓝分量,并计算图像的强度I=(r+g+b)/3。金字塔中的每个像素构成颜色通道,红色通道表示为R=r-(g+b)/2,绿色通道表示为G=g-(r+b)/2,蓝色通道表示为B=b-(r+g)/2。通过过完备可控制的滤波器检测图像中每一点的方向。

2)中央周边差算子。计算某一特征的中央周边差来确定对比,执行这个操作在空间尺度上通过插值到小尺度,然后逐点相减。

3)归一化。把图像中的值归一化到一个固定的区间[0…M],消除振幅差异。计算图像某区域的最大值M,并计算图像其他区域的平均值m,然后用图像乘以(M-m)2。

4)关注图。以4为尺度将特征图像组成三个显著图像。

5)显著图。分别归一化三个关注图并相加得到最后输入的显著图。

2.2 GBVS视觉注意模型

Harel[13]最早提出了GBVS(Graph-Based Visual Saliency)模型,该模型是在Itti模型的基础上运用马尔可夫随机场的特点构建二维图像的马尔可夫链,通过求其平衡分布而得到相应的显著图[14]。GBVS模型的实现步骤如下:

1)获取多尺度亮度信息。利用式(1)所示的高斯金字塔低通滤波器对输入的灰度图像进行滤波操作:

其中,(x,y)代表像素的位置,σ表示比例因数。

2)获得多尺度的方向信息。利用一组Gabor金字塔滤波器对原始灰度图像进行滤波,如式(2)所示:

上式中σ是比例因子,f是正弦波形频率,θ是方向角度,θ=[0,π/4,π/2,3π/4]。因此,四组不同尺度的滤波结果构成了方向通道。

3)计算图像不同尺度和不同特征的马尔可夫平均分布。

4)获得显著图。通过对不同通道的马尔可夫平均分布的求和与归一化得到其大小与原始图像相等。

3 试验结果与分析

3.1 试验结果

1)试验样品

为了验证文中算法对消除复杂背景影响的QR二维码分割的有效性,选取10幅不同背景下拍摄的QR二维码图像进行了试验,试验图像均于2016年3月20日在西北农林科技大学机械与电子工程学院采集,采集时光照为日光灯照射。采集距离目标约15厘米,所有采集图像为JPEG格式。

2)试验软件及硬件

试验均在2.6GHz处理器、4G内存的联想笔记本上完成,试验程序均在MATLAB 2013a环境下编写、运行。

3)试验方法

试验过程的步骤如下:

Step1)输入复杂背景下的QR二维码图像,依次获取GBVS和Itti的显著图。

Step2)利用提取出的显著图中二维码区域与背景的灰度差异,分割出QR二维码图像。

利用Itti模型和GBVS模型分别对复杂背景下的QR二维码图像的感兴趣区域进行提取,获得的结果示例如图2所示。其中,复杂背景下的QR二维码原始图像如图2(a)、(f)、(k)、(p)、(u)所示,图2(b)、(g)、(l)、(q)、(v)以及图2(c)、(h)、(m)、(r)、(w)分别是GBVS模型和Itti模型对应提取的显著图,图2(d)、(i)、(n)、(s)、(x)以及图2(e)、(j)、(o)、(t)、(y)分别是从对应的图2(a)、(f)、(k)、(p)、(u)以及图2(c)、(h)、(m)、(r)、(w)中分割出来的最终结果。

3.2 结果分析

对比GBVS模型和Itti模型从复杂背景中分割出的QR二维码结果,从图2(d)、(i)、(n)、(s)、(x)和图2(e)、(j)、(o)、(t)、(y)所示的分割结果中可以看出两个模型基本上都完整的提取出了复杂背景中的QR二维码;对比图2(x)和图2(y)发现Itti模型较GBVS模型能够提取出更加完整的QR二维码。

为了进一步验证文中算法的有效性,引入分割误差和重合度两种客观评价指标,计算该实验得到的十幅图像数据,不同模型的分割误差和重合度如表1所示。

通过表1可以看出,GBVS模型获得的最低分割误差为0.93%,Itti模型为1.04%;GBVS模型获得的最高重合度为97.78%,Itti模型为96.79%;GBVS模型的平均分割误差为10.54%,Itti模型为10.39%,两者相差仅为0.15%;GBVS模型分割得到的平均重合度为87.14%,Itti模型为86.60%,仅相差0.54%;试验结果表明将视觉注意机制GBVS或Itti模型引入到复杂背景下QR二维码的图像分割可以有效去除复杂背景对QR二维码目标准确分割的影响。

4 结论

针对实际生活中各种场景下因复杂背景引起的QR二维码图像分割效果差这一问题,通过引入视觉注意机制模型,消除了复杂背景对QR二维码图像分割的影响,实现了复杂背景下QR二维码图像的完整分割。同时,GBVS模型和Itti模型的分割性能接近,均可有效的从复杂背景中分割出QR二维码目标区域。

摘要:QR二维码品质溯源的标识,在制造业中具有广泛的应用。提出了基于视觉注意机制GBVS和Itti模型的QR二维码分割方法,可以有效消除复杂背景对QR二维码高效识别的影响。实验表明,GBVS和Itti模型最终获得最小分割误差分别为0.93%和1.04%,最高重合度分别为97.78%和96.79%,平均重合度分别为87.14%和86.60%,相差仅为0.54%;该试验结果表明GBVS和Itti模型均能从复杂背景中有效分割出QR二维码,克服复杂背景的影响,有利于稳定快速识别QR二维码,同时验证了将视觉注意机制模型应用于复杂背景下的QR二维码分割的有效性、可行性。

上一篇:对应思想下一篇:历史课堂教学的有效性