图像检测技术

2024-08-20

图像检测技术（精选11篇）

图像检测技术篇1

1 引言

数字图像隐藏技术作为一种常用的信息保密技术,通过将秘密图像隐藏于一幅或多幅公开图像中,来实现对秘密图像的保护。由于图像数据已经成为重要的信息传输手段,所以基于数字图像的隐藏技术也日益成为研究热点。许多文献讨论了数字图像的隐藏问题[1,2,3,4,5,6]。信息可以通过很多种不同的方法进行隐藏。最常见的方法是最低有效位(Least Significant Bit, LSB)插入、替换、掩盖等。

图像插值有很多的应用场合,它在高清晰度电视、数字投影仪、图像打印以及通常的图像编辑和处理软件等方面有广泛的应用。使用者可以通过对图像插值改变图像大小或者对感兴趣的区域增强其细节性,以便得到很好的观察效果。图像插值的重要性可以追溯到很多领域,比如医学,军事以及电子领域等等。因为运算简单通常采用传统的线性插值算法,线性插值方法主要利用已知的象素点的加权平均。常用的方法有最近邻插值法(Nearest Neighbor Interpolation,NNI)、双线性插值法(Bilinear interpolation,BI)、分段三次插值法(Piecewise Bicubic Interpolation,PBI)等。线性插值方法的不足主要体现在容易引起两种失真,即图像边缘阶梯形失真效应(最近邻法和双线性插值尤其明显),和边缘模糊效应(双线性插值和双三次插值比较明显)。

本文介绍新的邻近均值图像插值方法,该方法具有较高的速度和较低的时间复杂度。在信息隐藏中利用基于邻近均值插值方法得到的扩张图像作为载体图像。由于基于邻近均值插值方法效率较高,所以数据隐藏效率较高。

2 图像插值方法

2.1 传统的插值方法[7]

数字图像的插值在数字图像的应用中,起着重要的作用,尤其是在超分辨技术中。

传统的图像插值有最邻近插值,双线性插值,三阶线性插值。最邻近插值又称零阶插值,它输出的像素值等于距离它映射到的位置最近的输入像素值,例如(50.5,71.3)的插值结果就是将(51,71)点处的值赋予新的象素点作为插值后的值。这种算法的优点是算法简单,运算速度快。其缺点在于较低的代数拟和阶使得插值质量差,会在图像中产生人为加工的痕迹,常出现方块效应,图像边缘易产生锯齿效应。

双线性插值又称一阶插值,它先对水平方向上进行一阶线性插值,然后再对垂直方向上进行一阶线性插值,或者反过来,最后将两者合并起来。双线性插值实际上是对邻近4个像素点进行插值,效果比最邻近插值好。但由于双线性插值的斜率不连续,并且双线性插值的平滑作用会使图像的细节产生退化,在进行放大时更为明显。这些情况可通过高阶插值得到修正。

高阶插值算法常用的有双三次线性插值,对周围邻近的16个像素点进行插值计算。这种图像插值算法的优点是可以消除锯齿现象,插值质量高,效果好,同前面两种方法比较边缘阶梯失真现象得到很大程度的抑制,但放大时边缘模糊现象却比较严重。但这种算法的不足是计算量大,运算时间长,当运算需要实时性时就略显遗憾。

2.2 邻近均值插值方法

邻近均值插值法定义为如下公式:

undefined

其中,M×N为原来图像大小,T为按比例放大的倍数,这里我们取T=2时,插值结果图像具有较高的分辨率。

图1给出了邻近均值插值方法的一个例子,插值结果图像是原图像的两倍。像素点I′(0,0),I′(2,2)和像素点I(0,0),I(2,2)的值相同;当ij时I′(0,1)由(I(0,0)+I(2,0))/2计算可得。

3 基于邻近均值图像插值信息隐藏方法

本节给出基于邻近均值图像插值的信息隐藏方法。应用邻近均值图像插值所得的结果图像作为载体图像,信息隐藏按Zigzag顺序逐一进行, 即从左到右,从上到下的方向。在秘密信息被隐藏前,载体图像被分成4像素、不重叠、连续的块,应用zig-zag扫描(如图2)。

3.1 信息隐藏

对于每一个4像素、不重叠、连续的块中像素灰度值为I(i,j),

I(i,j+1),I(i+1,j),I(i+1,j+1),相应的利用NMI方法的结果图像的像素灰度值为I′(i,j), I′(i,j+1), I′(i+1,j), I′(i+1,j+1),把秘密信息隐藏于除了I(i,j)以外的其它像素点。算法思想:

首先利用公式(2)计算出不同的d:

d=I(T·x+Z,T·y+O)-I(T·x,T·y) (2)

其中Z,O为0或1,0≤x,y≤127

其次利用公式(3)计算出Lbit

undefined

最后利用由公式(3)出的Lbit在秘密信息中选择出相应的秘密信息并转换为实数P,则新的像素值变为:

I′(i,j)=I′(i,j)+P (4)

如图3所示,给出信息隐藏的全过程:给出像素点I(0,0),I(0,1),I(1,0),I(1,1)灰度值分别为110、128、 145、89,利用公式(2)计算出d分别为0、18、35、11;相应的计算出隐藏于4像素块的信息长度L分别为0、4、5、3;从而秘密信息转换的实数分别为11002=10,101002=20,0102=2,则利用插值法得到的结果图像像素I′(0,0),I′(0,1),I′(1,0),I′(1,1)分别为110,138,165,91

3.2 信息恢复

信息恢复是信息隐藏的逆过程,利用公式(5)可以恢复出秘密信息。

undefined

其中M,N=0,1,2,…,127,T同上定义。

图4给出了信息恢复全过程: 利用插值法得到的结果图像像素I′(0,0),I′(0,1),I′(0,2);I′(2,0),I′(2,1); I′(3,0),I′(3,1),I′(3,2)分别为35,68,105; 110,82,89; 189,130,90;如图4所示可以计算出d和l从而得到p,对应的就可以恢复出秘密信息。

4 数值试验

4.1 插值结果:

图5利用文中给出的邻近均值图像插值方法由256×256的灰度图像生成512×512的图像作为载体图像,并比较三种插值方法的峰值噪声比PSNR:两种传统的方法和邻近均值插值方法(如表1所示)。

结果表明邻近均值插值方法优于最近邻插值方法和双线性插值方法。

4.2 图像隐藏:

图6是利用本文的算法进行图像隐藏,其中Lena图(a)为秘密图像(256×256),模板图像(b)为Monkey(256×256)图为利用邻近均值方法生成的(512×512)图像,图c为隐藏后的公开图像。

4.3 图像恢复

图7给出了图像的恢复试验。图a是公开图像(512×512),图b是恢复的秘密图像(256×256)。

5 结束语

本文给出了一种邻近均值数字图像插值方法,并把该方法应用于信息隐藏。利用邻近均值插值生成分辨率较高的数字图像,把该图像作为载体图像,给出了信息隐藏的具体方法,该方法的优点是计算简单,信息隐藏的安全性较高;另外,数值试验表明该插值方法优于传统的最近邻插值方法和双线性插值,在超分辨技术中也可以用该方法。

参考文献

[1]张贵仓,王让定,章毓晋.基于迭代混合的数字图像隐藏技术.计算机学报,2003,26(5):569~574

[2]丁玮,齐东旭.数字图像变换及信息隐藏与伪装.计算机学报,1998,21(9):838~843

[3] Chi-Kwong Chan,L.M.Cheng.Hiding data in images by simple LSB substitution.Pattern Recognition.2004,(37):469~474

[4]张大奇,张永红,康宝生.基于RB曲线融合的数字图像隐藏技术.中国图象图形学报,2006,11(2):235~243

[5] Z.Ni,Y.Q.Shi,N.Ansari,W.Su.Reversible data hiding,circuits and systems for video technology.IEEE Transactions2006,16:354~362

[6]程东升,叶瑞松.一种新的图像置乱方法.计算机应用,2008,29(2):9~13

[7] Thomas M.Lehmann,Claudia Gonner,Klaus Spitzer.Survey:interpolation methods in medical image processing.IEEE Transac-tions on Medical Imaging.1999,18(11):1049~1075.

图像边缘检测方法研究篇2

关键词：灰关联分析；小波变换；数学形态学；边缘检测

中图分类号：TP391文献标识码：A文章编号:1009-3044(2007)16-31144-02

Edge Detection in Image Method Research

XUE Wen-ge，KUANG Tian-fu

(Yunnan Normal University, Kunming 650092,China)

Abstract:Discuss several kinds of traditional edge detection operators and receive widespread attention in recent years on the edge of detection methods, and pointing out the advantages and disadvantages.And also give a new gray correlation analysis based on the edge detection method for edge detection methods ，analysis its algorithmic rationality ,and make further supplement and improvement for edge detection methods.

Key words:Gray correlation analysis;Wavelet transform;Morphology;Edge detection

1 引言

边缘是图像最重要的特征之一，包含了图像的大部分信息。边缘检测的实质是采用某种算法来提取出图像中对象与背景间的交界线。我们将边缘定义为图像中灰度有阶跃变化或屋顶状变化的像素的集合，它存在于目标与背景、目标与目标、区域与区域、基元与基元之间，是图像分割所依赖的最重要的特征。根据灰度变化的剧烈程度，边缘可以分为两种[1]：一种为阶跃性边缘，另一种为屋顶状边缘。对阶跃性边缘，二阶方向导数在边缘处呈零交叉；而对于屋顶状边缘，二阶方向导数在边缘处取极值。

目前，经典的边缘检测方法包括边缘算子法、曲面拟合法、模板匹配法、门限化法等。但这些方法对噪声比较敏感并且会在检测边缘的同时增强噪声，这就给边缘检测带来了一定的困难。近年来，随着数学理论和人工智能的发展，又出现了许多新的边缘检测方法，如基于灰关联分析的边缘检测法、基于小波变换、数学形态学、模糊理论的边缘检测法等。

2 传统的边缘检测算子

传统的边缘检测方法是对原始图像中像素的某小邻域来构造边缘检测算子。以下是对几种经典的边缘检测算子进行了分析。

2.1 差分边缘检测

利用图像灰度的一阶导数算子在灰度迅速变化处得到的极值来进行奇异点的检测。它在某一点的值就代表该点的“边缘强度”，可以通过对这些值设置阈值来进一步得到边缘。但用差分检测边缘必须使差分的方向与边缘方向垂直，这就需要对图像的不同方向进行差分运算，增加了运算的繁琐性。一般可以分为垂直边缘、水平边缘、对角线边缘检测：

图1 差分算法边缘检测方向模板

差分边缘检测方法根据灰度迅速变化处一阶导数达到最大值原理，利用导数算子检测边缘。但是这种算子具有方向性，要求差分方向与边缘方向垂直，运算繁琐，目前很少使用。

2.2Roberts边缘检测算子

Roberts边缘检测算子[2]根据任意一对互相垂直方向上的差分可用来计算梯度的原理，采用对角线方向相邻像素之差，即：

它们的卷积算子为：

图2 Roberts边缘检测算子方向模板

有了△xf，△yf之后，很容易计算出Roberts的梯度幅值R(i,j)，适当取门限TH，作如下判断：R(i,j)>TH，(i,j)为阶跃状边缘点。{R(i,j)}为边缘图像。

Roberts算子采用对角线方向相邻两像素之差近似梯度幅值检测边缘。检测水平和垂直边缘的效果好于斜向边缘，定位精度高，但对噪声较敏感。

2.3 Sobel边缘检测算子

对数字图像{f(i,j)}的每个像素，考察它上下、左右邻点灰度的加权差，与之接近的邻点的权大。据此，定义Sobel算子[3]如下：

卷积算子为：

图3 Sobel边缘检测算子方向模板

适当取门限TH，作如下判断：s(i,j)>TH，(i,j)为阶跃状边缘点，{s(i,j)}为边缘图像。

Sobel算子利用像素点上下、左右邻点的灰度加权算法，根据在边缘点处达到极值进行边缘的检测。Sobel算子对噪声具有平滑作用，提供较为精确的边缘方向信息，但会检测出伪边缘，边缘定位精度不够高。

2.4 Prewitt边缘检测算子

由于Prewitt边缘算子[4]是一种边缘样板算子，这些算子样板由理想的边缘子图像构成，依次用边缘样板去检测图像，与被检测区域最为相似的样板给出极大值，用这个最大值作为算子的输出值p[i,j]，这样可将边缘像素检测出来。我们定义Prewitt边缘检测算子模板如图4所示。

适当取门限TH，作如下判断：R(i,j)≥TH，则(i,j)为阶跃状边缘点。{R(i,j)}为边缘图像。

图4Prewitt边缘检测算子模板

图5 八个算子样板对应的边缘方向

Prewitt算子是对图像灰度平均后再求差分，因此可以抑制噪声。但Prewitt算子检测出的边缘较宽。

2.5 Laplace边缘检测算子

Laplace算子[5]是二阶微分算子，它具有旋转不变性，对灰度突变敏感。在数字图像中，可用差分来近似微分运算，f(i,j)的Laplace算子为：

?荦2f(i,j)=△2xf(i,j)+△2yf(i,j)=f(i+1,j)+f(i-1,j)+f(i,j+1)+f(i,j-1)-4f(i,j)

Laplace算子的模板如下图所示：

图6 Laplace边缘检测算子模板

Laplace算子是二阶微分算子，利用边缘点处二阶导数出现零交叉原理检测边缘，不具有方向性，对灰度突变敏感，定位精度高。但会丢失一些边缘，对噪声较敏感。

2.6 LOG边缘检测算子

LOG滤波器又称Marr-Hildreth模板或算子[6]。

其中，G(x ,y)是对图像进行处理时选用的平滑函数（Gaussian函数）；x，y为整数坐标；σ为高斯分布的均方差。对平滑后的图像fS(fS= f(x ,y)×G(x ,y))做拉普拉斯变换得：

即可得到一个兼有平滑和二阶微分作用的模板，再与原来得图像进行卷积，其精度明显提高。

LOG算子通过检测二阶导数过零点来判断边缘点，因此，高斯函数中方差参数σ越大，检测到的图像细节越丰富，但对噪声抑制能力相对下降，易出现伪边缘；反之，则抗噪声性能提高，但边缘定位准确性下降，易丢失许多真边缘。

2.7 Canny 边缘检测算子

Canny算子[7]是一个具有滤波、增强和检测的多阶段的优化算子。其实质是用一个准高斯函数作平滑运算fs=f(x ,y)×G(x ,y)，然后以带方向的一阶微分算子定位导数最大值。平滑后fs(x ,y)的梯度可以使用2×2一阶有限差分近似式：

幅值和方向角可用直角坐标到极坐标的坐标转化来计算：

M(i,j)反映了图像的边缘强度；θ(i,j)反映了边缘的方向。使得M(i,j)取得局部最大值的方向角θ(i,j)，就反映了边缘的方向。

Canny算子也可用高斯函数的梯度来近似，在理论上很接近4个指数函数的线性组合形成的最佳边缘算子。但编程较为复杂，且运算较慢。

3 新的边缘检测方法

3.1基于灰关联分析的边缘检测方法

灰色理论是20世纪80年代初创立的一门新兴边缘学科，主要用来研究小样本、贫信息的不确定性系统，通过对已知信息的综合、开发、建模、计算等提取有价值的信息，实现对系统行为的正确认识和有效控制。

灰关联分析是灰色系统理论的重要组成部分,它通过分析时间序列曲线的几何形状的相似程度来衡量它们之间关联性的大小。图像的边缘点往往表现为相邻像素点处的灰度值发生了剧烈的变化，而灰色关联度恰好能反映这种变化的剧烈程度。对一幅灰度图进行边缘检测时，可取图中某一像素点X和其八邻域像素点顺序排列组成比较序列Xi；把理想非边缘点和其八邻域像素点组成母序列X0，根据灰关联度分析的基本思想[8]，当Xi和X0的关联度较大时，表示两序列的几何形状较为相似，因此可认为像素点X为非边缘点；反之，当两序列的关联度较小时，可认为像素点X为边缘点。灰色关联度的定义如下：

设X0={X0(t)|t=1,2,…,n}为参考序列，Xi={Xi(t)|t=1,2,…,n},(i=1,2,…,m)

为被比较的序列，整条曲线Xi与参考曲线X0的关联度

其中，

基于灰关联分析的图像边缘检测方法计算量较小，检测出的边缘清晰、连续，但会出现伪边缘，对噪声较敏感。

3.2 基于小波变换的边缘检测方法

近年来，小波分析[9]成为应用数学和工程学科中迅速发展的一个新领域，小波变换实质上是时域-频域的局部变换，因此可以更有效的从信号中提取有用信息。在图像处理中，图像中的大部分信息集中在低频和中频部分，图像的边缘和噪声对应于高频部分，因此就需要多尺度的边缘检测。而小波变换具有天然的多尺度特征，通过伸缩平移对信号进行细化分析，达到高频处时间细分，低频处频率细分。所以，小波变换非常适合复杂图像的边缘检测。

3.3 基于数学形态学的边缘检测方法

数学形态学[10]是图像处理和模式识别领域中的一门新兴学科，具有严格的数学理论基础，现已在图像处理中得到了广泛的应用。其基本思想是用具有一定形态的结构元素去度量和提取图像中的对应形状以达到对图像分析和识别的目的。用数学形态学进行图像边缘检测，算法简单,结构元选取灵活,但算法的适应性较差。

4 结束语

在图像边缘检测领域中尽管有经典的边缘检测算子和一些新的边缘检测方法，但它们都不是具有绝对优势的方法，有的方法边缘检测精度高，但抗噪声性能较差；有的方法解决了抗噪声性能差的问题，检测精度又不够。可见，无论哪一种边缘检测算法在解决一定问题的同时也存在不同类型的缺陷。因此，寻求算法简单、能较好解决边缘检测精度与抗噪声性能协调问题的边缘检测算法将一直是图像处理与分析中研究的主要问题之一，还有许多工作有待进一步研究。

参考文献：

[1]甘勇,马芳,熊坤,等.基于遗传算法和梯度算子的图像边缘检测[J].微计算机信息,2007,23(2):306-308.

[2]徐建华.图像处理与分析[M].北京:科学出版社,1992.

[3]何斌.Visual C++数字图像[M].北京:人民邮电出版社,2001.

[4]崔屹.数字图像处理与技术[M].北京:电子工业出版社,1997.

[5]周新伦，柳健，刘华志.数字图像处理[M].北京:国防工业出版社,1984.

[6]李小红.基于LOG滤波器的图像边缘检测算法的研究[J].计算机应用与软件,2005,22(5):107-108.

[7]陈宏希.基于边缘保持平滑滤波的canny算子边缘检测[J].兰州交通大学学报,2006,25(1):86-90.

[8]王坚强.一种新的灰色关联度计算方法及其应用[J].系统工程理论与实践,1997,17(11):119-122.

[9]王建中,赵军.图像边缘提取的小波多孔算法及改进[J].武汉理工大学学报,2004,26(1):76-79.

[10]王树文,闫成新,张天序.数学形态学在图像处理中的应用[J].计算机工程与应用,2004,40(32):89-92.

图像检测技术篇3

1 几种常用的边缘检测算子

物体的边缘是以图像的局部特征不连续的形式出现的, 也就是指图像局部亮度变化最显著的部分, 例如灰度值的突变、颜色的突变、纹理结构的突变等等, 同时物体边缘也是不同区域的分界处。对于单色图像, 通常认为边缘是灰度陡然变化部分, Herskovits指出了边缘的几种典型情况, 例如阶跃形、屋顶形、边缘-效应形、斜坡-阶跃形等。

由于边缘是图像灰度变化最剧烈的地方, 传统的边缘检测就是利用了这一点, 对图像的各个像素点进行微分或求二阶微分来确定边缘像素点。一阶微分图像的峰值处对应着图像的边缘点, 二阶微分图像的过零点处对应着图像的边缘点。根据数字图像的特点, 处理图像过程采用差分来代替倒数运算。我们定义的梯度算子为:

式子中表示图像的灰度值, 图像边缘提取的常用梯度算子有sobel算子, robert算子, prewitt算子, laplacian算子, canny算子等。

2 像素级图像融合

从以上各个算子提取的边缘图来看, 每个算子提取的图像都有其优缺点, Sobel算子检测对角方向的边缘较好;Prewitt对方向敏感, 边缘较宽, 而且间断点多, 但检测垂直方向的边缘较好;LOG算子检测方法对具有高斯噪声的图像处理效果较好;Canny方法不容易受噪声干扰, 能够检测到真正的弱边缘。怎样结合各种算子的优点, 使得检测出来的边缘更加清晰, 显示的更加明显, 基于这一思想, 本文采用了像素级图像融合的方法, 将不同算子检测出来的汽车边缘图像融合, 获得一副结合不同算子优点的边缘图像。像素级融合原理又称数据级融合, 它是直接在采集到的原始数据层上进行的融合, 在各种传感器的原始则报未经预处理之前就进行数据的综合和分析。

在融合的3个级别中, 像素级图像融合作为各级图像融合的基础, 它能尽可能多地保留场景的原始信息, 提供其他融合层次所不能提供的丰富、精确、可靠的信息, 这样有利于图像的进一步分析、处理与理解, 进而提供最优的决策和识别性能。目前常用的图像融合技术有:加权平均法、逻辑滤波法、彩色空间法、多分辨塔式算法、小波变换法、卡尔曼滤波算法、模拟退火法和假彩色法。

3 一种基于像素级融合的边缘检测方法

3.1 加权平均法

假设参加融合的两个源图像分别为A, B, 图像大小为N1×N2, 经融合后得到的融合图像为F, 那么对A, B两个源图像的灰度加权平均融合过程可表示为:

式中:ω1+ω2=1。ω1, ω2在不同类的图像融合当中, 通过仿真确定它们的值。当两幅图像很相似时, 合成图像就采用两幅图的平均值, 也就是权值分别为0.5和0.5;当两幅图像差异很大时, 就选择最显著的那一幅图像, 此时的权值为0和1, 上面的权值选择方法基本上都是基于人眼的视觉特征, 而没有考虑到实际应用中的目标特征。Lallier利用军事应用中的目标特征提出了一种自适应的权值选择方法, 所产生的融合算法计算量较少, 适于实时处理, 而且稳定性非常好。

3.2 逻辑滤波方法

另一种将2个像素数据合成为1个像素的直观方法就是对它们进行逻辑运算, 例如:当2个像素的值都大于某一阈值时, “与”滤波器输出为“1” (为“真”) 。图像通过“与”滤波器而获得的特征可认为是图像中十分显著的成分。“或”逻辑操作可以十分可靠地分割一幅图像。

4 实验结果及分析

比较这四幅边缘图, Sobel算子与Robert算子获得的边缘图比较相似, Canny算子与Laplacian算子获得的边缘图比较相似, 分别对它们进行加权平均, 权值设为0.5:

得到两幅图像 (e) , (f) , 再将这两幅图像进行逻辑滤波, 这里选择的是“或”滤波器, 设定一个阈值, 计算阈值采用的方法是:分别对 (e) , (f) 两幅图像进行全局阈值处理, 采用最大类间方差法, 该方法是在判决分析最小二乘法原理的基础上推导得出的, 算法比较简单, 分别得到两个阈值T1, T2, 经过实验比较, 采用小的阈值为逻辑滤波最后的阈值。最后得到一幅融合后的图像 (h) 。

下面就是采用以上这种方法, 用Matlab获得边缘图像, 用C语言编程获得融合图像:

(h) 图是最终得到的融合图像, 该图融合了不同的边缘算子的优点, 增强了汽车边缘, 并且可使轮廓的间断的地方连接起来, 使得汽车轮廓更加清晰, 明显, 这给提取汽车外形尺寸带来了很大的方便, 最终用于车型识别系统。

参考文献

[1]覃征, 鲍复民等.数字图像融合[M].西安交通大学出版社, 2004.

[2]夏良正.数字图像处理[M].东南大学出版社, 2003.

图像处理技术论文篇4

关键词：智能交通;数字图像处理;车牌识别;车辆的跟踪与检测

智能交通ITS(Intelligent Transport System) 最早出现在二十世纪九十年代初期，作为世界电子信息技术的前沿，将这项技术应用到交通管理中，实现了交通的智能化。ITS主要是将先进的电子技术、IT、AI、GIS影像等技术进行全面集成，建立起准确实时的地面交通系统。主要应用于APTIS(Advanced Public Traffic Infor-mation System)、APTS(Advanced Public TransportationSystems)、AVCS(Advanced Vehicle Control System)、CVO(Commercial Vehicle Operations)、ETC(electronicToll Collection)、EMS(Emergency Management System) 等方面。Intelligent Transport System有两个由于面的含义，一是智能; 二是交通。交通技术的核心就是智能，智能技术源于电子通信、计算机与人工智能。在交通管理过程中借用当代的信息技术，对车辆道路进行全面的监控，实现交通的智能化管理。

一、数字图像处理技术在智能交通领域中的作用

( 一) 数字图像处理技术的主要工作步骤

一是利用计算机和其他电子设备完成的，其主要内容包括图像的采集与获取、对采集的信息进行编码与存储、图像的合成。合成之后对图像进行绘制，并最终输出，利用新技术对其进行恢复与重建。因此数字图像处理的主要目的是：首先，对图像做灰度变化，保存有效信息，这种方法可以增强图像可读性，有利于原图的恢复;其次，利用特殊手段对图像中所包含的特殊且重要的信息进行提取，并详细分析图像中所包含的特征，这种方法主要是为了提取其中包含的特殊信息，对图像进行分割识别; 其三，对获取到的数据进行压缩，并保持其特有的清晰度，方便图像后期的传送与保存。

( 二) 数字图像处理技术在车牌识别当中发挥的重要作用

车牌识别技术(LPR) 作为智能交通的重要管理策略，被广泛应用在高速收费站、失窃车辆查找、停车场的车辆管理、监控车辆的违纪情况等方面，大大提高了工作效率，节省了人力资源。

数字图像处理技术在智能交通领域中发挥着极大的作用，如监控车辆交通安全、统计交通拥堵情况等，最为出色的地方是车牌识别。数字图像处理技术在智能交通方面有着不可忽视的作用，在智能交通领域的研究中占有一席之地。

一个完整的车牌识别过程，应该是先获取到车牌的图像，计算机设备对获取到的图片信息进行识别，然后对图片进行预处理。根据获取到的图片信息，通过渡波、边缘增强等办法对其进行车牌定位。

二、我国拍照识别系统存在问题及原因

首先，我国的车牌组成比较复杂，由汉字、英文和阿拉伯数字共同构成。汉字的相似，对车牌识别的难度增加; 其次，我国车牌的颜色比较多，有白色、蓝色、红色等，识别起来比较麻烦; 第三，由于人为、道路、天气等原因，使得车牌上粘有水渍、泥土之类的污渍，导致车牌模糊不清，难以识别; 第四，车牌格式繁多，如民用、军用、公安警车、武警专用、外交车辆、特种车辆、消防专用、救护车等。民用车又分为多种，导致识别起来更加麻烦; 第五，车牌悬挂的地方不一致。要解决上述问题，必须提高图像处理的算法，使得拍照识别系统更加有效。

三、应用数字图像处理技术解决拍照识别系统存在问题的对策

( 一) 车牌定位要从复杂的背景中提取出有价值的信息，并进行分割

因为自身不利因素的影响，所以增加了LPR对车牌定位的难度。良好的提取算法，是在保证有效信息不丢失的前提下，尽可能多的踢掉没价值的信息，准确的将车牌信息给抽取出来。判断算法是否精确，有以下三个方法：其一，为了保证其实时性，必须要尽量减少算法; 其二，在复杂的环境下依然具有高度的定位效果，必须有一定的抗干扰性，第三，在保证有效信息不丢失的前提下，尽可能的多的踢掉没价值的信息为提高图像的质量奠定基础。车牌具有纹理，颜色与形状三个主要的特征。纹理主要是因为车牌的字符与车牌背景颜色的一个对比。颜色主要是由于汽车牌照的字符颜色与背景的组合，一般分为白字蓝底 ( 民用轿车) ,黑字黄底 ( 大型汽车) ,白字黑底( 使、领馆汽车) ,黑字白底( 警用汽车) 四种。现阶段车牌定位的处理办法主要要两种，一是灰度图像处理，其主要优势是速度快，内存少;二是基于彩色图像处理，其主要优势是彩色的图像从视觉上极占优势，尤其是随着计算机的迅速发展，运行速度飞快，内存也随之增大。而颜色也是车牌的主要区分模式，所以基于颜色的分割定位在当今的使用更为广泛。

( 二) 基于模板匹配的车牌字符分割

在车牌得到准确的定位后，字符分割水平影响到字符的识别精确度。字符的分割算法主要有：一是直接取得原始车牌的垂直投影，将投影后的峰值作为分割的黄金点。在车牌严重受到损坏的情况下，直接分割往往会产生极大的错误，所以很难找到分割的黄金点; 二是分割即精分割与细分割。这种方法的最大优势就是包括在车牌遭到严重损坏的情况下，也可以保持极好的分割效果，但是算法较为复杂、费时，较难保证实时性。由于一些客观条件的影响，使得以上算法都不能满足，所以提出了一种新的分割算法，这种方法既能克服车牌损坏的影响，又没有过多的增加字符分割的时间。

在此也讲一下改进的MSR算法对车牌图像进行预处理，由于车牌的图像不是很大，所以完全可以满足实时性要求。因为我们提取出来的车牌不能直接进行分割，必须先将其进行二值化处理。所谓二值化处理就是将原始图像经过技术转成二值图像。因为车牌图像的边缘信息是最终图像识别结果的重要影响因素，所以要在进行二值化处理的过程中要保留其边缘信息。我们经常见到的车牌应该是一个方方正正的矩形，然而在实际中，车牌会发生倾斜，我们可以把它看作为一个平行四边形来处理。对于其倾斜车牌的校正，我们需要找到倾斜的角度，然后进行旋转变化，使得转变成一个矩形。对于倾斜的车牌进行校正，一般情况就是先水平校正，再垂直校正。

( 三) 对于字符的识别

字符识别的原理是利用数字图像处理技术，对车牌中分隔处理的字符进行识别，字符识别系统的工作过程：首先，对所需识别数据获取。图像数据的获取只有通过输入设备来实现，比如我们通常使用的摄像机、摄像头等等一些图像采集设备。它们主要的任务就是将景物反射的信号转换成可以识别的模拟信号，再经过A/D转换，将转换后的模拟信号转换成数字图像信息。性能好、分辨率高、噪声较小、转换速度比较快的电信号线做优先的选择。只有达到这个标准的转换电信号线才是上乘选择，对图像的识别水平也较高。转换后的图像信息要进行进一步的预处理。其主要目的就是为了去掉原始图像的噪音与其他变形问题的干扰，保留并增强有效信息。其次，进行预处理的过程也比较复杂，要进过滤液、复原、提取边缘、图像分割等预处理方式，提高图像的可读性与清晰度，为下一步进行特征的提取提供了便利，奠定了基础。第三，提取特征。是根据预处理后得到的结果，对其进行分析、辨别真伪、剔除无效信息、保留有效信息的一个过程。鉴于原始图像数据信息量比较大，需要在这庞大的数据中提取出有价值的信息，并进行归类，这就是特征的提取。在对特征进行提取之后，才能对其进行分类决策。其主要的目的就是对在分类提取过程中所得到的样本进行分析和判断，当然在判断的过程需要遵循某个规则，将分类提所引起的错误识别概率降到最低，保证其具有较高的精准度。

字符识别常用的方法有三种：统计识别法; 句法结构模式识别; 模糊模式识别法。

( 四) 先采取摄像头拍摄的方式，再通过图像处理来进行数据的采集

在我国的公共道路交通管理系统中，为了获取更多的车辆的运动数据，之前通常采用感应线圈等方法，但是这种方法要求设置在路面上并且对路面造成一定程度的损坏，安装困难，影响交通。所以现在都是采取摄像头拍摄，再通过图像处理来进行数据的采集。随着科技的发展与进步，现在只需要在路段相应的位置安装摄像头，摄像头所获取到的视频与图像就会通过压缩之后传输到控制中心。监控中心只需要根据上述视频与图像进行提取，就可以对车辆进行实时跟踪。运作跟踪是车辆识别的一部分，其主要分为背景的提取、运动点团的提取，运动点团位置的提取和运动物体的跟踪。近几年，经过技术人员的不断钻研，针对每个点都提出各自相应的算法，使得车辆跟踪更为直观、精确。

本文中详细描述了数字图像处理技术在ITS中的应用。ITS技术在车牌识别，车辆的跟踪等方面应用广泛。由于信息技术的逐步完善，使得数字处理技术在智能交通领域中得到极大的应用。经过各方的不懈努力，无论是硬件还是软件，都在不断的进步与发展，使得数字图像处理取得一个又一个突破性的进步。

参考文献：

[1]黄卫，陈里得。智能运输系统(ITS) 概论[M].北京：人民交通出版社。20xx.

[2]高建平，张小东，蒋锐。基于图像处理的交通信息采集[J].重庆交通大学，20xx(1) :103-106.

[3]石红兰。基于图像处理的车牌识别系统的研究与实现[J].现代制造，20xx(21) :178.

基于背景噪声的图像伪作检测篇5

关键词：噪声；篡改；小波变换；支持向量机

中图分类号：TP391.41

在当今互联网时代，信息尤其是图像信息的真实性对于商业、军事、媒体等来说都至关重要，但是由于相应的图像篡改技术在不断升级，使得如何识别初始图像和篡改图像成了研究的难点，也是学术界关注的重点之一。目前研究图像篡改的检测方法，分为主动与被动技术两种。主动技术包括给数字水印和数字签名，他们都有在图像中添加附加信息等弊端；被动技术是根据图像本身信息来判断其是否篡改，包括四种常见的检查方法：采用SURF提取图像不变量特征采用最近邻法进行特征匹配的图像复制粘贴篡改检测技术[1]；基于质量评价量和方差分析以及基于相位一致性的篡改检测技术[2-3]；利用相机模板噪声与待测图像相匹的篡改检测技术[4]；利用图像高阶统计量来计算噪声标准差的不一致性的篡改检测技术[5-6]。本文通过小波变换获得图像噪声，再运用支持向量机分类器进行特征分析真实图像和篡改图像，从而识别图像是否被篡改。

1 小波变换及其原理

1910年，Haar最早提出小波规范正交基；1981年，Morlet首次提出“小波分析”的概念，它是对傅里叶变换和短时傅里叶变换的改进，成功用于地质数据处理；1986年，Meyer通过创造了具有衰减性的ψ（x）光滑函数，其二进伸缩和平移：；j，k∈Z是函数空间L2（R）的一个标准正交基，标志着小波分析取得了突破进展，同年S.Mallat和Y.Meyer提出多分辨率概念和快速小波变换算法[7]，此时小波变换的理论框架就已成熟。与傅里叶变换只能反映图像的整体特征但缺乏时空域上局部化的功能相比，小波变换可通过伸缩平移运算对信号逐步进行多尺度细化，可以进行高频处时间细分、低频处频率细分，通过自动适应时频信号分析要求，聚集到信号的任意细节。

本文研究的基于背景噪声的图像伪作检测算法主要也是基于小波变换，而信号压缩则是小波变换的核心思想。具体来说，设多元素的信号为{X1，X2，X3，X4}，平均运算和细节运算表示为：{a1，0，a1，1，d1，0，d1，1}，篡改越多，则丢弃的细节信号越多，原信号的小波变换是：{a0，0，d0，0，d1，0，d1，1}，其中基于不同层次的平均信息、细节信息的分辨率信息依次是：{X1，X2，X3，X4}表示最高分辨率信息；{a1，0，a1，1}表示次高分辨率平均信息；{d1，0，d1，1}表示次高分辨率细节信息；{a0，0}表示最低分辨率平均信息；{d0，0}表示最高分辨率细节信息。对于长度为2n的信号Sn={Sn，t|0≤1≤2n}，平均和细节记作：

多级Haar小波变换分解和重构过程可用图1表示：

2 分类器解釋

利用小波变换原理获得图像噪声特征，然后采用支持向量机对真实原图像和篡改部分图像进行分类和识别，在本文采用的是支持向量机（SVM）[8]分类器中的诸多常用核函数S形核函数K（xi，xj）=tanch（v（xi*xj）+t）对噪声特征进行分类。前人研究中有多项式内积函数、径向基核函数的支持向量机，但未有文献研究Sigmoid核函数。SVM它的主要思想是将非线性可分样本的输入向量映射到高维度Z空间，从而找到超平面，在图像识别和函数运算方面具有诸多优势。在两个平面间我们找那么一个超平面，它使得分类间隔最大，这种分类器称之为支持向量机，如图2。通过支持向量机，可以有效地将图像原始部分和发生篡改的部分进行有效的分离。

3 实验结果与分析

为了验证本文算法是否有效，选取了三幅256*384的彩色图像进行了灰度处理，再原始图像分别进行增加、减少、转移等篡改操作，篡改后的图像如下，并对其进行检测。

在实验中，我们针对上面的三幅图像共进行了两次检测。在第一次检测时，我们发现只有一部分被篡改的图像部分能够被检测出，但仍然存在漏检甚至误检的情况，所以我们利用改进后的算法进行重新的检测与定位。在第二次检测与定位之前，我们先对篡改后的图像进行了相关性强弱的判断，这一次的结果精确度较第一次有所提高，尤其是误检和漏检情况得到了明显改善，效果也比较理想。

通过Matlab我们对每个图像进行了8*8和8*12的分块检测，分块后，确定了每块的平均值；然后对每个子块进行归类（类别包括均匀字块、边缘字块还是纹理字块），而归类就是通过SVM来完成的。再开始对每个字块进行编码，而解码过程是编码过程的逆过程。研究结果发现8*8的漏检和错检率较高，而8*12分块结果较好，这表明分块的大小可能对于识别篡改部分也有所影响。另外，阀值的选取也对噪声处理产生直接影响。因为我们利用小波变换处理篡改后图像的主要步骤是：首先是利用小波阈值来对图像进行去噪处理，优先处理小波分解后大于或小于阀值部分；去第二步是再利用小波系数重构去噪后的图像。对于给定的小波系数，噪声越大，阀值越大。所有对于噪声的预估决定了阈值的设定，如果太小，难以实现有效去噪；如果太大，将可能将原始图像局部区域也被覆盖了。本文采取的是目前研究最为常见的VisuShrink全局同一阈值：，其中σ是噪声信号的标准差（度量噪声强弱），N为信号长度。

具体来说，在图像-房子中噪声点与周围像素点灰度差别较大，表现为高频信号。当噪声强度增大，图像原本的灰度将成为次高信号，被高频影响而难以识别。在进行第一级小波分解时，如果篡改后的图像噪声越多，小波分解的高频系数的标准差之比将趋于一个固定值。与之相反，对于图像树的篡改操作，由于是删除了一朵花，所以表现的是图像模糊，这就意味着用相对低频的信号代替了边缘突变的高频信号。在进行第一级小波分解时，如果篡改后的图像越模糊，那么小波近似系数和原始图像的标准差之比会越大。

总之，对图像小波分解的高低频数关系做阈值处理能够判断图像的真假，有助于我们识别图像是否被篡改。

4 总结与展望

由于不同图像的背景噪声强度不同，所以在提出图像篡改识别算法时关键步骤是对噪声进行估计，本文采取的方法是对图像进行了两次全图二维小波分解，这样既能够保证算法的精确度也一定程度降低了计算的负责度，其他相关研究可以借鉴该方法。

我们在本文中分别针对图像常见的三种篡改方式：增加、修改、减少操作都进行了实验分析和检测。我们基于图像背景噪声提出了一种新的图像篡改的检测算法，主要利用了小波分析多频率特点，有效地识别篡改手段和篡改图像部分，该算法为图像鉴定和法医取证方面提供了一种新的应用可能性，具有一定参考价值，但对于复制粘贴、重采样等操作的篡改检测效果不理想，以后在这一方面进行下一步研究。

参考文献：

[1]张静.基于像素匹配的图像“复制-粘贴”篡改检测算法[J].天津大学学报，2009（08）：713-720.

[2]黄启宏.一种改进的相位一致性图像特征检测方法[J].电讯技术，2006（06）：172-176.

[3]吴昌柱，王庆.基于相位一致性的兴趣点检测方法[J].西北工业大学学报，2006（02）：199-204.

[4]杨弘，周治平.基于模式噪声的手机图像篡改检测[J].计算机系统应用，2013（09）：210-213.

[5]卢燕飞.基于图像背景噪声特性的篡改检测[J].信号处理，2012（09）：1299-1306.

[6]王虹.基于量化噪声的JPEG图像篡改检测[J].计算机工程与应用，2012（19）：205-208.

[7]董卫军.基于多小波变换的图像去噪[J].计算机应用与软件，2007（12）：32-34.

[8]丁世飞.支持向量机理论与算法研究综述[J].电子科技大学学报.2011（01）：2-10.

作者简介：洪拥筠（1987-），男，安徽安庆人，硕士研究生，主要研究方向：智能信息处理、图像处理。

图像边缘检测技术研究现状篇6

所谓边缘是指图像中周围像素灰度有阶跃变化或屋顶状变化的那些像素的集合,是图像的最基本的特征[1]。它存在于目标与背景、目标与目标、区域与区域、基元与基元之间。边缘具有幅度和方向两个基本特征,沿边缘走向,像素值变化比较平缓;垂直于边缘的走向,像素值变化比较明显,可能呈现阶跃状,也可能呈现斜坡状(即屋顶状)。因此,边缘可以分为两种:一种为阶跃性边缘,它两边的像素灰度值有着明显的不同;另一种为屋顶状边缘,它位于灰度值从增加到减少的变化转折点。对于阶跃性边缘,二阶方向导数在边缘处呈现零交叉;而对于屋顶状边缘,二阶方向导数在边缘处取极值[2]。

边缘检测技术是图像处理和计算机视觉等领域最基本的技术。如何快速地、精确地提取图像边缘信息,一直是国内外研究的热点,然而边缘检测又是图像处理中的一个难题。早期经典算法包括边缘算子法,曲面拟合法,模版匹配法,门限化方法等等。近年来随着数学理论及人工智能的发展,又涌现出许多新的边缘检测方法,如小波变换和小波包的边缘检测法、基于数学形态学、模糊理论和神经网络的边缘检测法。

1 经典的边缘检测算子

经典的边缘检测方法是对原始图像中像素的某个小领域来构造边缘检测算子。常用的边缘检测方法有Roberts算子、Sobel算子、Prewitt算子、Laplacian算子、LOG算子、Canny算子等。

1.1 基于检测梯度极大值(即一阶微分)的边缘检测方法

目前应用比较多的是基于微分的边缘检测算法[3],梯度算子是其中重要的一个检测算法。由于边缘检测发生在图像灰度值变化比较大的地方,对应连续情况就是说函数梯度较大的地方,所以研究比较好的求导算子就成为一种思路。

边缘检测的实质是采用某种算法来提取出图像中对象与背景间的交界线。将边缘定义为图像中灰度发生急剧变化的区域边界。图像灰度的变化程度可以用图像灰度分布的梯度决定,因此可以用局部图像中像素的某小邻域来构造边缘检测子。以下是上述几种经典的边缘检测算子。

梯度是一个向量,指出灰度变化最快的方向和数量。最简单的边缘算子是用图像的垂直和水平差分来逼近梯度算子:

1.1.1 Roberts边缘检测算子

Roberts边缘检测算子是对每一个像素计算出(1)的向量,然后求出它的绝对值,再进行阈值操作。这就是Roberts边缘检测算子。

Roberts算子采用对角线方向相邻两像素之差近似梯度幅值检测边缘。检测水平和垂直边缘的效果好于斜向边缘,定位精确度较高,对噪声较敏感。

1.1.2 Prewitt边缘检测算子和Sobel边缘检测算子

Prewitt是使用两个有向算子(一个水平的,一个垂直的),每一个逼近一个偏导数。Prewitt边缘检测算子检测图像M的边缘,可以先分别用水平算子和垂直算子对图像进行卷积,得到的是两个矩阵,在不考虑边界的情况下也是和原始图像同样大小的M1,M2,它们分别表示图像M中相同位置处的两个偏导数。然后把M1,M2对应位置的两个数平方后相加得到一个新的矩阵G,G表示M中各个像素的灰度的梯度值(一个逼近)。然后就可以通过阈值处理得到边缘图像。

Sobel边缘检测算子和Prewitt边缘检测算子的不同就在于所使用的有向算子不一样而已。Sobel算子利用像素点上下、左右邻点的灰度加权算法,根据边缘点处达到极值这一现象进行边缘检测。Sobel算子对噪声具有平滑作用,提供较为精确的边缘方向信息,但它同时也会检测出许多的伪边缘,边缘定位精度不够高。

1.2 基于二阶导数的边缘检测方法

一阶微分组成的梯度是一种矢量,不但有大小还有方向,和标量比较,数据存储量比较大。Laplacian算子是对二维函数进行运算的二阶微分算子[4],是一个标量,与方向无关,属于各向同性的运算,对取向不敏感,因而计算量要小。Laplacian算子的优点是各向同性,但是它有两个缺点:1)边缘的方向信息丢失;2)Laplacian算子是二阶微分,双倍加强了图像中的噪声影响。

因此,Marr提出首先对图像用Gauss函数进行平滑,然后利用Laplacian算子对平滑的图像求二阶导数后得到的零交叉点作为候选边缘,这就是LOG算子[5]。选用高斯函数(即Gauss函数)是因为它近似满足边缘检测最优准则并且到达时频测不准关系的最小下界。用LOG边缘检测算子须用较大的窗口才能得到较好的边缘检测的效果。然而,大窗口虽然抗噪能力强,但边缘细节丢掉较多,而小窗口虽然获得较高的边缘定位精度,但对滤除噪声又不够有效。所以,这种方法在去除干扰和复杂形状的边缘提取之间存在矛盾。

1.3 Canny检测边缘算子

Canny算子是一个具有滤波、增强和检测的多阶段的优化算子[6]。在进行图像处理前,Canny算子先利用高斯平滑滤波器来平滑图像以去除噪声(即用高斯平滑滤波器与图像作卷积)。增强是将边缘的邻域(或局部)强度值有显著变化的点突出出来,一般通过计算梯度幅值来完成。Canny算法采用一阶偏导的有限差分来计算梯度的幅值和方向。对一个边缘来说,其一阶导数在边界处存在一个向上的阶跃,或者其二阶导数过零点。在处理过程中,Canny算法还将经过一个非极大值抑制的过程。最后Canny算法采用两个阈值来连接边缘。

2 新的边缘检测方法

2.1 基于小波变换的边缘检测算子

图像的边缘检测要求对于反映在低频的大部分灰度信息,希望能分辨其中的细微的明暗差别,即有高的低频频率分辨能力。对于高频的边缘和纹理希望能准确的定位,即有高的空域分辨力。用传统的尺度分析方法来分析信号时,往往只用了信号的频率信息,于是难以将信号中突变与噪声分开。而小波分析理论,不仅可通过每个尺度的变换结果来分析信号,还可以通过它们在不同尺度上的演化来分析信号特征。

小波变换是应用数学和工程学科中迅速发展的一个新领域,它是传统的Fourier变换的继承和发展。小波变换是时域-频域的局部变换,具有一定的分析非平稳信号的能力,主要表现在高频处的时间分辨率高,低频处的频率分辨率高,即具有变焦特性,特别适合于图像这一类非平稳信号的处理,更有效地从图像信号中提取有用信息。经典的边缘检测算子都没有自动变焦的思想。事实上,由于物理和光照的原因,图像中的边缘通常产生在不同尺度范围内,形成不同类型的边缘(如缓变和非缓变边缘),这些信息是未知的,尤其对于缓变部分,即低频和中频部分,是图像的大部分能量的所在,噪声对应于高频部分。可以肯定,用单一尺度的边缘检测算子不可能检测出所有的边缘,以及避免在滤除噪声时影响边缘检测的正确性。

基于小波变换的边缘检测算子是利用了小波函数良好的时频局部化特性及多尺度分析能力,不仅对图像的低频子带进行分解,还对图像的高频子带进行分解,可以满足不同分辨率下对局部细节进行边缘提取的需要,尤其对于含噪图像,在提取图像边缘时对噪声的抑制效果更好[7~9]。

2.2 基于数学形态学的边缘检测方法

数学形态学是图像处理和模式识别领域中的一门新兴学科,具有严格的数学理论基础,现已在图像工程中得到了广泛应用。基本思想是用具有一定形态的结构元素去度量和提取图像中的对应形状以达到对图像分析和识别的目的。获得的图像结构信息与结构元素的尺寸和形状都有关系,构造不同的结构元素,便可完成不同的图像分析。数学形态学包括二值形态学、灰度形态学和彩色形态学,基本变换包括膨胀、腐蚀、开启、闭合四种运算,并由这四种运算演化出了开、闭、薄化、厚化等,从而完成复杂的形态变换。目前随着二值形态法的应用越来越成熟,灰度和彩色形态学在边缘检测中的应用也越来越引起人们的关注并逐渐走向成熟[2]。

2.3 基于模糊理论的边缘检测方法

模糊理论创立于1965年,由美国柏克莱加州大学电气工程系教授zadeh在模糊焦合理论的基础上提出,模糊理论的特点是能够用模糊集合来反映事物的模糊性,不对事物做简单的肯定和否定,而是用集合隶属度来反映某一事物属于某一范畴的程度。由于成像系统、视觉反映等因素造成图像本身的模糊性,再加上边缘定义区分的模糊性,使人们在处理图像时很自然的想起了模糊理论的作用。其中较有代表性的是国外学者Pal和King提出的模糊边缘检测算法,其核心思想是:利用模糊增强技术来增加不同区域之间的对比,从而能够提取出模糊的边缘。基于模糊理论的边缘检测法的优势就是自身的数学基础,缺点是计算要涉及变换以及矩阵逆变换等较为复杂的运算,另外在增加对比的同时,也增强了噪声。

2.4 其他一些新的边缘检测方法

除了上面介绍的方法之外,还有基于分形几何的边缘检测法[10]、基于局部直方图相关的造影图像边缘检测方法[11]、基于灰色系统理论的图像边缘检测新算法[12]、神经网络法[13]、遗传算法、动态规划法、最小代价函数法等等。

3 结束语

通过本文的介绍可知,当今较为常用的图像边缘检测算法为经典检测算子、基于小波理论的算子和基于形态学等多种检测算法。每一种算法都有其特点,但也存在一定的不足,特别是检测精度和抗噪能力的均衡问题。因此,很多高校师生和社会的许多学者一直都致力于寻找更为全面的边缘检测算法,在这个领域还有很大的空间需要我们去努力,共同寻找更好的边缘检测算法。

摘要：本文首先回顾了经典的边缘检测算子,主要分析了各种算法的特点和处理性能,并对它们自身的优缺点进行了论述。接着对近年来出现的新的边缘检测方法进行了介绍,较全面地阐述了图像边缘检测技术的研究现状。

图像检测技术篇7

目前用于ECT图像重建较常用的方法主要有线性反投影算法、正则法、Landweber迭代法、投影Land-weber迭代法以及共轭梯度法等。这些算法各有自己的特性, 对于生成的图像精度和反映图像的特征有所不同, 对多源图像进行融合要比设计一个能够生成具有融合图像性质的传感器要更加方便和经济。对它们进行融合, 利用图像的互补特性, 得到准确度更高的成像结果。

一、电容层析成像的原理

典型的ECT系统结构, 主要由电容阵列传感器、数据采集和图像重建计算机三部分构成。涉及两个重要的计算过程:正问题和逆问题。正问题由已知的介电常数求解电极对间的电容值, 此问题为非线性问题;逆问题由已知的电容数据估计被测区域的介电常数分布。即图像重建技术, 是从多个电极对得到的测量值反演出多相流截面的介电常数分布, 并用不同的灰度值表示出来。通用的做法是将介电常数大的相对应高灰度值项, 利用这些灰度值重建出一幅多相流截面图。

二、图像融合的定义及常用方法

图像融合 (Image Fusion) 是指将多源信道所采集到的关于同一目标的图像数据经过图像处理和计算机技术等, 最大限度的提取各自信道中的有利信息, 融合成高质量的图像。图像融合方法可从两个角度分析, 分别为空间域融合法和变换域融合法。空间域图像融合法主要有逻辑滤波器法、加权平均法、数学形态法;常用的变换域融合法有金字塔图像融合法、小波变换图像融合法等。为LBP算法对层状流重建图像进行小波分解。

三、融合规则

将图像分成图像区。如果必要, 则对图像中的一部分进行滤波。通过卷积核为每个图像生成对比映象, 并使得对比映象中的每个图像区都具有对比值。比较对比值, 并且根据诸如选出较大或最大对比值的选择标准或过程, 选择图像区。用所选出的图像区形成融合图像。如果必要, 调整融合图像中一个或更多部分的亮度。选取一个传感器作为参考传感器, 并确定参考传感器图像中每个区的平均亮度。通过将确定的平均亮度值和最终图像的强度值进行组合, 调整最终图像中一个或更多区的亮度。

一种好的融合算法生成的融合图像应具有连续性, 即融合图像的多分辨率表示中不应存在这样的系数, 它来自源图像y, 而其邻域内的大部分系数却来自图像x。先对原始图像进行小波分解, 得到各频带上的分解图, 然后针对其低频和高频采用加权平均的方法进行融合。

四、图像融合结果分析

融合后的图像除了能较好地体现各种算法重建图像的主要能量外, 同时也能够通过多幅图像的综合比较消除一部分干扰, 提高最终的成像精度。通过小波分解出的图像, 再经过融合后得到的图像更加接近原型, 去除了其中冗余的信息量, 包含更多的准确信息, 误差相对融合前的图像减小, 提高了准确度和信息量。

五、结束语

将图像融合技术应用到电容层析成像图像重建中虽取得了一定成果, 但由于在图像直接融合过程中, 源图像信息容易丢失, 融合出的结果并不理想, 利用小波变换对图像进行融合的过程是先对源图像进行分解, 接着对分解系数进行融合, 再对融合后的信号进行图像重构, 获得精度和信息量更高、更多的重建图像。这样基本不损失源图像信息, 所以融合结果较好, 有较强的抗干扰能力, 还原精度比不经过融合算法直接得到的图像要高。

参考文献

[1]马平, 周晓宁, 田沛.图像融合理论在电容层析成像中的应用[J].第四届中国智能计算大会论文集.2010.5

[2]陈德运, 陈宇, 王莉莉, 等.基于改进Gauss-Newton的电容层析成像图像重建算法[J].电子学报, 2009, 37 (4) :739-743

视频图像检测火灾探测技术比较篇8

第一代商用的视频图像检测(Video Image Detection,VID)火灾探测器出现在2000年左右,它在原有的辐射能量型火焰探测器基础上做出改进。VID使用黑白CCD获得火灾特征,而不是传统技术中使用的紫外或红外光谱传感器。传统的辐射能量火焰传感器可测量预先定义的单个或多个波长的能量总和,以此确定测量的信号是真实的火灾,或是错误特征干扰。然而,VID改变了算法,通过测量光强、颜色、形状、移动、闪烁频率和每帧图像时间的改变确定火灾。两年以后开发出可以检测烟雾的VID软件,宣称可以配合现有的安防摄像头,安装在客户现有的个人电脑上使用。但是随着摄像头技术的进步,分辨率增高,产生太多的附加数据,使现有的软件无法正常工作。另外,如果在黑暗环境下烟雾识别软件也无法工作。在以上技术的基础上,2005年出现第二代VID火灾探测器,它将火焰探测和烟雾探测结合起来,使用高感光或者内建红外光的摄像头,并使用数字信号处理器完成视频图像的处理和检测算法。2008年出现的最新一代VID火灾探测器,将火焰和烟雾的视频图像检测紧密结合,有效整合成一个产品。

1 视频图像检测火灾探测技术

基于视频图像检测技术的火灾探测器,包括一个常规彩色摄像头、一个红外摄像头,一个红外光源,图像俘获处理和数字信号处理器(DSP)。使用红外摄像头是为了增强探测器检测火焰并减少误报的能力。红外摄像头提供的图像中只能看到火焰和热源。红外光源使探测器能在黑暗的环境工作,特别是检测烟雾火。图1为探测器的结构示意图。

探测器可以将视野分为16个子区域,包括重要监控区域和非重要监控区域,重要区域可能存在的错误和干扰源或者火灾发生的可能性非常小。DSP中装载了智能图像识别和处理算法。首先输入来自常规彩色摄像头和红外摄像头的数字图像,然后通过数据滤波处理、背景学习和建模、物理特征分析、数据融合、报警可行性计算,最后输出。算法流程如图2所示。

VID系统有两种类型的报警输出——烟和火焰。火焰和烟信号的识别和处理是分离的。在探测中,一帧或多帧图像被放上疑似火焰或烟雾的标记。这些标记在视频屏幕监控器中被追踪并显示。DSP将量化和处理来自多张图像的烟雾和火焰特征。一旦烟雾和/或火焰特征的可能性超过预先设定限度,图像帧的颜色将从绿转红。然后,探测器发布火灾报警给本地火灾安全系统,同时VID火灾探测器上的报警灯也打开。

VID系统可作为独立的火灾探测器使用,视频处理和报警算法执行在探测器内完成。也可组成中心化检测系统,单个计算单元可连接和处理8个以上的摄像头信息。VID探测器会将烟和火灾的检测灵敏度分为5级,1级最高,5级最低,3级是VID探测器的默认灵敏度等级。灵敏度的等级可根据应用的环境调节。探测器摄像头的视野决定了在VID系统应用中的性能。可通过使用不同的透镜调节视野大小,默认设置是32°。

2 技术比较

现有5种火灾探测技术,包括:视频探测器、线型温度探测系统、火焰探测器、烟雾探测系统和点式探测器[3],其性能比较列于表1。

3 结束语

视频探测器结合了火焰探测器和烟雾探测系统的功能,基本可以取代后面4种技术。点式探测器主要是和火灾安全系统中的水喷淋头结合使用,探测对象包括温度、烟雾以及气体等。线型温度探测系统包括传统的基于电传感的感温电缆、新型的拉曼散射感温火灾报警系统(欧洲)和光纤光栅感温火灾报警系统(中国)。这些新型的基于光纤传感技术的火灾报警系统具有探测区域范围广、受环境影响小以及可靠性高等优点。VID火灾探测技术和其他技术比较起来有反应速度快,定位火灾的同时可监测火灾的发展。但是可靠性和有效性不确定,因为该技术受环境影响较大,如:镜头被污染及应用现场能见度低等。VID火灾探测技术可作为辅助手段配合感温火灾探测系统一起工作。

图像分割技术综述篇9

在对图像的研究和分析中, 人们通常对图像中特定的、具有独特性质的区域感兴趣, 图像分割就是指把这些区域提取出来的技术和过程。正因为图像分割作为前沿学科充满了挑战, 近年来, 吸引了众多学者从事这一领域的研究。图像分割技术在航空航天、生物医学工程、工业检测、机器人视觉、公安司法、军事制导、文化艺术、地理测绘等领域受到广泛重视, 并取得了重大的开拓性成就, 使其成为一门引人注目且前景广阔的新型学科。

2 传统的图像分割技术

图像分割一般根据要解决的问题将图像细分为感兴趣对象的集合, 其分割方法的种类已达上千种。传统的图像分割技术多为基于图像局部特征的图像分割方法, 是根据图像局部区域中像元的特征来实现图像分割的方法。

2.1 基于阈值的图像分割技术

阈值分割法是一种传统的图像分割方法, 因其实现简单、计算量小、性能较稳定而成为图像分割中最基本和应用最广泛的分割技术。阈值法在不同物体或结构之间有很大的强度对比时, 能够得到很好的效果。它计算简单, 而且总能用封闭而且连通的边界定义不交叠的区域。阈值化分割算法就是选取一个或者多个阈值, 将图像的直方图分成几类, 图像中灰度值在同一个灰度类内的象素属于同一个类, 从而达到分割的目的。

阈值法的核心是如何选择合适的阈值, 阈值分割法具有运算效率较高、计算简单等优点, 在过去的几十年中被广泛使用。阈值化算法多种多样, 最具代表性的方法有:最大类间方差法、直方图法、最大熵法、概率松弛法、最小误差法、矩量保持法等。但是, 阈值法一般仅考虑像素本身的灰度值, 不考虑图像的空间相关性特征, 极易受到噪声的影响。在实际情况中, 阈值法常与其它分割算法相结合, 对图像进行分割。

2.2 基于边缘的图像分割技术

边缘检测法是基于图像不连续性的分割技术, 它通过检测不同均匀区域之间的边界来实现对图像的分割, 这与人的视觉过程有些相似。依据执行方式的不同, 这类方法通常又分为串行边缘检测技术和并行边缘检测技术。串行边缘检测技术首先要检测出一个边缘起始点, 然后根据某种相似性准则寻找与前一点同类的边缘点, 这种确定后继相似点的方法称为跟踪。根据跟踪方法的不同, 这类方法又可分为轮廓跟踪、光栅跟踪和全向跟踪三种方法[1]。

并行边缘检测技术通常借助空域微分算子, 通过其模板与图像卷积完成, 因而可以在各个像素上同时进行, 从而大大降低了时间复杂度。常见的边界检测方法包括基于各种边界检测算子[2] (Roberts算子、Laplacian算子、Sobel算子、Prewitt算子、LOG算子等) 的边界检测。这类方法通常不能得到连续的单像素边缘, 而这对于分割来说是至关重要的。所以, 通常在进行上述边缘检测之后, 需要进行一些边缘修正的工作, 如边缘连通、去除毛刺和虚假边缘等。

2.3 基于区域特征的图像分割技术

基于区域的分割技术有两种基本形式:区域生长和分裂合并。前者是从单个像素出发, 逐渐合并以形成所需的分割结果, 是区域分割的最基本方法;后者是从整个图像出发, 不需要生长点, 逐渐分裂或合并以形成所需要的分割结果。不同于阈值方法, 这类方法不但考虑了像素的相似性, 还考虑了空间上的邻接性, 因此可以有效消除孤立噪声的干扰, 具有很强的鲁棒性。而且, 无论是合并还是分裂, 都能够将分割深入到像素级, 因此可以保证较高的分割精度, 如分水岭算法等。

3 改进的图像分割技术

传统的图像分割技术都或多或少地存在着某种程度上的不足, 因此更多的研究者尝试将诸多理论模型与图像分割技术相结合以求达到更好的分割效果。本文就简要介绍了几种应用得较为广泛的改进后的图像分割技术。

3.1 基于小波理论的图像分割技术

小波变换在图像分割中的主要应用是传统的Fourier变换的继承和发展, 首先构造特殊性质的小波函数, 利用小波变换函数在大尺度下检测出图像的边缘点, 在较小尺度下精确定位边缘点像素, 然后根据一定的策略把这些像素点连接成轮廓, 从而提取出目标边缘实现了图像的分割[3]。小波变换之所以能适合图像这类非平稳信号的处理是因为小波变换具有一定的分析非平稳信号的能力。高低频处的分辨率不同, 而经典的边缘检测算子都没有这种特性。

小波变换的多尺度性表现在:当检测图像边缘的噪声较小时, 选择小尺度可以获得较丰富的边缘细节信息;当检测图像的边缘细节要求比较低时, 选择大尺度可以较好的排除噪声干扰。目前研究者提出的基于小波变换的图像分割算法大部分都是二进制小波变换, 此外还有多进制小波、小波框架、小波包三种变换。

3.2 基于模糊聚类分析的图像分割技术

聚类法就是将图像中的每一个像素划分到不同的类别中, 其关键点在于聚类准则的确定。而在图像分析时存在一定的不确定性, 所以引入了模糊集合的概念, 用隶属度表示图像的像素点属于某区域的程度。模糊概念能够避免过早的明确判断, 因此在之后的处理过程中就保留下来了尽可能多的有效信息。近年来运用最广泛的是基于模糊聚类分析[4]的图像分割技术, 即模糊C均值 (FCM) 技术, 它既可以分割灰度图像, 也可以分割彩色图像。但模糊聚类具有运算量大, 容易陷入局部最优、对初值敏感、需事先指定聚类个数等缺点。

3.3 基于图论的图像分割技术

基于图论的图像分割方法本质上是将图像分割问题转换为一个对无向加权图进行最优化的问题。其主要思想是将图像映射为一个加权无向图, 像素对应图的节点, 像素之间的相邻关系对应图的边, 像素特征之间的差异或相似性对应边上的权值, 然后利用图论中的成熟理论或算法对图像进行切割和组合。图论 (Graph theory) 中诸多成熟的经典算法又为这一类图像分割算法提供了有力的计算工具, 因此基于图论的分割算法近年来受到广泛关注。常见的基于图的分割方法[5]包括基于最小生成树 (Spanning tree) 的分割, 基于支配集 (Dominant set) 的分割和基于最小图割值 (Graph cut) 的分割等。

其中基于最小生成树的分割方法具有很大的优势, 它的主要优点在于能够获取图像的全局特征, 从而获得较理想的分割效果;此算法的计算速度非常快, 可以在线性时间复杂度内实现对图像的分割, 算法的结构和实现方法较简单, 能够方便的应用到一些特定的领域中, 并且可以与其它的分割方法相组合, 得到更好的分割效果。

4 结束语

本文就应用较多的几种图像分割技术进行了介绍和讨论, 由于图像的质量不同, 应用的领域不同, 彩色图像中颜色的分布不同以及图像结构特征的不同, 导致很难有一种通用的分割方法能够普遍适用于各种不同类型的图像。所以目前的研究主要致力于根据图像的具体情况来选择不同的方法进行组合, 针对各种可能存在的实际问题, 提出新的算法, 这也是图像分割在今后研究工作中的发展趋势。随着计算机技术和成像技术的不断发展能及各种新理论的应用和改进, 相信图像分割技术会不断地完善和成熟起来。

摘要：图像分割是图像处理中的一项关键的技术, 是目标识别和图像解释的前提, 多年来一直倍受关注。目前, 在图像分割领域里的分割方法众多, 但至今没有一种通用的方法。文章综述了近年来在图像分割技术中出现的常用方法及它们的优缺点, 并对图像分割技术的前景进行了分析及展望。

关键词：图像分割,边缘检测,图论

参考文献

[1]N.R.Pal, and S.K.Pal, "A review on image segmentation tech-niques, "Pattern Recognition, 1993.[1]N.R.Pal, and S.K.Pal, "A review on image segmentation tech-niques, "Pattern Recognition, 1993.

[2]章毓晋, 图像分割[M].北京:科学出版社.2001.[2]章毓晋, 图像分割[M].北京:科学出版社.2001.

数字图像秘密分享技术的研究篇10

关键词：秘密分享；数字图像

中图分类号： TP309 文献标识码： A 文章编号： 1673-1069（2016）36-196-2

1 绪论

秘密分享的概念最早是由Shamir和Blakley于1979年提出的方法，并给出了一个（r，n）门限分享解决方案。此后人们又相继提出了多种秘密分享算法，但这些方案存在不足之处，在于：一次秘密分享过程只能分享一个密钥，在秘钥重构中，参与者的秘密份额随之暴露。再次分享秘密时，分发者必须为参与者重新分配新的秘密份额。因此提出了的门限多秘密分享，并将秘密分享技术应用到图像领域。

图像秘密分享是将秘密分享技术应用到图像上，从而实现图像的秘密分享。2004年，Lin和Tsai提出了一种运用（r，n）门限图像秘密分享方案，该方案加入了奇偶校验可检测是否信息被篡改，但该方案所产生的影子图像较大，不利于存储和传输。目前图像秘密分享方案已经成为秘密分享领域的研究热点，但现存的图像秘密分享方案仍然存在一些需要解决的问题。首先，成员间的不信任是设计秘密分享方案时需要着重考虑的问题之一，然而大部分现有的方案均未有效解决这一问题。其次，在处理图像的部分灰度图像时，需要一种有效的无质量损失图像秘密分享方法。目前，应用最广泛的图像秘密分享方案是（r，n）门限分享方法，如何构造更完善的图像秘密分享方案是本文的研究重点。

2 数字图像秘密分享

秘密图像分享，基本原理是利用（r，n）门限秘密分享的方法来实现图像之间的秘密分享，是在秘密分享方法上发展起来的一种新的密码学应用的研究领域。秘密图像分享主要完成的是图像的分发与恢复，在一些以图像为传输载体的应用领域有一定的实际应用价值。

2.1 数字图像秘密分享算法

因为数字图像的灰度值是（0—255），直接使用（r，n）门限方案将会导致浪费大量内存空间。为了解决这个问题，节约内存，本文提出一种基于Shamir的（r，n）门限方案的新方法，可大大减小分享图像的大小。该方案分为两个步骤：秘密分享步骤和秘密重建阶段。第一步，需要由秘密分发者分发秘密，第二步，重建需要的合法子图像完成。在本方法中，用于产生n个影子图像的是秘密图像，任意能够重构秘密图像的r个或更多的子秘密图像，就是影子图像； r-1个或更少的子秘密图像无法获得足够信息来重构秘密图像。

2.1.1 秘密分享阶段

若把秘密图像S分割成n个影子图像，该秘密数据S可以通过r个或多于r个的影子图像来重建。在本方法中，取r个系数来产生r-1项多项式。因此本方法和Shamir的方法的主要区别在于本方法并不采用随机系数应用于公式中。

在256级灰度图像中每一个像素的灰度值在0到255之间，对于秘密图像的每个影子图像接收其中一个有序生成的像素数值，每个影子图像的大小是秘密图像的1/r。该秘密的分享阶段步骤如下：

①使用一键生成一个序列来置乱秘密图像的像素；

②按顺序取出置乱图像的r个尚未分享的像素以形成一个部分；

③用第二步中生成的部分来生成n个影子图像的n个像素；

④重复第三步和第四步直到置乱图像的所有像素都处理完。

2.1.2 秘密重建阶段

因为构造的是（r，n）门限秘密分享方案，所以只要n个参与者他们持有的子秘密大于等于r个子分量，就可以恢复原始的秘密图像。

步骤如下：

①r个影子图像中，每个图像取出第一个未使用的像素；

②对置乱图像进行逆置乱操作来得到秘密图像。

2.2 图像秘密分享的性能讨论

本方案是基于（r，n）门限秘密分享方案，只要少于r个子密钥就恢复原始图像； r个或多于r个合作者才能够用这r个子密钥重构得出恢复图像。

这里来证明任何小于等于r-1个的子秘密将无法得到用于恢复秘密的信息。对于一个512×512的秘密图像，将有512×512/r个部分，即有512×512/r个多项式{fj（x）}1≤j≤512×512/r。为了计算出多项式fj（x）中的r个像素a0-ar-1，需要r个方程。假设只有r-1个影子图像，即只有f1（x1），f1（x2），…，f1（xr-1）则只能建立r-1个方程，由于图像被分成许多部分，每个部分有r个像素，每个部分的n个输出像素按顺序分配到n个影子图像中。对于秘密图像的每个部分，每个影子图像接收其中一个生成的像素，所以每个影子图像的大小是秘密图像的1/ r。因而，本方案大大减小了影子图像的大小，便于存储和传输。

3 实验

基于上述内容，采用分享一副图像的（2，4）方案，做了图像仿真。在实验中，取图两幅子秘密图像（即影子图像）用于恢复秘密图像。图3-2是用于分享的秘密图像，图中的3-2（d）和3-2（e）两幅子秘密图像（即影子图像）用于恢复秘密图像。图3-1中（a）是用于分享的秘密图像，（b）是置乱图像，图3-2中（c）、（d）、（e）、（f）是子秘密图像，3-2中（g）是恢复图像。可以看到，恢复图像几乎和秘密图像完全相同。由于秘密图像像素的灰度值均在250之内，所以恢复图像几乎不存在不合适的质量损失。

4 总结

本文对Shamir的（r，n）门限秘密分享的基本原理及数字图像秘密分享方案的内容作了较为全面的分析。但在数

字图像分享领域直接使用（r，n）门限分享影子图像将与

原秘密图像一样大小，不便于存储和传输。占用大量的内存。

图像匹配技术综述篇11

1、图像匹配技术四要素

一般来看, 图像匹配可以作为四个要素的组成:特征空间、搜索空间、相似性测度和搜索策略。选取特征要考虑三点因素:首先, 选取的特征必须是原始图像和待匹配目标图像所共同具有的特征;其次, 特征集必须包含足够多的分布均匀的特征;再次, 所选取的特征要易于特征匹配的计算。搜索空间是在输入特征与原始特征之间建立的对应关系的可能的变换集合, 成像畸变的类型与强度决定了搜索空间的组成与范围。相似性测度的作用在于对从搜索空间中获取的一个给定的变换所定义的输入数据域参考数据之间的匹配程度的评估。搜索策略是指在相似性测度下达到最佳匹配的计算方式, 即采用合适的方法在搜索空间中找到平移、旋转等变换参数的最优估计, 使得相似性测度达到最大值。

2、图像匹配技术的分类

以往的图像匹配方法, 大致可以分为三类:基于特征点、灰度分布和频域。基于特征点的图像匹配技术是目前最常用的方法之一, 其最大的优点是能够将对整个图像进行的各种分析转化为对图像特征点的分析, 从而大大提高了运算的速度, 对图像偏移、旋转, 灰度变化等都有较好的适应能力。本文的主要工作是研究了这三类图像匹配方法, 分析各种方法的优缺点, 重点研究了基于特征的匹配方法。

2.1 基于特征点匹配方法

基于特征点匹配方法一般分为三个过程: (1) 特征点提取; (2) 利用一组参数对特征点作描述; (3) 利用特征点的参数进行特征匹配, 根据相似性原则对两幅图像中的特征点进行匹配。其最大的优点是能够将对整个图像进行的各种分析转化为对图像特征 (特征点、特征曲线等) 的分析, 从而大大减小了图像处理过程的运算量, 对灰度变化、图像变形以及遮挡等都有较好的适应能力。下面介绍三种基于特征点的匹配方法。

2.1.1 SUSAN特征点算法

SUSAN算法[1]的基本原理是通过以一个点为中心的局部区域内亮度值的分布情况来判断平滑区域、边缘及角点。如图1所示, 一个在图像上移动的圆形模板, 模板的中心称为核心, 它的位置有以下五种形式。图像一定区域的每个象素的亮度值与核心点的亮度值相比较, 把比较结果相似或相同的点组成的区域叫做USAN (单值分割相似核心) 。USAN区含有图像在某个局部区域的结构信息, 而大小反映了图像局部特征的强度。

SUSAN算子使用的是圆形模板来进行角点探测, 一般使用模板的半径为3-4个像元, 模板在图像上滑动, 在每一个位置求亮度相似比较函数, 并计算合计值, 就得到了USAN区域的面积, 而后再跟一个给定阈值进行比较。计算重心求出核到重心的距离, 对应正确角点, 若重心距离核较远, 就能以距离消除虚假角点的影响。最后使用非最大抑制 (No Max Suppression) 方法, 这样就可以找出角点。

近年来, Yu Song等人[2]提出了一种自适应阈值的检测算法, 解决了SUSAN算子对灰度细节丰富的图像检测效果不佳的问题。

2.1.2 SIFT特征点算法

SIFT特征点匹配算法[3]是David G Lowe在1999年提出的, 并于2004年总结了现有的基于不变量技术的特征检测方法的基础上, 提出的一种基于尺度空间的特征匹配算法[4]。SIFT特征匹配算法分四个步骤来实现:一是尺度空间极值点求取, 二是特征点位置确定, 三是为关键点指定方向参数, 四是关键点描述子的生成。匹配的方法是:在获得第一幅图像的特征向量后, 将采样点的欧式距离作为相似性度量。取帧图像中某个关键点, 找出其与图像中欧式距离最近的前两个关键点, 在这两个关键点中, 如果最近的距离与次近的比值小于某个阈值, 则接收这一对匹配点。降低比例阈值, SIFT匹配点数目会减少, 但匹配更稳定可靠。G Yu和J M Morel[5,6]克服了拍摄倾角过大造成的仿射变换的影响, 提出了ASIFT, 确保了特征稳定性, 提高了鲁棒性。

2.1.3 SURF特征点算法

2006年, Herbert Bay[7]提出了SURF算法, 其整体思路同SIFT类似, 特征点检测理论也是基于尺度空间, 但在整个过程中采用了与SIFT不同的方法。首先, 在尺度σ上定义Hessian矩阵, 用该矩阵的行列式计算图像上特征点的位置和尺度信息。其次, 为保证旋转不变性, 确定特征点的主方向。以特征点为中心, 将坐标轴旋转到主方向, 将其划分成4×4的子区域, 在每个子区域形成四维分量的矢量, 对每一特征点会形成4× (4×4) =64维的描述向量, 再进行归一化, 从而对光照具有一定的鲁棒性。SURF在各方面的性能均接近或者超越了SIFT的性能, 但是计算速度却是SIFT的3倍左右。

2.2 基于图像灰度相关的匹配算法

基于灰度信息的图像匹配方法一般不需要对图像进行预处理, 而是利用图像本身具有灰度的一些统计信息来度量图像的相似程度。这类算法的性能主要取决于相似性度量及搜索的选择上, 其主要特点是实现比较简单, 但因为是基于像素的, 所以计算量比较大, 应用范围较窄, 不能直接用于校正图像的非线性变换。下面简单介绍几种经典的匹配算法, 大致可以分为三类:序贯相似度检测法、互相关法、交互信息法。

2.2.1 序贯相似度检测匹配法

1972年, Barnea等人根据传统相关方法提出了一种为之有效的算法SSDA[8], 从而得到很好的效果。这种算法在两方面有了显著的改进, 一是简化计算, 利用图像f和模板T之间的差值来表示变化。与相关法相比处理效果差不多, 同时显著的提高了运算速度。二是改进使用了一种序列搜索的策略, 由检测范围和模板大小定义了一系列窗函数和阈值, 而每一个窗函数作用到图像中, 当相似性超过阈值后, 就进行次数累加, 而后在次数最多的窗口里进行匹配, 重复迭加细化直至得到所需要的结果。近年来, 人们对该算法提出了很多的改进, Shi等人[9]基于特征提出强角点算子引导SSDA匹配方法, 使其能更好的满足匹配的要求。

2.2.2 互相关法

1982年, Rosenfeld提出的互相关法[10]。它像是一种相似性度量或者匹配程度的表征, 而不是一种图像匹配的完整方法, 但是把互相关的思想作为度量测度, 在许多匹配算法里都会用到。

对于一幅图像f (x, y) 和相对于图像较小尺度的模板T, 归一化二维交叉相关函数C (u, v) 表示了模板在图像上每一个位移位置的相似程度:

如果除了一个灰度比例因子外, 图像和模板在位移 (i, j) 处正好匹配时, 交叉相关函数就在C (i, j) 出现峰值。这时, 交叉相关函数有否归一化是必须注意的, 否则相似度的度量将会受到局部图像灰度影响。A.Roche等人[11]的改进算法能够较好的解决噪声的问题, 而且计算速度也提高不少。

2.2.3 交互信息法

1995年, Viola等人[12]把互信息引入图像匹配的领域, 交互信息是基于信息理论的相似性准则。这种图像匹配方法是假设A、B是两个随机量, 交互信息量是这两个随机变量之间统计相关性的量度, 或者是一个变量包含另一个变量的信息量的量度, 其意义与信息论中相同, 互信息量表示了两幅图像的统计依赖性, 它的关键思想是:如果两幅图像达到匹配, 它们的交互信息量达到最大值。因此, 作为图像间相似性的量度, 该方法是近些年来医学图像匹配研究领域中使用最多的一种方法。在此基础上, Maes等人[13]进行了全面的研究, 将匹配精度提高到亚像素级。

2.3 基于变换域的图像匹配的方法

基于变换域的图像匹配方法最主要就是傅里叶变换方法, 还有基于Gabor变换和基于小波变换的匹配。这些匹配方法主要有以下一些优点:对噪声不敏感, 检测结果不受光照变化影响, 图像的平移、旋转、镜像和缩放等变换在变换域中都有相应的体现。这里重点介绍傅里叶变换方法, 该方法有成熟的快速算法并且易于硬件实现。算法是考虑两幅图像I1 (x, y) 和I2 (x, y) 之间存在一个平移量 (dx, dy) , 即:

对其进行傅里叶变换, 在频域上1F与2F有下面的关系:

上式说明两幅图像变换到频域中幅值相同, 但有平移量有一个相位差, 这就是说两幅图像的相位差由图像间的平移量直接决定。根据平移定理, 这一相位差等于两幅图像的互功率谱的相位谱:

上式的右边部分为一个虚指数, 对其进行傅里叶逆变换会得到一个冲击函数, 其只有在峰值点也就是平移量 (dx, dy) 处不为零, 这个位置就是所需求的匹配位置。张锐娟等人[14]结合四元数理论, 提出一种基于四元数傅里叶变换的亚像素相位相关法, 能够稳定快速的实现匹配。

3、图像匹配技术算法的性能评价指标

对匹配技术算法的性能评估, 在这方面West[15]等总结了人们对匹配效果评价所做的许多工作。算法首先要进行性能界定, 也就是说将图像匹配问题视为参数估计的问题, 运用参数估计的理论和方法得到图像匹配可以达到的最好的性能。算法的性能评价指标主要有:准确性、鲁棒性、实时性等, 然而, 在不同的环境中用相同的匹配算法, 却会有不同的评价指标, 但总的评价准则只有一条:在实际应用中是否达到要求, 性能是否优于以前的方法。

但是, 完美的匹配算法是不存在的, 每种算法都有其适用环境, 这样才能使每次匹配操作能够做到最好, 发挥算法的最好性能。

4、图像匹配技术的研究方向和热点

图像匹配算法经过国内外学者的共同努力, 已经取得了很大的进展, 各类算法相继出现, 但是由于实际情况复杂多变, 现有算法总是存在一些不足, 目前在以下几个方面值得深入的研究:

(1) 当匹配图像中物体存在遮挡, 或者是特征点均匀性不是很好的时候, 提取特征要不不容易获取, 要不就是不可靠, 这可由粗到精的分析图像数据, 从全局匹配到局部匹配, 提高了匹配运算精度。因此, 研究基于非均匀性图像的匹配算法是很有必要的, 也是当今研究的方向和热点。

(2) 匹配算法的复合研究。前文介绍的匹配方法都有各自的优缺点, 如果能综合利用它们的优点将会取得更好的匹配结果, 将多个特征和算法相互融合, 以克服单个算法的局限性, 提高匹配的适应性。

(3) 研究基于遗传算法、神经网络和人工智能等方法相结合, 组成系统模型, 用来实现多目标的人工智能神经网络的匹配处理, 具有强大的记忆、选择、识别和学习的能力。

5、结语

【图像检测技术】推荐阅读：

图像检测08-08

图像特征检测论文09-06

图像边缘检测技术分析08-18

视频图像技术06-14