Gabor滤波器(精选7篇)
Gabor滤波器 篇1
1 引言
由于虹膜比起其他生物特征更具有非侵犯性和稳定性,因此基于虹膜的身份识别系统越来越引起人们的广泛关注。世界各国的研究人员提出了很多不同的虹膜识别方法[1,2,3,4,5,6,7],其中以基于2D-Gabor变换的虹膜识别方法最为经典[8,9,10,11,12]。该方法最早由英国剑桥大学的Daugman博士提出,而后又有很多文献对该方法进行了研究和探讨,但在目前发表的众多文献中,只给出了该方法的大体框架,对于实现该方法的难点,Gabor滤波器的参数设计都未有过多说明。
本文分析了Gabor滤波器中各参数对滤波器性能的影响,提出了一种适用于虹膜纹理特征提取的滤波器参数选择方法,该方法将虹膜图像分块得到抽样因子(r0,θ0)的取值;根据分析建立频率因子ω与尺度因子β的反比例关系;通过绘制尺度因子α、β与类内、类间海明距离均值关系曲线,找到能得到较好分类效果的尺度因子的取值范围,在该范围内选择尺度因子的取值,β确定后ω利用与β的反比例关系确定取值。
2 Gabor滤波器分析
2.1 直角坐形式与极坐标形式的Gabor滤波器性能比较
Daugman在1980年提出了二维Gabor滤波器理论,并指出二维Gabor滤波器可以同时在空域、频域和方向上获得最佳的分辨率。
直角坐标形式的Gabor滤波器[3]:
极坐形式的Gabor滤波器[4]:
两种Gabor滤波器都是二维高斯函数与复指数的乘积,通过调整一系列参数可以得到不同尺度、频率、方向的滤波器,利用一组与虹膜纹理的分布特点相接近的滤波器,就能可靠的提取虹膜纹理特征。
比较式(1),(2)总结两种滤波器主要有以下区别:
1)直角坐标形式滤波器:(x0,y0)表示滤波器中心的位置,α、β表示高斯窗函数的有效宽度和长度,(µ0,ν0)表示滤波器具有频率,方向θ0=arctan(µ0/ν0);极坐标形式滤波器:(r0,θ0)决定滤波器的中心位置;α、β决定滤波器高斯窗作用范围,ω决定滤波器所具有的频率。
2)采用直角坐标形式Gabor滤波器提取图像特征时,式(1)中自变量x,y用图像I(x,y)各像素点的直角坐标值代入,若图像大小为M×N,则x∈(1,M),y∈(1,N);用极坐标形式Gabor滤波器提取图像特征时,式(2)中自变量r,θ对应图像I(x,y)进行极坐标转换[4]后得到的I(r,θ)的极坐标值,其中r∈(0,1),θ∈(0,2π)。
3)式(1)中的频率调制因子(µ0,ν0)成对出现,分别沿x方向和y方向起频率调制的作用,滤波器具有的频率,方向θ0=arctan(µ0/ν0),调制频率的方向可以根据θ0的不同发生旋转;式(2)中频率调制因子ω只沿θ方向起频率调制的作用,而在r方向不起作用,滤波器所具有的频率是ω,频率调制方向始终沿θ方向,不能以任意角度旋转。
4)式(1)中参数(x0,y0,µ0,ν0,α,β)是6维的;而式(2)参数(r0,θ0,ω,α,β)是5维的。
通过以上比较可知,极坐标形式的Gabor滤波器与直角坐标形式的Gabor滤波器相比,少了方向选择特性,但参数空间的复杂度低。在归一化后的虹膜图像中,纹理变化信息主要体现在沿θ方向,极坐标形式的Gabor滤波器就能够提取出纹理沿这一方向的主要信息,所以我们选用其提取归一化后的虹膜图像中的纹理特征,以下重点分析极坐标形式的Gabor滤波器各参数对滤波器性能的影响。
2.2 极坐标形式Gabor滤波器分析
2.2.1 局部选择特性与α,β的关系
Gabor滤波器由高斯窗函数与复指数的乘积组成,高斯窗是指数窗,值在一定范围内衰减至很小,该衰减范围是Gabor滤波器的局部有效作用范围。式(3)给出高斯窗的表达式:
令式中(r-r0)2/α2+(θ-θ0)2/β2=m2,则窗函数的值随m的增大而减小。表1列出m取值对应的窗函数的值以及相应的衰减率。
从表1中看出当m=2时,窗函数衰减至峰值的98.17%,m>2时窗函数衰减接近100%函数值接近零。
(r-r0)2/α2+(θ-θ0)2/β2≤22是一个以2α、2β为长短轴的(r,θ)平面上的椭圆区域,由以上分析可知,在这个区域以内窗函数以(r0,θ0)为中心快速衰减至很小,区域以外窗函数值接近零。窗函数的衰减限制Gabor滤波器只能在局部区域起作用,使其具有了局部选择特性。这个局部区域,在r方向和θ方向的最大区间可以表示成:
可以看出,Gabor滤波器的局部作用范围与α、β成正比,α、β大局部作用范围大,α、β小局部作用范围小。由局部作用范围的要求可以确定α、β的取值,也可以根据α、β的值推导出滤波器的作用范围。图1是r0=θ0=0;α,β取不同值时两幅二维高斯窗函数的图像。其中图1(a)是α=0.25,β=1.57,滤波器局部作用范围为-05.
2.2.2 位置特性与参数(r0,θ0)的关系
(r0,θ0)是Gabor滤波器中心,决定滤波器峰值出现的位置。图像的二维Gabor变换实质是Gaobr滤波器与图像做卷积,这一过程会产生信息冗余,为了减少冗余Gabor滤波器不与图像做逐点卷积,而只在一些抽样点做卷积。(r0,θ0)的取值将Gabor滤波器中心在图像中的定位,这些中心点就是抽样点。
2.2.3 频率特性与参数ω的关系
参数ω决定Gabor滤波器的频率选择特性,滤波器根据ω的不同产生不同的震荡频率。为了便于分析,构造频率ω=4的1-D Gabor滤波器,用不同频率的方波信号与其做卷积得到的响应曲线图2给出。从图中可以看到,频率ω=4的方波信号与Gabor滤波器卷积后得到的响应曲线峰值最大,震荡最剧烈,其余频率方波信号与Gabor滤波器响应都相对较小。由此得出Gabor滤波器对不同频率信号产生不同响应,当信号频率与Gabor滤波器频率相等时,响应最大,最剧烈,这种对信号频率的选择特性由参数ω决定。
3 Gabor滤波器提取虹膜纹理特征
3.1 虹膜图像变换
通过获取装置采集到的虹膜图像通常除含虹膜外,往往还有眼睛的其它部分,比如眼睑、睫毛、眼白等,因此在进行虹膜识别前,必须先确定出虹膜在图像中的位置,这一过程就是虹膜定位。虹膜定位完成,就需要进行虹膜归一化。归一化的目的是将每幅原始图像调整到相同尺寸和对应的位置,从而消除平移、缩放和旋转对虹膜识别的影响。本文采用极坐标变换的方法进行归一化。该变换将虹膜灰度图像I(x,y)从直角坐标系投射到双无量纲的极坐标系统中得到I(r,θ)。图3(a)说明了该转换前后的对应关系。图中的环型模拟定位后的虹膜图像,矩形模拟转换后的虹膜图像即归一化虹膜图像。归一化后得到的矩形,行方向是极坐标系的θ方向θ∈(0,2π),列方向是极坐标系的r方向r∈(0,1),设归一化图像大小为M×N,图像中两相邻像素点的相对距离为∆r=1/M,列方向的距离分别为∆θ=2π/N,第m行n列的像素点在极坐标系下坐标为(m×2π/M,n×2π/N)。图3(b)给出了虹膜预处理的整个过程。
3.2 Gabor滤波器参数选取
2D-Gabor滤波器有着优良的滤波器性能,在空间域和频率域能同时达到最佳分辨率,适合提取虹膜局部纹理信息。但并非所有的Gabor滤波器都能很好的提取出这些纹理信息,将虹膜分类,滤波器的参数选择是关键。
3.2.1 (r0,θ0)的选择
(r0,θ0)是Gabor滤波器在虹膜图像中的空间定位,也是图像与滤波器做隔点卷积抽样点的位置。图像中的抽样点不能过密,这样达不到降低冗余的目的;也不能过稀疏,这样会丢失信息。将区域选择后的虹膜图像分成大小适中的若干块,每块中心对应的坐标即为(r0,θ0)的取值。图4给出一个利用对虹膜图像分块确定抽样因子的例子,图中将整个虹膜图像分成8块,子块中心依次为(π/4,0.25),(3π/4,0.25),(5π/4,0.25),(7π/4,0.25),(π/4,0.75),(3π/4,0.75),(5π/4,0.75),(7π/4,0.75)。这8个子块中心确定8个滤波器的抽样因子(r0,θ0)的取值。
3.2.2 ω的选择
ω是Gabor滤波器的频率调制因子,决定滤波器的频率选择特性。ω与正、余弦波波长λ有如下关系:
取Gabor滤波器的模板大小等于Gabor滤波器的局部作用范围,由式(4)可知模板沿r方向和θ方向的长度分别是4β和4α。若每个滤波器模板内包含n个波长,则得到等式nλ=4β,由于ω只在θ方向起频率调制的作用,所以只考虑模板长度4β与波长λ的关系即可。结合式(5),可以得到ω与β的关系:
式中n取得某一定值后,ω与β成反比例关系,反比例系数为nπ/2。n值不能过大,这样不能体现滤波器的局部化特性,也不能过小这样会使波形不完整。
式(6)将滤波器局部作用范围与滤波器所具有的频率建立起联系,根据其设计的Gabor滤波器大尺度模板对应低频,能够提取虹膜纹理的低频总体信息;小尺度模板对应高频,能够提取虹膜纹理的高频细节信息,这正与小波图像分解的特性相符合。
3.2.3 α、β的选择
α、β是Gabor滤波器的尺度因子,分别决定滤波器r方向和θ方向的衰减范围。用Gabor滤波器提取虹膜纹理特征时,尺度因子的选择很重要,过大会使相同虹膜之间海明距离偏大,不同虹膜之间海明距离偏小;过小会使海明距离都偏大,这是由于尺度因子过大会漏掉纹理信息,过小又不能滤除高频噪声。为了得到合适的尺度因子,本文利用文献[4]的方法,分别用尺度因子不同的Gabor滤波器对20×3幅虹膜图像编码,计算同类和异类虹膜之间的海明距离均值,并画出对应关系曲线,如图5所示。
从图中可以看出α在1/64~1/4间取值,β在π/16~π/4间取值类内类间海明距离差异较大,类内类间海明距离差异越大越容易实现虹膜正确分类。因此,在设计滤波器尺度因子α、β的取值时,可以在上述区间中取值,得到一组多尺度Gabor滤波器。
4 实验与分析
实验采用的原始数据取自中科院自动化所(北京)提供的CASIA虹膜数据库(版本1.0),图像像素大小为320×280,定位归一化后的虹膜图像为512×64。本文选取CASIA虹膜数据库(版本1.0)中210幅图像实验,包括30只不同虹膜每只虹膜7幅图像。由于图库中的大量图像受上下眼皮遮挡严重,所以只取图像中纹理清晰丰富的一部分。图6(a)为512×64的归一化图像,图6(b)为在r方向上取(0~0.5),在θ方向上取(π~2π)后的图像。实验采用图6(b)图大小的区域。
4.1 图像分块的确定
根据以上分析可知,图像分块决定抽样点的位置,抽样点数目过多,会引起信息冗余时间浪费;过少,会引起信息不足达不到好的识别效果。为了确定所选虹膜区域的最佳分块,在小样本图像上实验得到图像分块与识别率对应关系曲线,如图7所示。从图中看出识别率随分块数的增加而有显著提高,当分块数达到64以后,识别率基本达到稳定不再随块数的增加有明显变化,由此可以确定能保证图像抽样点数少,又保留图像中大部分有用信息的较佳图像分块数为64。
4.2 n的确定
式(6)中的n值决定ω与β的反比例系数,n的不同取值与识别率的关系曲线如图8所示。从曲线看出n值在2~3.5时识别率较高。
根据以上分析和实验结果,确定Gabor滤波器参数取值,首先根据归一化后的图像大小将虹膜图像分成64块,子块中心为参数(r0,θ0)的取值;再使α、β分别在1/64~1/4,π/16~π/4中等间隔取值得到多个尺度;最后根据图8中的曲线选择ω与β的反比例系数为3π/2。
4.3 虹膜匹配
利用所设计的滤波器组分别与整幅图像作积分,将得到的响应系数粗量化值作为纹理编码,采用海明距离来实现匹配[4],30×7幅图像类内匹配630次,类间匹配21 315次。类内匹配是指将来自同一个虹膜的不同图像的编码进行比较计算海明距离,类间匹配是指将来自不同虹膜的图像的编码进行比较计算海明距离。分别统计类内,类间海明距离画出海明距离分布图,如图9(a)所示。
当阈值取在海明距离交点处T=0.191 5时,在21 945次匹配实验中,错误拒绝5次,错误接受293次,算法误拒率FRR=0.79%,误识率FAR=1.37%,识别率98.64%。统计不同阈值下错误识别率(FAR)和错误拒绝率(FRR),将这些值连成曲线得到FRR&FAR曲线如图9(b),两曲线交点处等错误率EER=1.043%,此时阈值为0.188。从实验结果看,依照本文方法设计的滤波器组能够实现虹膜分类,但是类内类间海明距离仍有部分交叉,分析其原因:
1)图像中存在光斑,在图像采集过程中人眼对光源的反射会使采集到的图像产生光斑,由于光斑位置不固定同类虹膜图像之间就会产生差异使得类内海明距离变大。
2)部分图像受上下眼皮遮挡严重且图像选取区域比较小,虽然为了避免上下眼皮的遮挡影响,图像只取得原图像的1/4但是仍有大部分图像受到遮挡影响使类内海明距离增加;即使一些图像不受遮挡影响,实验只选取虹膜图像的1/4,纹理信息也较少,导致类间海明距离偏小。
以上图像质量问题在预处理中得到解决将有助于提高虹膜识别的正确率。
5 结论
本文比较了直角坐标形式和极坐标形式Gabor滤波器的性质,详细分析了极坐标形式Gabor滤波器各参数对滤波器性能的影响。在分析的基础上提出了一种适用于虹膜纹理特征提取的Gabor滤波器参数设计方法。该方法根据归一化后的虹膜图像大小,对虹膜图像分块,将每块的中心坐标作为参数(r0,θ0)的取值;画出尺度因子α、β与类内、类间海明距离均值的关系曲线,选取类内类间海明距离相差大的部分作为α、β的取值范围;建立频率因子ω与尺度因子β的反比例关系最终得到其取值。实验结果证明所设计滤波器组能够很好提取虹膜纹理特征,实现虹膜分类。实验样本较小,有待进一步扩大样本,验证算法鲁棒性。
摘要:Gabor变换实现的难点是Gabor滤波器组的参数选择。本文提出了一种适用于虹膜纹理特征提取的Gabor滤波器组参数选择方法。该方法根据图像分块确定Gabor滤波器的位置因子取值;借助海明距离均值曲线确定滤波器尺度因子;通过建立尺度因子与频率调制因子的关系,最终确定频率因子的取值。实验证明,依据该方法设计的滤波器,能有效提取虹膜纹理特征,得到较高识别准确率达到虹膜识别的目的。
关键词:生物特征,虹膜识别,特征提取,Gabor滤波器
参考文献
[1]Wildes P.Iris recognition:an emerging biometric technology[J].Proceedings of IEEE,1997,85(9):1347-1363.
[2]Boles W W.A human identification technique using images of the Iris and wavelet transform[J].IEEE Transaction Signal Processing,1998,46(4):1185-1188.
[3]Daugman J G.Uncertainty relation for resolution in space,spatital frequency,and orientation optimized by two-dimensional visual cortical filters[J].Journal of the Optical of America A,1985,2(7):1160-1169.
[4]Daugman J G.High confidence visual recognition of persons by a test of statistical independence[J].IEEE Transaction on Pattern Analysis and Machine Intelligence,1993,15(11):1148-1161.
[5]Daugman J.Recognizing persons by their Iris patterns[J].Information Security Technical Report,1998,13(1):33-39.
[6]汪林峰,林斌.基于虹膜识别技术的便携式身份认证系统[J].光电子?激光,2001,12(10):1076-1078.WANG Lin-feng,LIN Bin.A Portable Verification System Based on Iris Recognition Technology[J].Journal of Optoelectronics?Laser,2001,12(10):1076-1078.
[7]应忍冬,徐国治.基于小波变换过零检测的虹膜身份识技术[J].上海交通大学学报,2002,36(3):355-358.YING Ren-dong,XU Guo-zhi.Recognition of Iris Using the Wavelet Transform Zero-Crossing Detection[J].Journal of Shang Hai Jiao Tong University,2002,36(3):355-358.
[8]康浩,徐国治.虹膜纹理的相位编码[J].上海交通大学学报,1999,33(5):542-544.KANG Hao,XU Guo-zhi.Phase Encoding for Iris Texture[J].Journal of Shang Hai Jiao Tong University,1999,33(5):542-544.
[9]张鹏飞,李德胜,王祁.一种新颖的虹膜识别方法[J].光电工程,2005,32(5):89-92.ZHANG Peng-fei,LI De-sheng,WANG Qi.Novel iris recognition method[J].Opto-Electronic Engineering,2005,32(5):89-92.
[10]徐涛,刘畅,明星,等.基于实数形式Gabor变换的虹膜识别方法[J].吉林大学学报:工学版,2004,34(1):46-51.XU Tao,LIU Chang,MING Xing,et al.Using real Gabor transform in iris identification[J].Journal of Jilin University:Engineering and Technology Edition,2004,34(1):46-51.
[11]黄惠芳,胡广书.一种新的基于小波变换的虹膜识别算法[J].清华大学学报:自然科学版,2003,43(9):1200-1213.HUANG Hui-fang,HU Guang-shu.Wavelet transform algorithm for iris recognition[J].J TsingUniv:Sci&Tech,2003,43(9):1200-1213.
[12]黄惠芳,胡广书.虹膜识别算法的研究及实现[J].红外与激光工程,2002,31(5):404-409.HUANG Hui-fang,HU Guang-shu.Study and implementation of iris recognition algorithms[J].Infrared and Laser Engineering,2002,31(5):404-409.
Gabor滤波器 篇2
目前,针对指纹图像增强的算法一般可以分为3大类:频率滤波、空间域的方向滤波和Gabor滤波。其中,在Hong[1]等人提出的利用局部纹线方向和频率,使用Gabor函数增强指纹图像的方法,以及后面出现的一些改进的Gabor滤波算法等,使得Gabor增强具有更好的鲁棒性和适应性,成为目前指纹增强的主流方法。其主要思想是在指纹图像的一个局部区域(一般是指纹中互不重叠的分块),提取指纹脊线上各点的方向和频率信息,构造适当的滤波器模板进行滤波增强处理。其主要步骤包括:(1)规格化处理;(2)方向场估算;(3)频率场估算;(4)图像分割;(5)Gabor滤波。
1规格化处理
图像规格化主要是将原始图像的灰度值的均值和方差调到所期望的均值和方差,进而减弱图像中由于噪声所产生的灰度差异,改善图像的灰度对比度,为后续处理工作做准备。公式如下:
其中,c(i,j)表示当图像当前第i行,第j列的灰度值,N(i,j)表示规格化的对应位置的灰度值,M0,σ0分别表示灰度图像的期望均值和均方,M,σ分别表示当前灰度图像的均值和均方差。其中原始图像和规格化图像分别如图1和图2所示。
2方向场估算
由于指纹图像的脊线走向比较平缓,对应的方向场也不会有剧烈的走向,因此脊线方向也表明着指纹的内在特性。而方向图分为点方向图和块方向图,前者是求出每个像素点的方向,方向图精确但计算量较大;后者是求出图像中每个局域中的纹线主导方向,计算量相对前者较少,抗噪性更强。本文中采用的是基于灰度梯度的方法求块方向图,其主要思路是根据纹线方向在局部区域内基本一致的特点,先把指纹图像分块,然后计算每一子块的纹线走向,最后用该方向代表对应子块内的各个像素的方向。方法如下:
(1)将规格化的指纹图像N分成W×W的无重叠的子块;
(2)利用Sobel算子分别计算每个子块中,对应的每个像素点的梯度分量值Gx,Gy;
(3)使用公式(2)计算每个分块中心像素点的纹线方向
这里θ(i,j)表示的就是以像素点(i,j)为中心的子块的局部方向,即纹线方向。得到的方向图如图3所示。
3频率场的估算
目前主要的脊线频率计算方法是:由于指纹纹线具有很强的方向性,沿着脊线方向看,指纹脊线和谷线像素点灰度值大致形成一个二维的正弦波,定义纹线频率近似为正弦波的频率,即为相邻的两个波峰或波谷之间的像素点个数的倒数。计算频率场的方法如下:
(1)在求出某一个块中心像素的方向角θ(i,j)基础上,以当前像素的脊线方向为短轴,作一个尺寸为N×S的长方形窗口,如图4所示。
(2)用公式(3)—(5)计算当前窗口内沿方向角方向的S个像素灰度的平均值,也即幅度值。
(3)在公式中,M(k)形成一个离散的正弦波,如果M(k)中存在连续的峰值,则说明当前窗口的指纹是有效的,设hi为第一个峰值与第i个峰值的间距,脊线平均距离L,则脊线频率为:
4图像分割
从图像场的角度看,梯度场可以用来分割指纹图像,因为指纹对象部分的梯度场值较高,而背景部分的梯度场值较低,所以一般把求出的梯度进行高度平滑,去掉梯度图像的噪声,然后利用适当阈值就可以判断该点为前景还是背景,确定阈值步骤如下:
(1)阈值的选择跟图像质量有关。对于光学图像,因为比较平滑,所以阈值比较小,通常取30~40。如果图像不够平滑,则必须先对图像进行平滑处理,并且阈值大约取50左右。
(2)用单位区域上的梯度阈值作为灰度梯度特征,需要计算单位区域上的平均梯度作为该单位区域阈值。具体方法见文献[2]。
(3)设A为分割域值。T(i,j)为位置(i,j)的梯度。
若T(i,j)>A,则当前点在指纹图像的前景上。
若T(i,j)<A,则当前点在指纹图像的背景上。
5 Gabor滤波器
由于Gabor滤波器具有频率选择和方向选择的特性,因此利用Gabor滤波器的窗函数沿着指纹脊线方向加强图像,使得指纹的脊线信息得到增强,而且可以去噪把指纹信息不失真的保留下来。
Gabor滤波器函数表示为:
其中,(x,y)表示当前点像素的位置,θ表示Gabor核函数的方向角,f表示当前点对应的脊线频率,σx,σy分别表示沿着x和y轴的高斯包络线的空间常数。
在Gabor滤波器3个参数中,方向角θ和脊线频率f已经在前文计算过,可以不予考虑,但高斯包络的标准偏差σx,σy不能直接设置,取不同的值会对滤波结果产生不同的影响:值越大,去噪能力越强,同时产生伪特征的可能性也越大;值越小,则相反。基于经验和实验,σx,σy取值均为4.0时,滤波效果较为理想。
利用Gabor滤波器进行滤波的公式为:
其中G(i,j)为滤波后得到的图像,N(i,j)为规格化后的图像,W=13,是Gabor滤波器的模板大小,效果如图5。
6改进的Gabor滤波器
虽然Gabor滤波器作为一种当前十分有效的图像增强方法,但是并不是对所有的图像都具有良好的滤波效果,尤其是低质量的图像在经过Gabor增强后仍针存在脊线结构模糊的情况。同时由于滤波器固定的方形窗口,使得增强后的图像很容易产生较多的块效应。介于传统的Gabor滤波器的局限性,在这里采用祝恩提出的减少Gabor增强产生块效应的方法:就是将Gabor滤波器的形状改为圆形[3]。如下:
其中滤波器的半径为τ=3L/4,L为脊线平均距离。
另外Gabor滤波器的带宽是由参σx,σy数共同决定。传统的滤波器中该参数均是根据经验值选取的一个固定值,对于脊线形状非常不规则时,滤波器就不能对图像进行有效的增强。所以在这里引用文献[4]中通过Gabor滤波器的频率带宽参数来指导搜索最佳滤波器的方法,使高斯常数随着脊线频率的变化而变化,尽而得到最佳滤波器。在文献中可得到公式如下:
根据半峰带宽的概念可以估计出σ和脊线频率F的关系,即式中f为脊线频率。
改进后的Gabor滤波器增强公式如下,效果如图6。
7实现结果分析
详细地介绍了指纹图像增强算法各个步骤:规格化、方向图、脊线频率、图像分割以及滤波器,对各个步骤并加以实现,并改进了Gabor滤波器。实验结果相比较表明,改进后的滤波,对低质量的图像处理效果有所提高,并减少了块效应,保留了更多的细节,使图像增强效果有所提升;但对于脊线频率的计算,仍不是太理想;另外,由于高斯常量是随着脊线频率的变化而变化,而不是固定的值,因此,在处理图像时需要花费更多的时间。
摘要:在指纹识别预处理中,指纹增强效果对于后续的匹配和识别具有很重要作用。本文主要详细的介绍了基于Gabor滤波的指纹图像增强算法,并通过研究和加以实现传统的增强算法,然后在原有的基础上改进了Gabor滤波器,最终,相对于传统的滤波器,取得了较好的增强结果,从而尽可能减少了噪声干扰以及块现象,为以后的指纹匹配打下了良好的基础。
关键词:规格化,方向角,频率场,Gabor滤波器
参考文献
[1]Hong L,Wan Y,Jain AK.Fingerprint image enhancement:Algorithms and performance evaluation[J].IEEE Transactions on Pattern Analysis Machine Intelligence,1998,20:777-789.
[2]夏振华,石玉,于盛林.基于Gabor滤波器的指纹图像增强[J].工程学学报,2006(5):80-85.
[3]祝恩.低质量指纹图像的特征提取与识别技术的研究[D].长沙:国防科学技术大学,2005.
Gabor滤波器 篇3
Gabor滤波是带通滤波器,在时域和频域都体现出很好的多尺度和方向特性,非常适合提取具有一定宽度和方向的中文笔迹特征。但由于Gabor变换是各向同性的,在各个方向均会得到完全的采样,会丢失很多与笔迹的直线或边缘相关的重要特征。鉴于此,现采用一种改进的Gabor变换进行特征提取,这种方法在不同方向选取不同的高斯尺度,很好的避免了Gabor变换的缺陷。实验表明,这种Gabor变换在汉字的笔迹特征提取上得到了比Gabor变换更具表征能力的特征集。
用Gabor滤波器进行特征提取时,不同的参数能提取图像不同尺度和方向的特征,参数设置是否‘合理直接决定滤波器的性能,因此,Gabor滤波器参数的设置是不可忽视的问题,但目前,有关这种问题的参考文献很少,故对此进行研究和实验,得出一些有参考性的结论。
1 Gabor滤波器
常用的Gabor变换的滤波函数取高斯函数,此种滤波器在x,y平面上的投影区域是一个圆,如图1(a)示。所用公式为[8]:
式(1),中,v表示Gabor滤波器的频率,u表示Gabor滤波器的核函数方向,K代表总方向数,高斯窗口大小由σ/k决定。
本文以“教”字为例,经预处理后,取频率值v=2,滤波选0°、45°、90°和135°这4个方向进行改进Gabor特征提取,结果如图2所示。
从0°、90°和135°方向三幅图中,可以看到角度的不同并对结果没有很大的影响,所提取的特征基本相同。出现这种问题的原因是,Gabor变换一种各向同性滤波器,在各个方向均会得到几乎完全相同的采样,会丢失很多诸如笔迹图像的直线或边缘等与方向相关的重要特征。
因此,选用一种改进的Gabor滤波器进行笔迹特征提取,它是由Geusebroek等提出的一种各向异性高斯滤波法[9],它在x,y平面上的投影区域是一个椭圆,如图1(b)示,所用公式为:
把图1(b)沿轴线旋转一个角度θ后形成图1(c),坐标系u-v与x-y的关系为:
这种方法能够在不同方向选取不同的高斯尺度,很好的避免了Gabor变换的缺陷,同时它具有速度快和变换直接在时域进行,不用像Gabor那样变换到频域的优点。依然以同样的汉字为例进行实验,所采用的方向与频率参数与Gabor变换相同,结果如图3所示。
可以看到,在同样实验条件下,本文所采用的改进的Gabor变换对汉字的特征提取效果要远好于常用的Gabor变换,这是因为这个滤波器在不同方向选取不同的尺度,滤波时很好的保留了笔迹图像的边缘等方向信息。另外,由于公式(2)中函数的可分解性,把滤波器分别沿着长轴和短轴的方向,分解成两个一维滤波器和图像卷积,这样大为简化了计算量。
另外,不难从几幅图中发现,选取角度参数的不同,提取的特征不同,进而对笔迹鉴别的识别率会产生一定的影响,实验中为了比对,只选取一个滤波器的频率,如果改变频率的值和个数,又对结果有怎样改变。从Gabor滤波器的原理可知,滤波器的设计主要是对参数的选取,其中角度和尺度直接决定滤波器的性能,本文下面的工作将对此问题进行研究。
2 滤波器参数对笔迹纹理特征的影响
2.1 尺度的确定及对纹理特征的影响
我们选取滤波方向为0°,4个不同尺度的滤波器对同一幅笔迹图像提取的特征,如图4所示,滤波器的尺度是由大到小进行变化,这里笔迹图像的大小为128×128。
可以看出,随着尺度由大到小变化,特征从全局特征向局部特征变化,全局特征体现整个笔迹图像的轮廓,局部特征体现图像的细节,如笔迹的线条部分就表现的比较清晰。滤波器尺度的不同对所提取的特征有很大的影响,因此如何确定尺度值是急待解决的问题。
目前很多国内外学者已提出了确定尺度的方法。本文采用较为简单的独立强度传播模型(IDS)法,这是由Deng等人[10]根据人类视觉生理特点提出的。文中把尺度定义如式(4):
式(4)中x,y表示位置坐标,I(x,y)表示归一化为[0,1]区间的图像灰度值。
现由式(4)来确定滤波器长轴的尺度值σu,滤波器短轴的尺寸σv的值确定为k*σu,其中k的值在[0,1]之间。不同的笔迹图像具有不同的纹理特征,k的值应该随之改变,可以根据实验效果在此区间确定k值,在图4实验中选取的k值为0.23。
2.2 角度的确定及对纹理特征的影响
从图3中可以看出,滤波器不同的角度能提取笔迹图像不同方向的纹理特征,在角度的选取上,由汉字本身具有较强的方向性,主要分布于垂直、水平和对角方向,只需在这几个方向进行角度选择即可。另外由于滤波器的对称性,只需要在[0°,180°]区间进行角度的选取,如果选取:0°、45°、90°和135°四个方向,就相当于对八个方向进行滤波。
在对于方向个数的选择上,建议通过人工统计的方式确定,即根据一幅笔迹图像笔划的方向数来确定滤波器角度及个数,对于某些笔划简单的笔迹图像来说,四个方向即可表征笔迹纹理特征。
3 实验结果与分析
为了验证这种Gabor滤波的有效性,以及研究滤波器参数对笔迹纹理特征的影响,本文选用天津考试院提供的15人的笔迹,每人10个笔迹图片进行实验,纸张选用A4打印纸,以200 dpi的精度将每幅图像进行扫描,存储于计算机中作为笔迹图像样本库。
为消除纸张背景、行间距、字间距和标点等因素对鉴别效果的影响,首先需要先对所有笔迹图像进行预处理。采取文献8的预处理方法,先通过RGB法设置一定阈值去除纸张背景以及字间分隔线,二值化后,分别进行水平和垂直方向投影,去除行或字之间的空白间距以及标点。最后将缩放成16×16的单字粘贴成128×128的图像,形成预处理后的笔迹纹理图。
现把每个人的5份笔迹共75份作为训练样本,另外5份笔迹共75份作为测试样本进行Gabor特征提取,对滤波器取σu=10、5、3、1这4个尺度,0、π/8、π/4、3π/8、π/2、5π/8、3π/4、7π/8这8个方向进行特征提取,最终得到特征的维数为524288。实验过程中,提取这样大的特征集耗费了数小时的时间,而且特征维数过大,存在严重的特征冗余。为避免上述状况,这里只选取每个Gabor通道的特征值的均值和方差作为笔迹特征,这样特征的维数仅为64维,极大降低了特征的维数和特征提取时间。通过实验比对,用改进的Gabor滤波器提取的所有笔迹特征进行鉴别,识别率为92.3%,用以上的方法提取的特征集进行鉴别,得到的识别率为93.2%,笔迹鉴别的识别率略有提高,更重要的是时间却从几个小时缩短为数分钟。
为此进一步改变滤波器的尺度参数,选取三组进行特征提取,得到如表1所示的识别率。
从表1中看到,随着滤波器尺度值的变大,所提取的特征由局部特征变成全局特征,而对于笔迹图像来说,显然局部特征更为重要,尺度值的增大使得全局特征越来越多,局部特征值变少,表征的笔迹特征不明显,因而识别率受到影响。
4 小结
采用了一种新的各向异性Gabor滤波器进行笔迹特征提取,实验结果验证了算法的有效性,也是在纹理特征提取方法上的一次有益尝试。另外分析了滤波器尺度和方向对于特征的影响,随着尺度的变大,特征由局部特征变化为全局特征,也即从表征笔迹图像细节特征转化为轮廓特征。对于参数的选取提供了实验与理论方法,下一步考虑选取优化算法来确定滤波器参数。
参考文献
[1] Abdl M K,Hashim S Z.Warm-Based feature selection for handwrit- ??ing identification.Journal of Computer Science,2010;6(1 ):80-86
[2]刘成林.计算机笔迹鉴别理论与方法.博士学位论文,北京:中国科学院自动化所,1995
[3]刘成林,戴汝为,刘迎建.简化的Winger分布及在笔迹鉴别中的应用.计算机学报,1997;20(11):1018-1023
[4] Liu C L,Dai R W,Liu Y J.Extracting individual features from moments for Chinese writer identification.In:Proceedings of IEEE International Conference on Documents Analysis and Recognition,Montreal, Canada,1995;438-441
[5]杨子华,吴敏,刘瑱,等.基于灰度共生矩阵的笔迹识别.信息安全与通信,2006;6:81-83
[6] He Z Y,You X G,Tang Y Y.Writer identification of Chinese handwriting documents using hidden Markov tree model.Pattern Recognition, 2008;41(4):1295-1307
[7] He Z Y,Tang Y Y.Chinese handwriting-based writer identification by texture analysis.In:Proceedings of the 3rd International Conference on Machine Learning and Cybernetics.Shanghai,China:IEEE, 2004:3488-3491
[8]刘宏,李锦涛,崔国勤,等.基于SVM和纹理的笔迹鉴别方法.计算机辅助设计与图形学学报.2003;15(12):1479-1485
[9] Geusebroek J M,Smeulders A W M,Weijie J V D.Fast anisotropic gauss filtering.IEEE Transactions on Image Processing,2003;12 (8):938-943
Gabor滤波器 篇4
输电线路长期运行中,因雷击、舞动、风振、覆冰跳跃及电气闪络等导致的导线、地线断股(损伤)已成为输电线路非计划停运的主要原因之一[1,2,3,4]。为保证电网的安全运行,运行中采用定期巡检的方法对输电线路进行检测。导线断股检测主要采用人工巡视,即沿着输电线路走廊用望远镜或者其他检测设备对辖区内的输电线路进行观测,但这种方法不仅精度低,而且劳动强度大;近年来,出现了利用直升机和机器人的输电线路巡线方式,通过搭载光学视频传感器检测输电线路导线状态[5,6,7,8,9,10,11,12]。
传统的对检测图像进行直接观测判断输电导线断股故障的方式具有一定的主观性,国内有学者对图像处理技术在输变电设备检测中的应用进行了研究,并取得了一定的研究成果[7,13,14,15,16,17]。由于检测装置移动速度、本身性能的限制和输电线路所处环境的复杂性(污秽、光照等)以及输电导线本身结构的特殊性,输电导线损伤、断股信息很可能因此受到干扰,以致不能快速、准确地判断输电导线损伤、断股故障,使得传统的图像处理方法在导线断股信息提取时表现出很大的局限性。Gabor滤波器是公认的分析具有频率和方位特征纹理图像的有力工具,基于Gabor滤波器的方法已被成功应用于具有规则纹理材料的图像分割与损伤识别[18,19,20,21,22]。
输电导线是由铝股线和钢股线螺旋捻制而成,形成一规则的纹理结构。针对输电导线断股图像检测的实际技术难题,本文提出通过Gabor滤波器对导线检测图像进行处理来识别输电导线断股缺陷,通过建立以正常纹理响应值的均值最大、方差最小为目标函数建立Gabor滤波器最优设计模型,并将广泛应用于非线性、多变量优化问题[23,24,25]的遗传算法应用于Gabor滤波器频率和图像分割阈值等参数的确定,最后通过检测图像的滤波和能量的二值化处理得到输电导线断股的检测结果。
1 最优Gabor滤波器设计
1.1 二维Gabor滤波器及其参数表示
Gabor变换是一种时频分析方法,Gabor变换函数又称Gabor滤波器,本质上是一种带通滤波器,具有方向、中心频率及频域带宽可调和最佳的时频域局部分辨能力[18,19,20,21,22]。二维Gabor滤波器是加二维高斯窗的傅里叶变换,它的冲击响应可以表示为用二维高斯函数调制的有向复正弦:
式中:φ={θ,λ,f};θ为方向角;λ为高斯函数的宽度参数(即尺度);f为滤波器带宽的中心频率。
Gabor滤波器Gφ(x,y)为复值函数:
图像D通过Gabor滤波器的响应为D(x,y)和Gabor滤波器Gφ(x,y)的卷积:
对式(6)进行离散化处理,设D(x,y)是m×n点阵的数字图像,对大小为W×W(W=2k+1)的邻域窗口,D(x,y)与Gφ(x,y)的实部、虚部离散卷积分别为:
定义窗口W×W中任意点(x,y)处频谱能量为:
式中:P=m-W+1;Q=n-W+1。
在学习和检测过程中,可采用函数Eφ(x,y)作为输入图像对滤波器Gφ(x,y)的响应。
1.2 二维Gabor滤波器的优化设计模型
如果能找到一个最优滤波器与导线的正常纹理匹配,那么正常纹理就能通过滤波器输出数值较小且稳定的频谱能量,而断股缺陷区域则有很大的频谱能量输出;然后对响应结果进行阈值化处理,即可实现导线断股区域的自动分割和识别。为了得到缺陷区域和正常区域的最大响应差别,本文以正常纹理响应值的均值最大、方差最小为目标函数来设计最优Gabor滤波器。
Fisher Cost评估函数是基于Fisher标准建立的,Fisher标准是一种广泛应用于模式识别领域的设计特征提取器工具,在处理纹理分割问题时,用于衡量由平均方差规格化的2个均值的差额。导线断股缺陷检测的目的是能够自动区分已知正常导线纹理和断股缺陷纹理。本文采用完好导线图像为模板D、优化变量为φ,并采用式(9)来计算模板D的响应矩阵E=(eφ,Di,j),把Fisher Cost函数用做目标函数,以获得最优的Gabor滤波器参数:
式中:
对于给定的Gabor滤波器参数,变量μφ,D表示衡量滤波器使标准导线图像的平均能量最大化的程度;变量σφ,D表示所区分效果,即在μφ,D确定的情况下,σφ,D越小,导线断股缺陷检测效果越明显。
约束条件为:
式中:λmin和λmax分别为尺度参数λ的最小值、最大值;fmin和fmax分别为频率参数f的最小值、最大值。
2 导线图像分割阈值的确定
由于导线图像背景和导线股间隙形成一规则纹理,因此,完好导线图像的响应输出服从正态分布,则eφ,Di,j的概率分布密度函数可表示为:
式中:μ1和σ1分别为对导线规则股间隙规则纹理响应的均值和方差;μ2和σ2分别为对导线背景响应的均值和方差;α为导线规则股间隙规则纹理在图像中出现的概率。
本文要求μ1<μ2。现采用极大似然法来估计未知参数μ1和σ1。对于(eφ,Di,j)P×Q,其似然函数为:
估计值
由于导线断股缺陷部分的响应小于正常部分的响应,分割阈值D可取为:
式中:η为控制常数,由具体的检测任务确定,一般取η=5~9。
对于导线检测图像S,通过分割其响应矩阵E=(eφ,Di,j),可得到检测结果为R=(ri,j),即
3 基于小生境遗传算法的模型求解
由以上分析可知,Gabor滤波器的优化设计和导线图像分割阈值的确定是具有约束的非线性多维变量优化问题,而遗传算法由于其高度并行、随机、全局搜索以及自适应特点,非常适合这类非线性优化问题的求解[23]。但传统遗传算法由于常用最优保存策略和比例选择相结合进行选择操作,使进化后期个体过于集中而导致早熟、收敛于局部最优解的问题。因此,本文利用小生境技术[24,25]对传统遗传算法进行改进,以更好地保持解的多样性、增强寻优能力和收敛速度,并利用改进后的小生境遗传算法求解Gabor滤波器优化设计模型和导线图像分割阈值。
求解Gabor滤波器和极大似然估计参数时采用十进制编码,适应度函数直接采用目标函数(即式(10)和式(15)),其优化过程如下。
步骤1:令进化代号t=1,随机生成M个个体形成初始群体p(t),并计算每个个体的适应度函数fi(i=1,2,…,M)。
步骤2:依据初始个体的适应度进行降序排列,f1≥f2≥…≥fM,并记忆前N个对应的个体,{X(t)1,X(t)2,…,X(t)N},其中N是适当给定的小于M的数。
步骤3:以概率Pi=fi
步骤4:采用均匀交叉算子对p(1)(t)进行交叉,交叉概率为0.6,得到p(2)(t)。
步骤5:采用均匀变异算子对p(2)(t)进行变异操作,变异概率为0.02,得到p(3)(t)。
步骤6:小生境淘汰运算。将前面计算得到的N个个体和最开始的M个个体合并在一起,得到一个含有M+N个个体的新群体;对这M+N个体求出每2个个体之间的海明距离:
式中:Xi和Xj为n维向量;xik和xjk为个体中变量的基因值;i=1,2,…,M+N-1;j=i+1,i+2,…,M+N。
当‖Xi-Xj‖<L (L为最小海明距离)时,比较个体Xi和个体Xj的适应度大小,并对其中适应度较低的个体处以罚函数Fmin(Xi,Xj)=δ,其中δ为一很小的正数,如10-20。
步骤7:将M+N个个体的新适应值进行降序排列,并取前M个个体为p(t+1)。
步骤8:若不满足收敛准则,则令t加1后返回到步骤3,否则输出p(t+1)。收敛准则:在预定的进化次数内最适应个体的适应度无改进。
本文提出的输电线路导线断股检测方法如图1所示,分为学习过程和检测过程。
在学习过程中,首先采用完好导线图像D为模板,经过Gabor滤波器G(φ)滤波后,得到响应矩阵E,然后以C(φ,T)为目标函数寻找最优的Gabor滤波器G(φopt);最后采用滤波器G(φopt)对模板D进行滤波,再通过极大似然法来估计响应值的概率分布密度,以确定分割阈值T。在检测过程中,首先应用滤波器G(φopt)和阈值T检测待检图像S,然后通过提取响应矩阵E的极小值点来计算断股缺陷处的形状特征,用于缺陷识别。
4 实验分析
为了验证算法的有效性,本文利用输电线路巡线机器人搭载图像传感器对导线进行视频检测进行了实验分析,巡线机器人实验平台见附录A图A1。
由于导线的股间隙纹理无强力的位置约束,正常完好的导线图像有较大的偏差,因此比较适合测试算法的稳定性和可靠性。在学习阶段,以完好导线的图像作为模板D,用小生境遗传算法求解最优Gabor滤波器参数及其能量响应矩阵的概率密度分布,可得滤波器参数1中θ为180°,λ为7.2,f为60 Hz,极大似然估计值
为对比Gabor滤波器最佳参数,本文利用其他2组Gabor滤波器处理导线断股检测图像,如表1所示。
图2(a)为在现场试验通过巡线机器人拍摄的输电导线断股、损伤数根的图像;采用传统图像边缘检测算法和小波算法对输电导线断股原始图像处理后的检测结果见附录A图A2(a)~图A2(e)[26];图2(b)~图2(d)为采用本文提出的Gabor滤波器的二值化处理结果(其能量谱见附录A图A2(f)~图A2(h))。图中的黑色部分表示导线背景或者导线完好纹理二值化处理后的结果,白色部分表示输电导线外部轮廓和断股缺陷区域。
传统的图像边缘检测算法Roberts算子、Sobel算子、Prewitt算子对原始图像处理后的导线断股缺陷区域不明显;Canny算子和小波算法能够提取导线断股缺陷区域,但是导线边缘轮廓和股间隙轮廓可能对导线断股缺陷信息提取形成干扰,因此,传统的图像边缘检测算法和小波图像处理算法对输电导线断股缺陷的图像检测能力较弱,无法提取导线断股图像信息。利用Gabor滤波器能够有效提取导线断股缺陷图像信息,同质纹理区域的能量值都很小,导线断股缺陷区域的能量值相对较大。Gabor滤波器采用参数2对导线断股原始图像的二值化处理结果亮度最大,能量幅度最大,但非缺陷区域能量谱噪声也较大;采用参数3的二值化处理结果亮度很小,能量幅度最小,从二值化处理结果甚至无法直接辨别导线是否存在断股损伤;Gabor滤波器采用本文提出的小生境遗传算法获得的参数对导线断股原始图像的检测结果不仅能够清晰地识别出导线断股损伤区域,而且其非缺陷区域在能量谱上反映出的噪声干扰也较小,因此,由以上分析可知,采用小生境遗传算法获得的Gabor滤波器参数相对其他2组参数最优。
图3分别为现场试验通过巡线机器人拍摄的输电导线断股翘起、导线断股一根、输电导线完好区段的检测图像和相应的Gabor滤波器二值化处理结果(其能量谱图见附录A图A3(a)~图A3(c))。
可见,利用Gabor滤波器能够有效提取各种断股缺陷程度的图像信息,同质纹理区域的能量值都很小,导线断股缺陷区域的能量值相对较大。导线断股缺陷越严重,其强度函数即二值化处理图像中反映断股缺陷的白色区域越明显、亮度越大,导线断股缺陷严重程度和能量幅度成正比。对Gabor滤波器处理输电导线完好区段检测图像的能量谱能很好地反映导线的边缘和股间隙特征信息。
5 结论
1)输电线路导线由单根铝线和钢芯捻制而成,其股间隙形成规则的纹理结构,具有显著的周期性、方向性和均匀性等特征,输电导线的这种结构特征使其适用于通过Gabor滤波器处理进行图像检测。
2)Gabor滤波器能够达到时频测不准的下界,因此,本文提出的方法既可以在频域中准确地检测到缺陷,又可以在空间域中准确地定位缺陷;断股缺陷识别能力强,且定位准确。
3)输电导线股间隙形成的规则纹理呈现一定的弧度,且巡线机器人提取的图像背景都存在正常的偏差,本方法能克服这些正常偏差对检测准确性的影响,即能够根据正常偏差的响应分布情况来确定图像分割阈值,并把正常偏差部分视为无断股缺陷的区域,因此可最大限度地减少误检率。
4)本文方法以巡线机器人或直升机为平台,通过对获得的输电导线的视频检测图像进行处理,实现输电导线断股检测,在学习阶段统一采用小生境遗传算法求解Gabor滤波器优化模型和概率分布参数的极大似然估计值,在检测阶段采用快速傅里叶变换(FFT)算法实现Gabor滤波器的卷积运算,适用于输电线路的实时检测。
附录见本刊网络版(http://aeps.sgepri.sgcc.com.cn/aeps/ch/index.aspx)。
Gabor滤波器 篇5
关键词:纹理分析,纹理分类,纹理图像,Gabor滤波
本文采用基于灰度—梯度共生矩阵的纹理统计方法。该方法将灰度直方图和边缘梯度直方图结合起来, 为了获得旋转不变测量, 采用高斯拉普拉斯算子计算梯度信息, 容易验证其旋转不变性。通过获得旋转不变特性, 梯度信息就得到了具有旋转不变特性的灰度—梯度共生矩阵。从此, 在灰度—梯度共生矩阵中提取适当的纹理特征,
为了同时考虑空间域和频域的统计信息, 将环形Gabor滤波与灰度—梯度共生矩阵方法结合, 提出了基于灰度—梯度共生/环形Gabor滤波联合的旋转不变纹理分类方法。提出了Gabor滤波的参数选择方案, 同时从灰度—梯度共生矩阵中提取适当的特征, 采用马氏距离分类器来分类纹理。实验结果表明该方法的有效性。
1 灰度—梯度共生矩阵 (GGC)
1.1 灰度—梯度共生矩阵定义
一幅图像{f (i, j) ;i, j=0, 1, 2, 3, …, N-1}, 灰度级数为N, 为了减少计算量, 可将灰度正规化处理
式中:Lf为规定的灰度级数目, fmax为图像的灰度级数目。
同样, 对于梯度算子, 可将其梯度图像{g (i, j) ;i, j=0, 1, 2, 3, …, N-1}进行正规化处理, 使其梯度更加离散公式为
式中:Lg为规定的灰度级数目;gmax为梯度图像的灰度级数目。为了得到旋转不变梯度图像, 采用高斯拉普拉斯算子作为梯度算子。
由此得到了2个正规化矩阵:
1) 灰度矩阵:
2) 梯度矩阵:
则灰度—梯度共生矩阵定义如下:
H (x, y) 定义为集合{ (i, j) |F (i, j) =x且G (i, j) =y;i, j=0, 1, 2, 3, …, N-1}中的元素数目, 即灰度为x, 梯度为y的总像素点数。如:Lf=Lg=16, H (7, 10) =14, 表示一幅图像的灰度取值范围和其梯度取值范围均为16, 在灰度-梯度共生矩阵中, 灰度为7 (x=7) , 梯度为10 (y=10) 的总像素点数为14。
1.2 灰度—梯度共生矩阵归一化
变换公式为
显然,
式中:x=0, 1, 2, …, Lf-1;y=0, 1, 2, …, Lg-1。
1.3 基于灰度—梯度共生矩阵的特征统计量
从灰度—梯度共生矩阵中可以抽取以下重要特征统计量:
1) 小梯度优势
2) 灰度分布不均匀性
3) 梯度分布不均匀性
4) 能量
5) 灰度平均
6) 梯度平均
7) 灰度均方差
8) 梯度均方差
9) 灰度熵
10) 梯度熵
11) 混合熵
12) 惯性
13) 逆差矩
2 环形Gabor滤波 (CGF)
传统的Gabor函数是由方向复数正弦信号控制的高斯函数, 其数学表达式为
式中:
式中:F为环形Gabor滤波的中心频率。图1具体说明了环形Gabor滤波的特性。
2.1环形Gabor滤波旋转不变纹理分析
在基于Gabor滤波的纹理分析中, 通过将纹理表面I (x, y) 投影到复杂Gabor滤波上得到每个像素的纹理属性。在分析中用到的环形Gabor小波为
考虑将原图像旋转Δθ角度之后的纹理图像I′ (x′, y′) , 其投影变为
此时,
;
则
所以, 上述表达式可以表示为
由P=P′证明了当一幅图像旋转后, 其在环形Gabor滤波器下的投影保持不变。也就是说该属性具有旋转不变性。
2.2参数选择方法
1) δ=2π与传统的Gabor滤波中的取值相同;
2) 对于一幅大小为N×N的纹理图像, 选择频率F, 公式为
对于每一个F, 可以计算出UF和σF:
其中
对得到的数据进行标准化, 这样一幅纹理图像可以表示为
3 基于信息增益的特征选择
信息增益的特征选择可以得到比较好的纹理, 降低图像维数, 从而提高分类系统性能。
定义信息熵I (s1, s2, …, sM) :
式中:S为样本集;M为S的分类数目; (s1, s2, …, sM) 为S的一个划分, 设Ci为第i类分类标号;Pi为任意样本属于Ci的概率;si为分类Ci上的样本数。
假设有V个不同的属性, A为其中的任意一个属性, 则由属性A划分整个样本集为M类不相交子集的熵E (A)
因此, 属性A的信息增益Gain (A)
在实验中, 有16类样本, 分类标号Ci∈ (1, 2, …, 16) , 每一类含有N个样本, 共有16×N个样本, 即S=160×N。
计算每一维属性的信息增益, 通过选取信息增益较大者对应的属性来完成特征的选择, 最终选择前70%的属性对应的特征, 得到的分类效果最好。此特征选择过程如下
Step 1 每一类含有N个样本, 即
Step 2 采用基于信息增益最小的数据离散化方法, 将连续的属性值离散化, 得到M个整数值;
Step 3 数据离散化之后, 样本数据集被重新划分, 量化值为k (k=1, 2, …, M) , 分类标号为i, i=1, 2, …, 16的样本数为sk, i, 得到
Step 4 计算I (sk, 1+sk, 2+…+sk, 16) , (k=1, 2, …, M) ;
Step 5 计算属性A的信息熵:
Step 6 计算属性A的信息熵
基于以上步骤, 选择较大的信息增益值对应的特征。
4 实验结果
从Brodatz图片集中选取16类纹理图像, 如图2所示。每一类纹理包含8个大小为512×512的原始图像, 其中1个用于训练分类器, 剩下的7个用于测试分类器。将这些原始图像旋转, 从旋转后的图像中截取大小为360×360的子图像。采用10个旋转角 (0°、20°、30°、45°、60°、70°、90°、120°、135°、150°) , 在旋转过程中, 采用双线性插值算法, 纹理在旋转后没有产生任何局部扭曲。这样得到了简单易控的旋转不变纹理分析图像数据。最初的实验是从训练图像中抽取几个64×64的子图像来训练纹理分类器, 这些比较小的样本增加了纹理分类问题的难度。训练集包含576个样本图像, 这些图像具有同一个旋转角度, 而用其他角度的纹理图像进行分类测试。
在实验过程中, 特征选择过程使用同一训练集进行数据离散化。测试集包含5 184个样本, 采用最小距离分类器作为纹理分类器, 用马氏距离来计算测试样本与训练样本模型的接近程度。得到的实验结果见表1。
5 结束语
将灰度—梯度共生矩阵与环形Gabor滤波方法结合来解决旋转不变纹理分类问题。文中示出了灰度-梯度共生矩阵与环形Gabor滤波的旋转不变特性, 同时采用了基于信息增益的特征选择方法来进一步选择特征以提高系统的性能, 实验结果表明了其有效性。未来的工作是彩色图像检索问题, 本文提出的方法加上颜色统计信息或许可以很好地解决此问题。
参考文献
[1]Xia De-shen, Jin Sheng, Wang Jian. Fractal Dimension and GGCM Meteorology Cloud Pictures Recognition. Journal OF NANJING UNIVERSITY OF Science And Technology, 1999, 23 (4) .
[2]U.M.Fayyad, K.B.Irani.“On the Handling of Continuous-valued Attributesin Decision Tree Generation”.Machine Learn-ing, 1992, 8:87-102.
[3]P.Brodatz, Textures:A Photographic albumfor artist and de-signers.Dover, 1996.
[4]Dong-Gyu Sim, Hae-Kwang Kim, Dae-Il Oh. Translation, Scale, and Rotation Invariant Texture Descriptor for Texture-Based Image Retrieval. ICIP, 2000:742-745.
Gabor滤波器 篇6
在基于内容的图像检索(CBIR,Content-Based Image Retrieval)方法中,以Gabor滤波器提取纹理特征作为检索依据是基本的方法之一[1,2,3,4,5,6,7]。
Manjunath等将Gabor滤波引入CBIR工作,并同时利用4个尺度6个方向的滤波系数的均值和方差组成的特征向量进行检索,查准率在25%~54%之间[1]。Zhang等利用图像Gabor滤波在5个尺度6个方向的滤波系数的均值和方差组成的特征向量进行检索,并且证明了系统能力的旋转不变性特征[2]。Chen等研究了在CBIR工作中Gabor滤波器模板大小及相关参数的关系,得到了在一定查全率的情况下,滤波器模板大小为13×13时查准率最佳,但与9×9的模板差别不大[3]。Andrysiak等给出了利用Gabor滤波器提取纹理特征并结合图像的色彩、形状特征的多层次的图像检索方法[4]。Mahmoud等利用Gabor滤波器作为纹理提取工具,通过改进的非线性的Radon变换(Radon transform)对纹理的方向、一致性进行估计从而实现CBIR,按方向估计时查准率达83.5%,按一致性估计时查准率达到了90.8%[5]。然而,Deselaers等对比了十九种特征提取方法用于图像检索,Gabor滤波的两种方法中,Gabor直方图法位于第8位查准率(平均39.4%),Gabor向量法的查准率只有25.7%,位于倒数第2位[6]。
这些研究都没有考虑多尺度和多方向上提取的滤波系数所给出的纹理特征的进一步挖掘,而图像作为一种二维光学能量分布,其局部强度在各个尺度和方向上的分布特征不仅体现在其滤波系数的均值和方差上,还体现在其峰态、偏态、平滑度以及一致度等分布特征上。因此,本文在利用一个4尺度6方向的Gabor滤波器组进行图像纹理特征提取的基础上,提出用这些滤波系数的高阶矩组成的向量来表示图像特征,并提出了在Gabor滤波组实现的多分辨率域上纹理平滑度和一致度的度量方法,并利用Gabor滤波系数的各阶矩与平滑度和一致度参数组成的向量进行图像检索。实验证明,所提出的方法具有较高的查准率,平均查准率达63%,对于纹理特征明显的图像,查准率超过了90%。
1 二维Gabor滤波、滤波器组与图像特征提取
1.1 Gabor滤波器组
采用奇对称Gabor滤波器提取图像纹理特征:
其中:ω是高斯函数的调制频率(或称滤波器的中心频率),σx,σ分别是高斯函数沿x方向和y方向的标准方差,决定了高斯窗口的大小,也被称为尺度因子。通过对二维奇对称Gabor基函数进行尺度扩张和旋转变换,可以得到一组自相似的滤波器:
尺度扩张:ω=ωmaxfs
旋转变换:x=xθcosθ+yθsinθ;y=-xθsinθ+yθcosθ其中:θ=rπk,k和s分别表示滤波器组的方向数和尺度数,r∈[0,k-1],f s表示滤波器的带宽是随尺度呈指数递增的。
Daugman等通过对人类视觉系统的研究[8],提出以下符合人类视觉感知的参数设置:
1)高斯窗口的标准方差比σy/σx=2;
2)滤波器的半峰值带宽φ取1~1.5倍频程。
基于此,本文取尺度数s=4,所用的Gabor滤波器组由4个尺度6个方向,一共24个二维奇对称Gabor滤波器组成,窗口大小设置为2σx×2σy,即从2×4倍增到16×32。
因此,对图像的二维Gabor滤波为
其中ψ(x,y;s,θ)为尺度为s方向为θ的Gabor滤波器。
1.2 多尺度多方向图像特征的提取
为了最大程度地获得图像纹理特征,并将其同时用于图像检索,采用如图2所示的算法进行图像特征提取,即:
1)按上述要求进行Gabor滤波器的设计,将多个Gabor滤波器组成滤波器组;
2)将待检索图像通过滤波器组,获得不同尺度不同方向的滤波系数;
3)统计这些滤波系数的各阶矩特征及平滑度、一致度特征,由这些矩组成图像特征向量。
考虑到图像纹理特征在不同的尺度和不同的方向上是不同的,通过具有不同分辨率和方向的Gabor滤波器组,可以获得多尺度且多方向上的滤波系数,这些滤波系数本身的特征可以由各种统计特征参数反映。因此,选择多个高阶矩组成的特征向量来反映图像在不同尺度、不同方向上图像纹理特征的统计分布特征,即可利用这一特征向量进行图像检索。
2 滤波系数各阶矩及相似性度量
2.1 滤波系数各阶矩
对于随机过程的一个样本X,若µk=Ε[(X-E(X))k]存在,则称其为X的k阶中心矩。随机过程的各阶矩可以衡量其一般特征。
传统的基于Gabor滤波的图像检索技术大多提取Gabor小波系数的数学期望µs,θ和二阶矩-方差σs,θ作为图像的纹理特征,即:
这里,引入Gabor滤波系数的三阶矩、四阶矩和能量,定义在各个尺度s和方向θ上的偏态δs,θ、峰态ks,θ和能量es,θ分别为
偏态、峰态和能量分布衡量了在滤波尺度和方向上的纹理分布的对称程度、陡峭程度和总能量。
2.2 纹理平滑度和一致度
为了突出滤波后所得到的系数体现出的纹理特征,引入纹理平滑度Rs,θ和一致度Us,θ:
其中σs,θ是Gabor小波系数的标准方差。图像在s尺度θ方向上的纹理越平滑,平滑度Rs,θ值越大,图像在s尺度θ方向上的纹理越粗糙,平滑度Rs,θ值越小。该定义是沿用其在灰度直方图中的原定义,因为标准方差σs,θ在灰度直方图中和Gabor小波系数中具有相似的物理意义,即都反映了图像纹理的分散程度。
其中:σs,θ是图像某个尺度某个方向上的小波系数的标准方差,ps,θ=σs,θ/∑s∑θσs,θ则表述了该尺度该方向上的纹理方差对图像各方向各尺度纹理方差总和的贡献率。因此,该定义描述了图像各个方向各个尺度上的纹理信息分布的规律性,各个方向各个尺度上的纹理分布越平均,Us,θ值越小,反之,各个方向各个尺度上的纹理分布差异越大,Us,θ值越大。
2.3 多特征融合的相似性度量
通过实验发现能量、标准方差、峰态、平滑度和一致性度量都是有效的特征量度,反而经常被用做特征量度的数学期望在区分纹理方面的效果不好,偏态区分纹理的效果最差。基于此,标识图像特征的特征向量可表示为
其中,向量下标即4个尺度6个方向。基于上述算法,可以将本CBIR方法简称为GMM法(Gabor Multi-moments method)。采用欧式距离测度各图像间的相似程度。
3 实验结果及分析
从Brodatz纹理库和Corel图像库中选取10幅典型图像作为待检索图像,如图3所示。并以这10幅图像为类别每类图像选取50个样本,组成500幅图像的图库。查准率(precision)按通用定义计算。
本文用于做比较的是传统µσ检索法,即只用滤波系数的均值和方差组成的特征矢量作为检索依据。为了突出特征空间构成的不同对图像检索结果的影响,µσ法算法流程设置成与GMM算法的流程相同,只是在提取特征向量时,µσ法只提取Gabor小波系数的期望和标准方差作为特征,而GMM法则提取Gabor小波系数的能量、方差、峰态、平滑度和一致性度量作为特征。
实验表明:
1)所提出的GMM算法比Deselaers等对比的十九种特征提取方法中所涉及的两种Gabor滤波方法,Gabor直方图法(Gabor histogram)和Gabor向量法(Gabor vetor),平均查准率分别高出27.6%与41.3%,且比其用于对比的最好方法,颜色直方图(color histogram)高出8.9%,这表明Gabor滤波方法只要深入挖掘其系数特征,仍可获得较好检索性能。
2)传统µσ法检索查准率与已报道的一致,查准率在22%~81%之间,且提出的方法与传统方法的查准率趋势一致。其中,纹理特征不明显且图像光滑的样品7、9,查准率最低;纹理特征明显的样品2、8、10,两种方法都获得了较高的查准率。表明Gabor滤波在纹理特征明确的图像检索具有较大优势。
3)所提出的GMM算法比传统的µσ法平均检索性能高出23%。对于纹理特征不明细的图像,检索性能也高出13%~15%;对于纹理特征明显的图像,检索性能高出12%~43%;对于纹理有明确尺度特征和方向性的图像,如样品1、2、4、6、8,检索性能改善最大,平均优化33.2%,最高优化达43%。对于纹理在各个尺度上都具有各向同性特征的图像,如样品5,所提的算法比传统方法优化不大。可见,对于纹理尺度特征和方向特征明显的图像,所提出的方法具有明显的优势。
4 结论
本文在多尺度多方向的Gabor滤波器组提取图像纹理特征的基础上,提出了一种利用滤波系数高阶矩进行图像检索的方法,这样,不仅利用了多通道的Gabor滤波器对图像纹理特征的选择性,而且充分反映了在不同尺度和不同方向上图像纹理的统计特征。为了更好地反映滤波后在特定尺度和特定方向上图像纹理的特征,引入了纹理平滑度和一致度的算法,并将纹理平滑度一致度作为纹理高阶统计参量纳入特征向量。通过利用图像在4个尺度6个方向的Gabor滤波系数高阶矩所组成的特征向量进行CBIR,获得了较好的查准率。
可以看到,在利用Gabor滤波系数高阶矩时,图像特征向量的计算量增加,因此,进一步可考虑在一定的特征判断基础上采用自适应方法,一方面提高检索特征提取的针对性,另一方面可减少检索计算量。
参考文献
[1]Manjunath B S,Ma W Y.Texture Features for Browsing and Retrieval of Image Data[J].IEEE Trans.Pattern Analysis and Machine Intelligence(S0162-8828),1996,18(8):837-842.
[2]ZHANG Deng-sheng,Wong Aylwin,Indrawan Maria,et al.Content-based Image Retrieval Using Gabor Texture Features[C]//Proc.of first IEEE Pacific-rim Conference on Multimedia,Fargo,ND,USA,October24-26,2001:1-9.
[3]Chen L,Lu G,Zhang D.Effects of Different Gabor Filter Parameters on Image Retrieval by Texture[C]//10th International Multimedia Modelling Conference,Brisbane,Australia,Jan5-7,2004:273-278.
[4]Andrysiak T,Choras M.Image Retrieval Based on Hierarchical Gabor Filters[J].International Journal of Applied Mathematics and Computer Science(S0218-1967),2005,15(4):471-480.
[5]Mahmoud R H,Ho Y.An Efficient Approach to Texture-Based Image Retrieval[J].International Journal of Imaging Systems and Technology(S0899-9457),2007,17(5):295-302.
[6]Deselaers T,Keysers D,Ney H.Features for Image Retrieval:An Experimental Comparison[J].Information Retrieval(S1386-4564),2008,11(2):77-107.
[7]Kamarainen J K,Kyrki V,K?lvi?inen H.Invariance Properties of Gabor Filter-Based Features-Overview and Applications[J].IEEE Trans.Image Process(S1057-7149),2006,15(5):1088-1099.
Gabor滤波器 篇7
关键词:车牌检测,Gabor变换,二维Gabor滤波
1 绪论
车牌区域检测 (LPD) 是车牌识别系统的关键步骤。车牌检测的精度对车牌识别系统的识别精度有着非常重要的影响。经典的车牌检测算法例如边缘检测[1], 数学形态学[2], 彩色分割[3]等方法, 这些方法的共同缺陷就是对图像的噪声特别敏感[1], 误检区域过多, 对后续的车牌识别造成很大的影响。
2 Gabor滤波简介
Gabor变换是D.Gabor 1946年提出的, 在图像的纹理细节分析方面有着非常广泛的应用。而且, Gabor滤波在对没有确定对象的方向和大小的分析有着非常独特的优势[5], 因此Gabor滤波广泛应用在模式识别, 图像分析中。
2.1 从Fourier变换到Gabor变换
式 (1) 为经典Fourier变换与反变换的定义是。由于经典Fourier变换只能反映信号的整体特性 (时域, 频域) 。另外, 要求信号满足平稳的条件。由式 (1) 可知, 要用Fourier变换研究时域信号频谱特性, 必须要获得时域中的全部信息。另外, 信号在某时刻的一个小的邻域内发生变化, 那么信号的整个频谱都要受到影响, 而频谱的变化从根本上来说无法标定发生变化的时间位置和发生变化的剧烈程度。
为此, D.Gabor在1946提出了一种新的变换方法—Gabor变换。设函数f为具体的高斯函数, 且, 则Gabor变换定义为
是一个时间局部化的““高斯窗函数””, 其中, a>0, b>0.参数b用于平行移动窗口, 以便于覆盖整个时域。
2.2 二维离散Gabor滤波理论
在图像处理中, 通常要用到二维离散Gabor滤波, 二维离散Gabor变换的公式化定义如式 (3) 所示:
其中, a、b为x和y方向的椭圆高斯的方差, w为复正弦函数的频率, 为复正弦函数的初相。
其中为滤波器的旋转角度, 完整的Gabor滤波基函数为:
2D Gabor滤波的表达式如下:
3 Gabor滤波在车牌检测中的应用
在实际应用中, 通常要具体量化上述的某些参数, 参数的选取应该结合实际的情况, 例如摄像机的视角, 环境, 光线等。其中为旋转角度, w为复正弦函数的频率, 图1为不同的和w的Gabor滤波器的频率特性。
通过以上实验结果可以看出:Gabor滤波器对于车牌区域的纹理变化非常敏感, 可以很好的车牌检测中。
参考文献
[1]C.Anagnostopoulos, I.Anagnostopoulos, E.Kayafas, and V.Loumos, “A license plate recognition system for intelligent transportation system applications, ”IEEE Trans.Intell.Transp.Syst., vol.7, no.3, pp.378-379, Sep.2006.
[2]F.Martin, M.Garcia, and J.L.Alba, “New methods for automaticreading of VLP’s (Vehicle License Plates) , ”in Proc.IASTED Int.Conf.SPPRA, 2002.