Gabor小波函数

2024-08-27

Gabor小波函数(共6篇)

Gabor小波函数 篇1

目前,指纹增强方法采用Gabor滤波方法,Lin Hong等人[1]提出了一种基于Gabor滤波指纹增强算法,该方法同时考虑了指纹纹线的频率和方向,取得了比较好的效果。Lin Hong等人[2,3] 又将二维Gabor滤波分解为二次一维滤波,降低了计算量。Paul A M等人[4,5]使用结合小波变换和Gabor滤波的指纹增强算法,改进了指纹脊线结构的清晰程度和连续程度。

Gabor滤波器具有方向选择和频率选择的特性,采用Gabor滤波器不但能够去掉噪声,而且能把指纹的脊和谷的结构不失真地保留下来。但是二维Gabor滤波方法计算量大、运算复杂度高,直接使用很难满足实际工程的需要。为此利用二维卷积可分解为两次一维卷积的性质[3]对二维Gabor滤波进行分解,从而达到计算量下降的目的。基于Gabor函数的指纹图像增强,依赖于纹线方向的准确估计。指纹图像在局部区域内几乎所有像素点的方向是一致的,同时在小波域里仅对其低频系数图做纹线方向估计,因在小波分解后小波低频系数的分布与原指纹图像的像素分布非常相似。由此,提出了一种基于小波域的Gabor函数指纹增强算法。

1 小波变换

小波分析是一种窗口大小固定但其形状、时间窗和频率窗都可以改变的时频局部化分析方法。一幅大小为N×M像素的原始指纹图像用C0(i,j)0表示,对其进行标准的2 D-DWT(Discrete Wavelet Transform)分解

其中,hg分别代表低通和高通滤波器。p是小波分解的级数,可以看出,在每一级小波分解中,上一级分解得到的低通分量C0p再一次被分解成 4个尺寸相同的图像分量C0p+1,C1p+1,C2p+1,C3p+1,C0p+1是原始指纹图像的低分辨率图像,它代表了指纹图像水平和垂直方向的低频分量;C1p+1则表示了水平方向低频分量和垂直方向高频分量;C2p+1表示水平方向高频分量和垂直方向低频分量;C3p+1表示水平和垂直方向的高频分量。

小波基的选取非常重要,文中提出的算法仅考虑用低频图信息估计纹线方向。因此,需选择使高频图含有较少的信息量且具有紧致性的小波基dB7[5]。

指纹图像可被看作输入信号,用dB7小波将指纹图像进行一层小波分解得到1个低频图和3个高频图。

2 基于小波域的指纹图像增强算法

结合小波变换较强的去噪特性[4]和二维Gabor滤波分解算法处理时间较少[3]的优点,提出了一种基于Gabor滤波的小波域指纹增强算法,其流程共包括4个步骤:(1)规一化处理;(2)小波变换;(3)小波系数调整;(4)Gabor滤波和图像重构。

2.1 规一化处理

图像的规一化就是将原始指纹图像的灰度值的均值和方差调整到所期望的均值和方差。在原始灰度图像上,规格化按下式进行

式中,I(i,j)和N(i,j)分别为规格化前后点(i,j)处的指纹图像灰度值,M0和σ02是预先设定的图像灰度均值和方差(通常均取100),Mσ2为原始图像的灰度均值和方差。

2.2 小波变换

理论上,可在任意层数上对指纹图像进行小波分解。然而,太低的分辨率是不合适的。因为,指纹图像在小波分解的过程中进行了下采样,大量的下采样处理会减弱纹线的方向特性。所以,一般一层或两层小波分解是可取的,这样不仅保留了纹线的方向特性,而且提高了运算速度[4]。文中选取一层小波分解。

2.3 小波系数调整

规格化后的指纹图像经过一维小波分解后,可得到4个小波系数。纹线方向和频率都是指纹的固有结构信息,只有充分利用这些信息才能取得良好的增强效果。Gabor函数具有方向选择和频率选择的特性,采用Gabor函数不但能够去掉噪声,并能把指纹的脊线和谷线的结构不失真地保留下来。小波系数调整包括两个部分:(1)方向场和频率场估算;(2)图像分割。

2.3.1 方向场和频率场估算

方向场反映了指纹图像上纹线的方向。根据纹线方向在局部区域内基本一致的特点,先把低频子图分块,然后计算每一子块的纹线方向,最后用该方向代表对应子块内各个像素的方向。方法为:将小波分解后的低频子图分成16×16大小的互不重叠的子块。采用Sobel计算每个子块像素点(u,v)梯度值∂x(u,v)(沿水平方向)和∂y(u,v)(沿垂直方向),然后利用式(6)~式(8)估计中心在点(i,j)的子块的局部方向

其中,θ(i,j)为以像素点(i,j)为中心的子块的局部脊线方向;w为子块的边长。由于噪声、粘连、模糊以及断裂等原因,方向场中存在着方向突变块,指纹具有脊线方向变化平缓的特性,并且在一个小范围内具有相对稳定的变化趋势,采用高斯低通滤波器对指纹图像的方向场进行平滑处理,得到了相对平滑的方向场,记其为O

由于低频系数图和高频系数图间像素点是一一对应的,由低频图估计得到的各像素的方向可作为高频图对应像素的纹线方向[5]。

2.3.2 图像分割

利用指纹图像梯度特性[3]对4个子图分别进行图像分割,方法为:将小波变换后的图像分为w×w的子块,取w=16,再利用式(9)~式(10)进行计算

其中,∂x(u,v)、∂y(u,v)分别为子块像素沿X轴和Y轴方向的梯度值;Vx2(i,j)、Vy2(i,j)分别为式(6),式(7)的计算结果,分别计算各子块的R值,设定阈值R1,若R<R1,则当前子块为背景区域,并标识该区域掩码M(i,j)=0,反之为前景区域,并标识该区域掩码M(i,j)=1。

2.4 Gabor滤波和图像重构

偶对称的Gabor滤波器的一般形式如下

式中,。其中,θ是滤波器的方向;f0是脊线的频率;[xθ,yθ]为坐标轴[x,y]逆时针转角度θ,σxσy分别是沿着x轴和y轴的高斯包络标准偏差。实验中,取块大小为8×8,指纹图像小波分解后各纹线间的像素点的平均个数为5,则Gabor函数的频率f0=0.2。σxσy取值均为1.7时滤波效果理想。

利用上面设计的Gabor滤波器,对指纹图像进行滤波,即

其中,E(i,j)为滤波后的图像;N(i,j)为规格化图像;M(i,j)为区域掩码;w为Gabor滤波器的模板大小。

显然,式(12)计算量大、运算复杂度高,难以满足实际需要。为此利用二维卷积可分解为两次一维卷积的性质[3]对二维Gabor滤波进行分解,从而达到计算量下降的目的。

实现的具体步骤为:

(1)将小波变换后的4个子图分别进行计算,每个子图分成为M×M大小互不重叠的子块,以子块为中心对其进行扩展,扩展后子块大小为(M+N-1)2,其中N为一维滤波器的长度。

(2)将子块方向离散化为8个方向,分别为θ=0°,26.6°,45°,63.4°,90°,135°,153.4°,并根据子块方向和滤波器的长度确定两个一维滤波器的系数。

(3)垂直于脊线的方向对扩展子块进行一维带通滤波,并将滤波结果保存。

(4)沿脊线方向对步骤3的运算结果进行一维低通滤波,得到最终结果。

因此,低频子图的Gabor滤波,如图2所示。

指纹图像在小波分解过程中进行了下采样,低频子图为原始图像在下一尺度上的概貌,而高频子图分别体现了原始图像垂直方向、水平方向和沿对角线方向的细节信息,这些细节信息不仅包含了许多噪声,而且也具有大量的原始指纹图像信息,为了确保增强结果的准确、可靠,需对高频子图进行处理,采用同样的方法,对3个高频子图进行增强,增强沿纹线方向的细节信息,抑制其他方向的细节信息。对增强后的低频子图和3个高频子图进行小波重构,得到最终增强的指纹图像。

3 实验与结果分析

为了验证算法的实际性能,在指纹样本库上进行实验,后台数据库采用SQL Server 2000。指纹样本库中的图像,是由FPS200指纹采集仪[6]采集得到,实验图像大小为 256×300,分辨率为 500 dpi。样本库中的图像来自60根手指,每根手指采集3幅图像,共180幅指纹图像。

实验基于 Pentium 4(1.80 GHz)计算机,内存256 MB 的硬件环境,Visual C++6.0 编程语言的软件环境条件下。对180幅质量不同的指纹图像进行测试。结果表明,本算法快速有效,改进了指纹脊线结构的清晰程度和连续程度,具有较强的鲁棒性。选取两幅典型的低质量图像进行实验,实验结果,如图3所示。

图3(a)是来自干手指的指纹图像,图3(d)是来自湿手指的指纹图像,两幅指纹纹线均有明显的断裂。图3(c)中断裂区的纹线得到了有效的连接,其余部分滤波效果和图3(b)基本相同。图3(f)中粘连区的的脊线和谷线被合理地分离开了,同时也去掉了一定的噪声,其余部分滤波效果和图3(e)基本相同。

二维Gabor滤波分解算法和文中算法增强同一幅指纹图像,如图3(a)所示。平均用时结果,如表1所示。

s

文中提出的算法有两方面的优点:

(1)低频图的尺寸大小仅为原指纹图像的1/2,纹线方向的计算量会有所下降。处理过干指纹图3(a),二维 Gabor分解算法方向场时间为0.704 s, 而文中算法方向场时间为0.156 s,运算时间下降约77.8%。处理过湿指纹图3(d),二维 Gabor分解算法方向场时间为0.672 s,而本文算法方向场时间为0.172 s,运算时间下降约74.4%。同时,因为低频系数图较好地保留了原指纹图像的纹线方向和频率信息,且抑制了高频扰动对纹线方向和频率信息的影响。指纹过干或过湿的局部区域可看作是图像局部区域灰度的高频扰动。所以,在低频子图做纹线方向可有效抑制指纹过干或过湿的影响。(2)Gabor分离算法乘法运算次数明显小于二维Gabor算法的乘法次数。采用N×N的滤波器对M×M大小的图像块进行滤波,二维Gabor算法的乘法运算次数约为M2N2,而采用分离算法乘法运算次数会随角度的不同而略有不同。

4 结束语

现有的指纹增强算法是在空域里对图像进行Gabor滤波,文中提出了一个新的指纹增强算法,在小波域里对图像进行Gabor滤波,并将二维Gabor滤波分解为两次一维滤波。实验证明,该算法快速有效,并改进了指纹脊线结构的清晰程度和连续程度,但对部分低质量图像,该算法还存在不足,可考虑与别的算法结合使用。对于整个自动指纹识别系统而言,一种新的有效的指纹增强算法,可以明显提高后续指纹特征提取模块的准确性,并在最终的特征匹配模块中,快速地获得一个准确的身份验证效果。

参考文献

[1]Lin Hong,Jain AK,Pankanti S.Fingerprint Enhancement[C].Proceedings3rd IEEE Workshop on Application of Computer Vision,1996.

[2]Lin Hong,Wan Yifei,Jain A K.Fingerprint Image En-hancement:Algorithm and Performance Evaluation[J].IEEE Transactions on Pattern Analysis and Machine Intelli-gence,1998,20(8):777-789.

[3]夏振华,石玉,于盛林.基于Gabor滤波器的指纹图像增强[J].工程图学学报,2006(5):80-85.

[4]Paul A M,Lourde R M.A Study on Image Enhancement Techniques for Fingerprint Identification[C].Proceedings of the IEEE International Conference on Video and Signal Based Surveillance,2006.

[5]Wen Miaoli,Liang Yan,Pan Quan.A Gabor Filter Based Fingerprint Enhancement Algorithm in Wavelet Domain[C].Proceedings of the IEEE International Symposium on Communication and Information Technology,2005(2):1468-1471.

[6]贾珈,蔡莲红,董代洁.基于FPS200的指纹采集系统与图像增强机制[J].计算机工程,2005,31(15):148-150.

Gabor小波函数 篇2

人脸表情是人类进行情感交流的一种重要方式,从表情的变化中可以感知出人的情绪、感受、秉性和气质。自动人脸表情识别(FER)技术可以协助进行人脸识别、智能人机交互以及行为科学和医学研究等。因此,为了推动更加智能和自然的人机交互,人脸表情识别在过去几十年得到广泛研究,并且成为一个研究热点。到目前为止,针对人脸表情识别提出了许多的方法,其区别表现在以下3个方面:使用的数据(图像序列和静态图像)、特征提取方法和分类器。对于图像序列的表情识别目前主要是采用光流估计[1]的方法提取特征再进行7种表情识别,但也有用基于模型的方法。对于分类器,根据是否利用时间信息来分析可分为基于空间分析的方法和空时结合的方法两类。而对于特征提取,常用的方法有主元分析、线性判别分析、ICA等。但是这些经典的方法如主元分析,特别是在处理图像矩阵时总是先将矩阵转换为图像向量,大大增加了维数,致使实现起来非常耗时,且识别率也相对较低。

鉴于此,程剑、应自炉提出基于二维主分量分析的面部表情识别方法[2],这种直接采用二维主元分析方法的进行特征提取,比传统方法节省了很多时间,但这种方法受光照环境等干扰因素影响很大,提取出的特征误差较大,识别率较低。为了能够更有效地提取与表情变化有关的特征矢量且屏蔽光照对特征提取的影响,本文采用了Gabor小波变换从人脸图像上提取表情特征[3],对高维特征进行局部采样和2DPCA[4,5]降维进行特征选择,以最少的数据代替高维的原始特征,达到降低特征向量的目的,再用基于模糊积分[6,7]的分类器进行识别,取得了相对较高的识别率[8,9]。实验结果证明本文方法解决了文献[2]提出的基于二维主分量分析方法中表情特征提取效率不高的问题。

1 特征提取

表情特征提取结果的好坏直接影响系统的识别率,所以对于输入的一副图像我们要尽可能精确的提取与表情有关的特征,并最大程度的降低与表情特征无关的各种干扰,如光照,遮掩,变形及不同人的轮廓不一样等。对于这些因素,目前最流行而且效果比较好的特征提取方法是用小波变换来提取特征,当然首先要对图像先预处理,相对减少干扰。

1.1 表情图像的预处理

图像的预处理主要包括人脸的定位,表情图像子区域的分割以及表情图像灰度均衡化和几何归一化处理。预处理的好坏会影响表情特征提取的计算量和效果。

对于一副表情图像中,眼睛、眉和嘴等如果发生移位或遮掩等都会给准确定位带来困难。为了准确定位并进行几何归一化,本文以两个眼球的中心位置作为人的特征点,进行图像旋转,使两眼的中心位置的连线保持水平,然后以两眼中心位置的距离为基准,再按一定的比例裁减,得到表情最多的人脸区域,最后进行图像缩放处理,使各图的大小统一。这样就得到了大小统一且两眼位置对齐的表情图像。本文归一化后的图像大小均为128×128。

灰度均衡化是指对图像进行光照补偿等处理,目的是消除光照变换对提取特征的影响,尽管Gabor变换对光照是不敏感的,但灰度均衡化处理可优化特征的提取效果。灰度均衡化可表示为

其中:I=(x,y)、Ī(x,y)分别为均衡前后的灰度图像,σ0、µ0分别为均衡后的均值和方差,这样经处理后,所有图像都有相同的均值和方差。

经过上述预处理后,图像如图1所示。

1.2 Gabor小波滤波器

Gabor小波是由Gabor函数经过尺度伸缩和旋转生成的一族复函数系,具有良好的时频局部化特征和多分辨率特性,能够提取图像局部细微变化的能力,这个特点非常适合表情特征的提取。另外,Gabor小波对光照变化不敏感,具有良好的光照性。

对于图像进行的是二维Gabor变换,因此二维Gabor小波核函数的选取有不同的方法,本文选取的核函数如下:

其中:i为复数算子,σ为小波滤波器的宽度,本文取σ=2π,Z=(x,y)表示图像的坐标点,kj=kv(cosθ,sinθ)T,其中kv=2-(v+2)/2π,v不同的取值表示不同的核频率,θ的取值表示不同的方向。本文选取的v为0,1,2,3,4;θ的取值为0,π/6,2π/6,3π/6,4π/6,5π/6,这样由5个频率6个方向共30个函数组成Gabor小波族。图2是v取1时的6个不同方向的2维Gabor小波。

1.3 Gabor特征提取

在提取人脸表情特征时,一般采用在不同尺度和方向上的Gabor滤波器族组成[10,11],并根据表情的特点和神经生理学的结论来选择参数。通常大尺度可以描述全局性较强的信息,同时可以掩盖掉图像中噪声的影响,而小尺度可以描述比较精细的局部结构,但同时受噪声的影响也大。本文主要是对表情特征的选取,局部细节及纹理特性是最主要的,而这些特性都是属于高频部分。所以我们选取的尺度尽量要小,即上节选取的参数0,1,2,3,4。

在得到一组Gabor小波滤波器后,将输入的图像I与小波族的各个滤波器进行卷积:

得到滤波后的小波系数图如图3。

由于Gabor小波变换是通过对图像进行卷积实现的,而卷积是对图像上给定范围区域内的像素灰度值进行乘积、累加的结果。因此,得到的Gabor系数图的值不会像像素的灰度值那样随着位置的改变发生剧烈的变换,也就是Gabor小波变换具有对位置部敏感的性质。

本文是5个尺度6个方向的小波函数,这样每一幅图像变换后得到30个Gabor小波系数图,由于预处理后的图像是128×128维的,提取后的特征维数则变为128×128×5×6,显然远远高于本来的图像的维数。要想直接利用这些特征分类那是不可能的,需要进行降维处理。

2 特征降维

如前所述,特征提取时实验所用的训练和测试样本的分辨力都是128 pixels×128 pixels,经过Gabor变换后如果直接进行分类,往往容易陷入“维数灾难”使得问题变得实际上不可实现。为此本文采用二次降维的方法进行特征提取。由于Gabor特征在相邻像素间是高度相关和信息冗余的,所以只要提取部分特征就足够了,因此首先对特征空间进行降维是有必要的,然后再利用2DPCA进行降维。

2.1 特征采样

对于高维特征的采样,本文采用的是密集与稀疏结合的方法,不同于以往的规则均匀采用。有规则的采样是对系数图的相邻间隔提取各个滤波器的输出值,然后联合起来作为图像的特征向量,这种降维是以识别率来换取识别速度,这样不利于识别效果。本文采用的是密集与稀疏一起的方法采样,也就是对表情细节多的区域采集的特征多一点,比如在眼睛、嘴巴等部位,但在脸上区域,由于表情信息相对较少,故采用稀疏采集,实验证明在采集相同个数的特征点时,本文这种方法较好。本文对于眼部提取35个特征点,对嘴提取25个特征点,在鼻子周围提取的是12个稀疏的特征点,这样采用得到的特征是72×30维,显然比小波系数图要小很多,但对于识别还需要进一步的降维。

2.2 二维主元分析

通常二维主元分析(2DPCA)主要用于面部表情的提取,其原理是利用矢量子空间,消除数据间的冗余,以最少的数据来描述原始信息,实现降维的目的。相比与PCA,2DPCA是直接由矩阵构造训练样本的总体离散布矩阵(协方差),然后计算其特征值和特征向量。

设采样后矩阵的分辨力为m×n,则第i个训练样本表示为m×n的矩阵Ai(i=1,2,…,M),M是训练样本的个数,训练样本的均值表示为

则训练样本的总体散布矩阵可用下面的公式进行估:

然后计算Gt的特征值和特征向量,一般选取前k个较大的特征值(λ1≥λ2≥…≥λk)所对应的特征向量(ξ1,ξ2,…,ξk)作为最佳投影轴。即:

则样本系数矩阵Ai的特征矩阵Yi∈Rm×k可表示为:

由于经典的PCA在降维时都是将数据矩阵先转换成数据向量之后再进行K-L变换的,这样会使向量空间的维数很大,若是训练样本太少的话,很难计算出正确的协方差矩阵。而2DPCA是直接基于矩阵的,可以很容易地正确计算出协方差矩阵。由于维数小,计算协方差的特征值和相应的特征向量所需的时间也较少。这样就可以均衡Gabor变换所消耗的时间。

3 基于模糊积分的多分类器联合

模糊积分是由Sufeno提出的,是目前一种有效的信息融合方法。就是在模式识别[4,5]中,把多个分类器的输出信息联合起来进行分类决策。设C={c 1,c2,......,cn}是n个目标类别组成的集合,X={x 1,x2,......,xm}是m个分类器组成。zk是第k个被识别对象。样本zk经过各分类器识别后,可以得到一个矩阵,也就是决策样板中的决策剖面,这里将其记为D(zk):

其中:每个行向量hi=(hi1k,hi2k,……,hink),(i=1,2,…,m)是某个分类器xi对样本zk的相对于各类别的识别结果,我们称之为分类器xi的输出向量;每个列向量hj=(h1jk,h2jk,……,hmjk),(j=1,2,...,n)表示相对某个类别cj,各分类器对样本zk的识别结果,我们称之为类别cj的融合向量。下面给出一种融合模型如图4所示,本文的模糊密度取各分类器的平均识别率。

实现基于模糊积分的多分类器联合的具体算法如下:

1)确定模糊密度gi,i=1,2,…,m;

2)构造模糊测度:λ+1=∏i=1m(1+λgi),即通过模糊密度确定参数λ,进而确定模糊测度;

3)对于各分类器输出的cj,按从大到小重新排列hj=(h1jk,h2jk,……,hmjk),使得前一项总是大于后项,同时也要重新排列相应的模糊密度;

4)计算模糊测度,令g(1)=g1,则g(t)=gt+(1+λgt)g(t-1),t=2,…,m。

5)计算模糊积分,µj=max{min(g(t),hj)},j=1,2,…,n;

6)比较积分值的大小,取最大的j为待识别对象的类别。

在本文中,取m=3,n=7,即3个分类器,7种表情类别,分别是生气、厌恶、恐惧、高兴、中性、悲伤、惊讶。由于最近邻和欧氏距离输出的结果是测试样本到类样本的距离,为了将距离转换置信度,采用下面的公式:输出为1/[1+d(x)],其中d(x)是测试样本X到类表情的距离。而余弦距离的输出可直接看成是置信度。本文的模糊密度分别取各分类器的平均识别率,即各分类器的重要程度。

4 实验结果及分析

本文选用JAFFE日本成年女性人脸表情数据库进行实验。该数据由10个人的213幅图像组成,每个人展示生气、厌恶、害怕、开心、悲伤、惊奇和中性7种基本表情各2~4幅图像,均为256×256的8位灰度图像。实验中取每人每种表情各一幅图像共70幅图像作为训练样本,其余143幅图像作为测试样本。实验环境是以MATLAB7为工具,在Microsoft Windows XP系统下硬件为Pentium(R)4 CPU 2.40GHz,256M内存条件下完成。虽然整个算法复杂度较大,但模块功能清晰,结构复杂度不高,识别系统能接受。

实验采用了目前在细节提取中比较常用的Gabor小波算法。在实验特征提取中,不同投影轴得到不同的识别率,对于采样后的Gabor系数用2DPCA提取特征时取3~4个最大特征值对应的特征向量便能达到较好的效果,但不是越大越好,一般取2~8个,本实验中取5个时达到最大识别效果。对于仅采用2DPCA算法的特征向量取4个时识别率最佳。然后对Gabor和2DPCA提取的特征分别做融合处理,基于各分类器融合的平均识别率和所用时间分别如表1和表2所示,2DPCA对应参数λ=-0.989 7,Gabor提取参数λ=-0.994 5。本文算法的分类结果为欧式距离、最近邻法、余弦距离三种分类器融合后的输出,即模糊积分法,表1中可以看到采用2DPCA特征提取时模糊积分的输出识别率为89.3%,而本文算法时模糊积分的输出识别率为92.0%。另外,为了突出模糊积分的优势,在表1中特显示了分别采用单个分类器时的输出作为对比,结果显示在相同特征提取方式下单个分类器的识别率明显低于模糊积分识别率,表明模糊积分能更有效的用于识别分类。

由实验结果可知,对于高维的Gabor系数采用2DPCA提取特征在识别率上明显高于仅用二维PCA算法的特征提取,表明本文算法能最大程度克服光照及脸型等噪声影响,更有效地提取与表情相关的特征矢量。另外由表1可以看出采用模糊积分法比单一分类器的识别率更高,但是在运行时间上采用Gabor提取特征比2DPCA算法耗时,这也是提高识别率的代价,但相对于传统的特征提取该算法是相当节省时间的。

实验中传统的基于PCA的Gabor特征提取算法消耗总时间为30.7 s,平均识别率仅为84.2%,因此相对于采用传统的PCA或DCT等特征提取来说,基于2DPCA的Gabor小波变换(识别率92%,时间1.948 s)在特征提取上是更有效的,它不但在识别率上有很大提高,而且在运算时间上也有很大改进。但是,实验中不管采用那种方法,厌恶、恐惧、悲伤的识别率不高,难度比较大,主要是由于用Gabor变换后的这两种表情的特征不显著引起,但表情中性的识别率都是相对最高的,惊讶与高兴也有比较好的识别率。

5 结论

本文利用对表情特征及纹理性质有较好表征能力的Gabor小波变换,对于小波系数图的高度相关性和冗余度采用先采样降维再利用2DPCA的方法进行再次降维,最后用直观简单的最近邻法进行分类,实验结果表明,与对图像数据采用2DPCA算法相比,该方法能够更加有效的提取与表情变化有关的特征,并且能够最大程度上克服噪声的干扰,解决了提取表情特征时精确度不高且耗时相对较大的缺点。但不足的地方是虽然用了2DPCA降维,但还是不能满足实时性的要求,并且本文主要是识别单个表情,但实际生活中往往是2个或2个以上表情在同一时刻在同一张脸上展示,比如恐惧跟厌恶等。另一个问题是,如果一个人是比较夸张的表情,这样的识别效果会相对要好些,对于不太明显的表情很容易识别错误,这些都是需要下一步改进的地方。

摘要:提出通过提取人脸表情图像的Gabor特征,结合二次降维的方法,进行人脸表情识别。针对Gabor特征提取后维数变高,冗余很大的特点,先对高维特征进行采样,再引入二维PCA算法对Gabor特征进行选择,以达到降维的目的。然后采用基于模糊积分的多分类器联合的方法对7种表情进行融合识别。在JAFFE库上进行测试的结果验证了该算法的有效性,与2DPCA算法及传统特征提取算法相比,本文算法取得了较高的识别速度和精确度。该算法能更有效的提取反映表情状态的特征。

关键词:表情识别,Gabor小波变换,模糊积分,多分类器融合

参考文献

[1]James Jenn-jier Lien,Tako Kanade,Jeffrey F,et al.Detection,Tracking,and Classification of Action Units in Facial Expression[J].Robotics and Autonomous Systems(S0921-8890),2000,31:131-146.

[2]程剑,应自炉.基于二维主分量分析的面部表情识别[J].计算机工程与应用,2006,31(5):32-39.CHENG Jian,YING Zi-lu.Facial Expression Recognition Based on2DPCA[J].Computer Engineering and Applications,2006,31(5):32-39.

[3]章品正,王征,赵宏玉.面部表情特征抽取的研究进展[J].计算机工程与应用,2006,38(9):38-42.ZHANG Pin-zheng,WANG Zheng,ZHAO Hong-yu.Research Advances of Facial Expression Feature Extraction[J].Computer Engineering and Applications,2006,38(9):38-42.

[4]Chen Queen,Huang Thomas.Facial Expression Recognition:A Clustering-based Approach[J].Pattern Recognition Letters(S0167-8655),2003,24:1295-1302.

[5]Havran C,Hupet L,Czyz J,et al.Independent Component Analysis for Face Authentication[C]//KES’2002Proceedings of Knowledge-Based Intelligent Information and Engineering Systems,Crema,Italy,Sept16-18,2002:1207-1211.

[6]Sugeno M.Fuzzy Measures and Fuzzy Integrals:A Survey[J].Fuzzy Automata and Decision Processes,1977,78(33):89-102.

[7]Keller J M,Gader P.Advances in Fuzzy Integration for Pattern Recognition[J].Fuzzy Sets and Systems(S0165-0114),1994,65:273-283.

[8]Fasel B,Luettin.Automatic Facial Expression Analysis:A Survey[J].Pattern Recognition(S0031-3203),2003,36(1):259-275.

[9]Jian Yang,Zhang D,Frangi A F,et al.Two-Dimensional PCA:A New Approach to Appearance-based Face Representation and Recognition[J].IEEE Transaction on Pattern Analysis and Machine Intelligence(S0162-8828),2004,26(1):131-137.

[10]Wen Z,Huang T.Capturing Subtle Facial Motion in3D Face Tracking[C]//Proceedings of IEEE Intenational Conference on Computer Vision,Nice,France,Oct13-16,2003,2:1343-1350.

Gabor小波函数 篇3

关键词:超声衍射时差法,Gabor小波,Fisher,线性判别分析,主成分分析技术

0 引言

超声衍射时差法 (TOFD) 检测技术是在1977年, 由Silk根据超声波衍射现象提出来, 是一种适合于中厚度焊缝中缺陷的无损检测方法[1,2,3], 与常规脉冲回波超声相比有可靠性好、定量精度高且可记录等优点, 因此该方法在无损检测领域得到了广泛的运用。但TOFD检测对缺陷定性取决于检测人员的数据分析经验、所掌握的焊接知识和对生产情况、设备运行状况的了解等相关经验知识, 人为因素 (检测人员的经验、知识水平和疲劳程度) 对缺陷定性的结果影响较大, 常出现错判、漏判, 前后不一致等情况, 降低了缺陷定性的可靠性。如何实现TOFD数据的自动处理识别, 提高检测准确度和检测的自动化程度, 是目前国内外无损检测领域的一个研究热点, 有着非常广阔的商业运用前景。Kechida等[4]采用小波分析和图像纹理分析技术提取纹理特征, 采用模糊C均值聚类器对TOFD超声图像进行分析, 实现对3种焊缝缺陷类型的位置和大小自动检测。Elineudo P.Moura等[5]采用了连续小波变换和神经网络相结合的方法实现了未熔合、未焊透和夹渣3种缺陷的自动分类。

C Shekhar等[6]还采用了人工神经网络、模糊规则、模糊神经网络3种不同的方法构建缺陷类别识别器, 实验结果表明, 采用模糊神经网络效果最佳。我国对TOFD超声检测技术应用比较晚, 研究工作主要集中在超声图像的去噪重构上, 如彭伟等[7]采用经验模态分解方法对TOFD检测回波进行重构, 从而提高降低原始TOFD的噪声干扰;迟大钊等[8]提出一种灰度极值检测与合成孔径聚焦相合的D扫描图像增强算法, 有效增强了检测目标, 然后采用二维信息熵局部阈值分割的方法对TOFD图像进行二值化处理, 从而实现自动提取出缺陷的位置。

本研究提出一种TOFD图像缺陷自动定性的方法, 首先提取TOFD缺陷图像的Gabor小波特征, 并依据这些特征, 采用主成分分析技术对Gabor特征进行降维, 然后采用Fisher线性判别分析方法对其进行判别分析, 最后完成缺陷的自动定性分析, 建立一个实际系统并在测试样本上进行试验验证。

1 TOFD图像典型缺陷定性图谱分析

在实际拼板对接焊缝检测中, 主要存在以下缺陷:裂纹、未融合、气孔、夹渣等[9]。它们的TOFD图像如图1所示。

由图1可知:

(1) 对于气孔缺陷, 在TOFD显示图上, 缺陷形状为近似的圆球状, 边缘比较清晰, 但亮度并不高;

(2) 对于夹渣缺陷, TOFD显示图上, 缺陷形状往往很不规则, 边缘不大清晰, 总体亮度并不高, 与底色反差不大, 但在个别很小的部位会出现亮度比较高的点;

(3) 对于裂纹缺陷, TOFD显示图上, 缺陷形状为条状, 大部分情况下有一定弯曲并与焊道方向成一定角度, 边缘清晰, 而且亮度比较高, 与底色反差比较大;

(4) 对于未融合缺陷, 在TOFD显示图上, 缺陷形状为条状, 缺陷有一定的高度, 出现上下两个端点, 下端点的相位与上端点的相反, 上端点的相位与底面回波的相位是相同的。有时会断断续续地出现, 大部分情况下比较平直并与焊道方向平行, 边缘清晰, 而且亮度比较高, 与底色反差比较大。

由此可见, TOFD图像各种典型缺陷的图像表征各不相同, 这使得自动定性分析成为可能。

2 缺陷自动定性分析算法构建

2.1 基于Gabor小波的TOFD缺陷特征提取

图像特征提取是图像识别的关键步骤, 图像特征提取的效果如何直接决定着图像识别的效果, 如何从原始图像中提取具有较强表示能力的图像特征是智能图像处理的一个研究热点。近年来, 二维Gabor小波变换成为图像的多尺度表示和分析的有力工具, 这主要是因为Gabor变换所采用的核 (Kernels) 与哺乳动物视觉皮层简单细胞二维感受野剖面 (Profile) 非常相似, 具有优良的空间局部性和方向选择性, 能够捕捉图像局部区域内多个方向的空间频率 (尺度) 和局部性结构特征。这样, Gabor变换可以看作一个对方向和尺度敏感的有方向性的显微镜[10]。同时, 二维Gabor小波变换对图像的边缘特征有较强的响应。二维Gabor小波变换的这些响应特性十分有利于TOFD缺陷图像局部特征的鲁棒表示。

二维Gabor小波变换是用一组滤波器函数与给定信号的卷积来逼近一个信号。二维Gabor滤波器的函数是一个复函数, 其实部和虚部分别可以表示为:

二维Gabor小波变换描述了图像I (x) 上给定一点x附近区域的灰度特征, 这可以用一个卷积来定义:

实际运算时, 该卷积过程必须既要在空间域内 (图像位置, 比如逐像素) 进行采样, 也要对小波函数即频域 (由k控制的高斯窗宽、振荡的方向和波长) 进行采样。小波函数采样最常用的采样方法是令:

其中:

式中:f—一个限定频域中核函数距离的间隔因子, 通常取

最终的采样则通过设定5个不同的尺度ν∈{0, 1, 2, 3, 4}和8个不同的方向μ∈{0, 1, 2, 3, 4, 5, 6, 7}来完成, 另外两个参数的取值通常为σ=2π, kmax=π/2。具体参见文献[11], 本研究不再赘述。

通过上述方法在每个图像位置计算得到的40个幅值特征反映了以该图像位置为中心的局部区域频域内的能量分布特征, 这40个幅值特征级联起来通常被称为一个Jet[10], 简写为J, 即图像位置p (x, y) 处的Jet为:Jp (x, y) = (J00, p (x, y) , J10, p (x, y) , ..., J40, p (x, y) , J01, p (x, y) , J11, p (x, y) , ..., J47, p (x, y) ) (6)

进一步将所有像素位置的Jet级联起来, 就得到了输入图像I的Gabor特征表示:

2.2 基于Gabor特征的子空间判别分析

当在每一像素位置提取的Gabor特征个数为40时 (8个方向、5个频率) , Gabor特征的维数是原始图像维数的40倍。为了解决Gabor特征维数过高的问题, 一种简单而有效的方法是均匀分布稀疏采样, 对TOFD图像上每个采样像素点提取Gabor特征, 形成Gabor特征表示, 然后进一步进行特征提取和分类。假如对一幅100×100大小的TOFD缺陷图像, 按5个像素间隔进行采样, 将得到19×19×40=14 440维的Gabor特征。这比原始Gabor特征空间维数 (100×100×40=400 000) 已经有了很大的降低, 但对于分类器设计而言, 仍然是高维的, 容易带来维数灾难问题。

因此, 本研究进一步尝试了对Gabor特征进行最优的线性判别分析的方法:即首先采用主成分分析技术对Gabor特征进行降维, 然后采用Fisher线性判别分析方法对其进行判别分析。

该算法基本思想:把所有的训练集中的图像先提取Gabor小波特征并组成数据矩阵, 然后投影到一个大小是P×P的正交基上 (P为所有的训练图像的个数, 正交基可以通过PCA训练得到) 。这个投影产生了一个维数小的多的满秩矩阵 (因为训练图像个数一般小于图像的维数) , 节省了后面计算LDA的时间。由PCA的思想可知, 这个投影保留了原始图像矩阵的足够信息, 因此不会影响LDA的计算精度。

子空间分析的计算过程如下:

(1) 给定一个图像训练集X, 先将图像进行分类, 将属于同一类的图像归为一类, 记为Xi;

(2) 计算平均值。计算每一类的类内平均图像 (mi) 和所有训练图像的总体平均图像 (mi) ;

(3) 中心化类内的图像。每个类内的图像减去自己类内的平均图像, 得到每个类的差:∀x∈Xi, Xi∈X,

(4) 中心化类间的平均图像。每一个类内平均图像减去总体平均图像, 即:m̂i=mi-m;

(5) 创建数据矩阵。把所有的图像按次序排列成一个数据矩阵;

(6) 求解数据矩阵的正交向量。可以通过奇异值分解或者求解数据矩阵的协方差矩阵的办法得到正交基, 也就是采用PCA方法得到一个子空间, 记为Wpca;

(7) 投影所有的中心化的图像到子空间, 得到图像在子空间上的投影向量:

(8) 投影所有的中心化后类内的平均图像到子空间, 即:

(9) 计算类内散布矩阵。第ith类的一个散布矩阵Si就是这个中心化的图像在子空间投影的协方差矩阵, 而类内的散布矩阵SW就是所有图像类的散布矩阵之和 (其中, C为图像类的个数) ;

(10) 计算类间散布矩阵。类间散布矩阵SB是所有类内平均图像在子空间投影的加权协方差矩阵之和, 权值是每一类的图像个数 (其中, Ni是类内的个数) ;

(11) 求解广义的特征值。求解类内散布矩阵SW和类间散布矩阵SB的广义特征值V和特征向量

(12) 保留前C-1个特征向量。按照特征值的大小对特征向量进行从大到小排序, 保留最大的前C-1个特征向量, 组合成最佳分类空间Wfld;

(13) 组合PAC和LDA方法得到的投影子空间Wpca和Wfld, 得到最优的投影子空间WTopt=WTfldWTpca。

在得到最优的子空间之后, 就可以用这个子空间进行TOFD缺陷图像的降维和分类识别了。识别的时候, 把TOFD缺陷图像减去总体平均TOFD缺陷图像, 然后投影到最优的TOFD缺陷子空间:

由式 (8) , 得到的TOFD缺陷图像在子空间的投影z, 是一个C-1维的向量, 然后对这个向量运用各种距离准则进行缺陷定性分析。

2.3 相似度准则及分类准则

按照本研究的方法, TOFD缺陷图像的特征提取后将生成特征向量, 这样TOFD缺陷特征匹配问题就转换成采用一定的距离准则来衡量两张TOFD缺陷图像的相似度问题 (待分类图像与标准缺陷图像之间的相似度) 。本研究采用了协方差距离 (Covariance Distance) 作为相似度准则, 其定义如下:

式中:X, Y—要比较的两张TOFD缺陷图像的特征向量。

本研究采用最邻近决策规则作为分类准则。

3 实验结果

3.1 测试数据集

由人工试块缺陷和自然缺陷采集到TOFD图像134幅 (包括42个裂纹、34个未熔合、37个气孔、21个夹渣) , 标准化图像使其大小为50×50, 将它们组成一个矩阵X, 矩阵维数为134×2 500。对矩阵X标准化, 得到矩阵T, 维数与X相同。使用其中的109幅作为训练样本, 另外25幅 (包括7个裂纹、6个未熔合、7个气孔、5个夹渣) 作为测试样本。

3.2 实验结果

为了验证Gabor小波在识别中的作用, 本研究采用了两种图像特征:一种是原始图像特征 (未经处理直接用于训练的缺陷特征) , 另一种为Gabor小波特征。然后分别采用子空间判别分析法构建缺陷分类器, 并在相同的测试样本上进行测试, 测试结果如表1所示。

由表1可知, 采用Gabor小波特征所构建的缺陷分类器的各种缺陷的识别正确率会高于采用原始图像像素特征, 从而实现缺陷的有效分类。

3.3 实验结果分析

Gabor函数可以在频域不同尺度、不同方向上提取相关的特征, 所以非常适于作为焊缝各种缺陷的特征描述。本次实验中4种不同缺陷的5个尺度, 8个方向 (每行是同一尺度, 每列是同一方向) 的Gabor特征能量图谱如图2~5所示。

从图2中可以看出, 小尺度的Gabor特征突出了夹渣缺陷个别很小的部位会出现亮度比较高的点这一特性;

从图3中可以看出, 不同方向的Gabor滤波器增强了裂纹缺陷呈多个抛物线形状的这一特性;

从图4中可以看出, 气孔的缺陷形状为近似的圆球状这一特性经过Gabor滤波器同样得到增强。

从图5中可以看出, 未融合缺陷的条状特征可大尺度的Gabor滤波器作用下得到增强;

从以上分析可得:当滤波器方向与图中纹理方向越吻合时, 输出图像的能量越大, 这也证实了Gabor滤波器的性质。因此, 采用Gabor小波特征所构建的缺陷分类器的各种缺陷的识别正确率高于采用原始图像像素特征, 这与实验结果相符。

4 TOFD图像缺陷自动检测及定性系统开发

根据上述的算法, 本研究开发实现了TOFD图像缺陷自动检测及定性系统。系统采用Visual C++2008软件作为开发平台。该应用系统主要由TOFD图像输入模块、缺陷检测模块、缺陷分类模块等3个部分组成, 可实现数据读入、缺陷特征提取和缺陷智能定性分类等功能。

系统的缺陷自动分类示例如图6所示。

5 结束语

本研究提出了一种利用Gabor小波特征进行TOFD缺陷图像特征描述, 并采用子空间判别分析的方法。该方法可实现TOFD缺陷图像的自动定性分析。使用该算法和最邻近决策规则作为分类准则构建了一个应用系统, 并对一个TOFD图像数据库进行了识别比较实验和分析, 得到了较高的分类正确率。

由实验结果和理论分析可知, 该基于Gabor小波特征的缺陷识别方法准确有效, 适用于TOFD的智能分类识别。

参考文献

[1]KECHIDA A, DRAI R, GUESSOUM A.Texture analysis for flaw detection in ultrasonic images[J].Journal of Nondestructive Evaluation, 2012, 31 (2) :108-116.

[2]盛朝阳, 刚铁, 迟大钊.基于分水岭方法的超声TOFD检测图像分割[J].机械工程学报, 2011, 47 (8) :35-40.

[3]林乃昌.基于变型波的超声TOFD近表面检测新方法[J].机电工程, 2013, 30 (8) :967-970.

[4]KECHIDA A, DRAI R.BENAMMAR A.Image Processing and Wavelets Transform for Sizing of Weld Defects using Ultrasonic TOFD images[C].Acoustics 08 Paris:609-614.

[5]MOURA E P, SILVA R R, SIQUEIRA M H S, et al.Pattern recognition of weld defects in preprocessed tofd signals using linear classifiers[J].Journal of Nondestructive Evaluation, 2004, 23 (4) :163-172.

[6]SHITOLE C N, ZAHRAN O, AL-NUAIMY W.Combining fuzzy logic and neural networks in classification of weld defects using ultrasonic time-of-flight diffraction[J].Insight, 2007 (49) :79-82.

[7]彭伟, 卢超, 徐薇.超声TOFD检测回波信号的时间识别[J].无损探伤, 2008, 32 (6) :5-8.

[8]迟大钊.基于超声TOFD法的焊缝缺陷表征研究[D].哈尔滨:哈尔滨工业大学材料科学与工程学院, 2007.

[9]盛朝阳.超声TOFD检测信号采集及缺陷识别方法[D].哈尔滨:哈尔滨工业大学材料科学与工程学院, 2007.

[10]LEE T S.Image representation using 2d gabor wavelets[J].IEEE Trans.Pattern Analysis and Machine Intelligence, 1996, 18 (10) :959-971.

Gabor小波函数 篇4

当前已经有了很多目标识别方法,这些方法一般分为两类: 提取特征和构建分类器。提取特征主要是从大量的训练样本中提取目标和非目标的特征,用这些特征训练分类器。在测试中,该分类器在整个输入图像中寻找特定对象模式。这种方法在许多检测不同对象过程中非常有效,例如人脸识别[3]和车牌识别[4]。关于检测特征的方法可以区分为全局特征和局部特性。局部特征和全局特征的区别在于,全局特征是对整个图像操作,而局部特征是针对图像的一块区域操作。众所周知的全局特征提取方法是主成分分析( PCA) 法,其缺点在于如果检测目标在外观、姿势和照明条件上有很大的变化,提取不出有意义的特征。另一方面,局部特征方法由于提取的特征针对图像的部分区域,对这些问题更不敏感。局部特征提取的常用方法有小波系数[3]、梯度方向[5]和区域协方差[6]。局部特征的方法是对人身体各部分进行检测,然后对各部分的结果进行融合,再用分类器完成对目标的检测。局部特征检测的优势是可以处理由于身体关节引起的目标不同的外形。然而,这种方法增加了目标检测过程的复杂性[7]。文献[8]对几种目标检测方法的性能通过分类器接收操作特性( Receiver Operating Characteristic,ROC) 检测其性能和效率。检测的方法包括PCA、局部接收场( LRF) 特征[9]、Haar小波的不同特性训练神经网络、支持向量机[10]和k - NN( 神经网路分类器) ,得到的结论是SVM与LRF特征结合的方法性能最好。同时也可以看到基于全局特征的检测器性能大于局部特征检测器。这可能是由于目标外形有太多变化,像PCA的全局特征能更好地为目标建立稳定的模型。近几年方向梯度直方图( HOG) 特征在目标检测中的应用使目标检测技术有了很大进步,HOG算子成功之处在于它采用了梯度的统计信息描述目标的局部轮廓。文献[5]中用HOG算子表示一个位置上用固定大小的目标块,块大小固定化是为了降低计算量; 在此基础上提出了很多改进的方法,如文献[7],考虑到固定大小的HOG块漏掉了全局线索,因此它采用了可变大小的( VHOG) 块,以不同大小的块获得更多的信息,并用线性SVM形成弱分类器,然后用级联Adaboost机制识别目标,从结果中可以看到这种方法比原始的HOG方法性能好。

本文在文献[5]和文献[7]方法的基础上,结合HOG特征,提出一种基于GHOG与realboosting方法结合的目标识别方法。Gabor小波强调图像在同一频率的特征成分,辨别局部目标和提取尺度、旋转、变换、光照变化不变的局部特征[11]。特别适合急剧变化的目标,比如视频监控中移动的目标。因此,Gabor小波从局部区域捕获信息,并且将不同方向、频率和尺度的相应滤波信息进行结合,用来表示复杂的目标[12]。这样,由于包含了几个Gabor图像,每个滤波有好几个Gabor图像,能维护和增强目标的整体信息。这种丰富会反映在HOG特征提取方法中,本文中的Gabor特征的融合能增强图像中的相关信息,并降低其他信息的影响,排除干扰和影响分类性能的混乱数据。Gabor预处理后,相关的目标信息被增强,不相关的信息和数据被排除,提高了HOG算法的全局性能。

1 GHOG特征提取

1. 1 Gabor小波变换

Gabor小波变换是被Gabor提出使用在1D的信号分解,是时频域分析在时域和频域最优化的决策。由于它的形状类似于视觉皮层简单细胞的可接收场,从数学上讲它在测量局部空间频率上Gabor小波是最佳的; 在模式识别中Gabor小波能产生畸变宽容特征空间,广泛引用在纹理分割、字符识别、指纹识别领域中。

在空间域,2D Gabor小波可以看作是被正弦平面波调制的一个高斯核。Gabor小波函数的定义为 ψ( ku,v,r)

式中: r = ( x,y) ; ‖·‖ 表示范数运算; ku,v= kveiφu,kv= kmax/ fv; φu= πu /8 ; f为核函数在一个限定域中的间隔因子; 在介于4 到16 像素中,u和v分别表示Gabor滤波器的方向和尺度。用Gabor滤波函数对目标图像的滤波,可以通过与图像的卷积来实现。

式中: I( z) 表示目标的灰度图像z = ( x,y) ; * 表示卷积运算。在运算中卷积除了在空间范围内逐个像素进行,还要在频域中按高斯窗口宽度、振荡方向、波长进行。

为了在实际采样过程中较全面地得到细节纹理,需要均衡v,u或kv,Q'u取值,即尽量在不同的尺度和方向上均匀取值。在[0,π]范围几乎覆盖采样所需的所有方向空间,因此,u或Qu可以在该范围内连续取值。当然,方向选取越多,得到的纹理信息越接近实际,但是同时会使采样获得的特征维数增多,运算复杂度加大; 所以本文采用均匀离散采样的方法,使每个方向上都有采样点。这样通过5 个尺度( v ∈ { 0,1,2,3,4} ) 、8 个方向( 0 ~ 7π/8)进行采样,u ∈ { 0,1,2,3,4,5,6,7} 。

1. 2 Gabor特征融合图像

从图1 中可以看出,5 个尺度、8 个方向会生成40 幅Gabor特征图像,如果直接用HOG方法提取特征会使接下来的分类过程计算量和内存成本大大提高,为了使目标识别系统更加有效但又不丢失其特征,需要对Gabor特征进行融合。

1) 方向融合

本文首先采用文献[13]提出的全局编码的形式,对Gabor特征在同一尺度的多个方向上的特征进行编码,这样能有效降低Gabor特征的维数,又能保证方向特征信息不丢失。

根据QBC,对于每个像素的5 个尺度、8 个方向的Gabor特征,可以对每个像素进行编码。针对每个像素在给定尺度时根据不同的方向上的Gabor特征的实部和虚部进行编码。GCv( z) 表示为像素z在尺度v的编码。GCvRe( z) 与GCvlm( z) 分别表示Gabor的实部和虚部编码,i = 7 表示从0 ~ 7 的8 个方向。编码完成后,实部和虚部都是8 个二进制位表示,其表示的十进制数字的范围为[0,255]。

编码之后每个像素可以用8 位二进制数表示,刚好符合灰度图像像素的表示范围,对编码之后的图像提取( 如图1) 后发现,纹理比较丰富。

2) 尺度融合

融和后的图像还有5 个尺度上的特征,从图1 可以看出,融和后的图像在5 个尺度上纹理比较相似,由此可见存在一定的数据冗余,为了让融合后的图像简单、有效地展现其Gabor特征,又能保证其特征信息不丢失,可以对其5 个尺度继续进行融合。

在方向融合的过程中发现,每个像素都可以由一个类似灰度的编码表示。为了保证5 个尺度上编码信息不丢失,采用对每个像素编码的十进制数求均值的方法,这样既能兼顾每个尺度上信息,又能降低数据的维数,降低计算量。公式为

从图1 可以看到,尺度融合后的图像能从整体上显示出人的轮和纹理,剔除了由于阴影、姿态等造成的干扰。由此可见,Gabor特征的融和图像能够鉴别出目标的纹理特征,另外,由于HOG对于纹理图像特征的检测效率较高,因此Gabor特征图像进行直方图特征提取。

1. 3 HOG特征提取和分类

在实际中,为了提高HOG方法检测的精度,在单元格内计算时采用了重叠单元的归一的方法,通过归一化能有效提高检测结果的稳定性。本文在此输入的图像是Gabor特征图像,其本身纹理和轮廓就比较明显,为了更清晰地提取目标的纹理和轮廓信息,对此采用HOG的方法提取目标特征。

为了对检测到的Gabor图像中颜色的变化和反差进行定位,需要计算每个像素的梯度,用2 个一维的简单算子,水平方向采用[-1,0,1],垂直方向用[-1,0,1]T。在计算方向直方图的过程中,需要2 × 2 的单元,每个单元9个方向通道,每个窗口中会有一个包含36 个特征的向量。这样,每幅图像一共有21 × 36 = 756 个特征。根据文献[5]中对于块的归一化问题采用L2Hys的方法,设v为块向量,对其标准化后的Vnorm为

式中: ξ 为一个近似为0 的正数; ‖·‖2为二范数,根据块的空间位置其向量按顺序排列,这样就形成了GHOG统计特征。

考虑到GHOG特征的维数偏大,训练样本的数目也非常大。传统的神经网络分类方法,其学习时间过长,如果用其来构造目标识别的分类器学习时间超过1 h; 虽然SVM方法需要的学习时间比较短,但是在检测过程中花费的时间较长,这样使用SVM方法就不能实现实时检测的目的; Boosting方法学习时间不长,检测的速度也比较快。和Real Adaboost方法相比,Adaboost方法是采用二值判断的,而Real Adaboost方法采用的命中率( 即置信度)来描述目标识别的精确程度。开始时的分类器是在一个开练集中训练得到的,用初始的分类器从大量目标图像中对目标随机样本中的GHOG特征进行识别,根据识别的结果计算每层的误警率,并且在下一层的学习中不断增加负样本。HOG特征提取如图2 所示。

2 试验与分析

对于目标检测,已经有几个公用的标准数据库,本文采用的INRIA几乎覆盖了所有的视点和姿态的变化。它包括了训练用的2 478 个正样本和1 218 个负样本。由于INRIA数据集中都是分割后的样本,因此对分类方法中的训练算法比较有效。另外本文还采用MIT的目标数据集,其中包含正924 张目标图片,没有负样本。通过MIT与INRIA标准数据库训练分类器,将图像分为两类,目标和非目标。分类器首先通过训练图像进行学习,然后对测试图像进行检测。

2. 1 试验结果

用该方法测试PET2009 的数据库,根据INRIA数据集,用INRIA训练样本对本文提出的方法进行学习,另外,采用查全率和精确率测量来检测本文提出的方法,结果如表1 所示。查全率是检测正确目标的数目除以目标的总数目( tp为正阳性数目,检测到且是目标像素的数目; fn为没有检测目标像素的数目) ; 查准率是检测到目标像素数目除以检测目标像素数目( tp真阳性与假阳性fp的和) 。

视频PET2009 的视频序列中,seq2 中目标存比较拥挤、遮挡比较严重的现象,因此检测查全率和查准率都不高; 相反在seq1 中,人行较少,且几乎都是独立存在的,因此查准率为1,同样seq3 和seq4 中目标大部分是独立的,所以查准率也较高; seq3 中,目标比较清晰且无遮挡因此查准率比其他高。

2. 2 结果分析

为了进一步证明本文提出方法的性能,在实验中将本文的方法与其他目标检测方法进行对比,其中包括HOG_SVM[3]、VHOG_CAdaboost[5]方法。比较的方法采用错误率( MissRate) 和每个窗口的假阳性( FPPW) 的曲线图,FPPW定义如下

比较结果如图3 所示。HOG_SVM方法的数据是通过开放源码HOG和Lin SVM及论文的结论; VHOG_CAdaboost方法的数据结论来自于文献。从图中可以看到本文提出的方法比基于HOG的方法性能优越,在FPPW为10- 5时,本文的方法达到了9% 的漏检率,比HOG_SVM方法低了8% 。

3 结论

Gabor滤波方法是目标分类特征提取较的好方法,但是由于Gabor特征的维数很大,因此会占用大量的内存和计算时间。因此在设计分类方法时应考虑到特征的维数。另外,将1 幅图像和40 个Gabor小波进行卷积计算量也是非常大的,这将使Gabor不能应用于实时目标检测中。本文提出的方法能在提取Gabor特征的同时对图像的Gabor特征在方向和尺度上较好地融合,并保持原图像的特征,形成Gabor特征图像; 通过对Gabor图像进行HOG提取进行目标检测,能有效降低错误检测率; 另外该方法选取了Real Adaboot的方法进行分类,在时间上有效弥补了提取Gabor花费的时间,在Gabor特征图像融合过程中采取了编码的方式,使计算量也有效降低。因此该方法在节约内存和降低计算量方面有更好的性能。

摘要:针对传统的HOG目标识别方法,提出一种通过Gabor滤波融合后的进行HOG特征提取的目标检测方法。为了提高HOG特征提取信息的有效性,首先用Gabor对目标图像做了预处理,其预处理过程是针对图像Gabor特征的在尺度和方向上进行融合,形成一幅Gabor图像。为了有效提取全局的Gabor图像纹理、轮廓信息,将该图像分为大小相同且重叠的块,分别对每个块进行统计,最后用RealAdaboost级联方法对目标和非目标样本进行学习,并对测试序列进行分类。结果表明,基于梯度的Gabor预处理技术能提高目标特征提取性能。与传统的HOG目标识别的方法比较,该方法在目标图像受到干扰的情况(遮挡、重叠等)下,监测效果明显优越。

Gabor小波函数 篇5

人脸识别技术关键点在于特征提取, 由于人脸容易受光照、角度、表情等方面的影响, 使之在特征提取方面带来很多困难。Gabor变换是图像辨识的最好方法之一, 与人类的视觉系统也是一致。利用Gabor小波提取的特征能够克服上述干扰对识别效果的影响。但是其直接用Gabor提取得到的特征维数太高, 计算量大, 不能满足人脸识别的实时性要求, 因此对纹理特征进行降维也是关键。本文采用了Gabor小波与改进的2DPCA算法来达到人脸特征提取及降维处理。

2DPCA方法是一种直接计算图像协方差矩阵的特征向量的方法, 不需要像PCA方法那样将图像矩阵预先转化为一维矢量, 更加方便简单;但2DPCA方法本质上是对图像矩阵按行经行压缩提取特征, 消除的是图像矩阵中列的相关性, 依旧保留了行的相关性, 没达到最好的人脸识别率。针对这一问题, 本文采用一种改进的2DPCA方法, 同时考虑到了图像矩阵的行列相关性, 在ORL人脸库的实验背景下, 该方法取得了比2DPCA更高效的识别率。

二、Gabor小波特征提取方法描述

Gabor小波是Gabor变换与小波理论相结合的产物, 它继承了小波变换的多分辨率特性。二维Gabor滤波函数在空间域和频率域中具有良好的分辨能力, 具备提取图像局部信息变化的能力, 因此在图像处理中有广泛的应用。二维Gabor小波的核函数定义如下:

假设人脸图像表示为I (x, y) , 让其和Gabor小波的核函数相卷积得:

其中Qu, v (x, y) 为Gabor人脸, 在这里我们选5个尺度, 8个方向。这样每幅人脸图像就可以得到40个复系数Gabor纹理特征, 然后对它们取模值, 把每一个纹理特征向量化并依次组成矩阵, 这样就实现了Gabor纹理特征提取。

当然, 若我们直接运用Gabor提取原始特征, 其数据维数相当高的。在此本文对Gabor人脸进行3次小波分解, 将其低频近似图按行连接起来组成列矢量, 并将全部列矢量依次连接起来, 即组成了一幅人脸的低维Gabor特征列矢量。

三、基于改进的2dpca方法的特征降维

3.1基于行方向的2dpca方法

我们平时所说的2dpca方法, 认为其实质就是基于行方向的2dpca方法。假设训练集中有M个大小为m×n的矩阵人脸图像Ai。设X为一个n维的单位列向量, 把人脸图像投影到X中, 得Yi=AiX, 其中Yi被称为图像Ai的投影特征向量。这里我们希望找到一个最优的投影轴X, 使得所有训练样本在其上投影后得到的特征向量的总体散布矩阵达到最大化。在2DPCA中是用投影后向量的总离散度作为准则函数J (x) 来衡量投影向量X的优劣, 定义为:

其中tr (Sx) 表示矩阵Sx的迹, Sx表示训练样本图像投影后特征向量的协方差矩阵, 定义为:

定义图像的协方差矩阵为:

最大化J (x) 的单位向量称为最佳投影向量Xopt, 也就是矩阵G的前d个最大特征值所对应的特征向量构成的投影矩阵就是最优值, 表示为Xopt=[X1, X2, …, Xd]。在求得最佳投影向量后, 便可对人脸图像进行特征提取和分类。

3.2基于列方向的2DP CA方法

令Z∈Rm×n, Z是一个列向量互相正交的矩阵, 将图像矩阵A投影到Z上, 产生一个大小为q×n的矩阵B, 即:

类似的, 用如下准则函数J (Z) 可以找到最佳投影矩阵Z:

我们从上式 (9) 可以得到图像列方向的协方差矩阵G:

计算出G前q个最大特征值对应的特征向量Z1, ..., Zq得到最优投影矩阵Zopt, 由于式 (10) 的特征向量只反映图像每列间的信息, 可认为这个2DPCA是沿图像列方向进行处理的。

3.3改进的2DP CA算法

由上边推理所知, 2DPCA方法是基于行方向来处理的, 消除了列的相关性, 忽视了行的相关性;基于列方向的2DPCA方法消除了行的相关性, 遗留了列的相关性。在此构造一种方法同时消除图像行、列的相关性, 使其达到更好的识别率。

设己获得n×d维投影矩阵X和m×q维投影矩阵Z, 将m×n的图像A同时向X和Z投影, 产生一个q×d的矩阵C:C=ZTAX (11)

这里称矩阵C为图像重建协方差矩阵。于是源图像A的重建图像

在此我们可以看出, 改进的2DPCA方法产生的特征矩阵C的维数较2DPCA方法获得的特征矩阵Y=AX的维数 (m×d) 少得多。因此, 与2DPCA相比, 在人脸重建和识别时所需要的系数要少得多。将训练样本图像Ak同时投影到X和Z上, 得到训练样本的特征矩阵Ck。选定一幅测试图像A后, 先应用式 (11) 得到其特征矩阵C, 然后可选用最近邻分类器来进行分类。把C与Ck的距离定义为:

四、仿真实验结果

本实验中所用到的人脸图像都选自ORL人脸库, 其中包括了40副人脸图像, 每人10幅大小为112×92的灰度图像且都具有丰富的面部表情和姿态变化。把每人前6幅图像作为训练图像, 后4幅图像作为待测图像, 这样训练样本共有240个, 待测样本共160个。从表1中不难看出, 应用2DGabor小波与改进的2DPCA方法的识别率在同一特征个数情况下均高于PCA和2DPCA结合的方法, 并且特征维数降到了较低的范围, 在小样本情况下具有比较满意的识别率。

五、结论

本文提出的人脸识别算法先用2DGabor小波变换提取人脸特征, 2DGabor滤波器是带通滤波器, 它在空间域有良好的方向选择性, 通常采用由5个中心频率和8个方向的Gabor滤波器组成, 用它来提取图像不同的频率尺度和方向的纹理信息, 能够克服光照、角度、表情等干扰带来的影响。再用改进的2DPCA方法进行降维, 与原来的2DPCA方法相比, 它同时包含了图像行方向和列方向信息, 能够同时利用图像的灰度信息和结构信息, 同时图像特征系数大为减少, 有效的提高了识别率。

参考文献

[1]高彤莘.某办公楼综合布线系统设计综述[J].科技信息, 2009 (3)

Gabor小波函数 篇6

关键词:多尺度Gabor小波变换,纹理特征提取,图像检索

纹理是一种不依赖于颜色和亮度反映图像同质现象的视觉特征,体现了物体表面共有的内在特性。图像纹理分析是图像分析与处理研究中的一个重要组成部分,在场景分析、医学图像研究、遥感图像处理、图像数据库的检索以及其他一些领域中均有着重要应用。常用的纹理研究方法主要有统计法[1]、结构法[2]、模型法[3]和频谱法[4]。其中频谱法结合人类视觉机理,可以进行更精确的纹理描述,而Gabor变换[4]能够很好地同时在时域和频域中兼顾对信号分析的分辨率要求,成为最常用的图像纹理特征提取方法。在纹理分析和分割、图像识别和图像检索[5,6,7,8,9,10,11,12]等方面得到广泛应用。MPEG-7标准推荐的3种纹理描述符中的同质纹理描述符和纹理浏览描述符都是基于Gabor滤波器实现的[13]。

根据Gabor滤波器滤波特点,利用Gabor小波变换对图像进行纹理特征的提取,对滤波器参数进行选择和优化,综合考虑滤波精度与计算复杂度,以提高滤波器的滤波效果。最后以归一化处理后Gabor小波变换系数的均值和标准方差作为纹理特征进行图像检索。

1 多尺度Gabor小波变换

Gabor函数是通过高斯函数加频移后产生。Gabor滤波器是用Gabor函数作单位冲激响应的带通滤波器,具有良好的滤波性能,其输出可以看作输入信号的Gabor小波变换。生物学研究发现,二维Gabor滤波器可以模拟生物的视觉系统,能够很好地描述大脑初级视觉皮层部分的单细胞可接受信息域的分布,因而在图像分析中具有重要作用[14]。而且,Gabor滤波器在消除空域和频域二维联合不确定性方面是最优的,它可以看成是方向、尺度可调的边界和直线检测器,是被公认的信号表示尤其是图像辨识的最好方法之一,所以可以通过Gabor滤波器检测出图像中不同方向和角度上的边缘和线条,以提取图像中的纹理特征。

一个二维Gabor函数可以表示为[4]

g(x,y)=[12πσxσy]exp[-12(x2σx2+1σy2)+2πjWx](1)

其中,W为高斯函数的复调制频率。二维Gabor函数的实部和虚部如图1和图2所示。

其傅里叶变换为

G(u,v)=exp{-12[(u-W)2σu2+v2σv2]}(2)

其中,σu=12πσx;σv=12πσy

Gabor函数构成了一个完备的非正交基,当给定函数时,用该基函数展开就提供了一个局域化的频率描述。因此,采用基小波为Gabor函数的小波变换来提取纹理特征,通过采用不同尺度的滤波器,就可以检测到不同尺度下图像的局部特征。

g(x,y)作为母波函数,通过g(x,y)进行适度尺度扩张和旋转变换,可以得到一组自相似的滤波器,即Gabor小波

gmm(x,y)=a-mg(x′,y′),a>1,m,nZ (3)

其中,x′=a-m(xcosθ+ysinθ);y′=a-m(-xsinθ+ycosθ);θ=nπΚ;a-m为尺度因子;K是方向的数目。通过改变mn的值,便可以得到一组方向和尺度都不同的滤波器组。

由于Gabor滤波器组的非正交性意味着滤波后的图像会存在冗余信息,为消除这些冗余信息,在设计滤波器时要确保Gabor滤波器组的响应在频谱上半峰幅值能相互接触,且互不重叠,如图3所示[12]。设UhUl分别代表高频和低频的中心频率,设S代表尺度。这样就得到如下的滤波器参数[4]σu,σv

a=(Uh/Ul)1S-1,W=Uh,σu=(a-1)Uh(a+1)2ln2(4)

σv=tan(π2k)[Uh-2ln(σu2Uh)][2ln2-(2ln2)2σu2Uh2]-12(5)

2 Gabor纹理特征提取与相似性匹配

对于一幅给定的图像I(x,y),图像大小尺度为w×h,其Gabor小波变换可以定义为[12]

Wmn(x,y)=x0y0Ι(x-x0,y-y0)gmn*(x0,y0)(8)

式中,g*mn(x0,y0)为gmn(x0,y0)的复共轭函数;x0、y0是滤波器模板大小的变量;用μmnσmn代表一幅图像的纹理特征

μmn=1wh|Wmn(x,y)|(7)

σmn=1wh[|Wmn(x,y)|-μmn]2(8)

为使提取的Gabor纹理特征能够准确反映图像的特征,需要对滤波器组的尺度和方向参数进行设置,如表1所示[9,13]。

表1是一些研究的常用设置,结合实验结果对比发现,当K=6,S=4时,基本可以表达图像的纹理特征,而且计算量也不至于过大。图4为Lena图像经过6个方向和4种尺度的Gabor滤波器滤波后的结果。其中,横向为尺度相同但方向互不相同的一组滤波图像,纵向为方向相同但尺度互不相同的一组滤波图像,且由上到下尺度依次增大,即频率递增。从图4中可以看出,图像的能量主要集中低频部分。当尺度S设置为4时,其中尺度最大的一组滤波器,对图像的滤波结果为图4中最下面一组图像,可以看出,此时图像的高频能量已经相当少了,对于一般自然图像,没必要将尺度S设置得更高,而且S过高会增加特征提取的计算量;相反,若尺度设置得过低,又会丢失一部分高频能量,因此尺度参数设置为4是一种比较合适的选择。方向参数的设置主要考虑从不同角度来刻画图像的能量分布。根据式(5)可以得到,当K=6时,角度参数分别为0°、30°、60°、90°、120°、150°,从图3可以看出滤波器角度的分布。这种方向设置,基本涵盖了从0°~180°的角度范围,而180°~360°的角度范围与0°~180°的角度范围的滤波器方向一致,因此只需设置0°~180°的角度范围。K=6,已经可以全面的反映图像不同方向上的能量分布,因此没必要设置得更高,同S一样,K过高也会增加特征提取的计算量;相反,若K设置得过低,会损失图像某些方向上的能量。

因此,采用6个方向(K=6),4种尺度(S=4)得到24个Gabor滤波器,对每幅滤波后的图像分别取均值和标准方差,得到48维特征向量

F=[μ00,σ00,μ01,…,μ35,σ35] (11)

由于提取出的纹理向量的各个特征分量的物理意义和权值范围不同,因此在计算相似性距离时,会产生很大偏差,可通过高斯特征归一化[15]来消除这种偏差。纹理特征经过高斯归一化,可使特征各分量具有相同的权重,或者有意使某一特征分量在综合特征中更加突出。高斯归一化方法是一种较好的归一化方法,其特点是少量超大或超小的元素值对整个归一化后的元素值分布影响不大。

一个N维特征向量可以记为F=[f1,f2,…,fN]。如用I1,I2,…,IM代表图像库中的图像,则对其中任一幅图像Ii,其对应的特征向量为Fi=[fi1,fi2,…,fiN]。假设特征分量值系列[f1j,f2j,…,fMj]符合高斯分布,计算出均值mj和标准差σj,然后可将fij归一化至[-1,1]区间,从而得到归一化的fij

fij=fij-mj3σj(12)

经过高斯归一化后,会使99%的fij的值落在区间[-1,1]上,再通过平移操作使这些值最终落在区间[0,1]上

fij=fij+12(13)

设有图像IJ,计算相似距离[4]

dmn(i,j)=mn(|μmn(i)-μmn(j)α(μmn)|+|σmn(i)-σmn(j)α(σmn)|)(14)

式中,α(μmn)和α(σmn)为整个特征库的均值特征和标准方差特征的标准方差。

3 实验结果分析

设计并实现了一个基于Gabor纹理特征的图像检索原型系统,系统的开发平台为Microsoft Windows XP操作系统,开发工具是Microsoft Visual C++6.0。系统先对图像库中的图像进行Gabor纹理特征提取,构建图像特征库。对检索图像计算其特征向量,再与特征库中所有向量进行相似性匹配,系统返回相似性检索结果。系统的核心模块为特征入库和图像检索两个模块,其中特征入库模块即图像库的纹理特征提取步骤可以总结如下:

步骤1 选择一幅图像,读取图像的灰度值。初始化Gabor滤波器组的参数。

步骤2 特定方向m和尺度n,计算Gabor滤波器的方差参数,确定一个滤波器。

步骤3 利用步骤2中产生的滤波器对步骤1中的图像进行滤波。计算滤波图像的均值和标准方差,作为图像的纹理特征,保存结果。

步骤4 判断方向变量m和方向数K是否相等,以及尺寸变量n和尺度数S是否相等,即判断滤波器组是否对一幅图像已全部滤波,若满足条件,则继续步骤5,否则返回步骤2重新设定方向m和尺寸n

步骤5 判断该图像是否为图库的最后一张图像,若满足条件,对纹理特征进行高斯归一化处理,图像库的纹理特征提取结束,否则返回步骤1重新输入一幅图像。

图像检索模块的算法步骤可以总结如下:

步骤1 获取用户点击的关键图像,从特征库中读取关键图像的纹理特征。

步骤2 读取图像库所有图像的纹理特征,并根据式(14)依次计算关键图与图像库中所有图像的相似性距离。

步骤3 对所有相似性距离进行递增排序,根据设定的阈值或要显示的数目返回检索结果。

为判定检索系统的性能和特征提取算法的有效性,在图像检索领域中,一般应用比较广泛的图像检索算法评价准则为准确度[15](precision)。设s为一次检索过程中检索到的所有相关图像数目,u为检索到的不相关的图像数目,这样准确度可表示为

precision=ss+u(13)

实验中用到的图像库来自Corel图像库,Corel图像库是图像检索领域常用的图像库,Corel图像库有10类图像,每类包含100幅图像。实验时,从每类图像中任意选出20幅作为检索图像进行检索实验。计算20次检索的准确度作为该类图像检索性能的最终评价标准。对未作归一化处理和归一化处理后的检索性能与基于傅里叶变换,即以傅里叶能量谱的前几个系数来表示图像的纹理特征的检索性能相比较,检索的性能评价及比较结果如表2所示。图6和图7分别为“汽车”和“恐龙”的一次检索结果,图中第一幅为检索关键图像。

从图5,图6和表2可以看出,基于多尺度的Gabor小波变换提取的纹理特征能较准确地表达图像内容。对纹理特征进行归一化处理后,由于消除了各个特征分量的物理意义和权值范围不同所带来的偏差,其检索性能较未作归一化处理的结果有一定的提高,提高约为5.5%,结果与理论符合。其中“非洲”和“建筑”类的图像检索结果的平均准确度较低是因为这类图像内容较丰富,而Gabor纹理特征主要描述的是图像中与人类感知一致的规则性、方向性和粗糙度等纹理特性,适合对同质纹理的描述。

4 结束语

上一篇:城市居住区绿化下一篇:猪无名高热病