GABOR算法(共7篇)
GABOR算法 篇1
指纹识别技术是目前国内外生物识别技术领域研究的一个热点,同时也是当前运用最为成熟、可靠和广泛的生物技术之一。由于各种不可避免的因素干扰,使得采集到的指纹图像很难得到准确提取和匹配,使得一个良好的指纹增强算法,不仅要具有快速性,还要具有良好的鲁棒性和稳定性,从而提高特征提取及特征匹配的准确率。Gabor滤波器具有方向选择特性和频率选择特性的带通滤波器,并且能够达到时域和频域的最佳结合,可以很好地兼顾时域和频域信息,因此是实现指纹增强一个很不错的方法。
目前,针对指纹图像增强的算法一般可以分为3大类:频率滤波、空间域的方向滤波和Gabor滤波。其中,在Hong[1]等人提出的利用局部纹线方向和频率,使用Gabor函数增强指纹图像的方法,以及后面出现的一些改进的Gabor滤波算法等,使得Gabor增强具有更好的鲁棒性和适应性,成为目前指纹增强的主流方法。其主要思想是在指纹图像的一个局部区域(一般是指纹中互不重叠的分块),提取指纹脊线上各点的方向和频率信息,构造适当的滤波器模板进行滤波增强处理。其主要步骤包括:(1)规格化处理;(2)方向场估算;(3)频率场估算;(4)图像分割;(5)Gabor滤波。
1规格化处理
图像规格化主要是将原始图像的灰度值的均值和方差调到所期望的均值和方差,进而减弱图像中由于噪声所产生的灰度差异,改善图像的灰度对比度,为后续处理工作做准备。公式如下:
其中,c(i,j)表示当图像当前第i行,第j列的灰度值,N(i,j)表示规格化的对应位置的灰度值,M0,σ0分别表示灰度图像的期望均值和均方,M,σ分别表示当前灰度图像的均值和均方差。其中原始图像和规格化图像分别如图1和图2所示。
2方向场估算
由于指纹图像的脊线走向比较平缓,对应的方向场也不会有剧烈的走向,因此脊线方向也表明着指纹的内在特性。而方向图分为点方向图和块方向图,前者是求出每个像素点的方向,方向图精确但计算量较大;后者是求出图像中每个局域中的纹线主导方向,计算量相对前者较少,抗噪性更强。本文中采用的是基于灰度梯度的方法求块方向图,其主要思路是根据纹线方向在局部区域内基本一致的特点,先把指纹图像分块,然后计算每一子块的纹线走向,最后用该方向代表对应子块内的各个像素的方向。方法如下:
(1)将规格化的指纹图像N分成W×W的无重叠的子块;
(2)利用Sobel算子分别计算每个子块中,对应的每个像素点的梯度分量值Gx,Gy;
(3)使用公式(2)计算每个分块中心像素点的纹线方向
这里θ(i,j)表示的就是以像素点(i,j)为中心的子块的局部方向,即纹线方向。得到的方向图如图3所示。
3频率场的估算
目前主要的脊线频率计算方法是:由于指纹纹线具有很强的方向性,沿着脊线方向看,指纹脊线和谷线像素点灰度值大致形成一个二维的正弦波,定义纹线频率近似为正弦波的频率,即为相邻的两个波峰或波谷之间的像素点个数的倒数。计算频率场的方法如下:
(1)在求出某一个块中心像素的方向角θ(i,j)基础上,以当前像素的脊线方向为短轴,作一个尺寸为N×S的长方形窗口,如图4所示。
(2)用公式(3)—(5)计算当前窗口内沿方向角方向的S个像素灰度的平均值,也即幅度值。
(3)在公式中,M(k)形成一个离散的正弦波,如果M(k)中存在连续的峰值,则说明当前窗口的指纹是有效的,设hi为第一个峰值与第i个峰值的间距,脊线平均距离L,则脊线频率为:
4图像分割
从图像场的角度看,梯度场可以用来分割指纹图像,因为指纹对象部分的梯度场值较高,而背景部分的梯度场值较低,所以一般把求出的梯度进行高度平滑,去掉梯度图像的噪声,然后利用适当阈值就可以判断该点为前景还是背景,确定阈值步骤如下:
(1)阈值的选择跟图像质量有关。对于光学图像,因为比较平滑,所以阈值比较小,通常取30~40。如果图像不够平滑,则必须先对图像进行平滑处理,并且阈值大约取50左右。
(2)用单位区域上的梯度阈值作为灰度梯度特征,需要计算单位区域上的平均梯度作为该单位区域阈值。具体方法见文献[2]。
(3)设A为分割域值。T(i,j)为位置(i,j)的梯度。
若T(i,j)>A,则当前点在指纹图像的前景上。
若T(i,j)<A,则当前点在指纹图像的背景上。
5 Gabor滤波器
由于Gabor滤波器具有频率选择和方向选择的特性,因此利用Gabor滤波器的窗函数沿着指纹脊线方向加强图像,使得指纹的脊线信息得到增强,而且可以去噪把指纹信息不失真的保留下来。
Gabor滤波器函数表示为:
其中,(x,y)表示当前点像素的位置,θ表示Gabor核函数的方向角,f表示当前点对应的脊线频率,σx,σy分别表示沿着x和y轴的高斯包络线的空间常数。
在Gabor滤波器3个参数中,方向角θ和脊线频率f已经在前文计算过,可以不予考虑,但高斯包络的标准偏差σx,σy不能直接设置,取不同的值会对滤波结果产生不同的影响:值越大,去噪能力越强,同时产生伪特征的可能性也越大;值越小,则相反。基于经验和实验,σx,σy取值均为4.0时,滤波效果较为理想。
利用Gabor滤波器进行滤波的公式为:
其中G(i,j)为滤波后得到的图像,N(i,j)为规格化后的图像,W=13,是Gabor滤波器的模板大小,效果如图5。
6改进的Gabor滤波器
虽然Gabor滤波器作为一种当前十分有效的图像增强方法,但是并不是对所有的图像都具有良好的滤波效果,尤其是低质量的图像在经过Gabor增强后仍针存在脊线结构模糊的情况。同时由于滤波器固定的方形窗口,使得增强后的图像很容易产生较多的块效应。介于传统的Gabor滤波器的局限性,在这里采用祝恩提出的减少Gabor增强产生块效应的方法:就是将Gabor滤波器的形状改为圆形[3]。如下:
其中滤波器的半径为τ=3L/4,L为脊线平均距离。
另外Gabor滤波器的带宽是由参σx,σy数共同决定。传统的滤波器中该参数均是根据经验值选取的一个固定值,对于脊线形状非常不规则时,滤波器就不能对图像进行有效的增强。所以在这里引用文献[4]中通过Gabor滤波器的频率带宽参数来指导搜索最佳滤波器的方法,使高斯常数随着脊线频率的变化而变化,尽而得到最佳滤波器。在文献中可得到公式如下:
根据半峰带宽的概念可以估计出σ和脊线频率F的关系,即式中f为脊线频率。
改进后的Gabor滤波器增强公式如下,效果如图6。
7实现结果分析
详细地介绍了指纹图像增强算法各个步骤:规格化、方向图、脊线频率、图像分割以及滤波器,对各个步骤并加以实现,并改进了Gabor滤波器。实验结果相比较表明,改进后的滤波,对低质量的图像处理效果有所提高,并减少了块效应,保留了更多的细节,使图像增强效果有所提升;但对于脊线频率的计算,仍不是太理想;另外,由于高斯常量是随着脊线频率的变化而变化,而不是固定的值,因此,在处理图像时需要花费更多的时间。
摘要:在指纹识别预处理中,指纹增强效果对于后续的匹配和识别具有很重要作用。本文主要详细的介绍了基于Gabor滤波的指纹图像增强算法,并通过研究和加以实现传统的增强算法,然后在原有的基础上改进了Gabor滤波器,最终,相对于传统的滤波器,取得了较好的增强结果,从而尽可能减少了噪声干扰以及块现象,为以后的指纹匹配打下了良好的基础。
关键词:规格化,方向角,频率场,Gabor滤波器
参考文献
[1]Hong L,Wan Y,Jain AK.Fingerprint image enhancement:Algorithms and performance evaluation[J].IEEE Transactions on Pattern Analysis Machine Intelligence,1998,20:777-789.
[2]夏振华,石玉,于盛林.基于Gabor滤波器的指纹图像增强[J].工程学学报,2006(5):80-85.
[3]祝恩.低质量指纹图像的特征提取与识别技术的研究[D].长沙:国防科学技术大学,2005.
[4]吴高洪,章毓晋,林行刚.分割双纹理图像的最佳Gabor滤波器设计方法[J].电子学报,2001,29(1):48-50.
GABOR算法 篇2
人脸识别即是通过采样并由计算机分析, 将所分析的人脸图像的特征与预存特征进行验证以确定身份。从1965年开始, 人脸识别就开始了不断地发展并逐步被人们意识到重要性。人脸识别主要依赖于计算机的处理能力和采样的详细程度, 因此人脸识别的精度很大程度上取决于计算机软硬件的水平。在信息化时代, 人脸特征信息化已经成为了历史发展的必然, 在迫切需要高精度的人脸识别的各个领域中, 通过改进算法提高精度就成为了必然。
1 基于 GA 的人脸样本重采样
GA算法是在给定一个训练集合, 通过交叉、变异等遗传算法操作对已有样本进行扩展并通过优化选择来“优胜劣汰”新生代样本, 从而最终扩大训练集合的规模。
样本重采样主要包括:样本的收集与对齐, 这样就可以先进行仿射变换, 即使样本随机旋转与缩放, 并同时对样本与GA的解进行直方图均衡化。随即根据样本随机旋转与缩放的程度在进行子集的细化, 将-15°~+15°的区间分为六个更加详细的子区间, 并用n1, n2, …n6表示[1]。计算步骤如下:
①对样本进行标注。将样本统一化为长宽均为20像素大小的图像并进行直方图均衡化。则任意坐标像素点的灰度为
②将样本人脸图像为初始种族, 则其适应度值为1。然后进行对其后代的评价, 因而可以得到各后代的适应度。再通过轮盘赌法进行后代的交叉和变异。
2 基于流形的人脸样本重采样
收集到的人脸样本训练集会有噪声数据, 或者由于采样过程的无意“有偏”导致样本分布的偏差。因此, 需要对训练样本进行“ 重采样” , “净化掉 ”噪声样 本。基于LLE (locallylinearembedding, 局部线性嵌套算法) 与LS-SVM (Support Vector Machine, 最小二乘支持向量机) 的计算流程如下:首先在图像中选择邻域点, 然后进行线性权值的重构, 最后在映射到嵌入坐标系。LLE的核心理念就是数据的结构在局部范围内是线性相关的。因此在已知数据结构中的任意一点都可以认为是其相近点的线性变换得到的[2]。
LLE的操作步骤为:首先对各个数值的邻域进行筛选, 然后进行矩阵的计算, 在进行低维嵌入。这样可以保证相邻数值的关系不产生变化, 保证流形在几何上不产生变化。LLE只着眼于局部的线性关系, 计算的复杂程度就大大地降低, 保证了计算的效率。但是LLE的计算中, 低维嵌入的结果是由其中的邻近参数和低维嵌入空间维数来决定的, 因此这两个参数对嵌入结果的影响非常大。LS-SVM是居于统计学习理论的学习算法, 学习速度快, 而且对硬件的需较低。LS-SVM通过最有分类面的 创造来进 行分类。 针对于任 意训练样 本集, 可以通过LS-SVM优化为:
3 结合 Haar 与 Gabor 特征的算法与实现
Viola等人提出的AdaBoost算法中人脸弱特征表示采用的是Haar特征, Haar特征计算简单, 但特征表示能力比较弱, 因此容易误检。而Gabor特征能识别人与人之间的人脸的细微差别, 表示能力更强, 我们尝试了将其应用到人脸检测中[3]。
3.1 Gabor 小波的特征及效果
神经生物学告诉我们, 人类对图像的反应中, 对图像的反应更趋近于一种非均匀的感知。大脑对图像的处理与小波变换处理图像的目标相同。基于Gabor特征的人脸识别系统是通过函数模拟大脑对图像感知的相同特性进行计算[4]。其中二维的Gabor小波模拟核函数为
通过结合Gabor特征的人脸识别算法可以将图像受到的光照影响进行适当的补偿, 一定程度上提高了图像的质量。
经实验表明, Gabor特征拥有良好的生物亲和性。其次Gabor滤波器能够很好地将图像的细节进行详细的描述, 人脸识别的精度有所提高。Gabor特征能够很好地补偿光照而产生的误差影响, 能提高人脸识别的灵敏度。但Gabor特征的识别方法对硬件要求较高, 计算速度过慢, 导致无法实时的进行信息的传达。
3.2 改进算法的实现
本实验以matlab作为开发工具, 为了提高计算效率, 系统前端采用Haar特征尽快过滤大量非人脸区域, 而在最后阶段采用复杂度更高但具有更好的区分能力的Gabor特征, 通过4000个人脸样本进行特征分析和处理, 通过对Sheffield人与ORL脸库中的人像进行了基于Haar+Gabor、Haar+LLE与Gabor+LLE的试验[5]。试验结果如下表:
实验表明这样的由粗到细的检测策略在一定程度上提高了检测算法的性能, Haar+Gabor表现更优越。
4 结语
本文通过对比试验, 综合考虑了人脸识别对软硬件的依赖性, 探讨了GA算法和LLE算法, 提出了先通过Haar特征筛选, 再通过Gabor特征精细识别的方法改进了Adaboost人脸识别算法。通过这种改进, 并再结合GA算法、LLE算法、LS-SVM算法, 人脸识别的速度和精度可以大幅度的提升, 在不提升的硬件需求下完成了对人脸更为准确精细的识别。
摘要:在模式识别的众多领域中, 针对于人脸识别的研究与应用逐渐成为重点和难点。尽管近些年众多学者不断钻研并改进人脸识别的算法, 但是在复杂光照条件下和不同肤色的人脸识别中仍然存在着重重的不足。尤其是由于现阶段数据的计算速度和存储条件仍然不能很好地去适应优秀的算法对其的要求, 因此如何改进算法, 提高人脸识别的精度是本文主要研究的问题。本文结合Haar与Gabor特征提出了Adaboost人脸识别算法的改进方法, 提高了人脸识别的速度和精度。
关键词:GA,LLE,Harr,Gabor,Adaboost,人脸识别算法
参考文献
[1]张文超, 山世光, 张洪明, 等.基于局部Gabor变化直方图序列的人脸描述与识别[J].软件学报, 2006, 17 (12) :2508-2517.
[2]曹林, 王东峰, 刘小军, 等.基于二维Gabor小波的人脸识别算法[J].电子与信息学报, 2006, 28 (3) :490-494.
[3]唐旭晟, 欧宗瑛, 苏铁明, 等.基于AdaBoost和遗传算法的快速人脸定位算法[J].华南理工大学学报:自然科学版, 2007, 35 (1) :64-69.
[4]甘玲, 朱江, 苗东.扩展Haar特征检测人眼的方法[J][J].电子科技大学学报, 2010, 39 (2) :247-250.
GABOR算法 篇3
在人们的日常交往中, 面部表情是传递信息的一种方式, 能够传达很多人类语言所不能传达的信息。自动面部表情识别使用计算机对人脸的表情信息进行特征提取并进行分类, 她使得计算机能够根据人的表情信息, 推断人所要表达的感情。一般而言, 表情识别系统主要有五个基本部分组成:表情图像获取、表情图像预处理、表情特征提取、表情特征选择和表情分类识别。
人脸表情信息主要体现在眉毛、眼睛、鼻、嘴巴的变化及其这些变化之间的相互关系。从图像处理的角度来看, 这些改变主要是由图像边缘的变化引起的。因此获得表情图像的纹理信息对表情识别是很有帮助的。近几十年来, 涌现了许多经典的表情识别方法, 如LBP[1]、PCA[2]、LDA[3]等。二维Gabor小波具有多分辨率特性, 能够精确地提取图像的局部特征, 且对形变、位移、旋转、尺度变化和光照变化都具有一定的容忍性, 因此Gabor小波在模式识别领域有着成功的应用[4]。但Gabor方法存在局限, Log-Gabor是Gabor的一种改进, 有着比Gabor更好的特性。Log-Gabor滤波器除了继承Gabor滤波器的多通道功能以及多分辨率等优点之外, 还拥有两个主要特点: (1) 没有了DC分量, 这样带宽可以不受到限制; (2) 传递函数在高频端引出一个延长的尾巴, 这也就弥补了由于Gabor滤波器过度表达低频分量而对高频分量表达不充分的缺点[5]。
2 Gabor滤波器
Gabor变换是D.Gabor 1946年提出来的。为了由信号的Fourier变换提取局部信息, 引入了时间局部化的窗函数, 得到了窗口Fourier变换。由于窗口Fourier变换只依赖于部分时间的信号, 所以, 现在窗口Fourier又称为短时Fourier变换, 这个变换又称为Gabor变换。
Gabor滤波器可以表述如下[6]:
由公式 (4) 可得:
3 Log-Gabor滤波器
Filed于1987年首次提出Log-Gabor滤波器[7], Log-Gabor滤波器可以被定义为, 控制滤波器所对应的带宽, 控制滤波器所对应的空间方向。具体可以表述为[8]:
f0是滤波器中心频率, 是滤波器方向。常量定义了射线带宽B, 定义了角度带宽:
对于变量f0保持不变, B设置为一个倍频。实验产生40组滤波器, 所有图像的处理均是在频率域进行的, 所以速度要比在时域进行卷积要快。
4实验
JAFFE图像库包括213幅日本女性的脸相, 每幅图像都有原始的表情定义。表情库中共有10个人, 每个人有7种表情 (中性脸、高兴、悲伤、惊奇、愤怒、厌恶和恐惧) 。JAFFE均为正面脸相, 且把原始图像进行重新调整和修剪, 使得眼睛在数据库图像中的位置大致相同, 脸部尺寸基本一致, 光照均为正面光源, 但光照强度有差异。由于此表情库数据库完全开放, 且表情设定标准, 现在大多数研究表情识别都使用它来训练与测试。
本文的实验采用JAFFE标准表情图像库, 训练样本数为140幅, 测试样本数为70幅。其中训练样本中每类20幅, 测试样本每类10幅。共建立3组不同测试样本和训练样本, 用于交叉验证。对于同一表情, 测试样本中不会出现和训练样本相同的图像。
经过试验得出, 利用log-Gabor滤波器得到的最大识别率为84.3%, 利用gabor滤波器得到的最大识别率是82.8%, 表1和表2分别表示利用Gabor和log-Gabor三组实验得出的每类的平均识别率。由表格显示数据可以看出, 表情类中特征比较明显的类的识别率要高于特征不明显的表情类, 比如中性, 愤怒和惊奇的识别率比其他几种表情类的识别率要高。
5 结论
本文的主要研究目标是测试和比较Gabor滤波器和log-Gabor滤波器在面部表情识别中的应用。基于JAFFE表情库的实验结果表明两者在面部表情识别中的性能相似, 使用log-Gabor所得出的识别率略高于使用gabor得出的识别率。
本文的实验结果只是基于JAFFE表情库, 并且人类的表情不止是这7种, 以后的研究工作是建立更为完善的表情库, 并在此基础上进行表情分类识别的研究。
摘要:Gabor滤波器在面部表情识别领域已经广泛应用, 并取得了良好的分类结果。Log-gabor是对Gabor滤波器的改进, 应该将其应用在面部表情识别当中。对JAFFE表情库中的图像进行特征提取, 并采用基于稀疏表示分类方法进行分类, 比较分别使用Gabor和log-Gabor滤波器得出的识别率。
关键词:gabor,log-gabor,稀疏表示
参考文献
[1]Liu Xiaoshan, Du Minghui, Jin Lianwen.Face features extraction based on multi-scale LBP[C].2010 2nd International Conference on Signal Processing Systems (ICSPS) , July 5-7, 2010.Dalian, China:438-441.
[2]Chen Juanjuan, Zhao Zheng, Sun Han.Facial expression recognition based on PCA reconstruction[C].2010 5th International Conference on Computer Science and Education (ICCSE) , 24-27 Aug 2010.Hefei, Anhui:195-198.
[3]Etemad K, Chellappa R.Discriminant Analysis for Recognition of Human Face Images[J].Journal of the Optical Society of America, 1997, 8 (14) :1724-1738.
[4]Nectarios Rose.Facial Expression Classification using Gabor and Log-Gabor Filter[C].Proceedings of the 7th International Conference on Automatic Face and Gesture Recognition, 2006
[5]李凤华.基于Log-Gabor变换和adaboost的人脸表情识别[J].辽宁工业大学学报 (自然科学版) , 2010, 30 (4) :229-231
[6]Field D J.Relations between the Statistics of Natural Images and the Response Properties of Cortical Cells[J].Journal of the Optical Society of America A, 1987, 4 (12) :2379-2394.
[7]Lajevardi, Seyed Mehdi, Hussain, Zahir M.Automatic facial expression recognition:feature extraction and selection[J].signal image and video processing, 2012, 6 (1) :159-169
GABOR算法 篇4
关键词:虹膜识别,伪虹膜,Gabor滤波,图像熵值
0 引 言
随着信息社会的发展,生物特征身份验证的重要性也不断增加。用于生物特征识别的生理特征有指纹、掌纹、人脸、虹膜、视网膜、耳廓等,行为特征有签字、语音、步态等。其中,虹膜作为重要的身份鉴别特征,具有唯一性、稳定性、非侵犯性等优点,且与人脸、指纹等生物特征识别方法相比,虹膜具有更高的准确性[1,2]。然而,尽管虹膜识别有很多优点,但虹膜认证系统容易受到伪虹膜的干扰。因此,虹膜识别系统需要活性检测。
目前比较常见的伪虹膜主要有:虹膜照片、纸质打印虹膜、隐形眼镜(主要是彩色隐形眼镜)、玻璃眼及与眼睛很相似的物体等[3]。伪虹膜的种类繁多,而且都有各自的特点,因此在防伪时应具体情况具体分析。
对于真假虹膜的识别,国内外研究者已经提出了许多活性检测方法[4,5,6]。如韩国的Eui Chul Lee等提出通过语音提示被拍摄者眼睛的转向,然后借助于人眼三维的距离模型来判断虹膜的真伪[7]。该方法能够准确地辨别出真假虹膜,但是耗时较多,且不方便。Daugman提出一种基于FFT的方法用于检测打印在隐形眼镜上的伪虹膜[8]。打印机制形成的点阵,使得伪虹膜图像经FFT变换后在频谱图上出现4个亮点,这4个亮点反映了打印点阵的水平和垂直频率,而真实虹膜图像FFT变换后不存在4个亮点。但是如果不聚焦的纸质打印虹膜的二维FFT变换频谱图上也没有出现4个中频亮点区域,因此,我们无法检测是否是活体虹膜还是纸质打印虹膜。还有些防伪的方法利用活体组织的红外特征光谱进行防伪。这种方法是基于人体组织、脂肪、血液等对特定波长红外光的吸收特性进行活体检测。该方法需要一定的硬件支持,增加了系统复杂度和成本。
本文从虹膜纹理的角度,提出了基于多方向Gabor滤波的虹膜活体检测,主要是针对佩戴彩色隐形眼镜的伪虹膜攻击手段。
1 虹膜的活体检测
1.1 虹膜图像预处理
判断虹膜图像的真伪主要在于判断图像中虹膜部分的真伪,由于图像中虹膜部分一般是圆环形,不易量化,并且采集设备与被采集者的相对位置会发生变化,使得采集到的人眼图像的大小、位置、角度有差异。所以,必须将虹膜进行定位并展开归一化以减小由这些差异带来的误差。因此,预处理的过程就包括提取虹膜即虹膜分割、虹膜图像的归一化、虹膜图像增强,如图1所示。
整个预处理的步骤如下:
(1) 虹膜定位
本文虹膜分割即虹膜定位采用的是将粗定位和精确定位相结合的虹膜边界提取预处理方法。通过对预处理后的二值化虹膜图像进行粗定位,用基于瞳孔边界点控制的最小二乘拟合方法确定虹膜内边界,并采用微积分算子精确检测定位虹膜外边界。
(2) 虹膜归一化
本文利用双线性插值法将环形虹膜展开为统一尺寸的矩形图像以方便统一样本大小。归一化后的样本大小为64×512。
(3) 图像增强
采集人眼图像时需要光照增强,就会引起虹膜纹理的明暗程度不同,从而给后续步骤造成影响。为了提高识别效果,需要对归一化的虹膜图像进行增强。本文采用直方图均衡化增强方法。设虹膜归一化图的灰度分布密度函数为:
rk表示灰度级,rk∈[0,255],nk表示rk灰度值的像素总数,n表示整幅图像的像素总数。采用下列变换函数对原图进行转换:
1.2 虹膜特征区域选择
通常虹膜图像的上部和下部分会受到眼睫毛或者眼睑遮挡覆盖,由于各异性,这部分的特征每个人都不一样,因此在防伪的计算过程中,这部分应该要被排除。通过选用自行拍摄的400张(768×576像素)和中科院自动化研究所CASIA(1.0版本)中的虹膜图片归一化后进行睫毛或眼睑的噪声检测。将虹膜区域分为左右两部分。则虹膜图像中被遮挡的区域分布如图2所示。
结果表明,所有的虹膜图像没有污染的地区的睫毛或眼睑部分的角度为-30°≤θR≤10°和170°≤θL≤210°,如图3所示。
1.3 虹膜真伪判断
从纹理角度观察图1可以得出,假虹膜图像的外围纹理比较虹膜内侧的纹理要丰富得多,而真虹膜在虹膜的外侧的纹理就很少甚至没有,因此如果能够对虹膜内外细节纹理的差异进行量化就能够判断出真假虹膜。
归一化后的虹膜纹理具有很强的方向性,大部分趋于竖直方向。Gabor滤波现在广泛应用在纹理增强,若对真假虹膜图像进行各个方向的Gabor滤波,真虹膜图像在Gabor滤波后特征区域的下半部基本呈现无纹理或者少纹理状态,而假虹膜不会。因此本文提出用多方向Gabor滤波对归一化后的虹膜图像进行滤波,然后分别计算各个方向滤波后特征区域的虹膜外侧和内侧图像熵值差,差值的和在阈值范围内为真,否则为假。
Gabor滤波器实质是一种短时的傅里叶变换,即在傅里叶变换的同时增加一个约束窗函数,当窗函数为高斯函数时为Gabor变换[9]。其既有时域的分辨能力又有频域的分辨能力,具有良好的频率和方向选择性,空间域偶对称Gabor滤波器的一般形式如下式:
G(x,y,θ,f)=exp-12x′sx2+y′sy2cos(2πfx′)
x′=xcos(θ)+ysin(θ)
y′=ycos(θ)-xsin(θ) (3)
式中sx、sy分别表示高斯包络在u轴和v轴上的标准差(u轴平行于θ、v轴垂直于θ),决定了滤波器有效宽度和长度,实验证明sx、sy值较大时主要体现纹理全局性的变化,较小时体现细小的纹理变化。因为这里主要讨论纹理的细节区别,所以这两个值应该小些。θ用于控制Gabor 滤波器的方向。f表示滤波频率。
图像的熵是图像特征的一种统计形式,反映了图像中包含的信息量。对于一幅包含256个灰度级的灰度图像,若其中灰度值为i的像素出现的概率为P(i),则图像熵的一般表达式为:
Hf=-∑Mi=1∑Nj=1PijlnPij
Pij=f(i,j)∑Mi=1∑Nj=1f(i,j) (4)
式中,Hf是M×N大小的局部窗口的熵,即局部熵;Pij是点(i,j)处灰度分布概率,Pij<1;f(i,j)是点(i,j)处灰度值。从而求得一幅虹膜图像在滤波方向为θ的条件下,滤波后特征区域的上下两部分的熵值之差Hba(θ):
Hba(θ)=Hb(θ)-Ha(θ) (5)
式中,Hb(θ)、Ha(θ)分别为图像b、a区域在滤波方向为θ的条件下的熵。最后计算各个方向上Hba的总和作为评判标准:
式中
2 实验结果及分析
为了验证本文提出的防伪方案的有效性,实验中搭建了一个自动对焦虹膜采集装置,该装置的具体参数如下:PENTAX定焦手动光圈镜头焦距f=35mm,光圈F=1:1.6;CCD图像传感器采用UNIQ的945nm近红外感光相机UM301,快门速度为1/60-1/31000秒;精密型电动平移台分辨率为0.25um(20细分),最大速度20mm/sec。本系统采集出来的图像统一为768×576像素大小,分辨率为96×96DPI。用上述装置采集真假虹膜,建立实验用小型虹膜库(NUAA-IDB)。首先对归一化的虹膜图像进行各个方向的Gabor滤波,处理结果如图4所示。
然后利用式(5)、式(6)计算各个方向Gabor滤波下每个图像特征区域的熵值和,选取虹膜库(NUAA-IDB)中200张真假虹膜进行实验,得出的结果如图5所示。
从上述结果可以看出,用本文提出的辨别虹膜真伪的方法能够100%地区别出真假虹膜,符合虹膜识别中防伪的要求。
3 结 语
本文根据虹膜识别中的具体特点提出了一种基于Gabor滤波的虹膜防伪方法,并且通过实验证明该方法的优越性。当然本文目前的算法都是基于PC上,整个虹膜识别的速度上会存在很大的不足。该项目的后期将会进一步对其优化以及会对算法移植DSP的研究,并逐步完善虹膜数据库。
参考文献
[1]Daugman J.How iris recognition works[J].IEEE Transactions on Cir-cuit and Systems for Video Technology,2004,14(1):21-30.
[2]安树娟,何孝富,施鹏飞.一种基于小波包分解的虹膜防伪检测方法[J].测控技术,2008,27(6):9-11.
[3]何孝富.活体虹膜识别的关键技术研究[D].上海:上海交通大学,2007.
[4]He X,An S,Shi P.Statistical textural analysis based approach for fake iris detection using support vector machine[C]//Proc.of International Conference on Biometrics,2007:540-546.
[5]Ma Li,Tan Tieniu,Wang Yunhong,et al.Efficient iris recognition by characterizing key local variations[J].IEEE Transactions on image processing,2004,13(6):739-750.
[6]Antonelli A,Cappelli R,Maio D,et al.Fake finger detection by skin distortion analysis[J].IEEE Transactions on Information Forensics and Security,2006,1(3):360-373.
[7]Eui Chul Lee,You Jin Ko,Kang Ryoung Park.Fake iris detection method using Purkinje images based on gaze position[J].OPTICAL ENGINEERING,2008,47(6):1-16.
[8]Daugman J.Recognizing persons by their iris patterns,biometrics:per-sonal identification in a networked society[M].Amsterdam:Kluwer Academic Publisher,1999:103-121.
GABOR算法 篇5
人脸表情是人类进行情感交流的一种重要方式,从表情的变化中可以感知出人的情绪、感受、秉性和气质。自动人脸表情识别(FER)技术可以协助进行人脸识别、智能人机交互以及行为科学和医学研究等。因此,为了推动更加智能和自然的人机交互,人脸表情识别在过去几十年得到广泛研究,并且成为一个研究热点。到目前为止,针对人脸表情识别提出了许多的方法,其区别表现在以下3个方面:使用的数据(图像序列和静态图像)、特征提取方法和分类器。对于图像序列的表情识别目前主要是采用光流估计[1]的方法提取特征再进行7种表情识别,但也有用基于模型的方法。对于分类器,根据是否利用时间信息来分析可分为基于空间分析的方法和空时结合的方法两类。而对于特征提取,常用的方法有主元分析、线性判别分析、ICA等。但是这些经典的方法如主元分析,特别是在处理图像矩阵时总是先将矩阵转换为图像向量,大大增加了维数,致使实现起来非常耗时,且识别率也相对较低。
鉴于此,程剑、应自炉提出基于二维主分量分析的面部表情识别方法[2],这种直接采用二维主元分析方法的进行特征提取,比传统方法节省了很多时间,但这种方法受光照环境等干扰因素影响很大,提取出的特征误差较大,识别率较低。为了能够更有效地提取与表情变化有关的特征矢量且屏蔽光照对特征提取的影响,本文采用了Gabor小波变换从人脸图像上提取表情特征[3],对高维特征进行局部采样和2DPCA[4,5]降维进行特征选择,以最少的数据代替高维的原始特征,达到降低特征向量的目的,再用基于模糊积分[6,7]的分类器进行识别,取得了相对较高的识别率[8,9]。实验结果证明本文方法解决了文献[2]提出的基于二维主分量分析方法中表情特征提取效率不高的问题。
1 特征提取
表情特征提取结果的好坏直接影响系统的识别率,所以对于输入的一副图像我们要尽可能精确的提取与表情有关的特征,并最大程度的降低与表情特征无关的各种干扰,如光照,遮掩,变形及不同人的轮廓不一样等。对于这些因素,目前最流行而且效果比较好的特征提取方法是用小波变换来提取特征,当然首先要对图像先预处理,相对减少干扰。
1.1 表情图像的预处理
图像的预处理主要包括人脸的定位,表情图像子区域的分割以及表情图像灰度均衡化和几何归一化处理。预处理的好坏会影响表情特征提取的计算量和效果。
对于一副表情图像中,眼睛、眉和嘴等如果发生移位或遮掩等都会给准确定位带来困难。为了准确定位并进行几何归一化,本文以两个眼球的中心位置作为人的特征点,进行图像旋转,使两眼的中心位置的连线保持水平,然后以两眼中心位置的距离为基准,再按一定的比例裁减,得到表情最多的人脸区域,最后进行图像缩放处理,使各图的大小统一。这样就得到了大小统一且两眼位置对齐的表情图像。本文归一化后的图像大小均为128×128。
灰度均衡化是指对图像进行光照补偿等处理,目的是消除光照变换对提取特征的影响,尽管Gabor变换对光照是不敏感的,但灰度均衡化处理可优化特征的提取效果。灰度均衡化可表示为
其中:I=(x,y)、Ī(x,y)分别为均衡前后的灰度图像,σ0、µ0分别为均衡后的均值和方差,这样经处理后,所有图像都有相同的均值和方差。
经过上述预处理后,图像如图1所示。
1.2 Gabor小波滤波器
Gabor小波是由Gabor函数经过尺度伸缩和旋转生成的一族复函数系,具有良好的时频局部化特征和多分辨率特性,能够提取图像局部细微变化的能力,这个特点非常适合表情特征的提取。另外,Gabor小波对光照变化不敏感,具有良好的光照性。
对于图像进行的是二维Gabor变换,因此二维Gabor小波核函数的选取有不同的方法,本文选取的核函数如下:
其中:i为复数算子,σ为小波滤波器的宽度,本文取σ=2π,Z=(x,y)表示图像的坐标点,kj=kv(cosθ,sinθ)T,其中kv=2-(v+2)/2π,v不同的取值表示不同的核频率,θ的取值表示不同的方向。本文选取的v为0,1,2,3,4;θ的取值为0,π/6,2π/6,3π/6,4π/6,5π/6,这样由5个频率6个方向共30个函数组成Gabor小波族。图2是v取1时的6个不同方向的2维Gabor小波。
1.3 Gabor特征提取
在提取人脸表情特征时,一般采用在不同尺度和方向上的Gabor滤波器族组成[10,11],并根据表情的特点和神经生理学的结论来选择参数。通常大尺度可以描述全局性较强的信息,同时可以掩盖掉图像中噪声的影响,而小尺度可以描述比较精细的局部结构,但同时受噪声的影响也大。本文主要是对表情特征的选取,局部细节及纹理特性是最主要的,而这些特性都是属于高频部分。所以我们选取的尺度尽量要小,即上节选取的参数0,1,2,3,4。
在得到一组Gabor小波滤波器后,将输入的图像I与小波族的各个滤波器进行卷积:
得到滤波后的小波系数图如图3。
由于Gabor小波变换是通过对图像进行卷积实现的,而卷积是对图像上给定范围区域内的像素灰度值进行乘积、累加的结果。因此,得到的Gabor系数图的值不会像像素的灰度值那样随着位置的改变发生剧烈的变换,也就是Gabor小波变换具有对位置部敏感的性质。
本文是5个尺度6个方向的小波函数,这样每一幅图像变换后得到30个Gabor小波系数图,由于预处理后的图像是128×128维的,提取后的特征维数则变为128×128×5×6,显然远远高于本来的图像的维数。要想直接利用这些特征分类那是不可能的,需要进行降维处理。
2 特征降维
如前所述,特征提取时实验所用的训练和测试样本的分辨力都是128 pixels×128 pixels,经过Gabor变换后如果直接进行分类,往往容易陷入“维数灾难”使得问题变得实际上不可实现。为此本文采用二次降维的方法进行特征提取。由于Gabor特征在相邻像素间是高度相关和信息冗余的,所以只要提取部分特征就足够了,因此首先对特征空间进行降维是有必要的,然后再利用2DPCA进行降维。
2.1 特征采样
对于高维特征的采样,本文采用的是密集与稀疏结合的方法,不同于以往的规则均匀采用。有规则的采样是对系数图的相邻间隔提取各个滤波器的输出值,然后联合起来作为图像的特征向量,这种降维是以识别率来换取识别速度,这样不利于识别效果。本文采用的是密集与稀疏一起的方法采样,也就是对表情细节多的区域采集的特征多一点,比如在眼睛、嘴巴等部位,但在脸上区域,由于表情信息相对较少,故采用稀疏采集,实验证明在采集相同个数的特征点时,本文这种方法较好。本文对于眼部提取35个特征点,对嘴提取25个特征点,在鼻子周围提取的是12个稀疏的特征点,这样采用得到的特征是72×30维,显然比小波系数图要小很多,但对于识别还需要进一步的降维。
2.2 二维主元分析
通常二维主元分析(2DPCA)主要用于面部表情的提取,其原理是利用矢量子空间,消除数据间的冗余,以最少的数据来描述原始信息,实现降维的目的。相比与PCA,2DPCA是直接由矩阵构造训练样本的总体离散布矩阵(协方差),然后计算其特征值和特征向量。
设采样后矩阵的分辨力为m×n,则第i个训练样本表示为m×n的矩阵Ai(i=1,2,…,M),M是训练样本的个数,训练样本的均值表示为
则训练样本的总体散布矩阵可用下面的公式进行估:
然后计算Gt的特征值和特征向量,一般选取前k个较大的特征值(λ1≥λ2≥…≥λk)所对应的特征向量(ξ1,ξ2,…,ξk)作为最佳投影轴。即:
则样本系数矩阵Ai的特征矩阵Yi∈Rm×k可表示为:
由于经典的PCA在降维时都是将数据矩阵先转换成数据向量之后再进行K-L变换的,这样会使向量空间的维数很大,若是训练样本太少的话,很难计算出正确的协方差矩阵。而2DPCA是直接基于矩阵的,可以很容易地正确计算出协方差矩阵。由于维数小,计算协方差的特征值和相应的特征向量所需的时间也较少。这样就可以均衡Gabor变换所消耗的时间。
3 基于模糊积分的多分类器联合
模糊积分是由Sufeno提出的,是目前一种有效的信息融合方法。就是在模式识别[4,5]中,把多个分类器的输出信息联合起来进行分类决策。设C={c 1,c2,......,cn}是n个目标类别组成的集合,X={x 1,x2,......,xm}是m个分类器组成。zk是第k个被识别对象。样本zk经过各分类器识别后,可以得到一个矩阵,也就是决策样板中的决策剖面,这里将其记为D(zk):
其中:每个行向量hi=(hi1k,hi2k,……,hink),(i=1,2,…,m)是某个分类器xi对样本zk的相对于各类别的识别结果,我们称之为分类器xi的输出向量;每个列向量hj=(h1jk,h2jk,……,hmjk),(j=1,2,...,n)表示相对某个类别cj,各分类器对样本zk的识别结果,我们称之为类别cj的融合向量。下面给出一种融合模型如图4所示,本文的模糊密度取各分类器的平均识别率。
实现基于模糊积分的多分类器联合的具体算法如下:
1)确定模糊密度gi,i=1,2,…,m;
2)构造模糊测度:λ+1=∏i=1m(1+λgi),即通过模糊密度确定参数λ,进而确定模糊测度;
3)对于各分类器输出的cj,按从大到小重新排列hj=(h1jk,h2jk,……,hmjk),使得前一项总是大于后项,同时也要重新排列相应的模糊密度;
4)计算模糊测度,令g(1)=g1,则g(t)=gt+(1+λgt)g(t-1),t=2,…,m。
5)计算模糊积分,µj=max{min(g(t),hj)},j=1,2,…,n;
6)比较积分值的大小,取最大的j为待识别对象的类别。
在本文中,取m=3,n=7,即3个分类器,7种表情类别,分别是生气、厌恶、恐惧、高兴、中性、悲伤、惊讶。由于最近邻和欧氏距离输出的结果是测试样本到类样本的距离,为了将距离转换置信度,采用下面的公式:输出为1/[1+d(x)],其中d(x)是测试样本X到类表情的距离。而余弦距离的输出可直接看成是置信度。本文的模糊密度分别取各分类器的平均识别率,即各分类器的重要程度。
4 实验结果及分析
本文选用JAFFE日本成年女性人脸表情数据库进行实验。该数据由10个人的213幅图像组成,每个人展示生气、厌恶、害怕、开心、悲伤、惊奇和中性7种基本表情各2~4幅图像,均为256×256的8位灰度图像。实验中取每人每种表情各一幅图像共70幅图像作为训练样本,其余143幅图像作为测试样本。实验环境是以MATLAB7为工具,在Microsoft Windows XP系统下硬件为Pentium(R)4 CPU 2.40GHz,256M内存条件下完成。虽然整个算法复杂度较大,但模块功能清晰,结构复杂度不高,识别系统能接受。
实验采用了目前在细节提取中比较常用的Gabor小波算法。在实验特征提取中,不同投影轴得到不同的识别率,对于采样后的Gabor系数用2DPCA提取特征时取3~4个最大特征值对应的特征向量便能达到较好的效果,但不是越大越好,一般取2~8个,本实验中取5个时达到最大识别效果。对于仅采用2DPCA算法的特征向量取4个时识别率最佳。然后对Gabor和2DPCA提取的特征分别做融合处理,基于各分类器融合的平均识别率和所用时间分别如表1和表2所示,2DPCA对应参数λ=-0.989 7,Gabor提取参数λ=-0.994 5。本文算法的分类结果为欧式距离、最近邻法、余弦距离三种分类器融合后的输出,即模糊积分法,表1中可以看到采用2DPCA特征提取时模糊积分的输出识别率为89.3%,而本文算法时模糊积分的输出识别率为92.0%。另外,为了突出模糊积分的优势,在表1中特显示了分别采用单个分类器时的输出作为对比,结果显示在相同特征提取方式下单个分类器的识别率明显低于模糊积分识别率,表明模糊积分能更有效的用于识别分类。
由实验结果可知,对于高维的Gabor系数采用2DPCA提取特征在识别率上明显高于仅用二维PCA算法的特征提取,表明本文算法能最大程度克服光照及脸型等噪声影响,更有效地提取与表情相关的特征矢量。另外由表1可以看出采用模糊积分法比单一分类器的识别率更高,但是在运行时间上采用Gabor提取特征比2DPCA算法耗时,这也是提高识别率的代价,但相对于传统的特征提取该算法是相当节省时间的。
实验中传统的基于PCA的Gabor特征提取算法消耗总时间为30.7 s,平均识别率仅为84.2%,因此相对于采用传统的PCA或DCT等特征提取来说,基于2DPCA的Gabor小波变换(识别率92%,时间1.948 s)在特征提取上是更有效的,它不但在识别率上有很大提高,而且在运算时间上也有很大改进。但是,实验中不管采用那种方法,厌恶、恐惧、悲伤的识别率不高,难度比较大,主要是由于用Gabor变换后的这两种表情的特征不显著引起,但表情中性的识别率都是相对最高的,惊讶与高兴也有比较好的识别率。
5 结论
本文利用对表情特征及纹理性质有较好表征能力的Gabor小波变换,对于小波系数图的高度相关性和冗余度采用先采样降维再利用2DPCA的方法进行再次降维,最后用直观简单的最近邻法进行分类,实验结果表明,与对图像数据采用2DPCA算法相比,该方法能够更加有效的提取与表情变化有关的特征,并且能够最大程度上克服噪声的干扰,解决了提取表情特征时精确度不高且耗时相对较大的缺点。但不足的地方是虽然用了2DPCA降维,但还是不能满足实时性的要求,并且本文主要是识别单个表情,但实际生活中往往是2个或2个以上表情在同一时刻在同一张脸上展示,比如恐惧跟厌恶等。另一个问题是,如果一个人是比较夸张的表情,这样的识别效果会相对要好些,对于不太明显的表情很容易识别错误,这些都是需要下一步改进的地方。
摘要:提出通过提取人脸表情图像的Gabor特征,结合二次降维的方法,进行人脸表情识别。针对Gabor特征提取后维数变高,冗余很大的特点,先对高维特征进行采样,再引入二维PCA算法对Gabor特征进行选择,以达到降维的目的。然后采用基于模糊积分的多分类器联合的方法对7种表情进行融合识别。在JAFFE库上进行测试的结果验证了该算法的有效性,与2DPCA算法及传统特征提取算法相比,本文算法取得了较高的识别速度和精确度。该算法能更有效的提取反映表情状态的特征。
关键词:表情识别,Gabor小波变换,模糊积分,多分类器融合
参考文献
[1]James Jenn-jier Lien,Tako Kanade,Jeffrey F,et al.Detection,Tracking,and Classification of Action Units in Facial Expression[J].Robotics and Autonomous Systems(S0921-8890),2000,31:131-146.
[2]程剑,应自炉.基于二维主分量分析的面部表情识别[J].计算机工程与应用,2006,31(5):32-39.CHENG Jian,YING Zi-lu.Facial Expression Recognition Based on2DPCA[J].Computer Engineering and Applications,2006,31(5):32-39.
[3]章品正,王征,赵宏玉.面部表情特征抽取的研究进展[J].计算机工程与应用,2006,38(9):38-42.ZHANG Pin-zheng,WANG Zheng,ZHAO Hong-yu.Research Advances of Facial Expression Feature Extraction[J].Computer Engineering and Applications,2006,38(9):38-42.
[4]Chen Queen,Huang Thomas.Facial Expression Recognition:A Clustering-based Approach[J].Pattern Recognition Letters(S0167-8655),2003,24:1295-1302.
[5]Havran C,Hupet L,Czyz J,et al.Independent Component Analysis for Face Authentication[C]//KES’2002Proceedings of Knowledge-Based Intelligent Information and Engineering Systems,Crema,Italy,Sept16-18,2002:1207-1211.
[6]Sugeno M.Fuzzy Measures and Fuzzy Integrals:A Survey[J].Fuzzy Automata and Decision Processes,1977,78(33):89-102.
[7]Keller J M,Gader P.Advances in Fuzzy Integration for Pattern Recognition[J].Fuzzy Sets and Systems(S0165-0114),1994,65:273-283.
[8]Fasel B,Luettin.Automatic Facial Expression Analysis:A Survey[J].Pattern Recognition(S0031-3203),2003,36(1):259-275.
[9]Jian Yang,Zhang D,Frangi A F,et al.Two-Dimensional PCA:A New Approach to Appearance-based Face Representation and Recognition[J].IEEE Transaction on Pattern Analysis and Machine Intelligence(S0162-8828),2004,26(1):131-137.
[10]Wen Z,Huang T.Capturing Subtle Facial Motion in3D Face Tracking[C]//Proceedings of IEEE Intenational Conference on Computer Vision,Nice,France,Oct13-16,2003,2:1343-1350.
GABOR算法 篇6
人脸识别是通过在一个存储不同个体图像的数据库中进行比较识别出一个指定个体的图像来识别出要求的个体。[1]这个图像集被分为两个种类:客户 (client) 和冒充者 (impostor) 。客户 (client) 是指一个确认身份的注册个体。非客户的个体都被称为冒充者 (impostor) 。人脸识别的过程分为两个阶段:特征选择 (feature selection) 和分类 (classification) 。特征选择不仅可以使得数据量减少, 而且还能使识别更精确。第二阶段的分类会识别图像是客户 (client) 还是冒充者 (impostor) 。在这篇论文里, 我们提出了一种基于Adaboost对人脸Gabor特征进行选择[2]。
1 Gabor滤波器提取人脸特征
Gabor小波因为它们的生物相关性和计算性能已被广泛用于图像处理, 纹理分析。Gabor小波, 它捕获的空间定位, 方向选择性, 频率选择性空间, 正交相位关系, 属性似乎是一个很好的近似皮质实验中遇到的滤波器响应型神经元, 其代表性, 已被证明是在尽量减少关节的两维空间和频率的不确定性的最佳感。人们普遍认为, 人脸的Gabor小波表示应该有强大的面部表情特点和构成的变化。
与Gabor小波的家庭 (内核, 过滤器) :
在频域采样, 我们选取了5个不同的频率, 指数V=0, …, 4, 8个方向, 指数U=0, …, 7离散集合。
Gabor滤波器在式 (1) 定义自相似, 因为它可以从一个扩张和旋转操作的母小波产生。每个过滤器是在平面波与波矢量K軑j的形状, 由高斯宽度σ=2π信封的限制。第一个阶段的方括号内, 第二个阶段内式 (1) 确定过滤器的振荡部分, 使过滤器直流自由。
B.Gabor特征表示
Gabor小波的人脸表示是卷积与Gabor族内核式 (1) 定义的形象。对于灰度图像Ix軆軆軆, 小波变换卷积围绕一个给定的像素x軆= (x, y) , 定义如下:
其中, Jj x軆軆軆表示Gabor滤波器在方向u和尺度v对应的卷积结果。作为一个结果, 这个图像Ix軆軆軆可以由一系列Gabor小波系数{j=μ+80v, j=0, …, 37, v=0, …, 4, μ=0, …, 7}, 卷积输出样本图像的 (实部和虚部) , 表现出强烈的特点空间位置, 尺度和方向的选择性。这样特征产生在显着的地方, 如眼睛的功能, 鼻子和嘴, 是适合视觉识别的事件。
由于输出由不同的位置, 尺度和方向组成, 我们将这些特征连起来成为个特征向量X, 因此特征向量由Gabor变换的实部和虚部组成。不失一般性, 我们假设每个输出是一个列向量, 可以通过构建串联成行 (或列) 的输出。
在每一个像素, 一套卷积系数可以得到的Gabor分解各种不同方向和不同的频率, 其中包括40个复杂子 (5个频率, 8个方向) , 它可以写成:
Jj=ajexp i軆准j軆, 1<j<40 (4)
人脸特色的代表性是在复杂系数40的基础上。
2 利用Adaboost对Gabor人脸特征选择
采用5种频率8种方向的二维Gabor小波变换来进行人脸图像特征提取, 对于M×N的样本图像会产生40×M×N维的高维特征向量, 所以必须进行降维。如果采用PCA (主成分分析方法) 进行降维, 需要进行矩阵运算, 消耗一定的计算时间和存储空间, 且采用PCA降维如果维度减少过多, 那么就无法充分体现样本之间的差异性。
为了解决这个问题, 更加直接的方法是从高维特征中选取小部分具有很强的区分 (分类) 能力的特征, 由这部分特征组成分类器, 这样就避免了在分类过程中进行的降维运算, 本文选用Adaboost算法解决此问题。
2.1 算法原理
Adaboost是Freund和Schapire根据在线分配算法提出的一种迭代算法, 他们详细分析了Adaboost算法错误率的上界, 以及为了使强分类器达到错误率, 算法所需要的是最多迭代次数等相关问题[7]。该算法的核心思想是针对同一个训练集训练不同的分类器 (弱分类器) , 然后把这些弱分类器集合起来, 构成一个更强的最终分类器 (强分类器) 。
Adaboost算法利用大量分类能力一般的简单分类器 (称为弱分类器) , 通过一定的方法叠加构成分类能力很强的强分类器。理论上, 只要弱分类器的分类效果比随机分类好, 就可以构造出强分类器, 其分类错误率趋于零, 并具有很好的泛化能力。Adaboost算法略作修改, 也可用于特征选择。只要令每个弱分类器仅对应一个特征并根据特征值的大小来进行分类判断, 则Adaboost挑选弱分类器的过程也就是挑选特征的过程。每一轮循环挑选出在当前权重分布下具有最佳分类表现的特征, 每个特征都是在已经选择出的特征所确定的权重信息前提下选择出来的。
2.2 训练方法
人脸特征主要是用五官来表现出来的, 五官的位置不同, 所呈现出来的特征的重要程度也不一样, 为了能挑选出最重要的特征进一步降低特征向量维数[8], 我们提出了一种基于多分类器层级检测的方法, 该方法的主要思想为:采用固定的正样本集合与不同的负样本集合分别训练强分类器, 然后将所有的强分类器组成层级检测分类器, 这样的好处是随着不断测试, 可以不断增加有针对性的负样本用于新的强分类器的训练。图1显示了采用单一正样本集合与多个负样本集合训练的层级检测分类器。
3 实验结果及分析
选用Ya Le人脸数据库[9]进行实验。该数据由有15人, 每人11幅图像组成, 分辨率均为320×243像素。每人选2幅图像训练, 其余图像作为测试, 最后再将得到的识别率取平均得到整体识别率。
为了比较不同尺度的Gabor特征对于人脸表情区分能力的强弱, 表1列出了采用不同尺度Gabor特征直接以SVM[10]进行分类时的识别效果。
由表1可知, 不同尺度的Gabor特征对人脸表情的区分能力是不一样的。单采用小尺度Gabor特征时的识别效果并不理想, 说明单凭人脸上细微的纹理变化不足以很好地区分各类表情。尺度3和尺度4的区分能力最强, 说明表情引起的人脸纹理的变化幅度多集中于这尺度范围。将各尺度的特征结合起来, 综合考虑各种幅度的纹理变化, 可以得到更好的识别效果。由于大尺度的Gabor滤波器模板尺寸大, 运算耗时, 综合考虑, 采用了由尺度0到尺度4的滤波器组。
为了测试以Adaboost进行特征选择的作用以及分类器的性能, 表2中比较了采用不同特征降维方法和不同分类器[11]的识别效果。
实验表明, 该方法具有很好的识别效果, 最高达到了97.18%的识别率。
基于生物特征的识别技术是一门利用人类特有的个体特征来证实个人身份的科学, 它提供了一种基于惟一的、高可靠性和稳定的人体生物特征的新的身份鉴别途径, 是身份识别的一种最安全的方式。Gabor特征具有可容忍一定的定位、对齐误差和对全局光照变化不敏感的优点, 但是只考虑了人脸上的纹理信息, 如果再与人脸的形状信息相结合[12]可望进一步提高识别效果, 这是我们下一步进行研究的方向。
为了使现有的人脸识别技术走向成熟, 达到先进、经济和实用的最终目标, 并且能精确地提取人脸图像的特征, 我国的研究方向主要是利用支持向量机 (SVM) 分类系统、最小中值距离分类器, 对图像进行分类识别, 并将分类出来的图像进行比较、总结, 从而得出更加精确的实验结果。
摘要:通过提取人脸图像的Gabor特征, 结合Adaboost进行人脸识别。针对Gabor特征维数高、冗余大的特点, 引入Adaboost算法进行特征选择降低特征向量的维数, 对于大量的Gabor特征进行选取。同时采用单一正样本集合和多个负样本集合分别进行训练的方法构建多个强分类器级联的层级分类器。在YaLe库上进行测试的结果验证了该法的有效性。
GABOR算法 篇7
在基于内容的图像检索(CBIR,Content-Based Image Retrieval)方法中,以Gabor滤波器提取纹理特征作为检索依据是基本的方法之一[1,2,3,4,5,6,7]。
Manjunath等将Gabor滤波引入CBIR工作,并同时利用4个尺度6个方向的滤波系数的均值和方差组成的特征向量进行检索,查准率在25%~54%之间[1]。Zhang等利用图像Gabor滤波在5个尺度6个方向的滤波系数的均值和方差组成的特征向量进行检索,并且证明了系统能力的旋转不变性特征[2]。Chen等研究了在CBIR工作中Gabor滤波器模板大小及相关参数的关系,得到了在一定查全率的情况下,滤波器模板大小为13×13时查准率最佳,但与9×9的模板差别不大[3]。Andrysiak等给出了利用Gabor滤波器提取纹理特征并结合图像的色彩、形状特征的多层次的图像检索方法[4]。Mahmoud等利用Gabor滤波器作为纹理提取工具,通过改进的非线性的Radon变换(Radon transform)对纹理的方向、一致性进行估计从而实现CBIR,按方向估计时查准率达83.5%,按一致性估计时查准率达到了90.8%[5]。然而,Deselaers等对比了十九种特征提取方法用于图像检索,Gabor滤波的两种方法中,Gabor直方图法位于第8位查准率(平均39.4%),Gabor向量法的查准率只有25.7%,位于倒数第2位[6]。
这些研究都没有考虑多尺度和多方向上提取的滤波系数所给出的纹理特征的进一步挖掘,而图像作为一种二维光学能量分布,其局部强度在各个尺度和方向上的分布特征不仅体现在其滤波系数的均值和方差上,还体现在其峰态、偏态、平滑度以及一致度等分布特征上。因此,本文在利用一个4尺度6方向的Gabor滤波器组进行图像纹理特征提取的基础上,提出用这些滤波系数的高阶矩组成的向量来表示图像特征,并提出了在Gabor滤波组实现的多分辨率域上纹理平滑度和一致度的度量方法,并利用Gabor滤波系数的各阶矩与平滑度和一致度参数组成的向量进行图像检索。实验证明,所提出的方法具有较高的查准率,平均查准率达63%,对于纹理特征明显的图像,查准率超过了90%。
1 二维Gabor滤波、滤波器组与图像特征提取
1.1 Gabor滤波器组
采用奇对称Gabor滤波器提取图像纹理特征:
其中:ω是高斯函数的调制频率(或称滤波器的中心频率),σx,σ分别是高斯函数沿x方向和y方向的标准方差,决定了高斯窗口的大小,也被称为尺度因子。通过对二维奇对称Gabor基函数进行尺度扩张和旋转变换,可以得到一组自相似的滤波器:
尺度扩张:ω=ωmaxfs
旋转变换:x=xθcosθ+yθsinθ;y=-xθsinθ+yθcosθ其中:θ=rπk,k和s分别表示滤波器组的方向数和尺度数,r∈[0,k-1],f s表示滤波器的带宽是随尺度呈指数递增的。
Daugman等通过对人类视觉系统的研究[8],提出以下符合人类视觉感知的参数设置:
1)高斯窗口的标准方差比σy/σx=2;
2)滤波器的半峰值带宽φ取1~1.5倍频程。
基于此,本文取尺度数s=4,所用的Gabor滤波器组由4个尺度6个方向,一共24个二维奇对称Gabor滤波器组成,窗口大小设置为2σx×2σy,即从2×4倍增到16×32。
因此,对图像的二维Gabor滤波为
其中ψ(x,y;s,θ)为尺度为s方向为θ的Gabor滤波器。
1.2 多尺度多方向图像特征的提取
为了最大程度地获得图像纹理特征,并将其同时用于图像检索,采用如图2所示的算法进行图像特征提取,即:
1)按上述要求进行Gabor滤波器的设计,将多个Gabor滤波器组成滤波器组;
2)将待检索图像通过滤波器组,获得不同尺度不同方向的滤波系数;
3)统计这些滤波系数的各阶矩特征及平滑度、一致度特征,由这些矩组成图像特征向量。
考虑到图像纹理特征在不同的尺度和不同的方向上是不同的,通过具有不同分辨率和方向的Gabor滤波器组,可以获得多尺度且多方向上的滤波系数,这些滤波系数本身的特征可以由各种统计特征参数反映。因此,选择多个高阶矩组成的特征向量来反映图像在不同尺度、不同方向上图像纹理特征的统计分布特征,即可利用这一特征向量进行图像检索。
2 滤波系数各阶矩及相似性度量
2.1 滤波系数各阶矩
对于随机过程的一个样本X,若µk=Ε[(X-E(X))k]存在,则称其为X的k阶中心矩。随机过程的各阶矩可以衡量其一般特征。
传统的基于Gabor滤波的图像检索技术大多提取Gabor小波系数的数学期望µs,θ和二阶矩-方差σs,θ作为图像的纹理特征,即:
这里,引入Gabor滤波系数的三阶矩、四阶矩和能量,定义在各个尺度s和方向θ上的偏态δs,θ、峰态ks,θ和能量es,θ分别为
偏态、峰态和能量分布衡量了在滤波尺度和方向上的纹理分布的对称程度、陡峭程度和总能量。
2.2 纹理平滑度和一致度
为了突出滤波后所得到的系数体现出的纹理特征,引入纹理平滑度Rs,θ和一致度Us,θ:
其中σs,θ是Gabor小波系数的标准方差。图像在s尺度θ方向上的纹理越平滑,平滑度Rs,θ值越大,图像在s尺度θ方向上的纹理越粗糙,平滑度Rs,θ值越小。该定义是沿用其在灰度直方图中的原定义,因为标准方差σs,θ在灰度直方图中和Gabor小波系数中具有相似的物理意义,即都反映了图像纹理的分散程度。
其中:σs,θ是图像某个尺度某个方向上的小波系数的标准方差,ps,θ=σs,θ/∑s∑θσs,θ则表述了该尺度该方向上的纹理方差对图像各方向各尺度纹理方差总和的贡献率。因此,该定义描述了图像各个方向各个尺度上的纹理信息分布的规律性,各个方向各个尺度上的纹理分布越平均,Us,θ值越小,反之,各个方向各个尺度上的纹理分布差异越大,Us,θ值越大。
2.3 多特征融合的相似性度量
通过实验发现能量、标准方差、峰态、平滑度和一致性度量都是有效的特征量度,反而经常被用做特征量度的数学期望在区分纹理方面的效果不好,偏态区分纹理的效果最差。基于此,标识图像特征的特征向量可表示为
其中,向量下标即4个尺度6个方向。基于上述算法,可以将本CBIR方法简称为GMM法(Gabor Multi-moments method)。采用欧式距离测度各图像间的相似程度。
3 实验结果及分析
从Brodatz纹理库和Corel图像库中选取10幅典型图像作为待检索图像,如图3所示。并以这10幅图像为类别每类图像选取50个样本,组成500幅图像的图库。查准率(precision)按通用定义计算。
本文用于做比较的是传统µσ检索法,即只用滤波系数的均值和方差组成的特征矢量作为检索依据。为了突出特征空间构成的不同对图像检索结果的影响,µσ法算法流程设置成与GMM算法的流程相同,只是在提取特征向量时,µσ法只提取Gabor小波系数的期望和标准方差作为特征,而GMM法则提取Gabor小波系数的能量、方差、峰态、平滑度和一致性度量作为特征。
实验表明:
1)所提出的GMM算法比Deselaers等对比的十九种特征提取方法中所涉及的两种Gabor滤波方法,Gabor直方图法(Gabor histogram)和Gabor向量法(Gabor vetor),平均查准率分别高出27.6%与41.3%,且比其用于对比的最好方法,颜色直方图(color histogram)高出8.9%,这表明Gabor滤波方法只要深入挖掘其系数特征,仍可获得较好检索性能。
2)传统µσ法检索查准率与已报道的一致,查准率在22%~81%之间,且提出的方法与传统方法的查准率趋势一致。其中,纹理特征不明显且图像光滑的样品7、9,查准率最低;纹理特征明显的样品2、8、10,两种方法都获得了较高的查准率。表明Gabor滤波在纹理特征明确的图像检索具有较大优势。
3)所提出的GMM算法比传统的µσ法平均检索性能高出23%。对于纹理特征不明细的图像,检索性能也高出13%~15%;对于纹理特征明显的图像,检索性能高出12%~43%;对于纹理有明确尺度特征和方向性的图像,如样品1、2、4、6、8,检索性能改善最大,平均优化33.2%,最高优化达43%。对于纹理在各个尺度上都具有各向同性特征的图像,如样品5,所提的算法比传统方法优化不大。可见,对于纹理尺度特征和方向特征明显的图像,所提出的方法具有明显的优势。
4 结论
本文在多尺度多方向的Gabor滤波器组提取图像纹理特征的基础上,提出了一种利用滤波系数高阶矩进行图像检索的方法,这样,不仅利用了多通道的Gabor滤波器对图像纹理特征的选择性,而且充分反映了在不同尺度和不同方向上图像纹理的统计特征。为了更好地反映滤波后在特定尺度和特定方向上图像纹理的特征,引入了纹理平滑度和一致度的算法,并将纹理平滑度一致度作为纹理高阶统计参量纳入特征向量。通过利用图像在4个尺度6个方向的Gabor滤波系数高阶矩所组成的特征向量进行CBIR,获得了较好的查准率。
可以看到,在利用Gabor滤波系数高阶矩时,图像特征向量的计算量增加,因此,进一步可考虑在一定的特征判断基础上采用自适应方法,一方面提高检索特征提取的针对性,另一方面可减少检索计算量。
参考文献
[1]Manjunath B S,Ma W Y.Texture Features for Browsing and Retrieval of Image Data[J].IEEE Trans.Pattern Analysis and Machine Intelligence(S0162-8828),1996,18(8):837-842.
[2]ZHANG Deng-sheng,Wong Aylwin,Indrawan Maria,et al.Content-based Image Retrieval Using Gabor Texture Features[C]//Proc.of first IEEE Pacific-rim Conference on Multimedia,Fargo,ND,USA,October24-26,2001:1-9.
[3]Chen L,Lu G,Zhang D.Effects of Different Gabor Filter Parameters on Image Retrieval by Texture[C]//10th International Multimedia Modelling Conference,Brisbane,Australia,Jan5-7,2004:273-278.
[4]Andrysiak T,Choras M.Image Retrieval Based on Hierarchical Gabor Filters[J].International Journal of Applied Mathematics and Computer Science(S0218-1967),2005,15(4):471-480.
[5]Mahmoud R H,Ho Y.An Efficient Approach to Texture-Based Image Retrieval[J].International Journal of Imaging Systems and Technology(S0899-9457),2007,17(5):295-302.
[6]Deselaers T,Keysers D,Ney H.Features for Image Retrieval:An Experimental Comparison[J].Information Retrieval(S1386-4564),2008,11(2):77-107.
[7]Kamarainen J K,Kyrki V,K?lvi?inen H.Invariance Properties of Gabor Filter-Based Features-Overview and Applications[J].IEEE Trans.Image Process(S1057-7149),2006,15(5):1088-1099.