变换不变量

2024-10-23

变换不变量(精选4篇)

变换不变量 篇1

纽结理论是数学学科代数拓扑的一个分支, 拓扑学是研究几何图形的连续变形的学科。纽结理论通常研究圈 (或多个圈) 在变形下保持不变的特性, 在复杂分子空间的分子化学和DNA构形的分子生物学研究中有重要应用。

纽结理论的基本问题就是任给一个纽结, 怎样判断它是不是平凡的?任给两个纽结, 怎样判别它们是否同痕?为此, 数学家提出了一条思路, 即纽结不变量方法。最初, 数学家设想用相交数来做同痕不变量, 所谓的相交数是指一个纽结中交叉点的个数。容易知道, 相交数不同的纽结不是同痕的, 而相交数相同的纽结是否同痕则不能断定。可见, 相交数虽便于计算, 但鉴别力不强。1928年, A lex ander发现可以利用具有整数系数的多项式为纽结定义一个不变量, 不同的多项式对应于不同的纽结。这个工作的重要意义在于能够在一定程度上对所有纽结进行分类, 它的缺点是无法区分开纽结和它的镜像。1984年, 新西兰数学家Jones从他关于算子代数的定理中引申出纽结的一个多项式。它是同痕不变量, 计算也方便。后来, Kauffman提出用一种所谓的尖括号多项式以及纽结的状态描述给出了一个新型的多项式不变量, 即构作Jones多项式这一威力巨大且应用广泛的同痕不变量。

自从Jones多项式问世以来, 其算法实现备受关注。尽管相对于其它同痕不变量而言, 其计算规则简单, 但手工计算依然繁琐。开发相应的程序已经成为纽结理论研究中一项极有必要和极富价值的工作。国外此项工作的现状是:将众多纽结标准化 (即将纽结的投影图画得美观而简洁) 并编号, 开发出一种软件, 输入某个纽结的相应编号, 即可算出该纽结的Jones多项式。

数学上研究的纽结是三维空间中的简单闭曲线, 即连通的封闭的不自交的曲线。而平凡纽结, 是指放在一个空间中的圈。一个圈是一个平凡的纽结, 我们说这两个纽结是等价的, 或同痕的, 如果一个纽结在空间中经过自由的连续变形, 不许剪断, 不许粘合, 而变成另一个。纽结可以用投影图来确定, 其中的投影图满足以下标准:只有有限多个重叠点;每个重叠点都是二重点;每个二重点处, 上下两线的投影图都是互相穿越交叉的。当说到投影图时, 总是指已经用虚实线标出了交叉情况的图, 用此图来代表一个纽结。图1便是一个投影图形式的纽结。

一个投影图代表一个纽结, 可一个纽结却有不同的投影图表示。由此可见, 要利用投影图来研究纽结理论, 先决条件是必须弄清楚:纽结在空间中的移位变形怎样在投影图上反映出来。德国数学家Re idem eister在上世纪20年代提出以下定理:纽结的同痕形变本质上是由投影图的如下三种初等变换来刻画的, 如图2。在上述三种初等变换的定义下, 称两个投影图为等价的, 或同痕的, 如果从一个投影图出发, 经过一连串的初等变换以及平面变形, 可以得出另一个投影图。

称一个纽结的投影图的性质P为该投影图的同痕不变量, 如果该投影图在三种初等变换下保持不变。同痕不变量的主要用处是, 既然互相同痕的纽结的投影图可以经过一连串初等变换互相转化, 那么同痕的纽结应该有相同的不变量。换句话说, 如果两个纽结有不同的不变量, 它们就一定不同痕。纽结理论的主题就是, 寻求既便于计算又有很强的鉴别力的同痕不变量。

纽结理论的发展比较迅速, 纽结理论的应用也比较广泛, 所以这一工作意义深远。

摘要:文章从纽结的由来及定义谈起, 介绍了拓扑学中的重要部分———纽结理论的基本概念, 纽结的表示与变换以及不变量。

关键词:纽结,纽结变换,纽结表示,不变量

参考文献

[1]陶志雄.二邻近纽结的投影图[J].浙江科技学院学报, 2010, 3.[1]陶志雄.二邻近纽结的投影图[J].浙江科技学院学报, 2010, 3.

[2]吴华安.纽结的同调与同伦[J].武汉交通科技大学学报, 1996, 4.[2]吴华安.纽结的同调与同伦[J].武汉交通科技大学学报, 1996, 4.

[3]李起升.一类纽结的Conway多项式不变量[J].系统科学与数学, 1995, 4.[3]李起升.一类纽结的Conway多项式不变量[J].系统科学与数学, 1995, 4.

基于尺度不变特征变换的图像检索 篇2

基于内容的图像检索(CBIR)是计算机视觉在图像检索中的一个重要应用。常见的基于内容的检索利用全局内容特征,例如颜色、纹理以及形状中的一种或多种特征来进行图像的检索。这种检索往往忽略了图像内容的局部细节部分,而不能达到很好的检索性能。基于局部特征的检索是通过提取图片中的一些关键点,并通过这些点的相似度来决定两幅图片的相似度。局部特征已经被普遍应用于图像检索中[1,2,3]。因为它们不仅容易计算,具有一定的图像变换不变性,而且对于部分被遮挡的物体也能较好地识别。

1 SIFT描述子构造

SIFT是一种对尺度、旋转、仿射以及亮度变化都有很好的不变性的特征[4,5,6]。SIFT的提出是为了解决Harris的角点检测不具有尺度不变性的问题。 SIFT特征描述子的生成主要包括极值点检测、关键点定位、关键点梯度方向计算以及SIFT描述子4个步骤。

1.1 极值点检测

第一步是在尺度空间上检测极值点。SIFT中使用的是高斯核差分的尺度空间,它近似于归一化的拉普拉斯尺度空间。对于要处理的图片,SIFT先用不同的核对其进行高斯平滑。I(x,y)表示原图,G(x,y,σ)为高斯变换,L(x,y,σ)则为原图经过高斯变换后的图片。如下式:

L(x,y,σ)=G(x,y,σ)*I(x,y)。 (1)

相邻尺度的高斯平面相减后,得到不同尺度的高斯核差分(DoG)的尺度空间。在DoG尺度空间上进行的极值点检测能使SIFT特征具有较好的尺度不变性。DoG可直接通过相邻尺度的高斯面相减而得到。如图1中,左边的是经过不同高斯平滑后的高斯平面,右边是相邻尺度的高斯面相减后得到的高斯差分面(DoG)。计算出高斯差分平面之后,对于其上的某一点,将它与周围的8近邻点以及上下相邻尺度的对应位置的9近邻点(共26个点)进行比较,若该点都大于或都小于这26个点,那么这个点将被选取为极值点。

1.2 关键点准确定位

DoG空间中选取出来的极值点是灰度变化的极值点,包含着图片的结构信息。但这些点还需要进一步的处理,去掉低对比度的点,因为低对比度的点对噪音比较敏感。首先,对DoG尺度空间函数D(x,y,σ)进行Taylor展开;其次,将检测到的极值点x^代入到Taylor展开式中,当算得的绝对值小于某个阈值(0.03)时,则这个点对比度较低,将被舍弃。

由于DoG对边缘有很强的响应,因此检测到的边缘点也要去掉。DoG在沿着边缘方向上的主曲率值会很大,而在与边缘方向垂直方向的主曲率值会较小。令α为沿着边缘方向的主曲率,β为与边缘垂直方向的主曲率。α=γβ,则当γ大于某个阈值(10)时,则作为边缘点舍弃。

过滤掉对比度低的点及边缘的点后,剩下的点即为关键点。由于关键点分布在不同尺度空间的不同位置上,这样可保证SIFT的尺度缩放不变性。

1.3 关键点梯度方向计算

在确定关键点后,为了保证特征的旋转不变性,SIFT通过关键点周围区域的梯度方向分布来表示关键点的方向。在尺度空间的高斯图片L( x,y,σ)中,关键点 ( x,y ) 周围区域的梯度模值m( x,y )和方向θ( x, y )如下:

m(x,y)=(L(x+1,y)-L(x-1,y))2+(L(x,y+1)-L(x,y-1)2,θ(x,y)=tan-1((L(x,y+1)-L(x,y-1))/(L(x+1,y)-L(x-1,y)))

然后对关键点周围区域的梯度方向进行直方图统计,以每10°为一个桶,平面上360°角可分为36个桶。根据梯度方向值将其关联到对应的桶中,权值由该梯度的模值大小来确定。SIFT用以关键点为圆心的高斯加权窗口来对梯度模值进行加权。

对梯度方向的直方图统计后,每个关键点的方向被定义为它的梯度方向的直方图统计中最大值的方向以及大小在最大值的80%以内的方向。

1.4 SIFT特征描述子构造

前面的步骤确定了关键点的尺度、位置以及方向,保证了其尺度缩放不变性及旋转不变性。关键点的检测已完成,现在将构造SIFT的特征描述子。SIFT特征是以它周围区域的像素点的梯度来表示。

梯度模值和方向的计算与第3步中计算关键点方向时的梯度计算的方式类似,只是这里选取的桶个数是8。对于以关键点为中心的周围区域16*16的像素点,计算其梯度方向和模值大小,然后以4*4的区域为单位进行方向的直方图统计。于是,原来的16*16区域的像素点被划分成4*4个4*4的小区域,每个小区域由对应的8个方向的梯度模值表示。因此,最终特征向量为:4*4*8 = 128维的。这便是SIFT的特征描述子。

为了保证SIFT特征对亮度变化的不变性,还需要对提取出来的特征向量进行归一化。这样,便得到了一个对于尺度缩放、旋转和亮度变换等具有不变性的特征——SIFT特征。

2 基于SIFT相关特征的图像检索

SIFT特征计算的简单性,对于尺度,旋转等变换具有很好的不变性,使它被广泛应用到图像检索中[7,8,9]。基于SIFT特征的图像检索的QBE过程,实际上是一种特征提取以及特征匹配的过程。它包含2个步骤:特征的提取跟特征相似度的计算。

2.1 特征提取

SIFT特征的提取包括2个阶段:离线的操作和在线的操作。对于庞大的图片集,先离线提取它们的SIFT特征存到数据库中,作为图像检索时的检索数据使用。在线图像检索时,对用户给出的检索图片提取SIFT特征后,与数据集中的特征进行匹配。然后,根据图片匹配的点数进行降序排序,匹配数目越多说明图片越相似。于是,图片的匹配转换成了图片中关键点特征的匹配。

将SIFT特征的提取分成离线和在线2个阶段是很有意义的,因为耗时的SIFT对于在线检索的实时性是很不利的。而如果先离线提取大量图像的SIFT特征,在线检索时只需要处理一幅图片的特征提取以及相似特征的检索及匹配问题。这样能很大地提高检索速度。

2.2 特征相似度计算

对于提取后的SIFT特征,检索过程要计算示例图片的特征向量与数据集中的特征向量的相似性。对于特征空间中的点,2点间相似度度量有2种常用的方法:一种是直接计算点间的距离,距离越小,相似度越大,常用的方法有曼哈顿距离和欧氏距离;另一种是计算给定点的最近距离和次近距离,当它们的比值越小,相似度越大[10]。第2种方法相对而言更准确,因为若2个特征向量匹配时,则它们间的相似度应该远大于它们和其他点间的相似度。因此,文中对于示例图片中特征向量的相似特征的检索采用的是第2种方法。

3 实验结果分析

实验中将基于SIFT的检索应用于3种类型的图片集,主要是通过对不同类型的图片比较SIFT特征进行匹配的效果。图片集包含600幅图片,其中建筑物图、室内图以及商标的图片各200幅。3种图片集的选取出于这样的考虑:室内的图片是为了观察对于室内的物体多且杂乱时,SIFT特征的性能如何。对同一建筑物的不同视角,以此对比同一物体的SIFT特征匹配的效果。对于企业徽标进行的实验主要是讨论SIFT对于相似的抽象图案的匹配结果。表1给出了利用SIFT特征对3类数据集的检索结果。

实验结果总结SIFT特征的特点如下:首先,SIFT特征是一种具有尺度、旋转不变性的局部特征,它对于视角变化(±35°)的图片也能较好的匹配。其次,SIFT特征提取的特征数目与图片的具体内容以及图片的分辨率成正比。最后,SIFT特征很适合用于相似图案的检索,它对同一场景或同一物体不同大小或小视角变化的检索结果也较好。从实验结果中可以看到,SIFT特征仍有它的局限性:一是SIFT的特征向量维数太高,对于较大的图片SIFT特征提取的特征数目很大,使得匹配速度慢;二是SIFT特征仅依靠点来描述物体,对位置等全局信息包含得还不够。

4 结束语

SIFT特征是一种对尺度,旋转变换等具有较好的不变性的特征。它很好地描述了局部信息,因此它在计算机视觉相关的邻域有很好的应用。同时,它也有特征向量维度高、匹配时间开销大以及缺少对全局信息的描述,只适用于对同一物体的匹配的局限性。高维特征向量的问题,可以通过对SIFT特征进行降维减少时间开销,或者通过采用分布式计算,从而提高检索速度。缺少对全局信息的描述,可以把SIFT与其他不同的特征(如颜色、形状和位置信息等)结合起来,提高全局信息的检索精度。

参考文献

[1]SCHMID C,MOHR R.Local Grayvalue Invariants forImage Retrieval[J].IEEE Transactions on PatternAnalysis and Machine Intelligence,1997,19(5):530-534.

[2]MIKOLAJCZYK K,SCHMID C.Indexing Based on ScaleInvariant Interest Points[C]//In Proc.of InternationalConference on Computer Vision,2001:525–531.

[3]KE Y,SUKTHANKAR R.Efficient Near duplicateDetection and Sub-image Retrieval[C]//InternationalMultimedia Conference Proc.of ACM,2004,60(2):869-876.

[4]MORTENSEN E N,DENG Hong-li,SHAPIRO L.A SIFTDescriptor with Global Context[C]//Computer Visionand Pattern Recognition,IEEE Computer SocietyConference,2005:184-190.

[5]EGENHOFER M.IEEE Symposium on Visual Languages[C]//IEEE Computer Society,1996:60-67.

[6]BRUNELLI R,MICH O.Image retrieval by examples[J].IEEE Trans.Multimedia,2000,2(3):164-171.

[7]EAKINS J P M,GRAHAM M E.Content-based ImageRetrieval:A Report to the JISC Technology ApplicationsProgramme[R].In:Institute for Image Data Research.University of Northumbria at Newcastle,Newcastle uponTyne,1999.

[8]汪道寅,胡访宇.基于改进SIFT算法的视频序列图像配准[J].无线电工程,2011,41(2):16-18.

[9]李向阳,庄越挺,潘云鹤.基于内容图像检索技术与系统[J].计算机研究与发展,2001,38(3):344-354.

变换不变量 篇3

人脸检测是一个开放性的、比较活跃的研究课题。在人脸检测算法中,迄今为止主要有模板匹配模型、肤色模型、ANN模型、SVM模型和Adaboost模型等。核机器学习方法是核函数方法在机器学习领域的应用。该思想在机器学习中的成功应用最早源于支持向量机(SVM)[1]。支持向量机是近十几年来发展起来的模式分类方法,在模式识别领域有广泛的应用。最初的SVM 主要用于解决两类问题的分类。后来,许多学者改进了SVM 的核心设计,或者与其他理论结合,提出各类改进的支持向量机。与模糊理论相结合,提出模糊支持向量机[2](FSVM)。模糊支持向量机的核心问题是隶属度函数的设计问题。紧密度模糊支持向量机在确定样本的隶属度时,不仅考虑了在特征空间中,样本与最小包围球中心之间的关系,样本到最小包围球中心之间的距离越大,则该样本属于该类的隶属度就越小;同时,考虑了在特征空间中样本分布范围对于隶属度的影响。但通过大量的实验表明,将0.4作为球内样本隶属度的极小值,球外样本隶属度的极大值,往往不能得到最好的分类效果[3]。基于此,本文提出了一种改进的紧密度模糊支持向量机。该算法将球内样本隶属度的极小值,球外样本隶属度的极大值不再单纯地设为常量0.4,而是变量 ,并采用交叉确认的方式来得到较好的隶属度函数的参数。实验结果表明,该算法具有更好的分类性能。通过人脸检测实验来对改进算法进行测试取得了较好的实验效果。

1算法的基本思想

在人脸的特征提取和分类实验中,首先使用变分的测地活动轮廓模型对人脸分割定位,然后通过尺度不变特征变换SIFT(Scale-Invariant Feature Transform)算法提取人脸图像的特征,根据训练样本集构造基于支持向量分量核函数的分类器,最后用改进模糊支持向量机进行人脸的检测。

2算法的基本原理

2.1测地活动轮廓模型

测地活动轮廓模型算法是一种基于边缘的图像分割方法。如果图像中的对象与背景的分界处存在灰度值的较大差异,那么对象的轮廓就将形成明显的边缘,也就是说图像的梯度模值在对象的边缘处将达到局部极大值。在此思想的基础上,Caselles V,Kimmel R和Sapiao G于1997年提出了不含自由参数测地活动轮廓GAC(Geodesic Active Contour)模型[4]。GAC模型的泛函表示为:

引入正则化函数H(z)可得变分水平集方法,表示为:

GAC模型的梯度下降流表示为:

式中,c为一可选常数,引入δεcg可以加快曲线在图像平坦区演化的速度,g是边缘停止函数,表示为:

式中,z 为图像的梯度模值,r 为正常数,其取值根据具体实验而定,H(z)是Heaviside函数,δε是所选Heaviside函数的导数。

GAC模型的提出使PDE方法在图像分割中的应用产生重大突破,近几年,国内外的研究人员对其进行了不同程度的改进,并取得了一定的成果[5]。

2.2尺度不变特征变换算法

尺度不变特征变换(SIFT)算法由Lowe D G 1999年提出,2004年完善总结,后来Ke Y将其描述子部分用PCA代替直方图的方式,对其进行改进[6,7]。SIFT算法是一种提取局部特征的算法,在尺度空间寻找极值点,提取位置、尺度和旋转不变量。高斯卷积核是实现尺度变换的唯一线性核,因此,二维图像的尺度空间定义为:

式中,G(x,y,σ)是尺度可变高斯函数,表示为:

式中,(x, y)是空间坐标,σ是尺度坐标。为了有效地在尺度空间检测到稳定的关键点,提出了高斯差分尺度空间(DOG scale-space)。利用不同尺度的高斯差分核与图像卷积生成,进一步表示为:

式中,σ是尺度因子,k是在同一阶中相邻两层的尺度因子比例系数。

在上面建立的DOG尺度空间金字塔中,为了检测到DOG空间的最大值和最小值,DOG尺度空间的中间层(最底层和最顶层除外)的每个像素点需要跟同一层的相邻8个像素点以及它上一层和下一层的9个相邻像素点总共26个相邻像素点进行比较,以确保在尺度空间和二维图像空间都检测到局部极值。如图1所示,中间的检测点和它同尺度的8个相邻点和上下相邻尺度对应的9×2个点共26个点比较,以确保在尺度空间和二维图像空间都检测到极值点。

实际计算时,要在以关键点为中心的邻域窗口内采样,并用直方图统计邻域像素的梯度方向。梯度直方图的范围是0度~360度,其中每10度一个柱,总共36个柱。直方图的峰值则代表了该关键点处邻域梯度的主方向,即作为该关键点的方向。图2是采用7个柱时使用梯度直方图为关键点确定主方向的示例。

在梯度方向直方图中,当存在另一个相当于主峰值80%能量的峰值时,则将这个方向认为是该关键点的辅方向。一个关键点可能会被指定具有多个方向(一个主方向和一个以上辅方向),这可以增强匹配的鲁棒性。每个关键点有三个信息:位置、所处尺度、方向。由此可以确定一个SIFT特征区域。首先将坐标轴旋转为关键点的方向,以确保旋转不变性。

接下来以关键点为中心取8×8的窗口。图3(a)的中央黑点为当前关键点的位置,每个小格代表关键点邻域所在尺度空间的一个像素,矢量方向代表该像素的梯度方向,矢量长度代表梯度模值,图中圆圈代表高斯加权的范围(越靠近关键点的像素梯度方向信息贡献越大)。然后在每4×4的小块上计算8个方向的梯度方向直方图,绘制每个梯度方向的累加值,即可形成一个种子点,如图3(b)所示。此图中一个关键点由2×2共4个种子点组成,每个种子点有8个方向向量信息。这种邻域方向性信息联合的思想增强了算法抗噪声的能力,同时对于含有定位误差的特征匹配也提供了较好的容错性。

实际计算过程中,为了增强匹配的稳健性,Lowe建议对每个关键点使用4×4共16个种子点来描述[7],这样对于一个关键点就可以产生128个数据,即最终形成128维的SIFT特征向量。此时SIFT特征向量已经去除了尺度变化、旋转等几何变形因素的影响,再继续将特征向量的长度归一化,则可以进一步去除光照变化的影响。

2.3模糊支持向量机和超球支持向量机

给定模糊样本集{xi,yi,μi}i=1l和核函数K(xi, xj),其中,xiRn,yi∈{- 1,1},μi∈(0,1],K对应某特征空间Z中的内积,即K(xi, xj)=〈g(xi),g(xj)〉,变换g:XZ将样本从输入空间映射到特征空间,μi为训练样本xi属于类别yi的隶属度。

模糊支持向量机的数学模型如下[8]:

式中,w为超平面的法向量,b为超平面的偏置,ξi是松弛变量,C为惩罚因子。

则原始问题式(8)的对偶问题为:

超球支持向量机的数学模型如下[9,10]:

其中,a为球心,R为球半径,ξi为松弛变量,v∈(0,1]为惩罚因子,用来控制包围球的半径与球外样本的个数之间的折衷。

则原始问题式(10)的对偶问题为:

训练超球支持向量机得到k个超球(am,Rm),其中,am是包围m类样本超球的球心,Rm为超球的半径。

紧密度模糊支持向量机的隶属度函数定义如下:

其中,d(xi)=‖g(xi)-ayi‖。

由式(12)可以看出:样本到最小包围球中心之间的距离越大,则该样本属于该样本集的隶属度就越小;同时考虑位于球半径内、外样本的隶属度变化规律不同,采用不同的隶属度函数,且位于超球内的样本,其隶属度都大于0.4;而位于超球外的样本,其隶属度最大值为0.4。但通过大量的实验表明,将0.4作为球内样本点隶属度的极小值、球外样本点隶属度的极大值,往往不能得到最好的分类效果。

扩展的紧密度模糊支持向量机的隶属度函数定义如下:

其中,σ∈(0,1)。

式(13)是式(12)的一般形式,它将位于超球内的样本的隶属度的极小值及位于超球外的样本的隶属度极大值设为σ,即位于球半径内的样本,其隶属度都大于σ;而位于球半径外的样本,其隶属度都小于σ。关于取得σ的较优值,本文采用交叉确认的方式来获得。

3实验结果及分析

本文算法对十幅110×140的正面人脸灰度图像进行实验。其中缩放尺度等于1,旋转因子为0,平移量T=(0,0)。图5是采用GAC模型的分割结果,可以看出基本正确地分割出了人的面部轮廓。

实验中共采集样本400个,每个人10幅不同的图片,共40个人。对每幅人脸取特征,随机选取其中的70%作为训练样本,30%作为测试样本。在检测前,对人脸图像进行几何归一化和灰度归一化,归一化成60×100 的标准人脸图像。实验中使用的核函数为径向基函数(RBF)K(x, y)=e-γx-y‖2和线性核K(x,y)=x·y

图5给出了不同核函数下改进的紧密度模糊支持向量机对于不同σ准确率的变化情况。从图5可以看出,随着σ的增加,准确率呈阶梯上升,一直到达某个极大值后,呈阶梯下降。即该极值点为σ的最优值。实验结果表明,一般情况下,紧密度模糊支持向量机(即σ=0.4)不能得到最优的分类结果,有时甚至与最优值相差较大,如果尝试通过交叉确认的方式可以取得较好σ,一般来说交叉确认的范围越大,步长越小,σ的值越精确,但巡优时间要相应的提高。本文实验中σ范围从0.1到0.9,步长为0.1。

表1给出了支持向量机、紧密度模糊支持向量机及其改进算法在不同核函数下,进行人脸检测的比较结果。系统参数和核函数参数均通过交叉确认得出,其中折取3。从表1可以看出与传统的支持向量机和紧密度模糊支持向量机相比,改进的紧密度模糊支持向量机具有更优的分类性能,更适合用于人脸检测。改进算法与传统模板匹配模型、肤色模型、ANN模型和Adaboost模型相比,因为检测算法具有尺度不变的特点,所以不需要对多个不同尺度的图像进行检测,提高了算法的检测速度和算法的鲁棒性。

4结语

本文首先使用变分的测地活动轮廓模型对人脸分割定位,然后使用尺度特征变换和支持向量机算法对人脸进行检测,其中尺度特征变换算法得到图像的局部特征,且对旋转、尺度缩放和亮度变化保持不变性,对视角变化、仿射变换和噪声也保持一定程度的稳定性。同时,实验证明改进的支持向量机算法具有较好的分类性能,本文算法是一种较为实用的人脸分类检测算法。

参考文献

[1]Vapnik V.The Nature of Statistical Learning Theory[M].New York:Springer,1995.

[2]Huang Hanpang,Liu Yihung.Fuzzy Support Vector Machines for Pat-tern Recognition and Data Mining[J].International Journal of Fuzzy Systems,2002,4(3):826-835.

[3]艾青,秦玉平,方辉,等.一种扩展的紧密度模糊支持向量机及其在文本分类中应用[J].2010,27(4):45-47.

[4]Caselles V,Kimmel R,Sapiro G.Geodesic Active Contours[J].In-ternational Journal of Computer Vision,1997,22(1):61-79.

[5]Li Chunming,Xu Chenyang,Gui Changfeng,et al.Level set evolu-tion without re-initialization:A new variational formulation[C]//IEEE Conference on Computer Vision and Pattern Recognition,Wash-ington,D.C.,USA:IEEE Computer Society,2005,1(1):430-436.

[6]Lowe D G.Object recognition from local scale-invariant features[C]//International Conference on Computer Vision,1999.9:1150-1157.

[7]Lowe D G.Distinctive image features from scale-invariant keypoints[J].International Journal of Computer Vision,2004,6(2):91-110.

[8]张翔,肖小玲,徐光祐.基于样本之间紧密度的模糊支持向量机方法[J].软件学报,2006,17(5):951-958.

[9]Maneivitz L M,Yousef M.One-Class SVMs For Document Classifica-tion[J].Journal of Machine Leaning Research,2002,(2):139-154.

变换不变量 篇4

目前常用的contourlet[2]检索算法主要是对各子带系数求方差和均值, 在图像检索中取得较好的效果, 但是该方法没有考虑图像的旋转问题, 在图像发生旋转时容易发生误判。为了解决这个问题, 本文采用了另外一种contourlet检索算法, 该算法以高频子带的方差和与方差最大值作为图像特征, 可以较好的解决图像的旋转问题。但是, 在视觉感受上完全不同的纹理可能具有相似的子带统计特性[3,4]。旋转不变LBP作为一种基于空域的描述子, 具有旋转不变性, 并且两幅不同的图像不太可能同时具有相似的空域特征和频域特征, 因此, 本文提出了一种融合contourlet变换和旋转不变LBP的旋转不变纹理检索算法。

1 综合contourlet与LBP的旋转不变纹理检索方法

本文检索算法流程图如图1, 首先对图像进行contourlet分解, 产生高频子带和低频子带, 再对几个高频子图像求方差和与方差最大值, 对低频子带进行LBP特征提取, 最后再综合两类特征进行检索。

图1纹理检索算法流程图

1.1 contourlet变换

Contourlet变换[5]通过滤波器组由多尺度变换和方向变换两步完成。首先, 多尺度变换是由拉普拉斯金字塔 (LP) 实现。然后, 在LP不同尺度下的各个差值 (细节) 子带上由方向滤波器组 (DFB) 进行不同数目的方向变换。这样的分解可以在高维情况下每层仅产生一个带通图像, 避免了频谱混叠现象。

图2为一测试图像的方向分解示例, 它是在第一层LP分解后的差值图像上进行的。由图可见, 图像得到了很好的方向稀疏分解, 而且不同的方向子带能够有效地反映不同的图像方向信息。

在未旋转前, 在某个方向的分解子带具有最大的方差, 但是, 在旋转后, 方差最大值往往会反映在另一个方向的分解子带中, 但是, 对同一个纹理进行不同角度的旋转后, 其子带方差最大值与所有子带的方差和是基本不变的, 类内差距很小, 因此, 可以利用这样的特征向量来描述纹理的旋转不变性。

1.2 旋转不变LBP

基本LBP的原理是对于某一像素3*3邻域, 将中心像素与其邻域像素的灰度进行比较, 如果某像素点的灰度值大于中心像素点的灰度值, 则将其置为0, 否则置为1。为了提高基本LBP特征的表达能力, Ojala等人对基本LBP特征进行了扩展, 以中心点为圆心、R为半径的圆周上等间隔地采样P个点。这P个点的灰度值通过与中心点的灰度值比较大小进行二值化。

式中gc为中心像素点的灰度值, gi是以R为半径, P个等间距分布像素点的灰度值。

以上的LBP特征的缺点是旋转相关的, 通过进一步改进, Ojala等人实现了具有旋转不变性的LBP特征[6]。旋转不变的LBP特征, 可由扩展的LBP特征通过数据的循环移位操作实现, 计算公式为:

LBPPri, R=min{ROR (LBPP, R, k) |k=0, 1, 2..., P-1} (2)

其中ROR (LBPP, R, k) 表示对P位二进制数x进行向右循环移位k次 (|k|

2 本算法的提出

纹理图像进行轮廓波系数分解, 选择分解的方法为:按图像分辨率从高到低, 第一层分解为16个方向的子带, 第二层分解为8个方向子带, 第三层分解为4个方向的子带, 第四层为3个子带。

(2) 对4层共31个子带的分解系数求均方差, 并统计相应层的所有子带最大的均方差值, 公式如下:

Mi=max (ei, j) (3)

i表示分解层次, j表示该层的子带位置, ei, j表示在第i层第j个子带分解系数的均方差, Mi表示第i层所有子带分解系数的最大均方差。

(3) 将各层的子带分解系数的均方差进行求和, 公式如下:

Si表示第i层所有子带分解系数的均方差和。

(4) 将最大均方差和均方差和进行级联形成一个特征向量X。

(5) 对4个低频图像分别进行统一化旋转不变LBP特征提取, 其中P=8, R=1, 将所有特征进行级联形成一个特征向量Y。

而判别公式则采用简单的距离公式并赋予权值:

其中, i为特征数量:Xoi, Yoi为目标图像的高频和低频特征向量:Xsi, Ysi为样本图像的高频和低频特征向量。

3 实验结果

本文选取了Brodatz图像库的64副图片, 首先将每一幅图片进行周期延拓, 然后从00旋转到1700, 角度间隔为100, 将旋转纹理图像中心部分提取出来作为旋转后的图像, 提取后的图片大小为256×256, 一共产生828 (46×18) 幅图片。

由于传统的contourlet的检索算法对图像旋转比较敏感, 因此在图3中仅仅只有9幅相似图片被检索出来, 检索效果不能令人满意。而对于本文运用的contourlet检索算法虽然具有较好的旋转不变性, 但是, 由于两幅完全不同的图片可能拥有相似的统计特性, 因此在实际的检索过程中可能会发生误检, 所以在图4中尽管最后一幅图与查询图并不相似, 但是却被检索出来。图5显示了融合后的检索结果, 可以看到, 融合了旋转不变LBP方法后, 原本在图5中误检的图片5_15.bmp没有被检索出来, 检索率达到了100%。

图3是基于传统contourlet方法的检索结果, 图4是基于本文contourlet方法的检索结果, 图5是基于本文contourlet方法与旋转不变LBP的检索结果。

由表1可以看到, 由于受到旋转的影响, 传统contourlet方法的查准率较低, 只有69.32%, 而本文所运用的contourlet方法相对传统方法在查准率有了大幅度提高, 说明了本文contourlet方法有了较高的旋转不变性, 而结合了旋转不变LBP后, 检索查准率有了进一步的提高。

4 结论

鉴于传统的contourlet检索方法对于图像的旋转具有较大的敏感性, 提出了一种融合基于方差和与方差最大值的contourlet变换和旋转不变LBP的旋转纹理检索算法。本文采用的contourlet特征提取方法具有较好的旋转不变性, 是基于变换域的, 而旋转不变LBP是基于空域的, 两者具有互补性, 而视觉感受完全不同的两幅图片可能具有相似的子带统计特性, 因此融合两种方法可以取得更好的检索效果。

摘要:目前常用的基于contourlet变换的检索方法具有较好的检索效果, 但是该方法对于图像的旋转比较敏感。该文采用的con tourlet变换检索算法是以子带的方差最大值与方差和作为纹理图像特征的, 能够较好的反映图像的旋转不变性, 但是视觉感受完全不同的两幅图像可能具有相似的子带统计特性, 为了解决这个问题, 该文将contourlet变换与旋转不变LBP (局部二值模式) 结合进行旋转不变纹理检索, 实验表明, 该方法能够较好表达图像的旋转不变性, 在旋转不变纹理检索中有较好的检索效果。

关键词:contourlet变换,旋转不变纹理检索,旋转不变LBP

参考文献

[1]Smeulders A W M, Worring M, Santini S, et al.Content-based image retrieval at the end of the early years[J].IEEE Transactions on Pattern Analysis and Machine Intelligence, 2000, 22 (12) :1349-1380.

[2]陈新武, 孙秋菊, 龚俊彬.复Contourlet-2.3纹理检索系统[J].光电工程, 2010, 37 (6) :139-144.

[3]赵一凡, 夏良正.基于轮廓波特征的纹理图像识别方法[J].东南大学学报:自然科学版, 2008, 38 (2) :128-131.

[4]练秋生, 李芹, 孔令富.融合圆对称轮廓波统计特征和LBP的纹理图像检索[J].计算机学报, 2007, 30 (12) :2198-2204.

[5]DoM inhN, VetterliMartin.The contourlet transform:an efficient directionalmultiresolution image representation[J].IEEE Transactions on Image Processing, 2005, 14 (12) :2091-2106.

【变换不变量】推荐阅读:

灰度变换07-16

隔离变换10-20

仿射变换05-20

初等变换05-21

阈值变换05-26

矩阵变换05-30

信息变换06-05

对称变换06-15

伸缩变换06-25

三角变换07-01

上一篇:层级设计下一篇:经济型数控系统