方向梯度论文

2024-11-06

方向梯度论文(精选4篇)

方向梯度论文 篇1

0 引言

通信设备的装配过程中由于工作人员疲劳,造成不可避免的错误,进一步降低工作效率。本文提出使用数字图像处理技术进行通信设备装备故障的智能诊断,提高装备装配效率的同时,降低企业资本消耗。

通信设备作为通信网络的四大基本要素之一,其工作的稳定性决定了通信网络工作的稳定性,为数据传输提供可靠的环境。而当通信网络出现故障时,物理层作为整个系统的底层,也应当最先进行故障排查,主要检查其端口差错、漏插等情况,目前使用的主要方法就是靠人眼进行视觉排查,不但效率低而且工作强度高[1,2]。在装配的过程中,为了保证设备装配的准确无误,往往需要配备专业人员或专家进行操作,费时费力成本高。因此本文提出使用机器视觉,在通信设备装备阶段对其漏插故障进行排查,以提高设备的工作稳定性,提高工作效率,降低企业成本。

图像识别技术[3]已广泛应用于包括医学、通信、机器人、航天、监测、生物学和农业等诸多领域。特征提取作为核心技术,一直是国内外的研究热点。1999年,D.G.Lowe[4,5]提出尺度不变特征变换(SIFT),并在2004年完善了该方法。随着对该方法的不断深入研究,出现了许多改进方法,包括PCA-SIFT[6],SURF[7]和Dense SIFT[8]等。2005年,两位来自法国国家计算机技术与控制研究所的研究人员,Navneet Dalal和Bill Triggs[9]在CVPR(IEEE计算机学会计算机视觉与模式识别会议录)提出了梯度方向直方图法(HOG),他们利用该方法对行人进行检测,取得了显著的成效。该方法不断地在各个领域得到广泛的应用,Fengyi Song[10]等人通过多尺度HOG检测,实现了人眼闭合状态的检测,Parul Arora[1 1]等人对行走姿态高斯图像进行了高效的识别。

本文将采用梯度直方图法进行通信设备的检测和识别,通过实验获得最佳参数,实现通信装备内部通信板的识别。再经过灰度变化、图像二值化、边缘提取和区域统计与标记,获得优秀的网孔检测结果,实际证明方法简洁高效,有广泛的应用价值。最后,对检测结果进行了分析,给出了系统的漏检原因,以及进一步改进方向。

1 原理和方法

特征提取,作为图像识别的最基本步骤,其结果的好坏对整个通过识别结果会产生重要的影响。梯度方向直方图法就是对待处理图像进行梯度计算和统计的结果。有如图1所示的待识别图像I(x,y)。

由于光照变化会对图像的特征提取结果造成一定的影响,因此拟优先采用伽马变换对图像亮度进行处理,伽马变换如公式(1)所示:

不同γ值的图像变换结果如图2所示,后续实验结果表明不同的γ值并未引起图像识别结果的剧烈变化。

接下来需要计算图像中任意点(x,y)的梯度幅值和方向,在实际操作中依照公式(2)将梯度幅值分解为水平梯度值和垂直梯度值分别求解:

式中,Gx(x,y)和Gy(x,y)分别是,图像I(x,y)中像素点(x,y)的水平和垂直方向的梯度。在实际计算时,图像都是由离散的像素点组成,所以分别使用两个梯度模板[-1,0,1]和[1,0,-1]T分别计算水平和垂直方向的梯度值。现在任意点(x,y)的梯度幅值和方向可分别用公式(3)和公式(4)求得:

可以看到,进行梯度方向计算时,水平方向的梯度值Gx(x,y)位于分母位置,所以将公式(4)的分母位置加上一个极小量ε,如公式(5)所示:

为了对计算完成的梯度值进行区域性统计,需要将图像划分成许多8*8个像素的cell区域,称之为元胞区域,每2*2个cell区域划分为1个block区域,称之为块区域,如图3所示。

经过前面的梯度幅值和梯度方向的计算后,每个元胞区域中的每个像素点都会有对应的梯度方向和梯度幅值,现本文将0~360度的梯度方向划分为若干个区域,并进行对应的被高斯权重的梯度幅值统计。采用无方向划分,将0~180的区域划分为9个区间,并进行相应的幅值统计,统计完成的一个9维向量即是该cell区域的梯度直方图特征。将4个cell的梯度直方图按照从上到下,从左到右的顺序连接成一个36维的向量,构成该block区域的梯度直方图特征。最终连接所有block的特征向量,构成图1图像的梯度直方图特征向量如图4所示。

2 实验过程和结果

如图1给定待识别图像,该通信板上的所有网孔必须插满网线,于是可知通信板从左到右第2,4,5,6个网孔出现了错误。因此要检测此问题,需使用HOG方法,将图1所示的通信板从图5所示的大型通信机柜中识别出来,再进行网孔插线状态的判断,标记错误网孔信息。

2.1 通信板的测试结果

根据以上原理,选择大小为32*256的样本图像,元胞区域的大小为8*8个像素点,Block区域的大小为2*2个cell区域,即16*16个像素点,梯度方向被分为9个方向。图6(a)为部分正样本图像,图6(b)为部分负样本图像测试过程中,选取了658个样本,其中正样本和负样本分别为128个和630个。由于测试图像的提供受到通信公司的限制,只进行了10幅通信设备图像的测试,表1为统计的测试结果。

从表1可以看出,10个通信板中,检测完全正确的有7个,占到70%,通信板数量为28个,正确检测25个;正确率为89.3%,漏检数量3个,漏检率为10.7%;误检数量0个,误检率为0。此处的通信板检测结果也是制约该系统工作稳定性的重要因素。

2.2 网孔测试结果

在完成通信板的检测后,就要进行网孔状态的测试。以图1为例,利用公式(6)将彩色的图像I(x,y)转化为灰度图像I'(x,y)

式中,R(x,y),G(x,y)和B(x,y)分别代表了彩色图1点(x,y)处的红色分量,绿色分量和蓝色分量,I'(x,y)为转化后的灰度图像,如图7所示。

对灰度化的图像进行二值化处理,并使用Roberts算子对结果进行边缘提取,得到如图8所示的边缘提取结果。

对边缘提取的结果,进行闭合空间统计,根据图8应统计出5个联通区域,如图9所示。

可以看到有明显错误判断,因此对统计结果进行长宽比的限制,如公式(7)所示。

式中,width为标记区域的宽度或列数,height为标记区域的高度或行数。通过公式(7)进行错误区域去除后,得到最终的检测结果如图10所示。

检测结果表明,未插线的网孔得到了正确的检测和标记。

2.3 综合检测结果和分析

最后,本文将通信板识别过程和网孔状态诊断过程综合起来,完成对通信设备的整体检测,以表1中No.2和No.7的检测结果举例,如图11所示,左右两侧通信机柜内均插入了3个通信板。区别在于No.2中有两个通信板是左右紧挨排列,而No.7中有两个通信板是上下紧挨排列。从结果发现,No.2的检测结果要优于No.7的检测结果,可以判断出当两个通信板上下排列时,其图像特征会随图像拍摄角度的变化而相互影响,最终影响通信板的识别结果。

从No.2和No.7的检查结果中可以看出,网孔状态的检测相对准确,没有出现误检和漏检,可见网孔在受到网线干扰的情况下仍具有一定的稳定性和鲁棒性,但是要能够检测网孔状态的前提是通信板检测结果的稳定性,因此更多的样本训练和光照控制将有利于整个系统性能的提高。

3 结束语

本文提出使用图像处理的方法,进行通信设备网孔状态的测试,主要解决通信设备中某类通信工具板内通信网孔漏插错误的判断。

检测分成两个部分:通信板检测和网孔检测。通信板检测中,样本的训练数目和网线之间的相互干扰是制约通信板识别识别率的重要因素,可以通过训练更多的样本和设定某些布线规则来改善。在网孔检测中,通过对数字图像处理技术的灵活运用,检测结果稳健,鲁棒性好,准确率高。综合来看,本文提出的方法可以在不需要进行电气连接测试的情况下,通过机器视觉对通信设备网孔故障进行判断,大大降低设备维护成本,降低对测试人员专业技能的需求,有助于解决企业人口红利的问题,有较广泛的应用价值。

参考文献

[1]胡晓晔.浅谈网络故障诊断[J].China High Technology Enterprises,2010(17):70-71.

[2]庄保新.网络中的常见故障诊断及分析[J].硅谷,2010(8):61.

[3]张家怡.图像识别的技术现状和发展趋势[J].电脑知识与技术,2010,6(21):6045-6046.

[4]Lowe D G.Object Recognition from Local Scale-Invariant Features[C].International Conference on Computer Vision,Corfu,Greece,1999,2:1150-1157.

[5]Lowe D G.Distinctive Image Features from Scale-Invariant Keypoints[C].International Journal of Computer Vision,2004,60(2):91-110.

[6]Yan Ke,Rahul Sukthankar.PCA-SIFT:A More Distinctive Representation for Local Image Descriptors[J].IEEE Computer Society Conference on Computer Vision&Pattern Recognition,2004,2(2):506-513.

[7]Bay H,Tuytelaars T,Gool L V.SURF:Speeded Up Robust Features[J].Computer Vision&Image Understanding,2006,110(3):404-417.

[8]Liu C,Yuen J,Torralba A.SIFT flow:dense correspondence across scenes and its applications[J].IEEE Transaction on Software Engineering,2011,33(5):978-994.

[9]Dalal N,Triggs B.Histograms of Oriented Gradients for Human Detection[C].IEEE Conference on Computer Vision&Pattern Recognition.2005:886-893.

[10]Song F,Tan X,Liu X,et al.Eyes closeness detection from still images with multi-scale histograms of principal oriented gradients[J].Pattern Recognition,2014,47(9):2825-2838.

[11]Arora P,Srivastava S,Arora K,et al.Improved Gait Recognition Using Gradient Histogram Gaussian Image[J].Procedia Computer Science,2015,58:408-413.

方向梯度论文 篇2

关键词:掌纹,三角点,Sobel梯度方向场

0 引言

掌纹是人体的一种生物特征,是人体体表的遗传因子,具有个体特异性和终身不变性。遗传学的研究表明:人体的遗传性病变会体现在手掌纹理上,所以在疾病预测上具有独特优势[1,2]。三角点作为掌纹最重要的细节特征之一,定义为3条不同纹线汇合形成的三角区域,ATD角定义为食指指根三角点(A点)、小指指根三角点(D点)与掌根三角点(T点)之间的夹角。现有研究表明:癌症[1]、精神分裂[3]、先天性弱智[4]等遗传学病人的ATD角与健康对照组存在明显差异,因此准确定位掌纹三角点并提取ATD角作为疾病的特异性特征,对无创的早期诊断具有重要意义。

但是目前的掌纹ATD角特征参数都是人工测量,精度、可靠性非常低,对掌纹三角点检测的自动检测研究较少。所幸三角点被广泛用于指纹匹配与识别领域,学者们提出了一些经典的指纹三角点定位算法[5,6,7,8,9,10],但是这些方法大多是对按压式指纹提取三角点,不能被直接用于掌纹三角点定位。因为相对于纹理较规则的指纹,掌纹图像包含大量噪声,而且这些方法在大幅图像中检测极少数的三角点时效率很低。张泽等[11]提出用改进的庞加莱指数算法对掌纹方向图处理来定位掌纹三角点。郑艳[12]提出动态聚类算法对特殊区域的方向图分割来定位三角点。这些方法适用于油墨捺印或扫描仪按捺采集的、纹路相对清晰的掌纹,处理数码相机采集的包含较多噪声的掌纹时精度较低。而捺印或按捺采样方法会引起掌纹纹路变形,并且会因油墨涂抹不均匀或用力不均匀,而使得部分区域的掌纹不全,导致检测到的三角点位置经常会出现很大偏差[11]。现有的检测数码相机采样的掌纹三角点算法极少。

为准确快速进行掌纹三角点检测,提出了一种基于Sobel梯度算子方向场的掌纹三角点检测算法。为准确采集掌纹沟嵴纹理信息,我们使用数码相机对自然伸张、涂抹炭黑的手掌图像进行采样。对手掌涂抹炭黑的目的是减弱光照影响以使掌纹的皮嵴以及皮沟更加清楚。算法首先对采集的掌纹图像进行去噪、巴特沃斯滤波增强、边缘提取及伪边删除预处理;然后对图像进行分块处理,计算每一子块的Sobel梯度方向场,基于方向场直方图统计子块内每一像素点的方向场数目,将子块内大多数点的方向确定为子块中心点的方向;对掌纹图像的方向场进行三色同质化后,用基于形态的方法进行掌纹三角点定位,并删除伪特征点。将算法用于数码相机采集的212幅掌纹图像进行测试,实验结果表明:提出算法能准确、可靠地检测出三角点,三角点的检测准确率为91.43%,验证了提出方法的有效性和鲁棒性。

本文的创新点在于:提出了对数码相机采样的掌纹图像提取三角点算法,提出了改进的Canny算子对原图像进行边缘提取算法,提出了梯度方向场掌纹三角点定位算法。

1 掌纹图像预处理

为避免掌纹纹理的畸变,使用数码相机对涂抹炭黑的掌纹进行采样。涂抹炭黑是为了增加掌纹凸凹纹理的对比度,减弱光照及肤色对纹理的影响。为了有效提取三角点,先对图像进行预处理。

1.1 图像增强

数字形态学处理结果的好坏最关键的是结构元素的选取,这里主要消除影响纹理提取的噪声,又不改变纹理的结构。通过实验对比发现,扁平的结构元素更接近一维结构,在去除噪声的同时对纹理的破坏性较小,其宽度小于两个条纹的宽度,避免对皮肤纹理的形状产生影响。因此首先对灰度图像进行形态学的灰度腐蚀运算,而后用扁平的结构元素进行膨胀得到处理后的图像,再从原图像中减去处理后的图像,对图像进行顶帽变换。形态学表达式为:

其中f为原始图像,F为顶帽变换后的图像。通过实验发现,在处理过程中,选取扁平的结构元素在去除噪声的同时对纹理的破坏性较小,可对图像进行整体的估计,极大地减轻了光照的影响,使皮肤纹理变得更加清晰。

1.2 改进的CANNY边缘提取

本文利用小波变换的边缘检测方法,构造改进型的Canny算子。传统的Canny算法是对输入图像先构造高斯滤波进行平滑处理,而后计算梯度。而小波变换利用高斯函数的一阶导数直接对图像进行梯度计算。本文结合两者的优点,采用二维高斯函数的一阶偏导数:

其中G为二维高斯的一阶偏导数,x、y为二维方向,σ为方差。构造的x方向滤波器(σ=1)为:

改进的Canny算法提取的边缘图像能很好地反映掌纹纹理的方向,但存在一个点有多个响应的现象,产生的部分边缘线达不到单像素级别,尤其在边缘拐点连接处,使后续求取方向场增加多余的计算量。为了获得单一像素的精细边缘,对图像进行二值化,而后进行细化处理。

本文使用Hilditch算法对获取的边缘进行细化。假设中心像素p的3×3邻域结构如图1所示。

对边缘检测后的图像按照从左到右、从上到下的顺序对每个点进行迭代运算,如果该点满足下列的6个条件,就把它作为背景,从前景中删掉。当迭代运算再也找不到满足6个条件的点时,该算法完结,将边缘检测后的图像进行二值化处理(边缘线的值为1,背景值为0)。

6个条件为:

(1)p为1,即为边缘线中的点,p不是背景。

(2)邻域中x1、x3、x5、x7位置的点像素值不全部为1。

(3)x1-x8中,至少有2个为1(若只有1个为1,则是线段的端点;若没有为1的,则为孤立点)。

(4)p的8连通联结数为1。连通联结数的定义为图像任一点p,其3×3邻域内和该点连接图形的个数,如图2所示。

图2中,左图的4连通联结数是2,8连通联结数是1,而右图的4联通联结数和8联通联结数都是2。

4连通联结数计算公式是:

8连通联结数计算公式是:

(5)如果x3已经标记删除,那么当x3为0时,p的8联通联结数为1。

(6)如果x5已经标记删除,那么当x5为0时,p的8联通联结数为1。

对边缘线进行图像二值化后,适当选取阈值使前景值即边缘线为1,背景值为0。

2 基于梯度方向场的掌纹三角点检测作

2.1 掌纹边缘图形的梯度方向场

因为掌纹的纹线不如指纹规则及清晰,所以现有的指纹方向场提取特征点方法不能直接用于提取掌纹特征点[13,14,15]。本文算法基于Sobel梯度求预处理后图像的方向场。由于预处理后的纹理图像无法避免存在裂痕、噪声点和不准确的纹路边缘线,直接计算出的方向图含有大量的噪声,会严重影响方向场图的使用。为了避免噪声,本文对图像进行分块处理。以每一个像素点为中心划取一个N×N的矩形,统计该矩形内每一个点的方向场,将该区域内大多数点的方向确定为该中心点的方向,以方向场直方图来确定。这种方法分块越大,对块中噪声越不敏感,得到的纹理方向越可靠,但在纹理曲率较大的地方不能求得精准的方向,同时计算量大;分块越小,对纹理方向的拟合程度高,但极易受到噪声纹理的干扰。经过多次实验,矩形块取值在40到60之间可以取得较好的效果,具体步骤如下:

计算纹理图像每一点X、Y方向的梯度x(i,j)和y(i,j),本文使用Sobel梯度算子,接着使用以下公式计算方向场。因处理后的掌纹图像包含干扰条纹,为避免噪声干扰,取矩形块大小为45×45,即w的取值为45。

其中,θ(x,y)即最后求得的方向场。上式所求的方向场在之间,为了在图像显示上保留更多的细节,本文将其归一化至0到1之间得到最终的方向场:

其中,θ(x,y)'为最终得到的方向场。

2.2 方向场同质化

受不可抑制的伪边缘影响,求得的方向场噪声较大。为了更精准求得三角点,将连续的方向场分块同质化,即将图像连续的色彩离散为个数单一色彩的色块,但是色块即同质区域的数量将影响特征点的定位。如果色块数量过小,无法确定特征点位置;若同质域个数过大,一方面计算量增加,另一方面方向场分割过于细致使得质量较差的纹理图的伪特征点数量过多,从而产生误检现象。经实验分析:本文将连续的方向场分为三个同质区域效果较好,既可以消除大量的噪声,又可以精准检测三角点异点。区分三个同质区域的阈值分别为:

2.3 三角点定位

求取掌纹图像的方向场后,传统的三角点检测方法主要是PI值检测方法[16],但是由于掌纹纹理图像噪声较大,验证PI值往往会误检、漏检。本文提出一种基于形态学的直接定位方法。

对同质化图像分析后可以得到以下结论:(1)特征点在形态图像上必满足三个同质域交点的特征;(2)特征点必在两块同质区域面的相交线上,如图3所示。

根据结论(2)可以完成从面到线的转换,从检测图像上所有的像素点到只检测分割块边缘线上的像素点是否满足条件(结论(1))即可。这样简化了算法,提高了检测的效率,以两个结论为原则来实现奇异点的精确定位。

首先检测色块与色块的边缘,因色块内的像素值是均匀的,边缘线易于提取。以同质域Ω(0,0.3)为例,阐述提取方法:

(1)从左到右、从上到下,遍历同质域Ω(0,0.3)所有的点,若像素点f(x,y)⊂Ω(0,0.3)且满足f(x+1,y)⊂Ω(0.3,0.5)或者f(x,y+1)⊂Ω(0.5,0.8)之一成立,则点f(x,y)为边缘点。

(2)重复上述步骤,分别检测同质域Ω(0.3,0.5)、Ω(0.5,0.8)的边缘线。

然后由结论(2)可知,在任一条边缘线上,且同时满足条件(结论(1))的点为特征点的候选点。遍历边缘图像像素值为0.9的点,即当前点f(x,y)⊂Edge(0.9),且该点在同质域图像上8邻域内不同像素值的种类为3种,每种像素值的像素个数为3个,则该点为特征点的候选点。

2.4 删除伪特征点

以候选特征点为中心,在一个w×w的窗口区域上,遍历区域的外缘封闭曲线。若其同质域图像上的像素值变化次数不足6次,且变化间距像素小于w/3个像素,则该点必为伪特征点。

特征点满足如下条件:

其中lchange表示像素变化次数,w为窗口大小。

3 仿真与测试

本文以MATLAB 7.1为开发平台,实验基于的掌纹库是用数码相机采集的来自96个人的212幅掌纹组成,掌纹大小为1200×1200,图像分辨率为600 dpi,彩色图像。展示实验结果皆为随机选择的掌纹图像。

3.1 预处理实现

首先将采集的彩色图像转换为灰度图像,使用扁平结构的形态学滤波器对图像进行增强,并用改进的Canny算子对图像进行边缘检测及细化,实现结果分别如图4(a)-(d)所示。

图4中(a)为原始的三角点区域图像,(b)为涂抹炭黑后采集的图像,与(a)相比,(b)中的凸凹纹理更清晰,减弱了肤色对掌纹纹路的影响。(c)为二值化后滤波增加的结果,增强后的掌纹纹理与背景有较高的分离度。(d)为改进的Canny算子提取边缘及细化结果,提取的主条纹线方向能够很好地表达掌纹的纹理方向,为下步求取方向场确定特征点做了很好的预处理。

3.2 三角点定位实现

在完成预处理后,对掌纹图像提取三角点。图5(a)为细化后的掌纹图像(图4(d))的梯度方向场,图5(b)为归一化后的三个同质区域,图5(c)为对同质区域边缘检测的结果。对同质区域边缘线进行特征点检测后,出现两个候选特征区域,即图5(d)和图5(e),其中前者为三角点,后者为伪特征点。因为图5(e)中同质域图像的像素值变化次数虽然是6次,但变化间距小于w/3个像素,因此被作为伪特征点删除。图5(f)为在原图上标识出来的三角点。

3.3 统计测试

在这一阶段的实验中,以采集的212幅掌纹图像为实验对象,在人工标记出的362个三角点中,本文算法成功地检测到了331个,准确率为91.43%。另外,在其中的9幅图像上检测到伪点18个,在11幅图像发生了漏检现象。相应统计结果如表1所示。

从表1的统计结果可以看出,本文算法可以有效检测出掌纹的三角点。

4 结语

方向梯度论文 篇3

引言内容合成孔径雷达(Synthetic Aperture Radar,SAR)成像是一种有源主动遥感探测系统。由于它具有穿透性能力强、作用范围广,以及全天候全天时全方位监测等特点,对现代测绘和侦察任务有至关重要的作用,是实现地面目标检测、识别、跟踪、监视的最重要的手段之一。然而由于SAR成像固有的特殊性,存在离散性强、噪声大、分辨率低、清晰度差、数据量大等缺点,致使SAR图像目标检测与识别十分困难。因此,对SAR图像的目标检测与识别研究,在国防、军事、遥感、遥测诸多领域,都具有重要的理论意义和巨大的应用价值。

现今比较流行的目标检测技术主要有:1)点目标检测,如采用恒虚警(Constant False Alarm Rate,CFAR)技术[1];2)特定形状的面目标检测,如采用样本相关、模版匹配、形态学处理[2]等;3)盲面目标检测,如采用特征分类、形状描述、分形检测等。分形检测方法具有较好的抗噪性能,同时也可检测出丰富的图像细节,已经广泛地应用于医学图像[3],雷达图像[4]等的分析中。其中,T.Lo等研究了海面雷达反射信号的分形特征及海面目标的分形检测[5],D.Gan、Z.Shouhong研究了海面雷达反射信号的高阶分形特征并将其用于海面目标的分形检测[6]。但这些分形方法主要用于海面目标检测。L.M.Kap lan引入Hurst参数,提出了扩展分形(Extended fractal,EF)特征[7],用于识别SAR图像中特定尺寸的地面目标。

本文根据分形特征在多尺度图像目标检测与识别中的优越性,结合物体的方向梯度能量,以物体能量的差异作为物体的测度,利用测度的分形特征来描述物体,提出了方向梯度能量的分形特征的概念和提取方法,并将其用于二维SAR图像目标的特征描述和检测。方法中,提出了方向梯度能量、方向梯度总能量、总方向梯度能量、方向梯度能量分形特征、复数分形特征等的概念和算法,分析并得出了方向梯度能量分形特征的性质,提取了二维目标的分形特征用于SAR图像目标检测。理论分析和实验结果表明,采用这种方法能够有效地检测不同形状和不同尺寸的目标。同时,这种方法还具有编程简单、运算速度快等优点。

2 物体的分形特征

2.1 物体的分形特征概念

物体的分形特征[8,9,10]是指在不同尺度测量下物体的测度特征。设在尺度r1测量下物体的测度特征为d1,在尺度r2测量下物体的测度特征为d2。则同一物体的测度具有如下特征:

式(2)表示两个测量尺度之间的尺度因子。这个尺度因子不等于零,可用对数来表示,定义为物体的分形特征D:

由式(3)可以看出,在同一分辨率r2=r1下,或在同一测度d2=d1下,物体的维数D=0,即零数维。在不同分辨率r2≠r1下,或在不同测度d2≠d1下,物体的维数D是正实数或负实数,即分数维。因此,分型特征D的定义域为(-∞,+∞)。

物体的分形特征可以是一维、二维、多维的。可以是形状、量度、能量等。同一物体在不同分辨率下有不同的分形特征,不同物体在同一分辨率下也有不同的分形特征。因此利用分形特征来描述物体,不但可以用于不同物体的检测与识别,而且可以用于多尺度下的目标的检测与识别。这就是分形特征的优越性。

2.2 物体的方向梯度能量分形特征

在一个物体内部,每个质点都有能量。相同的质点具有相同的能量,不同的质点具有不同的能量。在不同的物体之间,物体和背景之间,其质点的能量不尽相同。在不同的分辨率下,质点之间的能量也不相同。因此,我们采用能量的差异作为物体的测度,利用测度的分形特征来描述物体的形貌,以便识别不同的物体和多尺度下的物体。

我们定义物体能量差异为方向梯度能量分形特征Er1r2:

其中:∆Er1是在尺度r1下沿某一方向测量的方向梯度总能量,∆Er2是在尺度r2下沿某一方向测量的方向梯度总能量:

这里N+1是沿物体该方向的质点数,∆Eir1是在物体质点i处,在尺度r1下沿该方向测量的方向梯度能量,∆Eir2是在物体质点i处,在尺度r2下沿该方向测量的方向梯度能量:

其中:δr1是在尺度r1下沿该方向的测量半步长,δr2是在尺度r2下沿该方向的测量半步长。pi是质点i的坐标位置,f(pi)是在质点i处的量值。

若沿x方向测量,则x方向的方向梯度能量∆Exir1和∆Exir2分别为

若沿y方向测量,则y方向的方向梯度能量∆Eyir1和∆Eyir2分别为

若沿θ方向测量,则θ方向的方向梯度能量∆Eθir1和∆Eθir2分别为

2.3 物体的方向梯度能量分形特征的性质

正文内容为了研究物体能量差异分形特征的性质,我们假设同一个物体的质点在同一个尺度下具有相同的能量。不同物体的质点之间在同一个尺度下具有完全不同的能量。我们认为,这个假设不失一般性,因为很多情况下这个假设是成立的或近似成立的。如果不成立,可以采用数学变换使物体质点的能量满足或近似满足这个假设。

根据这个假设,由式(7)至式(14)可以看出,如果测量步长的两个端点属于不同物体的两个质点,则质点i处的方向梯度能量等于∆2,否则等于零,即:

由式(15)可知,沿物体某方向的质点的方向梯度能量分布为

式中:p0和pN分别是测量起点的质点和测量终点的质点的位置。由式(17)可知,当物体的沿测量方向的长度小于δr1时,沿测量方向所有质点的方向梯度能量都等于零,而当长度大于δr1小于或等于2δr1时,沿测量方向所有质点的方向梯度能量都等于∆2。当长度大于2δr1+1时,测量方向上中间段质点的方向梯度能量等于零,两边段质点的方向梯度能量都等于∆2。

将式(17)代入式(5),我们会得到在尺度r1下沿某一方向测量的方向梯度总能量∆Er1为

我们还会得到在尺度r1下沿测量路径的方向梯度总能量分布∆Er1(i)为

同理,在尺度r2下测量的方向梯度总能量∆Er2和方向梯度总能量分布∆Er2(i)与在尺度r1下测量的方向梯度总能量∆Er1和方向梯度总能量分布∆Er1(i)具有类似的表达形式。

从上面的研究和式(18)及式(19),我们可以得出方向梯度能量分形特征的性质:

在测量尺度固定的情况下,若物体尺寸小于或等于测量半步长,则方向梯度总能量为零;若物体尺寸大于测量半步长而小于测量步长,则方向梯度总能量随物体尺寸线性增长;若物体尺寸等于或大于测量步长时,方向梯度总能量达到最大值并保持不变。

在物体尺寸固定的情况下,若测量半步长小于物体半尺寸,则方向梯度总能量随测量半步长线性增长;若测量半步长大于物体半尺寸而小于物体尺寸,则方向梯度总能量随测量半步长线性减小;若测量半步长等于或大于物体尺寸,则方向梯度总能量为零;若测量半步长等于物体半尺寸,则方向梯度总能量最大。

当尺度r2=2r1,且物体尺寸等于测量尺度时,方向梯度能量分形特征的值最大,等于log((δr1+1)∆2)。

因为方向梯度能量分形特征具有上述性质,因此,我们提出采用方向梯度能量分形特征来描述物体的特征,以便获得很好的物体检测和识别效果。

3 SAR图像目标的方向梯度能量分形特征及其性质

3.1 计算步骤

SAR图像目标经过图像处理和变换后满足前面对目标能量的假设,于是,我们采用方向梯度能量分形特征来描述SAR图像目标,进行SAR图像目标检测识别。

目前,SAR图像目标都是二维的。能量和方向梯度能量在两维上是互相独立的,或者说是线性可分离的。因此,我们采用x方向梯度总能量∆Exr1,∆Exr2和y方向梯度总能量∆Eyr1,∆Eyr2来描述二维目标总方向梯度能量。

x方向梯度总能量∆Exr1,∆Exr2和y方向梯度总能量∆Eyr1,∆Eyr2分别为

其中:Nx+1,Ny+1,分别是x和y方向的像素数。二维目标总x方向梯度能量Exr1、Exr2和总y方向梯度能量Eyr1、Eyr2分别为

二维目标总方向梯度能量我们用复数方向梯度能量Ĕr1和Ĕr2来表示:

其中j是复数的虚单位。复数的模和辐角分别为

不难看出,复数的模是二维目标的总梯度能量,代表物体尺寸的分形特征。辐角是总梯度能量的方向,代表物体的形状分形特征。

从前面的方向梯度能量分形特征的性质和式(20)到式(37),很容易得出二维目标方向梯度能量分析特征的性质。它除了前面的两条性质外,还具有如下性质:

若物体每个点的总方向梯度能量等于零,则物体的方向尺寸小于测量半尺度;若物体中心点的总方向梯度能量有局部最大值,则物体的方向尺寸等于方向测量尺度;若物体中间点的总方向梯度能量等于零,则物体的方向尺寸大于测量尺度。

若物体各个总方向梯度能量不相等,则物体各个方向尺寸不相等;若物体中心点的各个总方向梯度能量不相等,则物体形状不是中心对称的。

由这些性质可以看出,利用方向梯度能量分形特征,可以检测和识别不同的目标。

3.2 SAR图像目标的分形特征理

在我们的SAR图像目标检测和识别中,我们利用物体的方向梯度能量分形特征的性质和SAR图像目标方向梯度能量分形特征的性质,定义二维目标的分形特征,提取物体的x方向分形特征、y方向分形特征、大小分形特征和形状分形特征。SAR图像二维目标的单尺度分形特征Ĕr1定义为

SAR图像二维目标的双尺度分形特征Ĕr1r2定义为

Ĕr1r2是一个复数分形特征,j是虚单位。实部Exr1r2和虚部Eyr1r2分别定义为

其模|Ĕr1r2|和辐角exp(jφr1r2)分别为

由此,我们在SAR图像目标识别中选取如下四个分形特征:

二维目标的x方向分形特征Ex:Ex=ln(Exr1)(44)

二维目标的y方向分形特征Ey:Ey=ln(Eyr1)(45)

二维目标的大小分形特征Ea:Ea=ln(|Er1r2|)(46)

二维目标的形状分形特征Ed:jEd=ln(e(jϕr1r2))=jϕr1r2(47)

这里ln是取自然对数。

在SAR图像目标检测识别中,我们在不同尺度下,分别计算每个目标的方向梯度能量分形特征,提取出目标的上述四个分形特征。再利用模式识别的方法按照分形特征进行分类识别。鉴于文章篇幅的关系,本文不涉及分类识别的问题。

4 实验与讨论

为了研究相同测量尺度,不同物体尺寸情况下以及同一物体,不同测量尺度情况下的分形特征,我们用测试图像进行了试验。测试图像如图1所示。图中三行分别是三种不同形状的物体,即正方形、圆形、三角形。三列分别是三种不同的尺寸。三列尺寸在x、y方向上的最大跨度分别为11、21、31。实验中的测量尺度采用三种物体的半尺寸,即5、10、15作为测量的半步长。

实验中得出的三个不同尺寸和两个不同尺度下x、y方向的方向梯度能量如图2所示,x、y方向的总方向梯度能量如图3所示。图3中,每点的值代表以该点为中心的测量尺度范围内的总方向梯度能量。二维方向梯度能量复数形式的模与辐角如图4所示。四个不同尺度下二维方向梯度能量的分形特征,同样以复数形式表示,其模与辐角如图5所示。图5中模的局部最大值是相应目标的大小分形特征,对应的辐角值是该目标的形状分形特征。

(a)尺度为5时x方向的方向梯度能量;(b)尺度为15时x方向的方向梯度能量;(c)尺度为5时y方向的方向梯度能量;(d)尺度为15时y方向的方向梯度能量

(a)Directed gradient power along the orientation x under the scale 5;(b)Directed gradient power along the orientation x under the scale 15;(c)Directed gradient power along the orientation y under the scale 5;(d)Directed gradient power along the orientation x under the scale 15;

(a)尺度为5时x方向的总方向梯度能量;(b)尺度为15时x方向的总方向梯度能量;(c)尺度为5时y方向的总方向梯度能量;(d)尺度为15时y方向的总方向梯度能量

(a)Total directed gradient power along the orientation x under the scale 5;(b)Total directed gradient power along the orientation x under the scale 15;(c)Total directed gradient power along the orientation y under the scale 5;(d)Total directed gradient power along the orientation x under the scale 15

(a)尺度为5时总方向梯度能量的模;(b)尺度为15时总方向梯度能量的模;(c)尺度为5时总方向梯度能量的辐角;(d)尺度为15时总方向梯度能量的辐角

(a)Amplitudes of total directed gradient power under the scale 5;(b)Amplitudes of total directed gradient power under the scale 15;(c)Phases of total directed gradient power under the scale 5;(d)Phases of total directed gradient power under the scale 15

(a)尺度为5和10时总方向梯度能量模的分形;(b)尺度为15和30时总方向梯度能量模的分形;(c)尺度为5和10时总方向梯度能量辐角的分形;(d)尺度为15和30时总方向梯度能量辐角的分形

(a)Amplitudes of total directed gradient power fractal feature under the scale 5 and scale 10;(b)Amplitudes of total directed gradient power fractal feature under the scale 15 and scale 30;(c)Phases of total directed gradient power fractal feature under the scale 5 and scale 10;(d)Phases of total directed gradient power fractal feature under the scale 15 and scale 30

由图2和图3可知,当物体尺寸小于测量半步长,则方向梯度能量和总方向梯度能量都为零;若物体尺寸等于或大于测量步长时,总方向梯度能量达到最大值并保持不变。由图4和图5可知,同一物体在不同分辨率下有着不同的分形特征,而不同物体在同一分辨率下的分形特征也不相同。因此,我们在如图3和图5所示的结果图中搜索局部最大值,与之相对应的就是检测到的目标,由对应的方向梯度能量分形值计算目标的x方向分形特征、y方向分形特征、大小分形特征、形状分形特征。

实验的结果和我们理论分析得出的结论完全一致,说明我们利用方向梯度能量的分形特征来描述物体,对于不同物体的检测与识别,和多尺度下的目标的检测与识别是可行的。

(a)尺度15下建筑物目标SAR图像x方向的总方向梯度能量;(b)尺度5下舰船目标SAR图像x方向的总方向梯度能量;(c)尺度15下建筑物目标SAR图像y方向的总方向梯度能量;(d)尺度5下舰船目标SAR图像y方向的总方向梯度能量。

(a)Total directed gradient power along the orientation x under the scale 15 of the building objects in SAR image;(b)Total directed gradient power along the orientation x under the scale 5 of the ship objects in SAR image;(c)Total directed gradient power along the orientation y under the scale 15 of the building objects in SAR image;(d)Total directed gradient power along the orientation y under the scale 5 of the ship objects in SAR image

(a)尺度为10和20下的建筑物目标SAR图像总方向梯度能量模的分形特征(b)尺度为5和10下的舰船目标SAR图像总方向梯度能量模的分形特征

(a)Fractal feature of the total directed gradient power amplitudes under the scale 10 and 20 of the building objects in SAR image(b)Fractal feature of the total directed gradient power amplitudes under the scale 5 and 10 of the ship objects in SAR image;

利用我们提出的二维目标分形特征,进行了SAR图像目标检测试验。图6是建筑物和舰船目标的原始SAR图像。经过图像处理和图像分割后得到只有目标和背景的二值图像。从大测量尺度到小测量尺度依次计算二值图像中目标点的方向梯度能量。图7描述了建筑物及舰船目标SAR图像的X和Y方向的总方向梯度能量。接着提取目标的分形特征,检测出各种目标。图8是建筑物及舰船目标SAR图像的总方向梯度能量模的分形特征。由图可知从大测量尺度到小测量尺度的计算顺序具有保留大目标去除小目标的目标筛选作用,这样做大大降低了运算量,提高了速度。只计算目标点的方向梯度能量,既可减少运算量,又可去除近邻目标的影响。

我们提出的方向梯度能量分形特征算法编程比较简单,因为只进行梯度运算和局部最大值搜索。运算速度也较快,因为我们采用从大测量尺度到小测量尺度的顺序计算,具有目标筛选作用,大大减少了运算量。当然这种方法也有本身的弱点:当两物体的边缘连接在一起时不能达到良好的检测效果。为此,需要事先加入目标分离的算法。

摘要:本文提出一种方向梯度能量分形特征提取方法用于目标的特征描述。该方法中,提出了方向梯度能量、方向梯度总能量、总方向梯度能量、方向梯度能量分形特征、复数分形特征等的概念和算法,分析并得出了方向梯度能量分形特征的性质,提取了二维目标的分形特征用于SAR图像目标检测。理论分析和实验结果表明,采用这种方法能够有效地检测不同形状和不同尺寸的目标。同时,这种方法还具有编程简单、运算速度快等优点。

关键词:合成孔径雷达,特征提取,目标检测,目标识别,分形特征描述

参考文献

[1]Conte E,De Maio A,Ricci G.CFAR detection of distributed targets in non-Gaussian disturbance[J].IEEE Transactions on Aerospace and Electronic Systems,2002,38(2):612-621.

[2]Lee C K,Wong S P.Amathematical morphological approach for segmenting heavily noise corrupted images[J].Pattern Recognition,1996,29(8):1347-1358.

[3]Chen C C,Da Ponte J S,Fox M D.Fractal feature analysis and classification in medical imaging[J].IEEE Transactions on Medical Imaging,1989,8(2):133-142.

[4]Berizzi F,Gamba P,Garzelli A,et al.Fractal behavior of sea SAR ERS-1images[J].IEEE International Geoscience and Remote Sensing Symposium IGARSS‘02,2002,2:1114-1116.

[5]Lo T,Leung H,Litva J,et al.Fractal characterisation of sea-scattered signals and detection of sea-surface targets[J].IEEE Radar and Signal Processing,1993,140(4):243-250.

[6]Gan D,Shouhong Z.High-order fractal characterisation of sea-scattered signals and detection of sea-surface targets[J].Electronics Letters1999,35(5):424-425.

[7]Kaplan L M.Improved SAR target detection via extended fractal features[J].IEEE Transactions on Aerospace and Electronic System,2001,37(2):436-451.

[8]Mandelbrot B B.The Fractal Geometry of Nature[M].New York:W.H.freeman,1982.

[9]Luo Daisheng.Pattern Recognition and Image Processing[M].U.K.Chichester:Horwood Publishing,1998:71-78.

方向梯度论文 篇4

1 基于内容的图像检索技术

基于内容的图像检索技术主要是根据图像的一些低级视觉特征[3], 如颜色、纹理、图像对象的形状以及他们之间的空间关系等作为图像的索引, 计算示例查询图像和图像数据库中图像的相似距离, 按照相似度匹配进行检索。其主要目的是要克服基于文本图像检索技术的局限性。基于内容的图像检索技术具有如下特点:

(1) 直接从图像的内容中提取线索。这一特点使得基于内容的图像检索技术突波了传统的基于关键词检索的局限, 可直接对图像本身进行分析并提取特征, 使得检索能够更加接近目标。

(2) 提取特征的方法多种多样。从图像中可以提取的特征包括颜色、纹理、形状、边缘和目标轮廓等。

(3) 基于内容的图像检索是一种近似匹配。在检索中, 可以采取逐步求精的算法, 每一层中间结果都是一个集合, 不断减小集合的范围, 直到定位到近似目标[3]。

2 梯度方向直方图

法国国家计算机科学及自动控制研究所DALAL等于2005年提出了一种解决人体目标检测的图像描述子, 即梯度方向直方图 (Histogram of Oriented Gradient, HOG) , 该方法使用HOG特征来提取人体的外形信息和运动信息, 形成丰富的特征集[4]。

梯度方向直方图特征是在尺度不变特征变换 (Scale Invariant Feature Transform, SIFT) 的基础上发展而来的, 能很好地刻画图像的边缘方向特征。因此本文采用它作为医学图像检索系统的描述子。支持向量机具有训练方便、容易使用、泛化能力较好的优点, 因此本文采用它作为医学影像分类系统的分类器[5]。

近年来, 由于HOG特征能很好地描述图像的边缘方向特征, 因此广泛应用在计算机视觉的其他领域中, 如目标识别与跟踪、图像检索、人体行为分析和遥感图像分类等。该特征的计算方法, 见图l。

具体的计算步骤如下:

(1) 计算图像中每个像素点梯度方向, 一般可以采用[-1, 0, 1]和[-1, 0, 1]T获取水平方向和垂直方向上的梯度分量dx和dy。

(2) 对于每个像素, 根据dx和dy可计算出梯度的方向角θ=arctan (dy/dx) , 将该角度的范围转化到[0, π], 然后每20°角量化为一个方向区间, 共9个区间0, 1, 2, ..., 8。

(3) 选取一个16×16大小的图像块, 根据量化后的区间, 以每个像素的梯度幅值作为权重, 计算16×16图像块中每个8×8图像子块的梯度方向直方图特征, 并将2×2=4个直方图特征串联起来。

(4) 对每个16×16的直方图特征 (4x9=36维) 进行归一化, 设直方图特征为v∈R36, vi表示直方图的第i维特征, v'i表示归一化后的值, 一般可以有如下的三种归一化方式[5]:

(5) 将每个16×16块的直方图特征串联起来, 作为最终的直方图特征。

另外, 在计算直方图特征的时候, 也可以采用三线性插值和高斯加权, 从而使得构建出来的特征更加鲁棒[6]。

3 支持向量机

支持向量机 (Support Vector Machine, SVM) 是一种根据结构风险最小化原则, 在使训练样本分类误差极小化的前提下, 尽量提高分类器的推广能力的机器学习方法, 目前已广泛应用在分类、回归等应用中。其分类函数如下:

其中αi表示支持向量的权重, yi表示样本的类别标签, 其值为+1或者-1, K (X, Xi) 为核函数, 常见的核函数有:线性核函数K (X, Xi) = (X, Xi) ;多项式核函数K (X, Xi) = (a+XtXi) d;径向基函数K (X, Xi) =exp (-C||X-Xi||) ;Sigmoid函数K (X, Xi) =1/ (1+exp (-XtXi) ) 。

关于支持向量机的训练, 目前常用的方法是序列最小优化算法 (Sequential Minimum optimal, SM) 。

4 测试结果及分析

4.1 数据集与实验参数设置

本文采用的数据集为lmageCLEF, 该数据集包括训练集和测试集, 共有2000张图片, 分为31类, 其中测试图片999张, 训练图片1001张。

实验中, 将所有的图片都归一化到64×128, 然后进行HOG特征提取, HOG特征向量的维度是3780维, 具体的参数如下:块的大小是16×16, 梯度计算采用[-1, 0, 1]和[-1, 0, 1]T, 方向角量化为9个区间, 归一化方式采用L1-norm, 直方图建立的过程中采用了三线性插值的方法[6]。

实验中采用的分类器是libsvm, 是一个简单、易于使用和快速有效的SVM模式识别与回归的软件包, 不但提供了编译好的可在Windows系列系统的执行文件, 还提供了源代码, 方便改进、修改以及在其他操作系统上应用。该软件对SVM所涉及的参数调节相对比较少, 提供了很多的默认参数, 利用这些默认参数可以解决很多问题;还提供了交互检验功能。核函数分别采用线性核、多项式核、径向基函数和Sigmoid函数, 各个核函数的参数均使用工具箱的默认值。

4.2 性能评估

ImageCLEF共包含31个类, 采用线性核函数获得了较好的结果, 其相应的混淆矩阵, 见表1。

各个核函数的总体分类性能比较, 见图2。其中, 线性核函数的分类性能最好, 平均的分类正确率为36.74%, 多项式核、径向基函数和Sigmoid函数的分类性能相当, 约10%左右。

5 结语

本文利用HOG特征和支持向量机对医学图像进行分类, 并比较了不同核函数的性能, 实现了从低层视觉特征到对象语义的映射, 为临床不同语义层次的检索提供了条件。由于分类之间的类内差异性大, 类间差异性小, 因此难以获得较好的分类性能。未来拟考虑采用贝叶斯网络融合对象语义提取高层语义的多层语义建模方法, 对多类别的图像进行分类。

参考文献

[1]张骊峰, 章鲁.医学影像数据库的索引及检索技术的研究[J].国际生物医学工程杂志, 2007, 30 (3) :159-163.

[2]张九妹, 杜建军, 姚宗, 等.利用基于内容的图像检索技术的眼底图像计算机辅助诊断系统[J].中国生物医学工程学报, 2012, 31 (5) :785-789.

[3]王惠锋, 孙正兴.基于内容的图像检索中的语义处理方法[J].中国图象图形学报, 2001, 6 (10) :945-952.

[4]余胜, 谢莉.基于边缘梯度方向直方图的图像检索[J].科技视界, 2012, (20) :26-27.

[5]申海洋, 李月娥, 张甜.基于边缘方向直方图相关性匹配的图像检索[J].计算机应用, 2013, (7) :194-197.

上一篇:自我感知下一篇:价值毁灭