数字识别特征提取

2024-05-28

数字识别特征提取（精选8篇）

数字识别特征提取篇1

0、引言

特征提取是人脸识别中一个非常重要的环节, 目的是为了降低人脸图像的维数。目前, 常用的基于统计的特征提取方法有主成分分析 (PCA) [1]和线性判别分析 (LDA) [2]等。独立元分析 (ICA) [3]是近年来发展起来的一种新的多维数字信号处理技术, 其基本思想是在最大程度保持信息量的前提下, 从高维数据空间中提取出低维数据的特征分量, 是一种基于人脸全局特征的识别方法。但ICA算法在获取独立分量的过程中需要获取人脸图像的先验知识, 这影响了识别的准确率。有效减少了后续工作的计算量, 取得了较高的识别率。

基于上述讨论, 本文将一个人脸图象矩阵视为一矢量, 通过引入模糊数学中的隶属度概念, 定义矢量隶属函数, 提出一种新的基于隶属度函数的独立成分分析特征抽取和识别方法。有效减少了后续工作的计算量, 取得了较高的识别率。本文称该方法为模糊ICA (Fuzzy ICA) 。

1、独立成分分析的基本理论

ICA最初是对盲信号的分离。利用独立成分分析 (ICA) 方法可以在不知道信号源和传输参数的情况下, 根据输入信号源的统计特性, 仅由观测信号恢复或提取源信号。独立成分分析已经成为盲信号处理中最主要的方法之一, 并在模式识别、数据压缩、图像分析等方面得到广泛的应用。

对于一组盲源信号S= (s1, s2, …sm) T, 有N路观测信号X= (x1, x2, …, xN) T, 每一路都是一维行向量的形式。存在系数 (混合) 矩阵A, 使得独立源信号S与观测信号X可以用线性关系来表示:

式中A∈RN×M, 称为混合矩阵。

存在分离矩阵W∈RM×N, 使其满足下式:

式中WA=I, I为单位阵, Y为统计独立的未知源信号S的最佳估计。

在独立成分分析中求解分离矩阵是关键。目前已提出很多求解分离矩阵的算法。本文采用FastICA方法来实现独立分量的提取【8】, 该方法是基于负熵的固定点算法, 是目前效率较高, 应用较广泛的一种ICA算法。该算法的具体描述为:

(1) 对数据进行中心化处理, 使其均值为零。

(2) 白化数据, 令白化后的数据为z。

(3) 初始化W (0) , 令其模为1, 置k=1;

(4) W (k) =E{zg (W (k-1) Tz) }-E{g′ (

W (k-1) Tz}W (k-1) ;

(5) W (k) =W (k) /||W (k) ||;

(6) 如果不收敛, 令k=k+1, 返回 (4) 继续, 否者输出W (k) 。

其中g (u) =uexp (-u2/2)

该算法最后得到的向量W, 其线性组合WTz给其中的一个独立分量。要计算n个独立分量就要重复上述算法n次, 但每提出一个分量后要从混合信号中减去这一分量。

2、基于Fuzzy ICA的特征提取和识别

2.1 算法设计的基本思想

自1965年Zadeh提出模糊概念以来, 模糊数学已被用于很多领域, 将其应用于模式识别, 形成了模糊模式识别。模糊模式识别方法是利用模糊数学中的概念、原理与方法解决分类识别问题。模糊模式识别将待识别类别、对象作为模糊集和其元素, 因此应根据实际问题需要进行特征提取或特征变换, 建立模糊集的隶属函数, 然后运用有关模糊数学的原理和方法进行分类识别。

2.2 特征提取和识别算法

ICA是PCA从二阶统计分析向高阶统计分析的拓展, 基于数据的高阶统计信息提取数据的独立特征, 能够更好的表示人脸的局部特征。具体算法为:

(1) 特征提取和变换

假设人脸图像训练集样本图像有n类人脸图像, α={α1, α2, …, αn}, 且第i类有Ni个人脸图像。

对人脸图像训练集样本图像α, 首先通过PCA算法对图像进行去二阶相关和降维处理, 然后通过ICA算法对图像进行处理, 获得由独立影像基构成的一个低维子空间:S={S1, S2, …, Sm} (m<n)

计算出此低维子空间的特征向量为:

假设Xj (j=1, 2, …, Ni) 为已知αi类人脸图像矩阵Aj (i) (j=1, 2, …, Ni) 的特征向量, Y为未知人脸图象矩阵C的特征向量, 计算Xj和Y在低维子空间中的投影向量, 即Zj=ST﹒Xj, φ=ST﹒Y。

(2) 建立矢量隶属函数。

模糊集合隶属函数的建立, 无论在理论上还是在应用上都是非常重要的。由于造成模糊不确定性的原因多种多样, 因而模糊集的种类是复杂的。实际应用中, 确定隶属函数的方法有不少, 如专家确定法、统计法、对比排序法等。

在本文中, 我们将模糊数学中建立隶属函数、隶属度的方法引入矢量空间中, 从而定义未知人脸图像矢量归属于αi类的模糊隶属度函数为:

其中, λj为任意实数, ‖﹒‖为向量范数, Zj和φ为 (1) 中得到的特征向量。

(3) 模糊结果处理及人脸分类识别。

使用模糊技术进行分类的结果不再是一个模式明确地属于某一类或不属于某一类, 而是以一定的隶属度属于各个类别。如果分类识别系统是多级的, 这样的结果有益于下一级的决策。如果这是最后一级决策, 而且要求一个明确的类别判决, 可以根据模式相对各类的隶属度或其他一些指标, 如贴近度等, 进行硬性分类。在本文中, 我们利用最大隶属度原则进行人脸分类识别, 即首先计算每个输入人脸图像 (测试样本) 对各类人脸图像的图像隶属度μai, 若, 则判别测试样本为αi类人脸图像。

3、试验结果及分析

试验中采用ORL标准人脸数据库验证该算法, 该数据库包括从1992年4月到1994年4月剑桥大学实验室拍摄的一系列人脸图像, 具体为40个人, 每个人有不同表情或不同视点的10幅图像, 共400幅图像所构成, 倾斜角度不超过20度, 这些人脸图像的分辨率为92×112, 人脸数据库中每个人的图像都是不同角度、不同时间且受一定光线和一些饰物 (如眼镜等) 影响。图1是ORL人脸数据库中部分图像:

本实验使用Matlab7.1在windows XP系统下, 为了更好地证明算法的有效性, 我们随机选取其中10个人, 每人前3幅 (共30幅) 图像作为训练样本, 其余的30幅图像作为测试样本的做法。如此重复10次试验, 最后结果取其平均值。分别采用传统的ICA方法、PCA方法和本文的Fuzzy ICA方法, 进行了人脸识别仿真实验

由图2可知, 识别率随着特征维数的增加而成上升的趋势, 本文的方法识别率高于传统PCA方法和ICA方法, 该方法识别率最高可达95.1%, 但当特征数接近100时, 识别率略有下降的趋势, 说明并不是所有的特征向量都是有效的投影空间, 有些刚好是与人脸本身无关的噪声因素干扰。

4、结束语

本文在研究采用ICA提取的具有局域特点的独立分量表示人脸基础上, 将基于模糊ICA的人脸图像特征提取和识别算法与传统的PCA和ICA人脸识别算法进行了比较, 对ORL标准人脸数据库的测试表明, 该算法的性能优越, 而且识别率较特征脸法更高。但是, 算法的计算量很大, 当样本数很多的时候, 训练时间是个问题。因此, 算法仍需进一步的改进和提高。

参考文献

[1]余晓梅, 徐丹。基于外观的子空间人脸识别方法研究[J], 计算机应用研究。2007, 24 (5) :10-12

[2]Belhumeur P N, Hespanha J P, Kriengman D J.FishedacesIRecognition using class specific linear projection[J].IEEETransaction on Pattern Analysis and MachineIntelligence.1997.19 (7) :771-720

[3]张贤达, 保铮。盲信号分离[J], 电子学报, 2001。29 (12) :1767-1771

[4]王展青, 刘小双等.基于PCA与ICA的人脸识别算法研究[J].华中师范大学学报, 2007, 41 (3) :373-376

[5]邢国。人脸识别中两种特征提取算法的性能比较[J].信息与电脑, 2011, 1 (6) :115-117

[6]龙际珍, 陈沅涛, 邓冬梅.基于模糊隶属度的人脸识别应用[J].计算机应用研究, 2011, 28 (7) :2789-2792

[7]Yuen PC, Lai JH.Face representation using independentcomponent analysis[J].Pattern Recognition, 2002, 35 (6) :1247-1257.

[8]Bartlett MS.Face Recognition by independent compo-nent analysis[J].Neural networks, 2002, 13 (6) :1450-1463.

数字识别特征提取篇2

运用小波分析理论及其时频分析方法,阐述了提取高频信息与低频信息的方法,并用该方法提取了以来云南地区强震(Ms≥6)前数字化形变异常.结果表明,在Ms≥6地震前,震中附近(<250km)的倾斜、应变和重力等形变信号出现周期为3～11天的.异常信息;重力和倾斜异常出现较早,可作为中短期指标,应变异常出现较晚,可用作短临指标;震源区最先出现应变异常,应变异常可作为未来强震震中的判定指标.这些强震前数字化形变异常特征对该地区未来强震三要素的中短临判定具有较好的参考作用.

作者：刘强宋治平Liu Qiang Song Zhiping 作者单位：刘强,Liu Qiang(中国科学技术大学地球和空间科学学院,合肥市金寨路96号,230026;云南省地震局,昆明市北市区北辰大道,650224)

宋治平,Song Zhiping(上海市地震局,上海,62)

指节折痕线特征提取与识别算法篇3

关键词：生物特征识别,指节折痕,灰度形态学,二维小波分析

随着计算机网络与通信技术的高速发展,生物特征识别技术在信息安全领域发挥着重要的作用,是替代传统身份识别方法的最佳选择[1,2]。当前,用于生物特征识别领域的生物特征有指纹、掌纹、人脸、声音、虹膜等。近年来,手指的指节折痕特征也引起了许多学者的关注[3,4,5,6,7,8,9]。应用手指指节折痕特征作为一种生物特征,并提出了一种基于灰度数学形态学和二维的小波变换的指节折痕识别方法。使用灰度数学形态学运算来增强指节折痕线的算法,大大地改善了折痕线的对比度,使指节折痕线能较清晰地显示出来。然后对经过形态学运算处理后的灰度图像利用二维小波变换对其进行J层的小波分解,得到3J+1幅小波变换子图像,这些子图像构成了分解后的塔式数据结构,计算每个小波子图的7个不变矩,对每幅子图像的不变矩进行组合,构成指节折痕特征向量,最后计算不同样本间的Euclidean距离并利用最近邻法完成匹配识别。

1基于灰度数学形态学的指节折痕线特征的增强

灰度数学形态学的基本运算,即膨胀、腐蚀、开启和闭合,通过组合可以推导出各种数学形态学组合运算,利用闭合变换可以定义以下的bot-hat运算。

式中f(x,y)是输入图像;b(x,y)是结构元素,它本身也是一幅子图像;f·b为用b(灰度)闭合f,其定义为:f·b=(f b)b。

该运算可以用来检测图像中的脊谷线[10],而分布在手指内侧指节上的折痕线是一些低灰度值线状区域,因此可以用其来检测折痕线。在形态学中,结构元素是最重要最基本的概念。结构元素在形态变换中的作用相当于信号处理中的“滤波窗口”。结构元素对形态运算的结果有决定性作用,要结合实际应用背景和期望来合理选择结构元素的大小和形状。根据指节折痕线的特征,选择图1所示的三个方向的线结构元素来对ROI图进行形态学的bot-hat运算处理。

图2显示了处理结果(关于指节折痕图像的预处理过程可参见文献[7])。其中图2(b)为选用°方向的结构元素时bothat运算分别与原图像图2(a)卷积的结果f0(x,y),图2(c)为选用135°方向的结构元素时bothat运算分别与原图像图2(a)卷积的结果f135(x,y),图2(d)为选用45°方向的结构元素时bothat运算分别与原图像图2(a)卷积的结果f45(x,y),最终的处理结果由下式给出(见图2(e))。

式中O(x,y)是ROI图经过形态学处理后的输出图像。从图2的最后处理效果可以看出,ROI图像上的指节折痕线得到了明显的增强。

2基于二维小波分析的图像分解和不变矩特征矢量的提取

手指指节折痕图像经过上述的灰度形态学处理后,极大地增强了图像中的折痕信息,利于后续对其进行进一步的分析和处理。下面应用二维小波分析理论对增强了折痕信息的图像进行分解,然后利用图像不变矩来表达图像特征。

2.1二维小波分析和图像分解

为了将小波变换应用于图像,可采用分离变量方法由一维小波函数和尺度函数构造二维小波函数和二维尺度函数。设ψ(x)、ϕ(x)分别为一维小波函数和尺度函数,则二维小波函数和二维尺度函数由式(3)构造。

${\begin{cases} Φ (x, y) = ϕ (x) ϕ (y) \\ Ψ^{(1)} (x, y) = ϕ (x) ψ (y) \\ Ψ^{(2)} (x, y) = ψ (x) ϕ (y) \\ Ψ^{(3)} (x, y) = ψ (x) ψ (y) \end{cases} (3)$

二维小波变换可以将图像在不同分辨率(尺度)不同方向上进行分解,因而很适合用来刻画指节折痕图像。根据式(3)的分离变量的性质,二维分解可以通过行处理和列处理两步完成。即二维小波变换可以看成两个一维小波变换:其中一个一维小波对行进行变换,然后再对按行变换后的数据按列进行一维小波变换来完成。图3给出了二维图像进行小波分解的过程,图中L, H分别代表一个低通滤波器和一个高通滤波器,↓2是二抽取操作(即隔一列取一列)。二维小波分解包括两个步骤,图像先分别由一个一维的低通滤波器L和高通滤波器H在行方向上进行滤波,接着对这两个被滤波处理的图像沿行方向进行二抽取操作。在第二阶段,将第一阶段处理后的两幅图像分别用L和H在列方向上进行低通和高通滤波并进行二抽取操作。通过一级二维小波变换原始图像被分解成四个分量,分别对应于LL(代表图像在水平方向和垂直方向的低频信息,是原始图像的近似图像), LH(代表图像在水平低频和垂直高频的信息), HL(代表图像在水平高频和垂直低频的信息),HH(代表图像在水平高频和垂直高频的信息)。从原始的ROI图像开始,经过J级的分解,得到3J+1幅小波子图:

${c A_{J}, [c Η_{k}, c V_{k}, c D_{k}]_{k = 1, \dots, J}}$ (4)

(4)式中,cAJ是ROI图像的近似图像,cHk、cVk、cDk分别是ROI图像在水平方向、垂直方向和对角线方向的细节图像。

图4给出了两个原始图像二维小波分解和增强后图像的二维小波分解对比的例子。从这些图像可以看出,增强后的图像经过二维小波变换后,图像在各级的细节图像更加清晰,特别是垂直方向的细节子图。这说明经过形态学变换处理后的图像小波分解效果更加良好。

2.2不变矩特征矢量的构成

不变矩是非正交矩的一种,属于统计特征的范畴,主要应用于图像的检索、识别和配准。手指指节折痕图像在获取和处理的过程中容易发生平移旋转或尺度变换等情况,影响识别率,M. K. Hu[11]在1962 年就证明了不变矩具有在平移、旋转和比例变化的情况下不发生改变的特性,用不变矩做为特征进行提取恰好可以解决生物特征图像中容易存在的问题。在对图像进行J层分解后得到3J+1幅小波子图后,分别计算各级垂直方向、水平方向和最后一级的近似子图像的不变矩,为了计算方便,最后的不变矩值按式(5)进行调整。然后将它们头尾相接组成一个一维的特征矢量,即构成了代表指节折痕图的不变矩特征矢量。

ψi=|log(ϕi)| i=1,2,…,7 (5)

3实验结果与分析

算法是在自建的手指图像数据库中进行测试。该库拥有来自103个人的103只中指图像(每人采集8幅)共824个手指图像样本。实验时,将该库分为两个子库,其中一个用来训练,包括412个手指图像样本(每只手指四个样本);另一个同样也包括412个手指图像样本用来测试,每个子库样本的选择是随机的。首先分别计算训练库中每个手指的4个样本的指节折痕特征矢量,然后用它们的均值作为最终代表该手指指节折痕的特征来注册,产生注册集存入特征模板数据库;然后计算测试库中的每个ROI图像的指节折痕特征矢量。采用欧氏距离计算待识别指节折痕特征矢量与各模板特征矢量的距离。最后由最近邻法完成分类判别任务,即待识别样本分别与注册库中的各类进行特征匹配。距离最小的类就是该待识图像的类别,即:如果 $d_{j} = \underset{i}{\min (d_{i})}$ i=1,2, …,L(L为测试库中个体的数量,这里为103类),则待识别的人属于第j类。

在不同的小波函数和不同的分解级条件下进行了算法测试实验,实验结果列于表1。

从表1可以看出,采用Coiflet1和Bior1.3小波函数,分解级数为5级时识别效果较好,正确识别率分别为98.49%和98.57%。在同样的条件下,采用Bior1.3小波函数直接在原始图像施行二维小波分解进行特征提取时,识别率为93.76%。说明经过形态学处理后提高了算法的识别率。

4结论

在介绍数学形态学的bot-hat运算和二维小波变换的基础上,提出了一种基于灰度数学形态学和二维小波变换的指节折痕特征提取方法。利用灰度数学形态学,通过选择合适的结构元素对指节折痕子图施以形态学运算处理,大大地改善了指节折痕线特征。然后应用二维小波变换理论对增强后的指节折痕子图进行小波分解得到不同分辨率和不同方向的小波子图;最后,通过计算特定的小波子图的不变矩来构造表征指节折痕特征的特征矢量。实验结果验证了算法的有效性。

参考文献

[1] Jain A K, Ross A, Prabhakar S. Biometrics: a tool for information security. IEEE Transaction on Information Forensics and Security, 2006; 1(2): 125—143

[2]Jain A K,Ross A,Prabhakar S.An introduction to biometric recog-nition.IEEE Trans on Circuits and Systems for Video Technology,2004;14(1):4—19

[3]Doi J,Yamanaka M.Discrete finger and palmar feature extraction for personal authentication.IEEE Trans on instrumentation and measure-ment,2005;54(6):2213—2219

[4] Ribaric S, Fratric I. A biometric identification system based on eigenpalm and eigenfinger features. IEEE Trans. on Pattern Analysis and Machine Intelligence, 2005; 27(11): 1698—1709

[5]Joshi D G,Rao Y V,Kar S,et al.Computer-vision-based approach to personal identification using finger crease pattern.Pattern Recogni-tion,1998;31(1):15—22

[6]Li Q,Qiu Z D,Sun D M,et al.Personal identification using knuckleprint.Advances in Biometric Person Authentication,5th Chi-nese Conference on Biometric Recognition,Sinobiometrics2004.Springer2004:680—689

[7] Luo R F, Lin T S, Finger crease pattern recognition using legendre moments and principal component analysis. Chinese Optics Letters, 2007, 5(3): 160—163

[8]Doi J,Yamanaka M.Biometric personal authentication using discrete points on finger and palmar creases.In:Proc2004IEEE Int Conf Virtual Environments,Human-Computer Interfaces,and Measure-ment Systems(VECIMS2004):72—76

[9]Doi J,Yamanaka M,Kajita H.Discrete finger and palmar feature ex-traction for personal authentication.In:Proc2003IEEE Int Symp In-telligent Signal Processing(WISP03),2003:37—42

[10]Wu X Q,Wang K Q,Zhang D.A novel approach of palm-line ex-traction.Proceedings of the Third International Conference on Imageand Graphics,Hongkong,2004:230—233

数字识别特征提取篇4

在中医师的长期临床实践中发现, 哮喘患者普遍存在着大鱼际掌纹粗糙的现象, 并将大鱼际掌纹分成四级, 研究证实[1], I级为正常, II级为外源性哮喘弱阳性特征, III级IV级为外源性哮喘阳性特征。中医师在诊断时, 往往根据自己的主观经验对掌纹进行观察, 作出论断。为了减少医师诊断过程中由一些主观因素带来的判断误差, 对大鱼际掌纹图像进行客观的分类量化就变得十分重要。

通过医学专家的知识, 大鱼际掌纹的阳性和阴性的区分是进行辅助诊病的根本依据。因此考虑其阳性和阴性的划分, 具有很重要的意义。利用现代信息处理手段, 客观准确地对大鱼际掌纹进行分类量化, 有利于增强诊断的客观性与准确性。为此, 本文提出对大鱼际掌纹二分类设计, 即, 实现大鱼际掌纹阴性与阳性的分类, 以达到辅助诊断哮喘病阴阳性特征。

1 大鱼际掌纹识别概述

对大鱼际掌纹进行二分类, 从采集到的整个手掌图像开始, 首先对其进行预处理, 包括图像定位分割, 图像去噪和增强; 然后基于增强后的大鱼际掌纹图像, 采用灰度共生矩阵GLCM ( Grey Level Co-occurrence Matrix) 方法, 提取利于大鱼际掌纹二分类的特征; 最后利用支持向量机SVM的方法对提取的这些特征进行二分类, 将阴性和阳性的掌纹图像尽可能准确分开。设计流程如图1 所示。

2 算法设计

2. 1 预处理

要对大鱼际掌纹图像进行分类识别, 采集到的图像是整个手掌图像, 因此要对掌纹图像进行定位分割, 获得大鱼际部分, 即感兴趣区域ROI ( Regions of Interest) 。本文借鉴掌纹识别技术中的ROI的定位方法, 首先采用Ostu[2]阈值方法即最大类间方差法对掌纹图像进行二值化, 对二值图像进行边缘检测获得手掌轮廓, 利用3 个手指间隙上的基准点来建立直角坐标系, 从而确定ROI区域[3]。

Ostu算法是自适应阈值分割方法, 是自适应计算单阈值的高效方法。首先得到掌纹图像灰度直方图, 对直方图进行归一化, 得到灰度概率函数, 计算出灰度均值 μT, 直方图零阶累积矩ω ( k) 和一阶累积矩 μ ( k) , 然后根据分离指标如式 ( 1) , 就可以计算出对每一个灰度进行一次分割后的类间方差, 取最大类间方差时对应的灰度的阈值k就是最佳阈值, 根据得到的最佳阈值对图像进行二值化, 把灰度值大于k的都设置为255, 小于等于k的都设置为0, 这样就得到掌纹二值化图像。

对平滑处理后的二值掌纹图像进行八邻域轮廓跟踪, 得到掌纹轮廓和掌纹轮廓的freeman链码。八邻域追踪完成后得到手掌边缘点的坐标保存在一个链表中, 此链表描述的是一个封闭的曲线, 以这些点的横坐标为自变量, 纵坐标为因变量, 求出它的局部极值。其中我们需要的辅助定位点就在这些局部极值点中, 最终通过对这些极值点进行筛选选出所需要的定位点。根据得到的定位点计算图像所要旋转的角度, 对图像进行旋转校正。本文选取的分割中心点O' 的坐标为 ( xcenter, yc) , 此点近似为掌纹手掌的中心点, 从分割中心点朝着拇指方向截取的矩形区域就是大鱼际区域, 建立坐标系, 对定位好的区域进行截取。

在采集图片过程中难免混入噪声, 这些噪声会使图片质量下降, 干扰到分类结果, 因此要对图像进行去噪处理。通常的去噪方法在空域中有均值滤波、中值滤波等技术。掌纹图像主要信息集中在边缘部分, 本文采用中值滤波方法去噪, 首先对一个滑动窗口的诸像素按灰度排序, 然后用排序得到的序列的中值代替窗口中心像素原来的灰度值, 在抑制噪声的同时减少了边缘模糊。

图像的纹理特征影响到分类效果, 为增加分类准确率, 要对图像进行增强, 使得纹理清晰, 特征明显。目前, 图像增强的方法有多种, 鉴于我们要使图像纹理更加清晰, 增加其对比度, 同时还要突出其边缘信息, 本文采用高频强调滤波和直方图均衡化相结合的方法[4]进行图像增强。

高频滤波和直方图相结合的图像增强算法如下:

( 1) 对去噪后的图像进行傅里叶变换获得低频和高频两部分的频率分量。

( 2) 傅里叶变换后, 对低频系数和高频系数同时进行加权处理, 但要使低频系数的加权值小于高频系数的加权值。

( 3) 对高频滤波后的图像进行傅里叶反变换, 然后在空域上对其进行直方图均衡化处理。

2. 2 基于GLCM的特征提取

图像的特征参数可以表现出一类图像与另一类图像的区别, 我们可以依据这些特征进行分类。因此, 特征参数的提取在图像识别分类中至关重要, 是成功进行分类的重要环节。不同级别的大鱼际掌纹图像其亮度、颜色不同, 结合大鱼际掌纹图像这些特点, 将对其提取纹理特征作为分类特征。目前, 纹理特征提取的方法有多种, 如Gabor滤波器提取法, 小波提取方法等[5], 本文采用统计方法中的灰度共生矩阵方法, 提取大鱼际掌纹的纹理特征。

2. 2. 1 灰度共生矩阵

GLCM是基于图像中不同灰度级结构重复出现的概率来描述图像纹理信息的方法[6], 本文设计得到一幅矩形图像I ( 在水平方向和垂直方向的分辨率分别为Nx, Ny) 的灰度共生矩阵, 其算法步骤为:

( 1) 将图像灰度做归并, 将所有像素的灰度都量化到Ng个等级上。

( 2) 构建零度方向灰度共生矩阵, 统计左右两个方向, 定义一个指针lp Src指向当前遍历到的像素点, 定义另一个指针lpDst指向偏离点, 第一次循环遍历图像, lp Dst指向的像素点在lp Src所指向的像素点的右方。第二次循环遍历图像, lp Dst指向的像素点在lp Src所指向的像素点的左方。通过两次循环遍历图像, 完成了零度方向上灰度共生矩阵的统计。

( 3) 最后用同样方法, 分别建立45°, 90°, 135°三个方向灰度共生矩阵。

2. 2. 2 计算纹理特征值

使在得到四个方向的灰度共生矩阵后, 要分别计算每个灰度矩阵所对应的纹理特征, 结合大鱼际掌纹阴性阳性的纹理的区别, 本文采用利于二分类的四个纹理特征[6]进行分类:

( 1) 角二阶矩: 用来度量图像灰度分布均匀性, 是灰度共生矩阵像素的平方和, 能反映纹理的粗细。

( 2) 对比度 ( CON) : 表示图像的纹理清晰程度, 阳性图像纹理沟纹深, 对比度较阴性图像大。

( 3) 相关性 ( COR) : 用来表示灰度共生矩阵各元素在某方向上的相似程度。

其中, μx, μyσx, σy是Px和Py的均值和均方差。

( 4) 熵 ( ENT) : 熵值是图像所具有的信息量的度量。

如果图像没有任何纹理, 灰度共生矩阵几乎为零矩阵, 则熵值接近于零。如果图像充满着细纹理, 则P ( i, j) 数值近似相等, 此时图像的熵值最大。如果图像中分布着较少的纹理, 此时P ( i, j) 的数值差别较大, 则图像熵值较小。阴性图像纹理密集、细腻, 熵较大。

为了使图像分类结果更加准确, 本文分别建立了上述四个方向上的灰度共生矩阵, 对每个方向上的共生矩阵提取f1- f4四个特征值。

基于上面的计算, 实验得到每张图片都有四个方向上共16个特征值, 把这16 个特征值组成一个特征向量, 作为分类特征输入量。

2. 3 基于SVM的分类

在对大鱼际掌纹图片进行特征提取结束后, 要将这些特征向量作为SVM输入向量进行分类。

采用支持向量机方法[7]解决非线性问题, 其基本思路是将样本空间映射到更高维的特征空间, 在高维空间中求出最优超平面, 寻找到满足分类条件的分类平面, 使得训练集中的不同类的点距离分类平面尽可能远。采用不同的函数作为支持向量机的核函数K ( x, y) , 可以构造实现输入空间不同类型的非线性决策面的支持向量机。目前常用且效果比较理想的核函数[8]主要有多项式核函数 ( Polynomial) 、径向基核函数RBF ( Radial Basis Function) 、多层感知机MLP ( Multi-Layer Perceptron) 。

分类算法步骤如下:

( 1) 从采集到的已知类别的掌纹图像中选出一定数量的阳性阴性掌纹图片作为训练样本, 把大鱼际掌纹阳性定义为1, 阴性定义为0, 将特征提取后的数据放入data中, 构成n × 16 矩阵, 在label中存入阴性阳性类别标签0 和1。这时得到的data矩阵就是属性矩阵, 行数代表样本个数, 列数表示属性个数; Label就是标签矩阵。

(2) 利用训练函数对训练样本进行训练, 选择核函数:

(a) 多项式核函数:

所得到的d阶多项式分类器。

( b) 径向基核函数定义为:

本文通过对比上述两种核函数, 实验结果证明径向基函数效果较好。

设置核函数类型参数t, 惩罚参数c值和核函数参数g值, 得到相应的训练模型model, 然后利用预测函数对训练样本进行测试, 观察所得到的准确率, 若准确率很低, 则需要反复改变c和g的值, 直至准确率接近100% , 这时得到的训练模型用于下一步的测试。

( 3) 把剩余的样本作为测试样本, 标出测试样本的属性矩阵和标签矩阵。用预测函数对测试样本进行测试, 最终通过比较测试类别和标签矩阵中的类别, 得出测试结果。

3 仿真与测试

本文以Microsoft Visual C ++ 为开发平台, 基于MFC的单文档应用程序, 采用Microsoft C + + 对图像进行预处理与特征提取, 在菜单栏中添加噪声处理、ROI提取、图像增强、图像特征提取等选项, 采用Matlab仿真进行分类训练与测试。选取标准的38 张阴性掌纹图像和48 张阳性掌纹图像, 从中选出25 个阳性和25 个阴性样本来进行训练, 用剩下的36 个样本进行测试。

3. 1 预处理实现

根据第2. 1 节所述, 我们对掌纹图像进行预处理, 首先要获取大鱼际掌纹图像, 通过命令响应函数On Binary ( ) 、Onedge ( ) 、On Key Point ( ) 、OnROI ( ) 和OnROIIm ( ) 、分别完成原始输入掌纹二值化、边缘轮廓提取、确定关键点、ROI矩形确定, 实现结果分别如图2 ( a, b, c, d) 所示。

通过On Huo Qu ( ) 响应函数, 获取大鱼际掌纹图像, 如图3所示。

然后对获得的大鱼际掌纹图像进行去噪处理, 这里用命令响应函数On Zhong Zhi LVBO ( ) 对大鱼际掌纹图像进行3 × 3 中值滤波去噪处理, 如图4 所示, 可以看出, 经过中值滤波处理后的图像比原图像少了许多细微的掌纹线条。

图 4 中值滤波后的图像

最后再通过命令响应函数On Hfe ( ) 、On Histeq ( ) 对去噪后的大鱼际掌纹图像进行高频强调滤波直方图均衡化, 如图5 所示。

图 5 高频强调滤波和直方图均衡化后的图像

按照以上操作步骤把阴阳共86 张样本掌纹图片分别进行预处理。

3. 2 特征提取实现

对预处理完成的大鱼际掌纹图像提取其特征, 我们调用菜单项的“GLCM特征提取”命令响应函数On Glcm ( ) 对大鱼际掌纹图像进行灰度共生特征提取, 特征提取后结果如图6 所示。

按照2. 2 节所述, 将图中数值按列组成一个向量, 便得到一个样本的特征向量。

3. 3 分类训练与测试

( 1) 训练样本准备

将每张大鱼际掌纹样本图片的四个方向的纹理能量、纹理惯性、纹理相关性、纹理熵等16 个数据进行记录在同一. txt文件中, 并在每行数据后标记类别, 0 代表阴性, 1 代表阳性, 取名为train. txt。如图7 所示。

( 2) 测试样本准备

将待测试的大鱼际掌纹样本图片4 个方向的纹理能量、纹理惯性、纹理相关性、纹理熵等16 个数据进行记录在同一. tx文件中, 并在数据后标记初步判断的所属类别, 0 代表阴性, 1 代表阳性, 取名为test. txt。如图8 所示。

( 3) 测试结果与分析

通过对13 张已知为阴性的图片和23 张已知为阳性的图片进行测试, 测试过程中, 将核函数类型设置为径向基函数, 惩罚参数值为16, 核函数中的gamma函数参数设置为2. 5。函数测试结果如表1 所示。

将核函数设置为多项式函数时, 测试结果如表2 所示。

基于以上统计, 通过对比得出, 核函数为径向基函数时, 准确率更高, 算法预测正确率为85. 75% , 影响结果准确性的因素很多。首先, 由于医学专家认定大鱼际掌纹级别存在着很大的主观因素, 阳性和阴性的分类界限十分的模糊, 以至于样本库图像在起始分类时就产生错误; 其次, 训练样本较少, 在一定程度上影响其分类的准确率。

4 结语

本文对大鱼际掌纹二分类进行设计与实现, 首先在预处理过程中, 借鉴ROI区域定位方法获取了大鱼际掌纹区域, 然后采用中值滤波方法对其进行去噪, 采用高频强调滤波和直方图均衡化相结合的方法对其进行增强处理, 最后采用灰度共生矩阵和支持向量机相结合的方法实现了阴性阳性的分类, 将选取的灰度共生矩阵不同方向的统计量特征作为大鱼际掌纹分类的依据, 通过算法验证在测试样本集上取得了较理想的识别率, 选取SVM用于特征分类, 有效地解决了大鱼际掌纹量化识别研究中的小样本、分类模型推广能力差及参数难以优化等问题。实验结果显示, 此算法虽然性能良好, 但还存在一定误差, 为了减小误差, 提高判断的准确率, 在采用此设计算法对掌纹图像进行分类预测时, 应注意以下问题:

( 1) 在对样本进行训练过程中, 应选取资深老专家已经划分好阴性阳性的掌纹图像作为训练样本, 并且用尽可能多的样本进行训练, 以提高预测的准确率。

( 2) 在此基础上, 选取一种更好的算法进一步对大鱼际掌纹进行I级II级的分类与III级IV级的分类, 而I级II级与II级IV级之间的界限十分模糊, 因此可以尝试结合模糊理论知识对其算法进行改进, 提高准确率。

摘要：首先将掌纹图像经过定位分割获得感兴趣的大鱼际区域, 再经中值滤波去噪, 采用高频强调滤波和直方图均衡化相结合的方法增强图像, 得到纹理清晰的大鱼际掌纹图像。然后采用灰度共生矩阵方法提取利于二分类的图像特征。最后基于支持向量机的方法实现大鱼际掌纹阴阳两类的识别。仿真实验结果表明, 所提出的图像处理与识别算法对大鱼际掌纹阴性与阳性的分类具有较高的效率和准确率。

关键词：大鱼际掌纹,灰度共生矩阵,支持向量机,二分类

参考文献

[1]周兆山, 王燕青, 刘治香, 等.大鱼际掌纹形态特征与哮喘的相关性研究[J].山东中医药大学学报, 2004, 28 (2) :114-116.

[2]郭永芳, 于明, 黄凯.基于细菌趋药性的Ostu双阈值图像分割算法[J].计算机工程, 2011, 37 (22) :8-11.

[3]Zhu Xijun, Liu Dazhuan, Zhang Qiulin.Research of Technology for Thenar Palmprint Locating and Segmentation[C]//Proceedings of2009 International Workshop on Information Security and Application, 2009:601-604.

[4]段群, 刘小豫, 吴粉侠.一种基于高频强调滤波和直方图均衡化的图像增强方法[J].计算技术与自动化, 2009, 2 (28) :95-97.

[5]赵冬娟, 梁久祯.融合小波和自适应类增广PCA的人脸识别[J].计算机工程与应用, 2011, 47 (35) :199-202.

[6]Haralick R M, Shanmugam K, Dinstein I.Texture Features for Image Classification[J].IEEE Trans.on Systems, Man and Cyber-netics, 1973, 3 (6) :610-621.

[7]VapNik V N.Statistical Learning Theory[M].New York, USA:Wiley, 1998.

车牌自动识别中的字符特征提取篇5

关键词：特征提取,复杂性指数,归一化

0 前言

汽车牌照自动识别技术是智能交通系统中的关键技术之一,广泛应用于高速公路出入口、港口、机场、停车场管理处、军事要塞等场所。汽车牌照自动识别系统一般由图像采集、牌照定位、字符分割和字符识别4部分组成。车牌定位与字符分割技术已能基本满足实际需要,字符识别仍然是个瓶颈。对于应用模糊神经网络进行车牌字符识别的方法,识别结果与特征提取密切相关,而特征提取比较耗时,因此特征提取是关键所在。

本研究主要探讨车牌自动识别中的字符特征提取。

1 车牌字符的特征提取

特征抽取的目的是获取一组“少而精”的分类特征,即获取特征数目少且分类错误概率小的特征向量。目前,在特征提取与选择时还没有通用的理论作为指导,在实际问题中只能根据实验对比来确定分类的特征及相应的算法。一般的方法主要有基于统计的特征选取和基于字符结构的特征选取方法。无论哪种方法,用于字符识别的分类特征应具有较强的分类能力,即同一类中各样本间距离应尽量小,而类与类之间的距离则应尽量大,最好没有交叠部分。要具有较高的稳定性和抗干扰性,且特征向量应便于提取,算法要尽量简便,在保证识别系统性能的前提下,特征向量的维数不能过高,以减少机器开销,提高运算速度。

综合考虑上述因素,本研究根据车牌字符特性提取了笔画的4个复杂性指数,以及面积、复杂度、占空比共7个字符特征。

1.1 笔画的复杂性指数

车牌字符的结构有的简单,有的复杂。横笔画多的字符,垂直方向复杂;竖笔画多的字符,水平方向复杂[1,2]。为了反映出最能包含字符特点的字形和笔划结构,本研究引入了字符的复杂性指数,根据笔画复杂性指数的不同对字符加以分类。

实验中本研究将字符区域依次划分,如图1所示。图1中,4个方向分别为水平方向、竖直方向、右斜方向和左斜方向,本研究分别在各方向上计算黑象素总数和2阶中心矩。

设字符二值点阵图像为f(i,j),点阵的大小为M×N,ic,jc分别为字符质心的0°、90°方向坐标。S1、S2、S3、S4、S5分别代表0°、45°、90°、135° 几个角度方向的像素点黑像素总数,定义为:

$S_{1} = \sum_{i = 0}^{Ν 1} f (i, j_{c}) (1)$

$S_{2} = \sum_{j = 0}^{Μ 1} f (i_{c}, j) (2)$

$\begin{array}{l} S_{3} = \sum_{k = 0}^{\frac{Ν}{2}} [f (i_{G} + k, j_{G} - k) + f (i_{G} - k, j_{G} + k)] (3) \\ S_{4} = \sum_{k = 0}^{\frac{Ν}{2}} [f (i_{G} + k, j_{G} + k) + f (i_{G} - k, j_{G} + k)] (4) \end{array}$

M1,M2,M3,M4为对应方向的2阶中心矩:

$Μ_{1} = \sum_{i = 0}^{Ν - 1} (i - i_{G})^{2} f (i, j_{G}) (5)$

$Μ_{2} = \sum_{i = 0}^{Ν - 1} (j - j_{G})^{2} f (i_{G}, j) (6)$

$\begin{array}{l} Μ_{3} = \sum_{j = 0}^{Μ - 1} 2 k^{2} [f (i_{G} + k, j_{G} - k) + f (i_{G} - k, j_{G} + k)] (7) \\ Μ_{4} = \sum_{j = 0}^{Μ - 1} 2 k^{2} [f (i_{G} + k, j_{G} + k) + f (i_{G} - k, j_{G} - k)] (8) \end{array}$

字符在4个角度的复杂指数定义为:

$t_{i} = \frac{Μ_{i}}{S_{i}} ‚ i = 1, 2, 3, 4 (9)$

由此构成四维特征向量X=(t1,t2,t3,t4)。这些特征量能很好地反映经过倾斜度校正的车牌字符的特征。

1.2 面积

这里的面积指的是字符目标区域所包含的像素个数,对于目标像素的灰度值为“0”的N×M的数字图像,面积A的计算式如下:

$A = \sum_{i = 1}^{Ν} \sum_{j = 1}^{Μ} f (i, j) (10)$

1.3 复杂度

复杂度C的计算式如下:

$C = \frac{L^{2}}{4 π A} (11)$

式中 L—周长;A—面积。

在相同条件下,圆形的周长最短,可称为最密集的形状,C=1;随着周界凸凹加剧,周长增大,C随之增大,因此常用复杂度作为区域相对于圆的离散性度量。

1.4 占空比

占空比L的计算式如下:

$B = \frac{A}{L \times W} (12)$

其中,最小外接矩形的长定义为连接目标边界上最远两点的距离,该直线称为长轴;宽定义为位于长轴两侧的目标边界点到长轴的最远距离之和。

2 数据归一化处理

在统计分析过程中,各个数据之间的量纲不相同,量级差别也很大,若直接进行后续处理,则对系统的性能影响很大。为了消除各特征之间量纲、量级等不同的影响,且使各个指标具有可比性,在分析之前需要对原始数据进行归一化处理[3,4]:

$x^{'}_{i j} = \frac{x_{i j} - \min_{j}}{\max_{j} - \min_{j}} (i = 1, 2, \dots, n j = 1, 2, \dots m) (13)$

式中 xij、x′ij—第i个字符的第j个特征变换前和变换后的数据;xjmax、xjmin—n个字符中第j个特征的最大值和最小值。

3 字符特征提取

3.1 字符特征提取示例

车牌包含的字符模板可以分为如下3类:①汉字54个,包括京、津等省级简称31个,甲、乙等天干10个,子、丑等地支12个,以及“警”字;②英文字母26个:A、B、……Z;③阿拉伯数字10个:0、1、……、9。

在实验中分别对90类字符进行特征提取。特征提取步骤如下:

第1步,特征形成。根据传感器的测量值产生被识别对象的一组原始特征。

第2步,特征选择。根据本研究提出的特征提取方法确定车牌字符的7个特征。进行字符特征选择的主要原因在于原始特征很多,如果把所有的原始特征都作为分类特征送往分类器,不仅使得分类器复杂,分类计算判别量大,而且分类错误概率也不一定小,因此需要减少特征数目[5,6]。

例如:根据上述步骤对如图2所示的字符图像进行处理,其中字母B和数字2的提取结果,如表1所示。

3.2 归一化处理

由表1可知,各种字符特征数据的值域范围、数据分布均不同,为突出小数据特征的分类作用必须对所有特征值归一化处理。根据本研究提出的方法进行归一化处理,所得结果,如表2所示。由表2可知,归一化后各特征无量纲,各个指标具有可比性,为字符的识别提供了准确信息。

3.3 字符模型库的建立

分类器设计的好坏,对于字符识别效果有着重要的影响。模糊逻辑技术与神经网络技术是解决车牌识别这一复杂非线性问题的理想途径。对于利用模糊逻辑技术设计的模糊分类器,提高识别率的关键因素之一就在于能否获得一个良好的字符模型库。

以每类目标样本集特征的均值和方差来描述该类目标,即每类目标将对应一个确定的均值和方差矢量。假定共有c类目标,每类目标共有D个较好的特征和N个训练样本。每个样本中提取出的特征记为fijk,其中,i表示目标类,j表示特征序号,k表示样本序号。则第i个目标类特征的均值和方差矢量为P(i),Q(i),即:

$p_{i j} = \sum_{k = 1}^{Ν} f_{i j k} / Ν (1 \leq j \leq D) (16)$

$q_{i j} = \sqrt{\frac{1}{Ν} \sum_{k = 1}^{Ν} (f_{i j k} - p_{i j})^{2}} (1 \leq j \leq D) (17)$

根据本研究的特征提取方法,D的取值应为7。7个特征不仅具有较强的分类能力而且所构成的特征向量维数低,大大减少了机器开销,从而能提高识别算法速度。此外这7个特征具有较高的稳定性和抗干扰性,对字符的平移、旋转和尺度变换不敏感,从而为字符识别率的提高打下基础。

4 结束语

利用抽取到的90类数据的特征,本研究设计了一种基于模糊决策的模糊分类器,该算法由2部分组成:①建立各类字符的模型库;②利用模糊决策的方法对待识别样本进行识别分类。

以上算法本研究采用Visual C++ 6.0编程,并对1 000幅牌照进行了识别,识别算法不仅运算量小、速度快、效率高而且其字符识别率达96.2%以上,大大超过统计模式识别率92.3%。其主要原因在于本研究根据车牌字符特性提取的7个典型的形态学特征,具有较强的分类能力、较高的稳定性和抗干扰性,有助于建立完善的字符模型库。

参考文献

[1]杨枝灵,王开.数字图像获取处理及实践应用[M].北京:人民邮电出版社,2003.

[2]王永茂,刘贺平.强噪声车牌图像中的字符识别[J].计算机仿真,2006,23(12):244-246.

[3]DEFRIES R S,TOWNSHEND J R G.NDVI-derived landcover classification ata global scale[J].InternationalJournal of Re-mote Sensing,2004,15(17):3567-3586.

[4]王枚,王国宏.利用伴生与互补颜色特征的车牌定位新方法[J].计算机工程与应用,2007,43(1):206-211.

[5]李正峰,侯杰.基于改进遗传算法的车牌图像分割[J].计算机应用研究,2005,26(9):15-17.

数字识别特征提取篇6

当今说话人识别领域使用的特征参数有多种, 它们各具特点, 能够用于各种不一样的场合, 其中应用较为广泛的具有代表性的特征参数是:基音频率、线性预测系数 (LPC) 、线性预测倒谱系数 (LPCC) 、梅尔倒谱系数 (MFCC) 。

2 MFCC的提取与分析

梅尔倒谱系数 (MFCC) , MFCC是利用人耳听觉模型建立的倒谱系数, 人类的听觉系统可以看成一个非线性系统, 它对于不同的频率信号的灵敏度是不一样的, 一般是对数型关系。正是由于Mel倒谱系数基于人耳感知这种特殊的特性, Mel倒谱系数在抗噪声能力以及鲁棒性这些方面都比其它特征参数要优秀了很多。

对于不一样频率的语音, 人耳有不一样的感知能力, 声音的物理频率表示单位是梅尔 (Mel) 。频率和MFCC系数的关系如下式:

其中, f的单位为Hz。参照Zvick的研究所说, 临界带宽按照频率不同而改变, 在1000Hz以下时, 维持线性分布, 带宽在100Hz附近;在1000Hz以上时, 表现为对数增长形式, 如图1所示。

Mel参数的提取过程:

(1) 把之前预处理过的语音信号, 即时域信号做傅里叶变化 (DFT) 。计算得到线性频谱x (k) , 其转换公式为:

(2) 把上面的频谱x (k) 通过Mel滤波器组生成Mel频谱。

(3) 接着对Mel频谱做对数能量处理, 得到对数频谱S (m) 。图2所列即为得到的线性能量谱, Mel能量谱和对数能量谱。

最后, 将S (m) 通过离散余弦变换 (DCT) 获得倒谱频域, 即Mel频谱倒谱系数 (MFCC参数) :

摘要：提取特征参数在说话人识别系统内是非常重要的步骤, 说话人语音的很多特有个性信息包含于特征参数内, 例如发声特征或者语义特征, 利用特征提取的方法一方面可以去掉声音里没用的冗余信息, 剩下有用的体现说话人个性不同的特征信息, 特别是可以有效减少计算量、模板数目以及存储空间。选用的特征参数的会直接关系到整个系统的工作性能, 良好的特征参数需要拥有好的稳定性和好的独立性, 一方面可以不受到外界情况的干扰, 不容易为其他的声音所替代, 另一方面, 能够较好的辨别不同说话人, 说明说话人之间的差异。

关键词：特征参数,倒谱系数,LPCC,MFCC

参考文献

[1]M.Chetouani, M.Faundez-Zanuy, B.Gas, and JL.Zarader.Investigation on LP-residual representation for speaker identification, Pattern Recognition.2009, 3 (42) :487-494.

[2]林琳, 王树勋, 郭刚.短语音说话人识别新方法的研究.系统仿真学报, 2007, 19 (10) :2272-2275.

数字识别特征提取篇7

LDA[4]是一种有效的提取辨别特征的方法, 广泛应用于可见光人脸识别及红外人脸识别, 但小样本问题导致类内散布矩阵奇异。许多推广的LDA方法被用来解决小样本问题, 如Fisherface[4], NLDA[5]等。Fisherface 首先去掉了总体散布矩阵的零空间, 该零空间是类内散布矩阵零空间与类间散布矩阵零空间的交集, 而类内散布矩阵的零空间包含了重要的辨别信息。NLDA夸大了零空间的作用。李江[6,7]对红外图像的人脸识别进行研究, 针对传统方法的信息丢失问题提出了一种新的LDA方法, 用Snapshot提取类间散布矩阵的特征, 减少了有用信息的丢失, 但无法彻底解决类内散布矩阵的奇异性问题。

Jiang[8]在可见光图像人脸识别领域提出了一种基于特征校正与提取 (ERE-Eigenfeature Regularization and Extraction ) 的人脸识别方法, 将类内散布矩阵分为3部分, 分别在3个子空间对人脸特征进行校正。该方法既解决了类内散布矩阵的奇异性问题, 同时减少了信息丢失。但人脸空间与噪声空间的划分要结合数据库的特性。文中基于能量自适应将类内散布矩阵划分为3个空间, 之后运用ERE对特征谱进行校正, 提取辨别特征。

1 子空间分解

图1为在HID标准人脸库中的长波红外人脸图像库及自拍长波红外人脸图像库中选取的部分人脸图像。该图像已做过裁剪, 去掉了背景相关的信息。在用于识别前要将尺寸归一化为60×60。

将人脸图像描述为列向量, 由人脸图像的列向量组成新的矩阵Xij, i为第i类;j为第i类的第j幅人脸图像。

$S_{w} = \sum_{i = 1}^{p} Ρ r (C_{i}) \sum_{j = 1}^{q_{i}} (X_{i j} - \bar{X}_{i}) (X_{i j} - \bar{X}_{i})^{Τ}$ (1)

$S_{t} = \sum_{i = 1}^{p q} (X_{i} - \bar{X}_{0}) (X_{i} - \bar{X}_{0})^{Τ} = Φ Φ^{Τ}$ (2)

其中, Pr (Ci) 为图像属于第i类的先验概率, $\bar{X}_{i} = \frac{1}{q_{i}} \sum_{j = 1}^{q_{i}} X_{i j}, \bar{X}_{0} = \frac{1}{p} \sum_{i = 1}^{p_{i}} \bar{X}_{i}$ 。

求取类内散布矩阵的特征值{σk}和特征向量{vk}, 按特征值大小降序排列。应用最优信号重建的准则, 假设前m (m<N) 个特征值是可靠的, 其余的特征值需要重新估计。令可靠的特征值对应的特征向量组成的空间为人脸空间, 零特征值对应的特征向量组成的空间为零空间, 人脸空间与零空间之间的空间为噪声空间。用人脸空间特征谱能量占整个特征谱能量的百分比来确定m的值。

$J (m) = \min_{m} \frac{\sum_{i = 1}^{m} σ_{i}}{\sum_{i = 1}^{Ν} σ_{i}}$ (3)

其中, N为图像维数。当0.90<J (m) <0.99时, LDA可以获得稳定的识别性能[9], 实验结果显示, 当在0.90～0.99之间取值时, 识别结果变化不大。文中取J (m) =0.95。类内散布矩阵的秩点r为噪声空间与零空间的分界点。

2 特征谱修正模型

特征谱曲线快速衰减而后稳定的特性与1/f函数吻合, 因此特征谱模型设为

$σ_{k} = \frac{a}{b + k}$ (4)

其中, σk为第k个特征值;a, b为要计算的常数。带入 (1, σ1) 和 (m, σm) 两点坐标计算可得

$a = \frac{(m - 1) σ_{1} σ_{m}}{σ_{1} - σ_{m}}$ (5)

$b = \frac{m σ_{m} - σ_{1}}{σ_{1} - σ_{m}}$ (6)

修正后的特征值为

将式 (5) 和式 (6) 计算得到修正因子, 带入式 (7) 得到修正后的特征值。

图2给出了红外人脸图像的原始特征谱和校正特征谱。其中横坐标为按降序排列的特征值的序号, 纵坐标为特征值的大小, m和r分别为人脸空间和噪声空间及噪声空间和零空间的分界点, 因版面所限, 图中缩小了零空间的比例。

3 提取辨别特征

利用修正特征值的倒数作为加权因子, 对类内散布矩阵的特征向量进行校正, 得到新的特征矩阵P。投影总体散布矩阵得到新的散布矩阵Snewt。

S $_{t}^{n e w}$ =PTΦΦTP (8)

计算该散布矩阵的特征值和特征向量, 将特征向量按照相应的特征值降序排列, 选取前s个大特征值对应的特征向量。组成特征向量矩阵Ws, s的选取可参考PCA中主特征的选择。最终投影矩阵为

A=PWs (9)

每副人脸图像X的投影特征向量F为

F=ATX, F∈IRs (10)

4 特征匹配

令F1和F2分别为训练图像与测试图像在投影空间的的投影矢量, 采用简单的欧式距离及最近邻准则, 判断测试图像所属的类。根据最近邻准则, 将待识别图像的投影系数矢量与训练集的投影系数矢量集进行匹配, 最小距离所对应的训练集图像所属类别则为待识别图像的匹配类别。

$d i s t = | F_{1} - F_{2} |$

识别率为正确识别的样本数与总测试样本数的比值。

5 实验结果

在HID标准人脸数据库和自建数据库中, 分别随机选取400幅长波红外人脸图像, 40人, 每人10副图像, 图像尺寸归一化为60×60, 图像中包括姿态、戴眼镜、光照、表情的变化。其中随机选取每人5幅图像作为训练图像, 其他5幅图像用作测试, 取10次测试结果的平均值作为最终识别率。将测试结果与标准的PCA, LDA等方法对比, 结果显示, 文中方法优于其他方法。

6 结束语

用能量自适应的方法将类内散布矩阵的特征空间分为3个子空间, 根据红外人脸图像的特征谱特性, 对3个空间的特征向量分别进行校正。实验结果显示, 该算法具有较高的识别率。

参考文献

[1]Wilder J, Philips P, Jiang C, et al.Comparison of Visible and Infra-red Imagery for Face Recognition[C].In Pro-ceedings, Internationial Comference of Automatic Face and Gesture Recognition, 1996:182-187.

[2]Diego A Socolinsky, Lawrence B Wolff, Joshua D Neuheis-el, et al.Illumination Invariant Face Recognition Using Thermal Infrared Imagery[C].Proceedings of the IEEE, 2001 (1) :527-534.

[3]Diego A Socolinsky, Andrea Selinger, Joshua D Neuheisel.A Comparative Analysis of Face Recognition Performance with Visible and Thermal Infrared Imagery[C].Washington, DC.USA:IEEE Computer Society, 2002:217-222.

[4]Peter N Belhumeur, Jo o P Hespanha, David J Kriegman.Eigenfaces VS.Fisherfaces:Recognition Using Class Spe-cific Linear Projection[J].IEEE Trans.Pattern Analysis and Machine Intelligence, 1997, 19 (7) :711-720.

[5]Liu Wei, Wang Yunhong, Li Stan Z, et al.Null Space Approach of Fisher Discriminant Analysis for Face Recogni-tion[C].Proc.ECCV Workshop BioAW, 2004:32-44.

[6]李江, 郁文贤, 匡刚要, 等.红外图像人脸识别方法研究[J].国防科技大学学报, 2006, 28 (2) :73-76.

[7]李江.红外图像人脸识别方法[D].长沙:国防科技大学, 2006.

[8]Jiang Xudong, Bappaditya Mandal, Alex Kot.Eigenfeature Regularization and Extraction in Face Recognition[J].IEEE Trans.Pattern Analysis and Machine Intelligence, 2008, 30 (3) :383-394.

数字识别特征提取篇8

混凝土作为应用最为广泛的工程材料,在建筑、道路、桥梁、大坝等工程结构中起着非常重要的作用。其中,桥梁多为钢筋混凝土结构,在恶劣的应用环境中,结构很容易产生细微裂纹等缺陷,如果不及时发现并处理,微裂纹继续发展有可能导致桥梁结构的损坏,严重情况下将造成桥梁断裂破坏,带来巨大的人员伤亡与财产损失[1~2]。因此,对桥梁结构早期微裂纹的有效检测,消除故障隐患,对保证桥梁的安全使用影响巨大。

目前,对钢筋混凝土结构缺陷检测的方法主要有超声法、红外热像法以及声发射法等[3]。其中,声发射(Acoustic Emission,简称AE)能够利用材料局部能量变化释放的瞬态弹性波来准确检测和定位故障缺陷,灵敏度非常高,可以达到微米数量级[4],加之声发射具有动态连续检测功能,从而在在诸多领域得到了广泛的研究与应用。因此,将声发射技术应用到桥梁钢筋混凝土结构缺陷的在线实时监测中,是一种可靠的途径,并得到了专家学者们的重视。纪洪广等通过三点弯曲试验分析混凝土断裂过程中声发射关联分维数的变化规律,确定了混凝土试块在临界断裂时的分型特征识别模式,并证明此识别模式可以作为材料临界断裂的判别特征[5~6]。陈兵等通过三点弯曲试验将钢纤维混凝土梁的声发射信号振幅分布特性划分为不同的区段,并与混凝土内部不同的破坏机制建立一一对应的联系[7~8]。骆英等则通过三点弯曲载荷试验对不同强度的混凝土试块以及同强度的素混凝土和钢筋混凝土试块进行研究,发现全波形声发射技术可以实现混凝土结构的损伤在线监测[1,3]。在他们的研究基础上,本文进一步考虑了声发射信号中微弱故障特征信号的提取与识别技术,提出了基于非线性盲源分离消噪的钢筋混凝土梁全波形声发射信号时频检测方法。该方法的创新点在于:利用非线性独立分量分析(Nonlinear ICA)从多个传感器信号中分离出故障源,消除外界噪声干扰,同时,利用维格纳分布(WVD)对故障源信号进行时频分解,提取敏感故障时频特征,从而提高梁损伤检测精度。最后,利用三点弯曲载荷试验验证所提检测方法的有效性。

1 非线性盲源分离

传感器在采集声发射信号时,难免会受到通信环境的影响而引入非线性噪声信号。由此,会干扰故障特征提取过程,严重时会使故障辨识结果错误。因此,独立分量分析(ICA)被应用到多通道传感器信号的去噪中来,即在对信号系统没有任何先验知识的情况下,对含有噪声的原始信号进行分离,学术上称为盲源分离。然而,传统的ICA是建立在线性假设基础上的[9],当信号系统属于线性系统时,源信号分离的效果比较理想。但是现实系统一般为非线性系统,源信号与噪声属于非线性混合,所以基于线性假设的ICA很难分离出真实有效的源信号。近年来,基于神经网络的非线性独立成分分析引起了学术界的高度重视,与传统的线性ICA算法相比,非线性独立成分分析能利用神经网络强大的非线性函数逼近能力实现对非线性混合的分离。基于神经网络的非线性独立成分分析数学方程为[10]:

式中,s=[s1s2…sn]T是n个源信号,x=[x1x2…xm]T是m个传感器采集到的源信号的混合观测信号,A为线性混合矩阵,t=[t1t2…tl]T为非线性混合后的观测信号,f(x)为非线性混合函数,z=[z1z2…zm]T为非线性解混后的观测信号,g(t)为非线性解混函数,y=[y1y2…yn]T为分离后的源信号,W为分离矩阵。从式(1)的数学表达可见,盲源分离是对源信号的估算,其核心是找到非线性混合函数f(x)的反函数g(t)以及线性混合矩阵A的逆矩阵W。但是f(x)和A都是未知的,不能直接求得g(t)和W,为了能够得到近似逼近f(x)和A的逆,本文采用径向基函数(RBF)模型,结合最大互信息准则来求解解混函数和分离矩阵。其计算流程如图1所示,具体的理论推导可参见文献[11]。

在声发射信号采集过程中,噪声和弹性波之间具有相互独立性,通过基于神经网络的非线性盲源分离算法可以得到相互独立的分量,去除独立的噪声数据,从而保证了材料损伤特征信息不被破坏。这样,就可以利用WVD提取到可靠的故障特征,便于故障的早期识别。

2 试验与数据分析

试验用钢筋混凝土梁截面尺寸:180mm×120mm,长度1200mm,混凝土强度等级C50,梁底纵向构造钢筋为A5覫12,钢筋保护层厚度30mm。混凝土的配合比为水泥:砂:石子:水=1:1.32:2.32:0.40,采用人工搅拌混凝土。三点弯曲试验采用万能疲劳试验机加载,利用PXWAE鹏翔全波形声发射仪采集声信号,8个中心频率为150k Hz的压电传感器布置在试件正反两侧面,图2为一侧4个传感器的布置。在加载前,梁试件已经存在微裂纹,加载过程中,原始裂纹扩张已经与新裂纹合并形成宏观裂纹,随着进一步加载,宏观裂纹扩展断裂。

图3所示为声发射积累能量随加载载荷关系曲线。从图中可见,裂纹的高速扩展期处于BC段与DE段,在FG段断裂,破坏载荷为61k N。试验结果与文献[1]吻合。

通过分析图3,可以认为AB段是安全区,裂纹处于早期状态;DE段是危险段,宏观裂纹已经出现;FG段则是破坏段。这几个阶段对应混凝土梁失效的典型过程,因此,本文以AB、DE和FG三个时间区段的声信号作为研究对象,利用非线性盲分离和WVD时频分析技术提取各个阶段的损伤本质特征值作为对混凝土梁状态的评估依据,结合支持向量机来实现梁损伤检测的智能识别。

图4~图9给出了早期裂纹、宏观裂纹与断裂三种状态下声发射信号的WVD时频谱,并对比了传感器采集原始信号与非线性ICA分离信号的时频特性。

从图4~图6可见,传感器采集到的初始信号波峰主要集中在50~200k Hz,最大能量集中在75k Hz左右;另外,大于200k Hz的高频区也出现了能量波峰。而从理论分析与已经得到的研究结果[1,3,4,5]可知,正常钢筋混凝土梁的声发射信号能量峰值一般在10~100k Hz,最大能量集中在10k Hz左右,宏观裂纹以及断裂时能量峰值则在10~165k Hz。对比图4~图6分析可知,受到环境因素以及传感器自身的影响,噪声污染使得梁声发射信号的频率有了一定的漂移,并且高频率区域出现了噪声的能量波峰。而从图7~图9可见,经过非线性ICA去噪后,正常钢筋混凝土梁的声发射信号能量峰值主要集中在10~100 k Hz,最大能量集中在10k Hz左右,而宏观裂纹以及断裂时能量峰值则在10~165k Hz,整个破坏过程的频谱由低频到高频发展,分析结果与文献[1]吻合。由此可见,通过非线性ICA处理,传感器原始信号中的噪声干扰被有效地抑制与消除,去噪后的信号更加接近理论值。同时,注意到图7~图9中不同裂纹状态下频率区间[0~20k Hz]、[40~60k Hz]、[80~100k Hz]、[130~150k Hz]以及[160~180k Hz]的能量分布存在较大不同,所以,可以沿着时间轴方向将此5个区域的能量值作为识别梁裂纹状态的重要特征。

鉴于支持向量机(SVM)具有较强的模式识别能力[12],本文将计算得到的5个区域能量值作为SVM的输入变量,其输出为[0 0 1]、[0 1 0]和[1 0 0]分别对应梁裂纹的三种不同状态,从而来判断梁的裂纹情况。实验中,对梁的微裂纹、宏观裂纹和断裂声发射信号分别取50个样本来训练SVM,然后用训练好的SVM去判定新的输入样本。表1为SVM对新样本的识别结果,其中,分别采用了非线性ICA-SVM、线性ICA-SVM和只使用SVM的测试结果。从表中可见,使用ICA去噪后可以明显提高裂纹状态辨识精度;同时,非线性ICA比线性ICA的去噪效果好,裂纹状态辨识更准确。因此,本文所提出的短时交通流量预测方法具有较高的预测能力,有效提高了短时交通流量预测精度。

3 结论

(1)随着混凝土梁裂纹的扩展,其声发射信号频谱峰值范围相应扩大,但是在主要的特征频率50k Hz与100k Hz左右的能量集中具体不同特点,可以作为识别梁裂纹发展状态的重要特征。

(2)传感器采集到的声信号难免被噪声污染,影响信号的时频分布特性,采用非线性ICA可以较好去除噪声干扰,恢复信号本质特性,达到提高梁损伤识别精度的目的。

摘要：钢筋混凝土桥梁暴露在恶劣工作环境下常常受到裂纹损伤威胁,及时有效地检测到混泥土梁的微裂纹以及识别梁的损伤状况是保证桥梁安全作业的重要基础。针对目前采用全波形声发射仪采集声信号受到噪声污染而影响探伤精度的问题,提出了基于神经网络的非线性独立分量分析(ICA)与维格纳分布(WVD)的损伤声发射信号特征提取与识别的新方法。通过RBF网络估计混入声信号中的非线性噪声成分,利用ICA算法分离出真实的梁损伤声信号,消除噪声干扰,并应用WVD分析分离信号的时频谱分布,提取信号特征频率处的能量特征作为识别损伤状态的有效参数。三点弯曲加载试验结果表明,非线性ICA能够有效抑制噪声导致的声信号频率漂移,得到信号可靠的关键特征,提高梁裂纹损伤的识别精度,且结果比不进行去噪处理提高了9%。

关键词：钢筋混凝土,无损探伤,声发射,非线性独立分量分析,谱分析

参考文献

[1]王彬,顾建祖,骆英,李忠芳.预应力钢筋混凝土梁破坏过程的声发射特性实验研究[J].防灾减灾工程学报.2006,26(4):453-457.

[2]杨智春,于哲峰.结构健康监测中的损伤检测技术研究进展[J].力学进展,2004,34(2):215-223.

[3]王余刚,骆英,柳祖亭.全波形声发射技术用于混凝土材料损伤监测研究[J].岩石力学与工程学报,2005,4(5):803-807.

[4]Ohtsu M.Acoustic emission characteristics in concrete anddiagnostic applications[J].Journal of Acoustic Emission,1987,6(2)99-108.

[5]纪洪广,张天森,蔡美峰,张志勇.混凝土材料损伤的声发射动态检测试验研究[J].岩石力学与工程学报,2000,19(2):165-168.

[6]纪洪广,王基才,单晓云,蔡美峰.混凝土材料声发射过程分形特征及其再断裂分析中的应用[J].岩石力学与工程学报.2001,20(6):801-804.

[7]陈兵,张东,吴科如.混凝土梁声发射特性试验研究[J].建筑材料学报,1998,1(4):315-319.

[8]陈兵,姚武,张东,吴科如.混凝土梁破坏机制的声发射特性试验研究[J].建筑材料学报,2001,4(4):332-338.

[9]Hyvarinen A.,Karhunen J.,Oja E.In dependent componentanalysis[M].John Wiley&Sons,New York,2001.

[10]张天瑜.基于神经网络的变速率非线性盲源分离ICA算法研究[J].陕西科技大学学报,2010,28(5):105-109.