DPCA论文

2024-10-24

DPCA论文(精选5篇)

DPCA论文 篇1

0引言

地面运动目标检测是合成孔径雷达研究中的一个重要课题。通常有两种主要的研究方法:单通道SAR动目标检测和多通道SAR动目标检测[1,2,3]。本文主要研究多通道SAR动目标检测。偏置相位中心天线技术 (DPCA)、沿轨干涉 技术(ATI)和空时自 适应处理 (STAP)是多通道SAR动目标检 测中的重 要方法 。 DPCA和ATI都需要先对通道间的图像做坐标配准和相位补偿,这一过程的准确度将严重依赖于系统参数的准确性,如基线长度、载机速度等。本文提出一种配准与补偿算法,使得这一过程对参数准确性的依赖降到最低。DPCA技术主要依靠通道间信号相减后再进行阈值检测以消除杂波,但为了防止对动目标的漏检,不能过高地提升阈值,这也造成了一些强杂波无法消除;而ATI技术是依靠通道间相位差来检测出动目标。

1原理

以双通道为例,通道1发射和接收信号,通道2仅接收信号。如图1所示,x轴为方位向,y轴为距离向,雷达的方位向和距离向速度分别为va和vr。 t = 0时雷达位于坐标原点,此时目标点位于 (x0,y0) 。

对静止目标进行分析,对通道1和通道2的数据均使用通道1的参数进行距离多普勒(RD)算法处理后, 可得到通道1和通道2信号的表达式:

式中:tc1= x0va; yc1= y0- vrtc1; fc1= 2vrλ; tc2= (x0- d 2) va;yc2= y0- vrtc2; fc2= 2vrλ ;τ 代表快时 间或者距 离向时间;t表示慢时间或者方位向时间;σ 是目标反射系数的复数常量;tc1是波束中心的偏离时间;pr(τ) 是距离向包络,通常是一个sinc函数;pa(t) 是方位向包络,通常也是一个sinc函数;λ 是雷达系统的波长;d是基线长度。

因为 (τ,t) 平面与 (x,y) 平面具有如下关系:

所以得知 ,静止目标 在通道1的位置信 息为 (x0,yc1) ,同时,它还有一个常数相位 -4π λyc1和一个线性相位2πfc1t ;静止目标 在通道2的位置信 息为 (x0- d 2,yc2+ d2(8yc1)) ,此外 ,它还有一 个常数相 位和一个线性相位2πf c2 t 。从而对静止目标,通道间位置差异与相位差异分别为:

2算法

本算法的逻辑框图如图2所示。算法共分为5步: 坐标配准、相位补偿、杂波对消/干涉、均值平滑和阈值检测。其中坐标配准和相位补偿是2种方法所共有的且为重点关注的步骤。

2.1坐标配准

坐标配准是通过对通道2信号的位置平移以消除同一静止目标在不同通道间的差异。理论上只需在通道2信号上平移两通道之间的位置差即可,但这一方法受到系数参数不够精确的影响,配准精度不高。在此, 采用将其转化为一个最优化问题,即找到一个平移量,使得通道2图像平移后与通道1的差异最小。假设通道1的SAR幅度图像为M× N的实数矩阵I1(i,j) ,通道2的SAR幅度图像为M× N的实数矩阵I2(i,j) ,则两通道间的差异可用均方误差e来衡量:

那么最优化问题可表述为:找到一个 (m0,n0) ,其中m0∈ R,-M 2  m0 M 2,n0∈ R,-N 2  m0 N 2,使得I2(i,j) 平移 (m0,n0) 后的e最小。

因为m0和n0是非整数,这就使得在时域上的处理变得困难起来,而帕斯瓦尔定理将此问题转化为频域处理提供了理论支持。根据帕斯瓦尔定理有:

式中:

因此:

根据二维傅里叶变换,有:

即时域上 的平移等 同于频谱 上乘以因此在频域上要解决的问题是 :找到一个 (m 0 ,n 0 ) ,使得X 2 (u, v) 乘以) 后,使得式( 8 )最小。

2.2相位补偿

由于基线长度d远小于斜距yc1,故d22yc1≈ 0 ,根据式(8),相位差Δθs约为:

要补偿这个相位,可以直接让通道2的图像乘以exp(-jΔθs) ,但同样基线长度等参数的不准确性会导致补偿结果的不准确性,因此将问题转化为一个一维最优化问题。

设要补偿 的相位为 θs,通道1的复数图 像为I1com(i,j) ,通道2的复数图像为I2com(i,j) ,则相位补偿后两通道间的差异用均方误差e(θs) 来衡量:

则问题为:找到一个 θs,使得e(θs) 最小。

2.3杂波对消/干涉

对于DPCA来说,需要进行杂波对消,即用通道1信号与配准和补偿后的通道2信号相减,所得的差值在理论上可以消除静止杂波而保留运动目标杂波,但实际上由于配准与补偿的不完全性,并不能将静止杂波完全消除,一部分强静止杂波依然会保留影响运动目标的检测。对于ATI而言,取通道1信号与配准和补偿后的通道2信号的相位差进行检测。同样,由于配准与补偿的不完全性,并不能将静止杂波完全消除,一部分强静止杂波依然会保留影响运动目标的检测。

2.4均值平滑

为进一步消除强杂波对于运动目标检测的干扰,需要对信号进行均值平滑。对2种方法而言,其平滑窗口的大小选择是不一样的。对于DPCA,选择3 × 3的小窗平滑效果较好;而对于ATI,窗口大小越接近于运动目标大小将能够更好地凸显运动目标并抑制强杂波。

2.5阈值检测

对于两种方法,均使用阈值检测,计算其均值 μ 与方差 σ ,则根据公 式threshold= μ + ασ 可设定检 测阈值。理论上,α 越大,则检测后残余的杂波越少;但实际上,为了保证动目标不被漏检,并不能过高地设定 α 的值,在此取 α = 4 。

3研究成果

使用电子所的一组双通道雷达数据来检测本文算法的可行性。图3为通道1的SAR信号成像,从图中可以看出目标1要稍弱一些不易检测。

图4为DPCA差值平滑后的图像。

图5为DPCA阈值检测结果,图中可见2个运动目标,但同时一些强杂波也被保留下来。

图6和图7是干涉相位图和平滑后的干涉相位图, 对比发现,平滑后动目标被凸显出来更易检测,图8为ATI检测结果,2个目标均被检测出来且无杂波残留,证明该算法检测效果较好。

4结语

本文针对地面运动目标检测提出了创新的DPCA和ATI技术。两种方法均能够有效地检测出运动目标, 即使运动目标相比于杂波来说强度非常弱的情况下,检测效果依然良好。对于两个方法的最终成果,发现ATI在运动目标检测方面更胜一筹。

摘要:通过改进合成孔径雷达(SAR)动目标检测(GMTI)的检测方法 DPCA及ATI,并对两种方法的效果进行了对比。DPCA处理步骤为:坐标配准、相位补偿、杂波对消、均值平滑和阈值检测,而ATI处理步骤为坐标配准、相位补偿、杂波对消/干涉、均值平滑和阈值检测,除了第三步有所差异外,其余步骤均一样。在此着重改进坐标配准与相位补偿,为提高配准与补偿的精度以提高动目标检测的准确率,并使用亚像素级的频域配准方法。实测数据证明,经改进后的DPCA和ATI检测效果均良好,即使是强度极弱的动目标也能够被检测到。经对比分析,ATI在动目标检测上有更优良的性能。创新地使用亚像素级的频域配准方法,且该算法为自动算法,对系统参数精度无要求。

关键词:合成孔径雷达,地面运动目标检测,偏置相位中心天线技术,沿轨干涉技术

DPCA论文 篇2

人脸识别是目前模式识别和计算机视觉领域的研究热点,它在身份认证、人机交互和智能信息处理等方面有着广泛的应用[1]。Turk等人提出主成分分析(Principal Component Analysis,PCA)的人脸识别方法[2],把图像矩阵转化成图像向量,但造成图像向量维数非常大,计算样本协方差矩阵很困难,耗费大量运行时间。

针对这些问题,Yang等人于2004年提出了二维主成分分析(2DPCA)的人脸识别方法[3],直接以图像矩阵进行特征提取,可以降低计算的复杂性,提高人脸识别的准确率[4,5,6],但在小样本的人脸识别情况下(或者样本中存在异常的边缘样本时),不能保证各类训练样本的均值就是本类样本分布的中心点,以训练样本的均值作为该类样本中心求出的投影矩阵不能保证是最优的。2010年,韩晓翠等人基于样本中间值改进了2DPCA的人脸识别方法[7],可以减小训练样本均值偏离类中心对求取最优投影矩阵的影响,但提取出的人脸特征维数大[7,8],运行时间较长,识别率提高不明显。

鉴于上述原因,本文提出了基于样本中间值的双向二维主成分分析(Two-Directional Two-Dimensiona Principal Component Analysis Based on Sample the Median,(M(2D)2PCA)的

人脸识别方法,它将训练样本的中间值代替训练样本的平均值,以此重建总体散布矩阵,改进传统的(2D)2PCA算法。同时,本文采用支持向量机(SVM)替代最近邻(NN)分类器进行分类识别,其方法明显优于传统人脸识别方法。

1(2D)2PCA算法

假设模式类别有C类,每一类有ni个训练样本图像组成。训练样本集由组成,且每个训练图像都是m×n矩阵。

设有N个训练样本图像,Ak(k=1,2,…,N)表示第k个训练样本图像,且Ak∈Rm×n,则所有训练样本图像的平均值为

训练样本的行方向的总体散布矩阵为

求解G的特征值和特征向量,根据主成分的贡献率

选择G的前d个最大特征值λ1,λ2,…,λd所对应的特征向量X1,X2,…,Xd构成的最优投

影矩阵Xopt,即Xopt=[X1,X2,…,Xd]。

图像列方向的总体散布矩阵矩阵

其中,和分别是和的第j个列向量。求解G'的前q个最大特征值γ1,γ2,…,γq对应的特征向量Z1,Z2,…,Zq,得到最优投影矩阵Zopt=[Z1,Z2,…,Zq]。

由上面计算得到n×d维投影矩阵Xopt和维投影矩阵Zopt,将m×n的图像矩阵A同时向Xopt和Zopt投影,产生一个q×d的图像识别矩阵

2 基于样本中间值的(2D)2PCA算法

2.1 样本中间值的概念

对于给定的有限数列{x1,x2,…,xn},对其排序,当n为奇数时,数列的中间值为n为偶数时,数列的中间值为。

假设人脸图像有C类,每一类有ni个图像组成。样本集由组成,且每个样本图像都是m×n矩阵。由以下步骤计算得到样本图象中间值:

(1)将所有训练样本先转化成列向量Zi1,Zi2,…,Zini,其中,Zini∈Rl×1,l=m×n,取第i类人的n个训练样本图像组成矩阵:

列向量组的中间向量:

其中,是每行的中间值。

(2)再将转化成m×n矩阵M:

(参见右栏)(8)

矩阵M∈Rm×n,M为人脸图像第i类的类内中间值。

2.2 基于样本中间值的(2D)2PCA(M(2D)2PCA)算法步骤

基于样本中间值的(2D)2PCA算法步骤如下:

(1)把图像样本转换成列向量,取每个人的n个样本,按照式(6)、(7)、(8)计算训练样本每一类的中间值Mi(1≤i≤c)。

(2)用样本中间值代替样本平均值构建图像行和列的总体散布矩阵。

其中,Mi为第i类的类内中间值。

(3)计算G和G'的特征值和特征向量,选取G的前d个最大特征值所对应的特征向量作为投影轴Xopt=[X1,X2,…,Xd],G'的前q个最大特征值所对应的特征向量作为投影轴Zopt=[Z1,Z2,…,Zq]。由式(5)求得图像特征矩阵。

(4)应用支持向量机(SVM)分类器对人脸图像的特征矩阵进行分类识别。

3 实验结果与分析

3.1 Yale人脸数据库上的实验

Yale人脸数据库有15个人,每人11幅不同的图像。这11幅图像在表情、姿态和光照上有很大区别。每幅图像大小为100×100,灰度级为256。

实验1,不同的训练样本数和测试样本数,应用支持向量机分类识别,研究训练数目对不同算法识别准确率和识别速度的影响,通过对比验证本文算法在识别表情、姿态和光照有很大区别的人脸图像时的有效性。

实验中,训练样本数目为n=3,5,7,SVM的参数设置为―c=5,―g=0.1。实验设计过程中采用2DPCA+NN、M2DPCA+NN、(2D)2PCA+NN、M(2D)2PCA+NN以及本文方法(M(2D)2PCA+SVM)进行实验,结果取50次实验结果的平均值,如表1所示。

表1不同训练样本数目下的准确率和时间比较

(参见下页)

从表1可以看出,随着每类人训练样本数的不断增加,五种方法的识别率都随之提高,而且基于样本中间值的方法比从传统的方法识别率提升得快。此外,当n=5或n=7时,基于样本中间值方法的识别率不低于采用平均值的传统方法,且本文方法识别率明显高于其他四种方法。另外,(2D)2PCA识别时所需的系数比2DPCA少,分类和识别时间短。

图2中通过比较不同特征矢量维数下的识别率发现,随着特征矢量维数的不断增加,2DPCA、(2D)2PCA以及本文方法的识别率逐渐升高,且本文方法的识别率增加的速率远大于另外两种方法。并且当维数≥7时,三种方法的识别率都趋于稳定。

3.2 ORL人脸数据库上的实验

ORL人脸数据库是基于表情和姿态变化的人脸数据库,该数据库有40个人,每个人有10幅不同的图像,共400幅。图像为黑色拍摄背景,且在光照强度、拍摄角度、面部表情(笑或不笑)以及面部细节(戴眼镜或不戴眼镜)等方面有很大区别。这些图像大小均为112×92。

实验2,选择不同识别算法,在ORL人脸库上进行实验,通过对比验证本文算法在识别表情、姿态有很大区别的人脸图像时的有效性。

每人任选5幅人脸图像用作训练样本,其余5幅作为测试样本,选择支持向量机参数为―c=5,―g=0.1。应用2DPCA+NN、Alternative 2DPCA+NN、M2DPCA+NN、(2D)2PCA+NN、M(2D)2PCA+NN和本文算法M(2D)2PCA+SVM进行对比实验,结果取50次实验结果的平均值,如表2所示。(参见右栏)

从表2可以看出,(2D)2PCA的识别率比2DPCA的识别率高,而M(2D)2PCA的识别率又比(2D)2PCA高,本文方法的识别率明显高于其他五种方法。可见,样本中间值更接近训练样本的分布中心,采用类内中间值构建的特征矩阵更准确地表示了原图像在行和列两方面的信息。此外,M(2D)2PCA的识别时间比其他方法的识别时间都短。

4 结束语

本文提出了基于样本中间值的双向二维主成分分析的人脸识别方法。此方法应用训练样本的类内中间值代替平均值构建行和列的总体散布矩阵,提取特征向量作为最优投影轴,采用SVM分类器进行分类识别。

在Yale和ORL人脸数据库上实验,并取得了较为理想的效果,识别性能明显优于传统的2DPCA、M2DPCA、(2D)2PCA和M(2D)2PCA算法,且识别时间大大缩短。同时,在样本数较少且存在边缘样本的情况下,样本的类内中间值比总体的平均值更接近训练样本的分布中心,更具有鲁棒性。

参考文献

[1]李武军,王崇骏,张炜.人脸识别综述[J].模式识别与人工智能,2006,19(1):58-66.

[2]Turk M,PentlandA.Eigenfaces for recognition[J].Journal of Cognitive Neuroscience,1991,3(1):71-86.

[3]Yang Jian,David Z.Two-dimensional PCA:Anewapproach to appearance-based face representationand recognition[J].IEEE Trans on Pattern Analysisand Machine Intelligence,2004,26(1):131-137.

[4]Zhang Daoqiang,Zhou Zhihua.(2D)2PCA:Tow-directional tow-dimensional PCA for efficient facerepresentation and recognition[J].Neurocomputing,2005,69(1-3):224-231.

[5]杨万扣,吉善兵,任明武.基于增强的2维主成分分析的特征提取方法及其在人脸识别中的应用[J].中国图像图像学报,2009(2):227-232.

[6]万鸣华,刘中华,金忠.一种基于2DPCA和SVM的人脸识别方法[J].通信技术,2009,42(5):100-102.

[7]韩晓翠.一种改进的2DPCA人脸识别方法[J].计算机工程与应用,2010,46(25):185-187.

DPCA论文 篇3

关键词:二维主成分分析,特征提取,简化均值,车脸识别

0 引言

车脸识别作为一种新兴的智能交通技术在道路管理, 交通安全, 公安稽查, 物流运输等方面受到广泛的关注。由于套牌车, 无牌车, 假牌车, 导致车型难以辨别, 对公安稽查, 交通肇事等各个方面造成了不便。因此, 车脸识别在实际运用中将对道路安全, 公安稽查起到很大帮助。当下, 车辆识别的主要方法有基于物理测量的车型识别, 其通过各种方法测量出汽车的长宽高等物理量进行测量, 得到大量的尺寸数据, 其测量过程中需要用到大量的机械设备, 测试过程复杂低效。另一种方法则是基于图像的检测方法, 该方法所需要使用的设备简单, 只需要简单的几个摄像头即可, 安装简便, 并且无需接触测量, 速度快、效率高。

基于图像处理的车脸识别方法主要有以下几种:以散热器格栅作为ROI (Region of Interesting) , 用“蒙板二值化分层”求出原图像共生矩阵, 再根据共生矩阵对车脸纹理进行识别;还有通过以散热格栅和大灯组作为ROI, 先根据车脸计算并确定车的中轴线, 再确定车灯所在的水平区域, 用Hough变换和Snake模型在前脸中划分出大灯和前进气格栅区域, 最后根据车灯形状和进气隔栅的特征纹理识别车脸[1,2,3,4]。文章采用的识别方是一种改进型的二维主成分分析法 (2DPCA) 。2DPCA主要是运用在人脸的识别上, 考虑到人脸的复杂多变性, 将其扩展到其他领域如交通标志的识别是可行的, 将其运用在车脸的识别理论上是可行的, 随后的实验也证明, 该方法可行有效。

1 2DPCA算法

1.1 算法描述

PCA方法在降维以及特征提取方面具有优势, 因此常应用在人脸识别领。PCA方法的基本原理是:用K-L变换提取图像的主要成分, 组成特征图像空间。测试时将图像投影到该空间, 进而获取一组投影系数, 然后与每个测试图像比较识别。2DPCA算法是在标准PCA算法上的改进, 主要区别是在构造协方差矩阵时, 选取前r个最大特征值和特征值所对应的特征向量也不相同。2DPCA算法是将m×n维的矩阵图像A经过线性变换Y=ATX投影到X上。进而得到一个n维列向量Y, 即为图像A的投影特征向量[5]。假设有c个类别:ω1, ω2, …, ωc每类有n个训练样本图像, 是所有的训练样本图像, 任何一个训练图像都是m × n矩阵。训练图像总的散布矩阵如下:

式中:, 为训练样本的总体均值矩阵, 容易证得GT为n × n的非负定矩阵[6]。接着取GT的前r个最大特征值所对应的标准正交特征向量X1, X2, X3, …, Xr, 令P =[X1, X2, …, Xr] , 则称P为最优投影矩阵[7]。

1.2 特征提取

针对测试样本A, 令Yk= AXk, k=1, 2, …, r, 投影所得到的特征失量Y1, Y2, …, Yd称之为测试图像样本A的主成分。图像样本A的主成分可构建成测试图像的特征图[8]:B =[Y1, Y2, …, Yr] 即B = A[X1, X2, …, Xr] = AP 。

1.3 分类

通过以上特征提取过程, 每个测试图像矩阵A对应一个特征矩阵B = AP , 根据这些特征矩阵, 运用最小距离分类器即可对测试图像进行分类, 两个图像特征矩阵Bi=[Y1 (i) , Y2 (i) , …, Yd (i) ] 和Bj=[Y1 ( j) , Y2 ( j) , …, Yd ( j) ] 之间的距离被定义为[9]:

式中K=1, 2, …, d。

假设训练图像为B1, B2, …, BM, 其中M为所有训练样本的个数, 每一个样本图像都属于一个指定的类别ωk。针对任意一个测试图像B, 如果 (B, Bi) = mjin (B, Bj) , 并且Bi∈ωk那么分类结果[9]就是Bi∈ωk。

2 改进的2DPCA算法

2.1 一种简化均值的概念

一个有限数列, 将它按照从小到大的顺序进行重新排列, 然后将新排列的数列按照一定的间隔抽样, 再将抽样出来的数取平均值。这就提出来的一种新的计算均值的方法, 虽然无法达到正常均值那样精确, 但已十分接近。之前有论文提出过中间值法[10], 但该方法有一个问题, 如中间值相较于前面的数突然有一个较大的阶跃, 再采用中间值的话将会导致一个较大的误差。

具体步骤:

(1) 按照从小到大的顺序排列原数列;

(2) 确定抽样间隔, 如果数列中有偶数个元素 (设有N个元素) 则抽取4 个元素, 分别为第1 个, 第就L个, 第S个, 第N个。其中:

式中h属于正整数。

如果数列中有奇数个元素 (设有N个元素) , 则取第1 个元素, 中间元素 (即第 ( N2) +1 个元素) 。

(3) 将取出的数求均值。

例如:

数列1={8.2, 9, 1, 2.7, 3.4, 5, 7, 8.9, 4.5, 9.8, 7.6 }

重排数列1={1, 2.7, 3.4, 4.5, 5, 7, 7.6, 8.2, 8.9, 9, 9.8},

取重新排列之中的重排数列1[1], 重排数列1[6], 重排数列1[11]组成新数列。

抽样数列1={1, 7, 9.8},

均值=6.1, 简化均值=5.93, 中间值=7,

数列2={9.3, 7, 1.2, 6.2, 8.1, 9.9, 3, 3.8, 3.5, 6.8},

重排数列2={1.2, 3, 3.5, 3.8, 4, 4.5, 7, 8.1, 9.3, 9.9},

取重新排列数列中的重排数列2[1], 2[4], 2[7], 2[10]组成新数列,

抽样数列2={1.2, 3.8, 7, 9.9},

均值=5.43, 简化均值=5.48, 中间值=4.25。

2.2 改进均值矩阵

假设给定几个同型矩阵, 如给定5 个随机矩阵

求改进均值矩阵, 首先将上列5 个矩阵在第3 维上按照从小到大的顺序重新排列, 排列之后的结果如下:

然后再将重新排列之后的矩阵抽取B1, B3, B5在第三维上求均值, 得到的即为简化均值矩阵:

2.3 算法步骤

标准2DPCA方法计算总体散布矩阵时, 使用了样本的总体平均值。当样本过大, 过多的情况下, 运算所需要的时间将会很长。因此采用简化均值算法。首先, 按照1.3 节所述方法求出所有训练样本的简化均值矩阵图像N, 带入式 (1) 中取代得到改进后的散布矩阵:

接着算出GT的前r个最大特征值所对应的特征向量X1, X2, …, Xr组成的最优投影矩阵P=[X1, X2, …, Xr], 再用待测图像A乘P得到待测图像的特征矩阵B= [X1, X2, …, Xr]=AP最后用最小距离分类器进行分类。

3 实验结果与分析

实验平台:CPU intel奔腾双核E6800 @ 3.33H;

内存:DDR3 1 333 MHz 2 GB;

硬盘:500 GB 7 200 r/min, 16 MB缓存。

操作系统:Windows 7旗舰版32位SP1;

测试软件:Matlab R2011a。

先在AR人脸库 (由西班牙巴塞罗那计算机视觉中心建立, 采集环境中的摄像机参数, 光照环境, 摄像机距离等都是严格控制的) 中进行算法的比较试验, 每张图片默认分辨率为120×165 像素BMP格式, 总共100 类, 每类26 张。图1 为AR库的部分人脸灰度图像。

选取每类图像的前部分作为训练集, 余下的部分作为测试集。测试结果在测试时间和测试识别率上进行比较。实验结果如表1, 表2 所示。

s

第2 个实验用到的所有图像均由实地拍摄的车辆车头图片组成。如图2 所示, 分别从车辆的车标高度, 车辆前挡风玻璃底部高度, 挡风玻璃中央高度拍摄, 每个高度分别以车中央位置为中心, 每隔1 4 个车宽拍摄车辆前脸。总共拍摄了32 种车, 每辆车21 张样本, 拍摄是在天气晴好的普通街道上。每张图片经过后期处理成分辨率为165×120 的灰度图像。

%

不同样本下各种2DPCA方法在时间和识别率上的对比见表3, 表4。

s

%

实验证明, 在一定噪声的情况下, 3 种方法都表现出令人满意的识别率。由表1 和表3 显示, 简化均值方法在某些样本识别率上略有下降, 但处在可接受范围。表2 和表4 在大图像集中, 本文方法的识别速度相对于标准的2DPCA方法有较大的提升, 在实际运用中, 使用DSP芯片将会有更高的识别速度。相较于使用传统的Hough变换等传统的图像处理方法, 2DPCA算法的更加简便直接, 在工程上更具有可行性。

4 结语

在保证识别率不降低的情况下, 识别速度的提升在工程运用中拥有很高的实际意义。文章在标准2DPCA的方法上提出了简化均值的方法, 在已经建立的车脸库中进行的实验表明, 改进后的方法在识别率略有下降的基础上, 提升了识别速度, 具有较高的实际工程应用价值。

参考文献

[1]田保慧.智能交通系统中自动车型识别技术的研究[D].西安:西安电子科技大学, 2008.

[2]钱志伟.智能交通系统中车型识别的研究与应用[D].西安:西安电子科技大学, 2011.

[3]笪东旭.基于车脸识别的套牌车检测方法研究[D].西安:西安电子科技大学, 2013.

[4]姚源.车脸图像特征提取[D].长沙:中南大学, 2008.

[5]陈伏兵, 陈秀宏, 张生亮, 等.基于模块2DPCA的人脸识别方法[J].中国图象图形学报, 2006 (4) :580-585.

[6]朱明旱, 罗大庸.模块2DPCA的缺陷与改进[J].中国图象图形学报, 2009 (1) :94-98.

[7]张龙翔.改进的模块2DPCA人脸识别方法[J].计算机工程与应用, 2010, 46 (13) :147-150.

[8]赵雅英, 谭延琪, 马小虎.基于样本扩充和改进2DPCA的单样本人脸识别[J].计算机应用, 2011, 31 (10) :1728-1730.

[9]王睿, 杨安平, 谢文彪.基于改进2DPCA的快速交通标志识别法[J].工业控制计算机, 2012, 25 (10) :78-79.

DPCA论文 篇4

人脸识别技术关键点在于特征提取, 由于人脸容易受光照、角度、表情等方面的影响, 使之在特征提取方面带来很多困难。Gabor变换是图像辨识的最好方法之一, 与人类的视觉系统也是一致。利用Gabor小波提取的特征能够克服上述干扰对识别效果的影响。但是其直接用Gabor提取得到的特征维数太高, 计算量大, 不能满足人脸识别的实时性要求, 因此对纹理特征进行降维也是关键。本文采用了Gabor小波与改进的2DPCA算法来达到人脸特征提取及降维处理。

2DPCA方法是一种直接计算图像协方差矩阵的特征向量的方法, 不需要像PCA方法那样将图像矩阵预先转化为一维矢量, 更加方便简单;但2DPCA方法本质上是对图像矩阵按行经行压缩提取特征, 消除的是图像矩阵中列的相关性, 依旧保留了行的相关性, 没达到最好的人脸识别率。针对这一问题, 本文采用一种改进的2DPCA方法, 同时考虑到了图像矩阵的行列相关性, 在ORL人脸库的实验背景下, 该方法取得了比2DPCA更高效的识别率。

二、Gabor小波特征提取方法描述

Gabor小波是Gabor变换与小波理论相结合的产物, 它继承了小波变换的多分辨率特性。二维Gabor滤波函数在空间域和频率域中具有良好的分辨能力, 具备提取图像局部信息变化的能力, 因此在图像处理中有广泛的应用。二维Gabor小波的核函数定义如下:

假设人脸图像表示为I (x, y) , 让其和Gabor小波的核函数相卷积得:

其中Qu, v (x, y) 为Gabor人脸, 在这里我们选5个尺度, 8个方向。这样每幅人脸图像就可以得到40个复系数Gabor纹理特征, 然后对它们取模值, 把每一个纹理特征向量化并依次组成矩阵, 这样就实现了Gabor纹理特征提取。

当然, 若我们直接运用Gabor提取原始特征, 其数据维数相当高的。在此本文对Gabor人脸进行3次小波分解, 将其低频近似图按行连接起来组成列矢量, 并将全部列矢量依次连接起来, 即组成了一幅人脸的低维Gabor特征列矢量。

三、基于改进的2dpca方法的特征降维

3.1基于行方向的2dpca方法

我们平时所说的2dpca方法, 认为其实质就是基于行方向的2dpca方法。假设训练集中有M个大小为m×n的矩阵人脸图像Ai。设X为一个n维的单位列向量, 把人脸图像投影到X中, 得Yi=AiX, 其中Yi被称为图像Ai的投影特征向量。这里我们希望找到一个最优的投影轴X, 使得所有训练样本在其上投影后得到的特征向量的总体散布矩阵达到最大化。在2DPCA中是用投影后向量的总离散度作为准则函数J (x) 来衡量投影向量X的优劣, 定义为:

其中tr (Sx) 表示矩阵Sx的迹, Sx表示训练样本图像投影后特征向量的协方差矩阵, 定义为:

定义图像的协方差矩阵为:

最大化J (x) 的单位向量称为最佳投影向量Xopt, 也就是矩阵G的前d个最大特征值所对应的特征向量构成的投影矩阵就是最优值, 表示为Xopt=[X1, X2, …, Xd]。在求得最佳投影向量后, 便可对人脸图像进行特征提取和分类。

3.2基于列方向的2DP CA方法

令Z∈Rm×n, Z是一个列向量互相正交的矩阵, 将图像矩阵A投影到Z上, 产生一个大小为q×n的矩阵B, 即:

类似的, 用如下准则函数J (Z) 可以找到最佳投影矩阵Z:

我们从上式 (9) 可以得到图像列方向的协方差矩阵G:

计算出G前q个最大特征值对应的特征向量Z1, ..., Zq得到最优投影矩阵Zopt, 由于式 (10) 的特征向量只反映图像每列间的信息, 可认为这个2DPCA是沿图像列方向进行处理的。

3.3改进的2DP CA算法

由上边推理所知, 2DPCA方法是基于行方向来处理的, 消除了列的相关性, 忽视了行的相关性;基于列方向的2DPCA方法消除了行的相关性, 遗留了列的相关性。在此构造一种方法同时消除图像行、列的相关性, 使其达到更好的识别率。

设己获得n×d维投影矩阵X和m×q维投影矩阵Z, 将m×n的图像A同时向X和Z投影, 产生一个q×d的矩阵C:C=ZTAX (11)

这里称矩阵C为图像重建协方差矩阵。于是源图像A的重建图像

在此我们可以看出, 改进的2DPCA方法产生的特征矩阵C的维数较2DPCA方法获得的特征矩阵Y=AX的维数 (m×d) 少得多。因此, 与2DPCA相比, 在人脸重建和识别时所需要的系数要少得多。将训练样本图像Ak同时投影到X和Z上, 得到训练样本的特征矩阵Ck。选定一幅测试图像A后, 先应用式 (11) 得到其特征矩阵C, 然后可选用最近邻分类器来进行分类。把C与Ck的距离定义为:

四、仿真实验结果

本实验中所用到的人脸图像都选自ORL人脸库, 其中包括了40副人脸图像, 每人10幅大小为112×92的灰度图像且都具有丰富的面部表情和姿态变化。把每人前6幅图像作为训练图像, 后4幅图像作为待测图像, 这样训练样本共有240个, 待测样本共160个。从表1中不难看出, 应用2DGabor小波与改进的2DPCA方法的识别率在同一特征个数情况下均高于PCA和2DPCA结合的方法, 并且特征维数降到了较低的范围, 在小样本情况下具有比较满意的识别率。

五、结论

本文提出的人脸识别算法先用2DGabor小波变换提取人脸特征, 2DGabor滤波器是带通滤波器, 它在空间域有良好的方向选择性, 通常采用由5个中心频率和8个方向的Gabor滤波器组成, 用它来提取图像不同的频率尺度和方向的纹理信息, 能够克服光照、角度、表情等干扰带来的影响。再用改进的2DPCA方法进行降维, 与原来的2DPCA方法相比, 它同时包含了图像行方向和列方向信息, 能够同时利用图像的灰度信息和结构信息, 同时图像特征系数大为减少, 有效的提高了识别率。

参考文献

[1]高彤莘.某办公楼综合布线系统设计综述[J].科技信息, 2009 (3)

DPCA论文 篇5

关键词:二维主分量分析,二维线性判别分析,特征提取,离散余弦变换

0 引 言

人脸识别技术在身认证、视频监控等安防领域得到了广泛的应用,是生物特征识别系统中研究中的热门话题之一。目前,人脸识别技术按所使用的表达方式不同,可分为基于外观的方法与基于特征的方法。基于外观的方法主要使用了人脸图像中特定区域或整个人脸的全部纹理特征,将人脸看成一个整体,将其映射为高维空间中的一个点,这样就可以实现一个人的不同图像用高维空间中的点集来描述,并可以使用统计的方法得到其分布;基于特征的方法中,主要利用脸部几何特征(眼睛、眉毛、嘴巴和脸颊等)及它们之间的几何关系。按技术分类可分为子空间方法与非子空间方法两类。子空间方法将高维的人脸图像特征通过空间变换压缩到一个低维的子空间中进行识别,典型的方法有主分量分析法、独立分量分析法、线性判别分析和基于核的分析等。非子空间法主要有基于神经网络的方法、弹性匹配法、形变模型方法和隐马尔可夫模型法等。在人脸识别系统中最早提出子空间分析方法的是文献[1]的主分量分析法(PCA),并取得了良好的效果。文献[2]提出线性判别分析法(LDA),该方法相对于PCA减少了计算量,并且提高识别率。文献[3]提出了二元主分量分析法(2DPCA),该方法不仅在识别率上远远大于PCA与LDA,且缩短了训练时间。后来,通过研究人员的深入分析,子空间分析法在人脸识别技术中得到广泛应用,并且成为当前识别技术中的主流方法之一。本文将对2DPCA、2DLDA、2DPCA+2DLDA的方法进行比较分析,并在此基础之上提出二维离散余弦变换(2DDCT)与2DPCA+2DLDA相融合的人脸识别方法,用该方法在ORL库上与上述三种方法进行识别性能的比较。

1 基本理论

1.1 二维主分量分析(2DPCA)理论

2DPCA是为了缩短特征提取的时间与减少PCA训练时间而推广的计算方法,2DPCA是由文献[4]提出来的,该方法可以直接在二维图像矩阵上进行计算,不像PCA方法需转换成一维向量的形式,以避免求特征值的计算量。2DPCA方法直接在二维图像上构建协方差矩阵,并求出协方差矩阵的特征值与特征向量,将二维图像直接投影到最优投影方向上,从而获得一组投影特征向量。2DPCA应用于人脸识别可分为特征提取与模式分类。

1.1.1 特征提取

对于任意一幅m×n图像矩阵A,经过如下线性变换:

yi=Axi (1)

其中xi为给定的一组最优的n维归一化投影向量,得到的yi为一个m维的列向量,并称之为A投影特征向量。对于任一组训练样本为m×n图像Ai,其中i=1,2,…,K,可求得其样本总体协方差矩阵为G:

G=1Κi=1Κ(Ai-A¯)Τ(Ai-A¯)(2)

易知Gm×m正定矩阵,其中A¯为训练样本均值。为了求出式(2)中最优的归一化投影向量x,应用最大化准则函数J(x):

J(x)=xTGx (3)

寻找最优的投影向量,即为准则函数为tr(G)最大值,相对应的特征值之和最大。因为当样本类别较多时,只有一组最优投影向量是不够的,所选择正交极大化的一组投影向量作为最优投影矩阵X=[x1,x2,…,xR],其实就是G所对应的前R个最大特征值(λ1≥λ2≥…≥λR>0)所对应的特征向量所构成。

B=[y1,y2,…,yR],可知B是一个K×R(RK)的矩阵,因此可知BA的特征矩阵。

1.1.2 模式分类

设训练样本中模式类别有C(ωt,t=1,2,…,C)个,对于任意两幅图片AmAn,所对应的投影特征矩阵Bi=[y1(m),y2(m),…,yL(m)]和Bj=[y1(n),y2(n),…,yL(n)]之间的距离定义为:

d(Bi,Bj)=r=1Lyr(m)-yr(n)2(4)

其中,‖yr(m)-yr(n)‖2表示主分量yr(m)yr(n)之间的欧氏距离。对于所有训练样本分别对应的特征矩阵B1,B2,…,BK,并且各次都属于下ωt类别,对于给定的一个测试样本A,与之对应的特征矩阵B,若存在d(B,Bi)=min[d(B,Bj)],且有Bi∈ωt,则可判定A∈ωt

1.2 2DLDA理论

二维线性鉴别与二维主分量分析原理是一样的,都是直接对二维图像进行处理,这样就比LDA缩短了分类时间,并解决类内散度矩阵的非奇异问题,即小样本的问题。

1.2.1 参数定义

设一组训练本X=[x1,x2,…,xN],并且这组样本包括了K类图像,对于其中一个训练样本xiL则可以表示第L(L<K)类别CL中的第i(i=1,2,…,NL)个样本,NL为该类训练的样本数目,则可以得总体训练的样本数目,Ν=i=1ΚΝi,所有训练样本的均值为:

X¯=1Νi=1Νxi(5)

可求得CL的样本均值为:

X¯CL=1ΝLi=1ΝLxiL(6)

定义类间散度矩阵如下:

sb=L=1ΚΝLΝ(X¯CL-X¯)(X¯CL-X¯)Τ(7)

定义类内散度矩阵如下:

sw=1ΝL=1Κi=1ΝL(XiL-X¯CL)(XiL-X¯CL)Τ(8)

1.2.2 特征提取

2DLDA的特征实际与LDA一样,即对sw-1sb求特征值与特征向量,得到了前R个(λ1≥λ2≥…≥λR>0)最大的特征值所对应的特征向量Uj(j=1,2,…,R),即为一组最优投影向量。对于给定的一副图像A,将其投影到U=[U1,U2,…,Uj]上,得到B为:

B=AU (9)

其中,B称为A的投影特征矩阵,U称为A的投影矩阵。

1.2.3 模式分类

与2DPCA的原理一样,利用最近邻分类器,对训练与测试的样本进行最小距离计算,即可判别出测试的图片是哪一类人脸。

1.3 2DPCA与2DLDA方法相结合

首先用2DPCA方法对图像进行特征提取得到投影特征矩阵Y, 其次再用2DLDA方法对Y进行特征选择,最后用最近邻分类法对图片进行最小距离计算。

1.4 2DDCT(离散余弦变换)理论

离散余弦变换是一种常用的图像数据压缩方法,基本思想就是在接收方不产生误解信息的前提下进行一定的信息丢失,是一种易于实现的快速算法。对于一幅m×n的数字图像f(x,y),其2D离散余弦变换的公式如下:

F(u,v)=[a(u)a(v)x=0Μ-1y=0Ν-1f(x,y)]×cos[(2x+1)uπ2Μ]cos[(2y+1)vπ2Ν](10)

其中,u=0,1,2,…,M-1,v=0,1,…,N-1,式中F(u,v)称为DCT系数,a(u),a(v)分别为:

a(u)={1/Μu=02/Μu=1,2,,Μ-1

a(v)={1/Νv=02/Νv=1,2,,Ν-1

相应的离散余弦反变换(IDCT)由下式给出:

f(x,y)=x=0Μ-1y=0Ν-1a(u)a(v)F(u,v)×cos[(2x+1)uπ2Μ]cos[(2y+1)vπ2Ν](11)

其中,x=0,1,…,M-1,y=0,1,…,N-1。

离散余弦变换的特点是:频域变化因子u,v较大时,DCT系数F(u,v)的值很小;而数值较大的F(u,v)主要分布在u,v较小的左上角区域,这也是有用信息的集中区域。基于2DDCT系数重建图像时,保留少数离散余弦变换的低频分量 ,而舍去大部分高频分量 ,利用反变换仍可获得与原始图像相近的恢复图像 ,新图像与原图像存在一定误差 ,但重要信息被保存下来。

2 2DDCT、2DPCA和2DLDA的融合

人脸识别Eigenface方法与Fisherface方法[7],主要是把识别过程分为两个基本部分,一是特征提取,二是模式分类。对于特征脸方法,它的主要原理是把人脸图像作为矩阵分析提取人脸特征之后对图像进行重构,使用了该方法以后,人脸图像中存在很大一部分冗余信息,在特征脸方法中这些冗余信息是集中在行列向量之上。2DPCA方法的本质特点是按行分块PCA[6],其投影抽取出的是特征矩阵,在特征提取的过程中所用的时间少,但各特征之间的冗余度仍然很大,这也是为什么2DPCA在识别时当特征个数大于7之后,识别率反而随着训练样本特征个数增加而下降。而2DDCT是一项有损技术压缩图像的方法,其原理也是要将图像进行分块处理,可以将相邻分块矩阵之间的冗余信息减少到最大,不会影响图像的重建,保留有用的图像信息,相当于对图像进行了降维处理,有利于2DPCA提取。2DPCA方法的主要优点是利用总体散度矩阵得到投影特征矩阵,并不需要知道人脸图像的分类信息就可以对人脸图像特征信息进行提取识别,但是识别时间相对较长,且没有对图像信息可以分类的原理加以利用。2DLDA方法可以弥补2DPCA方法在这些方面的不足,它对图像信息进行分类处理,且有识别时间相对较短的特点,但2DLDA需要求类散间矩阵sb与类内散度矩阵sw,在此基础之上对sw-1sb进行特征值与特征向量的求解,训练时间相对较长,而2DPCA训练时间相对较短。因此,本文采用2DDCT、2DPCA和2DLDA相结合的方法进行人脸识别。基本步骤如下:

1) 因为2DPCA只能去除图像行向量上的冗余,利用DCT提取图像的有用信息,剔除图像中的无用信息,提取出主要能量集中的低频分量,可以减少图像列向量上的冗余;

2) 2DPCA其训练时间少,先采用2DPCA实现特征提取,取特征个数K,计算出投影特征矩阵Y;

3) 因2DLDA的分类时间少,所以再采用2DLDA算法对Y进行特征选择;取特征个数K1(K>K1),计算得出新投影特征矩阵Y1;

4) 用最近邻方法识别人脸,设所有训练样本所分别对应的特征矩阵B1,B2,…,BK,并且各次都属于下ωt类别,对于给定的一个测试样本A,与之对应的特征矩阵B,若存在d(B,Bi)=min[d(B,Bj)],且有Bi∈ωt,则可判定Aωt

图1是2DDCT与2DPCA+2DLDA相融合的人脸识别实现的过程示意图。

3 实验结果

分别用2DPCA、2DLDA、2DPCA+2DLDA与2DDCT+2DPCA+2DLDA方法在ORL库上进行了实验,所采用的计算机CPU为core2(2.1GHz),内存为1GB,软件为Matlab2010(a)。结果如下:

ORL库中有40个人,每个人分别有10副人脸图像,共400幅图像,图像像素大小为112×92,灰度级为256。本文使用前5幅图像做训练,后5幅图像做测试,且人脸的表情与姿态是各不一样的,如图2所示。

实验所得数据是选取相应特征个数进行多次仿真取平均的结果,如表1所示。

图3给出了训练特征个数与识别概率间的关系。

结合图3与表1可知,对于2DPCA方法与2DLDA方法不论采用单一的方法还是二者相结合,并非投影矩阵取的特征个数越多识别率就越高,且各种方法所达到的最高识别率所训练的特征个数是不一样的,这主要是因为二维提取之后,投影特征值越大,重构的图片集中的主要信息能量就越高,特征越小的就越低,而最近邻分类法是距离分类器,当训练特征个数越多时,距离就越大,从而识别率下降。

4 结 语

从实验结果得到的数据进行分析,可以得出以下结论:

1) 从实验结果可以得出2DLDA方法比2DPCA方法的效果更好,主要原因是2DPCA方法还只是总体散度矩阵上的特征提取,而2DLDA考虑到了类间散度信息与类内散度信息,在生成的子空间上会实现最佳分类,从而识别率会更高些。

2) 2DPCA方法与二维2DLDA方法的识别率低于两种方法的结合,这是因为两种方法的结合都是利用各自的优势,2DPCA方法能够很好地表现出数据分布的多样性,而2DLDA方法能够很好地表现出数据的分类信息,从而提高识别率,但总体时间会相对比较长。

3) 通过2DDCT对图像进行压缩重建之后,再融合二维2DPCA与2DLDA结合的方法,在识别率上比其他三种方法高,且在总的时间上比其他三种方法少,这是因为图像通过2DDCT处理之后,对图像实现了降维与减少了列向量上的冗余,有利于减少特征提取时间及分类的时间与提高识别率。

4) 对于特征个数选取与识别的高低之间的关系,本文采取自行选取特征个数,再根据实验结果得出最高识别率的方式,这一点在接下来的工作有待进一步研究。

参考文献

[1]Kirby M,Sirovich L.Application of the karhuen-loeve procedure forthe characterization of human faces[J].IEEE Transactions on PatternAnalysis and Machine Intelligence,1990,12(1):103-108.

[2]Turk M,Pentland A.Eigenfaces for recognition[J].Cognitive Neuro-science,1991,3(1):71-86.

[3]Yu H,Yang J.A direct LDA algorithm for high-dimensional data withapplication to face recognition[J].Pattern Recognition,2001,34(10):2067-2070.

[4]Yang J,Zhang D.Two-dimensional PCA:a new approach to appear-ance-based face representation and recognition[J].IEEE Trans Pat-tern Analysis and Machine Intelligence,2004,26(8):982-994.

[5]Ming L,Yuan B.2D-LDA:A statistical linear discriminant analysis forimage matrix[J].Pattern Recognition Letters,2005,26(5):527-532.

[6]Wang Liwei,Wang Xiao,Zhang Xuerong,et al.The equivalence oftwo dimensional PCA and line-based PCA[J].Pattern RecognitionLetters,2005,26(1):57-60.

[7]Belhumeur P N,Hespanha J P,Kriegman D J.Eigenfaces vs.fisher-faces:recognition using class specific linear projection[J].IEEETransactions on Pattern Analysis and Machine Intelligence,1997,19(7):711-720.

【DPCA论文】推荐阅读:

上一篇:平凡中的崇高下一篇:高校辅导员工作创新

本站热搜

    相关推荐