人脸分块

2024-07-25

人脸分块(通用4篇)

人脸分块 篇1

0 引言

人脸识别[1]是模式识别中最重要的研究领域之一,然而,它仍然是非常具有挑战性的任务,面临着许多需要解决的问题。例如,基于主成分分析(PCA)[2]的方法是经典的特征提取方法,学者们运用这种方法处理人脸识别任务的第一阶段,该方法没有有效利用人脸的局部信息[3]。PCA最初用于特征脸方法中[4]为人脸识别任务提取特征,该方法作为一个预处理步骤,将每个2D图像转换成高维向量,该转换会引发一些重要问题,如小样本问题[5]。

为了解决小样本等问题,文献[5]提出了二维主成分分析(2DPCA),该方法保存图像的二维结构,相比基于向量的方法,能产生维度低得多的协方差矩阵[6]。尽管如此,2DPCA仅考虑图像的列的相关性,忽略了行与行之间的相关性,而且相比PCA,它需要更多系数来表示特征空间的图像[7]。于是,文献[8]提出了双向2DPCA((2D)2PCA)来解决2DPCA中的问题,由于它的优势,许多应用程序运用了(2D)2PCA[9]。(2D)2PCA同时利用图像的行和列之间的关系,相比2DPCA,使用较少的系数就能表示图像特征矩阵,而且在大多数情况下,(2D)2PCA和2DPCA获得的识别精度几乎一致[10]。通过增加用于构建投影矩阵的特征向量的数目,可以保留更多这类变化信息,然而更多无效信息和噪声也会被转换到特征空间中[11]。文献[12]提出了分块PCA(BPCA)将图像划分成许多块,使用PCA提取每个块中的特征,2DPCA就是BPCA的一种特例[13]。文献[14]提出了基于L1范式的分块PCA(BPCA_L1)方法,代替L2范式,使用L1范式定义它的优化问题。此外,文献[15]提出了分块2DKPCA,通过采用一种分块方法提取特征,降低了2DKPCA的计算复杂度。上述方法都面临着局部信息缺失问题,以全局方式提取变化最大的部分信息,虽然更有利于明显的全局变化,但可能会丢失一些有用的局部信息。没有有效利用人脸图像中的部分局部信息仍然是有待解决的问题之一。

为了解决局部信息缺失的问题,本文提出了一种新的基于2DPCA的算法。在特征提取阶段,本文方法遵循一种与BPCA相似的方法:保存图像的局部特征,将图像划分成许多子块。采用(2D)2PCA提取每个子块中的特征。因此,本文处理散布矩阵的大小为h2和w2代替(h·w)2,这是BPCA的情况(h和w分别代表每个块的高度和宽度),而且BPCA通过合并所有块的内容获得一个散布矩阵,根据这个散布矩阵计算单个投影矩阵,用于转换块。本文为每个块的内容计算一个独特散布矩阵,并将每个块转换为唯一的且包含那个块大部分信息变化的子空间。与BPCA不同,本文方法能灵活使用各种数目的特征向量,从各种块中构建特征矩阵。与其他方法不同,本文使用一种最近邻集成分类器,每个分类器对应一个块,并决定训练集中输入图像和每个对象之间的相似度,相对于其对应块的内容。通过聚合从所有分类器获得的分数做出最终决策,每个分类器对最终决策的影响正比于其输入块内容中的类之间相似度。在ORL、Yale、FERET和Essex四个人脸数据库上的实验评估了本文方法。实验结果表明,本文方法使用与(2D)2PCA相同数目的系数表示特征矩阵,在识别精度方面优于(2D)2PCA。

1 算法提出

1.1 训练

本文运用分块特征提取方法,受人类识别人脸时的自然方式启发,使用人脸和已知人脸局部脸部特征之间的相似度(如眼睛、鼻子等之间的相似度)。以这种方式可以识别人脸,即使人脸没有曝露出来。为此,本文方法首先将每幅图像划分成一个预指定数目的非重叠块,每个块包含图像的一些局部特征。然后,利用(2D)2PCA将每个块的内容转换到一个子空间,该子空间保存那个块的大部分信息变化,使用小数目系数表示,而消除了那些轻微和非常轻微的变化。以下两个步骤表示该过程。

1.1.1 图像分块

令Ai∈RH×W表示第i幅采样图像,划分Ai的图像矩阵成Nb=DH×DW个块,其中,DH和DW是垂直方向和水平方向上分割的数目,如式(1)所示。分别利用w=W/DW和h=H/DH计算每个块的宽度和高度。

B(2D)2PCA的基本假设是图像中的人脸承受轻微的位置变化,且各种图像中对应块包含相同特征。因此,为了提高该方法对位置变化的鲁棒性,块的尺寸大一些会比小块更好,然而,最佳块大小最终取决于每个特定数据库的特征。

1.1.2 提取特征

划分图像后,使用(2D)2PCA减小每个块的大小,而保留它的大部分信息变化,通过投影块矩阵到2DPCA同时左乘和右乘投影矩阵,定义Gp,q∈Rw×w和G'p,q∈Rh×h为:

式中,。通过选择对应于Gp,q和G'p,q的dp和d'p特征向量分别构建PCA右乘和左乘投影矩阵Wp,q和Zp,q:

式中,Wip,q和Zip,q是对应于Gp,q和G'p,q第i个最大特征值的特征向量,手动设置或可替代性设置用于构建投影矩阵Wp,q(Zp,q)的特征向量的数目dp(d'p):

式中,λi是Gp,q(G'p,q)的第i个最大特征值,θ是预指定的阈值。

将每个块Bip,q投影到Wp,q和Zp,q可获得维数较低的新块

将每个块Bip,q投影到Wp,q和Zp,q可获得维数较低的新块

在这种方式下,式(8)对于每一个样本Ai,有相同块数目的特征矩阵如前,但获得的低维的特征矩阵为:

为了转换给定测试图像Xt到特征空间,将Xt划分成Nb个块后,如下计算

1.2 分类

使用一个集成Nb(块数目)个最近邻分类器来确定测试样本的标签,每个分类器对应于一个块,每个分类器在一组置信度下为输入块的每个类进行投票而不是将分类输入块到其中一个类。在这种方式下,对于L类问题,每个分类器产生L个置信度。为了分类输入测试图像,计算每个类的置信度总和,选择总和最大的类作为输出类。

令Cl,k为测试图像相对于块k的内容属于第l类的置信度,定义Cl,k为:

式中,Dl,k指测试图像第k块和第l类图像对应块之间的最小距离,该距离通过下式计算:

式中,‖·‖Fro指的是Frobenius范式。

式(10)中,参数σ是正常量,决定距离Dl,k如何影响置信度,对于较小的σ,置信度对距离更敏感;如果σ接近零,分类过程等同于使用简单多数投票确定随之而来的类的情况,然而简单投票不能产生最优结果。α是一个归一化常量,所有类的置信度总和等于1。

该归一化步骤使得置信度独立于块中距离大小。

通过下式可以获得测试样本到第l类的总置信度:

如果所有类中类l有最大总置信度总和,则指派测试样本给类l,如果多于一个类满足该条件,则从这些类中随机选择测试样本标签。

2 实验

本节给出了本文方法在Yale、ORL、FERET和Essex大学人脸识别数据库上的实验结果。

所有实验中,对所有方法使用Frobenius范式作为距离函数:

式中,F和Fi是Rh×w中两个特征矩阵。

2.1 Yale和ORL数据库上的实验

Yale人脸数据库包括15个个体的165幅灰度图像,对于每个对象,存储了在脸部表情、脸部细节或光照方向上有变化的11幅图像,所有图像的分辨率为243×320像素,如图1所示为Yale人脸数据库上的图像示例。

ORL数据库包含40个个体的400幅灰度图像,每个对象的图像代表脸部一些变化以及情绪表达、脸部细节、尺度和有限的旋转,归一化所有图像到112×92像素的分辨率,如图2所示为ORL人脸数据库上的图像示例。

本文均使用Yale和ORL数据库中的图像,无需重整大小或裁剪。

2.1.1 最佳识别率比较

对于每个数据库,选择每个对象的k(k=2,4,6,8)个样本子集作为训练集,使用剩余图像评估2DPCA[5]、(2D)2PCA[8]、BPCA[12]、LBDPCA[14]和本文提出方法的精度。

为了找到每个方法可以获得的最高识别率,使用k个训练样本,在各种参数设置下重复执行每个方法,并记录获得的最高平均精度。为了获得最佳实验效果,在随机训练子集上重复40次实验。

表1比较了各种方法在Yale数据库上获得的最佳识别率。对于本文方法,本节中所有实验使用243×64像素的块,且σ=250;对于BPCA,块为27×32像素;LBDPCA中参数t设为50。从表1的结果可以观察到:在每种情况下本文方法获得的最高精度,相比所有其他方法在精度方面至少提高4%。

在ORL数据库上的实验,各种参数设置如下:对于本文方法,使用37×92像素的块,σ设置为1000;对于BPCA设置块大小为28×23像素;对于LBDPCA,t等于50。表2显示了在ORL数据库上的实验中每个方法获得的最佳识别率,正如所看到的,本文方法一致优于其他方法约1%。

如图3所示,每种情况的原始测试图像和对象ID如列(a)所示。(2D)2PCA进行特征提取之后,寻找与每个测试图像最相似的训练样本,用于分类给定的人脸,这个阶段发现的图像及其关联的对象ID如列(b)所示。(c和d)使用(2D)2PCA分别对列(a)和(b)中图像重建的图像;(e)原始图像划分成三块;(f)B(2D)2PCA发现的最相似图像;(g和f)使用B(2D)2PCA分别对列(e)和(f)中图像重建的图像块;(a)的左侧上的数字代表测试图像的正确类;(b)右侧的数字是(2D)2PCA确定的错误类;(f)右侧的数字是与列(f)关联的类。正如所看到的,除了列(a)和列(b)图像之间的整体相似度,还有每种情况下(2D)2PCA找到的属于另外一个对象的图像,两组图像样本的重建图像显示在下两列。

下四列解释了对应于B(2D)2PCA各种阶段的图像,正如以前提到的,对于在ORL数据库上的实验,划分图像成三个水平块,列(e)显示了三个测试图像的块内容。提取了每个块的特征之后,发送他们到不同的最近邻分类器。列(f)显示了发现的与测试图像块最相似的图像块。第一种情况(第一行),中间块是(2D)2PCA发现的同一训练图像的一部分,然而,另外两个最近块属于正确对象,因此,该例子中,分块识别有助于正确识别大部分人脸。第二种情况,第一最近块和第二最近块与错误对象关联,只能正确识别第三最近块,然而,第三个分类器产生的置信度足够大能补偿其他两个分类器的错误,产生测试图像的正确分类。第三种情况,三个最近块都与不同对象关联,没有一个是正确的,然而,聚合阶段,仍能够正确分类图像,因为分派图像到正确类别的总体置信度有最小值。图3解释了ORL数据库的三个样本,在其中一个实验中被(2D)2PCA误分类,但本文方法能正确分类。这些例子证明B(2D)2PCA能避免(2D)2PCA可能会犯错误的三种情况。

分块对图像的内部结构产生影响,这是不可否认的,本文方法利用图像重建,一定程度上减小了分块对图像内部结构的影响。从图3可以清晰地看出,使用(2D)2PCA对(a)(b)中图像重建的图像效果并不是很好,而使用B(2D)2PCA对(e)和(f)重建得到的图像明显比(2 D)2PCA的重建图像清晰,而下文的实验结果表明分块的引入明显提高了识别率。由此可见,本文中的分块对图像内部结构的影响并没有影响到识别精度的提升。

图3中第二和第三种情况证明了为什么合并置信度是一个较好的策略,如果使用分类器之间的投票则不能正确分类图像。

这些例子表明特征提取方法如何优于那些基于整体相似度的方法,然而,尚未有证据表明局部脸部特征总是比全局特征有价值,目前本文方法可以使用两种机制提取和使用信息特征。

第一,以任意方式选择块的形状和大小,仅使用包括整个图像的单个块,或划分图像成许多小块。实验表明,最佳策略更可能在这两个极端之间,正如前面所述,最合适的块形状和大小取决于待分析图像的特性,然而本文相信这是一种选择块的好策略,以这样的方式,他们能包含有意义的脸部特征。

第二,当块内容不充实时,它不能对最终决策做出贡献,其原因是本文方法通过合并从每个分类器获得的置信度做出决策,因此,仅当它对应的分类器足够强烈青睐于一个类而不是其他类时,这个块会影响最终决策。与图像之间距离的有关的参数σ可以用来控制置信度的大小。

2.1.2 特征矩阵大小的比较

本节将本文方法与其他方法的特征矩阵大小进行比较,该因子影响存储训练集所需的内存数量以及分类查询图像及处理这个图像所需的时间数量。

表3中,给出了与表1和表2相关的实验中使用的用于表示特征空间中样本的系数的平均数目。本方法在两个数据库上使用的组件平均数目几乎与(2D)2PCA和LBDPCA相同,但显著低于其他方法。

2.1.3 块大小的平均影响

用于划分图像的块大小能显著影响本文方法的精度,必须针对每个特定数据库做出适当的选择,块大小取决于具体数据库的样本特征。

图4、图5解释了使用各种块大小分类Yale和ORL数据库中图像所获得的精度。设置式(6)中θ值为0.96,确定每种情况下特征向量的数目。对Yale数据库,参数σ设置为250,对ORL数据库,设置为1000。每个给出结果是对各种随机选择的训练集40次实验的平均结果。使用243×64像素大小的垂直块能获得Yale数据库上的最佳实验结果,使用37×92像素大小的水平块能获得ORL数据库上的最佳实验结果。从图4的结果可以观察到:本文方法在各种实验设置下都优于(2D)2PCA。

2.1.4 σ影响因子

本节研究了距离敏感参数σ对本文方法性能的影响,为了研究影响因子σ,执行了如下实验:使用每个对象的5幅图像作为训练集,使用剩余图像获得误差率,为每个块大小固定用于构建投影矩阵的特征向量数目,平均在各种随机选择的训练集上的40次实验获得最终误差率。

图6解释了各种σ值和三种不同块大小下每个数据库上的误差率,从图中可以看出,尽管参数σ影响误差率的方式对两种数据库是不同的,但是每个数据库上的识别率变化趋势却是相似的。在ORL数据库上,当σ为1000左右时,每种设置下的误差率都达到其最小值,σ值超过1500时,误差率对σ值则变得不敏感。在Yale数据库上,当σ增加到250时,每种设置的误差率都达到其最小值,而σ值超过20 000时,误差率对σ值则变得不敏感。

2.2 FERET人脸库

实验从FERET数据库选择了150人,每个对象每个人有四个正面视图图像,这1000张人脸图像中包含了部分光线变化和面部表情变化,如图7所示为FERET人脸库上的样本示例。

实验将所有人脸图像转换为灰度,并创建三个不同训练集,由每个对象k幅图像组成(1≤k≤3)。对于大小为k的训练集,使用训练集的前k个元素来选择训练图像。每种情况下,使用剩余图像作为测试集,剩下的作为测试,进行大量的实验,对于每个条件,为了减少识别结果的变化,各种方法的参数设置如下:对于BPCA,使用的块大小为10×10像素;对于B(2D)2PCA,使用的块大小为20×20像素,σ值设为1000;所有方法的特征向量数目通过设置式(6)中参数θ为0.95来确定。在FERET上的识别结果如表4所示,结果表明了本文方法取得了每个训练集上的最高识别率。

2.3 Essex大学数据库上的实验

Essex大学人脸识别数据库包含395个对象的彩色图像,每个对象有20幅图像,划分这个数据成四个子集:94、95、96和grimace。本实验中使用第二和第三子集,如图8所示。Face95代表72个对象的图像,这个子集中的图像是在红色窗帘下采集到的,包含明显的光照变化、人脸位置的一些偏移、脸部表情上的一些变化。Face96包含152个个体的图像,这个子集与Face95之间的主要差异是这个子集中的图像是在复杂背景下采集到的。

实验转换彩色图像成大小为60×60像素的灰度图像,考虑每个对象有2、4、6、8幅训练例子的各种训练集,对于每个大小,随机选择训练样本,使用剩余图像测试本文方法的精度。重复20次这个过程,记录多次执行上的平均识别率。对于所有这些方法,参数设置与FERET人脸数据库上的实验相同。

各种方法获得的识别率如表5、表6所示,结果表明,B(2D)2PCA一致优于其他各个比较方法。

3 结语

本文提出了一种分块(2D)2PCA,并运用它与基于最近邻分类器集成的分类方法进行人脸识别任务。相比本研究测试的其他基于PCA方法,本文方法能获得更好的识别率,类似于(2D)2PCA,它产生小尺寸特征矩阵,而且计算复杂度低于分块PCA,在特征提取方面更具灵活性。本文方法的参数(如块大小和距离敏感度参数)影响其精度,然而,实验结果表明,这些参数的最优值取决于每个特定数据库的特性。最后,本文提出了三种改进方案:1)在本算法的特征提取阶段仅执行无监督分析,使用样本标签可进一步提高精度;2)使用网格分区划分图像成块,运用其他先进策略形成对脸部特征更具代表性的块3)分类阶段为每个分类器获得的置信度安排了相同权重,然而,某些脸部特征对区分不同人脸更重要,预计依据对应块的内容为分类器安排不同权重能产生更好的性能。

未来会将本文算法应用到其他的人脸数据集上,与其他新颖技术相结合,进行大量实验,进一步改进分块双向2DPCA的识别性能。

人脸分块 篇2

人工智能(Artificial Intelligence)是近年来计算机领域研究的新兴问题,它是让计算机通过已编写的程序来模拟人类行为的一门科学。该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能的应用,可以提高现代复杂单一工业的工作效率以及工作水平。计算机视觉是人工智能的一个很重要、应用广泛的领域。

计算机视觉是一种给予机器视觉的学科,更进一步说,就是机器或者计算机通过摄像头或者现有的图像获取信息,并对外界做出相应分析的一门学科。其应用领域非常广泛,包括监控录像中的人员自动辨别,道路交通限速违章拍照中的车辆车牌的自动识别,保密部门的生物特征识别门禁系统等。特别是随着移动网络平台商品交易的日益流行,一个可靠的脸部识别功能可以进一步提高移动APP支付平台交易支付的安全性。

人脸特征提取是人脸识别的关键问题之一。近年来,研究者将局部二值模式(LBP)的方法引入到人脸特征提取中[1,2,3],取得了很大的成功。但是LBP算子本身并不完善,特别是在训练样本的维度高达几千甚至上万维的时候,其性能会急剧下降。针对此问题,本文采用分块技术,将分块后的LBP直方图串联起来形成一个高维的直方图特征矢量,接着利用经典的主成分分析(PCA)方法降维,最后利用相似度计算方法进行相似度对比。该方法针对不同的图像进行不同的分块,使得维数的约简更加方便,实验结果表明有效提高了特征提取的准确性。

2 LBP算法与LBP算法分块的实现

2.1 初始LBP算法

图像是由基本的像素点构成的,每一个像素点就会有一个对应的色值,彩色图像就会有三个对应红、绿、蓝的色值。如图(1)所示,取一个3X3的像素点阵,以中间的一个像素点作为阈值参考,剩下8个像素点进行比较,按照公式(1)(2)的算法,可以得出一个8bit的二进制数列G(其中gx为第x位像素色值,gc为中心点像素色值)[4]。

将数列G进行十进制转换得到一个0~255区间的数字,这个数字就是一个LBP数值,如下图[5]:

中间像素点的色值为6,以左上方点为起始点开始的色值分别为6,5,2,1,7,8,9,7,将此数列与色差6进行比对,带入公式(1),(2)得到数列{1,0,0,0,1,1,1,1},将数列进行二进制转换得241,这就是此3x3方格的LBP值。

一张图片中有很多的3x3像素点阵,每一个点阵代表一个LBP值,将这些LBP值统计起来得到一个维度为0~255的直方图,这个直方图就是我们用来图像识别的模式依据,即LBP矩阵(LBPMat)。

2.2 适应旋转性LBP算法

在现实生活中,用初始LBP算法进行比对时,由于图片的角度问题会造成误判和错判,于是就提出了适应旋转性的LBP算法。

在2.1中,二进制数列的起始位置是以左上起始,那么,可以考虑从8个像素点的任意一个起始点开始进行二进制序数列的排列,一个3X3的像素点阵就可以得到8个二进制数列,按照既定好的规则选择一个二进制数列,这个二进制数列就作为该3X3像素点阵计算LBP的依据,例如下图:

2.3 均匀LBP算法

为了提高运算的效率,在提取图片特征值的过程时,往往纹理平滑的像素阵要占少数,而有决定性因素的纹理分明的像素阵要占大多数部分,可以用这些多数的纹理分明的二进制数列的LBP值来进行比对图片,提高运算效率。

一个二进制数列中,其中0,1交替出现3次以内,就可以认为是一个uniform,3次及3次以上,就可以认为不是一个uni⁃form,如下图,属于uniform的二进制排列顺序有58种,再算上所有的不属于uniform的排列顺序,全部为59种[6]。

统计出这59种二进制串出现的频率,得到一个59维度的LBP矩阵,很大一方面提高比对的效率。

2.4 LBP比对过程

通过以上的LBP算法对图像的分析之后,即可获得LBP矩阵。两张图片的相似度比对,即为两张图片的LBP矩阵的对比。基于此,本文提出一种比较算法,将两张图片的矩阵通过统计学中的矩阵相似公式(3)计算相似度,从而定量的计算两张图片的相似程度。(其中dis是两矩阵之间定量的差值,LBPMat1与LBPMat2分别为两个相互比较的矩阵)

得到距离dis后,本文确定两个界值,dis等于0为相似度100%,dis等于LBP矩阵里LBP数值的个数(num)为相似度0%,则可以根据公式(4)计算出相似度(reg)的值。

确定了相似度reg后,则可以根据实际情况制定阈值。如果reg值高于阈值时,则两个矩阵有相似性,反之,没有相似性。

在确定阈值时,不同的应用场合要求也是不同的。需要很强的容错率的人脸支付系统则需要制定很高的阈值,而容错率相对较低的图片相似度搜索引擎则需要制定较低的阈值。

通过reg与阈值的差值对矩阵进行定量的分析后,就可以定性地判断出两张图像是否有相似性。

2.5 LBP算法的分块实现

为了能够优化和改善LBP算法在维数大就比对率和运算率很低的缺点,本文提出对图片进行分块处理。具体过程如下图4:

虚线为图片的分块的线,将图片平分成虚线的几块。将每一块看做单另的图片,进行LBP算法处理。实例图5。

图5是一个3X3分块处理的举例,9个小块,每一个小块可以由LBP算法处理成一个LBP矩阵,然后将每个矩阵叠加成一个LBP矩阵,这个最后的LBP矩阵将作为整个图片的LBP矩阵,可以用公式(3)进行相似度比较。

分块时还解决了一个算法细节,分完块的小块之后,横纵的像素点个数可能不是3的倍数(因为LBP的算法还是要3X3的九宫格来处理)。解决的方法是进行像素的扩充,当分块前检测到像素点个数不是3X分块行数的倍数的情况,就会将前几排像素复制粘贴扩充到图片的后面。再进行图片分块,解决了像素分块除不尽的问题,图6举例。

3 实验验证与结论

3.1 实验策略

拟定一个人脸图片比对样本,分别是20个人在117种不同光照,不同表情的条件下的人脸图片,总共是2340张图片,图片的大小为120X142。如下图所示。

其次就是训练样本,20个人每个人抽出3张表情,总共60张图片。如下图所示。

要进行测试的方法是用2340张图片与这60张图片进行模式匹配,也就是说2340中的每一张图片都要比较60遍,那么总次数就是2340×60=140400遍,很好地达到了实验次数。并且在比对之后用程序判断是否是同一个人,来进行准确度的测试。在测试结束后进行准确度和速度的统计,并且进行分析。

3.2 实验结果

3.2.1 准确度

图(9)是利用0×0到10×10分块对LBP的四种不同的算法每个算法进行分块处理后的准确性的一个统计表,横坐标代表的是将图片分成大块的块数,从1×1到10×10,纵坐标是准确度,图例为初始LBP算法(org LBP),旋转适应性LBP(rev LBP),均匀LBP(uni LBP),旋转适应性均匀LBP(unirev LBP),从这张表中可以看到以下几点。

第一点从横坐标来看,也就是从分块技术提高准确度来看,每一个算法都是曲线的变化率从分块数1×1到10×10变化的越来越平缓的,并且曲线无限接近于100%的准确度。但是,每个算法在10X10分块处理的准确度要比在1X1分块的准确度高40%。也就说明,采用分块技术之后,图片的识别率有了提高。并且从10×10再往上走,就是再进行更多的分块,准确性的提升开始变得微乎其微的。

第二点从纵坐标来看,也就是从同样的分块级别下,算法的选择来看,很明显的上面两根线和下面两根线在10×10分块之前差别特别大,从图例可以看出,下面两条线是包含了旋转不变性的LBP算法的准确性,上面的两条线是不包容旋转不变性的LBP算法的准确性。说明了在同样的分块级别下,不包容旋转不变性的LBP算法的准确性更高。

第三点可以看出的是org LBP的准确率变换曲线与Uni LBP曲线变换趋势差不多一致,带了旋转不变性的两个LBP算法的准确度的变换趋势相一致。

表1是之前那个折线图的数据形式,经市场调查,现在的人脸识别能做到95%就算合格,那么可以看出从10×10分块起几种算法全部可以达到95%的识别率。

3.2.2 运行效率

这里的纵坐标的时间是以毫秒做单位,之前也说过了,实验总共的比对次数大概是2340*60=140400次,并且这个时间统计也包括了将60张拟定数据库图片存入内存的时间,所以平均时间大概在1700/140400=0.012l108毫秒。根据表3横坐标显示,10×10分块以内,四个算法所用的时间是相差无几的,到了更细的分块处理后,算法运行的时间会越来越长。

4 结论

本文提出了一种基于分块技术的改进的LBP算法和一种高效的计算矩阵相似度的方法。根据不同的客户需求定制不同的分块等级,来提高图片的辨识率。所提出的算法在高维度的实际实验中,在10X10分块的处理下,4种改进后的LBP算法的准确度都达到95%。实验数据表明,该改进方法可以有效地提高人脸识别率。

摘要:人脸识别是人工智能科学的重要问题,局部二值模式(LBP)算法是已知的比较精准的用于人脸识别的图像特征提炼算法。在对org LBP(初始LBP),rev LBP(旋转适应性LBP),uni LBP(均匀LBP),unirev LBP(旋转适应性均匀LBP)等几种LBP算法研究的基础上,通过大量实验比对和研究,设计了基于分块技术的改进LBP算法,有效提高了算法的鲁棒性。

关键词:人工智能,计算机视觉,信息安全,LBP

参考文献

[1]Timo Ojala,Matti Pietikainen,David Harwood[J].Pattern Recog-nition Society.1996(29):51-59.

[2]王宪,张彦,慕鑫,张方生.基于改进的LBP人脸识别算法[J].光电工程,2012(7).

[3]房德峰.浅谈改进的LBP算法[J].现代企业教育,2013(16).

[4]M.PIETIKÄINEN,T.OJALA,Z.XU.ROTATION-INVARI-ANT TEXTURE CLASSIFICATION USING FEATURE DIS-TRIBUTIONS.

[5]MäenpääTopi,Pietikäinen Matti,Ojala Timo.Texture Classifi-cation by Multi-Predicate Local Binary Pattern Operators.

人脸分块 篇3

人脸识别作为一种最常用的生物特征识别技术,具有非接触性、唯一性和不可复制性等特点,相对于其他生物特征识别技术,人脸识别具有明显的优势,在视频检索、身份识别、安全防范等领域具有广泛的应用前景,成为计算机图像和视频研究领域中的热点问题[1]。

对于人脸识别问题,学者们进行了大量研究,取得了不错的进展,涌现出了许多人脸识别算法,但仍然有许多问题有待解决,比如,如何从人脸图像提取和选择描述人脸图像类别的关键特征,如何设计识别性能优异的人脸分类器[2]。当前人脸特征提取方法主要有: 空间投影特征、结构特征和变换域特征等[3]。 子空间特征由于采用空间压缩技术,降低了特征维数,但同时也丢失了许多重要的特征,而且识别结果没有可解释性[4]; 结构特征的计算复杂度高,人脸识别效率低,而且识别结果极不稳定,鲁棒性差; 变换域特征主要通过采用小波变换、傅里叶变换等提取特征,但它们不能提取人脸图像的纹理信息,稳定性比较差[5]。这些特征提取方法均是基于外观的人脸识别方法,需要每类人脸包含大量人脸图像,导致人脸识别系统的成本高,结构复杂,不利用推广。同时,在犯罪取证、护照验证等特殊场合,每类人脸只能得到一幅人脸图像,是一种典型的单样本人脸识别问题,因此单样本的人脸识别问题更具有实用价值。在单样本特征提取程,希望尽可能多地从一幅人脸图像提取更多的特征信息。文献[9]采用主成分分析和积分投影相结合的人脸特征提方法,获得较高准确率的人脸识别结果; 文献[10]通过虚拟人脸技术,获得较多数量的人脸样本,提高了单样本人脸识别效果,但增加了计算机开销; 文献[11]提出基于分块的单样本人脸识别算法,首先将图像划分为多个小块,然后采用线性识别分析算法提取人脸特征,实验结果证明了其有效性; 文献[12]提出基于学习框架的单样本人脸识别算法,将单样本问题变成了多样本问题,但是在实际应用中很难找到通用性强的数据集。

针对传统单样本人脸识别算法存在的不足,为提高单样本人脸识别准确性,本文提出一种基于图像分块和特征选择的单样本人脸识别算法。首先将人脸图像划分成子块,并分别提取各子块的特征,连接成人脸图像特征向量,然后采用多流形判断分析算法选择对人脸识别结果贡献较大的特征。最后计算采用支持向量机对人脸进行识别,并采用Yale B和PIE人脸库进行仿真测试,检验本文单样本人脸识别算法的可行性和优越性。

1 人脸识别算法的框架

本文提出的人脸识别算法框架如图1所示。基本思想为: 首先收集人脸图像,并采用轮廓波变换对人脸图像进行预处理, 然后将人脸图像划分多个子块,并提取其特征,组成人脸特征向量,最后采用多流形判断分析算法选择最优人脸特征子集,并采用支持向量机对人脸样本进行学习,建立人脸分类器。

2 人脸识别算法的设计

2. 1 人脸图像预处理

人脸图像在采集过程,由于受到光照变化、环境、照相机等多种因素的影响,会产生许多噪声,若将其直接用于特征提取, 噪声会对人脸特征提取结果产生负面影响,影响人脸识别的最终结果,因此在提取人脸图像之间,需要对其进行预处理。由于Contourlet变换具有较好去噪效果,为此首先对人脸图像进行Contourlet变换,消除其中的噪声信息,然后对人脸图像重构,获得更优的人脸图像。Contourlet变换包括拉普拉斯塔式分解和方向滤波器组两部分,其工作原理如图2所示。一幅人脸图像经过Contourlet变换去噪后,结果如图3所示,其中( a) 为原始图像,( b) 为处理后的效果图。从图3可知,相对于原始图像,图像效果得到了增强。

2. 2 人脸图像分块

对于单幅人脸识别图像,首先将人脸图像划分成多个均匀或不均匀的子块,对于具体人脸图像,子块的大小不同。假设人脸图像的大小为H × W像素,先将每幅人脸图像平均划分为互不重叠的C个子图像,具体如图4所示。

2. 3 人脸图像特征提取和选择

设一幅人脸图像第i个流形中第r块为xir,Nintra和Ninter分别表示其流形内部和外部近邻,多流形判提取人脸图像可以转化成最优化问题,即:

其中,Airp、Birq为亲和矩阵; x'irp代表第p个流形外部k1近邻,xirq表示第q个流形内部k2近邻。

亲和矩阵A、B计算公式为:

其中,k1、k2及 σ 是3个先验固定参数; Nikn1ter( xir) 、Nikn2tra( xir) 分别表示xir的流形外部k1近邻及流形内部k2近邻。

那么可得:

其中,F1与F2为两个常数矩阵。

J1( Wi) 和J2( Wi) 可以简化为:

其中,

这样人脸特征的投影矩阵Wi可以通过下式得到:

设 { w1,w2,…,wdi} 为包含di个特征值{ λjj = 1,2,…,di} 所对应的特征向量,W = { w1,w2,…,wdi} 是Wi的投影矩阵,就可以N个投影矩阵W1,W2,…,WN。

2. 4 支持向量机的人脸分类器

支持向量机分类目标是指在一定条件的约束下,找到一个最优分类平面,不仅将全部样本点分成为两类,而且它们之间的距离尽可能最大。设人脸图像数据集 { xi,yi} ,xi∈ Rn,i = 1,2, …,n,xi表示选择的人脸行征向量机; yi表示人脸类别,那么支持向量机的分类平面可以描述为[8]:

其中,ω 和b参数。

对于一非线性问题,无法对式( 1) 进行求解,通过引入松弛因子变为:

s. t.yi( w·Φ( xi) + b) ≥ 1 - ξiξ ≥ 0,i = 1,2,…,n其中,C为惩罚参数。

引入Lagrange乘子将式( 2) 变为其对偶问题,则可以得到:

其中,αi表示Lagrange乘子。

采用式( 10) 计算权向量 ω 的值:

那么,人脸图像的二分类函数变为:

其中,Φ( xi) ·Φ( xj) 表示点积。

最后,引入核函数[6],加快问题的求解速度,可以得到:

采用RBF函数核函数[6],支持向量机的二分类函数为:

3 仿真实验

3. 1 数据来源

Yale B人脸包含38个人、64种不同光照条件下的图像,每个人在不同光照条件下有5个子集,子集1包含7幅图像,子集2、3、4和5分别包含12、12、14、19幅图像,子集数目越大,光照变化就越明显。Yale B人脸图像示例如5所示。

PIE人脸库包含65类人脸图像,每类有21张图像,人脸图像示例如6所示。

3. 2 结果与分析

3. 2. 1 本文算法的识别结果

对于Yale B和PIE人脸库,选择第一幅图像作为训练样本,建立人脸识别模型,然后将剩下图像作为测试集,它们的识别结果如图7所示。从图7可以知道,随着人脸特征增加,人脸识别率不断增加,Yale B和PIE人脸库的最高人脸识别率分别为75. 12% 和84. 47% ,较好地满足了人脸识别精度要求。实验结果表明,本文人脸识别建立模型思想是正确、有效的。

3. 2. 2 与其他单本本人脸识别算法的性能比较

为了测试本文算法的优越性,使其结果更具说服力,选择文献[12,13]的单样本人脸识别算法进行对比实验,结果如图8和图9所示。从图8可知,在Yale B和PIE人脸库上,相对于其他算法,本文算法的人脸识别率更高,具有一定的优越性。从图9可知,相对于其他算法,本文的平均人脸识别时间明显减少, 人脸识别速度得以提高,可以用于人脸识别的实时性要求。

4 结 语

人脸分块 篇4

处理遮挡相关问题有两类方法: 第一类方法是将遮挡FR问题当作重构问题来对待, 通过线性合并图库图像 ( 即注册的人脸图像) 将遮挡图像重构成一幅干净的图像, 然后将遮挡图像分配到重构误差最小的类中, 例如, 文献[6]提出了基于鲁棒主成分分析的人脸子空间重构算法; 文献[7]提出基于低秩子空间恢复的联合稀疏表示算法; 文献[8]提出稀疏表示的重构算法; 文献[9]提出基于分类的协同表示, 这类方法要求每个人有足够多的样本来形成探针图像 ( 即查询人脸图像) , 这在现实环境中并不总是可行的。另一类方法是基于块匹配的方法, 首先将遮挡图像划分成子块, 在子块中提取特征, 然后基于每个成对块的相似度执行匹配过程, 为了减小因遮挡块造成的匹配误差, 通过训练产生不同的权重值分配给不同的块, 例如, 文献[10]提出了一种局部匹配的人脸识别算法; 文献[11]提出部分相似性算法; 然而, 训练过程通常是数据依赖的。

基于上述分析, 为了更好地解决面部遮挡人脸识别问题, 提出了一种基于动态时间规整 ( DTW) [12]的局部分块匹配人脸识别算法。首先将图像划分成子块, 然后以光栅扫描顺序重新形成一个序列, 在这种方式下, 人脸由包含脸部特征顺序信息的块序列表示, 所提算法计算查询人脸和注册人之间图像到类的距离, 寻找查询序列和所有注册序列之间的最佳对齐方式。实验结果验证了所提算法的有效性及可靠性。该研究为FR应用提供一种有效的候选方法, 所提模型与现实世界FR应用的各种图像描述符和特征提取方法均兼容。

1 算法提出

1. 1 图像表示

将图像划分成M个不重叠子块, 大小为d × d'像素, 然后依光栅扫描顺序重新将这些子块联接成一个单一序列。人脸由前额、眼睛、鼻子、嘴巴和下巴这样的自然顺序组成, 尽管有遮挡和不精确注册, 这个顺序是不变的。人脸图像以块序列表示, 其中块位置顺序 ( 即人脸特征的顺序) 可作为时间信息, 因此, 处理FR问题可以使用时间序列分析技术。

Fi表示第i块, 通过相邻两个块对应像素的值相减计算差异块▽Fi, 即

式 ( 1) 中, ( x, y) 是一个像素点的坐标。

这些由空间连续块产生的差异块能增强人脸序列内的顺序信息, 这与所提模型是兼容的。此外, 从宏观角度来讲, 当每个块的大小非常小时, 每个块就是一个像素点, 差异块▽Fi实际上可以认为是相邻像素Fi +1与Fi的近似一阶导数, 因为一阶导数操作对边缘敏感, 如眼睛、鼻子、嘴巴这些能够表示详细纹理区域的显著脸部特征就会增强。图1 所示为所提算法的图像表示框架。所提算法将差异块的灰度值作为特征, 相比使用原始块, 相同类的距离分布和不同类的距离分布分离更大。

1. 2 动态图像类规整

通过定义序列之间的距离度量来实现人脸匹配, 通常, 如果两个序列彼此类似, 则期望更小的距离。使用DTW计算两个时间序列之间的距离, 例如, 对于两个序列A = ( 3, 1, 10, 5, 6) 和B = ( 3, 2, 1, 10, 5) , 它们之间的欧氏距离是对于这两个近似序列来说这个值有些大, 然而, 如果忽略B中的“2”, 用A中“1, 10, 5”匹配B中“1, 10, 5”, 不使用按位匹配, A和B之间的距离会大幅减小。DTW基于这个思想计算两个序列之间的距离, 以最小的整体成本寻找它们之间的最优对齐方式。匹配期间要考虑顺序信息, 因此, 不允许有交叉匹配 ( 如A中的“3”匹配B中的“2”, 而A中的“1”匹配B中的“3”) 。对于FR, 这非常合理, 因为脸部特征的顺序不能逆转。

借助于DTW的设计思想, 所提算法试图找到人脸序列之间的最佳对齐方式, 降低遮挡块的影响, 将两个序列之间的对齐方式扩展成一个序列和给定类序列集之间的对齐方式。包含M个块的探针图像表示为P = { p1, …, pm, …, pM} , 其中, pm是前文提到的差异块, 包含K幅图像的给定类的图库集表示为G = { G1, …, Gk, …, GK} , 其中, 每个Gk= { gk1, …, gkn, …, gk N} 是包含N个块的一幅图库图像, gkn指的是类似pm的块向量。DTW和所提算法的对齐方式如图2 所示, 规整在两个方向上执行: 1) 按照时间维度 ( 维持顺序信息) 将探针序列P对齐到给定类的图库序列集G; 2) 在每个时间步P的每个块沿着类内维度匹配到所有图库序列中最相似的块。其中, 箭头指示每个块的对齐方式, 虚线标记了图像和图库图像集之间的最佳规整路径。

规整路径W表示的是T个时间步的P和G之间的对齐方式, 定义为W = { w1, w2, …, wT} 。第t个元素wt是一个索引三元组{ mt, nt, kt} , 表示的是块pmt匹配到块gktnt, 其中, mt∈ { 1, 2, …, M} , nt∈ { 1, 2, …, N} , kt∈ { 1, 2, …, K} 。考虑到FR的内容, W满足下列四个约束:

边界约束: m1= 1, n1= 1, mT= M, nT= N。路径起始于匹配p1到gk11, 以匹配pM到gkTN结束, 从1到T, k可以是1 到K之间的任意值, 因为探针块可与图库中任意K幅图像的块匹配;

连续性约束mt- mt -1≤1, nt- nt -1≤1, 每执行一步路径的索引增加1, 探针和图库图像中的所有块都会处理到;

单调性约束mt -1≤ mt, nt -1≤ nt, 路径保存时间顺序, 且单调增加;

窗口约束| mt- nt| ≤ l, 其中, l ∈ N+是窗口长度, 探针块不应该与距离太远的块匹配 ( 如眼睛不能匹配到嘴) , 长度为l的窗口能限制规整路径在一个合适的范围内。

创建一个局部距离矩阵C ∈ RM × N × K, 其中, 每个元素Cm,n,k存储欧氏距离, 称为局部成本, pm和gkn之间: Cm,n,k= ‖pm- gkn‖2, W的整体成本定义如式 ( 2) 。

最优对齐方式 ( 即最优规整路径) W*是S ( W) 最小的路径, P和G之间的图像到类之间的距离即为简化的W*整体成本

计算DDTW ( P, G) 能够测试所有可能的规整路径, 但是计算成本很高, 值得庆幸的是, 动态规划 ( DP) 可以有效地求解式 ( 3) 。创建一个三维累积矩阵C ∈ RM × N × K, 元素Dm,n,k存储子问题的成本, 即分配一个m个块的序列到一个有n个块的序列集, 匹配第m个块pm到第k个图库图像的块, DDTW ( P, G) 的计算基于一系列子问题的结果, D可递归计算为

式 ( 4) 中, 初始化将D扩展为一个 ( M + 1) × ( N +1) × K的矩阵, 设置D0,0,k= 0, D0,n,k= Dm,0,k= ∞ , × 表示笛卡尔积操作, 因此, DDTW ( P, G) 可由下式得到

然后探针图像P分类到距离最短的类, 未对式 ( 4) 的第一项的k作任何约束, 因为在每个时间步, 探针块可与图库中任意K幅图像的块匹配。

所提算法能从所有可能的规整组合中找到整体成本最小的对齐方式, 因此, 整体距离主要依赖于人脸最相似的部分, 这与视觉感官也是一致的。图3解释了图像到类的规整, 图3a中, 遮挡的人脸属于类2, 但当使用图像到图像距离时会被错误分类 ( 最近邻属于类1) , 尽管图像到图像距离比类2 的每个单个图库图像大, 但是图像到类距离小, 能够产生正确分类。如图3b所示, 每一步中, 探针图像的每个块与图库图像最相似的块匹配, 图像到类距离计算主要基于这些成对的最相似的块 ( 匹配的块用相同颜色表示) 。

算法1 总结了计算探针图像与类之间距离的过程, 时间复杂度为O[lmax ( M, N) K], 其中l < <M[l通常设置为max ( M, N) 的10% ]。当每个类的图库图像数目有限时, K相对较小, 因此可以非常有效地获得规整距离。MATLAB实现取平均0. 05 s计算一幅图像与类之间的距离, 使用大约200 个块的序列 ( CPU频率为3. 10 GHz, 内存为8 GB) , 相比基于重构的方法, 使用所有注册图像表示测试图像, 所提算法独立计算探针图像与每个注册类之间的距离。因此, 在实际FR应用中, 可以并行地产生距离矩阵, 还可以增加更新注册数据库。

2 实验

实验使用所提算法处理不同类型的遮挡: 合成遮挡、伪装遮挡和真实图像识别, 在两个公开数据库FRGC2. 0 ( 人脸识别大挑战) 数据库[13]和AR数据库[14]及一个户外环境数据库[15]上进行了大量的实验。FRGC数据库中, 为了仿真不同级别 ( 从0% 到50% ) 的连续遮挡, 使用一个随机位置的方块代替有黑框的每个测试图像, 遮挡的位置随机选择, 对算法是未知的。使用AR数据库是因为它是少有的包含实际伪装的数据库。户外人脸数据库包含大街上光照不受控制的陌生人脸图像的正面照, 遮挡源包括眼镜、帽子、头发和放在脸上的手, 除了遮挡, 这些图像也包含表情变化和姿势变化, 图像示例如图4所示。

实验将所提基于DTW的局部分块匹配算法与其它几种具有代表性的匹配算法进行了比较, 包括使用特征脸作为特征的线性SVM[4] ( LSVM) 、基于稀疏表示的重构 ( SRC) [8]、基于朴素贝叶斯最近邻的块匹配 ( NBNN) [3]、基准的最近邻 ( NN) 分类器[5]。NBNN也是一种基于块匹配的算法, 分别使用原始块和差异块进行测试, 给出了最佳结果。

2. 1 子块大小的影响

这部分研究不同子块大小对所提算法识别性能的影响, 从FRGC中取400 幅未遮挡图像作为图像集, 分别包含从0% 到50% 级别合成遮挡的6 个探针集用于测试, 所有图像都裁剪为80 × 65 大小, 子块大小从3 × 3 到10 × 10。简单起见, 将探针图像和图库图像划分成相同数目的子块, 即M = N, 识别结果如图5 所示。

从图5 可以看出, 当块大小等于或者小于6 × 5时, 每个识别率曲线都没有大幅波动。尽管存在遮挡比率, 所提算法在适当范围内对子块大小的鲁棒性更好。此外, 也在AR数据库上测试了所提算法, 得到的结果与FRGC上的一致。相对较小的块产生的识别率更好, 因为它们能比大块提供更灵活的空间信息, 然而, 如果块太小, 计算和内存成本都会增加。根据这一结果, 建议使用块大小在4 × 4 至6 ×5 之间。该实验中, 根据图像大小, FRGC数据库使用的块大小为6 × 5, AR数据库和户外人脸数据库使用的块大小为5 × 5。

2. 2 合成遮挡人脸识别

首先使用有合成遮挡的FRGC数据库对所提算法进行评估, 选择100 个对象, 每个对象8 幅图像, 对于每个对象, 分别选择K = 1, 2, 3, 4 幅无遮挡图像作为图库集, 另外4 幅有合成遮挡的图像作为探针集。每个测试图库集与探针集无重复图像, 所有图像均裁剪成80 × 65 大小。

图6 给出了每个人不同图库数目下各个算法的识别率。

从图6 可以看出, 起始阶段 ( 遮挡水平≤10% ) SRC的性能略优于所提算法, 然而, 当遮挡增加时, 性能急剧下降。基于块匹配的算法NBNN和所提算法整体上执行效果优于其它几种算法。当每个人仅有一幅图库图像可用 ( K = 1) 时, 所提算法中图像到类的距离等于图像到图像的距离, 仍能对所有级别的遮挡获得最佳识别率, 因为它通过规整并考虑面部特征的顺序, 能找到图库和探针图像之间的最优对齐方式。综合4 幅图可有看出, 不论K取何值, 所提算法取得的识别效果均优于其它各个算法。

2. 3 伪装人脸识别

这部分在有实际伪装的AR数据库上测试所提算法, 使用AR数据库的一个包含各种光照条件、表情变化和遮挡的子集 ( 包含50 位男性50 位女性) , 使用未遮挡的带有各种表情的正面视图图像作为图库图像 ( 每人8 幅图像) , 对于每个对象, 从中分别选择K = 1, 2, 4, 6, 8 幅图像作为图库集, 使用包含太阳镜 ( 覆盖图像的30% ) 和围巾 ( 覆盖图像的50% ) 的两个分离集作为测试集, 所有图像均裁剪为83 × 60 大小, 图7 所示为各算法的识别结果。

从图7 可以看出, 当可用的图库图像较少时, 识别率呈下降趋势, 所提算法的性能稳定且显著优于其它算法, 甚至在K = 1 时, 所提算法在太阳镜集和围巾集遮挡情况下的识别率可分别高达90%和83%。

在同样的实验设置下, 还使用每人8 幅图库图像对所提算法与较为先进的几种人脸识别算法进行了比较, 所有算法仅使用灰度值特征, 识别结果如表1 所示, 其它各算法的识别率直接引自各自所在文献。

从表1 可以看出, 相比其它几种算法, 所提算法能获得与这些算法相当甚至更好的识别率。而在识别效率上, 所提算法的识别速率约为文献[8]提出算法的15 倍。在围巾集这种几乎遮挡住一半人脸的数据集上, 所提算法仅对2% 的图像误分类, 就目前所知, 这是在围巾集上仅使用灰度值作为特征时得到的最好的结果。

2. 4 户外人脸识别

最后, 在实际条件下采集的人脸数据库上测试所提算法。实验选择包含55 个对象的一个图像集, 对于每个对象, 分别选择K = 1, 3, 5, 8 幅未遮挡的图像作为图库集, 有不同遮挡类型的110 幅图像用于测试, 每个图库集与探针集均不相交。从每幅图像的背景中裁剪出人脸区域, 调整大小为80 × 60。识别结果如表2 所示, 不同于先前在室内条件下采集到的测试图像, 这些图像是在完全不受约束的现实环境中采集到的。从表2 可以看出, 由于自然遮挡的挑战, 所有算法的整体识别率相对较低, 但相比其它几种算法, 所提算法仍能获得最好的识别性能, 由此可见其可靠性及优越性。

3 结论

提出了一种基于DTW优化局部分块匹配的面部遮挡人脸识别算法, 在三个人脸数据库上的大量实验表明, 所提算法能获得比其它算法更好的性能。在每个人仅有一幅图库图像可利用的极端情况下, 所提算法仍能得到良好的执行效果。所提算法能直接处理原始数据, 不需要执行遮挡检测, 也不需要任何训练过程, 这些优点使其更适用于现实场景。

上一篇:临近隧道下一篇:调查测量

本站热搜