局部识别(共7篇)
局部识别 篇1
0 引言
社区结构对研究分析网络内部相互作用、社区演化都具有重要意义。在许多实际应用中,由于条件限制往往只能获取局部网络信息,或者只需分析某个特定群体的社区结构,这就对社区识别提出了限制和要求,为此需要研究如何利用网络局部信息进行局部社区识别。
Newman和Girvan于2004 年首次提出基于模块度的社区评价测度[1],由此引发了社区识别研究的热潮。文献[2]提出基于结构相似度的方法来聚类节点,以识别网络中的聚类和“离群”值。文献[3]提出的基于模块度识别社区的贪心算法采用树状图描述社区结构、运用层次聚类方法在线性时间内快速处理更大规模的分层网络。然而,以上几种识别方法都需要知道网络的整体拓扑结构。
文献[4]给出的局部社区结构识别算法从源顶点出发,依据一组节点到源节点的测度距离来增加顶点,该算法的性能取决于开始节点的选择,此外,该算法缺少一个适当的停止标准,仍然依赖于阈值。文献[5]定义了局部社区模块度R,采取最大化局部模块度的方法来发现局部社区,通过迭代增加邻接节点来产生R的最大增值,直到社区达到预定的规模。文献[6]给出的算法采用基于链接密度的社区评价测度来衡量社区结构,从给定的起始节点出发,首先提取可能的候选集节点,然后优化社区结构,该算法无需初始参数且可发现从特殊节点开始是否存在局部社区,但其存在着所发现社区不稳定的问题。文献[7]给出的局部聚类算法的特点是基于密度的组内聚性进行社区结构的扩展,它能够较好的发现小规模的社区结构。Andersen提出基于“剪枝增长过程”识别局部二分社区的聚类算法[8],在二分网络中该算法获得很好的社区识别效果。文献[9]提出基于极值优化的算法,通过最优化模块度来识别复杂网络中的社区结构。文献[10]给出的基于模块度矩阵的算法通过实现模块度的最大化过程来识别社区结构。文献[11]将局部中心节点作为局部网络的核心节点,围绕局部中心节点来扩展局部社区,以改善局部社区发现结果的精确度。文献[12]定义外部节点与局部社区之间的连接相似度,通过聚类、优化和剪枝三个步骤循环迭代,直至不能通过聚类外部节点使局部模块度增大时则停止迭代,以期发现更好的局部社区。上述算法识别出的社区包含较多的离群值,准确率不够高、社区划分效果不够理想。
本文给出一种基于提取局部团、通过局部团扩展社区、自动选择社区扩展的终止条件的局部社区识别算法,以发现稳定的社区结构、保留最优社区结构。
1 识别算法
本文给出的局部社区识别方法是: 1挖掘提取网络中的局部团结构作为初始社区; 2从局部团开始扩展,迭代遍历局部团的邻接节点集,每次选择链接密度最大增量的邻接节点添加到社区结构中; 3进行剪枝操作,移除“离群”节点。
1. 1 提取局部团
局部团属于稠密子图,它由一个节点及其邻接节点组成,是社区内部具有最高链接密度的局部结构。从一个局部团开始进行社区扩展,初始社区具有较高的链接密度和稳定性。为了维持局部团较高局部链接密度的特性,不能将一个节点的所有邻接节点都添加到团结构中,需要移除一些链接密度低( 有较少的内部链接) 的节点。我们用D表示识别出的社区,节点集合S表示图中未知部分的节点,S包含邻接于D中节点但不属于D的节点。定义D的两个子集: 核心节点集C和边界节点集B,C中节点与D外部节点不存在邻接边,B中节点至少有一个邻接节点在集合S中。
记节点v所在的局部团为cliquev,Lv表示局部团cliquev的链接密度,L( u,cliquev) 表示节点u在局部团cliquev中的链接密度,Lv和L( u,cliquev) 分别按式( 1) 和( 2) 计算:
其中,Lv - in表示局部团cliquev的平均内部链接密度,Lv - ex表示局部团cliquev的平均外部链接密度,Deg( u,cliquev) - in表示节点u与局部团cliquev中节点的链接数目,Deg( u,cliquev) - ex表示节点u与局部团cliquev外部节点的链接数目,Lv - in和Lv - ex分别按式( 3) -( 4) 计算:
其中,INi表示节点i与局部团cliquev中节点相连边的数目,Boundry表示局部团cliquev中与集合S有边相连的节点集合,EXj表示节点j与S中节点相连边的数目。
满足下列条件的邻接节点u将被添加到局部团cliquev中:
其中,平衡因子a用来平衡局部团链接密度Lv和局部团cliquev大小的关系: 增大a可以提高局部团链接密度Lv,但减小了局部团cliquev的规模; 反之,减小a可以降低局部团链接密度Lv,却增大局部团cliquev的规模。我们采取启发式策略来提取局部团,搜索局部子图结构G中所有节点,并按Lv值倒序排列G中节点,找出满足式( 5) 要求的局部团结构。
提取局部团算法( 简记为Jbt_get算法) 描述如下:
算法1 Jbt_get算法
按Lv值对G中节点进行降序排列,得到有序图G’;
利用Jbt_get算法可以找出局部社区中链接密度较高的局部团结构,为扩展局部团、识别出局部社区结构提供基础。
1. 2 局部团扩展
提取局部团cliquev之后,迭代合并集合S中的节点到局部社区D中,一次迭代社区添加一个新节点。在迭代过程中,使用社区D的链接密度L作为适应度函数,能较好地优化局部社区结构。提取出的局部社区结构D中可能存在“离群”值的干扰,因此需对社区结构D应用剪枝策略,移除“离群”节点,以获得高质量的社区结构。记Lin、Lex和L分别代表社区结构D的平均内部链接密度、平均外部链接密度和链接密度,Lin'、Lex'和L'分别代表增加或者删除节点v后社区D的平均内部链接密度、平均外部链接密度和链接密度,其计算公式可参见文献[8]。
当增加新节点到社区D中时,下列3 种情形可能导致L' > L的结果: 1 Lin' > Lin和Lex' < Lex;2Lin' < Lin和Lex' < Lex; 3 Lin' > Lin和Lex' > Lex。
显然,情形1的节点增强了社区的内部联系,降低社区外部的链接密度,此类节点属于需要合并到社区D中的节点。情形2的节点属于离群值,因为它同时降低对社区内部和社区外部的链接密度。情形3的节点在增强社区内部联系的同时,也提高了社区外部的链接密度,该节点可能同时链接两个社区中,在这种情况下,为保证社区具有较高的链接密度,我们不将该类节点合并到社区D中。因此,算法检查社区结构D中所有节点,只保留属于情形1的节点。
局部团扩展算法Jbt_extend描述如下:
算法2 Jbt_extend算法
Jbt_extend算法开始时将局部团cliquev内的所有节点都添加到社区D中,与S有边连接的节点添加到B中,与S没有边连接的节点添加到C中,并初始化S。然后迭代地扩展社区,每次迭代将加入一个新节点到D中,这个节点存在于集合S中,在迭代过程中找出L的最大增量。每次迭代,遍历集合S,计算加入新节点v后L的增量,如果L的增量大于等于0,则更新D、B、C和S; 否则,将节点v从社区D中移除。如果所有的邻接节点都不能够使L的增量大于或等于0,则迭代自动停止; 或者当集合S为空集时,也停止迭代。对于识别出的社区结构D,为降低“离群”值的干扰,依次遍历D中各个节点u,并进行“剪枝”和“添加”操作,比较“剪枝”和“添加”前后Lin和Lex值的大小,进而保留属于情形1 的节点。
与以往的局部社区识别算法不同的是,Jbt_extend算法提取出局部团作为社区的初始状态,而不是随机选择一个节点作为初始社区,同时迭代过程中选择L增量最大的邻居节点添加到社区结构中,如果不存在新的结点进一步提高L的值,或者没有结点剩余,则自动退出迭代,从而使得迭代扩展后识别出的社区比较稳定; 为保证提取出的社区结果具有较高的准确率,算法遍历迭代社区结构中的节点,通过“剪枝”和“添加”操作,保留属于情形1 的节点。
2 实验
2. 1 实验环境
实验硬件平台为内存容量4GB、CPU为Intel( R) Pentium( R) G2020 的双核计算机,运行的操作系统为Windows XP,采用C ++ 语言编程实现算法。给定局部团cliquev、网络真实社区结构的数据集Cvreal、提取出的局部社区结果Cvalg,采用与文献[6]相同的具有代表性的precision( 准确率,简记为p) 、recall( 召回率,简记为r) 及F - measure( 简记为F)评价局部社区识别算法的性能,p为局部社区中被正确划分的节点数在局部社区所占的比例、r为局部社区中被正确划分的节点数在标准数据集所占的比例、F为是p和r的加权调和指标:
2. 2 实验结果分析
2. 2. 1 人工生成网络上的实验
文中采用有代表性的GN网络[1]作为人工生成网络的实验。GN网络包含128 个节点,每个社区有32 个节点,节点之间的边是随机生成的,din表示社区内部边的数目,dout表示社区外部边的数目,保证同时满足对任意节点有din+ dout= 16。通过保持每个节点的度数不变,改变dout的值,能够得到多组边界稀疏度不同的数据集。
社区内部的链接密度随dout的增大逐渐降低,维持dout< 8,才能得到比较合理的社区结构。实验中人工生成网络的所有数据集都满足此要求。
实验自动生成500 组GN网络,根据dout不同,每组各有7 个GN网络( 其dout取值分别为1,2,3,4,5,6 和7 ) 。对这些数据集分别运行本文提出的局部团识别算法Jbt _extend和有代表性的Chen算法[6],实验结果如图1 - 3 所示。
从图1 的结果可知,随着dout的增大,社区结构趋于不明显,致使Jbt_extend算法和Chen算法识别的效果都有所下降,但是,Jbt_extend算法识别准确率明显高于Chen算法。这主要是因为局部团具有密集性,在社区扩展过程中,只有链接密度高的节点才能够合并到社区中,这样就降低了社区外节点被错误添加到社区的可能性。当dout≤ 6 时,Jbt_extend算法取得了很好的识别效果,准确率几乎均为100% ,当dout> 6 时,社区外部边的数目增多,社区的边界节点链接密度增大,社区内部链接密度降低,社区结构不够明显,导致提取出的社区结果准确率p值开始下降。但是,即使当dout= 7 时,Jbt _extend算法识别准确率也达到80% ,识别效果一直保持在比较高的水平,这表明Jbt _extend算法具有高稳定性。
图2 的结果表明: 对于所有的dout值,Jbt_extend算法的召回率均高于Chen算法,特别是当dout≤5时,Jbt_extend算法可以识别出社区的完整结构; 而Chen算法则表现较差,召回率随dout增大下降比较明显。这是因为Chen算法没有充分考虑到“离群”值的影响,识别出的社区结构中包含较多链接密度低的节点。当dout> 5 时,社区内部和外部边的数目开始趋于相等,情形3中的节点增多,为了确保社区具有较高的链接密度,Jbt_extend算法和Chen算法都严格控制不将此类节点合并到社区中,从而可能使得提取出的局部社区结果Cvalg下降,两种算法的r值呈下降趋势。
图3 给出了dout逐步增大时,Jbt_extend算法和Chen算法F值的对比结果。
从图3 的实验结果可知,无论dout取何值,Jbt_extend算法识别的效果均明显优于Chen算法。从图1 - 2 可以看出,当dout> 5 时,p和r值都呈下降趋势,F作为p和r值的加权调和指标,它也应该是呈下降趋势。图3 的实验结果验证了这种趋势。
图1 - 3 的结果表明Jbt_extend算法识别人工生成网络社区结构的能力具有明显的优势,其识别出的局部社区结构质量高。
2. 2. 2 真实数据集上的实验
NCAA足球赛网络图包含180 个节点以及787条边,任意两个节点之间存在边代表两个球队之间有一场比赛[2]。NCAA中有115 个球队归属于11个社区,社区内部的球队通常有更加频繁的比赛,另外还有4 个球队各自单独构成一个社区,其余所有节点没有社区,作为“离群值”。NCAA足球赛网络的拓扑结构已知。
实验多次运行Jbt_extend算法和Chen算法,取多次运行实验结果的平均值评价算法效果,仍然采用p、r和F值比较Jbt_extend算法和Chen算法对NCAA网络图中社区结构的识别效果,实验结果如表1 所示。
从表1 的结果可知,Jbt_extend算法和Chen算法均能识别出11 个社区,r值均为1,Jbt_extend算法和Chen算法都能够将真实社区结构中包含的节点完整识别出来,但是Jbt_extend算法得到的准确率和F值都优于Chen算法,这说明Jbt_extend算法不仅能完整地提取出真实网络中的社区结构,而且能很好地排除“离群值”的干扰。Jbt_extend算法不是随机选择初始节点,而是选择具有较高链接密度的局部团作为社区膨胀中心点,实验结果表明Jbt_extend算法每运行一次即可发现结构稳定的社区。而Chen算法随机选择一个节点作为初始状态,然后通过此节点进行扩展,以将更好的节点合并到社区中,算法效果很大程度上依赖于初始节点的选取,多次运行的实验结果表明,Chen算法每次选择的初始节点的社区链接密度不同,致使每次运行的识别效果不稳定,也难以保证社区划分效果理想。
综上所述,与局部社区识别代表性的Chen算法相比,本文给出的Jbt_extend算法在人工数据集和真实数据集上能够自动停止迭代扩展,输出稳定的结果、发现高质量的社区结构。
3 结束语
本文给出的局部社区发现算法从提取出的局部团出发进行扩展,迭代遍历局部团的邻接节点集,每次选择链接密度最大增量的邻接节点添加到社区结构中,以不存在新的节点进一步提高局部链接密度值或者没有节点剩余作为迭代终止条件,从而解决已有识别方法稳定性不高、不能够自动停止迭代扩展等的问题,通过“剪枝”和“添加”操作可确保提取出的社区具有较高的准确度。在确保准确度和稳定性的前提下,如何将局部社区发现算法应用到动态社会网络中社区演化分析将是下一步的研究工作。
摘要:通过提取出具有高链接密度的局部团,从局部团出发进行扩展社区,设计自动选择社区扩展的终止条件,以保留最优社区结构,提出一种社会网络局部社区识别算法。在人工生成网络和真实网络上的实验结果表明,与同类算法相比,该算法能够识别出稳定的局部社区结构,提升了局部社区识别结果的准确率。
关键词:社会网络,局部社区识别,局部团,局部链接密度
参考文献
[1]Newman M E J,Girvan M.Finding and evaluating community structure in networks[J].Physical review E,2004,69(2):026113.
[2]Xu X,Yuruk N,Feng Z,et al.Scan:a structural clustering algorithm for networks[C]∥Proceedings of the 13th ACM SIGKDD international conference on Knowledge discovery and data mining.New York:ACM,2007:824-833.
[3]Clauset A,Newman M E J,Moore C.Finding community structure in very large networks[J].Physical review E,2004,70(6):066111.
[4]Bagrow J P,Bollt E M.Local method for detecting communities[J].Physical Review E,2005,72(4):046108.
[5]Clauset A.Finding local community structure in networks[J].Physical review E,2005,72(2):026132.
[6]Chen J,Zaane O,Goebel R.Local community identification in social networks[C]∥Proceedings of 2009 International Conference on Advances in Social Network Analysis and Mining.Piscataway,NJ:IEEE,2009:237-242.
[7]Xu J.Identifying Cohesive Local Community Structures in Networks[C]∥Proceedings of the 30th International Conference on information Systems,Phoenix,Arizona,USA,Dec.15-18,2009:112.
[8]Andersen R.A local algorithm for finding dense subgraphs[J].ACM Transactions on Algorithms,2010,6(4):60.
[9]Duch J,Arenas A.Community detection in complex networks using extremal optimization[J].Physical review E,2005,72(2):027104.
[10]Newman M E J.Finding community structure in networks using the eigen vectors of matrices[J].Physical review E,2006,74(3):036104.
[11]Chen Q,Wu T T,Fang M.Detecting local community structures in complex networks based on local degree central nodes[J].Physica A:Statistical Mechanics and its Applications,2013,392(3):529-537.
[12]Wu Y J,Huang H,Hao Z F,et al.Local community detection using link similarity[J].Journal of computer science and technology,2012,27(6):1261-1268.
局部放电信号模式识别应用研究 篇2
随着计算机的出现及人工智能的兴起, 模式识别在很多领域得到了广泛的应用, 和传统的依靠专家目测进行放电类型判定相比, 其显著提高了识别的科学性和有效性。但局部放电模式识别技术的研究尚处于起步阶段, 一方面由于很多非确定性因素使局部放电信号的采集过程中混杂着干扰信号, 需要更好的信号处理技术获取准确的局部放电信息;另一方面, 对局部放电信号中所包含信息的内涵及规律尚未完全清楚。因此, 局部放电信号模式识别尚处于研究阶段。
2 局部放电信号的分类
要对局部放电信号进行识别, 需了解局部放电信号的特性和分类。局部放电一般指在电场作用下, 绝缘系统中只有部分区域发生放电而没有形成贯穿性放电通道的一种放电现象。局部放电的表现形式为脉冲放电电流、超声波、粒子碰撞发出的光和热、介质分解形成的分解物等。可以利用这些特征采用相应的方法对局部放电进行测试。目前应用比较多的是基于脉冲电流的电测法。
实际设备的局部放电信号看似复杂, 但这些信号都可以归结为基本的放电类型。在进行模式识别前, 要首先确定局部放电信号的放电类型, 然后进行分类, 根据不同放电类型的特征, 研究识别算法, 最后将识别算法应用与未知的局部放电信号, 进行放电类型判断。根据放电的位置和机理的不同将局部放电分为以下几种类型。
1) 内部放电:
指发生在设备或者是发生在绝缘材料内部的放电。这种放电的特征与绝缘介质的特性和放电间隙的形状、大小、位置都有关。
2) 悬浮电位放电:
悬浮电位指高压设备内部或外部金属部件因与设备松脱从而失去有效接地, 处于高压设备和地之间产生悬浮电位, 当该悬浮电位所在部件与高压设备或地的电场场强低于其间介质场强时将发生放电, 这种放电形式称之为悬浮电位放电。
3) 电晕放电
气体介质在不均匀电场中的局部自持放电, 是常见的一种气体放电形式。在曲率半径很小的尖端电极附近, 由于局部电场强度超过气体的电离场强, 使气体发生电离, 出现电晕放电。
4) 表面 (沿面) 放电
在沿介质表面 (两种绝缘材料的交接面) 的电场强度达到击穿场强时所发生的局部放电, 属于表面放电。
3 局部放电信号的模式识别
通常模式识别系统由四部分组成:数据获取, 预处理, 特征提取和选择, 分类决策。前两者是数据量的获取过程, 特征量提取是对原始数据进行变换, 得到反映模式本质的特征量或是统计量。分类决策则是在特征空间中用一定的方法把被识对象区分归为不同类型。对于局部放电信号, 数据获取和预处理一般由仪器完成, 特征量提取和选择与分类决策由计算机完成。通常后面两个过程是局部放电模式识别的重点。
3.1 局部放电信号特征量提取
为了解具体事物或事件的真实特征, 在进行模式识别时尽可能多地采集数据, 这使得样本在模式空间的维数很大, 不方便处理和应用。信号的特征选择与特征提取成为必要。模式识别系统的特征量指用于描述局部放电故障模式识别系统的一组与分类有关的参数。特征量提取的目的就是通过映射或变换的方法计算模式的某种“特征”或“属性”, 把模式空间的高维特征变成特征空间的低维特征, 以减少原始信号图的维数。其前提条件就是所提取的特征必须像原始图形那样能准确地分辨不同的模式。目前, 多采用以下方法进行局部放电信号特征量提取。
1) 相位统计特征:
在工频交流电压作用下, 局部放电的发生具有明显的相位特征。每个局部放电脉冲具有特定的幅值以及相对于工频试验电压特有的相位角。因此可以把局部放电基本参数:放电量q和脉冲放电次数n看作放电发生相位角φ的函数, 用以表示局部放电特征。
2) 放电统计特征:
由于局部放电具有明显的随机性, 而且它可能随着放电位置的不同以及局部场强和电压作用时间而发生变化, 因此可以采用与随机特性有关的识别方法, 即提取统计参数特征作为局部放电信号特征量。
3) 脉冲波形特征:
在局部放电测量中应用高速采样和宽带检测技术, 可以记录每个脉冲的时域波形。不同类型放电与其电流脉冲信号的波形是相对应的, 可直接用测得的局部放电脉冲信号的波形特征对放电源进行分类。提取局部放电信号波形的特征量, 包括时域、幅值域、频域等特征量作为分类器的学习训练输入样本。
4) 分形特征:
分形学是以复杂事物 (信息) 为研究对象的新兴学科, 其分形信息论是用信息度量理论原理和方法来研究信号的分形及其度量和属性。由于电器结构的复杂性和局部放电的随机性, 导致局部放电信号不规则性;但局部放电本身又有许多规律性, 因此表现为一种无周期的有序态, 总体表现为无序性和局部规律性, 这使得局部放电信号具有分维性质。基于分形特征的局部放电模式识别研究也表明, 局部放电的多种模式集合具有分形特征, 属于分形几何研究的对象范畴。
5) 矩特征:
矩特征是一种被广泛应用的图形识别特征, 它在统计意义上描述了一幅灰度图象中所有象素点的整体分布情况, 与一些最基本的图象形状特征有直接关系。局部放电信号有其自身的特点:如果按照局部放电发生的工频相位分布, 可将三维统计图谱划分成工频正、负两部分, 不同类型局部放电的两幅图象具有不同的相关程度。研究描述这种相关程度的统计特征, 有助于局部放电模式识别的应用。
3.2 自动识别理论
针对不同的对象和不同的目的, 可以用不同的模式识别理论、方法, 目前应用与局部放电识别的识别方法有统计模式识别 (又称决策理论方法) 、模糊识别、神经网络等方法, 它们之间又存在一定的联系和借鉴。根据这几种方法, 设计出局部放电的模式识别的决策分类器, 主要有:基于距离的模式分类器、线性及非线性分类器、聚类分析分类器、模糊识别分类器、人工神经网络分类器。基于距离的模式分类法是依据待检模式与样本之间的距离判别模式匹配的程度, 距离越小则模式匹配程度越高。线性及非线性分类法可归结为找到一个能够返回某种度量值的线性或非线性函数, 而且该度量值能够成为区分样本不同类别的依据, 根据这些依据来训练分类器。聚类分析是对一批没有标出类别的模式样本集, 按照样本之间的形似程度分类, 相似的归为一类, 不相似的归为另一类。人工神经网络是由大量简单的基本单元 (神经元) 相互联接而成的非线性动态系统, 每个神经元结构和功能比较简单, 而由其组成的系统且可以非常复杂, 具有人脑的某些特征, 能用于联想、识别和决策。近年来采用BP (back propagation) 算法的前馈网络是当前应用最为广泛的人工神经网络 (如图1所示) 。BP网络基本思想是将输出层产生的误差, 通过连接权值传到隐含层, 逐步后退最后达到输入层, 从而根据误差调整各层间的权值。最终使输出层达到某种要求。
3.3 局部放电信号模式识别应用
为了研究具体设备的局部放电的特征, 选取干式互感器作为研究对象, 其原因是因为干式互感器的结构简单, 可能存在的局部放电的原因多是环氧树脂浇注时真空不够, 内部存在气泡、裂隙。内部放电是干式互感器 (固体绝缘, 绝缘材料为环氧树脂) 产生局部放电的主要原因。为了方便研究, 假设所测试具有相似局部放电谱图的干式互感器均为内部放电 (如气泡、裂隙) 原因造成, 根据30只干式互感器的局部放电的相似放电图谱可以发现, 内部放电发生在第一、第三象限, 即电压幅值上升的部分, 而且正负半周的放电基本对称, 最大放电的相位在正负半周45度左右。
在软件中将相位分成若干个区间, 通过软件计算得出每个相位区间放电次数和平均局部放电量即Hn、Hqn。同时由软件统计功能由可以得出Hn、Hqn的统计量偏斜度Sk、陡峭度Ku、放电量因数Q、互相关系数cc以及局部峰点数Peaks。由样本值和样本均可以得出以下规律, 正负半周Hn、Hqn的Peaks差异较小, 且正负半周Hn、Hqn的Peaks均较大, 说明正负半周局部的放电特征相似, 即局部出现最大放电次数、最大放电量的次数接近;Q较小说明正负半周放电量差异不大。同时cc的较大说明正负半周平均放电量相似程度较高。正负半周Hn的Sk的样本值及均值大于0, 说明正负半周的放电次数的统计谱图相对于正态分布左偏。正负半周Hqn的Ku的样本值大部分 (>75%样本值) 小于0, 均值小于0, 说明正负半周的平均放电量的统计谱图相对于正态分布平坦的概率较大。
由此可以得出假设的内部放电的统计规律。假设30个个体的统计量取自同一放电类型的随机样本的统计量, 根据我们得出的该放电类型的统计规律, 计算样本中的统计量Q[Hqn (φ) ]、Sk[Hundefined (φ) ]、Ku[Hundefined (φ) ]、Pe[Hundefined (φ) ]、Pe[Hundefined (φ) ]的99%置信区间, 经过计算上述统计量置信度99%的置信区间分别为[0.86, 1.36], [0.48, 0.91], [-1.02, -0.47], [22, 28], [23, 30], 对cc求置信度99%的单侧置信区间为[0.60, 1]。以上统计量构成对局部放电模式识别的特征量, 各统计量在模式识别中的权重相当, 在对模式判别中, 计算被测试品局部放电的相关统计量是否落在上述置信度为99%置信区间内, 依据测试对象中6个统计量值落入置信区间的概率来确定为环氧树脂内部放电的概率。
图2、图3为两个试品的放电谱图, 根据上述计算方法计算图2为环氧树脂内部放电的概率为33%, 图3为环氧树脂内部放电的概率为83%, 根据局部放电的特点可直观判断图2为较明显的电晕放电谱图。可见这种内部放电的识别方法具有一定的合理性和代表性, 其识别结果有助于对环氧树脂内部放电类型的判断。
4 结束语
由于样本数量受试品个数限制, 以上方法存在一定的误差和限制。同时统计量落入样本置信区间的概率来代表放电可能性的概率还值得进一步的深入研究。随着计算机及数字处理技术的不断发展, 信号的处理及自动识别技术将得到广泛应用。但由于局部放电信号存在的多样性、复杂性、形成因素的不确定性等, 造成现有大多的局部放电识别系统与实际脱节, 识别效率不高, 应针对具体某种类型的设备, 根据设备的特点, 对局部放电信号进行分类, 根据其放电信号所具有的特征, 选择合适的识别方法进行识别;进行大量的设备局部放电信号的统计, 来验证识别方法的效率, 来形成一套高效、准确、方便的识别方法。
参考文献
[1]李剑, 孙才新, 廖瑞金, 等.用于局部放电图像识别的统计特征研究[J].中国电机工程学报, 2002, 22 (9) :104-107.
[2]郑重, 谈克雄, 高凯.局部放电脉冲波形特性分析[J].高电压技术, 1999, 25 (4) :15-20.
局部识别 篇3
关键词:人脸识别,局部相位量化,自适应加权,近邻保持嵌入
0 引言
人脸识别是当前计算机视觉和模式识别领域的热门研究课题之一[1,2]。目前, 主要的人脸识别方法分为基于全局特征和基于局部特征的方法。基于局部特征方法如Gabor小波法[3]、子图像法[4]相对于全局特征方法具有旋转、平移不变性等特点, 因此具有更高的稳定性和识别率。Ahonen[5]等人将局部二值模式 (Loca Binary Pattern, LBP) 应用于人脸识别, 将其用于描述人脸图像的特征, 取得了较好的识别效果。随后LBP算子被广泛地用于人脸检测、人脸识别等领域, 并得到了不断的改进[6,7,8]。考虑到LBP纹理模型过于依赖中心点像素的灰度值, 对噪声比较敏感, Ojansivu[9]提出了局部相位量化的人脸纹理描述方法, 该方法提取的图像局部纹理特征受光照变化和噪声影响很小, 具有更强的纹理描述效果。
在基于纹理特征的人脸识别方法中, 高维的特征向量是个普遍存在的难题, 因此特征降维方法的选取是影响识别效果的重要因素。PCA[10]和LDA[11]是常用的降维方法, 对线性数据降维有良好的效果。但是作为一种线性降维方法, 并不能保持原始数据的非线性的特点。人脸图像受诸如表情、姿态等因素影响, 它更可能位于一个非线性流形上。近年来产生了很多流形学习算法[12,13,14], 其中最具代表性的是He等人提出的近邻保持嵌入 (NPE) 算法[13], 该方法对非线性数据分类有良好的效果。
本文第一节和第二节介绍了LPQ特征的提取方法并提出了改进算法AWLPQ, 第三节针对目前局部相位量化特征提取中存在的问题, 进一步提出了基于AWLPQ和NPE的人脸识别方法。
1 模糊不变的局部相位量化方法LPQ
LPQ是用来处理空间的模糊图像纹理的描述算子, 具有很好的模糊不变性。如果定义u为二维坐标向量[u, v]T, 分别用G (u) 、F (u) 和H (u) 表示模糊图像、原始图像和点扩散函数的离散傅里叶变换, 则根据傅里叶变换的性质有:
同时可推出它们的幅值和相位之间的关系满足:
当点扩散函数h (x) 是中心对称函数时, 那么它的傅里叶变换总是实数, 也就是H只能取0或, 即:
进而可推出当H (u) 0时, 恒有G (u) (28) F (u) , 所以此时相位特征具有一定的模糊不变性。
设x (28) [x1, x2]T为图像f (x) 的一个像素点, 则LPQ特征就是通过离散的短时傅里叶变换 (STFT) 计算出该像素点的邻域Nx的相位, 计算公式为
式中:u表示频率, LPQ分别在四个频率u1 (28) [a0, ]T, u2 (28) [, 0a]T, u3 (28) [a, a]T, u4 (28) [a, -a]T计算傅里叶系数, a是一个足够小的使H (iu) 0的数。此时, 图像中的每个像素点都可以用一个向量来表示:
然后进行量化:
其中:fj是F (x) 中的第j个分量, 量化之后的F (x) 是一个8位的二进制编码, 同LBP算法一样, 然后对每位编码赋予权值系数即可求出该像素点的LPQ特征值:
2 自适应加权的局部相位量化方法
2.1 图像分块
如果对一幅图像直接应用LPQ算子, 这样只能描述该图像的整体的轮廓特征, 不能表征图像细节的纹理特征。所以应该将原始图像分若干块, 求出每个子模块的直方图特征, 然后串联起来作为整体特征进行匹配。
2.2 自适应加权系数
人脸的主要特征集中在变化明显的眼睛, 嘴巴, 鼻子等信息量丰富的部位, 但是对人脸图像分块时, 会有相当部分的子模块只包含一些对识别作用很小的边缘信息, 如果同等对待这些子模块的话, 会影响识别率的提升。
根据香农理论, 一张图片中所含的信息量可以用信息熵来表示, 信息量越大, 熵就越大。信息熵可以表示该图像的信息量, 同时也表示其纹理的丰富程度。信息熵的提出, 有利于我们计算各个子模块对图像信息的贡献率, 从而进行自适应的权重调整。
式中:ip为信源X取第i个符号的概率, n为符号的个数, H (X) 表示信源X的信息熵。
在本算法中, 假定将图像分为m个子块, 则第j个子块的熵为
其中:pji表示每级像素点的概率, n为该区域的像素级数, 通常为256。当子块的熵越大, 就赋予它更大的权值, 因此各分块权值定义如下:
设Rk为各子块的直方图向量, 则对各子块的直方图向量进行串接加权得到人脸图像最终的特征向量:
2.3 实验流程
综上所述, 本算法流程如下:
1) 对图像分块:X (28) [X0, X1 (42) Xm-1];
2) 计算子块的LPQ直方图Hj (28) fLPQ (Xj) ;
3) 计算子块的信息熵:
4) 求出每个子块的权值:
5) 串接各个子块加权后的直方图向量φ (28) (W0 X0, W1 X1, W2 X2, (42) Wm-1Xm-1) ;
6) 通过norm最近邻分类器进行分类。
2.4 实验结果及分析
为了验证本文提出方法的有效性, 我们在FERET人脸数据库中进行实验。该库包括200人的1400张图像, 每人7副图像。图像尺寸为8080, 其中包括了大量不同姿势、光照、表情的变化, 是一个极具挑战性的人脸库。
我们从中分别随机选取该库200个人的3、4张图像作为训练样本, 另外4、3张作为测试样本, 取10次实验的平均值作为最终结果。所得实验数据如表1。
分析实验数据可知, 本文提出的AWLPQ获得了最好的性能, 相对于次优的LPQ, 其中最小提高幅度约1个百分点, 最大可达2个百分点。主要原因在于AWLPQ考虑了每个子图像对人脸识别的不同的贡献率, 对图像特征的描述更合理。
但是, LPQ的特征值在0~255之间, 所以求出的每个子图像的LPQ直方图特征维数为1256。如果将人脸图像分为nn, 那么每张人脸的最终LPQ特征维数就是256nn, 高维的特征向量大大增加了分类时的计算负担。为解决这一问题, 本文提出了相应的解决办法。
3 基于近邻保持嵌入的自适应加权LPQ
3.1 近邻保持嵌入
在这里, 我们引入流形算法中的近邻保持嵌入 (NPE) 对AWLPQ获得的直方图数据进行降维。
设X (28) (x 1, x2, (42) , xn) 是由D维向量组成的数据集合, NPE算法的目的是寻找一个变换矩阵A, 将数据映射到低维空间Rd (d (27) (27) D) 中, 数据点xi在Rd中表示为yi, 且yi (28) ATxi。
NPE采用与LLE近似的方法构造数据集的k近邻图, 假定每个局部近邻是线性的, 可以通过线性组合系数矩阵W来描述局部几何特征。每个数据点通过它的k个近邻线性重构, 重构的损失函数为
NPE认为如果能在D维空间中重构数据点ix, 则可以重构ix对应在d维空间中的yi, 因此线性变换A可以通过求解下面最小化问题得到:
约束条件为ATXXTA (28) 1。其中M (28) (I-W) T (I-W) , tr表示矩阵的迹。
上式的最优化问题可以转换成下面的广义特征值求解问题, 即
3.2 实验结果及分析
ORL人脸库中有40类, 共计400张尺寸为11292的人脸图像。这些图像拍摄于不同时期, 图像光照、姿态表情有一定的变化。随机选取每类5张作为训练样本, 另外5张作为测试样本, 取10次实验的平均值作为最终结果。测得在不同分块个数下各方法的消耗时间 (图2) 和识别率 (表2) 。
由图2可知, 随着图像分块数量的增多, 计算所耗时间也不断增加。由于AWLPQ需要计算各个分块的信息熵和权重, 所以比LPQ更消耗时间。而本文提出的AWLPQ-PCA, AWLPQ-LDA与AWLPQ-NPE三种方法均对高维的特征向量进行了降维, 实时性得到了显著提高。
基于局部差分三值模式的人脸识别 篇4
由于在人机交互,安全,执法,金融卡识别,自动视频监控,娱乐等的广泛应用,人脸识别已经成为了模式识别和计算机视觉中一个非常活跃的研究领域。对于人类而言,人脸识别是一项在日常生活中可以轻松完成的任务。人的大脑可以迅速感知一个人的面部,并在高度不可预测的或不确定的情况下用自己的知识来识别它们。而要让一台机器能够像人类一样执行相同的工作依然是一个巨大的挑战。
现有的人脸识别方法主要分为基于外观(整体性)的方法和基于特征的方法。在整体性方法中,整个人脸图像被视作一个高维向量。由于维数灾难,这样的向量不能直接用于识别。因此,整体性方法通常使用一些维数降低技术来解决这个问题,如主成分分析、线性判别分析、独立成分分析、支持向量机、拉普拉斯等。而基于特征的方法使用从人脸图像中得到的观察集合来执行识别任务。一些典型的基于特征的方法,如约束图、局部二值模式、高斯混合模型、隐马尔可夫模型。相比整体性方法,基于特征的方法对于旋转,光照,表情,定位误差均有较好的鲁棒性。本文就是要提出一种用于人脸识别的基于特征的纹理描述子。
纹理是一副图像中形状的表达方式。纹理描述子由于对旋转、光照等变化具有鲁棒性,因此在人脸分析领域得到了越来越多的关注。LBP是纹理分析中最有代表性的算法。LBP可以从图像中获取大量对人脸识别非常有用的细微纹理模式信息。由于其低维度和高效率,已被证明对于人脸表情分析,背景建模以及人脸识别具有高度的判别能力。然而,传统LBP方法的均匀模式思路,无法发现由不均匀模式产生的更加复杂的形状,并且传统LBP无法发现邻域像素点大于中心像素点的情况。正因为存在这些问题,之后出现了很多LBP衍生算法。局部三值模式(LTP)是为解决纹理分类问题而提出的,它能够获取比传统LBP更详细的局部纹理信息。局部差分模式(LDP)是根据局部差分变化来编码方向模式的一个整体框架,主要用于鲁棒性的人脸识别。它可以对一个局部区域的各个空间关系进行编码。LDP提取基于边缘的信息,包括水平和垂直方向上分布的信息。它拥有比传统LBP更多的判别特征。
受到这些衍生技术的启发,本文用LDP技术中的方向特征与LTP方法中的三级描述子融合为新的描述子,即局部差分三值模式(LDTP)。实验结果表明,LDTP在不同光照环境、面部表情和旋转变化下,均能很好的表达人脸特征,显著的提高人脸识别系统的识别精度。
1 LDTP纹理描述子
一副图像的纹理特征可以作为一个整体用一个灰度共生矩阵来表征,也可以用在宏观层面的局部描述子出现频率的直方图和微观层面的局部纹理描述子来表征。本文提出的局部差分三值模式是一种局部描述子。全局描述子用一个一维直方图表示,直方图的横坐标表示纹理模式的个数和纵坐标表示该模式的发生频率。
LDTP描述子应用在一个N×N大小的局部区域中,然后可以计算出一个对应于该区域的纹理模式的值。在本文中N取值5,该描述子通过对一个5×5 大小的局部区域所包含的各种空间关系进行编码,来提取二阶局部差分信息。给定一个区域I(Z),一阶差分表示为,其中和,使Z0成为I(Z) 的中心点, Zi, (i 1 8) 为Z0的邻域点,那么一阶差分Z Z0可以写成
在α方向上的二阶LDTP被定义为
其中, f是一个三值编码函数,被定义为
参数T既可以用于整幅图像的固定值(全局),也可以适应于局部区域。在自适应技术中,阈值是根据图像动态变化的,其本身包含了图像中光照条件的变化。在本文中,阈值T是自适应的,并且可以使用统计参数均值m和标准差s来计算:Tkmls,式中,k和l取值范围为0.1到1,它们是通过实验评估得出的经验值,本文中m和s的值被分别固定为0.2和0.1。
计算LDTP纹理描述子的过程如下:(1)计算各独立方向的模式值。(2)所有模式值被合并为一个单一比特流。3)计算该比特流十进制的值。下式给出了LDTP描述子在一个5×5 大小的局部区域的实际计算示例,其中, T =3, α0 :
2 人脸识别算法
人脸识别系统主要分为训练阶段和测试阶段。系统中预处理的任务是将图像调整到所需的大小,同时去除人脸图像中的眼镜和胡须等遮挡物。在训练阶段,输入图像被划分成N N大小的非重叠区域,然后用LDTP描述子对每个区域来提取局部纹理特征。有了这些特征,就可以构造出针对每一个区域的一维直方图,并把它们被合并在一起,得到一副图像的全局描述子,然后将训练特征以一维直方图的形式存储在数据库中。在测试阶段,执行相同的过程,从测试图像中提取纹理特征。然后,使用K近邻(KNN)分类器把从测试图像中提取的纹理特征与数据库中存储的特征进行比较得到识别结果。这里KNN使用对数似然度作为距离测度。人脸识别系统的整个处理过程见图1 所示。
3 实验结果与性能分析
3.1 性能指标与测试条件
为了验证该模型的可行性和有效性,有必要在各种情况下分别进行测试实验,包括不同光照度,脸部旋转,面部表情和脸部覆盖遮挡物的情况。实验在包含各种不同条件下的人脸图像数据库中进行:JAFFE、ORL、Essex和YALE B。测试样本与训练样本中所有的匹配项,均已使用基于监督知识的KNN算法进行了验证,以判断是否正确匹配。人脸识别系统的两个性能指标:
3.2 数据库介绍
JAFFE数据库是十个人分别摆出7 种基本表情(快乐,悲伤,惊讶,愤怒,厌恶,恐惧和正常),每一种表情有3 到4 幅图片,共包含213 幅图片。该数据库用来进行正常条件下的脸部识别。数据库图像被分为10 组,每组有同一人的20 幅图像,一半用于训练,一半用于测试。ORL人脸库包含了40 人的400 幅图像。这些图像在不同的时间拍摄,拥有不同的变化,包括表情,光照和脸部细节。该数据库用于验证正常状态、光照变化和遮挡条件下的纹理模型的性能。Essex数据库包含了395 个男性和女性,每个人有20 幅图像。其中有些人戴着眼镜,有些人有胡须。该数据库用于遮挡条件和正常状态下的测试。YALE B数据库包含10 个人的5760 单光源图像,每个人都有576 种观看条件(9 种脸部旋转*64 种光照条件)。该数据库用来检查LDTP在不同光照和旋转条件下的识别效果。图2 和图3 展示了JAFFE和Essex数据库中的人脸图片。
3.3 实验结果
表1 是在正常状态下LDTP的实验结果。JAFFE和ORL数据库含有不同旋转角度和表情的图像,因此它们的识别率比Essex数据库低。基准数据库的平均识别率达到了93.9%。从实验结果可以得出,在正常状态下,LDTP能够提取人脸图像的详细特征信息,可以得到更好的人脸识别结果,有效地获取了人脸纹理信息。
人脸表情变化的鲁棒性是人脸识别系统中的一个重要问题。这里把Essex数据库中的图像被随机分为训练集和测试集。每个试验进行三次,计算一个平均结果,结果见表2。实验结果表明,LDTP显著增强了各种表情的识别率,其原因是:表情的变化不会影响相同的模式部分。因此,该算法属于局部自适应阈值方法。Essex数据库的平均识别率为85.9%。
在实时处理中,人脸图像的灰度值会受到周围环境和成像设备的严重影响。在光照不受控制的条件下提高识别率是人脸识别系统的主要挑战。这里,我们通过对ORL和YALE B数据库执行人脸识别,来评估LDTP描述子的不同光照下的鲁棒性。实验结果见表3。从实验结果可以得出以下结论,LDTP描述了高阶差分信息,因此它对光照变化最不敏感,它还保留了人脸识别所必要的基本外观细节,可以从人脸图像中捕获比传统LBP更多的变化特征。本文提出的识别方法实现了89.5%的平均识别率。
人脸识别任务中出现脸部旋转意味着极大的提高了识别难度。此实验是在YALE B数据库上进行的,结果列于表4 中。从实验结果中,我们得出结论LDTP在脸部旋转为0 时可以实现较高的识别率。但是,当旋转由0 急剧地变化到 25 时识别性能显著降低,结果表明,LDTP是较为适应旋转变化的。
眼镜等局部遮挡会使得人脸识别任务变得更加复杂。因此预处理需要从图像中去除这些遮挡物。这里,我们用递归误差补偿算法去除遮挡物。在Essex数据库上对戴眼镜的人脸图像进行实验,正常的人脸图像组成训练集,每个目标的三类遮挡图像被视为测试集。表5 给出了累积正确识别率结果。与正常状态下人脸识别相比,识别率出现了一定的下降,因为眼镜覆盖了眼睛区域,而眼睛与人的嘴巴、鼻子区域相比,承载了更多的相同模式信息。
4 结论
本文提出了一种针对人脸识别的新颖高效的纹理描述子LDTP。系统的执行了5 组人脸识别实验包括:(1)正常状态;(2)不同光照;(3)不同面部表情;(4)脸部旋转;(5)局部遮挡。实验结果表明,在实时条件下LDTP描述子能够很好的表达人脸特征,显著的提高人脸识别系统的识别精度。该算法可以用于其他基于纹理的应用,如基于内容的图像检索、遥感图像分类以及医学图像等,还可以扩展到性别分类和年龄变化等与人脸处理相关的问题上。在未来的工作中,可以将针对分类问题的神经网络融合进来,来对LDTP加以改进。
参考文献
[1]苏煜,山世光,陈熙霖,高文.基于全局和局部特征集成的人脸识别[J].软件学报,2010.
[2]叶继华,亚慧,王仕民.基于LBPT方法的彩色人脸图像识别[J].系统仿真学报,2016.
[3]盖健,刘小华,李锐杰,宁尚军.基于LBP的图像集人脸识别算法[J].东北师大学报(自然科学版),2015.
[4]杨作宝,侯凌燕,杨大利.人脸识别的光照预处理算法[J].北京信息科技大学学报(自然科学版),2015.
局部识别 篇5
人脸具有唯一性、非接触性和不可复制性,相对于其它生物特征,具有操作性,因此在军事安全、身份识别、视频检索等领域具有广泛的应用前景[1]。当前,在环境比较理想的条件下,人脸识别率已经比较理想了,但是在实际应用,人脸所处环境受到光照等因素的不利影响,从而使人脸识别过程仍然有大量问题有待解决。而人脸特征的提取是人脸识别的第一步,也是比较关键的一步,特征优劣对后续人脸分类器性能影响较大,因此如果提高人脸识别的准确率和光照鲁棒性,一直是光照人脸识别研究领域中的难点[1]。
针对人脸识别问题,许多学者投入大量时间和精力进行研究,提出了许多人脸识别算法[2]。经典人脸特征提取方法主要有基于主成分分析法PCA( Principal Component Analysis) 、线性鉴别分析法LDA ( Linear Discriminant Analysis) 、独立成份分析法ICA( Independent components analysis) 等。这些方法是一种类线性特征提取方法,而人脸图像具有多变性,特征不是固定不变,当人脸图像发生遮挡、光照时,它们难以准确、全面提取人脸特征,提取有用的人脸特征信息相当少,人脸识别率比较低[3,4,5]。为了获得更加理想的人脸识别结果,有学者提 出基于局 部二值模 式LBP ( Local Binary Pattern) 的人脸特征提取方法 。 大量研究结果表明 ,LBP获得比传统特征提取算法更好的效果[6,7]。然而LBP只能提取人脸的一阶特征信息,对光照变化、随机噪声比较敏感。 为了解决该难题,Jabid等提出了一局部方向模式LDP( Local Directional Pattern) 算法 。该算法可以提取人脸特征的多阶信息,并可以充分利用局部边缘梯度信息,人脸识别得以相应提高[8]。然而在实际应用,LDP算法同样存一些缺陷,如耗时长、抗噪性能差等,人脸识别率有待进一步提高[9,10]。
为了提高人脸的识别正确率,针对传统局部方向模式耗时长的难题,提出一种改进局部方向模式的人脸识别算法。首先将人脸图像分割成若干不重叠的子块,采用修改了编码方案局部方向模式算法提取每个子块特征,然后所有子块特征进行连接构成人脸图像的特征向量,最后采用最小二乘支持向量机人脸图像进行识别,在ORL标脸库上将本文算子与LDP、LBP和PCA等算法进行了对比试验。
1 LDP 算法
局部方向模式LDP是一种LBP描述算子的变种,LDP提取图像的二阶导数信息,即表示高阶导数信息,而LBP则表示一阶导数信息,这些高阶导数信息包含了更多的可被识别的特征, 而且这些信息在只能表示出一阶导数信息的LBP中是无法得到的[11]。LDP分别将图像某点八邻域四个方向的二阶导数进行编码,组成四个方向的细节特征图像。设一幅图像I( z) ,方向为0°、45°、90°和135°的一阶导数分别被表示为I'α( Z) ,其中 α = 0°、45°、90° 和135°,设Z0图像中一点,是围绕着点Z0的8邻域点,那么Z = Z0在这四个方向上的一阶导数计算公式为:
式中,z0的二阶导数用LDP2α( z0) 表示,LDP2α( z0) 定义为:
其中:
最后,二阶LDP即LDP2( z) 被表示为: 四个八位并具有方向的一阶LDP的组合:
LDP算法的Kirsch模板如下所示:
2 改进 LDP 算法
由于传统LDP算法存在一定的不足,为此,本文进行一种改进局部方向模式算法ILDP( Improved Fast Local Directional Pattern) ,以获得更优的人脸特征,从而提高人脸识别率。
2. 1 编码方式的改进
传统局部方法总把阈值选择为0,这样光照条件下并不能很好地表现鲁棒性,为此本文算法阈值是按照实验数据来给定的,也就是如果光线充足时,阈值就会相对变大; 反之阈值就会相对变小。阈值编码规则为:
2. 2 主方向归一化
在人脸识别系统的实际应用过程中,人脸通常会有一定角度的旋转,这会导致LDP编码时各方向的空间对比信息分布发生变化。同一幅人脸得到完全不同的LDP编码值,使特征包含大量冗余信息,计算复杂度增加,对人脸识别速度产生不利影响。为此,本文根据文献[12],对LDP算子主方向归一化操作定义为:
这样可以减少冗余特征信息,提高人脸识别效率。
2. 3 改进边缘模板选择
本文选择目前常用三种梯度模板: Prewitt算子、Sobel算子Roberts算子,并计算4个方向的边缘响应,来构建ILDP描述子,具体如下所示:
( a) Prewitt算子边缘模板
( b) Sobel算子的边缘模板
( c) Roberts算子的边缘模板
2. 4 人脸图像分块和加权
在提取人脸特征信息时,传统LDP算法对于像素点信息同等对待,这样难以准确描述不同人脸区域像素点对于人脸识别结果影响程度,为此本文出采用人脸图像分块和加权思想,对人脸特征进行处理。
设把人脸图像分割成大小为M × N的n个子块,对于每一个子块,权值计算公式为:
式中,wi表示权重; mi表示4个边缘返回值; wrc( LDPk( r,c) ) 表示分块中LDP编码的结构对比信息。
3 基于 ILDP 的人脸识别
3. 1 提取人脸特征
首先提取人脸图像,然后对其进行ILDP编码,并将其划分成n个子块,最后将各子块的特征连接在一起,得到人脸全局特征,作为后续人脸分类器的输入。人脸特征提取过程具体如图1所示。
3. 2 人脸分类器设计
设训练集为( xi,yi) ,i = 1,2,…,n; n表示训练样本数,xi∈ Rm为样本输入,yi∈{ 1,- 1} 为输出,最小二乘支持向机( LSSVM) 在高维特征空间的线性函数为:
式中,ω 为权值向量,b为偏置量。
根据结构风险最小化原则,综合考虑拟合误差和函数复杂度,式( 13) 变为:
式中,γ 为正则化参数; ei为预测误差。
通过引入Lagrange乘子将式( 14) 变成无约束对偶优化问题,即:
式中,ai拉格朗日乘子。
根据KKT条件,可到:
对非线性分类问题,通过引入核函数转换到高维特征空间求解,相对于其它核函数,径向基核函数( RBF) 参数少,且性能更好,因此选择其作为LSSVM的核函数,RBF定义为:
式中,σ 为径向基核函数的宽度参数。
最后,LSSVM分类决策函数为:
LSSVM是二元分类器,对于多类型的人脸进行分类,必须构造多分类器,本文人脸分类器的构建方式具体如图2所示。
4 仿真实验
4. 1 仿真环境和数据来源
为了测试基于改进局部方向模式( ILDP) 的人脸识别算法性能,在AMD 4核CPU 740,4G内存,Windows XP操作系统, Matlab R2012工具箱的环境下进行仿真测试实验。为了使本文算法的结果更具说服力,采用当前经典人脸特征提取算法中的LBP、LDP、LDA、PCA进行对比实验。人脸图像来自于ORL和FERET、Yale标准人脸数据库。
ORL人脸数据库共有40类样本,每类10幅,共计400幅。 在这些样本图像中,光照、表情和姿态都有一定变化,但是变化范围相对较小。ORL中的一个训练样本如图3所示。
FERET人脸数据库共有200类样本,每类有7幅图像,包括人脸的角度、表情、光照等的变换,变换幅度比较明显,部分人脸如图4所示。
Yale人脸数据库包含15个人的165张不同的图像,每一个人都有在不同光照下的11张图像。图5是Yale人脸数据库中的一个样本。
4. 2 编码阈值的选择
在基于改进局部方向模式算法( ILDP) 中,编码阈值选择十分关键。ORL、FERET、Yale人脸库的人脸识别率与阈值之间的变化曲线如图6所示。从图6可知,随着阈值的增加,分类准确率呈现先上升后下降的趋势,可见,阈值的选取,可以改善人脸识别性能,因为阈值的选择与待识别人脸图像质量、尺度、信噪比等因素相关。当阈值为7时,ORL人脸库的人脸识别结果最理想,当阈值为8时,FERET人脸库的人脸识别率最高,当阈值为6时,Yale人脸库的人脸识别率最高,因此选择该阈值进行后续实验。
4. 3 人脸分块大小的确定
由于改进局部方向模式算法( ILDP) 的特征构建思想来源于LBP,因此不同图像采用不同分割方式会对ILDP算法性能会产生不同程度影响。首先将人脸划分多个子块,并提取每一个子块的人脸特征,然后将子块特征连接起来组成一个人脸全局特征。不同分块大小的人脸识别率如图7所示,随着子块数的多,人脸平均识别不断提升,这主要是由于分块增多能够更细致特征信息,从而提高人脸的识别率。但是,子块过多,计算时间和存储空间随着增加,而且随着分块的增多,过小分块导致特征信息出现比较大冗余导致识别率下降。因此ORL人脸库的最优子块数确定为7; FERET人脸库的最优子块数确定为6; Yale人脸库的最优子块数确定为7。
4. 4 结果与分析
4. 4. 1 分类准确率比较
不同算法的人脸识别结果如表1所示。
( 1) 相对于PCA,LBP、LDA、LDP的人脸识别率相对较高, 但是当训练样本较小时,它们的人脸识别率都很低,没有什么优势,这主要由于训练样本太少,提供的信息过少,随着训练样本增加,LBP、LDA、LDP优势得到体现,具有一定的优势,获得更高的人脸识别率。
( 2) 相对于LBP、LDA算法,LDA文算法获得更加理想的人识别结果,这主要是由于LDP可以提取图像的二阶导数信息,,而LBP和LDA只能提取一阶导数信息,信息量相对较少, 难以对人脸类别进行识别,因此LDP的人脸识别率更高。
( 3) 相对于对比算法,ILDP的人脸识别率最高,这主要是由于ILDP用修改了LDP的编码方案,并且所有子块特征进行了加权处理,构建的人脸特征更加准确描述人脸类别信息,可以实现准确的人脸分类,从而提高了人脸识别率,识别结果可以较好地满足用户要求。
4. 4. 2 人脸识别速度比较
对于现代人脸识别系统来说,识别速度至关重要,其影响人脸识别的在线性和实时性。不同算法的平均人脸识别时间如表2所示。在所有算法中,PCA的平均人脸识别时间最少,识别速度最快,但是其识别率比较低,不能满足人脸识别实际应用的正确率要求,没有太大的应用价值。相对于LBP、LDA、LDP,ILDP算法的识别时间相对较少,识别速度最快,同时具有较高的人脸识别率,因此可以较好的满足人脸识别的实时性和在线性识别要求,可以拓宽人脸识别的应用范围。
5 结 语
为了提高人脸识别率,提出一种改进局部方向模式的人脸识别算法,并在ORL、Yale以及FERET人脸数据库进行了仿真对比实验。实验结果表明,相对于LBP、PCA、LDA、LDP等经典人脸特征提取算法,本文算法可以获得更优的人脸特征,提供了更加丰富的人脸信息,能够精确刻画人脸图像的类别,人脸识别结果十分理想,并且大幅度降低了平均人脸识别时间,人脸识别效率更高,较好地解决了人脸识别过程中的光照、耗时长等难题,具有广泛的应用前景。
摘要:为了提高人脸识别率和效率,提出一种改进局部方向模式特征的人脸识别算法。首先将人脸图像分割成若干不重叠的子块,采用改进局部方向模式算法提取每个子块特征,然后对所有子块的特征进行连接,构成人脸图像的特征向量,最后采用最小二乘支持向机对人脸图像进行识别。在多个人脸库上进行仿真实验,结果表明,该算法获得了比传统算法更高的人脸识别率,而且加快了运行时间,较好地满足人脸识别实时性要求。
基于局部幅度三值模式的人脸识别 篇6
LBP是一种有效的纹理描述算子,Ahonen等人将其引入人脸识别中。LTP[13]是在LBP基础上增加阈值的设定,这对纹理结构有更加细腻的描述,同时也对噪声有较好的鲁棒性。但是LBP或LTP算子都只是对纹理的结构进行描述,却没有对纹理中像素点之间的不同进行有效的表达。为了对纹理中像素点之间的差异进行更多的描述,进而利用其来提高人脸识别率,本文提出局部幅度三值模式,首先对邻域像素值与中心像素值的偏离幅度进行编码,描述局部纹理中像素点的差异,同时提取LTP特征描述纹理结构,然后把得到的LMTP的直方图与LTP直方图进行串联,得到人脸特征。实验结果表明,该算法能有效提高人脸识别率。
1 局部三值模式的回顾
1.1 局部二值模式(LBP)
LBP是对图像中局部纹理特征进行描述的算子。LBP算子对图像中每个像素点的(P,R)邻域进行采样,其中P表示采样个数,R表示邻域的半径。对中心像素点的灰度值gc与其邻域第i个像素灰度值gi进行比较,gi大于gc则为1,否则为0。这样得到P位的二进制编码。通过十进制转换得到LBP值,计算如下
同时Ojala提出采用“均匀模式”对LBP算子的二进制编码进行降维。使得LBP模式值由2P种减少至P(P-1)+3种。“均匀模式”使得统计直方图时,在不损失过多有用信息的情况下,减少统计的类别。
1.2 局部三值模式(LTP)
LTP算子是对LBP算子的扩展,其对光照变化和噪声具有更好鲁棒性,并更加细腻地描述局部纹理。LTP增加自定义t,gi大于区间[gc-t,gc+t]时为1,属于此区间时为0,小于此区间时为-1,得到三值编码值,计算如下
式中:P、R、i和LBP算子一样。由于LTP的模式值有3P种,为简化计算,令LTP特征分解为正、负LBP的编码方式。即把编码值不为1的均修改为0,得到正LBP人脸纹理特征。把编码值为-1的修改为1,其余均变为0,从而得到负LBP人脸纹理特征。过程如图1所示。
2 LMTP算子的提取和人脸特征的表示
2.1 局部幅度三值模式(LMTP)
尽管LTP算子对LBP做出了改进,使得该算子对光照变化和噪声更具鲁棒性,并且对局部纹理有更好的描述。但本质上与LBP算子对纹理的描述是一致的。LBP和LTP都仅仅通过比较像素值的大小来确定编码值,忽略了像素值之间偏离幅度的描述。当邻域像素值与中心像素值或区间之间保持大小关系不变的前提下发生较大变化时,编码值结果保持不变。所以LTP算子无法描述此类非线性变化前后的差异,而这种差异也是纹理的重要特征之一,然而这部分重要的纹理信息没有被有效地利用到人脸匹配中。
针对LTP对局部纹理描述的不足,本文提出LMTP算子。定义mi=gi-gc为gi与gc之间像素值的差,其中gc为中心像素值,gi(i=0,1,…,P-1)为中心像素的邻域中第i个像素值。mi表示邻域像素值与中心像素值的偏离幅度,LMTP算子则有如下定义,公式如下
式中:P,R,t和LTP算子一样,u是阈值,对人脸图像分块处理后,把u设置为所属分块中所有mi的绝对值的均值。例如图2a是一个中心像素值为25的3×3的局部邻域。图2b是偏离幅度向量[-17,6,7,3,17,-15,13,-5],假设该向量所处块中所有mi的绝对值的均值为8,以此值设定阈值u,通过式(5)和式(6)得到三值编码(-1)0001(-1)10。从得到的编码中可以看到,邻域的像素点分为三类,像素值比中心像素值小且偏离幅度较大时得到的编码值为-1,比中心像素值大且偏离幅度较大时编码值为1,与中心像素值偏离幅度不大时编码值为0。
LMTP中阈值t的设定目的也是为了增加对噪声的鲁棒性。阈值u则是对邻域像素值与中心像素值的偏离幅度进行编码值的划分。当邻域像素值都比中心像素值大时,LMTP通过比较幅度值来表达邻域像素点间的差异,LTP则只是简单的比较。尽管LMTP的形式与LTP相似,但其更多是描述邻域像素值之间的不同,从而补充LTP算子对局部纹理描述的不足,为人脸识别提供更丰富的纹理特征。最后利用得到的人脸纹理特征进行人脸识别,提高识别的准确率。
2.2 LMTP和LTP人脸的特征提取和表示
本文提出结合LMTP和LTP的人脸纹理特征提取算法。图3是人脸特征提取的流程。
以一张人脸图像为例,将图像划分为m×n块,其中LMTP和LTP特征提取步骤如下:
1)从人脸图像的某一分块中的一个像素点A的像素值记为gc,邻域像素值记为gi。
2)通过式(3)、(4)计算A点的LTP值,并分解为正负均匀模式的LBP。
3)通过式(5)、(6)计算A点的LMTP值,并分解为正负均匀模式的LBP。
4)重复步骤2)、3)计算该块中每个像素值的编码值,然后统计LTP直方图和LMTP直方图。
5)对人脸图像的每一块重复以上步骤,得到m×n个LTP直方图并串联成为一个直方图。同理,将m×n个LMTP直方图串联成一个直方图。
6)进一步将LTP直方图与LMTP直方图串联得到整幅人脸的LTP/LMTP直方图,将此作为人脸特征。
3 实验结果与分析
为了检测该人脸识别算法的性能。本研究采用ORL、AR和FERET人脸数据库进行仿真实验。实验中阈值t设置为4,人脸图像分成3×3块,P和R取值分别为8和1,用LTP8,1和LMTP8,1计算人脸特征。然后统计直方图,本文采用Chi平方统计对直方图的相似性进行度量,然后用根据最近邻准则进行分类。
3.1 在ORL人脸数据库上的实验
ORL人脸数据库由剑桥大学AT&A实验室创立。一共有400张人脸图像,40个人,每人10张图片。自愿者的图像包括了姿势、表情和面部饰品的改变。每张图片大小为112×92。人脸库中某一人的10幅图像如图4所示。
在真实场景下,采集人脸样本时不可避免地受到噪声的影响。LTP本身对噪声有较好的鲁棒性,为了测试LMTP对噪声是否同样具有鲁棒性,对ORL增加噪声等级λ,模拟真实场景下的噪声。在此实验中随机选取5张图像作为训练样本,剩余的图像作为测试样本,识别率的对比结果如表1所示。
%
通过表1的对比实验可以看到,当噪声等级λ增大时,LBP的识别率快速下降,而LTP、LMTP和LTP/LMTP的识别率的下降幅度较小,证明对噪声具有较好鲁棒性。同时可以看到LMTP在原图中识别率达到88%,表明其作为纹理的特征之一,能被利用到人脸识别。LTP/LMTP的识别率在原图上达到了97%,在噪声图像中其识别的性能也优于其他方法,表明了LTP/LMTP对纹理的描述能被利用到人脸匹配中,从而提高人脸识别准确率的方法是可行和正确的。
3.2 在AR和FERET人脸数据库上的实验
AR人脸库包括4 000多张人脸图像,一共有126人,70名男性和56名女性。其中包含了不同表情、光照和遮挡的正面人脸图像。本文只选择70名男性和50名女性,每个人选择没有遮挡的14张人脸图像。对AR人脸库中每个人随机选择k张图像作为训练集,其余的作为测试集。k的取值设置为2,4,7。用不同的方法进行实验,识别率的对比结果如表2所示。
%
FERET人脸库包括1 400张人脸图像,一共有200个人。这些图像包含了不同的表情、光照和姿势,其大小为80×80。对FERET人脸库中每个人随机选择k张图像作为训练集,其余的作为测试集。k的取值设置为1,3,5。用不同的方法进行对比实验,识别率的对比结果如表3所示。
%
由表2和表3中不同人脸识别方法的对比实验可以看到,LTP/LMTP的人脸识别率在AR和FERET人数据脸库中最高能达到93%和98%,均高于其他的方法,表明其对光照、姿势和表情具有较好的鲁棒性。在训练样本减少的情况下,识别率均比其他方法好,并且识别率的下降幅度较小,表明LTP/LMTP的稳定性更好,进一步证明了本文算法的可行性和正确性。
4 小结
人脸识别问题一直是研究的热点,本文提出基于局部幅度三值模式的人脸识别算法,利用LTP描述纹理的结构,利用LMTP描述纹理中像素间的偏离幅度。通过结合LTP和LMTP对纹理的描述,得到一个更丰富的人脸特征,并利用此人脸特征进行识别。实验结果表明,本文算法比LTP和LBP方法的识别率更高。
摘要:针对局部三值模式(Local Ternary Pattern,LTP)对纹理特征描述不足的问题,提出一种基于局部幅度三值模式(Local Magnitude Ternary Pattern,LMTP)的人脸识别算法。首先将人脸图像进行分块处理。然后用LTP算子提取直方图以描述局部纹理的结构和LMTP算子提取直方图以描述局部纹理中像素值间的偏离幅度。最后将不同的直方图串联成LTP/LMTP直方图,将其作为人脸特征用于人脸匹配。实验分析表明,算法对纹理有更好的描述能力和在人脸识别中有更高的识别率,并对噪声有较好的鲁棒性。
局部识别 篇7
人脸识别[1]是模式识别中最重要的研究领域之一,然而,它仍然是非常具有挑战性的任务,面临着许多需要解决的问题。例如,基于主成分分析(PCA)[2]的方法是经典的特征提取方法,学者们运用这种方法处理人脸识别任务的第一阶段,该方法没有有效利用人脸的局部信息[3]。PCA最初用于特征脸方法中[4]为人脸识别任务提取特征,该方法作为一个预处理步骤,将每个2D图像转换成高维向量,该转换会引发一些重要问题,如小样本问题[5]。
为了解决小样本等问题,文献[5]提出了二维主成分分析(2DPCA),该方法保存图像的二维结构,相比基于向量的方法,能产生维度低得多的协方差矩阵[6]。尽管如此,2DPCA仅考虑图像的列的相关性,忽略了行与行之间的相关性,而且相比PCA,它需要更多系数来表示特征空间的图像[7]。于是,文献[8]提出了双向2DPCA((2D)2PCA)来解决2DPCA中的问题,由于它的优势,许多应用程序运用了(2D)2PCA[9]。(2D)2PCA同时利用图像的行和列之间的关系,相比2DPCA,使用较少的系数就能表示图像特征矩阵,而且在大多数情况下,(2D)2PCA和2DPCA获得的识别精度几乎一致[10]。通过增加用于构建投影矩阵的特征向量的数目,可以保留更多这类变化信息,然而更多无效信息和噪声也会被转换到特征空间中[11]。文献[12]提出了分块PCA(BPCA)将图像划分成许多块,使用PCA提取每个块中的特征,2DPCA就是BPCA的一种特例[13]。文献[14]提出了基于L1范式的分块PCA(BPCA_L1)方法,代替L2范式,使用L1范式定义它的优化问题。此外,文献[15]提出了分块2DKPCA,通过采用一种分块方法提取特征,降低了2DKPCA的计算复杂度。上述方法都面临着局部信息缺失问题,以全局方式提取变化最大的部分信息,虽然更有利于明显的全局变化,但可能会丢失一些有用的局部信息。没有有效利用人脸图像中的部分局部信息仍然是有待解决的问题之一。
为了解决局部信息缺失的问题,本文提出了一种新的基于2DPCA的算法。在特征提取阶段,本文方法遵循一种与BPCA相似的方法:保存图像的局部特征,将图像划分成许多子块。采用(2D)2PCA提取每个子块中的特征。因此,本文处理散布矩阵的大小为h2和w2代替(h·w)2,这是BPCA的情况(h和w分别代表每个块的高度和宽度),而且BPCA通过合并所有块的内容获得一个散布矩阵,根据这个散布矩阵计算单个投影矩阵,用于转换块。本文为每个块的内容计算一个独特散布矩阵,并将每个块转换为唯一的且包含那个块大部分信息变化的子空间。与BPCA不同,本文方法能灵活使用各种数目的特征向量,从各种块中构建特征矩阵。与其他方法不同,本文使用一种最近邻集成分类器,每个分类器对应一个块,并决定训练集中输入图像和每个对象之间的相似度,相对于其对应块的内容。通过聚合从所有分类器获得的分数做出最终决策,每个分类器对最终决策的影响正比于其输入块内容中的类之间相似度。在ORL、Yale、FERET和Essex四个人脸数据库上的实验评估了本文方法。实验结果表明,本文方法使用与(2D)2PCA相同数目的系数表示特征矩阵,在识别精度方面优于(2D)2PCA。
1 算法提出
1.1 训练
本文运用分块特征提取方法,受人类识别人脸时的自然方式启发,使用人脸和已知人脸局部脸部特征之间的相似度(如眼睛、鼻子等之间的相似度)。以这种方式可以识别人脸,即使人脸没有曝露出来。为此,本文方法首先将每幅图像划分成一个预指定数目的非重叠块,每个块包含图像的一些局部特征。然后,利用(2D)2PCA将每个块的内容转换到一个子空间,该子空间保存那个块的大部分信息变化,使用小数目系数表示,而消除了那些轻微和非常轻微的变化。以下两个步骤表示该过程。
1.1.1 图像分块
令Ai∈RH×W表示第i幅采样图像,划分Ai的图像矩阵成Nb=DH×DW个块,其中,DH和DW是垂直方向和水平方向上分割的数目,如式(1)所示。分别利用w=W/DW和h=H/DH计算每个块的宽度和高度。
B(2D)2PCA的基本假设是图像中的人脸承受轻微的位置变化,且各种图像中对应块包含相同特征。因此,为了提高该方法对位置变化的鲁棒性,块的尺寸大一些会比小块更好,然而,最佳块大小最终取决于每个特定数据库的特征。
1.1.2 提取特征
划分图像后,使用(2D)2PCA减小每个块的大小,而保留它的大部分信息变化,通过投影块矩阵到2DPCA同时左乘和右乘投影矩阵,定义Gp,q∈Rw×w和G'p,q∈Rh×h为:
式中,。通过选择对应于Gp,q和G'p,q的dp和d'p特征向量分别构建PCA右乘和左乘投影矩阵Wp,q和Zp,q:
式中,Wip,q和Zip,q是对应于Gp,q和G'p,q第i个最大特征值的特征向量,手动设置或可替代性设置用于构建投影矩阵Wp,q(Zp,q)的特征向量的数目dp(d'p):
式中,λi是Gp,q(G'p,q)的第i个最大特征值,θ是预指定的阈值。
将每个块Bip,q投影到Wp,q和Zp,q可获得维数较低的新块
将每个块Bip,q投影到Wp,q和Zp,q可获得维数较低的新块
在这种方式下,式(8)对于每一个样本Ai,有相同块数目的特征矩阵如前,但获得的低维的特征矩阵为:
为了转换给定测试图像Xt到特征空间,将Xt划分成Nb个块后,如下计算
1.2 分类
使用一个集成Nb(块数目)个最近邻分类器来确定测试样本的标签,每个分类器对应于一个块,每个分类器在一组置信度下为输入块的每个类进行投票而不是将分类输入块到其中一个类。在这种方式下,对于L类问题,每个分类器产生L个置信度。为了分类输入测试图像,计算每个类的置信度总和,选择总和最大的类作为输出类。
令Cl,k为测试图像相对于块k的内容属于第l类的置信度,定义Cl,k为:
式中,Dl,k指测试图像第k块和第l类图像对应块之间的最小距离,该距离通过下式计算:
式中,‖·‖Fro指的是Frobenius范式。
式(10)中,参数σ是正常量,决定距离Dl,k如何影响置信度,对于较小的σ,置信度对距离更敏感;如果σ接近零,分类过程等同于使用简单多数投票确定随之而来的类的情况,然而简单投票不能产生最优结果。α是一个归一化常量,所有类的置信度总和等于1。
该归一化步骤使得置信度独立于块中距离大小。
通过下式可以获得测试样本到第l类的总置信度:
如果所有类中类l有最大总置信度总和,则指派测试样本给类l,如果多于一个类满足该条件,则从这些类中随机选择测试样本标签。
2 实验
本节给出了本文方法在Yale、ORL、FERET和Essex大学人脸识别数据库上的实验结果。
所有实验中,对所有方法使用Frobenius范式作为距离函数:
式中,F和Fi是Rh×w中两个特征矩阵。
2.1 Yale和ORL数据库上的实验
Yale人脸数据库包括15个个体的165幅灰度图像,对于每个对象,存储了在脸部表情、脸部细节或光照方向上有变化的11幅图像,所有图像的分辨率为243×320像素,如图1所示为Yale人脸数据库上的图像示例。
ORL数据库包含40个个体的400幅灰度图像,每个对象的图像代表脸部一些变化以及情绪表达、脸部细节、尺度和有限的旋转,归一化所有图像到112×92像素的分辨率,如图2所示为ORL人脸数据库上的图像示例。
本文均使用Yale和ORL数据库中的图像,无需重整大小或裁剪。
2.1.1 最佳识别率比较
对于每个数据库,选择每个对象的k(k=2,4,6,8)个样本子集作为训练集,使用剩余图像评估2DPCA[5]、(2D)2PCA[8]、BPCA[12]、LBDPCA[14]和本文提出方法的精度。
为了找到每个方法可以获得的最高识别率,使用k个训练样本,在各种参数设置下重复执行每个方法,并记录获得的最高平均精度。为了获得最佳实验效果,在随机训练子集上重复40次实验。
表1比较了各种方法在Yale数据库上获得的最佳识别率。对于本文方法,本节中所有实验使用243×64像素的块,且σ=250;对于BPCA,块为27×32像素;LBDPCA中参数t设为50。从表1的结果可以观察到:在每种情况下本文方法获得的最高精度,相比所有其他方法在精度方面至少提高4%。
在ORL数据库上的实验,各种参数设置如下:对于本文方法,使用37×92像素的块,σ设置为1000;对于BPCA设置块大小为28×23像素;对于LBDPCA,t等于50。表2显示了在ORL数据库上的实验中每个方法获得的最佳识别率,正如所看到的,本文方法一致优于其他方法约1%。
如图3所示,每种情况的原始测试图像和对象ID如列(a)所示。(2D)2PCA进行特征提取之后,寻找与每个测试图像最相似的训练样本,用于分类给定的人脸,这个阶段发现的图像及其关联的对象ID如列(b)所示。(c和d)使用(2D)2PCA分别对列(a)和(b)中图像重建的图像;(e)原始图像划分成三块;(f)B(2D)2PCA发现的最相似图像;(g和f)使用B(2D)2PCA分别对列(e)和(f)中图像重建的图像块;(a)的左侧上的数字代表测试图像的正确类;(b)右侧的数字是(2D)2PCA确定的错误类;(f)右侧的数字是与列(f)关联的类。正如所看到的,除了列(a)和列(b)图像之间的整体相似度,还有每种情况下(2D)2PCA找到的属于另外一个对象的图像,两组图像样本的重建图像显示在下两列。
下四列解释了对应于B(2D)2PCA各种阶段的图像,正如以前提到的,对于在ORL数据库上的实验,划分图像成三个水平块,列(e)显示了三个测试图像的块内容。提取了每个块的特征之后,发送他们到不同的最近邻分类器。列(f)显示了发现的与测试图像块最相似的图像块。第一种情况(第一行),中间块是(2D)2PCA发现的同一训练图像的一部分,然而,另外两个最近块属于正确对象,因此,该例子中,分块识别有助于正确识别大部分人脸。第二种情况,第一最近块和第二最近块与错误对象关联,只能正确识别第三最近块,然而,第三个分类器产生的置信度足够大能补偿其他两个分类器的错误,产生测试图像的正确分类。第三种情况,三个最近块都与不同对象关联,没有一个是正确的,然而,聚合阶段,仍能够正确分类图像,因为分派图像到正确类别的总体置信度有最小值。图3解释了ORL数据库的三个样本,在其中一个实验中被(2D)2PCA误分类,但本文方法能正确分类。这些例子证明B(2D)2PCA能避免(2D)2PCA可能会犯错误的三种情况。
分块对图像的内部结构产生影响,这是不可否认的,本文方法利用图像重建,一定程度上减小了分块对图像内部结构的影响。从图3可以清晰地看出,使用(2D)2PCA对(a)(b)中图像重建的图像效果并不是很好,而使用B(2D)2PCA对(e)和(f)重建得到的图像明显比(2 D)2PCA的重建图像清晰,而下文的实验结果表明分块的引入明显提高了识别率。由此可见,本文中的分块对图像内部结构的影响并没有影响到识别精度的提升。
图3中第二和第三种情况证明了为什么合并置信度是一个较好的策略,如果使用分类器之间的投票则不能正确分类图像。
这些例子表明特征提取方法如何优于那些基于整体相似度的方法,然而,尚未有证据表明局部脸部特征总是比全局特征有价值,目前本文方法可以使用两种机制提取和使用信息特征。
第一,以任意方式选择块的形状和大小,仅使用包括整个图像的单个块,或划分图像成许多小块。实验表明,最佳策略更可能在这两个极端之间,正如前面所述,最合适的块形状和大小取决于待分析图像的特性,然而本文相信这是一种选择块的好策略,以这样的方式,他们能包含有意义的脸部特征。
第二,当块内容不充实时,它不能对最终决策做出贡献,其原因是本文方法通过合并从每个分类器获得的置信度做出决策,因此,仅当它对应的分类器足够强烈青睐于一个类而不是其他类时,这个块会影响最终决策。与图像之间距离的有关的参数σ可以用来控制置信度的大小。
2.1.2 特征矩阵大小的比较
本节将本文方法与其他方法的特征矩阵大小进行比较,该因子影响存储训练集所需的内存数量以及分类查询图像及处理这个图像所需的时间数量。
表3中,给出了与表1和表2相关的实验中使用的用于表示特征空间中样本的系数的平均数目。本方法在两个数据库上使用的组件平均数目几乎与(2D)2PCA和LBDPCA相同,但显著低于其他方法。
2.1.3 块大小的平均影响
用于划分图像的块大小能显著影响本文方法的精度,必须针对每个特定数据库做出适当的选择,块大小取决于具体数据库的样本特征。
图4、图5解释了使用各种块大小分类Yale和ORL数据库中图像所获得的精度。设置式(6)中θ值为0.96,确定每种情况下特征向量的数目。对Yale数据库,参数σ设置为250,对ORL数据库,设置为1000。每个给出结果是对各种随机选择的训练集40次实验的平均结果。使用243×64像素大小的垂直块能获得Yale数据库上的最佳实验结果,使用37×92像素大小的水平块能获得ORL数据库上的最佳实验结果。从图4的结果可以观察到:本文方法在各种实验设置下都优于(2D)2PCA。
2.1.4 σ影响因子
本节研究了距离敏感参数σ对本文方法性能的影响,为了研究影响因子σ,执行了如下实验:使用每个对象的5幅图像作为训练集,使用剩余图像获得误差率,为每个块大小固定用于构建投影矩阵的特征向量数目,平均在各种随机选择的训练集上的40次实验获得最终误差率。
图6解释了各种σ值和三种不同块大小下每个数据库上的误差率,从图中可以看出,尽管参数σ影响误差率的方式对两种数据库是不同的,但是每个数据库上的识别率变化趋势却是相似的。在ORL数据库上,当σ为1000左右时,每种设置下的误差率都达到其最小值,σ值超过1500时,误差率对σ值则变得不敏感。在Yale数据库上,当σ增加到250时,每种设置的误差率都达到其最小值,而σ值超过20 000时,误差率对σ值则变得不敏感。
2.2 FERET人脸库
实验从FERET数据库选择了150人,每个对象每个人有四个正面视图图像,这1000张人脸图像中包含了部分光线变化和面部表情变化,如图7所示为FERET人脸库上的样本示例。
实验将所有人脸图像转换为灰度,并创建三个不同训练集,由每个对象k幅图像组成(1≤k≤3)。对于大小为k的训练集,使用训练集的前k个元素来选择训练图像。每种情况下,使用剩余图像作为测试集,剩下的作为测试,进行大量的实验,对于每个条件,为了减少识别结果的变化,各种方法的参数设置如下:对于BPCA,使用的块大小为10×10像素;对于B(2D)2PCA,使用的块大小为20×20像素,σ值设为1000;所有方法的特征向量数目通过设置式(6)中参数θ为0.95来确定。在FERET上的识别结果如表4所示,结果表明了本文方法取得了每个训练集上的最高识别率。
2.3 Essex大学数据库上的实验
Essex大学人脸识别数据库包含395个对象的彩色图像,每个对象有20幅图像,划分这个数据成四个子集:94、95、96和grimace。本实验中使用第二和第三子集,如图8所示。Face95代表72个对象的图像,这个子集中的图像是在红色窗帘下采集到的,包含明显的光照变化、人脸位置的一些偏移、脸部表情上的一些变化。Face96包含152个个体的图像,这个子集与Face95之间的主要差异是这个子集中的图像是在复杂背景下采集到的。
实验转换彩色图像成大小为60×60像素的灰度图像,考虑每个对象有2、4、6、8幅训练例子的各种训练集,对于每个大小,随机选择训练样本,使用剩余图像测试本文方法的精度。重复20次这个过程,记录多次执行上的平均识别率。对于所有这些方法,参数设置与FERET人脸数据库上的实验相同。
各种方法获得的识别率如表5、表6所示,结果表明,B(2D)2PCA一致优于其他各个比较方法。
3 结语
本文提出了一种分块(2D)2PCA,并运用它与基于最近邻分类器集成的分类方法进行人脸识别任务。相比本研究测试的其他基于PCA方法,本文方法能获得更好的识别率,类似于(2D)2PCA,它产生小尺寸特征矩阵,而且计算复杂度低于分块PCA,在特征提取方面更具灵活性。本文方法的参数(如块大小和距离敏感度参数)影响其精度,然而,实验结果表明,这些参数的最优值取决于每个特定数据库的特性。最后,本文提出了三种改进方案:1)在本算法的特征提取阶段仅执行无监督分析,使用样本标签可进一步提高精度;2)使用网格分区划分图像成块,运用其他先进策略形成对脸部特征更具代表性的块3)分类阶段为每个分类器获得的置信度安排了相同权重,然而,某些脸部特征对区分不同人脸更重要,预计依据对应块的内容为分类器安排不同权重能产生更好的性能。