步态识别技术方法研究

2024-09-21

步态识别技术方法研究(共7篇)

步态识别技术方法研究 篇1

0 引言

生物特征识别技术是根据每个人独有的、可以采样检测的生理特征或行为特征进行身份识别的技术。第一代生物特征识别技术主要利用人的指纹、脸像等特征进行识别, 这通常要求上体近距离或接触性的协作感知, 在远距离的情况下, 这些特征不可能被利用。

由于个体之间身体结构和运动行为上的基本特性不同, 步态运动为人的识别提供了独特的线索。步态具有非接触性、难以隐藏或伪装、易于捕捉等特点, 且不受距离影响。除了步态本身的特点, PC处理器能力的提升, 高速数据存储设备的出现, 人体建模、运动跟踪等计算机视觉处理技术的提高等因素使得步态识别技术成为一种新的可行的安全应用, 极具研究意义与研究价值。

近几年来步态势识别技术引起了世界各国学术科研机构的广泛的关注。美国国防高级研究所项目署资助的重大项目———HID (Human Identification a Distance) 计划开展的多模态视觉监控技术以实现远距离情况下的人的检测、分类和识别。

1 步态识别过程

步态识别旨在根据人行走时的姿势来进行人的身份认证。步态识别过程可以划分为步态检测、步态特征提取、步态分类与识别三个阶段。

1.1 步态检测

步态检测是从人行走的视频序列中提取步态轮廓区域, 这方面的工作包括背景建模、前景检测和形态学后处理等。步态轮廓的有效分割对于特征提取、分类识别等后期处理非常重要, 因为后续处理过程仅考虑图像中轮廓区域的像素。常用的步态检测方法有背景减除法、时间差分法、光流法等。

1.2 步态特征提取

步态特征主要分为两大类:人体结构特征和运动行为特征。前者反映了人体的几何特性, 如身高和体形;后者主要指行走时的肢体运动参数的变化。步态特征提取的方法主要有基于模型的方法和基于非模型的方法。

1.2.1 基于模型的方法

基于模型的方法是将人体结构或人体运动建模后, 利用二维图像序列数据与模型数据进行匹配以获取特征参数。人的步行存在着携带背包、雨伞等足以改变外形、掩盖部分身体的现象, 在很多运动场合还存在身体自我遮挡现象, 基于模型的方法能够成功解决遮挡问题, 原因在于模型是依赖于图像序列中人的运动模式而建立, 能够反映当前的变化, 还能对过去和将来的变化进行估算。常用的模型主要有:Lee构建的椭圆模型, 即用椭圆来匹配运动人体的二值化侧影的不同身体部位, 以椭圆的质心、离心率等参数反映人体步态特征参数[1];Cunado建立的钟摆模型, 将大腿建模为链接的钟摆, 并从其倾斜角度信号的频率分量中获取步态特征[2];Yoo建立的骨架图模型, 即用直线近似在关节点处所连接的骨骼来表达人体[3]。

1.2.2 基于非模型的方法

非模型的方法是通过对位置、速度、形状等相关特征的预测或估计来建立相邻帧间的关系。例如, Little等[4]利用步态序列图像的光流频率和相位作为特征;Kale等[5]提取人体轮廓图像的宽度向量作为特征;Shutler[6]等引入速度矩作为特征;王亮等[7]提取轮廓点到人体质心的距离向量作为步态特征。

1.2.3 步态分类与识别

步态的分类识别过程, 即采用适当的方法将待识别的步态与步态数据库中的步态模式进行匹配, 通过一定的判别依据决策它所属的类别。考虑到步态的运动特性, 对其分类识别也需要采用基于动态系统的识别方法。

2 结论

美国“9.11”事件之后, 国际社会反恐形势更为严峻, 加强重点场所的安全监测, 提高身份识别能力, 是反恐必不可少的措施。步态可在被观察者没有察觉的情况下进行非接触性的感知和度量, 具有较好的非侵犯性。因此, 从视觉监控的角度来看, 步态识别是非常具有潜力的生物特征识别技术。当前文献报道的各种步态识别方法大多数是在一定实验假设条件下进行测试的, 还没有应用到实际生活中。实际监控场景往往很复杂, 可能存在多个运动物体, 背景图像受天气、光照等外界因素的影响变化较大。以日照条件下运动目标的影子为例, 它可能与被检测的目标相连, 也可能与目标分离。前者, 影子扭曲了目标形状, 使基于轮廓的步态识别方法不再可靠;后者, 影子可能被误认为场景中一个错误的目标。因此, 实现实际场景下的步态检测仍然是一个挑战。

摘要:步态识别是生物特征识别技术的一个新兴领域, 旨在根据人们走路的姿势进行身份识别。本文对步态识别过程的步态检测、步态特征提取、步态分类与识别三个阶段进行了综述, 分析了现有步态识别算法的特点, 总结了步态识别研究存在的问题及未来研究方向。

关键词:生物特征识别,步态识别,步态检测,特征提取

参考文献

[1]L.Lee.Gait analysis for recognition and classification[C]//Proceedings of the IEEE International Conference on Automatic Face and Gesture Recognition.2002.

[2]D.Cunado, M.Nixon, J.Carter.Using gait as a biometric, via phase-weighter magnitude spectra[C]//Proceedings of International Conference on Audio and Video-based Biometric Person Authenticetion.1997.

[3]Yoo Jang-hee, Nixon M S, Harris C J.Extracting Human Gait Signatures by Body Segment Properties[C]//Proceeding of Proc IEEE Southwest Symposium on Image Analysis and Interpretation.2002.

[4]J.Little, J.Boyd.Recognizingm people by their gait:the shape of motion[J].Jouranl of Computer Vision Research, 1998 (2) :2-32.

[5]Kale A, Rajagopalan A, Cuntoor N.Gait based recognition of humans using continuous hmms[C]//Proceedings of IEEE International Conference on Automatic Face and Gesture Recognition.2002.

[6]J.Shutler, M.Nixon.Statistical gait recognition via temporal moments[C]//Proceedings of IEEE Southwest Symposium on Image Analysis and Interpretation.2000.

[7]王亮, 胡为明, 谭铁牛.基于步态的身份识别[J].计算机学报, 2003, 26 (3) :1-7.

步态识别技术方法研究 篇2

根据人的生理特征或行为特征对人的识别技术,在很长一段时间里一直是各个领域科学工作者的研究热点。人脸识别、指纹识别、瞳孔识别越来越常见。但它们都有共同的缺点,那就是都需要近距离或者接触性的感知[1,2,3]。但是人的步态仍是可见的,且可在被观察者没有任何觉察的情况下从不同方向、不同角度进行非接触性的感知和度量。步态识别技术是生物特征识别技术的一个新兴领域。从视觉监控的角度来看,步态是远距离情况下最具潜力的生物特征,从而引起了国内外广大研究者的浓厚兴趣。

1 步态识别技术

步态识别是根据人的步态特征来识别人。它是从有限的图像序列中提取人的特征,进而通过匹配和判定来确定其身份。这是一种新兴的生物特征识别技术,其输入是一段行走的视频图像序列,因而其数据采集具有远距离、非接触、不易伪装等特点。在智能视频监控领域,这项技术比其他识别更具优势。步态是一种复杂的行为特征,犯罪分子可以改变自己的面貌或不让自己的一根头发留在作案现场,但其走路的姿态是很难控制的。因为人们在身高、体重、肌肉、骨骼和视觉的灵敏程度等条件上都存在着差别,所以每个人都有着不同的走路姿势。不管犯罪分子是否带着面具从容地走向银行工作人员还是从犯罪现场逃跑,他们的步态都会让他们露出马脚。

2 步态识别的过程及其技术

2.1 背景提取

要进行有效的步态识别,就要将得到的一系列步态图像(见图1)的背景提取出来。目前最简单的方法是时间平均图像法。首先得到一帧步态图像,其中一点的灰度值为Q(x,y),那么n帧图像在该点的平均灰度值为p(x,y)=Median(Q(x,y)),其中Median()表示取这n帧图像的像素中间值作为背景图像的像素值,p(x,y)为背景图像的像素值。以此计算每点的平均值,就可以得到该视频序列的背景图像。目前很多研究人员都致力于开发不同的目标模型,以减少动态场景变化对运动分割的影响。例如有人提出采用基于卡尔曼滤波的自适应混合高斯背景模型[4],这样可以有效减小光照变化、背景混乱变化等对背景提取的干扰。

3.2运动目标检测与分割

可以利用背景剪除法[5]检测运动区域,从而得到运动目标。为了能得到更好的二值图像,还应该进行必要的差分操作[6]

式中:0≤f(a,b)<1,0≤a(x,y),b(x,y)≤255,a(x,y)和b(x,y)分别是当前图像和背景图像在像素(x,y)点的灰度值。最后可以对图像进行轻微的膨胀和腐蚀,来消除小的空洞和凸起,使人体图像更加清晰,如图2所示。

2.3 步态周期检测

一个人行走呈现的周期性是步态有别于其他运动方式的最大特点。获取一个人的步态周期能规划定义他的行走序列,从而更好地进行识别的研究。一个人行走时的高度变化是有规律的。一般可以认为双脚合拢的时候高度最大,双脚支撑着地的时候高度最小。而连续2个最低高度之间的时间差就是一个步态周期,如图3所示。人走路时的姿势与步幅一般是不同的,所以其周期也不尽相同。

2.4 特征提取

特征提取是步态识别的一个重要部分,它直接关系到最后识别的好坏。目前常用的提取方法有基于特性的特征提取法和基于模型的特征提取法。基于特性的提取法,最典型的是基于下肢角度特征的步态识别方法。此方法是计算相邻关节点连线与竖直线的夹角,以此作为下肢角度进而作为步态特征。通过分析、提取一个步态周期的下肢角度变化序列作为特征向量来表达步态,最后通过对比下肢角度的周期变化来识别目标人物。在基于模型的特征提取中,所使用的模型大致有Lee[7]构建的椭圆模型:就是将得到的人体侧面图像分成7个部分,用椭圆对每个部分建模,以质心、离心率等位参数反映人体步态的特征。还有Nash构建的人字型模型,Cunado建立的钟摆模型,Niyogi的时空切片方法和线性模型等。

总的来说,人体的特征提取方法主要从下列几个方面入手:基于“从行走运动的时空模式中可学习人体的外观模型”,基于“人体行走运动很大程度上依赖于轮廓随着时间的形状变化”,基于“行走运动的关节角度变化包含着丰富的个体识别信息”等。每个方面都有自己的实现方法和特点,在不同的背景下选择不同的特征提取方法。

2.5 识别

识别是整个过程的最后一步,将待测序列的特征与样本特征进行对比,从而完成识别任务。在将图像序列转换成一组静态形状模式后,设计一个好的分类器来进行识别是解决问题的关键。一些常用的分类器有最近邻距离分类器、人工神经网络分类器、支持向量机分类器[8]等。设置好一个分类器后,将处理好的静态形状图像与预先存储的行为标本比较。将相似度作为分类的标准,最后采用最近邻算法[9]进行识别。

3 步态识别在视频监控中的应用

智能监控将计算机视觉和模式识别结合起来,从而实现监控的智能化[10]。智能监控技术能够理解视频图像中的内容,对序列中的目标进行自动检测、跟踪和识别,过滤掉对用户无用的信息。

智能化是视频监控的必然趋势。特别是“9.11”恐怖袭击以后,出于国家安全、反恐等方面的需要,各国政府已经将对智能监控技术的研究上升到了国家战略高度。我国在智能监控方面也给予了高度的重视,特别是“863”项目以及公安部“3111”试点工程的开展,使中国城市报警与视频监控技术都有了长足的发展。而在智能视频监控里步态识别又发挥其显著的特点,可以在远距离实时监控和分析目标,从而判断其身份及行为目的。如在银行大厅,当发现有人急速快跑则对其跟踪并进行全身细致拍摄以存为资料。如果发生事态可以及时查阅,必要时进行预警。

在美国,步态识别技术已经应用到医疗方面[11]。通过对病人步态的分析,可以得到其骨骼及走路姿态的微妙变化。以此可以及早发现异步病态、偏瘫等疾病,而且对诊断和康复也起到了显著的辅助作用。在现代化的体育训练中,也可以通过步态特征来监测运动员的体能消耗情况、动作准确程度等,以此来制定科学的训练方案。此外,步态识别在机器人行走等科学研究上也占有举足轻重的地位。

在2010年上海世博会上,步态识别技术发挥了巨大的作用。该技术在远距离将每一个靠近世博场所的人都“还原”成他(她)本来的面貌,从而有效预防了犯罪分子进入世博场地。此外,通过集合智能监控系统还能够自动锁定可疑对象,并对其实施持续监控。当可疑分子进入监控范围时,该系统在屏幕上用“!”标注。当可疑分子继续前进时,系统将警戒级别升到“!!”。当可疑分子靠近核心区域时,系统开始报警。多个摄像头协调作用,能够完整地绘制出可疑分子的前进路线图,提供给安保人员分析。

2007年中国科学院自动化所参与的国际科技合作重点项目“人的运动与行为分析”通过了验收。该项目以步态识别与视频多媒体管理为应用背景,在背景建模、目标检测与跟踪、目标分类识别等方面取得了具有自主知识产权的科研成果,在智能交通、安全监控等领域都具有广泛的应用前景。

随着中国铁路建设的快速发展,铁路向多层次、全自动化等方向发展,而整个监控体系也随之发生变化。青藏线、京沪线等大型铁路系统就成功更新了视频监控系统,其中步态识别的增加是其更新的一项重要内容。可以看出,以步态识别为基础的入侵检测、特殊目标场景的监视和识别在中国监控体系中正发挥着越来越重要的作用。

4 小结

步态识别作为生物特征识别领域的一个重要分支,已经引起了广大研究者的兴趣。但是由于步态识别序列图像的数据量较大,因此计算复杂度较高,处理起来也比较困难。尽管生物力学中对人体步态进行了大量的研究工作,基于步态的身份识别研究却是刚刚起步。另外,迄今所有数据库的图像都是二维的,并且很大程度上取决于摄像机的角度。所以基于步态的身份识别还有广阔的研究前景,需要广大科学工作者继续在该领域探索和发展。

参考文献

[1]LIU Chengjun,WECHSLER H.Gabor feature based classificationusing the enhanced fisher linear discriminant model for facerecognition[J].IEEE Trans.Image Processing,2002,11(4):467-476.

[2]梅中玲.指纹识别技术及其应用[J].中国人民公安大学学报:自然科学版,2008(2):81-84.

[3]DAUGMAN J.How iris recognition works[J].IEEE Trans.Circuits andSystems for Video Technology,2004,14(1):21-30.

[4]李全民,张运楚.自适应混合高斯背景模型的改进[J].计算机应用,2007,27(8):2014-2017.

[5]刘丽娜,吴清江.基于角度特征分量特征的步态识别[J].计算机与数字工程,2010,38(3):135-138.

[6]王亮,胡卫明,谭铁牛.基于步态的身份识别[J].计算机学报,2003(3):353-360.

[7]SHUTLER J D,NIXON M S.Zernike velocity moments for descriptionand recongnition of moving shapes[C]//Proc.BMVC,2001.Manchester:[s.n].,2001:705-714.

[8]路远.基于模糊支持向量机的步态识别[J].计算机工程,2009(21):189-191.

[9]胡萍.基于人工神经网络和最近邻算法的实例检索模型[J].组合机床与自动化加工技术,2008(12):4-7.

[10]郑世宝.智能视频监控技术与应用[J].电视技术,2009,33(1):94-96.

基于下肢角度特征的步态识别方法 篇3

人的步态是自身生理结构、行为习惯、心理状态等诸多因素在行走时的外在综合表现。由于个体之间存在差异,步态亦不尽相同,故步态特征可以为人的身份识别提供独特的线索。步态特征既包括身高、体形等基于几何度量的特征,也包括对行为变化较敏感的运动学特征,如关节点的运动轨迹及位移速度、肢体关节角度等。直观上,人类视觉对步态的识别很大程度上依赖于人体轮廓形状随时间的变化过程[1],因此,现有的步态识别方法大多基于人体轮廓特征。文献[2]应用傅立叶描述子描述人步行时的轮廓特征,利用模板匹配法获取待测样本与训练样本的相似度,最后采用最近邻分类器进行决策;文献[3]利用人体二值图像的侧面外轮廓宽度矢量作为步态特征,使用隐马尔可夫模型(HMM)进行步态识别;文献[4]提出一种是基于Procrustes形状分析的步态识别方法,利用统计形状分析提取步态特征向量,分别采用最近邻分类器、K近邻分类器及最近标本分类器进行分类识别。

上述方法经实验验证是成功的,但存在一定不足:人体轮廓特征虽然能反映运动人体的形状变化,但无法直接表达步态的运动特性,属于步态的低层信息;而且人体轮廓形状容易受服饰改变、外物遮挡等因素的影响,识别性能很不稳定;在分类识别方面,上述方法采用的是最简单的模式分类方法,如最近邻分类器、隐马尔可夫模型等,其共同理论基础是经典统计学,采用的是样本数目趋于无穷大时的渐进理论,但在实际问题中,研究样本的数目是有限的,因此这些分类方法的分类效果并不十分理想。

针对这些问题,本文提取一个步态周期内的下肢角度变化轨迹构造步态特征向量。下肢角度是重要的步态运动学参数,能有效反映步态运动的细微变化,相较于人体轮廓,包含了更丰富的步态模式变化信息。在获得了有效的特征向量之后,关键问题是设计具有良好分类能力的分类器。支持向量机无需先验知识,与传统的模式识别方法相比具有推广性能强、能保证全局最优等优点,故采用支持向量机与最近邻分类原则相结合的策略进行分类决策。

1 步态特征提取

1.1 步态检测

采用中值法[5]估计图像序列的背景帧;然后使用背景减除法检测图像中的运动目标,并在设定的阈值下对图像进行二值分割。二值化后的图像会出现噪声,使用3×3的腐蚀和膨胀滤波算子去除噪声点,并执行连通性分析进一步填充小的空洞。对预处理后的二值图像进行边界跟踪,即可获得人体外轮廓边界线。

1.2 下肢关节点定位

在人体轮廓图像上定义一个能包含整个人体的最小矩形框,如图1所示,人体身高即为矩形框的宽度,记为H。根据图2给出的解剖学中人体下肢比例关系[6],可以确定盆骨、膝、踝关节点的纵坐标分别为:Y1=0.53H、Y2=0.285H、Y3=0.039H。各关节点横坐标的定位过程如下:

1)盆骨关节点:从左至右水平扫描轮廓图像的第Y1行,记录像素值为1的点的坐标。由图1可知,这样的点有两个,分别位于盆骨点左右两侧的轮廓边界线上,其横坐标分别记作X1l、X1r;盆骨关节点的横坐标X1可用下式计算:

2)膝关节点:需要确定左、右膝关节点的位置。以坐标点(X1,Y2)为起始位置,分别向左、右两侧水平扫描轮廓图像的第Y2行;然后按步骤1的相同方法得到左、右膝关节点的横坐标值。

3)踝关节点:定位方法类似于步骤2。

人在行走时,膝、踝关节点在某些时刻会出现自遮挡现象,此时无法检测出它们的位置。本文采用插值的方法获得近似的关节点位置。同一步态序列中,插值公式为:

其中下标n、n+1分别代表第n帧和第n+1帧步态图像,第n+2帧为遮挡点所在的帧,(x,y)表示关节点的坐标。

1.3 下肢角度计算

得到各关节点的坐标后,用直线连接相邻关节点以代表人体下肢,如图1所示。下肢角度可以用关节点连线与竖直线的夹角表示。如图3所示,设人体的左大腿、右大腿、左小腿、右小腿与竖直线的夹角分别表示为:θ1、θ2、β1、β2,使用下面的公式可以计算任意一个下肢角度α:

其中(x,y),(x',y')分别表示任意两个相邻关节点的坐标。

步态运动是一种时空相关的行为模式,有效的步态描述不仅需要包含丰富的步态空间特征,还应描述步态随时间的变化信息。步态的时间特性体现在一个步态周期内步态的变化。因此,对每个步态序列,使用一个步态周期的四个下肢角度变化序列作为步态特征矢量D,则D记为:

本文通过分析运动人体轮廓的宽度和高度信号来实现步态周期检测。从人体侧影图像序列可以看出,人在行走过程中,其侧影轮廓宽度会呈现出周期性的变化,即从最大值到最小值再到最大值;而人体的高度变化却很小。因此,本文利用运动人体轮廓的宽度与高度之比进行步态周期分析。图4为运动人体轮廓的宽高比随时间变化的曲线图,定义一个步态周期T为相邻的三个波谷之间的时间间隔。

2 分类识别

2.1 支持向量机的基本原理

支持向量机(support vector machine,SVM)是一种泛化能力很强的分类器,建立在统计学习理论的VC维理论和结构风险最小原理基础上,主要用于解决小样本、非线性及高维模式识别问题[7]。在模式识别方面,对于手写体识别、语音识别、人脸识别等问题,SVM算法的精度已超过传统学习算法。

支持向量机理论的主要思想是寻找一个满足分类要求的最优分类超平面,该超平面在保证分类精度的同时,能够使超平面两侧的空白区域,即分类间隔最大化[8]。这里,最优超平面的构造问题实质上是约束条件下求解一个二次规划问题,其最优分类函数为:

其中sgn()是符号函数,K(xi,x)表示核函数,n为训练样本的个数,yi∈{-1,+1}是特征空间的类标记,b是分类阈值。在分类函数中,某些xi对应的αi为0,某些xi对应的αi>0,这些具有非零值的αi对应的向量支撑了最优分类面,被称为支持向量。

对于线性问题,核函数K(xi,x)就是两向量的点积运算;对于非线性情形,由核空间理论,首先通过非线性变换将输入空间变换到一个高维空间,然后在这个新空间中求取最优线性分类面,而这种非线性变换是通过定义适当的核函数实现的。不同的核函数将形成不同的SVM算法,目前常用的核函数主要有多项式、径向基函数和Sigmoid函数等[9]。

2.2 基于支持向量机的步态识别

SVM本质上是一种二分类方法,而步态识别是一个典型的多分类问题,为此,本文采用“One-against-Rest”(即“一对多”)方案,通过构造多个SVM二值分类器来达到多分类的目的。

假设待识别的步态有m类,分别记为C1,C2,…,Cm,构造m个SVM分类器Si(i=1,2,…,m)。对每个分类器Si,用其中的一类样本Ci作为正样本进行训练,余下的所有样本Sj(j≠i)作为负样本进行训练。对于正样本,系统输出+1,而负样本输出为-1。测试时,将每个测试样本输入到这m个分类器中,如果只有一个分类器Si输出为+1,则将该样本判定为第i类;若有P(P>l)个分类器输出为+1,再利用最近邻分类原则,即计算测试样本与这P个分类器所代表的训练样本之间的距离,将测试样本判别为距离最小值对应的那个步态类别;如果所有分类器输出都是-1,则判定本次识别错误。

3 实验

3.1 实验过程

采用中科院自动化所提供的CASIA步态数据库检验算法的有效性。步态数据集为Dataset B中0度视角下20个人的正常状态行走序列。每人有6个步态序列,取前3个序列进行训练,后3个序列用于测试。对于其他视角、其他行走状态下的实验,有待于进一步的研究工作。

训练时,先对训练集中每个步态序列进行步态检测,以获取人体轮廓的二值图像;然后对每帧图像提取四个下肢角度,使用一个完整步态周期内的四个角度序列构建步态特征向量;最后用这些步态特征参数训练SVM分类器,采用的是多项式核函数:

测试时,对每个测试样本,使用与训练过程相同的方法提取步态特征向量;然后用训练好的SVM分类器按照2.2节所述方法进行分类决策。

为了对不同的模式分类方法进行比较,实验还选取最近邻分类器(NN)和K近邻分类器(KNN)对算法进行验证。对于NN测试,每个样本被分到离它最近邻居所属的类中;对于KNN测试,取K=3,即找到离测试样本最近的三个邻居点,并选择主要的类,如果没有主要的类,就简单使用最近邻规则。

3.2 实验结果

表1显示了分别采用NN、3NN、SVM三种分类器的正确分类率(CCR)。很明显,对于使用相同特征提取方法所获得的样本特征序列,采用SVM分类器的识别性能比NN分类器和3NN分类器有大幅度提高。这表明更成熟的分类器将大大提高分类能力,也进一步证明利用支持向量机进行步态识别的优越性。

为了全面地报告方法的性能,实验还计算了在不同阈值下的错误接受率(FAR)和错误拒绝率(FRR),得到相应的ROC曲线,如图5所示。从图中可以得到:基于NN分类器、KNN分类器、SVM分类器的ROC曲线等概率点ERR值分别为14%、12%、8.2%。可见SVM分类器的校验性能也优于另两个分类器,同时也体现出SVM分类器所具有的良好推广性能。

3.3 方法比较

目前国际上还没有建立通用的步态测试数据库,故使用本文的步态数据集对几种代表性的步态识别方法进行验证,所得的实验结果如表2所示。为了公平起见,采用与本文相同的步态检测方法(即背景减除法)对每个步态序列进行预处理。

通过比较可知,本方法的识别性能明显高于其他文献中的方法。这主要是因为文献[2]、文献[4]的方法是利用人体轮廓特征进行步态识别,而本文则提取更能反映步态运动本质的下肢角度作为步态特征,可以更有效地描述步态模式的细微变化。文献[10]将腿部运动设定为一个链接的钟摆运动模型,然后提取盆骨的起始位置、盆骨位移速度以及股的转动作为步态特征;虽然同样利用下肢运动特征进行步态识别,但在识别时采用的仍是简单的KNN分类器和NN分类器;而本方法采用具有强大分类能力的支持向量机进行分类决策,故识别效果更理想。

4 结论

针对现有步态识别方法的不足,提出一种基于下肢角度及支持向量机的步态识别方法。通过对步态序列图像的运动分析,分别确定盆骨、左右膝、左右踝关节点的位置,然后提取一个步态周期的下肢角度变化轨迹作为步态特征,充分体现了步态运动的时空特性。识别时,采用了在小样本问题上很有优势、兼顾训练误差和泛化能力的支持向量机,能有效克服目前常用的步态分类器的不足,获得更好的分类效果。CASIA数据库上的仿真结果表明,本方法能获得令人满意的识别性能。

本方法也存在一些局限,如背景简单、视角单一、小规模的评估数据库等,因此下一步的研究将考虑视角变化对步态识别的影响,并在大规模、复杂背景下的步态数据库中进行算法验证,以提高算法的鲁棒性。

摘要:基于人行走时的下肢角度变化包含丰富的个体识别信息的观点,提出利用下肢角度特征进行步态识别的新方法。对每个步态序列,依据人体解剖学的先验知识定位下肢关节点,计算相邻关节点连线与竖直线的夹角,以此作为下肢角度;通过步态周期分析,提取一个步态周期的下肢角度变化序列作为特征向量表征步态。最后,采用针对小样本问题具有很好分类效果的支持向量机技术实现步态的分类决策。CASIA步态数据库上的仿真结果证明本方法具有较高的识别性能。

关键词:步态识别,支持向量机,下肢角度,轮廓特征,步态周期

参考文献

[1]王亮,胡为明,谭铁牛.基于步态的身份识别[J].计算机学报,2003,26(3):1-7.

[2]Collins R T,Gross R,Jianbo Shi.Silhouette-based human identification from body shape and gait:Proceedings of International Confer-ence on Automatic Face and Gesture Recognition[C].Washington DC,USA:[s.n.],2002:351-356.

[3]Kale A,Cuntoor N,Yegnanarayana B,et al.Gait analysis for human identification:Proceedings of the Fourth International Conference on Audio-and Video-Based Biometric Person Authentication[C],Guildford,UK:[s.n.],2003:706-714.

[4]Liang Wang,Huazhong Ning,Weiming Hu,et al.Gait recognition based on procrustes shape analysis:Proceedings of the Ninth IEEE International Conference on Image Processing[C],Rochester,New York:[s.n],2002:22-25.

[5]田见光,赵荣椿.步态识别综述[J].计算机应用研究,2005,11(5):20-23.

[6]Yoo J H,Nixon M S,Harris C J.Extracting Human Gait Signatures by Body Segment Properties:Proceedings of the Fifth IEEE South-west Symposium on Image Analysis and Interpretation[C],[S.l.],[s.n.],2002:35-39.

[7]边肇棋,张学工.模式识别[M].2版.北京:清华大学出版社,2000.

[8]刘向东,陈兆乾.基于支持向量机方法的人脸识别研究[J].小型微型计算机系统,2004,25(12):2261-2263.

[9]柳元春,马树元.支持向量机研究现状[J].中国图象图形学报,2002,7(6):618-623.

步态识别技术方法研究 篇4

目前,研究身份识别的方法有很多,主要包括人脸识别方法、瞳孔识别、鼻纹识别、步态识别等,相关研究也取得了一定的成果,其中,文献[6]提出一种基于局部二值模式的人脸识别方法,采用主成分分析和稀疏编码分类相结合的方法对人的身份进行识别,但该方法容易受到人脸部图像的拍摄位置和角度敏感的影响,很难实现高精度的动态身份识别; 文献[7]提出基于图像静态特征的身份识别方法,该方法采用纯色背景,对人的身体区域图像进行采集,经二值化处理后对图像进行分块处理获取100 个特征值,从而实现身份识别,但该方法建立的神经网络结点数过多,容易受到光的影响,使鲁棒性降低,也无法完成动态识别; 文献[8]提出一种远距离量度变换和尺度不变特征匹配的身份识别方法,通过两种方法的共同作用实现身份识别,但该方法过分依赖图像特征的采集,对光线变化较为敏感,也大幅限制了动态识别的应用性; 文献[9]提出基于头顶点三维运动轨迹的身份识别方法,从头顶点三维运动轨迹采集人体侧视平面上的人体身高波动信息,实现身份识别,但该方法存在实现过程复杂的弊端; 文献[10]提出基于小波分解的身份识别方法,将小波特征和融合特征作为特征向量,通过相关系数阈值法实现身份识别,但该方法存在效率低下、实现时间长的弊端。

1 基于三维动态步态的身份识别方法

通过分析以上方法的弊端,提出基于三维动态步态的身份识别方法,对人体三维轮廓进行提取,在此基础上,继续提取三维动态步态特征,依据该特征,通过欧氏距离度量和分类器实现身份识别。仿真实验结果表明,所提方法具有很高的识别精度和识别效率,性能较优。

1. 1 三维步态轮廓的有效提取

对步态特征轮廓进行提取是完成识别的第一步。首先以采集的步态图像帧为单位,通过立体视觉技术从立体图对各采样时刻运动人体的三维步态轮廓信息进行提取,提取结果如图1 所示,详细提取过程如下。

( 1) 随机采集人体运动图像中,腿部左轮廓上的一点,获取以其为中心的匹配模板以及相应的特征。

( 2) 依据上述过程匹配出的点对腿部右轮廓图像待匹配点的初始值进行预测,同时沿极线滑动和步骤( 1) 中的点进行模板匹配,获取相关函数序列。

( 3) 将步骤( 2) 中的相关图像序列进行拟合,得到二次特征曲线,找出和二次曲线极大值相应的点,将其和步骤( 1) 中相应的匹配点找出。

( 4) 逆时针方向逐次遍历左轮廓图像的全部轮廓点,按照步骤( 1) ~ 步骤( 3) 的过程进行立体匹配。

经上述立体匹配后,左右轮廓中每两个步态特征匹配点之间均构建了某种对应关系,将上述对应关系和立体视觉标定获取的摄像机内外参数结合在一起,即可获取这两个点在现实世界中相应的世界坐标。分别用( xil,yil) 和( xir,yir) 描述左图像和右图像上依据立体匹配过程得到的一对轮廓点,则可通过式( 1) 计算出人体三维立体轮廓点( xiw,yiw,

式( 1) 中b用于描述基线距离; fl、fr分别用于描述经标定后的左右摄像机焦距长度; ( x0,y0) 用于描述图像中心; ( αx,αy) 用于描述像素的行间距和列间距。

针对一个采集的步态图像对左右轮廓图像中全部轮廓点对依次进行三维重建,即可获取一个三维步态轮廓点序列,设为

式中N用于描述完全匹配的步态特征轮廓点数量,而Di=(Xi,Yi,Zi),i=1,2,…,N,则用于描述匹配出的轮廓点集。则人体三维立体步态轮廓可描述成

式( 2) 中S( t) 用于描述t时刻的人体三维立体轮廓。而三维立体步态特征轮廓序列则可描述如下。

1. 2 三维步态特征的提取过程分析

1. 2. 1 人体二维步态特征的提取

对人体步态三维轮廓进行提取后( 图1) ,需要完成分割图像,获取可用来辨别的三维人体行走步态特点。在人们活动的进程里,形成步态特点差别的关键是在于自身腿部特点的个性差异,这也是识别的根本,可将行走中的这种个体差异特征,看作是识别个人信息的关键依据。

首先沿图像中人体轮廓( 即顺着边缘) 提取一维间隔信号,获得间隔信号的最小值与次最小值。将最小值点与次最小值点作为人体两脚的位置点。两点间的欧氏距离为步间距离,此距离可看作是测试者步态识别的特征向量( 图2)

利用三维坐标系得到测试者的脚点坐标,再依据生理解剖学原理,获得测试者膝关节、胯部的二维坐标,脚点、膝关节和胯部坐标分别以( x1,y1) ,( x2,y2) ,( x3,y3) 表示,同时对上述原始二维步态特征进行保存。

1. 2. 2 动态变化特征的生成

假设步态图像中特征点构成的解析几何投影模型为

式( 4) 中f( x) 用于描述三维环境下物体的特征点x = ( x,y,z) 到二维步态图像里的二维坐标点xi= ( xi,yi) 的摄像转换,经过小孔摄像机的投影转化模型可以表示实际环境里的透视变换模型。物体点及图像点坐标系的原点都处在同一二维图像平面中,存有特定的统一性,包括xi、xc与x的3D步态情况,能表述人体步态的转化模型。不同步态间具备特定的共线性,则有:

式( 5) 可转换成

展开式(6)有

实际应用中,动态三维坐标系中的任意一点通过下述过程即可转换成投影中的点q( r,t) : 首先对实际动态三维坐标系中的点qs( xs,ys,zs) 进行旋转和平移,获得这个点在摄像机下的摄像机坐标是qh( xh,yh,zh) 。E用来表示旋转变化矩阵,G表示平移转换矩阵。使用摄像机旋转矩阵U把摄像机坐标qs( xs,ys,zs) 投影到平面里,点q( r,t) 是用来实行表示方法如式( 8) 所示。

假设步态图像里的特点点数据,获得上面所述解析的E,U,G 3 个转变矩阵变化,那么有几何转换特点模型

式( 9) 中J用于表示二维步态图像的帧数; Ej ×3为经过J帧图像旋转组成的矩阵,矩阵里各行元素区分成矩阵绕x、y、z轴旋转的角度,Gj ×3为经过J帧图像平移组成的矩阵,B3 ×4总共包括4 个点的三维坐标,它是参数练习进程里形状基点的初始值。U3 ×2的第一列是摄像机的旋转矩阵,矩阵里3 个元素区分为矩阵绕x、y、z轴旋转的角度,次列没有意义。经过非线性优化算法对上面所述矩阵实行改进的进程里,各矩阵的原始值能随机生成。

2 识别过程的实现

完成三维动态步态特征的提取后和几何特征模型的转换后,依据欧氏距离度量,通过最近邻分类器( NN) 和最近模板分类器( TNN) 实现身份识别。

假设P1,j和P2,j分别用于描述经上节得到的两个步态特征序列,N1、N2分别用于描述其长度,则其样本序列均值可描述成

上述二者之间的欧式距离可通过式( 12) 求出

给出一个低维流行中长度为NI的步态序列PIj,在完成最近邻分类的过程中,首先求出其样本序列均值

然后求出SI到全部训练样本集的样本序列均值之间的欧氏距离,将欧氏距离最小的一类看作是PIj的归属类。

将样本序列模板均值看作是类匹配模板来计算欧氏距离,假设是第S个人的I个步态序列,则样本总数可描述成

则第S类的样本序列模板均值可描述成

针对最近模板分类器( TNN) ,将所有样本序列被划分至离其最近的样本序列模板均值所属的类中,实现身份识别。

3 仿真实验结果

为了验证本文提出的基于三维动态步态的身份识别方法的有效性,需要进行相关的实验分析。实验将文献[6]的识别方法当作对比实行解析。

把Little和NLPR数据库作为研究对象进行实验。Little数据库是一个由5 个人各自6 个步态序列构成的数据库,其采集速度为30 帧/s,分辨率可达335 × 175。NLPR数据库为侧面视角库,该数据库共含有10 个人,每人4 个序列,采集速度为25帧/秒,分辨率为360 × 2 500。采集得到的不同角度的三维步态特征结果如图3 所示。

分别采用本文方法和文献[6]方法在不同的数据库中进行身份识别,得到的识别率比较结果分别用表1 和表2 进行描述。

分析表1、表2 可以看出,无论是Little数据库还是NLPR数据库,本文方法的识别率均高于文献[6]方法,并且针对NLPR数据库,虽然本文方法和文献[6]方法的识别率均较Little数据库有所降低,但本文方法的降低幅度显著低于文献[6]方法,验证了本文方法的有效性。

为了能更好地证明本文方法的有用性,经过对错误接受率FAR ( false accept-ance rate) 和错误拒绝率FRR( false reject rate) 进行计算,获得ROC ( receiver operating characteristic) 曲线,用来衡量两个算法的性能。错误接受率就是把冒充者辨别出真正的生物特点所有者; 错误拒绝就是生物特点所有者被拒绝。在现实使用中,上面所述两个指标是有关的,在错误拒绝率较低的状况下,错误接受率较高,所以,经常需要在两个错误率间选取一个折衷,而ROC曲线正好能表示两个错误率间的联系。图4 表示的是使用本文方法与文献[6]方法获得ROC曲线。

分析图4 可以看出,采用本文方法的ROC曲线相对较平稳,而采用文献[6]方法的ROC曲线波动较大,说明文献[6]方法的错误接受率和错误拒绝率均较高,进一步验证了本文方法的有效性。

分别采用本文方法和文献[6]方法进行10 次身份识别实验,将两种方法的准确率和耗时进行比较,得到的结果见表3。

分析表3 可以看出,本文方法能够以较高的可靠性对身份进行识别,10 次实验的识别准确率和耗时均优于文献[6]算法,证明本文方法可以满足及时辨别的要求。

4 结论

提出一种基于三维动态步态的身份识别方法,以图像帧为单位,通过立体视觉技术从立体图对各采样时刻运动人体的三维轮廓信息进行提取,提取人体步态三维轮廓后,对其进行分割,提取人体行走的步态特征。将测试者腿部特征看作是识别个人信息的关键依据,分析了物体与图像之间变换的几何模型,给出动态三维步态特征的转换过程,依据欧氏距离度量,通过最近邻分类器和最近模板分类器,将所有样本序列被划分至离其最近的样本序列模板均值所属的类中,从而实现身份识别。仿真实验结果证明,本文方法具备较高的辨别准确度及辨别效率,性能较优。

摘要:根据步态识别人身份的研究中,由于二维步态特征无法完全表示人体特有的动态步伐特征,导致识别受限。提出基于三维动态步态的身份识别方法,以连续步态图像帧为单位,通过立体视觉技术从二维图对不同采样时刻的运动人体三维步态轮廓信息进行提取,提取人体步态三维轮廓后,对其进行无关区域分割,获取和人体行走相关的步态特征。通过构建步态特征变换的几何模型,给出动态三维步态特征的转换过程,依据欧氏距离度量,根据结果实现身份识别。仿真实验结果表明,所提方法具有很高的识别精度和识别效率,性能较静态方法有较大的改善。

关键词:三维图像,动态步态,身份识别

参考文献

[1]孔英会,陈佩瑶.基于视频的人脸和步态自适应融合身份识别.电视技术,2015;(05):137—141Kong Yinghui,Chen Peiyao.Based on the video of face and gait identification adaptive fusion.Journal of TV Technology,2015;(05):137 —141

[2] 汪西原,闫辉.一种新的基于不变矩的步态特征身份识别算法.电视技术,2014;(05):169—172Wang Xiyuan,Yan Hui.A new gait feature identification algorithm based on invariant moments.Journal of TV Technology,2014;(05):169 —172

[3] 彭鑫.一种基于稀疏矩阵的指纹识别新方法.电子设计工程,2014;(23):54—55Peng Xin.A new method for fingerprint recognition based on sparse matrix.Journal of Electronic Design Engineering,2014;(23):54 —55

[4] 王运成.基于动态二维图像序列的三维步态识别方法.科技通报,2013;(10):186—188Wang Yuncheng.Two-dimensional image sequence based on dynamic three-dimensional gait recognition method.Science and Technology,2013;(10):186—188

[5] 孟庆鑫,李志瑶.基于三维动态捕捉系统和Matlab的穿戴式下肢外骨骼步态分析.长春大学学报,2013;(12):1576—1578Meng Qingxin,Li Zhiyao.Based on the three dimensional dynamic capture system and Matlab wearable lower limb exoskeleton gait analysis.Journal of Changchun University,2013;(12):1576—1578

[6] 李锐,陈勇,余磊.基于帧差能量图行质量向量的步态识别算法.计算机应用,2014;34(5):1364—1368Li Rui,Chen Yong,Yu Lei.Based on frame difference energy figure line quality vector of gait recognition algorithm.Journal of Computer Applications,2014;34(5):1364—1368

[7] 侯一民,刘凤.基于Procrustes均值形状和Fan—Beam变换的步态识别.制造业自动化,2013;(14):1—3Hou Yimin,Liu Feng.Based on the mean Procrustes shape and FanBeam transformation of gait recognition.Journal of Manufacturing Automation,2013;(14):1—3

[8] 张善文,张传雷,黄文准.基于最大最小判别映射的煤矿井下人员身份鉴别方法.煤炭学报,2013;38:1894—1899Zhang Shanwen,Zhang Chuanlei,Huang Wenzhun.Discriminant mapping based on maximum minimum identification method of the mine personnel in coal pit.Journal of Coal,2013;38:1894—1899

[9] 周伟芳,叶学义,何文韬,等.基于SVM特征层融合的集成性身份识别模型.计算机应用与软件,2013;(9):81—83Zhou Weifang,Ye Xueyi.He Wentao,et al.The integration of identity recognition based on SVM feature layer fusion model.Journal of Computer Applications and Software,2013;(9):81—83

步态识别技术方法研究 篇5

步态识别旨在利用人们的走路姿势来进行身份的识别。目前,步态识别的方法大致分为2类:基于模型方法和非模型方法。基于模型方法需要事先建立人体的结构或运动模型[1,2],如庄月挺[3]等建立的人体三维棍状模型等。这种方法直接从建立的模型中获得步态特征,但匹配和搜索过程较复杂。非模型方法直接从人体轮廓或运动中提取步态特征参数,无需建立人体模型。如文献[4]将统一Hu矩和步幅特征结合进行步态识别;文献[5]提取Zernike矩特征进行步态识别研究;文献[6]将提取的紧致度、矩形度、伸长度和质心高度相结合,采用支持向量机进行步态识别。这类方法计算量小,符合实时性要求,但受外界干扰比较敏感。

依据非模型的方法,提出了一种基于PCA主成分分析和统一Hu矩特征融合的步态识别新方法。将人体髋关节以下的运动部分作为感兴趣区域,进行归一化处理,对其进行PCA特征提取,并用统一Hu矩来描述其轮廓特征,将二者进行数据融合,采用支持向量机进行分类识别。

1 特征提取算法分析

1.1 PCA主成分分析

PCA是目前应用较广泛的特征提取方法。假设有N幅大小为n×n的步态序列图像,将每幅图像按列相连,构成一个n2维的列向量xi,i=1,2,…,N,则样本矩阵X=[x1,x2,…,xN]n2×N,为n2×N维。由此得序列图像的均值向量M和协方差矩阵Cx为:

式中,N为样本总数;M为均值。

设Cx的秩为r,其特征值为λ1,λ2,…,λr,且λ1≥λ2≥…≥λr,对应的特征向量为wi,i=1,2,…,r。则λi与wi满足:

Cxwi=λiwi,i=1,2,…,r。 (3)

令W=[w1,w2,…,wr],一般称特征向量wi为样本矩阵X的第i个主分量,W称为样本数据的主分量矩阵。

1.2 统一Hu不变矩

Hu提出了用于区域形状识别的连续函数不变矩的定义,利用归一化的二阶和三阶中心距构造了7个不变矩的表达式,这7个表达式对于平移、旋转和尺度缩放都具有不变性。其中前4个的表达式如下:

文献[7]已经证明,在实际点的离散状态下7个不变矩的尺度不变性是不成立的。针对这种情况,构造了一组新的表达式,新表达式同时考虑了区域、边界和离散状态3种情况,使之在这3种情况下都具有平移、旋转和尺度不变性,称之为统一Hu矩。其仅利用了Hu矩中计算量小的前4个矩不变量φ1,φ2,φ3,φ4。具体表达式如下:

2 实验结果与分析

2.1 运动目标检测及感兴趣区域分割

运动目标检测过程如图1所示。

利用中值法对图像序列进行背景建模,背景减除得到初步二值化的运动人体。由于存在噪声和干扰点,多次利用形态学操作,来消除孤立的噪声点,填充小的孔洞,进一步获得理想的二值化图像,如图1所示。图1(a)为视频序列图像中的原始图像,图1(b)为利用中值法得到的背景估计图像,图1(c)为背景减除得到的初步二值化运动人体,图1(d)为经过形态学处理后的理想二值化图像。

根据人体解剖学中各部分肢体占身高的比例关系,如图2所示,设人体高度为H,则髋关节为0.530 H。

根据此比例关系,对人体髋关节以下部分进行加框操作并将其作为感兴趣区域进行分割,将感兴趣区域进行归一化操作,以消除冗余。如图3所示。

(a) 髋关节以下加框操作 (b)感兴趣区域分割

2.2 特征提取和融合

本文首先采用PCA主分量分析进行感兴趣区域的特征提取,选取90%的能量特征,同时采用统一Hu矩的不变矩表达式,来计算图像序列每一帧中感兴趣区域的不变矩,将二者所得特征数据融合,构成用于识别的步态特征向量。

在进行统一Hu不变矩特征提取时,由于不变矩的变化范围较大,采用取对数的方法进行数据压缩,即实际上采用的不变矩为:

undefined。 (6)

本文的步态视频序列库为小样本数据,其中包含4个人的步态视频,每个人62帧序列图片,共248帧图片,人的行走方向均与摄像机成90°的垂直方向。感兴趣区域的主分量PCA特征W为74维,将beta1~beta5作为图像的矩特征,即

Zj=(beta1j,beta2j,…,beta5j)。 (7)

进而构成矩特征空间Z=(Z1,Z2,…Zj)T,其中,j=1,2,…248为步态序列的帧数。将2种特征相结合,构成79维的合成特征矩阵Q,即

Q=(W,Z)。 (8)

2.3 分类识别

实验运行环境为Pentium(R) Dual-Core CPU 3.07 GHz,1.96 GB的内存;操作系统为Windows XP;软件平台为Matlab 7.1。

分别采用PCA+SVM的方法、统一Hu矩+SVM的方法和PCA+统一Hu矩+SVM的方法进行对比试验,每种方法仿真10次,其仿真次数与识别率的关系曲线如图4所示,其平均识别时间和识别率如表1所示。

由图4可以看出,本文所用方法的曲线波动较小,即稳定性好于其他2种方法。由表1的实验数据可以看出,采用本文所述方法,将2种特征结合起来,比单独使用其中一种特征进行识别的识别率要高,而且平均识别时间不到2 s,时间代价比较低,满足一定的实时性要求。

另外,为了证明所用方法的有效性,将该方法与其他文献中提及的识别方法进行对比实验,在进行比较的时候,样本数据库仍然是本文所用的小样本数据库,比较结果如表2所示。

从表2可以看出,本文所用的组合特征算法要优于其他文献的方法,说明本文所用方法有效可行。

文献[4]采用将统一Hu矩与步幅特征相结合进行分类识别,虽然包含了步态的静态特征和动态特征,但是步幅特征的提取增加了计算量,使得分类器在分类识别时的误差增大,从而影响了识别率。文献[5]在文献[4]的基础上进行改进,采用提取步态的Zernike矩特征进行分类识别,Zernike矩比统一Hu矩更能精准地表达步态特征,识别率较文献[4]虽有所提高,但文献[5]只提取了步态的动态特征,识别率仍有待提高。文献[6]将多种有效步态特征结合起来,采用将紧致度、矩形度、伸长度和质心高度结合起来共同作为步态的有效特征进行分类识别,虽然更全面、更好地表征了步态运动的特征,但是特征的增加势必带来数据量的增加,导致识别率没有很大提高。而本方法不仅提取了步态运动的有效静态特征和动态特征,而且计算量和数据量也得到了减少,识别率得到了很大提高。

3 结束语

本文提出了一种基于PCA主分量特征、统一Hu矩和支持向量机的步态识别新方法,将人体髋关节以下运动部分作为感兴趣区域,对其进行PCA特征提取和统一Hu不变矩特征提取,将两者结合,形成用于识别的有效特征库,并采用三次多项式核函数的支持向量机进行分类识别,结果表明该算法具有一定的应用前景。当然,本文提出的方法还存在一定的局限性,下一步主要工作就是在大规模数据库上进行算法测试,融合更好的特征,进一步提高识别率。

参考文献

[1]王亮,胡卫明,谭铁牛.基于步态的身份识别[J].计算机学报,2003,26(3):353-359.

[2]POPPE R.A Survey on Vision-based Human ActionRecognition[J].Image and Vision Computing,2010(28):976-990.

[3]庄越挺,刘小明,潘云鹤.一种基于视频的人体动画骨架提取技术[J].计算机研究与发展,2000,37(4):498-506.

[4]林敏,吴清江.基于统一Hu矩和支持向量机的步态识别[J].微计算机信息,2010,26(5):197-199.

[5]李颖佩,卢结成,徐玉辉.基于Zernike矩快速算法的步态识别[J].计算机仿真,2010,27(11):238-241.

[6]江洁,陈峰,张广军.多区域特征融合的步态识别[J].计算机工程与应用,2011,47(7):159-161.

步态识别技术方法研究 篇6

步态是指人们行走的姿势, 是一种远距离情况下可感知的生物行为特征。步态识别技术旨在从相同的行走行为中寻找和提取个体之间的变化特征, 以实现自动的身份识别, 它是融合计算机视觉、模式识别与视频/图像序列处理的一门技术。

由于传统支持向量机本身一些固有的缺陷, 众多的学者开始将模糊数学的思想引入支持向量机中, 在传统支持向量机的基础上加入了"模糊隶属度"因子, 从而构造出了一种新的分类器--模糊支持向量机。本文力图通过分析模糊支持向量机在语言识别方面已有的实验成果, 探讨模糊支持向量机在步态识别中的可行性, 从而期望模糊支持向量机在步态识别领域能够取得更好的分类效果。

1、支持向量机的原理

对于线性可分的两类模式识别问题, 设n个训练样本[1]

, 假设存在分离超平面w·x+b=0, 使得对于每个样本有:

样本到超平面的距离, 即分类间隔可定义为, 当最小时, 分类间隔最大, 此时的分离超平面即为最优分类面。

对于线性可分和线性不可分情况, 分离超平面为最优分类面, 相应的决策函数为

C>0为权值系数, 它控制对错分样本惩罚的程度。式中的第一项使分类间隔尽量大, 从而提高推广能力;第二项则使误差尽量小。

其中 (xi·xj) 表示欧式空间中的内积, ai为与第i个样本对应的Lagrange乘子, 实质上是凸优化问题的解, 与ai>0对应的样本点xi就是支持向量。

对于非线性问题, SVM通过非线性变换, 将实际问题转换到高维特征空间F, 然后在F中构造线性判别函数来实现原空间中的非线性判别函数, 仍可用线性分类器实现分类, 从而巧妙地解决了维数灾难问题, 使得算法的复杂度与样本维数无关。此时的目标函数为

相应的决策函数为

其中k (xi·xj) 为满足Mecer条件的核函数。目前常用的核函数有下列3种:

(1) 阶次为d的多项式核函数

(2) 径向基核函数

(3) 两层神经网络核函数, 其中a和t为常数。

2、模糊支持向量机

虽然支持向量机在众多领域得到了广泛的应用, 但SVM在分类过程中, 样本是以同等地位输人到它们中的, 但实际上样本对分类的作用大小不一。FSVM在SVM的基础上, 将模糊数学引人其中, 根据不同输入样本对分类的贡献不同, 赋以相应的隶属度, 这样可减小噪声的影响, 提高SVM的分类性能[2]。

下面我们简要介绍2002年台湾学者Chunfu Lin和Shengde Wang提出的模糊支持向量方法, 它的主要思想是:针对支持向量机对训练样本内的噪音和孤立点的敏感性, 在支持向量机中引入模糊参数, 从而减弱噪音及孤立点对分类的影响[2]。

设训练集为

其中, σ为大于零的实数。sj为训练点 (xj, yj, sj) 的输出yj=1 (正类) 或-1 (负类) 的模糊隶属度 (j=1, …, l) 。

可以看出模糊支持向量机与传统的支持向量机最大的不同在于由于模糊隶属度sj的存在。

对于线性问题, 模糊最优分类函数为:

其中

对于非线性问题, 引入核函数k (xi, xj) , 则模糊最优分类函数为:

其中

3、模糊支持向量机在步态识别中需要解决的几个问题

1、解决多类分类问题

最初SVM是用以解决两类分类问题, 不能直接用于多类分类, 如何有效地将其推广到多类分类问题还是一个正在研究的问题。模糊支持向量机也同样要解决多类分类的问题。

现有的用SVM解决多类分类问题的主要方法有:1-v-r SVMs、1-v-1 SVMs、决策导向非循环图DDAG方法、纠错编码SVMs等。这些方法也同样适用于模糊支持向量机。

2、模糊隶属度的确定

在实际情况中样本对分类的作用大小不一, 如果能正确估计样本对分类的贡献大小, 就将获得更佳的性能。FSVM可根据不同输入样本对分类的贡献不同, 赋以相应的隶属度sj, sj越小, 相应的输入样本xj在SVM中作用就越低, 这也就达到了我们按一定规则对输入样本的重要性进行划分的目的, 减少了野值和噪声的影响, 提高了SVM的分类性能。由于这个规则是直接作用于sj上的, 所以sj的选取尤为重要。所以估计样本对分类的贡献, 也就是样本的隶属度, 就成为一个比较关键的问题。

确定样本的隶属度的方法有:直接选用一组递增数列作为模糊隶属度、模糊C均值算法、基于核方法的隶属度确定等方法。

4、模糊支持向量机在步态分类识别中的可行性分析

由于模糊SVM方法在理论上具有很突出的优势, 如今国内外的众多学者已经开始尝试将模糊支持向量机应用到人脸识别、语音识别、文字识别乃至股票分析等诸多领域。实践已经表明模糊支持向量机不但具有支持向量机的诸多优点, 而且较之有更强的鲁棒性。

以下是模糊支持向量机在语音识别的部分实验结果[1]。

从表4-1中的结果可以看出, 在无噪声的情况下FSVM的正确识别率略高于SVM, 但当在训练样本中叠加均匀分布噪声, 测试样本保持不变的情况下, 重新进行上述试验时 (得到的结果如表4-2) , FSVM无论在识别率, 还是训练时间上均优于SVM。这是由于SVM在分类过程中, 样本是以同等地位输人到它们中的, 但实际上样本对分类的作用大小不一, 另外还有一些被噪声污染了的样本, 输入到SVM中不但对分类毫无贡献, 而且影响SVM分类的能力, SVM应抛弃这种样本, 但SVM恰恰缺少这种能力。FSVM在SVM的基础上, 根据不同输入样本对分类的贡献不同, 赋以相应的隶属度, 从而能正确估计样本对分类的贡献大小, 提高了SVM的分类性能。

从以上的分析中我们可以看到模糊支持向量机较之SVM有如下特点:

1.具有更高的识别率

2.抗噪声能力强

3.在有噪声情况下训练时间最短

5、展望

步态识别和语言识别均属于模式识别领域两个不同的研究方向, 虽然研究的对象各有不同, 但在特征提取与识别分类等步骤的方法上具有很大的相似性。由于步态本身的复杂性 (比如行走时相对摄像机的角度、步速前后不一致, 是否穿着服装和携带提包、背景变化等等) , 特征选取的本身的缺陷, 以及步态图像预处理与跟踪过程中图像处理的欠缺, 使得步态特征本身更具不确定性和模糊性。较之支持向量机, 模糊支持向量机恰恰具备了这种处理不确定性和模糊性特征的能力。所以, 综合以上模糊支持向量机在语音识别中的实验结果, 可以预期的是, 在步态识别领域, 模糊支持向量机理应较其他分类器获得更好的识别效果。

参考文献

[1].朱志字, 张冰, 刘维亭.基于模糊支持向量机的语音识别方法.计算机工程.Vol.32, No.2, 2006

[2].孟媛媛.模糊支持向量机的研究与应用.山东师范大学硕士学位论文, 2006

[3].王青力.基于支持向量机的步态识别.华侨大学硕士学位论文, 2006

[4].许文芳, 吴清江.步态识别综述.福建电脑.2007年第一期

[5].顾民, 《神经网络_模糊系统_支持向量机内在联系研究》, 电子科技大学硕士论文

步态识别综述 篇7

生物特征识别技术是指利用人自身所固有的生理或行为特征进行身份鉴别,运用到的生物特征主要有:指纹、掌纹、人脸、虹膜及步态等。在这些生物特征识别中,步态识别近年来为越来越多的研究者所关注,成为一种较新的生物认证技术[1],它是通过人的走路方式来识别人的身份。步态被认为是个体特有的,且完全决定于几百个运动学参数。这些运动学参数包括特定关节点的角速度、加速度以及肢体的边界[2]等。以上领域的研究是步态识别作为一种生物认证技术的科学依据。

与已有的指纹、虹膜和人脸识别等生物识别方法相比,步态识别的优势[3]在于唯一不受距离影响的生物特征、非接触性、难以伪装且受环境影响小、对图像分辨率要求不高。

步态作为一种远距离身份识别的生物特征,虽然它具有其他的生物特征所不具有的一些优点,但也具有明显的缺点。首先,与指纹或虹膜不同,人的步态是高度改变的,它的唯一性是有限的[4],其次,步态识别的识别准确度还不够高,并且对于数据库较小时比较有效,对于数据库中的数据较多时仅仅利用步态很难从中识别出单一的个体,但是此时利用步态可以缩小可能匹配的范围[5]。下面本文对近年来该领域的研究文献进行简单的概述,有助于我们对步态识别这个研究领域有一个总体的认识和了解。

二、步态识别涉及方法的分类

步态识别涉及到的几项关键技术包括:视频处理、图像处理、模式识别。步态识别分析可以划分为特征抽取、特征处理和识别分类三个阶段。

下面针对步态识别过程中的各种方法和算法进行分类概述。

1、运动分割

运动分割的目的是从序列图像中将变化区域从背景图像中提取出来。运动分割可以分为在静止和运动背景下运动目标的检测和提取。现有的运动分割算法大体可分为如下三类:

(1)帧间差分:差分法是最为常用的运动目标检测和分割方法之一。如时域差分方法是在连续的图像序列中两个或三个相邻帧间采用基于像素的时域差分并且阈值化来提取出图像中的运动区域。此类方法的优点是速度快,鲁棒性好,适用于实时性要求较高的应用环境;不足在于算法对环境噪声较为敏感,并且基于差分法的运动目标分割精度没有保证。

(2)背景估计:除差分法外,背景估计静止或缓慢变化背景下运动目标为检测和分割的解决提供了另一条思路。这类方法的优点在于一般能够提供最完全的特征数据,对复杂背景情况效果较好,但是对于动态场景的变化,如光照和外来无关事件的干扰等特别敏感。

(3)基于运动场估计的方法:此类方法通过视频序列的时空相关性分析估计运动场,建立相邻帧对应关系,进而利用目标与背景表观运动模式不同进行运动目标的检测与分割。与差分法相比,运动场分析能够较好地处理背景运动的情况,适用范围更广;缺点在于其计算的时空复杂度过高。

2、步态特征的提取与表达

步态特征提取与表达是步态识别中的关键问题,在一定程度上决定了最终识别率的高低。一般可以分为基于统计特征的方法和基于模型的方法两大类。

(1)基于统计特征的方法

基于统计的方法重点关注人运动的静态信息,这类方法通过从行人的图片序列中产生的时空模式的分析表示步态,直接将从人体图像当中提取出步态的特征数据用于步态的识别。它又可细分为很多类方法,现将比较有代表性的几类方法介绍如下:

(1)基于运动的形状分析

Little与Boyd[6]利用步态序列图像的光流的频率和相位信息进行步态识别,从含有一组从高密度的光流分布的运动差中获得的运动特征的形状。

(2)对称分析

Hayfron-Acquach[7]使用广义对称性算子进行步态识别,描述了基于分析人运动的对称的自动步态识别的方法,这种方法利用的算子不依赖形状的边界,也不依赖总体形状,而是由它们的对称的性质找出特征的位置,是一种综合平衡算子。

(3)图片自相似

Chiraz Ben Abdelkade等[8]使用特征空间中步态的自相似。他们将走路的人的二维动态译成由人的图片序列的成对图片相似点组成的二维图,对序列中的每个图片计算相似性图。

(2)基于模型的方法

基于模型的方法重点关注人的运动信息,这类方法预先建立模型,通过模型和图像序列匹配获得模型参数作为步态特征进行分类。Cunado等[11]提出了钟摆模型,在此基础上,他和Nixon等人[9,10]进行了改进,提出了一种基于模型的特征提取分析方法,称为VHT(Velocity Hough Transform)。VHT方法应用了图像序列之间的时间相关性(这种时间相关性通常被用在视频压缩技术里)来提取线性运动的锥体的最优参数。

3、步态特征识别

在提取了步态特征之后,需要将待测序列的特征与样本特征进行比对完成识别任务,目前步态识别方法主要分为基于模板的方法与基于统计的方法。

(1)基于模板的方法

基于模板的方法主要有模板匹配和动态时间规整。

建模时,模板匹配的算法对每个人体样本都建有一个或者多个模板,识别时将获取的特征数据与模板进行匹配,计算两者之间的相似度。模板匹配算法无法解决运动时间快慢的影响,这是其最主要的缺点。

动态时间规整将两个不同时间长度的运动特征模板,按照一定的时间规整曲线进行时间规整,使得特征模板时间长度达到一致,然后再匹配。

(2)基于统计的方法

基于统计的方法是动态系统模式识别中识别效果最好的方法,主要有隐马尔科夫模型(Hidden Markov Model,简称HMM)和动态贝叶斯网络(Dynamic Bayesian Network,简称DBN),对于人类的活动或行为识别,大多数研究都是用基于HMM(隐含马尔可夫模型)的方法,HMM的方法与模板匹配方法相对。隐马尔科夫模型是目前人体运动识别中应用最为广泛的识别方法,也能够很好的应用于步态识别中,动态贝叶斯网络由于模型结构复杂,参数繁多等原因,在步态识别中运用很少,但是动态贝叶斯网络具有隐马尔科夫模型无可比拟的优越性,是步态识别方法中发展的方向。

三、该领域存在的问题及发展趋势

目前对于步态识别的研究还只是处于初级阶段,步态识别的研究是在以下几个假设条件下进行的:

(1)假设摄像机静止,并且摄像机的视角范围内只有一个人的运动。

(2)人的行走方向固定。

(3)算法有效性检验时所使用的数据库比较小。

这就造成了步态识别问题的研究与实际问题相违背的情况,主要体现在:

(1)现有的算法只适用于假设人体按照固定不变的方向行走无遮挡的情况下,而在现实环境中,人体的行走方向随时会发生变化且会发生遮挡现象,这对特征的提取及识别算法都是一个很大的挑战。

(2)现有步态识别算法多是假定图像中只有单个人行走,或背景不太复杂的情况,而实际监控场景可能比较复杂,有多个运动物体,因此研究图像噪声对识别的影响较为重要。

(3)在运动分割阶段,由于动态环境中捕捉的图像受到多方面的影响,比如天气的变化,光照条件的变化,运动目标的影子,甚至摄像机的运动等,这些都给准确有效的运动分割带来了困难。

(4)步态识别算法在大规模数据库上的识别效果的研究还不太多。

步态识别技术的不断成熟,为其广阔的应用前景提供了无限可能。其未来应用不仅仅局限于生物特征方面,还可用于医学推断,法医推断(犯罪分析现场),甚至可能用于动画片和电影行业。在诸如监视、访问控制、雷达系统、城市场景和自动驾驶中的驾驶支持等的许多应用领域,步态识别技术的需求仍不断增长。

四、结语

步态识别作为一个新型的研究领域,无论是在计算机视觉领域还是在应用领域,都具有重要的理论研究意义和实用价值。将步态的采集环境逐步与实际监控环境相逼近,处理实际的遮挡及行走方向改变,是未来的发展趋势。

摘要:步态识别作为一种新的生物认证技术,通过人的行走方式识别个体的身份。本文首先分析了步态识别的特点及其研究背景;其次,对目前步态识别中涉及到的几项关键技术所采用的方法进行了简单的描述及分类,并分析各种技术的主要优缺点,最后,提出了目前步态识别问题研究中的几个薄弱点,指出进一步研究发展空间。

关键词:步态识别,特征提取,运动分割,识别分类

参考文献

[1]Tang Xiao-ou,Ma Song de,O’Gorman Lawrence,et al.Guest editorial:introduction to the special issue on image and videobased biometrics-partⅡ[J].IEEE Transactions on Circuits and Sys-tems for Video Technology,2004,14(2):46-148.

[2]Yasutomi,S.,Mori,H A method for discriminating pedes-trians based on rhythm[R].IEEE/RSG Intl Conf.on Intelligent Robots and Systems.(1994).

[3]邓玉春,姜昱明.基于步态的身份识别[J].微电子与计算机,2005,22(6):12-18.

[4]叶波,文玉梅.基于步态的人身份识别技术综述[J].计算机应用.2005,25(11):2577-2580.

[5]Amit Kale,A N Rajagopalan,et al.Identification of Humans Using Gait[D].Center for Automation Research University of Mary-land at College Park,MD20740,2002.

[6]ames J.Little,Jeffrey E.Boyd.Recognizing people by their gait:the shape of motion[J].Videre:Journal of Computer Vision Research1(2):2-32.1998.

[7]Hayfron-Acquah J,Nixion M,Carter J.Automatic gait recognition by symmetry analysis[R].Proc International Conference on Audio-and Video-based Biometric Person Authentication,Halmstad,Sweden,2001.272-277.

[8]Chiraz Ben Abdelkadery,Ross Cutlerz,Harsh Nanday andLarry Davisy.EigenGait:Motion-based Recognition of People using Image Self-Similarity[J],AVBPA’01,pp.312-317,2001.

[9]Cunado D,Nixon M S,Carter J N.Automatic extraction and description of human gait models for recognition purposes[J].Com-puter Vision and Image Understanding,2003,90(1):1-41.

[10]Cunado D,Nash J M,Nixon M S,et al.Gait extraction and description by evidence gathering[A].In Proceedings of the Second International Conference on Audio and Video Based Biometric Person Authentication AVBPA[C].Washington DC,USA,1999:43-48.

上一篇:教育选择权下一篇:打击乐教学实践