3D指纹识别

2024-05-14

3D指纹识别（精选4篇）

3D指纹识别篇1

人脸识别是基于生物特征识别技术的身份认证中最主要的方法之一, 涉及计算机图形学、计算机视觉、模式识别、机器学习、感知科学、人工智能、计算智能等技术, 3D人脸识别主要分为人脸检测、人脸特征和人脸识别三个过程。为了提高人脸的识别精度, 本文对3D人脸的自动识别系统及识别算法进行了研究, 给出了3D人脸识别存在的问题。

1 3D人脸自动识别系统

普通的人脸识别一般分为图1[1]所示的三个过程。图2所示是一个典型的3D人脸识别系统的组成框图。其中, 图像获取部分负责获取来自于摄像机或是扫描仪等设备的图像, 通过程序将其转换为可处理的数字图像格式;检测定位是通过对输入的图像进行处理分析, 判断图像中是否有人脸, 如果有人脸, 则作出准确的定位;特征提取是在预处理后的人脸图像中按照某种策略抽取出识别的特征[2,3]。

人脸模型主要分为刚性模型和塑性模式, 刚性模型可以满足对人头部跟踪检测的要求, 主要用于表示人的头部位置、姿态、方向等;塑性实体主要处理人脸识别、表情识别、唇语识别等问题, 它涉及面部器官、肌肉和表皮的运动。

目前主要的三维建模工具有3DSMAX, MAYA, AUTOCAD等[4]。

1.1 结合一般人脸模型的建模

由于人脸的复杂性和相似性, 直接采用视觉重建算法进行3D人脸的重建, 在精度和实用性上, 相对于昂贵的硬件采集方法, 都不能达到很好的效果。为了重建精度较高的人脸模型, 下面引入了一般人脸3D模型。

一般人脸模型的主要思想是定义一个平均的人脸3D模型, 其空间坐标点集为Sg={xgi, ygi, zgi}, i=1, 2, …, n, 该空间坐标集表达了常见的人脸表面形状的共同特性。该思想认为, 不同人脸的3D结构Sp都可以通过一般人脸模型Sg中每个空间点的位置变化来表达, 即特定的人脸模型Sp=Sg+ΔS, {xpi, ypi, zpi}={xgi+Δxi, ygi+Δyi, zgi+Δzi}。形变量ΔS如何求取具有不同的方法, 但核心思想是利用人脸模型提取表达五官特征 (眼睛、鼻子、嘴、脸颊、眉毛) 的轮廓点集Sf={xfj, yfj, zfj}, j=1, 2, …, m (其中m≪n) , 然后`利用相应的轮廓信息或特征点队形的深度信息在一般人脸模型和特定人脸模型之间建立一个光滑的3D位移插值函数f (Sg) , 并使f (Sg) 对于轮廓或特征点集合均满足f (Sj) =ΔSf, 进而从f (Sg) 得到一般人脸模型上每一点的位移ΔS[6]。

1.2 结合3D人脸形变模型的建模

3D人脸形变模型的核心思想是利用有限数量的3D人脸模型的线性组合来表达任何一个3D人脸。在用3D人脸形变模型建模时, 可将模型的形状坐标集合记为s=[x1, y1, z1, …, xN, yN, zN]T, 即包括N个顶点的x, y, z坐标;再将对应一个人脸的纹理表示为一个纹理向量t=[R1, G1, B1, …, RN, GN, BN]T, 即包括N个对应顶点的RGB值 (假设有效纹理的数据等于顶点数) 。形变模型由M个人脸样本数据构成, 这些数据分别表示为它的3D形状和纹理两部分, 也可写成M个样本图像的质心坐标表达式[10], 即:

$\begin{array}{l} s_{m o d e l} = \sum_{i = 1}^{Μ} a_{i} s_{i} (1) \\ t_{m o d e l} = \sum_{i = 1}^{Μ} b_{i} t_{i} (2) \end{array}$

其中:

$\sum_{i = 1}^{Μ} a_{i} = \sum_{i = 1}^{Μ} b_{i} = 1 (3)$

使用PCA对3D人脸数据进行压缩, 再把基底变换到一个由对应协方差距阵的特征值按降序排列对应的特征向量si和ti形成的正交坐标系下, 则有 (α, β∈RM-1) :

$\begin{array}{l} s_{m o d e l} = \bar{s} + \sum_{i = 1}^{Μ - 1} α_{i} s_{i} (4) \\ t_{m o d e l} = \bar{t} + \sum_{i = 1}^{Μ - 1} β_{i} t_{i} (5) \end{array}$

其中, α的概率分布满足:

$p (α) \sim \exp [- \frac{1}{2} \sum_{i = 1}^{Μ - 1} (α_{i} / δ_{i})^{2}] (6)$

式中:δ $_{i}^{2}$ 是形状协方差矩阵CS的特征值。p (β) 的计算与p (α) 的计算类似。

最终定义的3DMM为[smodel (α) , tmodel (β) ], 由两个变量参数确定a=[a1, a2, …, aM]T, b=[b1, b2, …, bM]T。这样, 任意新的人脸都可以通过变化a, b来控制其形状和纹理。

2 基于视频图像的识别算法

特征脸方法通常利用主分量分析进行降维和提取特征。该方法选择与原数据协方差矩阵前几个最大特征值对应的特征向量构成一个组基, 以达到最佳表征原数据的目的。在人脸识别中, 由一组特征脸基图像张成一个特征脸子空间, 任何一幅人脸图像 (减去平均人脸后) 都可投影到该子空间, 从而得到一个权值向量。图3所示是一个主分量分析的应用举例。图中最左边的图像为平均脸, 其他为对应7个最大特征值的特征向量[9]。

但是, 3D人脸识别是通过自动检测人脸区, 从视频中提取特征后才识别出人脸的身份。虽然视频人脸识别是基于静态图像的人脸识别的直接扩展, 但一般认为, 视频人脸识别算法需要同时用到空间和时间信息, 它的时间连续性是视频图像的一个非常重要的特性, 包括由此产生的人脸信息的不确定性。视频人脸识别算法和基于静态图像的人脸识别算法的最大区别就是在人脸跟踪和识别中利用时间信息[7]。目前这类算法大致可分为两类:

(1) 跟踪-然后-识别, 这类方法首先检测出人脸, 然后跟踪人脸特征随时间的变化。只在跟踪阶段用到时间信息。识别还是采用基于静态图像的方法, 而没有用到时间信息。

(2) 跟踪-且-识别, 这类方法中, 人脸跟踪和识别是同时进行的, 在跟踪阶段和识别阶段都要用到时间信息。

3 3D人脸识别存在的问题

近几年才开始研究将三维方法用于人脸机器识别, 目的是为了弥补二维方法的不足, 或者是解决二维方法所无法根本解决的问题[8]。

目前, 三维人脸识别的处理方法和手段还是处于发现时期, 其本身还不成熟, 主要存在以下困难:

(1) 海量存储和计算的困难。

由于三维识别过程中处理的数据容量和计算量十分巨大, 对于一般计算机来说, 它们的存储和运算还比较困难;

(2) 信息来源方面的困难。

由于三维识别的完整信息难于获取或者识别的信息往往不完整, 同时, 再加上图像采集设备的差异和成像原理的不同, 都可能造成识别算法本身不可纠正的错误;

(3) 对人的生理认识的不足。

由于计算机没有人的经验和知识功能, 而只有计算功能, 同时由于对肌肉的运动理论和表情形成等问题, 现在还不能提供给计算机足够的专家支持;

(4) 受环境和条件的约束。

影响二维识别的不利因素在三维识别上同样存在, 如光线的强弱、方向、遮盖、阴影、背景等;

(5) 实现方式和手段的不足。

传统的识别方法不能满足三维识别的要求, 必须改进或采用新的方法。例如由于动态图像的计算量太大, 因此, 适用于静态图像处理的神经网络就变得不适合了。

4 结语

3D人脸的研究始于计算机动画和生物医学成像。计算机动画方面的方法是在计算机上生成三维的人脸来表达人的运动、姿态和表情。这种动画的人脸可以在不同的环境下应用和发展为虚拟现实, 这在生物医学方面可从生物图层或切片来重构人体器官组织, 并将其用于病理分析。而三维人脸识别是极具挑战性的课题, 如在技术上有所突破, 将具有很强的创新性和应用价值。

参考文献

[1]PHILLIPS J, GROTHER P, BLACKBURN D, et al.Facerecognition vendor test 2002[R].[S.l.]:[s.n.], 2002.

[2]AMOR B B, ARDABILIAN M, CHEN L M.3D facemodeling based on structured-light assisted stereo sensor[C]//Proc.of ICIAP.[S.l.]:ICIP, 2005:6-8.

[3]PU D, DU C, YU Z, et al.Design of face recognition doormanager system based on DSP[C]//Proceedings of 2005International Conference on Embedded and Ubiquitous Com-puting.Nagasaki, Japan:EUC, 2005:87-97.

[4]HSUR L, JAIN A K.Face model for recognition[C]//Proc.of IEEE ICIP, [S.l.]:ICIP, 2001, 2 (10) :693-696.

[5]ZHOU S, CHELLAPPA R.From sample similarity to en-semble similarity:probabilistic distance measures in repro-ducing kernel Hilbert space[J].IEEE Trans.on PAMI, 2006, 28 (6) :917-929.

[6]俞王新.计算机人脸检测与识别方法的研究[D].上海:上海交通大学, 2009.

[7]高志升.彩色图像人脸检测新方法[C].第十四届全国图象图形学学术会议论文集.北京:清华大学出版社, 2008:113-115.

[8]宋红, 石峰.面向视频监控的快速多人脸检测与分割[J].兵工学报, 2006, 27 (2) :252-257.

[9]王英杰, 谢金法.基于复杂背景的彩色图像肤色分割[J].重庆工学院学报:自然科学版, 2009 (4) :109-112.

[10]段锦.人脸自动识别中若干问题研究[D].长春:吉林大学, 2004.

3D手势识别背后的技术篇2

2D视觉的局限

计算机视觉技术一直在努力向堪比人类智慧的智能方向发展,以更好地了解场景。如果不能解释周围的世界,计算机就无法与人实现自然交流对接。计算机在了解周围场景方面面临的主要问题包括细分、对象表征、机器学习与识别等。由于2D场景表征本身存在局限性,手势识别系统必须应用其它各种提示信息才能得到包含更有用信息的更好结果。在可能性信息包含整个身体跟踪时,尽管将多种提示信息整合在一起,单靠2D表征也很难获得超越手势识别的任何信息。

“z”(深度)创新

向3D视觉及手势识别发展过程中的挑战一直都是第三坐标—z轴坐标的获取。人眼能看到3D对象,能自然识别(x,y,z)坐标轴,从而能够看到一切事物,而后大脑能够以3D影像的形式表达这些坐标轴。机器无法获得3D视觉的一大挑战就在于影像分析技术。目前有3种应对3D采集问题的常见解决方案,每种方案都有其独特的功能与特定的用途。这三种方案分别为:立体视觉、结构光模式以及渡越时间(TOF)。有了这些技术提供的3D影像输出,就可实现手势识别技术。

立体视觉

立体视觉系统可能是最为人所熟知的3D采集系统。该系统使用2个摄像机获得左右立体影像,该影像有些轻微偏移,与人眼同序。计算机通过比较这两个影像,就可获得对应于影像中物体位移的不同影像。该不同影像或地图可以是彩色的,也可以为灰阶,具体取决于特定系统的需求。立体视觉系统目前通常用于3D电影,能带来低成本而又震撼人心的娱乐体验。

结构光模式

结构光模式可用来测量或扫描3D对象。在该类系统中,可在整个对象上照射结构光模式,光模式可使用激光照明干扰创建,也可使用投影影像创建。使用类似于立体视觉系统的摄像机,有助于结构光模式系统获得对象的3D坐标。此外,单个2D摄像机系统也可用来测量任何单条的移位,然后通过软件分析获得坐标。无论使用什么系统,都可使用坐标来创建对象外形的数字3D图形。

渡越时间(TOF)

渡越时间(TOF)传感器是一种相对较新的深度信息系统。TOF系统是一种光雷达(LIDAR)系统,同样可从发射极向对象发射光脉冲。接收器则可通过计算光脉冲从发射器到对象,再以像素格式返回到接收器的运行时间来确定被测量对象的距离。

TOF系统不是扫描仪,因为其不支持点对点测量。TOF系统可同时获得整个场景,确定3D范围影像。利用测量得到的对象坐标可创建3D影像,并可用于机器人、制造、医疗技术以及数码摄影等领域的设备控制。

实施TOF系统所需的半导体器件现已开始供货。目前的器件支持实现TOF系统所需的处理性能、速度与带宽。

3 D视觉技术的比较

不同的应用或市场适用于不同的3D视觉技术。图1显示了不同3D视觉技术的比较及其相关响应时间、软件复杂性、成本及准确性的相对优缺点。

立体视觉技术需要极高的软件复杂性才能获得高精度3 D深度数据,其通常可通过数字信号处理器(DSP)或多内核标量处理器进行处理。立体视觉系统支持小巧的外形与低成本,是移动电话等消费类设备的良好选择。不过,立体视觉系统的精确度与响应时间不及其它技术,因此对于制造质量控制系统等要求高精度的系统来说不太理想。

结构光技术是包括3D计算机辅助设计(CAD)系统在内的3D对象扫描的良好解决方案。这些系统的相关软件复杂性可通过硬接线逻辑解决(如ASIC与FPGA等),其需要高昂的开发及材料成本。此外,该计算复杂性还可导致较慢的响应时间。在实现微观层面上的高精度方面,结构光模式技术优于其它3D视觉技术。

TOF系统取得了性能与成本的平衡,非常适用于需要快速响应时间的制造与消费类电子设备等应用领域的设备控制。TOF系统软件复杂程度通常较低,不过这些系统需要昂贵的照明部件(LED、激光二极管)以及高速接口相关部件(快速ADC、快速串行/并行接口、快速PWM驱动器),这将提升材料成本。图1显示了这三种3D传感器技术的对比情况。

“z”(深度)如何影响人机界面

随着“z”坐标的加入,显示与影像更接近自然,更贴近人类。人们在显示屏上能看到人眼从周边环境所看到的逼真事物。增加这第三维坐标改变了可使用的显示与应用类型。

显示

立体显示屏

立体显示屏通常需要用户佩戴3D眼镜。这种显示屏为左右眼提供不同的影像,两眼看到的影像不同,让大脑误以为看到了3D影像。这种显示屏目前广泛用于众多3D电视与3D电影院。

多视点显示屏

多视点显视屏不同于立体显示屏,无需佩戴特殊眼镜。这些显示屏可同时投射多个影像,每个影像稍微有些位移,形成适当的角度,让用户可在每个视点角度看到相同对象的不同投射影像。这些显示屏支持全息摄影效果,在不久的将来将实现全新的3D体验。

检测与应用

处理并显示“z”坐标的功能将实现全新的应用,其中包括游戏、制造控制、安全、互动数字标牌、远程医疗、汽车以及机器人视觉等。图2是身体骨架与深度映射传感技术所支持的某些应用领域视图。

人类手势识别(消费类)

人类手势识别是一项深受欢迎的新技术,可为游戏、消费类以及移动产品带来新的输入方式。用户能够以极其自然、直观的方法与设备进行互动,从而可促进产品推广。这些人类手势识别产品包括从160 x 120像素到640 x 480像素,30到60 fps的各种分辨率的3D数据。原始数据到z深度解析、双手跟踪以及全身跟踪等软件模块需要数字信号处理器(DSP)对3D数据进行高效快速处理,才能实现实时游戏与跟踪。

工业

工业与制造传感器等大多数3D视觉工业应用都采用至少1像素至数100k像素的影像系统。3D影像可使用DSP技术进行控制分析,确定制造瑕疵或者从部件集中选择正确的部件。

互动数字标牌(精确定位的市场营销工具)

每天我们都在遭受广告的轰炸,无论是看电视、开车还是在机场登机都是如此。有了互动数字标牌,企业就可通过精确定位的市场营销工具提供适合每位消费者的内容。例如,有人走过一个数字标牌,标牌上可能就会马上显示额外的消息确认该客户。如果客户停下来阅读信息,该标牌可能会理解为客户对产品感兴趣,并提供更有针对性的消息。麦克风则将让广告牌检测并识别关键短语,进一步精确定位所提供的消息。

这些互动数字标牌系统将需要3D传感器进行全面的身体跟踪,2D传感器进行面部识别,并需要麦克风进行语音识别。这些系统的软件将运行在更高级的DSP及通用处理器(GPP)上,不但可实现面部识别、全面的身体跟踪以及Flash媒体播放器等应用,而且还可提供诸如MPEG4视频解码等功能。

医疗(无故障虚拟/远程护理)

3D视觉将为医疗领域带来前所未有的全新应用。医生无需跟患者共处一室就可问诊。远程虚拟护理采用高精度3D传感器支持的医学机器人视觉系统,可确保为每一位患者提供最优质的医疗护理,无论他们身处何方。

汽车(安全)

近期,汽车应用在交通信号、车道以及障碍检测方面使用2D传感器技术取得了长足发展。随着3D传感技术的到来,3D传感器的“z”数据将大幅提升场景分析的可靠性。汽车通过使用3D视觉系统,现已有了预防事故的新途径,无论白天还是夜间都非常适用。采用3D传感器,车辆能可靠检测并解读周边环境,确定对象是否对车辆及车内乘客构成安全威胁。这些系统要求软硬件支持3D视觉系统,并需要密集型DSP及GPP处理性能在极短时间内解读3D图形,避免事故。

视频会议

视觉会议技术经过多年发展,已经从间断脱节传输影像发展成当前的高清系统。未来增强型视频会议将充分发挥3D传感器的优势,提供更真实、更具互动性的视频会议体验。该增强型视频会议系统具有集成型2D传感器以及3D传感器及麦克风组合,将能够与其它增强型系统连接,实现高质量的视频处理、面部识别、3D影像、噪声消除以及内容播放器(Flash等)等应用。随着这种密集型音视频处理需求的出现,需要具备最佳性能及外设组合的DSP。

技术处理步骤

对许多应用而言,需要同时具备2D和3D摄像机系统才能充分实现应用技术。图3显示了这些系统的基本数据路径。从传感器获取数据,然后进行视觉分析,这并不像数据路径示意图看上去那么简单。具体而言,TOF传感器需要的带宽相当于2D传感器的16倍之多,这可导致高输入/输出(I/O)问题。另一个瓶颈则存在于原始3D数据向3D点云转换的处理过程中。通过正确的软硬件组合解决这些问题,对于手势识别及3D的成功应用至关重要。当前数据路径可通过DSP/GPP处理器组合加上分立式模拟组件及软件库实现。

3D视觉嵌入式系统的挑战

输入挑战

如前所述,输入带宽限制对3D视觉嵌入式系统提出了极大的挑战。此外,输入接口也没有标准化。设计人员可为2D传感器与通用外部存储器接口选择采用不同的输入选项,其中包括串行与并行接口。在支持最佳带宽的标准输入接口出现之前,设计人员只能使用现有的接口。

两种不同的处理器架构

图3所示的3D深度映射处理可分为两类:一是以数据为中心的视觉专用处理,二是应用上层处理。以数据为中心的视觉专用处理需要处理器架构能够执行单指令多数据(SIMD)快速浮点乘法及加法运算,以及快速搜索算法。DSP是快速可靠执行这种处理功能的完美选择。对于应用上层处理而言,高级操作系统(OS)及协议栈则可提供任何应用上层所需的必要特性集。

根据两种处理器架构要求,提供高数据速率I/O GPP+DSP+SIMD处理器的片上系统(SoC)非常适合3D视觉处理,其可支持必要的数据及应用上层处理。

缺乏标准中间件

3D视觉处理领域的中间件是多种来源的众多不同组件的整合,包括开源(如OpenCV)与专有商业源等。商业库主要针对身体跟踪应用,这是一种特定的3D视觉应用。目前尚未开发出针对所有不同3D视觉应用标准化的中间件接口。

“z”(深度)之后会有什么精彩?

没有人质疑3D视觉的诱人因素。工程师早已在期待未来的应用发展。那么不久的将来会出现哪些最新技术?研究人员已经在开发针对人和对象的各种视觉技术了。全球研究人员正在使用多路径光分析技术,探索实现转角视觉或绕开对象的视觉途径。透明研究将带来可透视对象和材料的系统,而运动检测系统则将带来查看人类大脑内部的应用,从而可检验一个人是否在撒谎。

基于3D人脸识别研究的探索篇3

关键词：3D人脸识别,人脸建模,3D人脸形变模型,视频图像

1 3D人脸自动识别系统

人脸识别是基于生物特征识别技术的身份认证中最主要的方法之一, 设计计算机图形学、计算机视觉、模式识别、人工智能、机器学习、计算智能等技术, 3D人脸识别主要分为人脸检测、人脸特征和人脸识别三个过程, 见图1[1]。

典型的3D人脸识别系统如图2所示。

其中:图像获取部分负责获取图像, 可以来自于摄像机或是扫描仪等设备, 程序将其转换为可处理的数字图像格式;检测定位是通过对输入的图像处理分析, 判断图像中是否有人脸, 如果有人脸则作出准确的定位;特征提取是在预处理后的人脸图像中按照某种策略抽取出来识别的特征[3,5]。

2 3D人脸模型

人脸模型主要分为刚性模型和塑性模式, 用刚性模型可以满足对人头部跟踪检测的要求, 用于表示人的头部位置、姿态、方向等;用塑性实体可以处理人脸识别、表情识别、唇语识别等问题, 涉及面部器官、肌肉和表皮的运动。

目前主要的三维建模工具有3DSMAX, MAYA, AUTOCAD等[4]。

2.1 结合一般人脸模型的建模

由于人脸的复杂性和相似性, 直接采用视觉重建算法进行3D人脸重建在精度和实用性上相对于昂贵的硬件采集方法都不能达到很好的效果, 为了重建精度较高的人脸模型, 引入了一般人脸3D模型。

一般人脸模型的主要思想就是定义一个平均的人脸3D模型, 其空间坐标点集为Sg={xgi, ygi, zgi}, i=1, 2, …, n, 该空间坐标集表达了常见的人脸表面形状的共同特性, 该思想认为不同人脸的3D结构Sp都可以通过一般人脸模型Sg每个空间点的位置变化来表达, 即特定的人脸模型Sp=Sg+ΔS, {xpi, ypi, zpi}={xgi+Δxi, ygi+Δyi, zgi+Δzi}。形变量如何求取有不同的方法, 但核心思想就是利用人脸模型提取表达五官特征 (眼睛、鼻子、嘴、脸颊、眉毛) 的轮廓点集sf={xfj, yfj, zfj}, j=1, 2, …, m (其中m<

2.2 结合3D人脸形变模型的建模

3D人脸形变模型的核心思想是利用有限数量的3D人脸模型的线性组合来表达任何一个3D人脸。将模型的形状坐标集合记为s=[x1, y1, z1, …, xN, yN, zN]T, 即包括N个顶点的X, Y, Z坐标。将对应一个人脸的纹理表示为一个纹理向量t=[R1, G1, B1, …, RN, GN, BN]T, 即包括N个对应顶点的RGB值 (假设有效纹理的数据等于顶点数) 。形变模型由M个人脸样本数据构成, 这些数据分别表示为它的3D形状和纹理两部分, 也可写成M个样本图像的质心坐标表达式的形式[10], 即

其中

使用PCA对3D人脸数据进行压缩, 把基底变换到一个由对应协方差距阵的特征值按降序排列对应的特征向量si和ti形成的正交坐标系下, 则有 (α, β∈RM-1)

α的概率分布满足

其中δi2是形状协方差矩阵Cs的特征值。P (β) 的计算与p (α) 的计算类似。

最终定义的3DMM为[smodel (α) , tmodel (β) ], 由两个变量参数确定a=[a1, a2, …, aM]T, b=[b1, b2, …, bM]T。任意新的人脸都可以通过变化a, b来控制其形状和纹理。

3 基于视频图像的识别算法

特征脸方法常利用主分量分析进行降维和提取特征。该方法选择与原数据协方差矩阵前几个最大特征值对应的特征向量构成一组基, 以达到最佳表征原数据的目的。在人脸识别中, 由一组特征脸基图象张成一个特征脸子空间, 任何一幅人脸图象 (减去平均人脸后) 都可投影到该子空间, 得到一个权值向量。图3给出了主分量分析应用的例子。图中最左边的为平均脸, 其他6个为对应7个最大特征值的特征向量[9]。

但是3D人脸识别是通过自动检测人脸区, 从视频中提取特征后则识别出人脸的身份。虽然视频人脸识别是基于静态图像的人脸识别的直接扩展, 但我们认为视频人脸识别算法需要同时用到时间和空间信息, 它的时间连续性是视频图像的一个非常重要的特性, 以及由此产生的人脸信息的不确定性。视频人脸识别算法和基于静态图像的人脸识别算法的最大区别就是在人脸跟踪和识别中利用时间信息[7]。目前这类算法大致可分为两类:

1) 跟踪-然后-识别, 这类方法中, 先是检测出人脸特征, 然后只在跟踪阶段用到了时间信息。识别还是只采用基于静态图像的方法, 没用到时间信息。

2) 跟踪-且-识别, 这类方法中, 人脸跟踪和识别是同时进行, 在跟踪阶段和识别阶段都用到了时间信息。

4 三维的人脸识别存在的问题

近几年才开始研究将三维的方法用于人脸机器识别, 目的是为了弥补二维方法的不足, 或者是解决二维方法所无法根本解决的问题[8]。

目前, 三维的人脸识别处理方法和手段还是处于发现时期, 其本身还很不成熟, 主要存在以下困难:

1) 海量存储和计算的困难。由于三维识别过程中处理的数据容量和计算量十分庞大, 所以给计算机的存储和运算带来了困难。

2) 信息来源方面的困难。由于难于获取三维识别的完整信息或者识别的信息往往是不完整的, 同时, 再加上图像采集设备的差异, 成像原理的不同, 这造成了识别算法本身不可纠正的错误。

3) 对人的生理认识的不足。由于计算机没有人的经验和知识的功能, 只有计算功能。

4) 受到条件和环境的约束。影响二维识别的不利因素在三维识别上是同样存在的, 如光线强弱、方向、阴影、遮盖、背景等。

5) 实现的方式和手段不足。传统的识别方法不能满足三维识别的要求, 必须进行改进或采用新的方法。

5 结束语

3D人脸的研究始于生物医学成像和计算机动画。在生物医学方面是采用从生物图层或切片重构人体器官组织的方法, 将其应用于病理分析。而计算机动画方面则是在计算机上生成三维的人脸来表达人的运动、表情和姿态。三维人脸识别是极具挑战性的课题, 如果今后能进一步在技术上有所突破, 将具有巨大的创新性和应用价值。

参考文献

[1]Phillips J, Grother P, Blackburn D, et al.Face recognition vendor test 2002[R].Evaluation Report, 2002.

[2]段锦.人脸自动识别中若干问题研究[D].长春:吉林大学.2004.

[3]宋红, 石峰.面向视频监控的快速多人脸检测与分割[J].兵工学报, 2006 (02) .

[4]王英杰, 谢金法.基于复杂背景的彩色图像肤色分割[J].重庆工学院学报 (自然科学版) , 2009 (04) .

[5]高志升.彩色图像人脸检测新方法[A].第十四届全国图象图形学学术会议论文集[C], 2008.

3D指纹识别篇4

据美国中文网2月11日报道, 近日, 一硅谷华裔电脑高手向人们展示了由他带领团队研发的智能眼镜“Atheer One”。和谷歌眼镜靠眼球和语音识别不同, 这款智能眼镜还可以识别各个方向的手势, 而透过眼镜看到的也是三维立体的全新视觉效果。

据报道, 发明这款3D眼镜的就是一位叫扬扬的华裔“电脑高手”。杨扬来自中国广西, 13年前来美求学, 是伊利诺伊大学博士、加州大学伯克利分校博士后, 如今扎根硅谷。在硅谷, 给人打工的华裔软件开发人员一抓一大把, 但像杨扬这样的创新企业创始人, 却并不多见。

作为公司的首席产品总监, 杨扬承担起了乔布斯的角色, 在大型展会上推广这款可能具有划时代意义的产品。他说, 现在市场上主要的操作系统, 不管是微软, 苹果, 还是谷歌做的, 他们的原装系统都不能自然地理解三维的输入和输出, 我们做的最大一个革新就是进入安卓系统里, 改变它的输入输出, 这样它能很自然地理解三维的输入和输出。

报道称, 沉浸式的感官体验, 让用户足不出户便可身临其境地看电影、逛博物馆。更神奇的是, 它还可以帮助警察识别人脸, 在人海茫茫中锁定罪犯。比如说在高速公路上有很多摄像机自动拍车牌, 如果警察或者安保人员戴上这种眼镜, 可以通过眼镜连接到他们的数据库里, 就能加强实时反应, 如果一些高危的地方有一些突发的事情, 警察能更好地处理危机。

据报道, Atheer One将推出专业版和普通用户版, 分别为850美元 (约合人民币5151元) 和350美元, 专业版将于下月起上市发售。

【3D指纹识别】推荐阅读：

指纹识别门禁06-09

指纹识别云技术07-24

指纹数据10-16

指纹特征06-12

现场指纹07-01

指纹信息08-05

指纹技术08-25

指纹系统08-31

气相指纹图谱05-27

指纹采集设备06-01