人脸检测识别(共12篇)
人脸检测识别 篇1
作为一种新兴的生物特征识别技术, 与虹膜识别、指纹扫描、掌形扫描等技术相比, 人脸识别技术在应用方面具有独到的优势:人脸识别技术使用通用的摄像机作为识别信息获取装置, 可以非接触的方式完成识别过程。但是正是这些应用场景的优势, 被一些人用照片、视频、人脸模型等方式进行人脸复制, 欺骗系统。在人脸识别系统应用推广中, 活体检测技术逐渐成为系统的必要核心技术。
当前活体人脸检测技术主要是基于人脸细微动作、3D人脸重建、红外人脸检测三个领域上的研究。
1 人脸细微动作
由于照片、模型中的人脸不具备细微等动作的可能, 那么我们在获取人脸的连续一系列细微动作的过程中可以获得一些线索来判断是否是真实的人脸:如眼睛眨动、嘴唇的离合、面部肌肉细微动作以及人脸周边场景的细微变化, 这些我们可以将其设为相应的特征值存储在人脸特征值中, 并设定这些值设置波动范围, 如果这些值没有变化, 就判定这是伪造的人脸。
对于以上归类的细微动作可以采用以下几类人脸经典算法进行特征值提取和判断:霍夫变换法、变形模板法、边缘特征分析法和对称变换法等, 利用这些算法, 从一个较大的特征集中选择少量的关键的特征, 产生一个高效的强分类器, 再用瀑布算法将多个强分类器合成为一个更加复杂的层叠分类器, 使图像的背景区域快速地丢弃, 而在有可能存在目标 (人脸) 的区域花费更多的计算, 其在人脸检测方面速度快且具有鲁棒性[1]。
2 3D人脸重建
平面的人脸图像, 不管是视频还是图片, 都是无法恢复出此特定人的3D结构, 因此出现了基于3D人脸重建的活体检测技术。
3D人脸重建的原理是:人脸都被标准化到一个统一的标准的方向和位置, 人脸的形状由数百个顶点表示, 为简化计算, 均匀采样这些顶点, 在球面谐波函数算法中, 对形状和纹理按照不同的策略分开处理。根据算法理论, 人脸的姿态只与一些关键特征点的位置有关, 通过将形状和纹理分开处理, 避免了复杂的优化过程, 节省了计算时间, 稀疏统计模型的建立过程。我们将人脸的n个顶点的X、Y、Z坐标串接起来, 组成形状向量来描述人脸的3D形状:我们可以重构得到对应于输入人脸的3D形状。为得到更加精细的3D形状的解, 我们按照给定2D图像上的特征点的坐标来对3D形状顶点进行进一步调整, 一旦得到了人脸精细的3D形状信息, 再结合此特定人的纹理图像, 姿态的校正就可以简单地通过旋转3D人脸模型来实现了[3]。
3 红外人脸检测
在人脸活体检测研究中, 由于图片和视频画面或者戴有面具时其表面是没有温度的, 而根据人体温度产生的人脸红外感应成像就成为一个新的人脸活体检测的研究热点, 它的基本原理是:由于人体血液流动的过程中产生了温度, 会被皮肤发散, 从而使皮下血液系统呈现出一种独特的面部信号。这种信号可以被红外照相机获取, 通常就称之为面部热像图。
目前主要的研究方向是根据脸皮下面复杂的血管末梢产生同温线而形成的特征值提取来实现识别, 可以采用同温线匹配方法特征提取和识别方法进行红外人脸识别技术, 通过对于人脸皮肤下面的血管分布信息, 使用热灵敏度小于或等于0.7℃的红外照相机所拍摄的人脸照片, 每张脸一般含有数百个或者更多的封闭的同温线。提取同温线特征, 用包含该特征的区域的标准模板进行提取, 用几何分析的方法来分析同温线形状, 分析的结果产生的特征值就用来进行人脸活体检测[2]。
4 结语
以上几个活体检测技术主要基于人脸的各项生理特征来进行设定识别, 其各自存在局限性, 如人脸细微动作:在光线发生变化的时候, 其可靠性目前还无法保证;3D人脸识别在检测戴有头套的伪装模型或者当某个目标试图采用三维模型或面具试图欺骗该系统时, 也可以让系统难以察觉和受骗;而红外人脸检测时, 周边环境温度的变化和人自身身体状况如运动, 情感等因素使得面部热像图是否具有唯一性和稳定性, 还有待进一步验证。综上所述, 同时结合上面三种活体检测技术, 可以取长补短, 提高识别率, 实现真正的活体检测。
参考文献
[1]孙霖.人脸识别中的活体检测技术研究[D].杭州:浙江大学, 2010.
[2]伍世虔, 等.红外人脸识别技术[J].中国图象图形学报, 2008 (12) .
[3]柴秀娟, 等.基于3D人脸重建的光照、姿态不变人脸识别[J].软件学报, 2006 (3) .
人脸检测识别 篇2
二、实践概况 实习时间:2017-3-7 至 2017-4-29
实习公司:新秩序电子科技有限公司
实习目的:在实习中接触社会,学习市场营销的基本知识,掌握市场营销的基本技能,在实践中锻炼自己在与人沟通、团队合作、制定计划、应对危机等各方面的能力,发现自身的各种问题和缺点并采取实际行动改进。
实习任务:通过面试被聘为新秩序电子科技有限公司的一名实习生,在其销售部担任一名市场营销人员,参与公司人脸识别产品的市场维护及拓展的营销计划。
三、实践方法及内容 (一)人脸识别内容 本实践提出的分布式人脸识别模型中有多个代理,并且每个代理可以同时识别多个视频中的行人,为了避免代理处理任务量不均导致的时间延迟,对每个代理处理的任务量采用遗传算法(GA)进行负载均衡。假设有k个代理要处理 m 个视频,每个视频中有多个行人,第 i 个代理处理的 ID 号为iAID,处理的视频集合为 } ,..., , {2 1iin i i iV V V V ,其中 i 的范围是(0,k),in 是第 i 个代理中的视频个数,)<n 0(im ,iV 中第 j 个视频的行人个数为ijP,)n <j 0(i。
首先对 GA 中的染色体进行初始化,以第 i 个代理为例,将ij ij iP V AID , , 这 3个参数作为一个节点,由于第 i 个代理中有in 个视频,所以就有in 个这样的节点,将这in 个节点作为第 i 个染色体的基因。第 i 个染色体由iChrom,来表示,iChrom初始化结果如下所示:)., ,(),..., , ,(),..., , ,(), , ,(:2 2 1 1i iin in i ij ij i i i i i i i iP V AID P V AID P V AID P V AID Chrom
本实践采用的适应值函数如下:
injij iP c F1/
其中 c 是小于 1 的随机数。
其次,使用轮盘赌方式进行选择操作,根据计算公式获得选择结果。考虑个体优劣差距较大的情况,根据染色体的数量,选择不同质量的染色体进行遗传。
kii i chromF F i P1/)(在遗传操作中,选择两点交叉方法进行交叉操作,根据染色体长度的不同,设定这两个交叉点的选择范围,令第一个交叉点的位置为第一个基因节点,假设这两条染色体中最短的染色体长度为minL,则第二个交叉点的选择范围即为
[min min, 2 / L L ]。
为了避免过早收敛使算法进入局部最优,及保证种群的多样性,根据染色体的适应值对交叉概率cP 和变异概率mP 增加了一些随机性操作,cP 和mP 的计算公式如下所示: 2211MaxFFkMaxFFk P c
FMinFkMaxFFk P m413 其中:1MaxF 是染色体中最大的适应值,2MaxF 是染色体中第二个大的适应值,MinF 是染色体中最小的适应值,3 2 1k k k、、和4k 是[0,1]的随机数。
为了尽快缩小染色体之间的优劣差距,在传统的 GA 算法中加入了迁移操作,即通过将最差染色体中的最大基因迁移至最优的染色体中来完成该操作。
最常用的停比准则是选择一个比较大的数作为迭代次数。但在本实践中,为了不错过最优解,设置了一个阂值函数,公式如下: > /MaxF F 其中:参数 是一个阈值,这个阈值小于 1。
本实践负载均衡操作的步骤如下: 步骤 1:服务器接收代理发送的信息,并初始化为染色体。
步骤 2:根据公式计算每条染色体的适应值。
步骤 3:根据公式执行选择运算。
步骤 4:计算公式,如果没有满足预定的阂值,则执行步骤 5~步骤 7;如果满足预定阂值,则停止。
步骤 5:根据公式计算交叉概率cP 判断是否执行交叉操作,并且重复步骤 2和步骤 3。
步骤 6:根据公式计算变异概率mP,如果不能执行变异操作,则执行迁移操作,并且重复步骤 2 和步骤 3。
步骤 7:转到步骤 4 继续。
(二)
实习内容 1.了解新秩序公司 在接受新秩序公司人事部主管、营销部等相关人员的基本培训,了解公司的基本概况。新秩序电子科技有限公司是一家研发、生产、销售新型电子产品于一体的高科技有限公司,公司产品旨在降低客户设备购置和使用成本。
在培训的那天,三位公司职务不低的培训人员在上午连续培训几个小时后,只在报告厅的桌子上睡了一下又接着在下午给我们进行精彩的培训,在中午的时候他们完全可以享受更好的休息条件,但他们却没有。在这种行为之中我感受到了公司中人的那种敬业的精神、能吃苦的精神。这也促使我之后在网上搜索该公司更多的信息,使我对公司有了更深刻的了解。
2.拜访经销商,督促其下单,了解市场信息
(1)跟着业务经理一起到各市县拜访各级经销商,了解公司人脸识别产品出货价格、出货渠道、出货时的促销优惠措施等,同时了解各级经销商所卖其他竞争人脸识别产品的各种信息,针对人脸识别产品信息做出人脸识别产品销售策略的调整。
(2)一些大的经销商不用督促其进货,沟通是最佳的手段,只要沟通的好他们会很容易的按其需求进货。只要情感的沟通技巧用的好,比说人脸识别产品性能和促销政策等效果要好很多。有时候印象很重要,要让别人接受你的人脸识别产品,就得先让别人接收你这个人。培养员工的独特方式,体会了一些商场上尔虞我诈、残酷无情的味道,这是我在学校肯定学不到的东西,我感觉这个游戏已经使我不虚此行了。
在我们接受公司营销部的业务培训,了解公司人脸识别产品的种类、特性、市场定位、价格、竞争优势、人脸识别产品流入市场的渠道、竞争产品的相关信息等。
3.拜访销售终端,销售公司人脸识别产品,摸清销售渠道,核实市场信息
跟着业务经理拜访营销点、经销商、等销售终端和终端用户。
(1)了解他们使用或销售人脸识别产品的感受,记录客户使用人脸识别产品后的反馈信息(包括人脸识别产品质量问题、实际使用时的人脸识别产品特性和使用感受),帮助用户解决使用过程中出现的问题,提供技术咨询与技术服务。
(2)从这些销售终端得到电子人脸识别产品及其他竞品的销售渠道、价格、促销、推广力度等的真实信息(竞争品的情报信息尤为重要),与从经销商处得到的信息核对,判断经销商在信息上是否对我们有所隐瞒,如有必要可调整与经销商的合作策略。
(3)从销售终端,了解其他相关人脸识别产品配送的渠道信息,为我们省去找渠道的时间。如了解营销点所用所经营各类人脸识别产品的种类、进货渠道、价格、得到的促销政策、用竞争产品而不用我们公司人脸识别产品的原因(如果用竞争人脸识别产品的话)。
如从营销点了解经销商的信息,若该经销商不经营我们公司的人脸识别产品,之后可以找该经销商谈,尽量将其争取为我们公司人脸识别产品的经销商。同时从营销点可以了解到一个地区的经销商网络状况,通过经销商找终端会为我们拜访客户省去很多找客户的时间。从营销点可以了解到我们的经销商是否执行了我们要求其执行的我们公司人脸识别产品推广计划。
四、实践感悟 (一)
沟通 有很多沟通的技巧在销售上是很有用的,特别是在外面拜访客户的时候有很多说话的技巧、观察的技巧,如在拜访营销点、经销商的时候如何打消他们的戒心和疑虑,如何让他们接受你、让他们对你说实话,如何从他们不经意间透露的信息了解到他们卖或用的人脸识别产品、进货渠道、用量或销量,如何说服他们用我们公司的人脸识别产品,如何对他们讲解我们公司电子人脸识别产品的优势,如何让他们对我们的人脸识别产品感兴趣、进有很多沟通的技巧在销售上是很有用的,特别是在外面拜访客户的时候有很多说话的技巧、观察的技巧,如在拜访营销点、经销商的时候如何打消他们的戒心和疑虑,如何让他们接受你、让他们对你说实话,如何从他们不经意间透露的信息了解到他们卖或用的人脸识别产品、进货渠道、用量或销量,如何说服他们用我们公司的人脸识别产品,如何对他们讲解我们公司电子人脸识别产品的优势,如何让他们对我们的人脸识别产品感兴趣、进而用我们的人脸识别产品等等。我也将我学到的和客户谈话技巧的小细节,与客户沟通的小招数,观察客户开的店子需要注意的细节等都认真总结、细心揣摩,从中我汲取到了更多的养分。
(二)
尝试 工作中有很多事没开始做的时候感觉很难,但真正开始做的时候会发觉其实没有想象中的难。有些事不管怎样,首先要尝试,只要在尝试后慢慢调整策略就很可能成功。
有一次想坐公交车到经销商的仓库去,但当时整条路都在修,我们所知道的几路公交车都改线路了。因为目的地本身就有点偏,几乎不可能有别的公交车到那里了。当时情况有点急,也可以步行到经销商那里,但会耽误时间,最后我还是尝试问了一个大叔有没有公交到我们的目的地,我们很幸运的得到了肯定的回答。有时候看似不可能或很困难的事,其实只要去尝试,就有解决的机会,不去试的话连丁点机会都不会有。
(三)
总结 总结是很重要的,自己学到的、体会到的知识能不能升华、能不能使自己得到更多的启示就靠总结了。总结能使我反思自己工作中的不足,继而想出解决的办法;能使我举一反三,加快我学习、成长的速度;能使我更清楚我前进的方向。这次写实习报告的过程也就是我总结反思的过程,在写报告的过程中发现了自身很多不足之处,在今后我会很重视这些在实践中发生的问题,竭尽一切努力去改进。
五、实践总结 1.增加实践环节。学生们共同的体会之一是“书到用时方恨少”。从销售终端的商品管理、价格确定,到渠道控制、广告投放、新品开发及至市场调研,都需要宽泛的理论知识支撑。
2.承认教师指导社会实践的工作量。目前教师指导社会调查实习、毕业实习都没有计入教学工作量,所以不能调动教师积极性,也出现了上面三番五次强调
但总是难以见效的实际情况。
3.加大教学改革力度。以社会需求为导向,调整课程设置。实习中了解到,目前社会需要大量的营销人才,可是,我们的学生却难以找到合适的岗位。客观表现为企业一般招聘有几年工作经验的人。
人脸识别 协助破案 篇3
由于视频监控正在快速普及,在众多的视频监控技术当中,
人脸识别技术可以从监控视频图像中实时查找人脸,并与人脸数据库进行实时比对,
让警方快速抓捕逃犯。
今年8月以来,中国保钓事件继续发酵,北京、深圳、广州、成都、长春、西安等地,相继发生规模较大的反日示威游行,爱国热情举世睹目。但是令人遗憾的是,也有一些不法分子打着“拒绝日货”的旗号或者是幌子肆意打砸路过的日系车辆,给很多居民造成了严重的财产损失。
最近一段时间,深圳、西安等一些城市警方公布了这些人进行日系汽车打砸的截屏图像或者是头像,在警方的压力下,一些犯罪嫌疑人走向了自首,但是也有一些人还没有被抓获。
有不少网友表示,警方可以使用人脸识别技术将这些故意打砸日系汽车的人抓捕归案。人脸识别技术真的有这么神奇?
记者体验,2~3秒身份被识别
?清华大学、中国科学院计算技术研究所和中国科学院自动化研究是我国人脸识别领域最具权威性的三个研究基地。“利用我们的处理器进行数据处理,比普通的计算机进行数据处理要快7952.6倍,在进行海量的数据分析和处理时,它就可以充分显现出自己的技术优势。” 清华大学电子工程系教授苏光大说。
9月26日上午,在苏光大教授的办公室,记者见到了多种人脸识别设备并体验了它的功能。
按照要求,记者掏出自己的二代身份证,站在办公室安装好的一架专用视频设备面前,让头像进入设备,然后将二代身份证在视频设备的扫描区域扫描,大约2~3秒钟后,视频头像和二代身份证所截取的头像出现在电脑屏幕上:左边是身份证上的照片,右边则是刚刚拍摄到的头像。屏幕上的数据分析显示,视频头像和二代身份证头像为同一个人。
利用脸部特征辨认身份
?“人脸识别包括了构建人脸识别系统的一系列相关技术,有人脸图像库的建立、人脸检测和定位、特征提取、身份确认以及身份查找等。”苏光大表示,该技术应用的过程并不神秘,最大的特点是利用人的脸部特征作为一种身份辨认的方式——即通过摄像机采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行一系列技术处理,判断输入的图像中是否存在人脸。虽然指纹同样具备了人类特有的身份信息,但不够直观,而灵活的人脸识别技术不需要身体接触,就可以在不同的场合中实现各式各样的智能化应用。
根据目前的研究,进行人脸识别对比的具体方法有多种,比如几何特征人脸识别方法,根据眼、鼻、嘴等的形状和它们之间的几何关系进行对比识别。此外,还有基于特征的人脸识别法、神经网络人脸识别法等。
在没有该项技术以前,古今中外,抓捕嫌疑犯或者罪犯一般都需要画像,然后张贴通缉,但这种大海捞针式的传统方式不仅耗费时间、工作量大,其准确率也很低。
现在,警方大多通过发布信息和照片通缉在逃嫌犯,或者核对可疑人员的身份证件信息以确认其身份。但这种方式需要警察记忆,并在大范围人群中,用肉眼去搜索与嫌犯长得相似的目标人。这常常让很多犯罪嫌疑人很难在短时间内予以抓获。
按照苏光大的说法,对很多打砸者而言,查清他们的信息并不是难事,只要将视频采集到的清晰头像和第二代身份证信息库中的头像进行对比,立马就可以判断出一些打砸者的真实身份。如果打砸者在视频中的头像较小,或者并非正面照,且模糊不清,则需要首先将视频头像予以放大,然后根据视频留下的一些人脸轮廓信息进行人像重构,在重构完成以后再和第二代身份证信息库中的头像进行对比,将其真实信息搜索到的几率就比较大。
因为计算机识别和人眼识别不同,人在大范围内识别比较困难,计算机则可以在千万人中不断识别,并且永远不知道疲劳。
需要大级别的人像数据库
?1989年,苏光大课题组就承担了公安部“GA计算机人像组合系统”研究项目。这套人像组合系统的基本要件就是利用计算机进行画像,只要在计算机中建立储存有各种眼睛、鼻子、嘴巴、眉毛、脸型等信息的信息库,在受害人凭记忆描述犯罪嫌疑人的各种相貌特征时,操作人员在信息库取来与之相应的眼睛、鼻子、嘴巴……直到组合成一个与犯罪嫌疑人特征相像的人像。
与传统手绘肖像相比,这种计算机画像能够变得更加便捷,也很容易进行画像的修改与微调,如果视频图像和目击者记忆结合起来,其画出来的人像也会更加真实。1994年,武汉市公安局利用该技术破获了一持枪抢劫特大案件,成为我国利用人像组合破获的首起成功案例。之后,该系统成为公安部门的必备装备。
近些年,通过计算机画像自动在目标人员数据库中搜索犯罪嫌疑人也成为公安机关在侦破案件时常常采用的手段。苏光大表示,前提就是要建立有大级别的人像数据库系统。
“在我国,绝大多数人都在使用第二代身份证,而根据第二代身份证上的人像就可以构建出庞大的人像数据库。”他说,根据公安部门提供的身份信息,2008年1月,他们建立了国内首套千万级数据库的人脸识别系统,这也是目前中国最大的人脸识别系统。在进行一些案件侦破时,通过电脑画像,而后通过系统和数据库系统的人像资料进行对比,就可以迅速查找犯罪嫌疑人的真实身份。最初该系统建立了9.2万人的数据库,用四台微机并行处理,比对一次仅耗时58秒。
如数据完善,周克华案可能早就告破
?近些年来,视频监控得到了迅速发展,但在视频监控场景中,监测到的人脸图像往往很小,目前,最新的技术可以将人像重建技术与人像识别综合系统结合在一起,从而获得相对清晰的人像。
系列持枪抢劫杀人案制造者、公安部A级通缉犯周克华就是一个典型的例子。苏光大说,重庆恶性案件发生几天以后,他就受到重庆警方的邀请去进行电脑画像。根据重庆警方提供的视频信息,他和警方在上面找到了一个形迹最为可疑的犯罪嫌疑人,但是由于视频图像太小,看不清该人的面部信息,随后通过技术手段,苏光大将放大的犯罪嫌疑人的头部视频进行了电脑复原画像,并在2009年的4月1日就提供给了重庆警方,但是遗憾的是在随后和第二代身份证的信息对比中,并没有找出该犯罪嫌疑人。
nlc202309010615
“现在案件破了才知道,周克华根本就没有使用第二代身份证,因此搜不到他的信息。”苏光大说,但是当时如果重庆警方能够提供云南的重点人员信息库,2009年就可以抓住周克华。原来周克华曾经在2005年因贩卖枪支被云南铁路法院判刑并在当地服刑3年,他在服刑期间被采集的有档案样照,后来公安部通缉令的上半部分照片便是他的这一档案样照。苏光在你身边“潜伏”的那些眼睛大说,2009年搜索的信息库中如果有这一档案样照,周克华就很难逃脱。
“不久以前我利用周克华的电脑复原像和在一个包含他的档案样照的36万人的重点信息库中搜索,周克华在搜索中排到了第3的位置,而其相似度则高达71.53%。”他说。
在你身边“潜伏”的那些眼睛
在美国大片《越狱》中和科幻电影《终结者》中,都曾出现过这样的场景:一个人走到保险库大门前,由摄像头对他的脸进行扫描——他的脸部特征就是进入保险库的密码——如果符合,大门自动开启,如果不符,则警铃大作。这种过去在好莱坞间谍大片里才能见到的场景,目前在现实生活中亦成现实。如今在国内,已经有多种型号的人脸识别系统出现,除了保险库等一些重要区域,在门禁系统中也得到了广泛的推广应用。
观看比赛 ,快速比对观众身份
2008年,人脸识别系统就在北京奥运会上成功应用。这也是奥运史上首次采用具有“生物特征”的身份识别技术。在开幕式和闭幕式当晚,观众进入“鸟巢”,除了要被检查门票外,还必须逐一在进场通道前“拍照”。持票人刷票时,摄像头在一两秒钟内抓拍人脸,定位面部关键点,并提取特征,随后将持票人和票内信息的认证结果同时上传到计算机,计算机存有观众事先提交的包含正面免冠照片的身份信息,如果上传的持票人照片特征与计算机数据库中已储存的购票人特征重合度达到设定的阈值时,便能获得认证并通过。整个过程只需要两三秒时间。在而后的残奥会开幕式、闭幕式上,该系统也得到了有效的利用。
中国科学院自动化研究所博士张小博表示,在非控制状态下,虽然人脸识别技术的准确率目前还无法达到100%,但由于拥有识别速度快、不易被察觉等其它技术无法比拟的优越性,近些年得到日益广泛的应用,已经从原有的刑侦、安检等领域,进入物业管理、公司考勤等人们的日常工作和生活中。
手机只认主人的脸
记者在汉王科技公司看到,“人脸通”门禁系统已经实现了活体生物特征检测,可以进行非接触、自动人脸识别等功能。汉王科技的技术人员告诉记者,他们研发的这种人脸识别系统具有存储功能,只要把一些具有潜在危险性的“重点人物”脸部特征输入存储系统,识别系统发现后就会自动发出警报,向其安保中心“报警”。
现在在网站上,已经有能够应用到手机上的人脸识别软件下载,只要将该软件下载到手机上,开启后将手机屏幕对准自己的脸,手机上的摄像头打开识别自己的面目,信息核对准确后屏幕后就会自动打开,以后也只有是自己的脸出现,手机才能正常工作,反之,屏幕就会显示,“很抱歉,我不认识您!”。
人脸识别系统应用于高铁
今年4月13日,京沪高铁安检区域人脸识别系统工程开始招标,上海虹桥站、天津西站和济南西站三个车站安检区域将安装用于身份识别的高科技安检系统——人脸识别系统,以协助相关部门辨认乘客身份。
张小博表示,人脸识别经过40年左右的发展,现在的技术已经趋于成熟。尤其是美国9·11事件发生后,人脸识别技术备受关注。如今国际上最好的识别率现已达到99%以上,在短短1秒钟的时间里就可以识别出来。
北京师范大学信息科学与技术学院院长周明全对记者表示,人脸识别技术甚至为一些无名尸骨的识别提供了有效手段,从而帮助破获一些被害人已经死亡多年的复杂案件。加上专门开发的修饰软件,40分钟左右就可以使一具头骨复原面貌,从而为确定死者、警方破案提供最关键线索。而人脸识别在这个过程中扮演着至关重要的角色。
未来的人脸识别技术
特工哈纳韦戴上隐形眼镜,拿着手机,在火车站茫茫人海中寻找跟踪对象。而他戴的眼镜就像个录入摄像头,将看到的信息进行自动收集,通过无线传输与手机或者电脑相连,利用人脸识别功能,迅速与人物信息库中的人脸特征进行比对、匹配,从而在一眨眼的工夫,就迅速精准地锁定了一位男士。今年初,在国内热映的《碟中谍4》中的经典镜头,向观众生动地展示着人脸识别科技的魅力。
人脸识别实时跟踪成为可能
苏光大告诉记者,《碟中谍4》中的人脸识别科技并不是来自于虚幻,目前,利用人脸识别技术在茫茫人海中搜索目标对象并对其进行跟踪已经逐步变成了现实。如今,国内研发的系统已经可以进行“无线”人脸识别,即应用手机拍摄人脸图像,通过无线传输,发送到识别系统进行人脸识别,并把识别结果发回手机。
如今,美国维萨格公司的脸像识别技术在美国的两家机场大显神通,它能在拥挤的人群中挑出某一张面孔,判断他是不是通缉犯。而国内的一些公司已在开发人脸识别或物体识别技术,其产品可将识别抽取出的数据作为搜索请求并交由搜索引擎处理,从而锁定目标人物。
中国移动通信研究院主任研究员邓小宁指出,依托云计算的搜索引擎,人脸识别智能终端产品的功能已经比较强大,现在已完全有能力快速、准确地从图像中提取人脸信息,实现人物信息数据库比对。
身份造假将难上加难
未来随着技术的进一步成熟和社会认同度的提高,人脸识别技术将应用在更多的领域。 比如人脸识别门禁考勤系统,人脸识别防盗门等。而利用人脸识别辅助信用卡网络支付,就可以防止非信用卡的拥有者刷卡。
苏光大表示,现在比较先进的考勤系统、防盗门的人脸识别系统都需要对识别物的温度进行判断,或者进行人体活性的一些判断,这样照片、面具和打印人像就很难蒙混过关,另外一些系统还设置了只识别活体生物的程序,其在信用卡上的应用也可以如此进行设置。
而对电子护照及身份证进行身份识别,这或许是未来规模最大的应用。在国际民航组织已确定,从 2010年 4月 1日起,其 118个成员国家和地区,必须使用机读护照,人脸识别技术是首推识别模式,该规定已经成为国际标准。
人脸检测识别 篇4
关键词:考试身份识别系统,虹膜识别,人脸识别,Haar特征,识别准确率
高考、研究生入学等大型考试,最大特点就是准备时间长,参考人数多,公民关注度高。以往考试中,教育部一般按照当地学校提供的身份证、照片等个人信息制作准考证。在考试过程中,监考教师要在10分钟之内核查全部考生的身份。随着科技发展,流程化和集体作弊的技术日趋猖獗。替考团队可以伪造考生的信息,修改考生照片,甚至找外貌相似的学生替考。在不熟悉考生的情况下,监考教师很难迅速地判断考生身份,而且每个监考教师的判断标准参差不一,无法保证考试的公平性。
为了提高考试的规范性、权威性和公平性,杜绝考场出现替考的作弊情况,生物识别技术应运而生。生物识别技术利用考生独一无二的特点进行核查。相比传统的人工识别,生物识别速度快、识别率高、客观性强,并且简化了考试核查流程,节约了大量的人力物力,可以从根本上解决考试作弊问题,维护考试的公平。
1 生物识别的主要方法及特点
生物识别技术就是利用人类独一无二且易于识别的信息,用一组特别的算法进行取样核对,分析其特征,得到一组唯一的编码,如果编码与数据库中保存的相同就表明其验证成功,反之验证失败。这种技术跨越了生物领域、物理领域、计算机领域与统计领域,同时借助大数据、云端处理来准确高效地识别,从而实现了智能化和自动化,符合考场的要求和当代社会发展的趋势。
指纹识别是当今社会发展最为迅速的生物检测技术。指纹是最容易残留的个人信息,它包含的特征多,我们的双手至少有5000个可以识别的特征,现在国内外的指纹识别技术大都采用基于细节特征,即采用基于图像处理的指纹识别算法,有两种比较有代表性的指纹识别算法,一种是基于方向滤波增强,并在指纹细化图上提取特征的算法,另一种是直接从指纹灰度图上提取特征的算法[1,2]。由于指纹图像的噪音、皮肤弹性引起的非线性形变,或者在手指出汗或者有污渍的情况下,会出现不易识别的情况,导致识别过程中出现误差,影响识别率等。而且在大型考试中,由于考生人数庞大,因此设计的数据库很庞大,也不利于系统的运行和维护[3,4]。另外它还存在一个重大漏洞,就是当替考者使用指纹膜,甚至更隐蔽的透明指纹贴时,机器可能误判,这样一个不可避免的隐患使指纹不适合作为考场中取证的特征。
静脉识别系统用红外线提取考生静脉的分布及特点并作为判断依据来进行识别。用一组唯一的编码保存其特征值,若特征值与以前考生存储的信息相同,则可以进行判断。首先,静脉识别是活体识别,由于需要采集手部皮下的静脉图像,用红外对手背皮下的静脉图像进行照影,与手背表面的图像特征无关。所以手背表面的污渍或者天气炎热时出汗等带来的障碍均没有影响。另外双手无须接触设备,卫生安全,考生易于接受。在考场中使用静脉识别,安全性特别高。作为活体识别的静脉识别花费的代价太高昂,而且研究复杂。不利于在高考和研究生这样上百万人数的考试中大规模使用和推广,可以在今后选拔性更高且考生不多的情况下使用。
虹膜识别是一种不需要接触考生的生物识别技术。首先抓拍并确定人的整个眼部图像,在特定的算法下抓取虹膜的某些特征,这样就获取到了一组唯一的编码,如果与本地数据库中保存的编码信息一致,则可以判断其为本人。在考场中,虹膜识别无须接触机器就可以检测,方便快捷,仅仅数秒就可以给出结果,并且识别率很高[5]。但虹膜识别很难将图像获取设备的尺寸小型化,设备造价高,无法大范围推广,而且镜头可能产生图像畸变,而使虹膜识别的可靠性降低。
人脸识别需要对考生的面部进行扫描,通过系统特定的算法对其某些特征进行提取来识别人的身份特征[6,7,8]。人的五官、脸型等一些微小的特征都可以作为观察点来鉴别,将这些特征点编排得到一组独特序列,与数据库中已经存储好的数据进行比较,当达到一定阈值,就可以判断为本人,反之亦然。该技术需要考生在报名时提前存储其人脸信息,在考试时,只需简单拍摄一下就可以轻松识别,实现对考生身份的确认,以达到又好又快的检测和识别效果。相比于人工检查的繁琐与不确定性,其整个过程快速高效,很符合考场的环境。
2 一种人脸检测与识别方法
2.1 系统主要功能
该系统采用Visual C++编程实现,主要完成了三个功能:从给定的图像中检测出人脸区域并识别;从给定的视频流中检测出所有出现的人脸信息;检测出摄像头拍摄区域的人脸信息,显示相关信息。
该系统具体实现分为三个阶段:(1)训练。先采集人脸图像组成训练集,识别训练所需要的数据,保存每个人的代表脸;(2)检测识别。当再次输入图像、视频时,利用已知特征,截取图像或视频中的人脸区域;(3)身份认证。最后提取该区域人脸特征,与训练阶段得到的特征相对比,识别并显示相应的人物信息。
在人脸图像的训练阶段,常用的脸部特征包括基于面部的几何特征,基于模板的模板匹配特征,基于数学的主成分分析特征等。在本系统中,用到了两种特征:主成分分析特征和基于统计的Haar特征。其中,Haar特征用于人脸检测部分所需要的分类器,主成分分析特征用于人脸识别阶段。
在人脸检测与识别阶段,采用前一阶段训练得到的Haar特征分类器从输入的图像中截取出人脸区域,然后用前一阶段得到的主成分分析特征对截取到的人脸进行主成分分析,并与训练阶段得到的特征相对比,识别出相应的信息。
本文在统计学习的基础上,对待识别的对象、视频加以处理,从中提取人脸区域,提取所需要的人脸特征,与已经训练过的人脸相比较,识别出人物身份。图1给出了人脸检测与识别系统的组成。
2.2 图像的预处理方法
在图像处理过程中,图像增强是一个十分重要的环节。图像增强就是采用一系列技术来改善图像的视觉效果或将图像转换成一种更适合于人眼观察和计算机自动分析的形式。本文将所有待处理图像转换为灰度图像统一处理。由于受光线影响,人脸区域可能出现阴影或是整体区域显示暗淡。针对这一问题,本文采用直方图均衡化方法对图像进行增强处理。
2.3 人脸区域的检测方法
在实际应用中,输入的图像不可能是规则的截取人脸区域,所以,对于输入图像,应先找出图像中的人脸区域。从一幅图像里提取出人脸区域,就必须遍历图像,计算量将会大大增加。如何从一幅图像中快速准确地找出人脸区域是本文考虑的重要因素。
本文处理的主要是包含人脸以及背景的图像或是一幅图像中也可能含有多个人脸的图像;另外,在处理视频流时,图像较多,对速度要求较高。针对这几种要求,本文采用Haar特征作为人脸检测的依据,它具有检测准确,速度快的特点。
Haar特征分为三类:边缘特征、线性特征、中心特征和对角线特征,组合成特征模板。特征模板内有白色和黑色两种矩形,并定义该模板的特征值为白色矩形像素和减去黑色矩形像素和。Haar特征值反映了图像的灰度变化情况。例如:脸部的一些特征能由矩形特征简单的描述,例如:眼睛要比脸颊颜色要深,鼻梁两侧比鼻梁颜色要深,嘴巴比周围颜色要深等。但矩形特征只对一些简单的图形结构,如边缘、线段较敏感,所以只能描述特定走向(水平、垂直、对角)的结构。图2给出了特征模型。
对于图2中的A、B和D这类特征,特征数值计算公式为:v=Sum(白)-Sum(黑),而对于C来说,计算公式如下:v=Sum(白)-2*Sum(黑);之所以将黑色区域像素和乘以2,是为了使两种矩形区域中像素数目一致。通过改变特征模板的大小和位置,可在图像子窗口中穷举出大量的特征。图2的特征模板称为“特征原型”;特征原型在图像子窗口中扩展(平移伸缩)得到的特征称为“矩形特征”;矩形特征的值称为“特征值”。矩形特征可位于图像任意位置,大小也可以任意改变,所以矩形特征值是矩形模版类别、矩形位置和矩形大小这三个因素的函数。故类别、大小和位置的变化,使得很小的检测窗口含有非常多的矩形特征。
由于训练样本通常有近万个,并且矩形特征的数量非常庞大,如果每次计算特征值都要统计矩形内所以像素之和,将会大大降低训练和检测的速度。因此引入了一种新的图像表示方法——积分图像,矩形特征的特征值计算,只与此特征矩形的端点的积分图有关,所以无论此特征矩形的尺度变换如何,特征值的计算所消耗的时间都是常量。这样只要遍历图像一次,就可以求得所有子窗口的特征值。
Adaboost是adaptive boost的缩写,它是一种迭代算法。其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。其算法本身是通过改变数据分布来实现的,它根据每次训练集之中每个样本的分类是否正确,以及上次的总体分类的准确率,来确定每个样本的权值。将修改过权值的新数据集送给下层分类器进行训练,最后将每次训练得到的分类器融合起来,作为最后的决策分类器。使用Adaboost分类器可以排除一些不必要的训练数据特征,并将重点放在关键的训练数据上。
2.4 人脸识别方法
对于一张截取的人脸区域图,由于受拍摄角度、光照、表情、饰物、年龄等的影响,也会表现出很大的差异;对于这些差异,如何提取特征,准确识别出相应的人脸,是人脸识别研究的重点。
在人脸识别阶段,本文所要处理的是检测阶段提取的规则的人脸,且识别的人脸一定是事先采集过的人脸图像,在训练集中对所有人脸提取PCA特征,并保存。识别时,采用主成分分析的方法提取待识别人脸特征,并与训练阶段的人脸特征相比较,识别出相应的人脸。
完整的PCA人脸识别包括如下步骤:人脸图像预处理、读入人脸库、训练形成特征子空间、将训练图像和测试图像投影到上一步骤中得到的子空间上、选择一定的距离函数进行识别。下面详细给出整个过程。
(1)读入人脸库。归一化人脸库后,将库中的每人选择一定数量的图像构成训练集,其余构成测试集。设归一化后的图像是n×m,按列相连就构成N=n×m维矢量,可视为N维空间中的一个点,可以通过K-L变换用一个低维子空间描述这个图像。
(2)计算K-L变换的生成矩阵。所有训练样本的协方差矩阵为(以下三个等价):
是平均人脸,M是训练人脸数,协方差矩阵CA是一个N×N的矩阵,N是xi的维数。为了方便计算特征值和特征向量,一般选用第2个公式。根据K-L变换原理,所求的新坐标系即由矩阵A·AT的非零特征值所对应的特征向量组成。直接求N×N大小矩阵CA的特征值和正交归一特征向量是很困难的,根据奇异值分解原理,可以通过求解AT·A的特征值和特征向量来获得AT·A的特征值和特征向量。在计算得到CA的所有非零特征值从大到小排序,1≤r<M及其对应的单位正交特征向量后,可以得到特征空间,从而可以计算一幅图像X在特征空间上的投影系数(也可以理解为X在空间U中的坐标):
(3)识别。利用公式(4),首先将所有训练图像进行投影,然后对于测试图像也进行同样的投影,采用判别函数对投影系数进行识别。
2.5 实验结果与分析
本文的具体步骤主要包括训练阶段、识别阶段。训练阶段:在CAS-PEAL人脸数据库中选取40个人的人脸图像,包括20个男性和20个女性,每个人选取的有不同表情的、带有饰物、不同光照的、正常表情的一共12幅图像,共480幅。其中选取240幅(每人6幅)作为训练对象,在这6幅图像中选取一幅作为这个人的代表图像。训练过程分为两步:
(1)对这240幅图像做人脸检测、加入到人脸库、输入个人信息、输入密码,这些数据都将作为识别阶段的识别依据,所输入的个人信息将写入单独文件保存;
(2)对这240个归一化的人脸进行K-L变换,提取这240幅人脸的平均脸、特征向量矩阵,并把这240幅人脸图像投影到特征向量矩阵,保存特征值。
识别阶段:
(1)读入图像,本文选择灰度图像作为处理对象,所以在接收到一幅图像时,首先转换为灰度图像;
(2)预处理。本文采用直方图均衡化方法处理减弱光线带来的影响,通过把原图像的直方图通过变换函数修正为分布比较均匀的直方图,从而改变图像整体偏暗或整体偏亮,灰度层次不丰富的情况;
(3)人脸检测。利用训练阶段所得的Haar特征分类器,检测图像中的人脸区域并标记,同时,将检测到的人脸区域截取保存,将截取区域显示为“当前脸”。当一幅图像中含有多幅人脸时,检测标记出多个人脸,点击“下一个人脸”时,则可识别一幅图像中不同的人脸;
(4)人脸识别。点击“识别”,本文将识别当前显示在“当前脸”区域的人脸。提取当前检测到的人脸,先做预处理,然后进行K-L变换,投影到训练阶段所得的特征脸矩阵,得到的特征值与训练阶段的特征值求欧氏距离。将最小的欧氏距离对应的人脸作为识别人脸,并显示出对应的代表图像。
本文在Visual C++平台,利用MFC库编程实现。鼠标左键双击界面,显示运行主界面,主界面中包括当前处理的步骤等。如图3所示,按钮“打开图像”、“打开视频”、“打开摄像”分别打开不同的数据来源,对于这三种数据来源,有其不同的用处。图像将主要用于构建人脸数据库、输入个人信息、输入个人代表图像、识别当前图像人物身份。对于视频文件,本文主要监测视频中出现的人物,并显示其相应的信息。对于摄像头采集到的数据,主要对其进行认证登陆处理。其中,视频文件、摄像头实时视频文件也可转化为图像来源。以下将对三种不同来源的数据处理过程分别加以说明。
当处理对象为图像时,打开的图像显示在“待检测图像区域”,当点击“人脸检测”时,将检测显示在“待检测图像”区域的图像,检测完成后,以方框的形式标记在待检测图像中。此时,若图像中没有检测到人脸区域,将弹出“未检测到人脸”的提示框;当检测到人脸区域时,标记并将显示在“检测到的人脸”区域,这个是归一化的人脸,是识别的具体对象。此时,若检测到多幅人脸,点击“下一个脸”按键,可依次把各个人脸显示在“检测的人脸”区域。人脸检测结果如图4所示。
此时,若点击“添加到库”,则将“检测到的人脸”区域显示的人脸图添加到人脸库,同时弹出个人信息输入界面,提示输入个人信息。输入完成后,点击确定,系统自动保存个人信息,并把该人脸图加入到人脸库。当添加新的人脸后,一定要重新训练,即点击“训练”按钮。在图4界面时,当点击识别按钮时,本文将对检测到的人脸进行识别,并将识别结果显示在个人信息区域,给出个人姓名,以及识别到的具体图像。如图5所示。
当打开的数据是视频文件时,本文弹出“Vedio”视频播放窗口,当检测到视频文件中的人脸区域时,本文将视频截图显示在主界面的“待检测图像”区域。然后对此图像按照图像人脸检测方法进行,并弹出所有检测到的人物信息。如图6所示。
本文完成了对图像、视频文件、实时视频人脸检测提取、人脸识别,人脸识别平均正确率为90%,具有较高的安全性。关于其缺陷可能的原因如下:
(1)Haar特征训练时,针对的是正常人脸区域,而且光线较好。当遇到戴有饰物或是光线变化的人脸时,检测效果不够理想;
(2)主成分分析的方法对于表情变化较大的人脸,或是人戴有饰物时,容易识别错误,这可能是训练人脸数量有限造成的。
3 结论
本文对各个领域中广泛使用的4种生物识别技术进行了剖析,设计了人脸防作弊检测技术。本文将多种特征结合起来进行检测、识别,先用Haar特征与Adaboost分类器相结合的方法对人脸与非人脸区域加以区分,实现对人脸的检测;而后对检测到的人脸进行分割处理,最后利用主成分分析的方法对人脸进行识别。
参考文献
[1]刘成,彭进业.基于多任务学习的自然图像分类研究[J].计算机应用研究,2012,29(7):2773-2775.
[2]毕雪芹,苏艳娟,王琪.嵌入式指纹识别系统的设计及试验研究[J].国外电子测量技术,2015,2:50-53.
[3]宋思瑶.指纹识别在学校考试系统中的应用[D].吉林大学,2011.
[4]马建敏.基于指纹识别的考试管理系统设计与实现[D].河北科技大学,2011.
[5]陈晴,易开军.现代虹膜识别技术在考生身份验证系统中的应用初探[J].工业和信息化教育,2015,8:81-85.
[6]李鑫,张俊.基于深度信念网络和多任务学习的人脸识别[J].电脑知识与技术,2016,12(17):165-168.
[7]刘向东.基于PCA算法人脸识别的MATLAB实现[J].电脑知识与技术,2016,12(12):193-194.
人脸识别技术是什么原理 篇5
1面像识别原理2、1、1面像识别技术概述
面像识别是近年来随着计算机技术、图象处理技术、模式识别技术等技术的快速进步而出现的一种崭新的生物特征识别技术。生物识别技术是依靠人体的身体特征来进行身份验证的一种高科技识别技术,如同人的指纹、掌纹、眼虹膜、DNA以及相貌等人体特征具有人体所固有的不可复制的唯一性、稳定性、无法复制一样,不易失窃或被遗忘。由于每个人的这些特征都不相同,因此利用人体的这些独特的生理特征可以准确地识别每个人的身份。
随着计算机技术的迅速发展,人们开发了指纹识别、声音识别、掌形识别、签名识别、眼纹(视网膜)识别等多种生物识别技术,目前许多技术都己经成熟并得以应用。而面像识别技术则是生物识别技术的新秀,与其他识别技术相比较,面像识别具有简便、准确、经济及可扩展性良好等众多优势,可广泛应用于安全验证、监控、出入口控制等多个方面。
面像识别技术包含面像检测、面像跟踪与面像比对等课题。面像检测是指在动态的场景与复杂的背景中判断是否存在面像并分离出面像,面像跟踪指对被检测到的面像进行动态目标跟踪,面像比对则是对被检测到的面像进行身份确认或在面像库中进行目标搜索。
面像检测分为参考模板、人脸规则、样本学习、肤色模型与特征子脸等方法。参考模板方法首先设计一个或数个标准人脸模板,然后计算测试样本与标准模板之间的匹配程度,通过阀值来判断是否存在人脸;人脸具有一定的结构分布特征,人脸规则即提取这些特征生成相应的规则以判断测试样本是否包含人脸;样本学习则采用模式识别中人工神经网络方法,通过对面像样本集和非面像样本集的学习产生分类器;肤色模型依据面像肤色在色彩空间中分布相对集中的规律来进行检测;特征子脸将所有面像集合视为一个面像子空间,基于检测样本与其在子空间的投影之间的距离判断是否存在面像。
上述方法在实际系统中也可综合采用。
面像跟踪一般采用基于模型的方法或基于运动与模型相结合的方法,另外,肤色模型跟
踪也不失为一种简单有效的手段。
面像比对从本质上讲是采样面像与库存面像的依次比对并找出最佳匹配对象。因此,面像的描述决定了面像识别的具体方法与性能。目前主要有特征向量与面纹模板两种描述方
法,特征向量法先确定眼虹膜、鼻翼、嘴角等面像五官轮廓的大小、位置、距离、角度等等
属性,然后计算出它们的几何特征量,这些特征量形成一描述该面像的特征向量;面纹模板
法则在库中存储若干标准面像模板或面像器官模板,在比对时,采样面像所有象素与库中所
有模板采用归一化相关量度量进行匹配。另外,还有模式识别的自相关网络或特征与模板结
合的方法。
面像识别技术的最新进展是可以通过摄象机来搜索捕捉识别活动的人像,而不仅仅
识别照片。例如,最近由美国新泽西州Visionics公司开发的面像局部特征分析法识别
系统,仅用一部摄象机和一台计算机,即可在人群中识别出某个人来。
该系统利用摄象机扫描拍摄的某一区域,搜索有可能是人脸的形状。然后在存储器
中搜索已事先存入的与之类似的面部特征。为了确认扫描到的眼睛、鼻子和嘴等特征就是一
个活人而不是人体模型或图片,系统还对眨眼或其他可以提供信息的面部动作进行搜索。
然后系统对组成面部图像的像素进行分析。它将每个像素点的明暗度与相邻点进行比较,查找明暗度向周围呈放射突变的区域。在眉骨、眼睛、或者其他突起的特征,比如颧骨和鼻子等处,都会出现这种突变。系统将勾勒出每一个这种像素点的位置,这些点称为“参照点”然后在点之间连线,形成一个由三角形构成的网络。
系统将测量每个三角形的角度,生成由672个1和0组成的数来描述一张面孔。之后程
序尝试从它的数据库中找出与该数据相匹配的类似记录。这种匹配不可能绝对理想,因此软
件会将相似程度分为不同的等级。软件是根据骨络结构描绘参考点的,因此胡须、化妆和眼
睛等伪装都不可能骗过它。
用于扑捉面部图像的除了为标准视频外,近来的发展趋势是热成像技术。热成像技术通
过分析由面部的毛细血管的血液产生的热线来形成面部图像,与视频摄像头不同,热成像技
术并不需要在较好的光源条件下,因此即使在黑暗情况下也可以使用。并可更好地排除胡须、头发以及化妆引起的面部变化的干扰。2、1、2面像识别过程
1.建立面像档案:可以从摄像头采集面像文件或取照片文件,生成面纹(Faceprint)编码;
2.获取当前面像,可以从摄像头捕捉面像或取照片输入,生成其面纹;
3.将当前面像的面纹编码与档案中的面纹编码进行检索比对。
“面纹”编码方式是根据脸部的本质特征和开头来工作的,它可以抵抗光线、皮肤色调、面部毛发、发型、眼镜、表情和姿态的变化,具有强大的可靠性,使得它可以从百万人中精确地辨认出一个人。
上述整个过程都自动、连续、实时地完成,而且系统只需要普通的处理设备。几乎所有的生物测量过程对人们来说都是一种干扰。指纹和掌纹的测定需要人们将手放在玻璃表面。虹膜扫描需要用激光照射你的眼睛。面部识别最大的优越性在于它的方便性, 快速性,而且是非侵扰的。面部识别无需干扰人们行为而达到识别效果,无需为是否愿意将手放在指纹采集设备上,或对着麦克风讲话,或是将他们的眼睛对准激光扫描装置而进行争辩。你只要很快从一架摄像机前走过,你就已经被快速的检验。2、1、3面像识别技术应用范围
面像识别技术作为生物识别技术体系的后起之秀,将有着十分广泛的应用前景。可应用于诸多领域,如出入口控制、银行金融系统、公安追辑嫌疑犯、反恐怖斗争以及互联网中等等。在我国开展的“追逃”斗争,如果能利用面像识别技术,则可大大提高工作效率,并能对犯罪分子产生极大的威慑力量。使用面像识别系统只要在重要的车站、码头、机场、海关出入口附近架设摄像机,系统即可在无人职守的状态下,自动捕捉进、出上述场所的人员的头像,并通过计算机网络将面像特征数据传送到计算机中心数据库,自动与面像数据库中的逃犯面像比较,迅速准确地作出身份判断。一旦发现吻合的头像,可以自动报警并记录。
我国银行金融系统对安全控制有着极高的要求,如电子商务信息系统、金库的安全设施、保险柜、自动柜员机的使用等。由于近年来金融诈骗、抢劫发生率有所增高,对传统安全措施提出了新的挑战。面像识别技术不需要携带任何电子、机械“钥匙”,可以杜绝丢失钥匙、密码的现象,如果配合IC卡、指纹识别等技术可以使安全系数成倍增长。同时,在ATM自动取款机上应用面像识别技术,可以免除用户忘记密码的苦恼,还可以有效防止冒领、盗取的事件发生。
目前,在我国,面部识别技术的研究和应用还刚刚开始,但在欧美等发达国家这一技术已被应用在许多场所。特别是“9.11”恐怖事件之后,美国警方率先在冰岛国际机场、美国波士顿机场、美国奥克兰机场、美国亚特兰大机场、美国休斯敦机场等开始应用这一先进技术,借助闭路监视系统监控扫描人群自动搜寻警方所需要的恐怖分子目标。
蒋遂平:人脸识别技术及应用简介人脸识别的分类
1.1 鉴别、验证和监控
(1)鉴别(identification):鉴别回答“这是谁?” 将给定的人脸图象与计算机中存储的N个人的图象逐个比较,输出M幅图象,这些按与给定图象的相似度从大到小排列,再由人来确定这是谁。通常,一个人在计算机中只存储一幅正面图象。
(2)验证(verification):验证回答“这是否为某人?” 将给定的人脸图象与与计算机中存储的某人的图象比较,回答给定的图象是否为某人的图象。通常,一个人在计算机中存储多幅不同角度的图象。
(3)监控(watch list):监控同时具有鉴别和验证,回?quot;这是否为要找的人?"(Are you looking for me?)。将未知身份的人的图象输入计算机,计算机决定这个人是否在监控名单中,如果在,还必须确定这个人的身份。
1.2 人脸识别和人头识别
(1)人脸识别:输入给计算机识别的人脸图象,只包括人的脸部部分,没有背景、头发、衣服等。这时,计算机在进行真正的人脸识别。
(2)人头识别:输入给计算机识别的人脸图象,除了包括人的脸部有皮肤的部分外,还有部分背景、头发、衣服。这时,人脸的五官特征是次要的,头发、背景、人脸轮廓等是主要特征,一旦头发、背景等变化,识别率下降。
1.3 自动与半自动人脸识别
(1)自动人脸识别:输入到计算机的图象可以是包含人脸的图象,由计算机自动检测人脸部分进行分割后,进行识别。最初人们认为人脸检测是件容易的事,后来发现人脸检测可能比人脸识别更困难(特别是在灰度图象情况下,这时没有运动信息和肤色信息可利用),人脸检测已经是一个独立的研究课题。
(2)半自动人脸识别:采用人工确定人脸图象中两眼各自的中心位置,计算机根据这两个位置分割人脸图象,进行识别。常用于人脸鉴别。人脸识别的性能
2.1主要性能指标
测量人脸识别的主要性能指标有:(1)误识率(False Accept Rate, FAR):这是将其他人误作指定人员的概率;(2)拒识率(False Reject Rate, FRR):这是将指定人员误作其它人员的概率。
计算机在判别时采用的阈值不同,这两个指标也不同。一般情况下,误识率FAR 随阈值的增大(放宽条件)而增大,拒识率FRR 随阈值的增大而减小。因此,可以采用错误率(Equal Error Rate, ERR)作为性能指标,这是调节阈值,使这FAR和FRR两个指标相等时的FAR 或 FRR。
2.2 影响人脸识别性能的因素及解决方法
(1)背景和头发:消除背景和头发,只识别脸部图象部分。
(2)人脸在图象平面内的平移、缩放、旋转:采用几何规范化,人脸图象经过旋转、平移、缩放后,最后得到的脸部图象为指定大小,两眼水平,两眼距离一定。
(3)人脸在图象平面外的偏转和俯仰:可以建立人脸的三维模型,或进行三维融合(morphing),将人脸图象恢复为正面图象。
(4)光源位置和强度的变化:采用直方图规范化,可以消除部分光照的影响。采用对称的从阴影恢复形状(symmteric shape from shading)技术,可以得到一个与光源位置无关的图象。
(5)年龄的变化:建立人脸图象的老化模型。
(6)表情的变化:提取对表情变化不敏感的特征,或者将人脸图象分割为各个器官的图象,分别识别后再综合判断。
(7)附着物(眼镜、胡须)的影响。
(8)照相机的变化:同一人使用不同的照相机拍摄的图象是不同的。应用情况
在无数影视或新闻中出现过这样的场景:警方利用人脸识别技术抓住了罪犯。然而,在现实生活中,人脸识别技术的效果并不令人满意。
美国陆军实验室在13周时间内,用270人的图象测试一个人脸识别系统,发现识别率只有 51%。这套系统在机场中进行测试时,存储了250人的图象,其中的15人在1个月内通过摄影机958次,只有455次被正确辨认,识别率只有47%。在美国一个机场开展的一项为期8周的公开测试中,使用一家公司的人脸识别系统,在4个星期出错率为53%。在另一个机场开展的一项为期90天的测试中,人脸识别系统发出的错误警报也太多。
人脸识别技术商业前景广阔 篇6
继由清华大学与梓昆科技联合研发的我国首台具有人脸识别支付功能的金融安全设备ATM机6月初正式发布,人脸识别系统与声纹识别技术在不久的将来亦将应用于高校测试考生身份识别,人脸识别技术市场将迎来爆发。
人脸识别技术打开更多商业化应用
据悉,由外研社开发研制的“FiF测试系统”是国内首款支持高校大规模外语在线测试全流程信息化管理及听、说、读、写、译全题型智能化评阅的新一代数字产品,不久将来还将融入人脸别技术,用于高校测试高考考生身份识别。这是我国人脸识别技术又一大突破。
人脸识别,是基于人的脸部特征信息进行身份识别的一种生物识别技术,集成了人工智能、机器识别、机器学习、模型理论、专家系统、视频图像处理等多种专业技术,同时需结合中间值处理的理论与实现,是生物特征识别的最新应用。人脸识别通常要用摄像机或摄像头采集含有人脸的图像或视频流,包括人脸图像采集、人脸定位、人脸识别预处理、身份确认以及身份查找等,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部的一系列检测验别技术,通常也叫做人像识别、面部识别。人脸识别系统成功的关键在于是否拥有尖端的核心算法,并使识别结果具有实用化的识别率和识别速度。
人脸识别系统的研究始于20世纪60年代,80年代后随着计算机技术和光学成像技术的发展得到提高,而真正进入初级的应用阶段则在90年代后期,并且以美国、德国和日本的技术实现为主,到现在技术日益成熟,并得到越来越广泛的普及应用。
在生物识别市场上,人脸识别的应用已经慢慢超出了安防领域,广泛用于政府、军队、银行、社会福利保障、零售、电子商务、安全防务等领域。比如:利用人脸识别进行手机解锁及电脑登录认证;一些广告公司把人脸识别技术应用在户外广告上进行人流量统计;社保系统纷纷启用人脸识别技术,规范领取人资格;在大超市,无须各种卡,只要应用“刷脸”技术就能进行支付;等等。在未来的某一天,你钱包里不再存放现金,甚至你出门连手机和钱包都不用带,就能在周边的便利店买东西——因为你可以“刷脸”支付。与“刷脸”支付同理的是,也可进行“刷脸提款”。当一个客户在提款机上提款时,一台摄像机对该用户的眼睛扫描,然后迅速而准确地完成用户身份鉴定,这个客户就可径直办理完提款业务。这是美国德克萨斯州联合银行的一个营业部中发生的一个真实的镜头。
你或许已经听说过“谷歌钱包”支付系统,它采用NFC技术,轻松触摸智能手机就可进行结算支付。还有一种使用“地理围栏”技术的服务已现世,用户可以在进出商店时登入登出。但这还不是最潮的,最先进的技术是无需借助额外设备,只要你亮出自己的脸蛋,在商店内如入无人之境,想买啥买啥,这项技术绝对是一个历史性的跨越。
一家英国酸奶店老板称,这种支付方式比刷卡或现金甚至手机支付还要快,排队等待付款的顾客明显减少了。据悉,不仅是英国、美国,“刷脸”消费在日本、韩国、澳大利亚、芬兰等国家也悄然崭露头角,极大方便普通百姓。
政策支持促使巨头跑步进入
抛开某些方面原因,国家政策的强烈支持可以说是人脸识别崛起的重要因素。随着近些年来,平安城市、智慧城市在全国各个城市大力推广,我国安防市场的需求也随之迅速升温,人脸识别已经开始被列为平安城市、智慧城市使用过程中的强制标准。这种情况的出现,对于人脸识别的推广无疑是一种非常有力的推动。
而随着技术的日渐成熟、应用场景的日益丰富以及政策支持逐步明确,人脸识别行业将进入大规模商业化阶段,成为市场的下一个角逐热点。人脸识别产品当前已逐渐广泛应用于金融、司法、军队、公安、边检、政府、航天、电力、工厂、零售、电商、教育、医疗及众多企事业单位等领域。随着技术的进一步成熟和社会认同度的提高,人脸识别技术将应用在更多的领域。
2015年以来,腾讯、阿里、民生银行等多个巨头纷纷加码人脸识别产业。继马云在德国汉诺威电脑展上亲自展示支付宝的人脸识别技术“SmiletoPay”,完成“刷脸”支付后,阿里巴巴将与国内生物识别领域知名企业海鑫科金旗下的海鑫智圣合作共同建设“阿里巴巴人脸比对系统”,利用海鑫智圣人脸识别核心算法在淘宝开户认证过程中引入“人脸比对”及“真人检测”。而另一大国内巨头腾讯财付通表示已与中国公安部所属的全国公民身份证号码查询服务中心达成人像比对服务的战略合作。腾讯与微众银行正在对金融、证券等业务进行人脸识别的支付应用尝试。而一直坚持创新为先的民生银行率先将人脸识别引入客户身份认证环节,目前已经在移动智能柜员系统、移动运营、客户化运营和柜台业务XBank业务系统中采用人脸识别技术。
而国外巨头动手更早,去年比尔·盖茨在博鳌演讲中指出“深度学习”和“计算机视觉”将是IT界下一个大事件。Google于2014年收购了4家人工智能初创公司均涉及深度学习,其中3家涉及计算机视觉。
市场人士指出,国内外巨头纷纷加码人脸识别技术,这可能直接助推产业的爆发性增长,脸识别产业即将迎来大规模商业化。
人脸识别概念股有望迎来爆发
识别技术准确率的日益提升以及用户习惯的培养,让人脸识别从安防军事领域不断延伸,全面打开线上商业化应用,也有助于线下生物识别格局的改变。
首先,随着用户习惯深入以及对人脸识别的技术认可,未来刷脸登录、刷脸交友等新型线上应用将迎来爆发,线上第三方认证服务平台将极大受益于线上多方需求的拓展;其次,随着人脸识别技术的革新,智慧银行VTM、新型安防系统以及后端海量视频数据检索等项目将大量上线,人脸识别效果的提升将打开前期受效果制约的应用场景;最后,互联网+是IT界当前风口,那么人工智能以及人机交互将是IT界的下个风口,布局人脸识别就是布局人工智能以及人机交互的未来。
nlc202309040220
我国人口规模巨大,经济增长迅速,对可靠的人脸识别技术的各方面需求越来越迫切。一旦人脸识别得以推广,人工智能和人机交互成为人脸识别下一个商业爆发点,其发展潜力与前景将十分美好。据统计数据显示,仅在中国大陆,在未来三年内有望形成年销售额过百亿,并在未来十年内则有望形成年销售额过千亿的人脸识别市场规模。
根据相关数据显示,全球市场对生物识别产品的需求在2010年已经达到百亿美元,近几年,生物识别设备的综合性年增长率也达到25%左右。国际生物识别集团(IBG)的报告《生物识别市场与产业报告2009-2014》显示,在各种生物特征识别技术中,指纹识别系统所占份额最大,为66.7%;除此之外,人脸识别占到11.4%,虹膜识别、语音识别、静脉识别和掌形识别各占8.0%、3.0%、2.4%和1.8%。以上数据显示,人脸识别有较大发展潜力。
安兴证券认为,人脸识别产业即将迎来大规模商业化,建议布局技术龙头。作为互联网金融的基础设施,人脸识别产业将充分受益于“线上身份认证”产业的爆发;同时智能安防、后端监控自动检索等前期受制于识别效果的应用空间也将被打开。看好人脸识别公司的当前发展空间,更看好其在人工智能领域的先入优势与技术积淀。未来像佳都科技、科大讯飞、川大智胜、汉王科技、欧菲光等这样致力于人脸识别技术的公司前景十分看好。
人脸识别技术开发尚有阻碍因素
与其他类型的生物识别比较,人脸识别具有无须被采集对象配合、无须采集对象和设备直接接触、可以在同一场景中对多个人脸进行分拣、判断及识别等优点。这些特点使得人脸识别系统工作效率高、准确度高,且效果较好。然而,既便如此,我们也无法忽视人脸识别技术在研发和应用中的阻力因素。
众所周知,所有人的脸部结构都是相似的,甚至人脸器官的结构外形都很相似。这样的特点对于利用人脸进行定位是有利的,但是对于利用人脸区分人类个体却是不利的。另一方面,人脸的外形很不稳定,人可以通过脸部的变化产生很多表情,而在不同观察角度,人脸的视觉图像也相差很大。另外,人脸识别还受光照条件(例如白天和夜晚,室内和室外等)、人脸的很多遮盖物、年龄等多方面因素的影响。加上整容技术的进步,人们对脸部可以作出更多的改变,这就又给人脸识别技术出了一道难题。
还有,随着人脸识别技术在市场上的应用越来越广泛,国际上出现了很多反对的声音,谴责人脸识别系统随意收集脸部信息侵犯了个人隐私。
另外,人脸识别技术已得到广泛的认同,但其应用门槛仍然较高:技术门槛高(开发周期长),经济门槛高(价格高),这也影响其推广应用。
责编:范颖华
人脸检测识别 篇7
人脸识别技术目前较为成熟, 人脸识别系统在机场、车站、码头、海关及商场、住宅区等场所有着广泛的应用, 2008年北京奥运会期间, 为了防止恐怖事件的发生, 很多的大型场馆都安装了人脸识别智能监控报警系统, 该系统是通过建立自动人脸识别报警服务网, 对于运动员、教练、场馆工作人员, 以及后勤、食品运送人员采用摄像机自动识别, 对未经过登记授权进入场馆的可疑人员, 系统则向网络报警中心报警。但是, 目前的人脸识别系统设备体积较大, 移动性能差, 不适合个人携带, 民警在外出办案、巡逻时往往只能靠照片比对或者记忆来核实嫌疑人的身份, 给办案工作增加了难度。
在手机的照相、摄像功能和彩色显示功能变得越来越普及, 已经成为众多手机的标准配置的今天, 能否将CBIR技术与手机通信技术相融合, 设计更为便捷的识别系统, 这是本文要涉及的问题。
1 CBIR技术
上世纪9 0年代早期研究者们提出了基于内容的检索CBIR (Content Based Image Retrieval) , 从可视化角度来对图像检索进行探讨。所谓基于内容的图像检索, 是从图像库中查找含有特定对象的图像 (也包括从连续的视频图像中检索含有特定对象的视频片段) 。它区别于传统的检索手段, 融合了图像理解、模式识别、人机交互等多种技术, 从而可以提供更有效的检索手段并实现自动化检索。CBIR作为信息检索中的一个重要分支, 有着重要的理论研究意义和市场应用前景, 例如生物学领域、医学领域、出版领域以及军事、考古、版权保护、旅游、建筑设计、天文学、地理信息系统、历史学、犯罪取证等领域。
1.1 典型基于CBIR技术的检索系统
在CBIR领域, 经过十几年的理论研究, 产生了许多比较成熟的基于图像特征检索的算法, 并相应的研发出了一些有价值的系统:
(1) QBIC系统
QBIC系统由IBM Almaden研究中心研究开发, 是基于内容检索系统的典型代表。QBIC系统提供了对静止图像和视频信号的检索手段。在静止图像检索中, QBIC系统为使用者提供了颜色、纹理、草图、形状、多物体等多种检索方法, 并提供了根据样本图像进行相似性检索的方法。在视频检索中, 包括了分镜头检测、主运动估计、建立层描述、通过拼接完成代表帧生成等多种视频处理手段, 并在此基础上提供了通过物体运动、摄像机运动的附加视频检索手段。
(2) Virage系统
由加州大学圣地亚哥分校 (UCSD) 开发的Virage系统, 支持颜色、颜色布局、结构和纹理的检索, 而且可以对四方面任意组合并制定相应的权重。
(3) Photobook系统
Photobook系统是MIT的媒体实验室在1994年开发研制的用于浏览和搜索图像的一套交互工具。图像在装入时按面部特征、形状或纹理特性自动分类, 图像根据类别通过显著语义特征压缩编码。
(4) VisualSEEK与WebSEEK系统
VisualSEEK与WebSEEK系统美国哥伦比亚大学图像和高级电视实验室开发的, “基于内容”的图像/视频检索系统。
(5) iFind系统
M S给出了一个结合语义与视觉特征信息的图像相关反馈检索系统iFind。系统通过图像的标注信息构造语义网络, 并在相关反馈中与图像的视觉特征相结合, 有效地实现了在两个层次上的相关反馈, 在基于内容的图像检索中取得了较为理想的效果。
(6) Mires系统
Mires系统由中国科学院计算技术研究所研发, 根据设定不同权值的颜色、纹理、形状特征进行检索。
(7) MARS
MARS系统是数据库管理系统、计算机视觉和信息检索多个领域交叉的结果。MARS不注重找到一个单一的特征表达, 而是寻找一个动态的适应不同应用和不同用户的检索机制。
1.2 基于CBIR技术的Web搜索引擎
1.1中的系统多数是基于图像的底层视觉特征进行的检索, 主要利用图像的颜色、纹理、形状等进行相似度比较, 并没有完整的Web实现方案, 距离普遍使用相去甚远。目前完整实现Web化的主要有两个网站:
(1) http://www.like.com/, 该网站实现了对服饰的搜索, 即通过提交衣服、鞋帽、手饰的照片在该站内搜索, 实现匹配后, 网站将返回该服饰的相关信息, 但该系统的最大局限性在于, 搜索的内容只能是服饰, 并且是世界知名产品。
(2) http://www.polarrose.com/, 瑞典风险企业PolarRoseAB公开了名为PolarRose的免费网线面部图像检索服务。该服务是依据该公司拥有的二维图像三维模型转化技术, 并综合了用户输入数据等信息的面部识别技术开发, 该服务是结合在客户端运行的软件和服务器端的处理功能而实现的。客户端软件以电脑网络浏览器Firefox和Internet Explorer的客户端软件的形式对外公开。当用户浏览网站并显示含有人物面部图像的静态图像时, 上述客户端软件就会在人物面部部位产生一个小标志。点击该标志, 就能检索出面部与该人物类似的图像。假如该人物的名字已经登记到PolarRose数据库, 还可确认其名字。用户选择的人物尚未登记名字, 用户还可自行登记名字。
2 手机的新功能
科学家们正在研制一种手机图像识别系统, 有了这套系统, 当我们面对陌生的环境时, 我们只需拿出我们的可照相手机, 把我们所看到的拍下来, 图像识别系统就会迅速从网上搜集有关资料, 帮我们解疑答惑。国外一些精明的厂家开始使用这种系统对其产品进行促销, 顾客只要把产品、产品标识甚至商家的特定广告拍下来就可以获得厂家赠送的精美礼品。条形码是图像识别系统的第一个实际应用。美国纽约的一家公司设计了一个软件, 手机用户只要把书籍和CD背后的条形码拍下来, 就可以登录到亚马逊网络书店去购买他们所喜爱的书籍和音乐。加利福尼亚的一家公司走得更远, 他们设计了一种物体识别软件供手机用户使用。他们把一些厂家的产品、标识、海报甚至一些杂志广告收集到数据库中, 当用户将这些照片拍摄下来作为短信发回到公司时, 手机用户就可以收到他们所需要的公司或产品资料, 例如公司网站和产品说明书等。日本的一家公司已经开始应用一种三维物体图像识别系统, 顾客只要把所需要的物体拍摄下来就可以在网站上购买相应的产品。
微软曾在2006年透露, 微软正在开发如何利用手机拍下的照片进行互联网搜索的方法。微软这个新功能被命名为Photo2Search, 用户只需通过电子邮件向微软发送用手机拍下的想要了解的事物的照片, 搜索结果就会出现包含相关信息的网页或是包含有类似照片的网站, 但目前还没有关于此项技术的消息。
3 系统设计
本文要设计一种新型的移动识别系统, 手机用户对于身份无法确认的人物, 通过手机自身的拍照功能将其面部特征进行拍摄, 后将图片以手机短信形式发送至服务器, 服务器用发送来的图片进行图对图的搜索, 将检索到的, 匹配程度高的图片信息 (人物的相关信息) 再以短信形式发送回手机用户, 这样就完成识别过程。
3.1 系统结构图
3.2 系统运行流程
系统首先建立图片数据库, 将面部特征提取后经排序存入特征数据库;用户将手机拍摄的图片通过无线网络发送至服务器, 服务器将发送来的图片进行面部特征提取, 而后在特征库内检索, 将相似度高的图片信息用sms形式回发至手机用户。
3.3 系统开发工具及运行环境
开发工具:由Microsoft制作发行的Visual studio 2005Team Suite系统
操作系统:Windows2003 Server
应用服务器:JRUN4.0
后台数据库:Oracle9i
服务器数量:2台
3.4 系统模块说明
(1) 数据库
图片数据库1:spider程序抓取网页, 将人物图片及其说明摘取存入图片数据库1。利用spider抓取图片的目的是弥补专业图片库的数量上的不足。
图片数据库2:图片数据库2由专业图片及专业注释组成, 其目的是为用户提供标准的解释。
图片特征库1:将图片数据库1中的图片的面部特征进行提取, 将特征即通常所说的面纹编码存入图片特征库1。将图片特征先行提取是保证系统检索效率的根本保障。
图片特征库2:图片特征库2用来存放图片数据库2中专业图片的面部特征。
(2) 图片特征提取器
该模块由算法组成, 特征向量法是提取器用到的主要算法。该方法是先确定眼虹膜、鼻翼、嘴角等面像五官轮廓的大小、位置、距离等属性, 然后再计算出它们的几何特征量。
(3) index索引器
图片数据库索引:将图片按科学的分类方法进行分类并索引, 例如按照最简单的性别进行分类, 对图片数据库进行索引是提高系统工作效率以及优化数据库组织结构的有效办法。
图片特征库索引:对图片特征库进行索引, 可以大大缩小检索的范围, 提高系统对用户的响应速度。
(4) GUI
GUI (Graphical User Interface) 即图形用户接口, GUI是屏幕产品的视觉体验和互动操作部分, 是一种结合计算机科学、美学、心理学、行为学及各商业领域需求分析的人机系统工程, 强调人—机—环境三者作为一个系统进行总体设计。这种面向客户的系统工程设计其目的是优化产品的性能, 使操作更人性化, 减轻使用者的认知负担, 使其更适合用户的操作需求, 直接提升产品的市场竞争力。本系统的GUI主要涉及网络查询部分和手机部分。
(5) 主要接口
手机通过基站与系统服务器的连接主要通过CMPP协议实现。CMPP协议是中国移动提供的短消息互联网接入解决方案, 它规定信息资源站实体与互联网短信息网关的应用层接口协议, 用以建立短消息中心和服务提供商 (SP) 之间的通路, 业务和信息的提供由SP完成。CMPP可以为实现移动数据增值业务提供服务, 包括以下业务:Email通知、语音信箱通知、Internet发送短信息、移动平台发Email、催费通知、自动综合业务信息台。
4 总结
本文的创新点在于将短信息服务 (SMS) 与手机拍照功能和基于CBIR技术的Web识别系统相结合, 设计了一个基于手机平台的人脸识别系统。该系统是手机增值业务的延伸, 同时为基于CBIR技术的识别系统提供了更为广阔的使用空间, 最为重要的是将极大的提高办案的效率以及准确率。
摘要:拍照手机非常普及, 基于CBIR技术的检索系统日趋成熟, 以Internet为媒质结合手机与CBIR检索系统的功能, 设计一种新型的移动人脸识别系统。
关键词:人脸识别,CBIR,手机,安全
参考文献
人脸识别技术综述 篇8
人脸是人类视觉交互中最重要的模式, 人脸识别技术 (FRT) 是模式识别和人工智能领域的一个前沿课题。在新兴的信息安全应用领域, 人脸识别技术提供了一种更为安全可靠易用的身份鉴别手段, 从而提升整个网络信息系统的安全性能。
1. 人脸识别技术概述
人脸识别技术就是通过计算机提取人脸的特征, 并根据这些特征进行身份验证的一种技术。人脸与人体的其他生物特征一样与生俱来, 它们所具有的唯一性和不易被复制的良好特性为身份鉴别提供了必要的前提。同其他生物特征识别技术相比, 人脸识别技术具有操作简单、结果直观、隐蔽性好的优越性。该技术涉及模式识别、数字图像处理、计算机视觉、生理学、心理学和认知学等诸多学科, 并且与基于其他生物特征的身份鉴别方法以及计算机人机感知交互的研究领域都有着密切联系。
2. 人脸识别技术的发展历史
人脸识别的研究已经有相当长的历史。人类最早的研究工作至少可追朔到二十世纪五十年代在心理学方面的研究和六十年代在工程学方面的研究。在上世纪60年代末, 人脸识别即引起了研究者的强烈兴趣, 但早期的人脸识别一般都需要人的某些先验知识, 无法摆脱人的干预。20世纪90年代以来, 随着高性能计算机的出现, 人脸识别方法有了重大突破, 才进入了真正的机器自动识别阶段。最近几年, 人脸识别技术逐渐走出了实验室阶段, 由原型系统朝着商业化应用系统的方向发展。
当前的商业化人脸识别系统是在一定的图像约束条件下对人脸识别技术的应用, 往往需要人的主动配合, 这在很大程度上限制了其应用范围。潜在的巨大市场需求和高可靠性的使用要求驱使研究人员从更加广阔的层面来考虑提高现有人脸识别的技术水平。
3. 常见人脸识别方法的研究与分析
静止图像的人脸识别方法主要有三个研究方向:一是基于统计的识别方法, 包括特征脸方法和隐马尔科夫模型方法;二是基于连接机制的识别方法, 包括一般的神经网络方法和弹性图匹配方法;三是其他一些综合方法或处理二维灰度图像的方法。
(1) 特征脸方法
特征脸 (Eigenface) 方法是从主成分分析 (Principal Componen Analysis, PCA) 导出的一种人脸识别和描述技术。特征脸是一个很容易执行的简单人脸识别的算法, 是计算机视觉方向的最基本的识别人脸的方法。特征脸所采用的步骤也被应用于很多先进的研究方法。特征脸算法如此重要的一个原因是这个算法遵循的基本原则——PCA和基于距离的匹配原理。
特征脸识别方法有良好的稳定性、位移不变性、特征向量与图像的高度成比例变化以及转置不变性。不足之处是受表情变化、光照角度强度变化和视角变化等严重影响, 鲁棒性较差。为了解决上述缺点, 研究人员在此基础上发展了许多改进方法:如将特征脸与线性判别函数相结合, 可以使得对光照及人脸表情不太敏感。
(2) 基于神经网络的方法
神经网络在人脸识别应用中有很长的历史。早期用于人脸识别的神经网络主要是Kohonen自联想映射神经网络, 用于当输入图像上的人脸受噪声污染严重或部分缺损时, 能用Kohonen网络恢复出原来完整的人脸。Cottrell等人使用级联BP神经网络进行人脸识别, 对部分受损的人像、光照有所变化的人像, 个人识别能力较好。BP神经网络是应用最广泛的一种人工神经网络, 在各门学科领域中都具有很重要的实用意义, 其学习能力和容错能力对不确定性模式识别具有独到之处。
神经网络方法在人脸识别上比其他类型的方法有其独到的优势, 它避免了复杂的特征提取工作, 可以通过学习的过程获得其他方法难以实现的关于人脸识别的规律和规则的隐性表达。此外, 神经网络以并行方式处理信息, 如果能用硬件实现, 就能显著提高速度。神经网络方法除了用于人脸识别外, 还使用于性别识别, 种族识别等。
4人脸识别技术面临的难题
人脸识别虽然已经取得了很大的成果, 但由于人脸识别问题的复杂性仍然还有许多问题。主要难点在于人脸外观的变异与图像采集和处理过程中的变异。人脸识别经常受到一些不确定性变化因素的影响。
(1) 采集设备问题。采集设备的性能和采集时的设置使得获取的人脸图像数据的变化更大, 如何解决这些问题也是值得关注的。
(2) 高适应性问题是人脸识别面临的最严峻的挑战。这主要表现在以下方面:一是光照、背景问题。二是人脸的姿态问题。三是表情问题。四是老化问题。
(3) 人脸特征的有效表达非常困难。人脸不是刚体, 也存在弹性形变。人脸是存在部分变形的三维固体表面, 因而其图像基本上是个复杂而高维数的视觉刺激, 这与计算机视觉研究中使用的其他人工刺激有很大区别。
结论:综合比较目前常用的几种人脸识别方法, 通过分析可以看出, 每种方法都有各自优缺点, 应根据具体的识别任务和条件选择合适的识别方法。由于人脸识别的复杂性, 仅单独使用任何一种现有的方法一般都不会取得很好的识别效果, 将各种人脸识别方法组合是今后研究的一种趋势。而如何有效地与基于其它生物特征识别方法结合来提高识别效率也是一个重要的研究方向。
参考文献
[1]肖冰, 王映辉.人脸识别研究综述[J].计算机应用研究, 2005 (80) :1-5.
[2]祝秀萍, 吴学毅, 刘文峰.人脸识别综述与展望[J].计算机与信息技术, 2008, (04) :53-56.
[3]宇雪垠, 曹拓荒, 陈本盛.基于特征脸的人脸识别及实现, 2009, 26 (5) :428-433.
人脸识别技术研究 篇9
计算机人脸识别技术是利用计算机通过对人脸图像的分析、特征的提取,从中提取出有效的识别信息,进而实现(自动)辨识人脸,并进行自动身份验证的技术。
2 方法归类
人脸识别的方法大致可以分为基于几何特征的方法、基于模板匹配的方法、特征脸方法、隐马尔可夫模型的方法,基于神经网络的方法。
2.1 基于几何特征
几何特征的识别方法首先将人脸用一个几何特征矢量表示,用模式识别中的层次聚类思想设计分类器来对人脸进行识别。几何特征矢量是以人脸器官的形状和几何关系为基础的特征矢量,其分量通常包括人脸指定两点间的欧氏距离、曲率、角度。人脸器官的关键点分别对应于不同的积分投影方式产生的波峰波谷,根椐人脸结构的先验知识,可得出人脸各器官之间的几何位置关系。
2.2 基于模板匹配
基于模板匹配的方法大多是用归一化互相关,直接计算两幅图像之间的匹配程度。由于这种方法要求两幅图像上的目标要有相同的尺度、取向和光照条件,所以预处理要做尺度归一化和灰度归一化的工作。最简单的模板匹配方法是每个人作为数据库中的一个条目,它的字段包含一个从正面人脸像抽取的二维点阵。图像必须经过归一化。识别时,未分类的图像跟数据库中的所有图像数据进行比较,采用相关作为典型的匹配函数[1]。
2.3 特征脸方法
特征脸识别方法是一种非常常见的方法。它本质是基于特征的方法,只不过它的特征是在抽取代数特征的基础上完成的。这里的代数特征是与几何特征相对而言的,是指经过数字变换得到的特征。主分量分析(PCA)是一种常用的方法,PCA实质上是K-L展开的网络递推实现,K-L变换是图像压缩中的一种最优正交变换,其生成矩阵一般为训练样本的总体散布矩阵。由于高维图像空间K-L变换后可得到一组新的正交基,因此可通过保留部分正交基,以生成低维人脸空间。而低维空间的基则是通过分析人脸训练样本集的统计特性来获得,K-L变换的生成矩阵可以是训练样本集的总体散布矩阵,也可以是训练样本集的类间散布矩阵,即可采用同一人的数张图像的平均来进行训练,这样可在一定程度上消除光线等的干扰,且计算量也得到减少,而识别率不会下降。将子空间的正交基按照图像阵列排列,则可以看出这些正交基呈现人脸的形状,这些正交基也被称作特征脸。利用这些基底的线性组合可以描述、表达和逼近人脸图像,可以进行人脸识别和合成。识别过程就是将人脸图像映射到由特征脸张成的子空间上,比较其与已知人脸在特征脸空间中的位置。
2.4 隐马尔可夫模型
人脸面部特征的分布都依照一种自然的顺序,即从上到小、从左到右,即使人脸在平面和垂直方向上发生旋转,这种顺序也不会变化。如果给人脸的每一个小区域分配一个描述和识别[2]。
2.5 基于神经网络
基于神经网络的方法是近年来比较活跃的一个研究方向.人工神经网络(ANN)是一种以大的量处理单元(神经元)为节点,处理单元之间实现加权值互联的拓扑结构,处理单元是人类大脑神经单元的简化。Cottrell等人使用级联BP神经网络进行人脸识别,对部分受损的人像、光照有所变化的人像,个人识别能力较好。
2.6 弹性图匹配
弹性图匹配方法(Elastic Matching)是一种基于动态链接结构的方法,是动态匹配中的一种。弹性匹配方法用网格作为模板,将图像间的比较变为网格间的比较。对于网格上的每一点抽取一定的特征信息,如灰度值、梯度值、傅里叶变换系数值、小波变换系数等,形成一组特征矢量,并用这些特征矢量来代表图像进行匹配。在将一幅图像的网格同另一幅图像的网格进行匹配时,一般先规定一个能量函数或代价函数,然后在一定范围内对网格进行逐点变形搜索,找出每一点对应的能量函数最小点的位置。这种利用弹性形变实现图像之间最佳匹配的方法称之为弹性匹配法。弹性图匹配能够容忍表情的变化,并在一定程度上能够容忍视角的变化。而这也是弹性图匹配方法优于特征脸方法的原因。
3 结语
人脸识别是利用人脸各器官(例如眼、鼻、口等)的几何特征和位置来区分被识别者,虽然人脸识别的准确性要低于虹膜、指纹的识别,但由于它的无侵害性和对用户最自然、最直观的方式,使人脸识别成为最容易被接受的生物特征识别方式。
参考文献
[1]OsamuNakamura,Shailendra Mathur,Toshi Minami,Identifica-tion of human faces based on isodensity maps Pattern Recog-nition,24(1991)3263-272
人脸表情识别概述 篇10
关键词:人脸表情识别,特征提取
0 引言
人脸表情是人们之间非语言交流时的最丰富的资源和最容易表达人们感情的一种有效方式,在人们的交流中起着非常重要的作用。表情含有丰富的人体行为信息,是情感的主载体,通过脸部表情能够表达人的微妙的情绪反应以及人类对应的心理状态,由此可见表情信息在人与人之间交流中的重要性。人脸表情识别技术随着人们对表情信息的日益重视而受到关注,成为目前一个研究的热点。所谓人脸表情识别,就是利用计算机进行人脸表情图像获取、表情图像预处理、表情特征提取和表情分类的过程,它通过计算机分析人的表情信息,从而推断人的心理状态,最后达到实现人机之间的智能交互。表情识别技术是情感计算机研究的内容之一,是心理学、生理学、计算机视觉、生物特征识别、情感计算、人工心理理论等多学科交叉的一个极富挑战性的课题,它的研究对于自然和谐的人机交互、远程教育、安全驾驶等都有重要的作用和意义。
1 国内外研究的发展与现状
国际上对人脸表情的分析与识别的研究工作可分为基于心理学和计算机两类。早在1872年,生物学家达尔文所做的心理实验就表明,面部表情的含义不会随着国家、种族、性别的不同而不同。1978年美国心理学家Ekman和Friesen开发了面部动作编码系统(Facial Action coding system,FACS),以此来检测面部表情的细微变化。在这个系统中,他将表情分为六个基本类别:悲伤、高兴、恐惧、厌恶、愤怒和惊奇,说明了与无表情人脸特征相比,这六种表情的人脸特征具有相对独特的肌肉运动规律。后来大多数学者的研究都是建立在FACS系统的基础上的,所以说这一系统的提出具有里程碑的意义。
计算机方面,最初对表情识别做了尝试的是Suwa和Sugie等人。1978年,他们对选定的连续图像序列中脸部固定的20个点进行跟踪识别,并与原型模式((Prototype patterns)进行比较以实现识别。同年,Terzopoulous和Waters运用了简化的Ekman-Friesen模型,用计算机产生人脸动画,同时也做了人脸视频序列的表情分析。直到1981年才有学者从肌肉角度的观点出发,用仿生学方法为面部表情建立模型。
到目前为止,人脸表情识别已经经过了四十多年的发展。尤其是近些年来,随着计算机软件技术的发展和硬件性能的提高,它更成为一个热门的研究课题。英国、美国、日本等经济发达国家和发展中国家如印度、新加坡都有专门的研究组进行这方面的研究。其中美国的麻省理工学院(MIT)的多媒体实验室的感知计算组、斯坦福大学、卡耐基梅隆大学(CMU)机器人研究所、东京大学、大阪大学的贡献尤为突出。
到目前为止,国外的人脸表情识别的方法大致可以分为五类:
(1)基于几何特征提取的方法
基于几何特征的表情识别是指对嘴、眉毛、鼻子、眼睛等这些人脸表情的显著特征的形状和位置变化进行定位和测量,确定它的形状、大小、距离及相互比例,进行表情识别的方法。Bourel等人定义了面部特征点之间的九个距离并通过它们构建了表情特征向量进行表情分析。Chibelushi等人也采用了面部几何特征点并采用Kanade-Tucas-Tomasi特征点跟踪算法实现特征点跟踪,然后通过计算得到九个特征系数,而这九个系数构成了特征流,描述了由于表情的发生而引起的面部特征点的几何关系的变化。Pantic等人进行面部特征检测并确定面部几何关系,然后他们通过规则推理系统将这种面部几何关系转化为面部动作单元的活动,最终通过专家系统实现表情识别。Ying-li Tian等人采用几何特征提取与神经网络相结合的方法对正面或接近正面的面部图像进行表情识别,其中提取几何特征主要包括对于关键部位的定位特征和表情区的形状特征。
(2)基于统计特征提取的方法
与提取图像的几何特征相比,这种统计特征是基于图像的整体灰度特征,它强调尽可能多的保留原始人脸表情图像中的信息,通过对整幅人脸表情图像或其中特别的区域进行变换,以此获取人脸各种表情的特征来进行识别。这方面比较有代表的方法是主成分分析法(PCA),它曾经是人脸识别中最常用的方法。1999年,Ginalucal等人在以前人脸识别算法的基础上,将PCA算法应用到人脸表情识别上,实验结果表明,当取前30个主分量并使用欧氏距离时,达到了最好的79.3%的识别率。2001年,Andrew J.Calder等人分别从社会科学和识别理论两个方面说明了主成分分析的有效性和可行性。PCA现在己经成功地应用于人脸识别和表情识别,但是由于在PCA中,只有图像数据当中的二阶统计信息被考虑到了,而高阶统计信息并没有利用到,在1998年Bartlett提出了基于独立分量分析ICA的算法。ICA把n幅原始图像看成是m幅特征图像的线性组合,对这m幅特征图像进行独立分量,然后就可以得到特征图像。C.Havran等也是采用了相似的方法,首先对图像进行PCA特征提取,然后进行独立分量分析,试验表明,与单独使用主分量分析的表情提取方法相比,这种表情提取方法更加有效,而且对主分量的特征空间维数的选择具有更低的敏感度。Buciu等利用ICA进行了表情识别,该方法将ICA与支持向量机(SVM)联合使用,达到了分类的目的并取得了很好的效果。
(3)基于频率域特征提取的方法
近来,越来越多的人关注Gabor小波并进行深入研究,把它应用于面部表情识别,也取得了不错的识别结果。Gabor小波核函数具有与人类大脑皮层简单细胞的二维反射区相同的特性,它相当于一组窄带带通滤波器,其方向、基频带宽及中心频率均可以调节,具有明显的方向选择和频率选择特性。Tian Ying-li等人将人脸分成上下两个部分,再标成一个个的运动单元,运用Gabor小波对脸部运动单元进行识别,最后结合几何特征进行表情的识别,达到了92.7%的识别率。Wen在一系列手工标定的局部小区域提取平均Gabor小波系数作为纹理特征,同时引入了一种在人脸合成中使用的基于比例图的方法来对纹理提取区域进行预处理,以降低不同人脸差异和光照变化引起的人脸光照度不均的影响。Littlewort等采用Boosting方法选取Gabor特征,采用SVM进行分类,识别率达93.3%。Kyperountas M等人以Gabor小波等多种特征提取算法为手段,结合新的分类器对静态图像进行试验,取得了较好的识别率。
(4)基于运动和形变特征提取的方法
基于运动和形变的特征提取方法关注由面部表情引起的面部变化。它们以中性脸作为参考面,首先分析各个面部特征区域内的形变或运动信息,然后通过这些信息构建特征向量进行表情识别。基于梯度的光流场计算法最早是由Horn和schunk提出来的,随后Mase首次利用光流来进行人脸运动跟踪,在FACS系统中的44个运动单元中,他利用光流检测到了其中的12个。Essa和Pentland扩展了这种方法,使用光流来估计面部解剖学和物理学模型中的面部运动。Tian等人把颧骨、眉毛、眼睛和嘴唇等作为特征点进行跟踪,通过隐藏的面部特征的变形获得模型的轮廓,提出了一种不同的元素模型。Anderson使用光流法计算人脸的多渠道灰度模型,完成对人脸区域的跟踪,最后用SVM算法实现了表情分类。Irene Kotsia等人主要利用网格跟踪算法跟踪由于表情发生而产生变化的网格,并构建变形系统进行识别。实验结果表明,识别六种表情的识别率达到了99.7%,而AU的识别率则达到95.1%。
(5)基于模型的方法
基于模型的方法以图像中人脸对象的形状和纹理结构为基础建立二维或三维模型,以此模型的参数化变形来适配人脸图像中的人脸部分,这些模型的参数就是所提取的特征。Huang等人提出了一种点分布模型PDM,模型由面部的90个特征点构成,通过它能够获得10个运动参数,最后根据这些动参数来实现表情识别。活动外观模型AAM也是一种模型的方法,是由Cootes等人在1998年提出的。它以目标对象变化的程度作为参数描述,是一种图像特征定位方法。Cri Stinacce等人结合AAM和特征响应成对增强算法(PRFR),用来检测面部边缘的一些特征以及嘴角、眼眶、鼻尖等局部区域的特征点。Jaewon Sung等人于2007年提出了一种新的结合两种模型的匹配方法,这种方法将ASM转变为类似于AAM的以梯度为基础的搜索算法,并将AAM和ASM的误差项结合在一个以梯度为基础的最优模型中。Cheon和Kim提出了Differential-AAM和流形学习相结合的人脸表情识别算法,实验证明该算法比AAM算法的识别率提高了20%。
国内对人脸表情识别的研究比较晚,但发展却是非常快速。清华大学、哈尔滨工业大学、中科院自动化所、中科院计算所、联合实验室、浙江大学等多所著名大学和研究机构都投入相当的人力和物力进行人脸表情识别的研究。
哈尔滨工业大学高文教授领导的团队是我国最早进行计算机表情分析、编码与识别研究的团队。高文和金辉等通过对若干类面部表情图像的分析,建立了基于部件分解组合的人脸图像模型,在他们的另一篇文献中,在对动态表情图像序列的时序分析的基础上,提出了对混合表情的识别系统。中国科技大学的尹星云等用隐马尔科夫模型(HMM)的基本理论和方法设计了人脸表情识别系统。余棉水等提出了一种基于光流的方法,利用光流技术跟踪人脸表情图像序列中的特征点,然后提取特征向量,最后利用神经网络对六种基本表情进行分类识别。邓洪波和金连文提出了一个基于Gabor特征的人脸表情识别系统。该系统首先对表情图像进行预处理,并提取Gabor特征,然后用PCA+LDA方法进行特征选择,最后采用K近邻分类方法识别人脸表情。赵浩和吴小俊在联合主动表观模型和主动形状模型的基础上,充分挖掘标定点之间的联系,提出一种局部纹理模型构建方法。通过改进匹配算法提高特征点的定位精度和匹配速度,结果表明其识别率较高。周书仁和梁昔明提出了融合独立分量分析(ICA)与支持向量聚类(SVC)的人脸表情识别方法。
2 存在的问题
人脸表情识别是一个具有重要意义而又富有挑战性的课题,目前还处于研究阶段,各种算法还在探索和验证中,还不十分成熟。归总来看,目前人脸表情识别的主要难点是:(1)对各种表情的体验。人的情绪是细微多变的,随之的表情变化也显得非常复杂,如有轻松的和紧张的、缓和的和激动的、细微的和强烈的等诸多形式,而现在的识别方法对比较夸张和明显的表情能够有较好的识别率,但是对变化不太明显的表情识别率是较低的。(2)受不同年龄、种族、性别、头发、饰物等的影响较大。(3)光照和人脸姿态对识别结果影响较大。(4)建立一个理想的人脸表情模型并不容易。因为人脸不是一个刚体,而是一个柔性体,很难用模型来准确描述。
总之,人脸表情识别技术作为一种高端生物特征识别技术,有着极其广阔的应用前景,将会涉及到人们日常生活的许多方面,对改善和提高人们的生活质量以及生活方式都有极其重要的作用和意义。
参考文献
[1]张翠平,苏光大.人脸识别技术综述.中国图象图形学报.2000.
[2]高文,金辉.面部表情图像的分析与识别.计算机学报.2005.
[3]尹星云,王洵,董兰芳,万寿红.用隐马尔可夫模型设计人脸表情识别系统.电子科技大学学报.2003.
[4]余棉水,黎绍发.基于光流的动态人脸表情识别[J].微电子学与计算机.2005.
[5]邓洪波,金连文.一种基于局部Gabor滤波器组及PCA+LDA的人脸表情识别方法[J].中国图象图形学报.2007.
[6]赵浩,吴小俊.基于改进联合模型的人脸表情识别.计算机工程.2010.
仅仅是人脸识别?你OUT了! 篇11
暗光环境
DC从来没有如此强大
如今,许多DC都在使用背照式CMOS传感器,它有什么性能优势呢?单就索尼TX9C而言,其使用的Exmor R CMOS背照式传感器由于其全新谢十带来的技术优势,对于亮度的敏感度是以往传统CMOS的2倍,而噪点的产生也仅为后者的50%,简单来说,就是这类传感器拥有着不凡的夜景拍摄性能。提到夜景拍摄,许多用户通常都会打开闪光灯以避免光线过暗造成的低速快门,其实利用闪光灯拍摄人像并不是万能的,失去真实的环境再现和死白的肌肤都让人对这样的拍摄画面颇为失望。TX9C由于使用了Exmor R CMOS背照式传感器,因此手持夜景模式也应运而生。在该模式下我们并不需要使用三脚架或者闪光灯,只需按下快门,相机即可自动连拍6张图片并合成1张清晰画面,轻松捕捉美丽夜景。如同MI所拍样张一样,清晰锐利的人像搭配昏暗的灯光,一切看起来都是那样的自然,具有美感。看来以后在夜晚的咖啡馆或者昏暗的酒吧,就再也不用担心闪光灯打扰到旁人了。
智能扫描全景
只玩风景太浪费
除了时尚华丽的外观设计外,只需左右或者上下移动相机就能拍到大视角的全景照片,想必是许多米饭被索尼Cyber-shot相机吸引的原因之一吧。以往我们拍摄全景照片时,需要繁琐的拼接方式,不仅操作不够方便而且成像画质也不理想,而索尼独创的扫描全景模式却用一种最为简单的方式让我们能够保存下精彩的全景照片。在索尼TX9C上,扫描全景模式得到了进一步的升级,新的智能扫描全景模式让这一功能并不单单能够拍摄美不胜收的近态美景,而且拍摄人像时也能够得到意想不到的乐趣。以前我们拍摄全家福或者集体照时,大家都是一层一层贴得紧紧的排列,总担心镜头不够广。现在有了这一功能,我们在拍摄集体照时,每个人并排站都不怕,是不是很爽?除此之外,随着镜头摆动,我们还能通过改变站位就能轻易获得两次甚至是多次的曝光影像。
背景虚化不再是单反大光圈的专利
浅景深、大光圈……太复杂了,我们只需使用索尼TX9C内置的背景虚化功能,这些看似专业的影像效果就能轻松实现。它有什么用呢?模糊虚化的背景,凸显出清晰的主体影像。应用于人像拍摄时,背景虚化营造出的类似于专业沙龙照的效果,想不爱都难。TX9C实现背景虚化的奥妙在于,依靠Exmor R CMOS传感器的高速连拍性能,相机能同时拍下两张照片,一张保证人物清晰,另一张是虚化的背景,最后再合成在一起。要更好发挥该模式的优势,有两点小窍门:首先,最好选择和人物肤色反差较大的背景。此外,在拍摄时对焦主体的前方最好不要出现前景物体,不然有可能会出现报错的情况。比如霓虹灯下的大街、层次斑驳的街巷中都是这一功能最好的应用场所。值得一提的是,在使用索尼TX9C背景虚化功能拍摄时,还能选取美肤模式,让人像脸部的皮肤显得更加柔和动人。
高速连拍铭刻动感的精彩
人脸识别研究综述 篇12
关键词:人脸识别,特征提取,模式识别,综述
人脸识别技术的研究涉及图像处理、模式识别、机器视觉、人工智能、认知科学、生理学、心理学等多个学科,人类视觉识别系统的特性对机器人脸识别有一定的借鉴意义,心理学和神经生理学的研究无疑对机器人脸识别具有启发性[1,2]。但除少数文献外,目前大多数的机器人脸识别研究独立于生理学和心理学之外。本文将对人脸识别方法及其研究状况进行综述。
1 人脸识别研究的发展状况
1.1 发展历史
早在1888年和1920年Galton就在《Nature》上发表过两篇关于利用人脸进行身份识别的论文。真正意义上的自动人脸识别的研究开始于二十世纪六十年代中后期,1965年Chen和Bledsoe的报告是最早的关于自动人脸识别的文献。
1965到1990年之间是人脸识别研究的初级阶段,这一阶段的研究主要集中在基于几何结构特征的人脸识别方法(Geometric feature based)。该阶段的研究基本没有得到实际的应用。
1991年到1997年间是人脸识别研究非常活跃的重要时期。出现了著名的特征脸方法(Eigenface),该方法由麻省理工学院的Turk和Pentland提出,之后有许多基于该方法的研究。Brunelli和Poggio在1992年对基于结构特征的方法和基于模板匹配的方法进行了实验对比,并给出了后者优于前者的明确结论。该时期内,美国国防部资助的FERET(Fac E Recognition technology Test)项目资助多项人脸识别研究,创建了著名的FERET人脸图像数据库。该项目极大地促进了人脸识别算法的改进以及算法的实用化。
1998年至今,研究者开始针对非理想条件下的人脸识别进行研究。光照、姿势等问题成为研究热点。出现了基于3D模型的人脸建模与识别方法。在商业化的应用方面,美国国防部在2000年和2002年组织了针对人脸识别商业系统的评测FRVT(Face Recognition Vendor Test),比较领先的系统提供商有Cognitec,Identix和Eyematic。
1.2 主要公共数据库
人脸数据库对于人脸识别算法的研究是不可缺少的,而公共人脸图像数据库的建立方便不同研究者之间的交流学习,并有助于不同算法的比较,下面列举常用的人脸图像数据库。
FERET人脸数据库:是FERET项目创建的人脸数据库,该库包含14,051幅多姿态、不同光照条件的灰度人脸图像,是人脸识别领域应用最广泛的人脸数据库之一。
ORL人脸数据库:包含40人共400张面部图像,部分图像包括了姿态、表情和面部饰物的变化。该人脸库在人脸识别研究的早期经常被人们采用,由于变化模式较少,多数系统的识别率均可以达到90%以上。
AR人脸库:包括116人不同光照、表情、遮挡和老化的人脸图像共3288幅。
MIT人脸数据库:由麻省理工大学媒体实验室创建,包含16位志愿者的2,592张不同姿态、光照和大小的面部图像。
Yale人脸数据库:由耶鲁大学计算视觉与控制中心创建,包含15位志愿者的165张图片,包含光照、表情和姿态的变化。
PIE人脸数据库:由美国卡耐基梅隆大学创建,包含68个人的41,368张多姿态、光照和表情的面部图像。
CAS-PEAL人脸数据库:该人脸库包含了1,040名中国人共99,450幅头肩部图像,涵盖姿态、表情、饰物和光照四种主要变化条件,部分人脸图像具有背景、距离和时间跨度的变化。
BANCA人脸库:BANCA项目资助创建,包含208人的多模态生物特征,覆盖了不同图像质量、不同时间段等变化条件。
1.3 研究现状
人脸识别是当前图像工程领域的四大研究热点之一,世界上很多国家的高校都有专门的人脸识别研究小组,比较著名的有:麻省理工学院,卡耐基梅隆大学,耶鲁大学,密歇根州立大学,加州大学洛杉矶分校(UCLA),曼彻斯特大学,南加州大学,萨里大学等。
国际会议IEEE International Conference on Automatic Face and Gesture Recognition和International Conference on Audio and Videobased Biometric Person Authentication是针对人脸识别及其他生物特征识别技术方面的会议。模式识别,机器视觉,图像处理等领域中最权威的国际会议,如IEEE CVPR,IEEE ICCV,IEEE ICIP,IEEE ICASSP,ECCV,ICPR每一届都对人脸识别领域的研究给予关注。
国内的许多研究机构在自然科学基金、863计划等资助下从事人脸识别领域的研究工作并取得了一定的成果。国内主要的研究机构和研究人员包括:清华大学计算机系人机交互与媒体集成研究所的徐光佑教授、艾海舟教授;清华大学自动化系的边肇祺教授、张长水教授;中科院计算所的高文教授、陈熙霖教授;中科院自动化所模式识别国家重点实验室的谭铁牛教授;北方交通大学的袁保宗教授;南京航空航天大学的陈松灿教授;南京理工大学的杨静宇教授;上海交通大学的施鹏飞教授;中科院自动化所(原微软亚洲研究院)的李子青教授领导的研究组等。此外,国内还有许多大学和研究机构在积极的从事人脸识别领域的研究,这些研究者在人脸识别领域积累了宝贵经验,近年来在国际知名期刊上发表了大量该领域的相关论文。
2 人脸识别的主要方法
一个自动人脸识别系统包括人脸检测以及人脸特征提取与识别两个关键环节。人脸检测指对输入的图像判断是否存在人脸,确定人脸的位置,分割出人脸。从原始图像分割出的人脸图像维数非常高,若直接用于数据处理,则运算难度大甚至对于已有计算机硬件是不可行的;而且原始的图像数据往往不能表现人脸的本质,不利于识别。因此,为了避免维数灾难(Dimensionality Curse)[3]并提高识别准确率,能够从高维原始数据中提取出用于分类识别的有用信息的特征提取技术是解决人脸识别问题的关键所在。人脸特征提取技术总的来说可以分为基于代数特征的方法和基于几何特征的方法两大类。
2.1 基于代数特征的方法
基于代数特征的方法是将人脸图像用特征向量表示,整幅图像看做一个矩阵,通过矩阵变换和线性投影来提取人脸特征并进行分类和识别。比较经典并被广泛使用的基于代数特征的方法有:主成分分析,Fisher线性鉴别分析,独立成分分析以及基于核的方法。
主成分分析:PCA(Principal Component Analysis),又称KL变换。该方法用KL展开式提取样本的主要特征。PCA的基本思想是利用一组包含离散度最大的特征来表示原始样本,它采用训练样本协方差矩阵的特征向量作为展开基,那些与较大的非零特征值相对应的特征向量被称为主分量,样本在这些主分量上的投影系数被称为为主分量特征,而原始样本可表示为这些主分量与投影系数乘积的代数和。Turk和Pentland将PCA用于人脸图像特征提取,提出了著名的特征脸(Eigenface)方法。
Fisher线性鉴别分析:Fisher在1936发表的经典论文选择使Fisher准则函数达到极值的向量作为最佳投影方向,从而使得样本在该方向上投影后,达到最大的类间离散度和最小的类内离散度。在Fisher思想的基础上,Wilks和Duda分别提出了鉴别矢量集的概念,即寻找一组鉴别矢量构成子空间,以原始样本在该子空间内的投影矢量作为鉴别特征用于识别。该方法被称为经典的Fisher线性鉴别分析方法。
独立成分分析:ICA(Independent Component Analysis),最早提出ICA概念的是Jutten和Herault[4],ICA是从线性混合的信号中恢复出独立源信号的算法。该方法假设数据由若干独立源信号混合而成,基于信号高阶统计特性的分析方法,分解出相互独立的分量,在抽取人脸图像特征与人脸识别上取得了较好的效果。ICA假设各成分是统计独立的之外,还必须假设独立成分是非高斯分布的。该方法是在PCA方法基础上发展起来的,其中统计独立条件要比主分量分析中统计不相关条件更为严格。
基于核的方法:上面介绍的三类方法都属于线性特征提取方法,这些线性方法本质上都是基于线性变换,通常无法表达数据的非线性分布结构。核方法的基本思想是通过适当的非线性映射(通过定义适当的内积函数实现)将非线性可分的原始样本变换到某一线性可分的高维特征空间,由于新空间中的线性方向对应于原特征空间的非线性方向,所以基于核的鉴别分析得出的鉴别方向也对应原特征空间的非线性方向。这种方法的独特和关键之处在于它巧妙地借助于“核函数”进行样本之间的运算,随后对生成的核样本向量进行相应的线性运算求取鉴别矢量集,而不需要求出原始特征空间样本非线性映射后的形式,使得它优于普通的非线性鉴别分析方法[5]。
2.2 基于几何特征的方法
基于几何特征的方法提取人脸的眼睛、鼻子、嘴巴、下巴等部位和这些部位的结构关系的几何描述作为识别人脸的特征。即识别所采用的特征是反映人脸器官形状和几何关系的特征向量,其分量包括人脸上指定两点间的欧氏距离、角度、曲率等,识别过程即特征向量的匹配过程。最早的基于几何特征的人脸识别方法是针对人脸的侧面轮廓的[6]。其后的研究将更多更广泛的人脸特征用于特征的提取,如眉毛厚度及眉毛与眼睛中心的垂直距离、眉毛形状的描述参数、鼻子的垂直位置和宽度等[7];更复杂的人脸模板,包含了头发线条和面颊。人脸的几何特征受光照条件、姿态变化等拍摄条件的影响较小,相对比较稳定,但不易抽取而且测量精度不高,影响了识别的准确率。
3 人脸识别技术的应用范围及优缺点
人脸识别用来鉴别人的身份,可以广泛地应用于公共安全、企业办公、教育、人机交互等领域。和其他生物特征识别技术一样具有特征唯一性的特点,这是作为身份识别技术的前提。相比其他生物特征识别技术,人脸识别技术又具有其独特的优势。
友好:特征的采集方式是非接触式的,不具有侵犯性,容易被人接受;
隐蔽:可以在被采集特征的人不知道的情况下进行,用于安全监控、罪犯追捕等与其他生物特征识别技术相比更具可行性;
成本低:一般的用于图像采集的摄像设备价格比较低廉,而数码相机在普通人中日益普及也使人脸识别的相关应用具有更大的发挥空间。
然而,作为识别特征,人脸自身的特点也使人脸识别技术面临诸多困难,总的来说体现在以下两个方面:
人脸特征稳定性差:首先,人脸会随着人的年龄变化而变化;其次人脸在人的不同表情之下会有很大差别;另外,人脸在化妆的情况下或佩戴眼镜等饰物的情况下也会对识别带来困难。
人脸图像的采集受外界影响大:不同光照、角度、距离之下采集到的人脸图像会极大地影响识别性能。
4 总结
目前,最好的人脸识别系统在环境理想、用户配合的情况下已经能够达到95%以上的识别率。人脸识别系统的应用离我们的生活也不再遥远。上海世博会期间,人脸识别系统应用于世博园的各个出入口和公交站点,对进出园区的50万持证工作人员和1亿人次游客进行人脸验证。但是人脸识别技术仍然不能算做一个非常成熟的识别技术,只是在限定范围内有了一定的应用。因为现实中很多应用场合需要在更大规模的人脸库、用户不配合(视角、表情、眼镜等遮盖物品的问题)、不可控制的非理想拍摄条件(光照、背景的问题)下使用,现有的系统在这些情况下往往识别率会下降得很快。大规模、用户不配合和非理想拍摄条件下的人脸识别方法也是目前人脸识别领域的主要开放问题。研究能够解决这些问题的核心算法、提出有效改进识别性能的解决方案是人脸识别领域的重点研究内容。
参考文献
[1]Zhao W,Chellappa R,Rosenfeld A,et al.Face Recognition:A Literature Survey.CS-Tech Report[D].University of Maryland,2000.
[2]Chellappa R,Wilson C L,Sirohey S,Human and Machine Recognition of faces:A survey[J].Proceedings of the IEEE,1995,83(5).
[3]Jain A K,Duin R P,Mao J.Statistical Pattern Recognition:A Review,IEEE TPAMI,2000,22(1):4-37.
[4]Jutten C,Herault J.Independent component analysis versus PCA[J].Proceeding of European Signal Processing Conf,1988:643-646.
[5]Scholkopf B,Mika S,Burges C J C,et al.Input space VS.feature space in kemel-based methods[J].IEEE trans.on Neural Networks,1999,10(5):1000-1017.
[6]高秀梅,杨静宇,金忠,等.基于核的Foley-Sammon鉴别分析与人脸识别[J].计算机辅助设计与图形学学报,2004,16(7):962-967.