视频匹配

2024-10-10

视频匹配(精选5篇)

视频匹配 篇1

0 引言

视频在传输的过程中由于信道噪声的存在, 导致视频图像中的某几帧图像部分缺失[1]。这就要求对其进行修复, 恢复视频信息的完整性。视频修复所依据的理论基础是, 在随时间变化的视频中, 由于运动的存在, 帧与帧之间存在很大差异。假设景物和摄像设备都是静止的, 则景物在当前帧中的位置与在前后帧中的位置理论上是相同的;如果在静止的景物中还有运动的物体, 则对当前帧中运动物体上的某一点, 与之最相似的点, 应该在前后两帧中。视频修复是数字视频处理中最主要的应用。视频修复最重要的工作之一是对缺失图像中待搜索块的搜索。基于块匹配的方法由于其位移跟踪能力强 (不低于6~7像素/帧) [2], 且计算简单易于实现, 是目前最受关注的算法。常用的几种块匹配算法各有特点[3], 三步搜索算法第一步过于粗糙, 容易偏离搜索方向。新三步搜索算法对于物体做小范围运动时, 减少了运算量, 但对于物体做大范围运动时, 增加了额外的运算量。简单高效的搜索算法减少了搜索方向, 减少了运算量, 但对于物体做小范围运动搜索效果差。针对以上缺点, 本文提出一种能够兼顾物体做大、小范围的运动且性能较好的算法。

1 常用块匹配算法

假设视频中运动的物体有重复模式的运动, 即前景物体每隔一段时间会呈现出相似的周期性的状态, 且视频中没有场景切换。块匹配算法的思想是:将某帧图像分割成N×N像素大小的矩阵块, 在搜索窗口将当前块与参考帧中对应的块比较。运用匹配准则找出最佳匹配, 得到当前块的替代块。该处搜索窗口大小为 (N+2w) × (N+2w) , 最理想情况为该像素矩阵块到搜索窗口四个边的距离为p个像素点, 其中p为搜索参数。参数p的选取受视频中运动物体的幅度约束, 运动幅度越大, 参数p值的选取就越大。但是, 参数p值越大, 处理过程所需计算量就越大。通常, 选取16×16像素矩阵块, 搜索参数p值为7个像素点。目前常用的匹配准则有均方误差函数 (MSE) 和绝对平均误差函数 (MAD) [4,5], 其中, 绝对平均误差函数 (MAD) 表达式为:

式中N为像素矩阵块的大小, Cij和Rij分别为当前帧和参考帧的像素值, 若在某处 (i0, j0) , MAD的值达到最小, 则该点为要找的最有匹配点, 以该点为中心的块为最优匹配块。

均方误差函数 (MSE) 表达式为:

式中N为像素矩阵块的大小, Cij和Rij分别为当前帧和参考帧的像素值, MSE的值越小, 两帧图像匹配越准确。

1.1 三步搜索算法

三步搜索算法TSS (Three Step Search) [6,7], 采用一种由粗到精的搜索模式, 从搜索窗口的中心开始, 按一定的步长取周围的8个点作匹配运算, 第一步测试以原点为中心的8个点, 得到最小的MSE值, 每次都利用上一步搜索得到的最佳匹配位置作为当前搜索中心位置。第二步以最小匹配误差点为中心, 步长折半, 测试新的8个点。第三步, 重复第二步的操作得到最后的匹配点, 示意图如图1所示。

1.2 新的三步搜索算法与简单有效搜索算法

新的三步搜索算法 (New Three Step Search, NTSS) [6,7]算法是基于中心的测试模式, 在原有的TSS算法第一步测试点的基础上再增加了中心点8个邻域点作为测试点, 当最小匹配点出现在8邻域点时, 继续搜索该点临近的8个点, 得到最后匹配点, 示意如图2 (a) 。

TSS的每一步中八个方向都被搜索过, 即在每一步中任一方向与其相反的方向都被搜索过。在此基础上, 简单有效的搜索算法SES (Simple and efficient search) [8]将三步搜索算法 (TSS) 的每一步分解为两部分: (1) 选择四分之一圆; (2) 在选择出来的四分之一圆内计算匹配点, 示意图如图2 (b) 所示。

三步搜索算法的第一步采用的是固定搜索模式, 过于粗糙, 这样造成该搜索方式对视频中的细小运动的匹配效果较差。针对这种缺点, 新的三步搜索算法在原有测试点的基础上加紧搜索中心区域, 在每个测试点上加了8个步长S=1邻域点, 对于静止及亚静止块的匹配非常有效, 提高了搜索的准确性。但是TSS和NTSS搜索算法的搜索方向是从中心到周围的方向, 即以测试点为中心的8个方向都被搜索过, 也就是说, 任何一个方向及其相反方向都被搜索。当匹配的块与实际的运动方向一致时, 误差是单调减小的, 其相反方向是单调增加。这就决定了最优匹配块不可能同时出现在两个相反的方向。针对这个缺点, 简单有效搜索算法只搜索八个方向中的四分之一, 大大减少计算的复杂度。但此算法的第一步, 没有考虑到视频中的细小运动。

2 改进的搜索算法

为了解决新的三步搜索算法与简单有效的搜索算法的不足, 本文提出了一种新的匹配方法, 新的简单有效的搜索算法NSES (New Simple and efficient search) 。

本文在三步搜索算法的基础上, 结合新的三步搜索算法与简单有效的搜索算法的优点, 减少搜索方向的同时, 对视频中存在的细小运动也进行匹配, 保证了结果的准确性。具体思想, 算法仍分为3步, 将三步搜索算法 (TSS) 算法的每一步分为两个部分: (1) 选择四分之一圆; (2) 以确定的四分之一圆内的测试点为圆, 继续选取四分之一圆, 在第二个四分之一圆内计算匹配点。如图3所示。

具体步骤如下:

Step1计算A、B、C三点的MAD, 选择下一步测试的象限, 计算匹配误差:

若MAD (A) ≥MAD (B) 和MAD (A) ≥MAD (C) 选择b;

若MAD (A) ≥MAD (B) 和MAD (A) <MAD (C) 选择c;

若MAD (A) <MAD (B) 和MAD (A) <MAD (C) 选择d;

若MAD (A) <MAD (B) 和MAD (A) ≥MAD (C) 选择e。

Step2计算距原点A步长S=1及大步长测试点的MAD值。若最优匹配点出现在大步长的测试点, 该点设为A, 减半步长重复Step1和Step2直到找到最优匹配;

Step3若最优匹配点是步长S=1的3个邻域点之一, 计算这点在搜索方向上步长S=1的邻域点。

3 改进的搜索算法

仿真实验使用标准视频库中的1000帧序列图做测试 (每帧240×320像素) , 在操作系统为XP、主频为2.11GHz、2.0GB内存的PC机上, 运用Matlab7.1完成。对以上三种搜索算法进行比较, 主要测试了NTSS方法与NSES方法的每个待匹配块所需时间和搜索点数的比较, 结果如表1所示。同时也对SES方法与NSES方法的匹配正确率做了比较, 如表2所示。将三种算法应用于视频修复的过程中搜索到的匹配块如图4所示。

由表1可知, 本文方法NSES与原方法NTSS的每个待匹配块所用时间有所减少, 减少幅度为29.55%, 搜索点数也减少, 减少幅度为29.23%。本文方法与原方法NTSS方法在准确率上相当均为98.73%。

由表2可知, 本文方法NSES与原方法匹配准确率上有所增加, 在时间上, 本文方法NSES与原方法的每个匹配块所用时间分别为:4.182 s、2.956 s, 时间增加幅度在允许范围内。

从图4中 (f) 与 (g) 和 (i) 与 (j) 比较, 可以看到本文方法在搜索到的匹配块比SES方法搜索到的匹配块与待匹配块更相近, 本文方法与NTSS方法的匹配结果一致。

4 结语

本文在简单有效的搜索算法的基础上, 加入新的三步搜索算法的思想提出了一种新的简单有效搜索算法, 在对视频缺失的图像块进行块匹配时, 提高了准确率。通过仿真实验进行搜索匹配时, 本文算法的性能更好。另外, 本文所得出的实验数据是NTSS搜索算法与SES搜索算法相结合得出的, 其他几种搜索算法的结合, 如三步搜索 (TSS) 、全局搜索 (FS) 、菱形搜索算法 (DS) 结合, 它们的搜索效率及算法性能有待进一步的研究。

摘要:视频修复最主要的工作之一是对缺失图像块的匹配替代块的搜索。针对传统块匹配算法具有易陷入局部最优的固有缺陷的不足, 提出一种新的块匹配搜索算法。该方法结合新的三步搜索方法和简单高效的三步搜索方法的优点, 在简单有效的搜索方法确定了四分之一选区后, 在该四分之一选区内加上相应的小步长临域搜索点, 以提高对于小范围运动的匹配效果。仿真实验结果表明该方法能够更准确、更高效地搜索匹配块, 对于视频修复具有非常重要的意义。

关键词:视频修复,块匹配算法,均方误差

参考文献

[1]朱雅, 李霁野.H.264/AVC在无线视频传输中的错误恢复机制[J].计算机应用与软件, 2011, 28 (1) :298-300.

[2]向友君, 郭宝龙.运动估计快速匹配算法[J].计算机工程, 2003, 29 (17) :62-64.

[3]贺文伟.视频编码中运动估计算法研究[D].山东:山东大学, 2006.

[4]Kundu A.Modified block matching algorithm for fast block motion estimation[J].Signal and Image Processing (ICSIP) , 2010:260-264.

[5]张晓星.基于块匹配的运动估计算法研究与实现[D].北京:北京交通大学, 2008.

[6]Raghavendra K.Video inpainting and object separation[D].Indian:Indian Institute of Technology, 2007.

[7]陈宫, 牛秦洲.图像序列运动估计中经典块匹配算法研究[J].计算机应用与软件, 2012, 29 (5) :149-151.

[8]Lu Jianhua, Liou M L.A simple and efficient search algorithm for block-matching motion estimation[J].Circuits and Systems for Video Technology, 1997:429-433.

视频匹配 篇2

近年来,基于图像分类的图像集相关方法经历了一次爆炸性的发展[5 - 7]。一些非参数方法试图把图像集表示为一个线性子空间[8]或非线性流形[9],这些方法不附带任何数据分布的假设,并且相对于参数模型来说具有许多优点。例如,文献[10]应用仿射包模型来解释不可见外观并且提出近似最近点法以衡量不同集之间的相似性,其通过施加稀疏约束使得最近点贴近某些平面。基于这种假设,文献[11]提出了从子空间至子空间距离的方法,即相互子空间法( MSM) ,通过各个子空间之间的相互匹配来解决图像集之间的匹配问题。文献[12]从子空间至子空间距离拓展至流形—流形距离( Distance between Manifold and Manifold,MMD) ,通过最大线性分割[13]将线性流形分割成多个局部线性模型,然后转化成逐对的子空间之间的距离。局部线性模型的一个延伸称为流形判别分析,它的提出主要用于求解约束流形之间的距离。这些基于非线性流形的方法在许多公共的人脸数据库中都取得了很好的效果,然而,目前大多数现存的流形匹配方法都是局限于监督或非监督的范围内,需要通过手动标注或者先验知识获得一些已知的匹配点,而对于大规模的视频数据若通过手动标注的方式来获得匹配点是件非常棘手的事情,所以这些方法不适合用于解决视频图像集匹配问题。

为了解决两个图像集之间的匹配问题,提出了一种非约束图像参考集匹配方法( Non-Binding Image Referring Set Matching,NB-IRSM) ,较好地定义一个参考图像集并且预先结构化成若干局部线性离线模型,然后将其与所有的图像集匹配,不再使用传统的流形判别分析( Manifold Discriminative Analysis,MDA)[14]中的总体线性变换,实验结果表明了所提方法的有效性及优越性。

1 问题提出

不失一般性,本文连接所有像素的强度,形成特征向量进而表征任意人脸图像。形式上看,两个图像集———目标集( 图库集或待测集) 和参考集分别由X = { xi| i =1,2,…,m} 、Y = { yi| i = 1,2,…,n} 表示,其中xi和yi表示样本,m和n分别是X和Y中的样本数。目标是寻找一个映射函数f ,即所谓的匹配函数,它将X中任意目标图像x映射到Y中的参考图像y 。将这个问题看作一个优化问题

其中

式中: Nxi表示xi的邻近元素; λ1和 λ2是三项的影响平衡系数。第1 项Eg表征两图像集之间的几何相似度值,其中g为几何一致性函数,衡量两个局部模型的差异程度。第2 项Ec反应了外观相似度,其中c为两点之间的匹配成本函数。第3 项Es用于保持平滑性,例如目标集的邻近关系应当储存在参考集中。

2 非约束图像参考集匹配

简要介绍一下所提方法,首先选择一个图像集作为参考集,这样所有的图像集都可以与之进行相互匹配; 接着从图像集中随机选取某人的一个视频序列,该序列具有足够的帧数,覆盖了不同的变化因素; 接着实施一个离线过程,把参考图像集分割成若干局部线性子空间; 然后用图像集匹配算法将待测样本、图库样本集和参考集进行匹配; 随后根据参考集的预先分段,对待测集和图库集进行相应的子空间划分,从而使得待测集和图库集的子空间可以进行自然匹配; 最后,只要计算相应的子空间距离,而不是计算成对的子空间,并将这些相似度值送入分类器,完成人脸的分类与识别。

2. 1 几何一致性

引入局部恒定的几何约束用于图像集的匹配,如上面所说,将每个图像集表示为一个流形。为了表征流形中每个点的领域的几何性质,假设每个xi可近似表示为它邻近点的仿射和

式中: W = { Wij} 是所有点的重组权重矩阵; Wi -th行存储了i - th个点xi的所有重组系数,其中 。具体而言,就是利用最小二乘法描述每个点的局部几何特性,即

显然,方程( 6) 是近似仿射不变的,所以,可以通过权重矩阵进一步将Eg公式化,如下面的目标函数所示

式中: Wx表征了图像集X的重组权重矩阵。如果将每个点的映射关系标记为一个向量,那么函数f可以表示为{ 0,1} 的二维矩阵Fm ×n。因此,函数( 7) 可以改写成如下的矩阵公式

由于W每一行的和都等于1,所以Lx可以看作某个图形的拉普拉斯矩阵,其中,边界可以由Wx构建,I是一个单位矩阵。

利用k个邻近图像集的欧式距离矩阵去描述局部几何特性,其所有的k! 可能的排列都被考虑进匹配成本O( k! ) ,相比文献[1],该模型是局部仿射不变的,求解映射F更容易。

2. 2 面部匹配开销

为了测量姿势、光照、表情及其他因素均互不相同的两个来自不同图像集的图像的相似度,提出对应的局部空间最大主角作为相貌匹配成本。

给定两个线性子空间S1和S2,主角0 ≤ α1≤ … ≤αr≤π/2( r = min( dim( S1) ,dim( S2) ) ) 等同于如下定义

式中: uk和vk是标准向量的第k对元素,“”指子空间的减法运算。主角的余弦值称为典型相关值。显然,最大主角越小,子空间越接近。通常情况下,根据最相似模模型选取标准向量的第一对元素之间的距离作为两个子空间的距离。

鉴于上述对于子空间距离的定义,可以根据两个局部线性子空间的最大主角计算两个图像的相貌匹配成本,进而推进到邻近的两个图像。式中因为xi和yi分别来自于X和Y ,所以它们邻近的k - NN元素可以拓展为子空间Sx和Sy。然后,根据上述子空间距离计算xi和yi和匹配分值,记作Cij。然后,将图像集X和Y的匹配值记作矩阵C = { Cij} 。这样,式( 3) 中Ec可以改写为

式中: tr表示矩阵的迹。

2. 3 平滑约束

直观地说,流形应当保持平滑,构成的曲面嵌入更高维数的欧式空间中,因此,匹配两个图像集时,应当保存其局部的邻近关系,即X中邻近的两个图像,在Y中与之对应的图像也应当是邻近的。

形式上,定义X中每个图像的第k个邻近关系为矩阵Rk

所以,式( 4) 中Es可以由以下公式表示

式中: Lk= I - Rk,k是局部邻近元素的个数。

2. 4 高效的解决方案

根据以上分析,目标函数( 1) 可以由如下的带整数约束的二次规划进行式化

式中: 变量F是一个m × n的表征图像匹配函数f的二维分配矩阵。F的每一行只包含一个1 ,这意味着X中每个点在Y中有且仅有一个投影点。式( 13) 中有3 个约束。第1 个约束保证X中所有图像匹配到Y中。第2 个表示X和Y中点的匹配关系要么是“是”要么是“否”。第3 个约束表征了X中最多有l个图像可以匹配到Y中相同的图像。

式( 13) 是一个带整数约束的二次目标函数,这完全是NP问题,不能有效求解。放开整数约束,同时将目标函数简化如下

式中: U可以由SVD求出,方程如下

本文利用MATLAB工具箱,采用“内点”法[10]去优化目标函数( 14) 。非约束图像集匹配的整个算法流程总结在算法1 中,为了对算法进行加速,利用置信区间收缩法[9]去近似求解凸面优化问题。

算法1: 非约束图像集匹配

输入:X={x1,…,xm},Y={y1,…,yn},m≤n。

输出:二维矩阵Fm×n。

1)分别找出X和Y中每个点的k个邻近元素;

2)由式(6)计算出权重矩阵Wx;

3) 由主角计算出相貌匹配成本C ;

4) 对于每个点xi∈ X初始化置信区间Ti= { yi1,yi2,…,yit} ;

5)While置信区间足够大;

6)由式(14)求解F;

7)移除F中值非常低的点,进而收缩置信区间;

8)End;

9)根据最终的置信区间,由式(14)求解F;

10)将F量化到矩阵{0,1};

11) 优化目标函数( 15) ;

12)计算各个图像集与参考集之间的欧式距离;

13)k近邻完成识别。

3 实验

3. 1 人脸数据库

实验使用了三大通用的视频人脸数据库: Honda/UCSD[3],CMU Mo Bo[4]和You Tube Celebrities[7]。

Honda / UCSD由Lee等人收集用于视频人脸识别研究。实验用他们的第1 个子集,包含20 个目标的59 段视频( 对于每个目标至少有2 段视频) 。每个视频序列包含不同的姿势和表情变化。使用级联的人脸检测器检测每段视频序列的人脸。然后,将所有的人脸调成20 × 20 像素的灰度图像。视频的长度从12 帧到645 帧不等。为了消除灯光影响,采用直均衡化的方图对图像进行预处理。

CMU Mo Bo数据库起初创建是为了用于人的姿势鉴定。该数据库包括了24 个不同目标的96 个序列,即每个目标4 段视频。每个视频都是从跑步机上行走时抓拍的,有300 帧。利用处理Honda数据库相同的方法去获得30 × 30 像素的人脸图像。

You Tube用于在真实世界中进行跟踪和识别。该数据集包含47 位明星( 男演员,女演员和政治家) 的1 910段视频序列。每个序列数百帧,低分辨率和高压缩率。与Honda和Mo Bo数据库相比,该数据库更加具有挑战性,因为噪声因素以及姿势,光照和表情的复杂变化。人脸图像同上调整为30 ×30 像素。

3. 2 实验结果

实验首先进行图像匹配实验去验证所提的匹配方法的有效性,接着,将该匹配方法应用到基于视频的人脸识别中,用各种姿态执行人脸图像匹配,随机选取50 个目标,对于每个目标,选取7 个姿势,面侧角( 间隔15°) 的不同表情和光照的83 张人脸图像。这些图像裁剪至20 ×30像素来模拟低质量的视频人脸图像。

所提方法主要的参数设置: 1) 控制参数: λ1= 2,λ2=0. 1; 2) 当对局部线性模型的灰度特征进行投影时,对应于3 个数据库,PCA的维数分别设定为70,60,80; 3) LDA的维数设置为分类数减1。实验利用欧式距离计算投影后两个相关线性模型的相似度,最小值就是最终图像集的距离。r的值取0 或1,近邻数k取不同的值( k = 1,3,4,…,10) ,进行了大量的实验,在3 个视频人脸数据库上的实验结果图1、图2 所示。

从图1、图2 中可以看出,随着近邻数的增加,r = 1的情况下,所提方法在3 个视频人脸数据库上取得的最佳识别率分别为98. 9% 、95. 0% 、74. 6% ; r = 0 的情况下,所提方法在3 个视频人脸数据库上取得的最佳识别率分别为97. 2% ,93. 8% ,72. 5% 。当r = 1 时,最近的姿势也视为是一次正确的匹配,而r =0 时,表示仅仅当计算对应的姿势时才是正确的匹配。同时,r = 1 时,该方法的最高识别率可达98. 90% ,这意味着几乎所有的匹配结果最多在± 10° 的姿势偏差内。值得指出的是,以前的研究仅使用几何相似度,而没有相貌匹配成本,所提方法具有更高的精度,可能是因为同时使用了相貌匹配成本和几何结构相似度的原因。此外,该方法仅需3 s就可以完成2 个图像集之间的匹配,这比文献[7]的方法快很多。

3. 3 比较与分析

这部分将所提方法与最近几年提出的各种图像集方法进行了比较,包括线性判别分析方法( LDA)[2]、相互子空间法( MSM)[11],判别典型相关性分析法( DDC)[15],流形—流形距离法( MMD)[12],流形判别分析法( MDA)[14],以及稀疏近似邻近点法( SANP)[10]。除了LDA方法,这里没有提供较多的基于样本方法的实验结果,因为文献[5,7,8,11]都已表明基于图像集方法的实验效果均比基于样本的方法好。对于3 个不同的人脸数据库,所有参与比较的方法的最佳识别率如表1 所示。

%

从表1 中可以看出,与其他所有方法相比,所提方法在3 个视频人脸数据库上取得的效果都是最好的。其中,MSM,MMD及SANP均以衍生的方法处理图像数据,而DCC、MDA及所提方法都利用了辨别式标签信息,这使得它们比DCC、MDA及所提方法稍逊一筹。在3 个人脸数据库上,SANP方法都比MSM方法的效果更好,这是因为稀疏约束使得最近点更加贴近仿射面。与SANP方法一样,相对于MSM方法,MMD方法存在更优的识别效果,这是因为它把复杂图像用多个局部线性模型表示,也正因为如此,MDA和所提方法相对于DCC来说更加优越。MDA采用了非线性模型,但是它忽略了集之间的对应关系,仅仅采用总体线性转化以提取辨别特征,并执行成对子空间的比较,而没有匹配过程。与MDA相比,所提方法更为优越,这是因为它消除了由于归类而造成的偏差。

4 总结

针对视频人脸识别中系统不能很好地学习人脸图像有效特征的问题,本文提出了非约束图像参考集匹配方法,通过预先定义一个参考集,构造了多个局部模型,这些模型对于两个图像集的匹配起着很关键的作用。在三大通用视频人脸数据库上的实验结果表明,相比其他文献中的方法,所提方法在处理视频人脸识别问题时是非常有效的,并且效果也是非常稳定的。

以后会将所提的方法运用到其他视频人脸数据库中进行测试,改变不同参数的初始设置及变化,通过实验进一步提高识别率,并且改善识别率的效率。

摘要:针对视频人脸识别中系统不能很好地学习人脸图像有效特征的问题,提出了非约束图像参考集匹配方法,通过在两个图像集之间预先定义参考集构造多个离线的局部模型,并分别与参考集进行匹配,无需考虑所有的成对情况,从而计算出它们的相似度,有效地将视频人脸识别问题转化成二次规划问题。所提方法的有效性在Honda、MoBo及YouTube三大视频人脸数据库上进行了验证,实验结果表明,与现有的视频人脸识别方法相比,所提方法取得了更好的识别效果。

视频匹配 篇3

随着电视和网络事业的蓬勃发展及其播出节目内容的日益丰富, 既繁荣了传媒行业, 也为电视、网络的广告产业提供了广阔的前景。同时广告是电视台和网络企业赖以生存和发展的经济基础。随着电视、网络节目的增多, 采用现代化的手段监视、记录、存储、查询广播电台节目内容, 监视广告的内容, 监测节目的播出时间、播放质量, 播放时长已经成为相应管理部门加强监管的重要手段。由此产生了广告行业内的监播系统。

随着计算机的飞速发展, 出现了智能广告监播系统, 目前主要有两种:一种是基于声音识别的智能监播系统;另一种是基于图像识别的智能监播系统。相对而言, 人类通过视觉渠道所获得的信息往往更加形象和具体, 图像信息给人的印象也更为深刻, 因此图像的监播结果较声音完整, 而且在只有视频图像没有语音信号的广告中同样适用 (网络中的许多广告大多没有声音) 。因此, 在利用计算机进行实时监控的过程中选择图像信息作为切入点, 更有利于全面实现实时监测。

在基于图像识别的智能监播系统中, 所用的图像匹配方法普遍采用的是序贯相似检测算法, 该方法是基于灰度相关的匹配算法。基于灰度相关的匹配算法是一种对待匹配图像的像元以一定大小窗口的灰度阵列按某种或几种相似性度量顺次进行搜索匹配的方法[1]。基于灰度相关的匹配能够获得较高的定位精度, 但是它计算量大, 难以达到实时性要求, 而且一旦进入信息贫乏的区域, 会导致误匹配率的上升。而本文提出的基于图像边缘特征的启发式快速匹配算法是基于特征的匹配方法, 该类方法首先从待配准的图像中提取特征, 用相似性度量和一些约束条件确定几何变换, 最后将该变换作用于待匹配图像。

2 智能图像识别的原理及构成

2.1 关键帧的提取

视频的信息量比音频大很多, 如果把视频广告样本中所有图像信息都作为特征, 逐点和监播视频信号作匹配对比, 显然这样的计算量太大, 实际应用起来难以满足实时监播的要求。因而, 我们必需考虑如何提取视频图像的特征, 既要满足速度要求, 又要满足精确度的要求。

关键帧是用于描述一个镜头的关键图像帧, 它通常会反映一个镜头的主要内容。关键帧的使用可以大大减少匹配的计算量, 关键帧提取最基本的方法主要有:基于镜头边界法、基于帧图像信息法[2]、基于运动分析法[3]、基于视频聚类提取关键帧[4], 还有针对特定视频类型的视频帧提取算法, 如基于图像和文字信息提取新闻视频关键帧.而对于广告, 一般每条广告的时间比较短, 可以根据镜头边界法, 也可以间隔一定的时间进行提取。

提取关键帧有两个目的:一是希望用它来表示视频节目的主题和部分内容, 而不是动态的细节;二是关键帧的选取可以把对动态视频的研究转变成对静态图像的分析上, 使问题研究更为简化, 同时还可利用图像分析的方法从关键帧中提取颜色、纹理和形状等特征作为视频摘要数据库索引的数据源。

2.2 图像特征提取

特征提取是图像识别的关键, 主要是利用图像所包含的多种特征:如匹配中常用的特征有边缘、轮廓、直线、兴趣点、颜色、纹理、运动特征等等。检索时依据示例图像的特征和数据库中的图像特征相比较, 在设定的相似度内搜索出所有符合条件的图像。而边缘是图像最基本的特征, 是图像灰度变化最剧烈的地方[5]。图像边缘和图像内容的物理特性之间存在着直接的联系, 因此, 图像的边缘包含了图像大部分的信息。

2.3 图像匹配

在基于图像识别智能广告监播中, 对图像的识别都采用模板匹配的方法进行识别。所谓模板匹配是通过把输入图像与样板图像重叠, 进行比较匹配, 并对两者是否一致进行判定的处理。通过判断的图像和样本库中的图像的差异度或相似度来达到识别的目的。

3 图像边缘检测

所谓边缘是指周围像素灰度有阶跃变化或屋顶变化的那些像素的集合。边缘在实际应用中, 图像数据往往被噪声污染, 因此边缘检测方法要求既能检测到边缘的精确位置, 又可以抑制无关细节和噪声。

由于边缘检测是定位灰度级的变化, 通常使用微分法来定位边缘。在微分法边缘检测中, 边缘定位与噪声滤除是一对矛盾, 很难同时得到很好地解决。边缘检测的一个重要目标即是获得边缘定位和噪声滤除的最佳折衷。经典的、常规的图像边缘检测方法如一阶微分的梯度法和二阶微分法等仍在使用, 这些方法普遍对噪声敏感, 抗噪性能差, 并且常常会在检测边缘的同时加强噪声[9]。

随着小波理论研究的不断深入和实际应用的日益广泛, 小波分析在滤波、信号和图像处理[8,9,10]等方面的优势已逐渐显露。小波分析在时域和频域都具有良好的局部化性质, 而且由于它对高频分量采用逐步精细的时域或频域取样步长, 从而可以聚焦到对象的任意细节。因此, 基于小波变换的图像边缘检测算法的研究逐渐成为图像处理领域的热点。

3.1 传统的图像边缘算法

传统的边缘检测就是对图像各个像素点进行微分或求二阶微分来确定边缘像素点。一阶微分图像的峰值处对应着图像的边缘点;二阶微分图像的过零点对应着图像的边缘点。根据数字图像的特点, 处理图像过程中常采用差分来代替导数运算。常用的一阶微分算子有robert算子、sobel算子、prewitt算子;二阶微分算子有拉普拉斯算子和log算子。

传统的边缘检测方法由于引入了各种形式的微分运算, 而必然引起对噪声的极度敏感, 执行边缘检测的结果常常是把噪声当作边缘点检测出来, 而真正的边缘受到噪声干扰而没有被检测出来。因而对带噪图像来说, 一种好的边缘检测方法应具有良好的各种噪声抑制能力, 同时又有完备的边缘保持特性。

3.2 基于小波变换的图像边缘检测[7,8,9]

小波分析克服了短时傅立叶变换在单分辨率上的缺陷, 具有多分辨率的特点, 在时域和频域都有表征信号局部信息的能力, 时间窗和频率窗都可以根据信号的具体形态调整, 在一般情况下, 在低频部分 (信号较平稳) 可以采用较低的时间分辨率, 而提高频率的分辨率, 在高频情况下 (频率变化不大) 可以用较低的频率分辨率来换取精确的时间定位。因为这些特点, 小波分析可以探正常信号中的瞬态成分, 并展示其频率成分, 被称为数学显微镜。

信号的奇异点 (如过零点、极值点等) 能够通过对信号进行小波变换后在不同尺度上的综合表现, 来反映信号的图变或者瞬态特征, 如信号的瞬变或者边缘的不同表现:过渡得比较陡峭或者平稳, 在小波多尺度变换上就表现为最大值的变化情况。突变信号在数字信号处理中具有非常重要的地位和作用。在图像处理中, 把像素点的灰度作为像素点位置的函数, 那么清晰的物体边缘在图像中表现为像素点灰度值的突变, 检测这些突变点就可以掌握图像中物体的边缘和形体特征。这在图像识别、目标检测、计算机视觉应用方面都是关键性的技术问题。

多数多尺度边缘检测是在不同的尺度上先平滑原信号, 再由平滑后的信号的一阶或二阶导数检测出原信号的剧变点。

设θ (t) 是一个起平滑作用的低通平滑函数, 且满足式 (1) 、 (2) :

通常取θ (t) 为高斯函数或者取规范B样条函数等。假设θ (t) 是二次可导的, 定义式为 (3) 、 (4) :

则函数Ψ (1) (t) , Ψ (2) (t) 满足小波的容许条件, 即式 (5) 、 (6) :

因此, 可用做小波母函数。若记则θ (t) 表示在尺度因子s下的伸缩。由于小波变换就是将原始信号用伸缩小波进行卷积得到, 于是有:

由此可见, 小波变换ws (1) , ws (2) 分别是函数f (t) 在尺度s下由θ (t) 平滑后再取一阶、二阶导数。当s较小时, 用θs (t) 对f (t) 平滑的结果对f (t) 的突变部分的位置与形态影响不大;当s较大时, 则此平滑过程会将f (t) 的一些细小的突变消去, 而只剩下大尺寸的突变。由此可知, 当小波函数可看做某一平滑函数的一阶导数时, 信号小波变换模的局部极值点对应信号的突变点 (或边缘) 。当小波函数可看做某一平滑函数的二阶导数时, 信号小波变换模的过零点, 也对应信号的突变点 (或边缘) 。这就是采用检测小波变换系数模的过零点和局部极值点可检测信号的突变点 (或边缘) 。这就是采用小波变换系数模的过零点和局部极值点可检测信号的突变点 (或边缘) 的原理。

同时小波变换提供了一种很好的降噪方法, 由于在正交小波中, 正交基的选取比传统方法更接近实际信号本身, 所以通过小波变换可以更容易地分离出噪声或其它信息, 因此小波分析有着传统方法无可比拟的优点。

4 图像匹配算法

4.1 序贯相似度检测算法 (SSDA) [6]

设参考图像Xij的大小为m×n, 输入图像Yij的大小为M×N, 其中。表示M>m, N>n。Y (a, b) ij输入图像以 (a, b) 为中心, 与参考图像大小相等, 对应 (i, j) 位置的像素灰度。

SSDA算法是一种快速图像匹配算法, 它使用下式作为相似性度量:

SSDA以随机不重复的顺序选取像元对 (i, j) , 在进行上述求和时不需要计算所有像素, 只要其和超过某一设定的阈值, 则说明当前位置为非匹配位置, 停止本次计算, 否则进行下一位置的测试, 直至找到匹配点为止。基于灰度相关的匹配能够获得较高的定位精度, 但是它计算量大, 难以达到实时性要求, 而且一旦进入信息贫乏的区域, 会导致误匹配率的上升。

4.2 基于小波变换的图像边缘特征的启发式快速匹配算法

在基于图像边缘特征的匹配算法中, 将模板图像包含的一组边缘点记为pi- (xi, yi) T, 相应的梯度向量记为di- (ti, ui) T, i=1, …, n。n表示模板图像的边缘点个数, 待搜索图像中的每一点 (x, y) 对应的梯度向量记为ex, y= (vx, y, wx, y) T。首先要为图像中的每一个点得出相应的一个梯度向量, 使用提取出来的边缘点特征作为匹配的特征空间, 然后, 最重要的一步是寻找一种有效的相似性测度, 可以利用模板图像和搜索子图像对应点之间的梯度向量的点积之和来计算搜索图像上的某一个搜索位置q= (x, y) T与模板的匹配程度, 这种相似性测度的定义如下:

去均值归一化后, 相似性测度为:

这时相似性测度的最大值只能1.如果模板图像和搜索子图像上对应点的梯度向量的吻合程度越高, 相似性测度值也就越接近1, 这样就方便我们通过设定一个最小的匹配分数来确定图像中是否存在要识别的目标物体。

在基于边缘点特征的图像匹配中, 为了在匹配中能尽早地判断当前位置是不是匹配点, 从而不需要在各个测试位置上都作完全的相似测度计算, 这样就能有效地加快匹配速度。为此, 需要引入匹配的最小接受程度Smin, 即如果匹配过程中所有测试位置的相似测度值都小于Smin, 则认为图像中没有找到要目标物体.设Sj (q) 表示对应点梯度向量的归一化点积累加到模板图像中的第j个像素点时的部分测度值, 定义为:

很明显, 一开始Sj很小的, 如果在累加计算到模板图像中的第j个像素点时满足条件Smin-Sj>1-j/n, 即, Sj

为了进一步提高匹配速度, 可以使用另一种更加苛刻的判别标准, 要求所有时刻计算出的部分测度值都满足条件Sj>Sminj/n.使用这个判别标准可以更加有效地提高匹配速度, 但并不能保证找到最佳的匹配位置, 特别是当搜索图像受到一些外部干扰的时候.为了在保证匹配概率的同时尽可能地提高匹配速度, 可以结合前面两种判别标准, 采用启发式的搜索策略, 即让一部分像素点采用第一种相对安全的判别标准;而剩下的那一部分采用第二种相对冒险的判别标准.即把判别标准制定为:

当计算到部分测度和满足这个条件时, 则停止在当前搜索位置上的匹配计算。在式 (13) 中, f= (1-gSmin) / (1-Smin) , g是启发式搜索的权重, 用来指定多大比例的部分采用安全的判别标准, 它的取值范围是从0到1, 当g取值越大时, Smin-1+fj/n的增长速度越慢, 意味着有更大比例的像素点采用安全的判别标准, 从而使得匹配速度越慢;当g取值越小时, Smin-1+fj/n的增长速度越快, 意味着有更大比例的像素点采用相对冒险的判别标准, 从而使得匹配速度越快。

5 实验结果与分析

对图像的边缘检测采用基于小波变换的边缘检测算法和经典算法进行比较, 如图2和图3所示。图2的图像中不含噪声, 图3的图像中含有噪声。从图中可以看出:roberts算子提取边缘的结果是边缘比较粗, 对噪声敏感;sobel算子提取边缘的结果好于roberts, 但边缘定位精度不够高, 对噪声也很敏感;prewitt算子提取边缘的结果是边缘比较粗大并且有一定程度的断裂, 对噪声也很敏感;log算子经常出现双像素边界, 并且该检测方法对噪声比较敏感;很少用log算子检测边缘, 而是用来判断边缘像素是位于图像的明区还是暗区;基于小波变换的图像边缘检测, 能够检测到真正的弱边缘, 能很好的抑制噪声, 边缘的连续性较好, 可见基于小波变换的图像边缘检测方法比其它几种方法具有更好的连续性和噪声抑制能力。

对于基于边缘特征的图像匹配中通过实验表明, 该算法的匹配效果主要与边缘检测的阀值、匹配的最小接受程度和启发式搜索的权重这三个参数有关, 应该根据不同的场景选择合适的值。对于252×194的搜索图像, 40×40的模板, 当thresh=15, Smin=0.9, g=1时, 能在0.24秒成功匹配;当g=0.3时, 能使成功匹配的耗时缩减到0.047秒.实验中用3幅不同的搜索图像分别为252×194、316×268、480×322来测试算法的匹配时间, 对应的模板大小分别为40×40、52×52、60×60.实验结果如表1。

6 结论

本文在分析了传统图像边缘检测算法和图像匹配方法的基础上, 进一步完善了基于小波变换的边缘检测算法, 并提出了基于小波变换的图像边缘特征的启发式快速匹配算法。实验结果表明, 基于小波变换的图像边缘检测算法能够比其它算法保留更多的图边缘信息, 鉴别出伪边缘, 边缘的连性较好。而基于边缘特征的启发式快速匹配算法比传统的序贯相似性匹配算法 (SSDA) 所用的时间显著缩短, 这样在基于图像识别的广告监播系统中, 对图像进行边缘检测后, 只对边缘点进行匹配, 这样能提高匹配速度, 提高识别效率, 达到实时监播的作用。

参考文献

[1]田金文, 杨磊等.基于局部分形特征的快速图像匹配方法[J].华中理工大学学报, 1996:24 (2) .12-14.

[2]于俊清, 彭丹霖.基于关键帧的视频摘要研究[J].计算机工程与设计, 2005, (10) :2598-2601.

[3]韦岗, 邱伟.现代信号处理理论与技术[M].广州:华南理工大学出版社, 1994.

[4]Wolf W.Key frame selection by motion analysis[A].Proceeding of IEEE International Conference on Acoustic, Speech and Signal Processing, Atlanta:ICASSP, 1996.1228-1231.

[5]李弼程, 彭天强, 彭波等.智能图像处理技术.北京:电子工业出版社, 2004.

[6]吴培景, 陈光梦.一种改进的SSDA图像匹配算法.计算机工程与应用.2005, 33:76-78.

[7]张书玲, 张小华.基于小波变换的边缘检测[J].西北大学学报, 2000, 30 (2) :93-97.

[8]高军, 李学伟, 张建.彩色印刷品质量检测系统图像预处理算法的研究[J].包装工程, 2007, 28 (1) :64-66.

[9]丁艳, 刘榴娣, 郭宏.小波变换在图像边缘检测中的应用[J].北京理工大学学报, 1998, 18 (5) :621-624.

[10]王家文, 曹宇.MATLAB6.5图形图像处理。北京国防工业出版社, 2004, 5.

[11]程正兴.小波分析算法与应用。西安:西安交通大学出版社, 1998, 5.

视频匹配 篇4

关键词:视频编码,匹配追踪,遗传算法,排序差分

(一)引言

目前几乎所有的视频编码核心技术都是采用的运动补偿(MC-Motion Compensation)加离散余弦变换(DCT-Discrete Cosine Transform)编码的方式。基于DCT的视频编码在低码率 (64kbit/s) 下将产生严重的块效应, M.Ohta和Zhang Xudong提出了重叠块运动补偿 (OMC) 和离散小波变换 (DWT) 编码算法对块效应进行改进;但在甚低码率时, 以上算法对块效应的有效性将显著降低。而用匹配追踪算法代替DCT能有效减少块效应。

MP算法是用过完备库集去匹配视频残差信号,同时它将首先编码图像能量最大的区域,这些特性使得MP算法能够有效的减少块效应。Neff和Zakhor首先提出了用MP分解帧间位移误差场DFD信号,证明了其有效性。2006年Haoxiang Zhang等人将MP应用于H.264标准,在中低码率下,与H.264标准相比得到较好的效果。近几年,国内外提出了许多相关的算法,这些算法结果都证实了在甚低码率下,与DCT相比取得更好的PNSR和视频主观质量。

由于MP算法用的是过完备库集,所以计算量比较大。本文在研究现有基于MP的视频编码算法的基础上,用遗传算法选取最佳原子,提高了算法速度,同时用排序差分法对量化结果编码,提高了编码效率。

(二)匹配追踪算法

Mallat和Zhang首先于1993年提出了信号在过完备原子库上分解的思想,其基本原理是任何一个信号f (t) 都可以用一个超完备函数,G中基函数gr (t) 线性表示,而且表示不唯一。匹配追踪是一个逐次迭代逼近过程:

其中gγ0是信号f在原子gγ0上的分量或投影,Rf是用最佳原子对原信号进行最佳匹配后的残余。显然,Rf与gγ0是正交的,即:

为使||Rf||最小,从而必须使极大化,然后我们可以用残余信号取代原始信号重复上述过程直到得到一个相关的分解系数或者残余信号达到某个能量阈值,经过m次迭代,信号f被分解为:

RM f为原信号分解为M个原子的线性组合后的残余。由于每一步分解都是选取的最佳原子,所以残余RM f随着分解的进行迅速地减少。

本文选择2-D可分Gabor基函数超完备集作为帧间位移误差场DFD信号匹配编码集,进行匹配编码选择。Gabor函数具有很好的时频窗口特性,也可以利用可分性降低编码复杂性。

通过1-D Gaussiang (t) =函数构造可分2-D Gabor超完备基函数集G, 1-D Gabor基函数定义如下:

其中α= (s, ξ, φ) 为基本的三维矢量,Kα为Gabor超完备集规一化参数,N是G中的基函数维数。

则2-D离散可分Gabor基函数为:

其中B为所有基本三维矢量α和β的集合。

(三)基于遗传算法的MP

在基于MP的信号稀疏分解中,每一步都要完成信号或信号分解的残余在过完备库中的每一个原子上的投影计算。每一步分解实际上要进行的内积计算是一个很高维空间的内积计算,而且要计算很多次,这是MP信号稀疏分解计算量巨大的根本原因所在。根据第2部分所述,MP每一步分解实际上是一个最优化问题,直接的求解方法是全局搜索,这将非常费时,而利用遗传算法可以很好的快速解决。

遗传算法 (Genetic Algorithms, GA) 是一种借鉴生物界的自然选择和进化机制发展起来的高度并行、随机、自适应搜索算法。概括地讲,该算法使用了群体搜索技术,从随机选定的初始种群开始搜索,初始种群中的个体是问题的可行解,个体的适应性由适应度函数度量,在进化过程中,根据适者生存的原则,从中选择出适应度高的个体进行配对,然后通过交叉、变异等一系列遗传操作,产生新一代的种群,逐步使种群进化到包含近似最优解的状态,从而求得最优解。遗传算法寻找最佳原子的流程如图1。

利用遗传算法寻找最佳原子,极大地减少了计算量,是对公式(3)所表示的最优化问题的一个较令人满意的解决方案。我们从若干标准测试序列中提取若干宏块 (MB) 的亮度和色度分量分别进行了试验,以原始的MP算法速度为标准,结果如表1:

(四)基于排序差分和MP的视频压缩编码方法

现有的基于MP的视频编码方法对分解的数据直接进行量化编码,因而没有消除分解结果数据之间的冗余,压缩率不够理想。排序差分的方法对MP分解的数据进行差分预处理,大幅度减小了投影分量的分布范围,提高了编码效率。

有关文献指出了图像MP分解结果数据的分布规律:投影分量 (k=0, 1, 2, …n-1) 的取值变化范围很大,随着分解的进行呈波动递减。如果直接对其进行量化和编码,则会产生大量的编码冗余。MP算法对图像进行稀疏分解,投影参数并没有严格按递减规律分布,而是略有波动。若直接对其进行差分处理,差分结果值的动态范围较大,会产生新的编码冗余。为解决这个问题,先将结果数据按投影分量的值由大到小进行排序,使投影分量呈递减排列。这样排序后,其它分量的顺序也相应的发生改变,由于原子的正的缩放因子s为均匀分布,重新排序对其分布并无影响,而原子的频率和相位与投影分量分布类似,又由于其取值范围较投影分量取值范围小得多,打乱其分布规律对整体编码效率并无太大影响。

根据视频稀疏分解结果的分布规律,我们设计了对分解结果的量化编码方案:

(五)实验结果分析

本文编解码方案在H.264/JVC JM-92标准测试模型下仿真实现。基本参数设置:ProfileIDC=66, LevelIDC=30, CABAC熵编码模型,10frame/s,用IPPP帧结构,每次编码100帧,1个I帧和99个P帧。测试序列为Stefen、Hall和Bridge-far等,CIF格式 (352×288) 。

从图2、图3可知本文算法在中低码率下,尤其在甚低码率下,PSNR优于H.264标准,与文献[3]几乎相近;表3给出了本文算法与文献5速度上的比较,本文算法要快出很多,编码效率也略有提高。

参考文献

[1]Mallat S, Zhang Z.Matching pursuit with time-frequency dictionaries[J].IEEE Transactions On Signal Processing, 1993, 41 (12) :3397-3415.

[2]Ralph Neff and Avideh Zakhor.Very Low Bit-Rate Video Coding Based on Matching Pursuits[J].IEEE Trans.On Circuits And Systems For Video Technology.Feb1997.Vol.7.NO.1.

[3]Haoxiang Zhang, Xiaopeng Wang, Wei Huo, and D.M.Monro.A Hybrid Video Coder Based On H.264With Matching Pursuits[C].IEEE International Conference on Acoustics, Speech, and Signal Processing–Proceedings, 2006, pII889-II892.

[4]Hsi-Tzeng Chan.Chih-Ming Fu.and Chung-Lin Huang.A New Error Resilient Video Coding Using Matching and Multiple Description Coding[J].IEEE Trans On Circuits And Systems For Video Technology.Aug.2005.Vol.15.NO.8.

视频匹配 篇5

关键词:人脸识别,几何匹配,分合算法

人体生物特征识别是通过计算机、各种传感器和生物统计学原理等高科技手段密切结合,利用人体固有的生物特征来进行个人身份识别。与虹膜识别、指纹识别、掌纹识别、签名识别、声音识别等人体生物特征识别技术相比,人脸识别具有方便友好、易于接受、不易伪造等优点,目前可用于身份认证、视频监测及视频资料检索分析等方面,是当前计算机视觉、模式识别和人工智能领域的一个研究热点。

1 分合算法

人脸识别就是对输入的图像或者视频,首先判断其中是否存在人脸,如果存在人脸,则进一步给出每个人脸的位置、大小和各个主要面部器官的位置信息,并依据这些信息,提取出每个人脸中所蕴含的身份特征,并将其与已知人脸数据库中的人脸进行比对,从而识别每个人脸的身份[1]。

图像分割的目的是把人脸的器官与脸的其他部分分离开来,并保存每个器官的完整性。在照片中,人脸比较明显而易辨别的特征主要是面部器官:眼睛、嘴巴、鼻子和眉毛。

分合算法的目的是把图像分割为许多这样的区域:具有某种共同特征并且相互连通的像素分在同一个区域,而特征不同或者不相互连通的像素分在不同的区域[2]。

二值化后的原始图像直接用黑和白的像素表示。在用分合算法分割之后,每一个连通的黑色特征块就由一组数据块编码来表示,编码所代表的数据块在一起组成了该特征块。分合完成,物体属性都计算完毕之后,就可以标出所有的特征块。

2 几何匹配

图像分割完成后,结果保存在“物体”数组中,每一个“物体”就是一个连通的黑色区域。

几何匹配算法所做的就是在“物体”中寻找可能是人脸器官的组合,所利用的判断依据则是人脸器官之间所固有的几何关系[3]。使用这些判断依据按照一定的权重组合,可以对每一组可能被当作面部特征组合的“物体”计算一个评价函数。如果这个函数值超过了一定的阈值,就认为它是一张人脸。

几何关系的模型参考的是SHI-HONG JENG、HONG YUAN MARK LIAO等人的工作[4](见附图),但是在评价函数的构造上有一些改动。

具体的算法是这样的:

(1)首先任意挑选一对“物体”(设为eye1和eye2),计算它们作为一对眼睛的评价函数:

其中l1和l2分别是eye1和eye2的归一化长度(长度除以eye1和eye2的中心距离D),O1是eye1的主轴倾角,O2是eye2的主轴倾角,O是eye1和eye2连线的倾角。

(2)在其余的“物体”中任取一个,计算它作为嘴巴的评价函数:

其中dm是“物体”中心到两眼中心连线的垂直距离,O是两眼中心连线的倾角(在1中算出),m O是“物体”的倾角,xm是“物体”相对于两眼中心连线中点的横向坐标(计算方法:先把坐标系原点移动到两眼中心连线中点,然后旋转坐标系使得两眼中心连线与x轴重合,此时“物体”的重心的x坐标就是xm),ml是“物体”的长度,el是两眼长度的平均值。

(3)计算综合的评价函数,表达式为:

3 系统检测结果

本系统通过大量样本实验,达到了预期的设计目标,本系统能多姿态、多角度、快速地检测出有效人脸,并对光线能进行一定的补偿。通过对600个样本测试,正确检测率为88%,误检率为2%。

4 在公安视频监控中的应用

人脸识别技术研究方法的不断创新和完善,使其在实际工作中的应用前景越来越广阔。随着公安情报资料搜集工作的逐步完善、公安基层管理信息化、自动化水平的提高以及现有情报信息资料和技术设备的不断整合,人脸识别技术在公安工作中的应用领域将更广[5]。

(1)运用人脸识别技术加强追逃工作:预先把在逃人员的照片等信息输入到人脸识别系统的数据库中,在飞机场、火车站、汽车客运站、旅店、大型商场、银行等场所安装人脸识别系统的前端,通过当前人和后台数据库中人脸信息进行比对,以查找在逃人员。

(2)无名尸、匿名者等身份的确认:可以通过对人口信息等系统的图像数据库进行无名尸、匿名者的人脸识别。特别是当一个案犯被抓获而拒不承认自己真实身份的时候,可以用人脸识别技术自动识别出他的身份。

(3)边境检查:对外开放的不断深人,国际交往的不断增加,使出入境人员数量不断猛增。在边检通道设置人脸识别系统,当国际恐怖分子等重大嫌疑人入境、重大案件犯罪嫌疑人外逃时可以及时识别并报警。

(4)司法人像鉴定:在刑事司法鉴定中,可以使用在犯罪现场监控录相获得的视频图像与嫌疑对象进行人像同一鉴定在民事诉讼中,可以对检材中的人像与样本照片或某人进行同一鉴定;从而判断检材中的人像与样本照片是否同一或检材中的人像是否就是某人[6]。

(5)重点场所的门禁:一些重点场所对出入人员有严格的资格限制,对出入人员身份进行准确识别是确保重点场所安全的关键。比如在银行金库、博物馆、机要室、武器库、重要会议等重点场所设置人脸识别系统,可以对出入人员进行身份识别,保障重点场所的安全。

参考文献

[1]TOSHIAKI K,HONG Y.Automatic human face detection and recognition under non-uniform illumination[J].Pattern Recogni-tion.1999(32):1707-1718.

[2]HOROWITZ SL,PAVLIDIS T.Picture segmentation by a direct-ed split-and-merge procedure[J].Proc.2nd IJCPR,1974(2):424-433.

[3]KENNETH RC.Digital Image Processing[M].Prentice Hall,1996.

[4]SHI-HONG JENG,HONG YUAN MARK LIAO,CHIN CHUAN HAN,et al.Facial feature detection using geometrical face mod-el:an efficient approach[J].Pattern Recognition,1998(3):273-282.

[5]ROBERT MH,LINDA GS.Computer and Robot Vision[M].Ad-dison-Wesley,1992.

上一篇:农业产业集群风险下一篇:即时性教学课件