运动小目标检测

2025-01-13

运动小目标检测（精选8篇）

运动小目标检测篇1

随着信息技术的快速发展以及计算机、手持移动设备的不断普及,催生了更多形式丰富的数字多媒体信息,而互联网络技术( 特别是移动互联网) 的广泛应用更是为数字多媒体信息的传播和使用提供了便利条件。数字视频产品是多媒体信息形式里最重要的产品之一,种类繁多,丰富了互联网媒体内容。然而由于网络的开放性和共享性特点,使得数字视频产品传播和使用过程中缺少合理监管,数字视频产品很容易遭到非法拷贝、传播和篡改等侵权行为。因此,对数字视频产品采取相应的版权保护措施变得极其重要。而数字视频水印技术作为数字产品版权保护和内容认证十分有效的手段,则逐渐成为信息安全领域的研究热点之一[1,2]。

数字视频水印技术作为信息隐藏技术中的一个重要分支,是将特定的标记信息嵌入到数字视频产品中。嵌入的标记信息不会对数字产品的使用价值产生影响且水印信息不易被感知和攻击篡改,以此达到对数字视频产品版权保护的目的,同时也可根据视频水印的正确性和完整性识别视频产品的真伪。运动特性作为视频区别图像的重要特点之一,针对视频的一般攻击无法对其进行破坏,因此关于视频运动特性的研究得到诸多学者的关注。目前视频水印嵌入算法主要分为3类: 1) 水印嵌入到压缩比特流。2) 水印嵌入到视频量化系数。3) 编码水印嵌入到原始视频序列。第1类算法水印嵌入到压缩比特流,不需要对视频进行解码和编码,也不会影响视频质量,但该算法不容易设计,水印容量也很有限; 第2类算法水印嵌入在视频编码量化系数中,如DCT( Discrete Cosine Transform) 系数和运动矢量,但此类算法会使视频质量会受到影响; 本文采用第3类算法,这类算法主要是结合人类的视觉特性,水印嵌入后不易被感知且对常见的视频攻击具有较强的稳健性。

Jordan和Kutter等人[3]第一次选择在修改后的运动向量中嵌入水印信息,并为基于运动特性的视频水印算法研究开拓了一种新的视角。楼斌等人[4]提出了一种自嵌入式的水印算法,将提取出的运动目标作为水印,该算法针对MPEG压缩具有一定的稳健性,但遭受加噪攻击时表现相对脆弱,稳健性能较差。陈希等人[5]通过检测和标记运动目标,进行奇异值分解并自适应嵌入水印,但受限于水印的嵌入位置,因此嵌入效果并不好。郭燕等人[6]提出基于运动目标检测和纹理复杂度的视频水印算法,但水印嵌入算法实时性较差,且不能进行水印盲提取。Cheng等人[7]提出了一种基于离散小波变换( Discrete Wavelet Transform,DWT) 跟踪识别多个对象的方法,在离散小波域采用帧间差分法对运动对象进行分割,但基于离散小波变换的方法对运动对象移位不敏感,不能准确分割运动对象。

针对上述问题,本文在相关研究的基础上,提出了一种基于小波变换域的运动目标检测并结合人类视觉系统( Human Visual System,HVS) 特性的视频水印算法。进行Daubechies复杂小波变换后采用近似中值滤波检测帧间差,从中获得视频图像中已改变的像素值,标记运动区域,并结合HVS特性从静止区域中划分出高纹理复杂区域,水印自适应选择嵌入在运动区域及高纹理复杂区域; 原始水印图像采用混沌加密和Arnold置乱进行预处理,置乱水印图像的相关性,确保了水印信息的安全性,并在小波域进行水印嵌入,较好地兼顾了水印的不可感知性和稳健性。

1基于小波域的运动目标检测

运动目标检测旨在从视频中实时检测并提取运动目标, 是视频序列运动分析与理解的关键技术。运动目标检测会受到诸多因素的影响,比如光照强度突变、背景转换、物体的移动、阴影、噪声等。目前,运动目标检测方法主要有3种: 光流法、帧间差分法、背景减法。帧间差分法因其复杂度低、对环境变化较不敏感、自适应能力好而成为研究热点。本文在进行Daubechies复杂小波变换后,采用帧间差分法并结合近似中值滤波算法检测帧间差,从而获取运动目标。

首先,在Daubechies复杂小波域内分解2个连续帧In和In - 1,然后再用近似中值滤波来检测帧间差[8]。用式( 1) 计算每一个像素点( i,j) 的帧间差

式中: FDn( i,j) 是帧间差; WIn( i,j) 和WIn - 1( i,j) 是对应帧In和In - 1的小波系数。式( 1) 获得的帧间差FDn( i,j) 可能会有一些噪声,在小波域可以应用软门限来消除噪声[9]

式中: FD'n( i,j) 是消除噪声后的帧间差; λ 是相应噪声。去除噪声后,采用Sobel边缘检测算子检测FD'n( i,j) 中像素差很明显的边缘,如式( 3) 所示

在小波域,得到运动分割对象DEn( i,j) ,并标记在原图像中。为了适应背景和光照变化,背景模型的实时更新如式( 4) 所示

式中: In( i,j) 是第n帧的( i,j) 像素点的值; In - 1( i,j) 是第n -1帧的( i,j) 像素点的值。

2基于DWT域的分块视频水印算法

2.1水印图像预处理

在嵌入水印前先进行预处理,来提高水印的安全性。本文采用基于Logistic混沌映射的混沌加密技术并结合Arnold变换的置乱技术对水印信息进行预处理工作。Logistic混沌映射定义如式( 5) 所示

式中: 0 < μ≤4,称为分支参数。当3. 569 945 6 < μ≤4时, Logistic映射处于混沌状态[10]。

本文选取二值图像作为水印图像,先利用密钥K1( 混沌映射初始值) 进行混沌加密,接着利用密钥K2( Arnold迭代次数) 对加密后的水印图像进行Arnold置乱,使嵌入的水印对JPEG压缩和噪声干扰等常见操作有较强的稳健性,同时嵌入水印具有很好的不可感知性。

2.2水印嵌入过程

具体的视频水印嵌入示意图如图1所示。

水印嵌入的具体过程如下:

1) 8M × 8M原始图像分为8 × 8子块,分别对子图像块进行Daubechies复杂小波分解。

2) 采用基于近似中值滤波的帧间差分法进行运动目标检测,并将标记位插入运动区域D1的每个像素中。

3) 将视频当前帧的图像分割为运动区域D1和静止区域D2。若静止区域D2的高频系数绝对值大于门限T,则标记该像素位置为高纹理复杂区域D2. 1。T为预先设定的阈值,在此取T为最大系数绝对值的一半。

4) 为了优化水印的不可感知性和强稳健性,水印选择自适应嵌入算法。运动区域D1和高纹理复杂区域D2. 1选为嵌入水印区域。预处理后水印如式( 6) 所示

式中: w( x,y) 为预处理后的水印。采用式( 7) 进行水印嵌入

式中: X( x,y) 为嵌入区域小波系数; X'( x,y) 为嵌入水印后小波系数; Q为水印嵌入强度; T1和T2为阈值,实验中取T1= 0. 25Q,T2= 0. 75Q,mod( ·) 为求余数运算。

5) 在原视频序列中嵌入水印信息后进行小波逆变换,即可获得已嵌入水印的视频图像。

2.3水印提取算法

提取算法具体过程如下:

1) 利用水印嵌入后视频序列运动区域中的标记像素位, 将视频当前帧图像分割为静止区域和运动区域。

2) 当前帧图像的静止区域分为8 × 8子图像块,比较小波变换中的高频系数,若该位置的高频系数的绝对值大于门限T,则标记该像素位置为高纹理复杂区域。

3) 运动区域和高纹理复杂区域选为提取水印区域,采用式( 8) 提取水印

式中: w'( x,y) 是提取出的水印; X'( x,y) 为嵌入水印后的小波系数; Q为水印嵌入强度; T1和T2为阈值,实验中取T1= 0. 25Q,T2= 0. 75Q。

4) 对提取的水印序列进行重构,先用密钥K2逆Arnold置乱,然后利用密钥K1混沌解密,得到正确解密后的水印图像。

3实验结果

3.1仿真实验

本文实验是在Intel Core、CPU T6500,2. 1 GHz的主频、 2 Gbyte的内存,Windows7的操作系统环境下,采用MATLAB R2012b平台仿真。

本文算法选取Foreman视频第11帧图像作为待嵌入的视频图像。进行Daubechies复杂小波变换后,利用近似中值滤波算法检测帧间差,然后对运动目标进行定位并准确标记运动区域中每个像素。运动目标检测过程如图2所示,其中图2a表示原始图像,图2b表示帧间差分法运动目标检测,图2c表示标记运动区域。

3.2不可感知性和安全性测试

为了确保水印嵌入的安全性,在水印嵌入原始视频之前, 先后对要嵌入的水印进行混沌加密和Arnold置乱,因此嵌入水印的帧图像对JPEG压缩和噪声干扰等常见操作有较强的稳健性,同时嵌入水印具有很好的不可感知性。图3a是原始水印,图3b是置乱加密后水印,图3c是Foreman视频序列中提取的水印图像,图3d为在密钥K1和K2都正确且未遭受攻击的解密恢复水印,图3e为密钥K1,K2其中有一个不正确时的错误解密水印。由图3可以看出,当两个密钥全部正确且视频未遭受攻击,可正确提取出水印图像; 然而当两个密钥中有一个错误,则嵌入的水印不能完整提取,故该算法的安全性较高。图4给出了Foreman11帧图像及嵌入水印后的图像, 该算法没有降低视频帧图像的观感质量,较好地满足了不可感知性要求。

3. 3稳健性测试

稳健性能是指视频水印应该能够抵抗各种有意或无意的攻击包括常见的信号处理攻击、几何攻击和针对视频的帧操作攻击,确保能从受到攻击的视频中获取较好的水印信息。为了测试算法的稳健性能,将归一化互相关系数NC( Normalized Correlation) 作为判断稳健性能的尺度,NC定义如式( 9 ) 所示

式中: W,Y是水印的行列大小; w( x,y) 为初始水印; w*( x,y) 为提取出的水印。在NC值大于0. 7时就认为提取出有效水印,NC值与水印的鲁棒性呈正相关性。

从视觉看图4a、图4b中嵌入水印前后图像对比,没有明显的差别,采用峰值信噪比PSNR来进一步验证水印的不可感知性,PSNR定义如式( 10) 所示

式中: D,H是视频图像的行列大小; max( I( i,j) )2表示视频图像像素能取到的最大值; 原视频帧图像为I( i,j) ; 嵌入水印后的视频帧图像为Iw( i,j) 。PSNR越大,水印的不可感知性越好。

因此,对已嵌入水印的视频帧图像分别进行多种针对视频的攻击处理,所提取出水印的实验结果如图5和表1所示。图5a和图5b分别为视频遭受方差为0. 001的高斯噪声和椒盐噪声攻击后提取出的水印图像; 图5c是对嵌入水印后的视频用均值为0,方差为10的加性噪声攻击后提取的水印; 图5d和图5e是对嵌入水印后的视频分别用3 × 3的维纳滤波和中值滤波攻击后提取的水印; 图5f和图5g分别为视频遭受MPEG压缩和JPEG压缩攻击后提取出的水印图像; 图5h ~ 图5j分别为视频遭受帧平均攻击( 从视频序列中的每5帧图像中随机抽1帧,再用此帧相邻的2帧的平均替代被抽出帧) 、帧删除攻击( 从视频序列中随机删除2帧,再随机插入2帧) 以及帧置换攻击( 从视频序列中每10帧中随机置换2帧) 后提取的水印图像。

表1和图5中的实验结果表明,本文算法满足不可感知性要求,且从图5看出,视频在经过常见针对视频的攻击后, 所提取出的水印都容易被人眼识别,足以表明本文算法对常见视频攻击具有较强的稳健性。

3.4与现有算法的性能比较

为了验证算法及进一步讨论算法的性能,在MATLAB R2012b平台上进行实验仿真后,将本文算法和文献[13]中的算法( 算法1) 、文献[14]中的算法( 算法2) 及采用LSB ( Least Significant Bit) 嵌入策略的算法( 算法3) 进行性能比较。算法1通过对亮度分量进行1级整数小波变换,水印嵌入在小波变换低频子带的最大奇异值上。算法2算法先对视频进行2级DWT变换,再对HL2子带进行SVD分解,根据LSB调制SHL2奇异值实现水印嵌入。算法3是先对视频每帧进行2级的整数小波变换,其次对低频子带LL2进行分块, 并对每一分块进行SVD分解。针对稳健性能的测试,以Foreman视频序列为例,考察了几种常见噪声和滤波的攻击, 对应的实验结果如图6a ~ 图6d。在图6a高斯噪声攻击实验中随着高斯噪声的增大,NC系数均受到影响,而本文算法中的NC值受到影响最小; 在图6b的加性噪声攻击对比实验中,随着加性噪声强度增加,本文算法和算法1的NC系数均减小,而本文算法中NC系数减小力度更小,算法2和算法3的NC系数则是上下波动较大不稳定; 图6c、图6d是中值滤波和维纳滤波攻击对比实验,两个实验结果均显示本文算法的NC系数减小幅度最小且保持在较高水平。通过以上实验结果可以总结出,本文算法的稳健性能明显优于算法1、算法2及算法3,因此本文算法具有较强的稳健性能。

4结束语

本文在保证视频水印算法稳健性前提下,结合视频运动特性,提出一种基于Daubechies复杂小波变换的运动目标检测视频水印算法。Daubechies复杂小波变换具有平移不变性和良好的方向选择性,解决了阴影、重影、噪声等问题。该算法在Daubechies复杂小波域采用近似中值滤波算法来检测帧间差,更加准确地检测运动目标,并采用背景更新法,以防止背景模型的退化。对嵌入的视频水印信息进行Arnold置乱和混沌加密处理,并结合HVS特性,将运动区域和高纹理复杂区域作为嵌入水印区域,以达到水印信息具有不可感知性和稳健性的目的。实验结果验证了本文算法对噪声、滤波器、压缩、帧平均等攻击有很好的稳健性和抗攻击性,并能实现水印盲提取,能够有效保护视频版权。

运动小目标检测篇2

机载雷达从地杂波中检测运动目标

提出了将变抽样率处理技术应用于机载雷达下视探测,以从地杂波中检测运动目标的方法.首先分析了信号模型,针对这一模型,讨论了变抽样率处理技术应用问题,最后进行了仿真,仿真结果,表明该方法可行.

作者：王盛利朱力 WANG Sheng-li ZHU Li 作者单位：南京电子技术研究所,江苏,南京,210013刊名：航空学报 ISTIC EI PKU英文刊名：ACTA AERONAUTICA ET ASTRONAUTICA SINICA年，卷(期)：21(5)分类号：V243.2 TN957.51关键词：地杂波变抽样率机载雷达下视运动目标

运动小目标检测篇3

红外运动小目标，由于要求的检出率较高而虚警率必须很低，同时目标本身的对比度和信噪比又较低，所以在单帧检测的情况下很难满足检测要求，必须结合多帧处理进行检测。为了克服单帧图像检测的缺点，研究人员提出了基于序列图像的检测方法，即时空结合的处理方法。先在空域上对图像进行处理，再在时域上进行多帧累积来进一步增强目标。空域上处理图像的方法，目前常采用小波变换的方法，而小波变换只对低频分量分解，高频段的分辨率相对很低，所以实际处理效果不是很理想。管道滤波方法只是考虑到目标的连续性和轨迹的一致性，但并没有充分利用小目标在时域上的运动特性。这些方法都会受到背景复杂程度的影响，而且在目标速度很快的情况下，管道滤波的方法将会失效。

为了克服以上缺点，创新性的将时频域分析、小波包变换和管道滤波相结合，克服了背景复杂程度和目标运动速度带来的问题，同时也降低了空间和时间的复杂度，便于应用到实时系统。

1 红外图像的场景建模

由于红外小目标缺乏有效的形状和纹理特征，所以通常能用的只是它的灰度信息。这里将红外图像描述为：

式中T(x,y,k)为红外小目标灰度图像，B(x,y,k)为背景灰度图像，N(x,y,k)为噪声图像，x,y为图像横纵坐标，k为序列帧数。一般来说红外小目标在多帧图像中具有一定的连续性和相关性，小目标图像的亮度和尺寸在帧间只有较小的变化;背景B(x,y,k)通常处于红外图像的低频部分，并具有较长的相关长度，由于场景和传感器内部热分布的不均匀性，背景图像是一个缓慢变化且非平稳的二维随机过程，对于大部分探测系统来说是比较固定的场景，其相邻两帧之间背景变化不大;噪声N(x,y,k)属于图像的高频部分，它与背景像素不相关，在空间上是随机的，帧间的空间分布不相关。

从上述分析可知，对于图像平面中的某个固定位置(i,j)，f(i,j,k)是帧数k的函数。显然，有无目标通过位置(i,j)，f(i,j,k)的函数曲线的形状完全不同。

2 图像的时频域分析

在图像平面中的位置(i,j)处，若无目标通过，则f(i,j,k)由背景和噪声组成，在一个比较短的时间内，背景是一个不随时间改变的常量，噪声随k随机变化。当有目标通过时，假设目标在图像第k1帧到达位置(i,j)，在k2帧离开，则在k1与k2帧之间图像序列平面中f(i,j,k)的函数曲线将出现跃变，所以可以通过函数的曲线形状来判定出现目标的图像序列。

3 二维离散小波包分析

小波包理论是小波变换理论的重要内容，是小波变换的延伸，是多分辨率分析思想的发挥，它直接来源于多分辨分析和正交小波构造，它成功地解决了小波变换所固有的高频低分辨这一时-频分析上的缺陷。

小波包的定义式表示为：

其中h(k)和g(k)分别是滤波器组中的低通滤波器系数和高通滤波器系数，并且满足g(k)=(-1)kh(1-k)，即两个系数具有正交关系。当n=0时w0(t)=φ(t)，w1(t)=ψ(t)，φ(t)和ψ(t)分别是小波变换中的尺度函数和小波母函数。以上定义的函数集合{wn(t)}k∈Z为w0(t)=φ(t)所确定的小波包。由此，小波包{wn(t)}k∈Z是包括尺度函数w0(t)和小波母函数w1(t)在内的一个具有一定联系的函数的集合，具有尺度函数和小波母函数的两种正交性。

和小波变换一样，一维小波包变换具有快速分解公式：

相应的重构公式为：

因为处理的图像为二维信号，对应的二维滤波器可以通过低通滤波器h(k)和高通滤波器g(k)的张量积来构造：

图像经过这4个不同的滤波器后分解为低频信号和水平、垂直及对角线方向的高频信号这4个分量，其中每个分量都将继续分解，每次分解将子图一分为四，这就形成了二维小波包多尺度分析的概念。图1为原始图像f(x,y)进行2层小波包分解示意图：

假设小波包分解到L层,则第L层所有小波包系数构成了原图像的一个完备集,该完备集可以完全重构原图像。此时将处于低频分量的小波包系数置零即可将红外小目标和噪声从原图像中分离出来。

4 基于时域特性和小波包的管道滤波方法

根据图像的时域特性分析可以确定出现目标的帧序列，对含有小目标的帧序列进行小波包分解，设分解层数为L，则L层所有小波包系数构成原始图像的一个完备集，该完备集可以完全重构原图像。接着将处于低频分量小波包系数置零，最后利用新的小波包系数重构图像，即可得到只含小目标和噪声在内的图像，将小目标和噪声点作为候选点进行管道滤波。

管道滤波是在帧序列图像的空间位置上以目标为中心建立的一个空间管道，管道的直径代表空间的作用尺寸，管道的长度代表检测时间的长度。具体步骤如下：

(1)对经过变换后的图像序列进行扫描，若一个候选点不属于现有的任何一个管道，则开辟一个新的管道;

(2)在每一帧图像中判断每一个管道在管径规定的范围内是否存在目标;

(3)在规定的检测帧数中计算每个管道目标出现的帧数，根据制定的准则判断真实的目标并确定其位置。

整个算法流程如图2所示：

5 仿真结果及分析

为了验证本算法的有效性，同时因为拍摄条件的限制，采取坦克上装光源的形式模拟远距离小目标，用对点光源的识别来验证本算法的有效性。以下论述均以点光源作为小目标进行论述。

仿真实验中，对快速运动的小目标连续采集200帧图像，并对其进行时域特性分析，从中选取五幅含有小目标的图像，如图3为含有小目标的41帧至45帧的原始图像。原始图像中，天空和地面中含有大量的杂波和亮点噪声，图像质量很差，信噪比比较低，在这种情况下，采用小波包变换的方法比采用小波变换的方法优越得多。图4为对五幅图像进行二维小波包变换处理后的图像(小波包分解层数为4)，从图像中可以看到，大量的噪声和杂波作为背景被抑制，只留少量的噪声点和小目标，图像质量得到了很大的提高，为后续工作奠定了基础。

对经小波包变换后的图像，采用管道滤波的方法进一步检测小目标，检测中定义管径为10像素，检测帧数为5f，当在同一管径内的图像序列中有3f检测到目标时认为所检测到的目标为真实目标，否则为虚假目标。图5是经管道滤波检测后的小目标检测结果。

6 小结

图像进行时域特性分析后，选取含有小目标的图像进行小波包变换，最后采用管道滤波进一步确定小目标。该方法不仅降低了虚警率，提高了检测率，同时也大大降低了算法的空间和时间复杂度，对于快速运动的小目标的检测，该算法具有更高的检测率和实用性。

摘要：针对复杂背景下红外快速运动小目标检测问题,提出一种将时域特性分析、小波包变换和管道滤波多帧检测相结合的方法。该方法首先对图像进行时域特性分析确定目标所在帧图像序列,再利用小波包变换对目标所在帧图像进行多尺度分解,提取候选目标,然后通过管道滤波从候选目标中确定小目标的位置,完成对小目标的检测。对实测数据进行仿真实验,结果表明该方法能有效检测红外快速运动小目标。

关键词：红外快速运动小目标,时域分析,小波包变换,噪声,管道滤波

参考文献

[1]王鑫,唐振民.一种新的复杂背景下红外弱小目标检测方法[J].系统仿真学报,2009,21(20):125-128.

[2]李俊山杨威张雄美,红外图像处理、分析与融合[M].科学出版社,2009.

[3]葛哲学.小波分析理论与MATLAB R2007实现[M].电子工业出版社,2007.

[4]孙即祥.图像分析[M].科学出版社,2007.

[5]谢凤英.Visual C++数字图像处理[M].电子工业出版社,2008.

[6]邸继征.小波分析理论[M].科学出版社,2010.

运动目标检测与跟踪算法研究篇4

1. 1目标检测方法

目标检测是目标识别的基础, 将视频目标从图像序列当中进行准确提取是检测的关键步骤。运动目标在静态背景中的检测和提取可使用图像分割或者目标模板等方法, 而动态背景下则可使用神经网络、帧间差分、背景估计、光流场等方法。

1) 基于帧间差分法: 该方法是用视频序列中相连续的图像帧做减法, 获得差分图像。在差分图像中, 像素的值较小时, 认定为没变化的背景点, 而像素值较大的点则作为运动目标点。该方法实现简单, 存在的缺点是易受光照影响。

2) 基于背景估计方法: 该方法则是为了解决图像差分法无法完整获取目标的缺点。背景估计法将视频序列中的一个图像帧作背景, 然后把后续帧的像素值和背景模板的像素值做相减, 得到差分图像, 并对差分图像做二值化和数学形态法处理。

1. 2目标跟踪方法

视频目标跟踪是监控领域的热点问题, 其目的则是为了得到目标图像帧和帧之间的联系和变化。它常采用的方法主要有以下三种算法: 滤波、浓缩以及动态贝叶斯网络算法等。现有的这些方法可根据具体的方法和视觉信息的层次进行分类, 分为基于底层视觉信息和基于高层理解信息这两种跟踪方法。底层视觉信息的跟踪是指利用一些易获取的直接信息, 例如轮廓信息、区域信息等特征。高层理解信息则是通过采集大量样本做训练学习, 生成可分析的结果。因为目标跟踪本身是随着目标的运动动态变化的, 所以其本身存在非常大的挑战性。根据其具体方法可以分为四种: 点跟踪、核跟踪、轮廓跟踪以及基于检测的跟踪。目标识别方法主要有Generative Model和Discriminative Model两种方法。其中Generative Model主要通过使用大量数据训练, 从而获得目标类别的概率分布。而Discriminative Model则在现有模型中找到划分类别的函数。最常用的Generative Model是高斯混合模型GMM。该模型能够对同一类图像进行不同形式的表现。而另一种则是概率隐含语义分析模型 ( Probabilistic Latent Semantic Analysis, PLSA) , Quelhas、Sivic等人使用特征计算来隐含进行分类, 然后通过贝叶斯概率计算获得目标类别概率。常用的Discriminative Model则有K近邻分类方法、支持向量机方法、PMK ( Pyramid Match Kernel, 金字塔匹配) 以及Boosting分类方法。K近邻分类方法的缺点在于其计算复杂度大, 不适合大图像数据。

1. 3运动目标检测与跟踪的难点

运动目标检测与跟踪需要有效、可靠以及智能的检测和识别技术。但由于以下具体问题, 运动目标检测与跟踪仍然是开放性问题。

1. 3. 1目标检测和分割的准确性

运动目标的检测过程中, 会受到场景当中的各种干扰, 例如: 场景光照变化, 场景的背景抖动和干扰, 目标运动速度过快或者视频摄影人的操作瑕疵等。当光源发生变化, 目标物体的颜色会呈现出特征的变化; 摄影人的操作瑕疵例如抖动可能会导致摄影的目标和背景区域的变化; 目标运动速度过快可能会导致目标跟踪的丢失等等。

1. 3. 2目标形态变化

在视频采集的过程当中, 摄像机和运动以及目标物体的运动都会使得目标的尺度发生改变, 目标发生的旋转和平移改变都会使得目标图像带来变化, 给图像的检测和识别带来困难。

1. 3. 3 算法的复杂度和准确性

运动目标的检测和跟踪需要对视频图像的像素值进行处理, 像素值需要大量的运算量, 若算法选择不合适, 会导致系统无法满足实时性的需求。另外, 系统需要保证识别的准确性, 多个特征进行联合匹配会让计算复杂度提高, 这样就造成了矛盾, 所以要平衡识别复杂度和准确性之间的矛盾。

2 结语

首先, 波门跟踪算法通过减小跟踪图像处理区域带来系统运算量的降低, 并且可以同时获得目标跟踪算法的抗干扰性能的提升。其次, 介绍了常用的多分辨率处理方法, 在此基础上提出了基于Ada Boost算法的多尺度图像检测方法, 极大地提高了图像跟踪中目标检测的精度。最后, 在结合Ada Boost检测算法、多尺度检测算法、波门跟踪法各自特点的基础上, 提出了一种具备全自动和实时性特点的目标跟踪方法。该方法充分利用Ada Boost检测算法, 多尺度检测算法的特点实现了在波门跟踪算法中自动选择波门, 并同时具备波门跟踪算法运算效率高的优势。

摘要：视频目标的检测和识别是计算机视觉领域研究的一个核心问题, 它的主要任务是对视频图像中的目标进行定位、检测、识别和分析判断。视频目标跟踪的研究目的是让机器获得人类视觉运动感知的能力, 能够辨识序列图像中的运动目标, 从而可以提供重要的数据依据对目标进行理解和分析。

关键词：图像序列,AdaBoost识别算法,波门跟踪,多尺度检测

参考文献

[1]梁鹏.基于内容的目标分类识别关键技术研究[D].广州:华南理工大学, 2011.

基于背景建模的运动目标检测篇5

背景减法实现最简单,并且能够完整地分割出运动对象,对背景已知的应用情况,背景减法是一种有效的运动对象检测算法。

一个有效的动态目标检测算法应能克服以下几种在实际应用中常常存在的问题:

1)背景的扰动:背景中可以含有轻微扰动的对象,如树枝、树叶的摇动,扰动部分不应该被看作是前景运动目标;

2)背景的更新:由于光照或其它条件的变化会使背景图像发生变化,需要及时对背景模型进行更新,以适应这种变化;

3)外界光线的变化:一天中不同时间段光线、天气等的变化以及室内开灯、关灯等都会对检测结果产生影响;

4)阴影的影响:通常前景目标的阴影也被检测为运动目标的一部分,这样将影响对运动目标的进一步处理和分析。

1 非参数模型

非参数[1]是Ahmed Elgammal等人提出来的,该背景模型把图像序列的对应像素点看成是一个统计过程,且他的灰度值的分布可能是变化的,分布函数的概率密度可用非参数的方法估计出来,然后再和阈值比较,以此确定是否运动点。假如对图像序列中某对应的像素点连续采样N次,其灰度依次为x1,x2,…xn,则基本的数学模型如下:

其中,N为采样次数,xi为采样灰度值,xj为当前帧对应的灰度值,K为核函数,可认为其符合正态分布N(0,∑),假设不同的颜色分量之间是独立的,则∑可简化为:

其中σi2(i=1,2,3)为每个颜色分量对应的核带宽,最后概率密度函数可近似为:

其中d为颜色分量的个数。

由于外部环境的变化,已建立好的背景模型需要适时地更新。非参数模型采用2种更新模式:

1)选择性更新,即只把属于背景点的像素点更新到背景模型。

2)非选择性更新,即不经过判断直接将当前的像素点更新到背景模型当中。

两种更新模式更新时,均采用先进先出的策略,即将最先存入缓存的采样帧去除,而将最新的采样帧更新到模型之中。如果采用选择性更新模式,则判断出当前帧的对应像素的概率值大于阈值T,则该像素点认为是背景点;相反,若概率值小于阈值T,则被认为是运动点。

经大量实验发现,非参数模型能够较敏感地检测出运动物体,亦能较完整地分割出运动对象,但其需事先存入N帧图像用来判决像素点和进行背景更新,严重制约了检测速度,一般很难达到实时性要求。

2 单高斯背景模型建立与更新

单高斯模型最初由Wren等人在文献[2]中提出。在该模型中,把背景模型中的每一个像素点都看成是一个高斯分布,由参数u(期望)和σ2(方差)来确定。随着环境的变化,对高斯模型适时地进行更新,以期得到更为准确地背景模型。事先在背景无运动物体的时候,连续采样N帧,由式(4)、(5)即可得到相应高斯模型的参数u(期望)和σ2(方差);

其中ui,t为点i在第t副图像中的灰度值。这样,所有的点(ui,σi2)就构成了初始的背景模型。

前景点和背景点的判决由式(6)决定:

其中I(i)为当前帧的第i个像素点的灰度值。当满足条件(6)时,该点为背景点,否则为前景点。

当该像素点判为前景点时,背景模型对应点的高斯模型的参数u和σi2爆出不变;当判为背景点时,模型参数由式(7)和(8)来完成。

其中,ui(t+1)和σi2(t+1分别是t+1时刻的模型参数值,ui(t)和σi2分别为t时刻第i个像素点的参数值,li(t)为t时刻当前帧第i个像素点的灰度值。参数α由式(9)来确定。

其中,β为学习率,为一个常数,N为高斯分布的概率密度函数。

经实验可知,在室内或不是很复杂的室外背景下,单高斯模型亦能得到很好的效果,处理速度快,分割对象比较完整,虽有时出现个别“黑洞”,但分割后的图像基本能够满足要求。但实验发现,当背景比较复杂时,如树叶摇晃时,噪声增多,背景将变得不稳定,这时用单高斯模型就不可以呢。

3 混合高斯背景模型建立与更新

近年来,在复杂背景建模方面,混合高斯模型成为了一种很受欢迎的方法。最初,该模型是由Stauffer等人在文献[3-5]中提出来的。和单高斯模型为每一个像素建立一个高斯模型不同,该方法为每一个像素建立K个高斯模型,一般K取3-7个,这样使模型克服外界环境影响(典型的如树叶摇晃等)成为可能。

这里,采用混合高斯分布描述背景模型。设用来描述每个像素点(u,v)颜色的高斯分布共K个,K的值通常取3~7个。则像素z(u,v)的概率函数可用式(10)表示。

其中:ωj,uv为t时刻第j个高斯分布在混合模型中所占的权值,K为高斯模型的个数,N为高斯模型的密度函数,μj,uv、∑j,uv分别为第j个高斯分布的均值和协方差矩阵。

建立混合高斯模型,首先要解决的一个问题就是,如何利用这N个采样点估计出ωj,uv、μj,uv、∑j,uv这些参数。参数确定了,对应的混合高斯模型也就建立起来了。

通常,确定这些参数的方法有两种:EM(Expectation-Maximization)算法和K-均值算法。EM算法是确定混合高斯模型参数的常用方法,利用采样值,通过迭代之后,最终可将混合高斯模型的参数同时确定出来[5]。考虑到模型要为每一个像素建立一个混合高斯模型,故本文采用实时性较好的K-均值法来确定模型的参数[6]。

初始化模型:将采到的第一帧图象的每个象素的灰度作为均值,再赋以较大的方差和较小的权重。

模型学习(确定参数):将当前帧的对应象素的灰度值与已有的k个模型作比较,若有|z-μj,uv|<2.5σ,该点属于背景,否则属于前景。训练得到的这K个模型,并不是全部代表背景模型,背景图像库中某些图像的有些像素点并不能真正地代表背景,用这类像素建立的高斯分布模型应该被去除。假设运动目标及噪声在场景区域中不会长时间停留在某一位置上。这样噪声和运动目标相对应的高斯模型的权值和优先级非常小。文献[6]中提到一个阈值M来分离出背景模型。将背景模型按照优先级高低次序排列,前B个分布作为背景模型,B的定义如下:

M是预先定义的阈值,它表示能真正反映背景的数据占总数据的最小比重。如果M取的比较小,就是个单高斯模分布的背景模型;M取的比较大,就是混合高斯分布的背景模型,适用于背景较复杂的情形。

基于颜色背景模型的更新就是更新其模型参数,包括高斯分布自身的参数和各高斯分布的权重。

(1)权重的更新

α是学习率,如果α取的比较小,适应环境变化的能力就低,能适应缓慢的环境变化,或者说,只要给足够的时间,该模型终究能适应环境的变化;如果α取的比较大,适应环境变化能力强,但容易受噪声影响,不够稳定。

(2)均值和方差的更新

对于未匹配的高斯分布,不予更新,对于匹配的第j个高斯分布如下。

混合高斯模型在室外的较复杂的环境中进行运动物体的检测取得了较好的效果,可以较好地抑制由于树叶轻微摇晃、旗帜摆动等外界环境对背景模型的影响。通过实验可以发现,该模型不但对目标较大的运动物体能较好地检测,而且对目标较小的行人也能完整地分割。

4 目标检测与实验结果

经实验发现,基于颜色的混合高斯模型能够适应背景场景轻微扰动、克服噪声和实时更新的、鲁棒的目标检测算法,通过利用分水岭算法提取的目标轮廓的融合,可以完全克服光线强度突变的影响,高效准确检测出运动目标[7]。但还不能消除阴影,这给后续跟踪和识别带来了较大的影响。文献[8]介绍了利用灰度信号去除影子这方面的工作,有效去除了阴影。

如图1所示,(a)待检测的图像。(b)基于混合高斯背景模型分割结果,可以看到包括阴影部分。(c)检测出的阴影部分。(d)去除了阴影部分,得到了理想的目标检测结果。

5 结束语

由于运动图像的目标检测在科学技术研究和工程应用上有着广阔的应用前景而且还可为其他科学研究提供有效的手段和工具,因此各国科学家和工程技术人员都在广泛而深入的研究该项技术,但是在运动图象目标的检测过程中,由于系统和传感器的固有噪声,目标周围背景的干扰,这些干扰的结果造成目标象素可能误判为背景象素,而背景象素可能误判为目标象素,从而引起目标区域质心的计算误差,给运动目标的正确检测带来了极大困难,如何建立对于各种复杂环境的动态变化均具有自适应性的背景模型仍是广大科研工作者日后研究的焦点问题,相信随着科学技术的进步,一定能够实现在各种复杂条件下的运动图像的精确检测。

摘要：介绍了在视觉监控领域经常用到的几种基于自适应背景模型的经典方法,如非参数模型、单高斯模型和混合高斯模型等。通过试验,比较了上述方法在检测过程中的优势和不足之处,以其在工程实践中有一定的参考作用。

关键词：运动目标检测,背景建模,混合高斯模型

参考文献

[1]Elganmmal A,Harwood D,Davis L.Non-parametric Model for Background Subtraction[C].Proceeding of the6th European Conference on Computer Vision,2000:751-767.

[2]Wren C,Azarbayejani A,Darrell T,et al.Real-time Tracking of the Human Body.IEEE Transactions on Pattern Anaysis and Machine In-tellidence,1997,19(7):780-785.

[3]X.Gao,T.Boult,F.Coetzee,and V.Ramesh,Error analysis of background adaption[A].in proc.IEEE Conf.on computer vision and Pattern Recognition[C].Hilton Head,SC,2000.503-510.

[4]C.Stauffer,W.E.L.Grimson.Learning Patterns of Activity Using Real-Time Tracking[J].IEEE Trans.PAMI,2000,2(8):747-757.

[5]C.Stauffer and W.E.L Grimson.Adaptive background mixture models for real-time Tracking[A].In CVPR’99[C].1999.246-252.

[6]方帅,薛方正,徐新和.基于背静建模的动态目标检测算法的研究与仿真[J].系统仿真学报,2005.17(1)159-161,165.

[7]王宏群,方帅,高明.基于抑制光强变化影响的运动目标检测[A].第十四届图象图形学学术会议论文集,2008,5,360-361.

运动小目标检测篇6

目前主流的检测方法有帧差法、背景差分法和光流法。帧差法是最简单且计算量最小的检测运动目标算法, 其对相邻两帧图像每一像素对应进行差分, 结果大于一定阈值的像素被判定为目标像素。但当运动目标速度较快时, 容易出现空洞现象且其对噪声敏感。背景差分法的思想是对图像帧建立背景模型, 然后将其和新输入图像进行相似度比较, 从而检测出前景目标[1]。但其缺点是对动态场景, 如摇曳的树叶、变化的光影较为敏感。光流法是采用计算每个像素的速度矢量和光流约束方程来检测出目标像素, 其计算复杂, 无法满足实时性需求。本文提出一种基于建立称为颜色自相关矩阵模型的背景差分法与边缘检测相结合的运动目标检测算法, 由此可得到较好地检测效果。

建立一个稳健的背景模型是背景差分法的关键部分, 其提供了整个场景的一种特征描述。目前研究人员提出了多种方法来构建背景模型, 常见的参数法是对于图像序列中的每个像素点用一个单高斯模型来表示, 模型参数则可利用一个自适应滤波器来更新[2]。该方法对于静止的背景有良好表现, 但在自然环境中, 监测场景大部分仍是动态的, 故存在不断变化的运动。为更好地表述这种动态变化, 混合多高斯模型被提出用于运动目标的监测[3]。当背景中的变化过快时, 基于高斯模型的模型表述则不准确, 因此有人用一种非参数的方法来建立模型[4]。该方法利用一个非参数核密度估计技术对场景进行统计表示, 其主要缺点是忽视了时间序列的问题, 且需要较好地训练数据[5]。

对于动态纹理背景下的前景检测及其现实应用, 基于像素的方法需长时间观测来建立模型。为克服这一限制研究人员将目标转向基于区域的方法研究, 通常是将图像分解成重叠或不重叠的多个块来建立特征模型。Mason[6]提出了一种基于边缘直方图的特征矢量来描述一个块并检测目标。Heikkila[2]提出了基于局部二值图案纹理的 (LBP) 背景差分方法, 图像中的每个块均被构建成一组加权的自适应LBP直方图。颜色自相关图作为图像一种包含颜色统计信息和局部空间信息的特征描述符, 适用于对动态背景建模。因此, 本文提出了基于颜色自相关图结合边缘检测的运动目标检测方法。

1 基本理论

1.1 颜色自相关图

图像特征是指图像的原始特征或属性, 图像特征的提取结果就是给出某一图像与其他图像相区别的特征, 提取的特征能否有效描述目标区域和准确提取运动目标是关键。颜色特征是图像最直观、明显的特征, 可用直方图描述。直方图是图像中各像素值出现次数的统计结果, 但不能反映像素的位置信息。纹理特征包含了物体表面结构排列的信息, 且具有区域特性, 该特征将随机纹理或几何纹理的空间结构差异转化为特征灰度值的差异并用数学模型来描述分析。对纹理最简单的统计描述方法可建立区域灰度共生矩阵。设S为目标区域R中具有特定空间联系像素对的结合, 则共生矩阵P中的元素可定义为[7]

式 (1) 中, #表示数量, 等号右边分子是具有某种空间关系、灰度值分别为g1和g2的像素对个数, 分母为像素对总个数。通常, 灰度共生矩阵中的像素对在角度上的空间关系有0°、45°、90°和135°, 文中对每个像素规定距离的所有方向上取像素点亮度信息, 这便构成了颜色相关矩阵。但此时考虑任何颜色之间的相关性, 图像颜色相关矩阵的数据量和计算量均会较大, 因此考虑相同颜色像素对之间的空间关系, 即g1=g2, 此时K为在目标区域R中具有特定空间联系像素对的结合, 简化为颜色自相关矩阵中的元素为

颜色自相关矩阵已应用至图像检索当中[8]。本文考虑可应用其对图像运动目标进行粗检测, 再进行后续算法检测以便提取精确目标信息。

颜色相关矩阵能有效减少颜色直方图缺乏空间信息产生的误差, 但同时RGB图像256×256×256的像素值大小在计算时会产生大量数据, 即使仅计算与像素自身相同灰度大小的方式也有较大计算量。因此, 在进行颜色特征的提取前图像必须进行量化。HSV颜色空间其中H表示色度, S表示饱和度, V亮度。为更接近于人类感知颜色的方式, 所以先将RGB图像转化为HSV图像, 再非均匀量化为256种颜色[9]。

1.2 边缘检测

边缘信息是一种图像高频信息, 是灰度不连续的结果, 该种不连续可由求一阶或二阶导数的方法检测。经过微分求导后, 在图像中的边缘部分会得到较高地计算值[10], 随后通过合适的阈值选择提取到边缘部分。图像中运动目标处具有丰富边缘信息, 对边缘特征的提取可满足对目标检测定位的要求。

目前较常用的边缘检测算子包括梯度算子、Roberts算子、Prewitt算子、Sobel算子和Canny算子等。梯度算子采用简单的一阶导数算子, Roberts算子和Prewitt算子是简单的梯度算子, Sobel算子运动算法复杂度小, 且具有一定鲁棒性。Canny算子是最常用的边缘检测算子[11], 先使用高斯模板进行卷积消除噪声, 再用一阶偏导计算梯度进行边缘滤波, 然后借助滞后法则选取高低阈值确定边缘点。所有灰度大于高阈值的像素肯定是边缘像素, 而灰度大于低阈值的像素则要看其是否与大于高阈值的像素相连[12], 由此便可有效减弱噪声影响。

2 运动目标检测算法的思路与流程

图1为本文提出的颜色自相关矩阵与边缘检测的算法基本流程。针对颜色自相关矩阵是对一帧图像, 即一个矩阵的特征描述, 相对直方图特征增加了局部信息, 因此分别对背景帧和当前检测帧进行分块操作, 然后对各帧的每一小块进行特征提取, 即计算对应块的颜色自相关矩阵并将空间信息上位置一致的对应块进行相似度比较 (这里采用直方图距离, 还可采用余弦距离等[13]) , 可得到粗略的二值化目标检测结果A。

同时针对边缘检测是对图像中目标细节的表述, 对这两帧对应利用Canny边缘算子得到边缘图像, 对两幅边缘图像进行差分得到粗糙的运动目标边缘结果, 并对结果进行形态学操作即小目标移除操作得到新的边缘图像B[11], 即提高了对小噪声的抵抗性。将最后的边缘检测结果A与之前粗糙检测结果B进行二值与操作, 若图像空间像素在两种结果中的值皆为1, 则最后输出为1, 否则此像素的值被判定为0。最终将结果进行形态学闭操作对目标边缘进行空洞补充[14], 即先膨胀后腐蚀即可得到大致的运动目标结果。

将背景帧与当前帧对应空间位置的特征矢量进行比较, 判断当前帧的各分块被判定为背景fs, t=1, 或前景fs, t=0, 其中 (s, t) 代表空间块的坐标, 判断公式为

其中, Fs, t和BFs, t分别表示当前帧和背景帧空间位置为 (s, t) 块的矢量特征, D (·, ·) 为相似度测量公式

式中i和j表示任意一块的颜色自相关矩阵的元素位置信息。

3 仿真实验及分析

实验在Intel Pentium 4处理器;3.00 GHz主频CPU, 1.50 GB内存下的XP系统平台上使用Matlab进行仿真测试。量化尺度为256个颜色区间, 图像分块采用块的小区域分解, <10像素的小目标噪声被清除。

为验证算法的有效性, 提取室内室外两组视频图像序列进行算法验证检测。图2是两种场景的背景模型, 即没有前景运动目标存在时的场景图像。图3是存在运动目标时的某帧场景图像, 图4为利用颜色自相关矩阵对图像进行粗糙检测后的输出结果, 从图中可看出, 其能大致检测目标的空间信息, 但无法达到精确检测标准。图5是利用Canny算子对相同图像帧进行边缘检测并简单除去小噪声后的输出结果;图6是将两种检测结果进行逻辑与操作后的输出结果, 可看到运动目标的细节边缘信息;图7是将运动目标还原现实的最终检测结果。

为更好地检验算法性能, 将文中仿真结果与其他经典的目标检测算法进行比较, 如传统帧差法和混合高斯算法 (Mo G) 。图8为原始输入图像;图9为运动目标;图10和图11是用帧差法和混合高斯 (Mo G) 对图像进行处理后得到的结果;图12是用本文算法进行检测得到的最终结果。

为定量评价算法效果, 利用F测量 (F-measure) [15]。其值越高表明检测结果的准确度越高, 则综合表现效果也就越好。即

其中, recall表示前景目标判断的准确度, precision表示被正确检测到的前景目标像素与被检测到的所有前景像素点的比值, 结果如表1所示。从表中数据可看出, 文中提出的算法 (Proposed) 相较于帧差法 (FD) 和混合高斯法 (Mo G) 具有更高的F测量值, 即对运动目标的检测具有更高的准确度。

通过仿真结果的对比分析和F-measure的测量结果可看出, 传统帧差法由于局部亮度的不同和局部背景与目标颜色相似度较高, 检测结果中出现了不少的孤立噪声点干扰, 且出现了空洞现象。混合高斯模型受光照变化和微小晃动如树叶摇曳、水波流动的变化过大, 得到的输出结果有较多噪声点。相比之下, 本文算法首先对运动目标在图像中的空间位置和大致轮廓进行提取, 且提取所用的颜色自相关阵克服了一般直方图特征的局限性。而利用Canny算子对前景的细节进行提取弥补了特征检测的粗糙劣势, 两者相结合最终产生了良好的检测效果。

4 结束语

本文提出了一种结合背景差分与边缘检测的算法。通过建立颜色自相关矩阵特征模型提取图像运动目标的粗糙轮廓, 同时利用Canny算子对图像进行边缘检测从而获取图像的边缘轮廓信息, 然后将两种输出结果进行逻辑与操作, 并进行形态学操作得到最终的运动目标检测结果。实验结果表明, 此算法能适应较复杂场景下的目标检测, 尤其对动态噪声具有一定鲁棒性。但该算法仍存在诸多不足, 例如对目标轮廓的提取不够完整、准确, 且有时检测错误率较高, 因此仍需进一步提高。

摘要：提出了一种基于颜色特征提取和图像边缘检测融合的运动目标检测算法。利用颜色自相关矩阵对图像建立特征模型, 进行相似度的比较得到较粗糙的目标检测结果。然后通过Canny算子提取图像的边缘信息并利用二值差化求得目标大致边缘轮廓。将两者再进行逻辑与操作, 即判定在粗糙检测结果中运动目标轮廓内的元素目标边缘信息为运动目标边缘, 并最终进行形态学操作得到运动目标。实验结果表明, 提出的算法对复杂背景下运动目标有较为理想的检测效果。

基于运动检测的目标跟踪算法研究篇7

首先将摄像机拍摄的模拟图像转化成计算机能识别和处理的数字图像, 再运用数字图像相关算法进行处理和存储。运动目标检测主要检测出图像特定区域的运动物体并标注, 目标跟踪算法对运动物体进一步识别并对它在视野中的路径进行跟踪。在前景中找到运动目标, 获取特征后反馈给跟踪系统, 跟踪系统就根据获取的运动目标的特征进行跟踪, 是行为分析和图像理解的重要依据。

1 运动目标检测

运动目标检测是运动目标跟踪的基础, 只有检测到了运动目标, 才能利用目标跟踪算法进行运动目标的跟踪。所谓运动目标检测, 就是运用数字图像处理方法找出视频中连续帧间的相关性, 检测出视频中运动物体的位置和大小。运动目标检测的基本方法主要有三种:帧间差分法, 背景差分法和光流法。

1.1 帧间差分法

帧间差分法主要是对连续两帧图像作差, 如果对应像素点无差别则认为其为背景像素点, 否则为运动前景。最后遍历整帧图像得到的检测结果为两帧图像中运动前景所在位置。从理论上来说检测结果并不是运动前景的完整表示, 一般情况下为了消除噪声影响会设定一个阈值K对差值结果进行二值化。

当摄像头固定时不需要背景图像也能检测出运动目标, 算法简单保证运动目标跟踪的实时性。运动目标整体颜色很相似时只能检测出运动目标边界;如果运动目标的速率太快, 检测结果会是两个分离的运动目标;如果时间间隔太短, 两帧图像中运动目标就会在同一位置, 运动目标被误当成背景差分掉了, 导致检测不出运动目标。

假设在t时刻当前帧像素点 (x, y) 处的像素值为f (x, y, t) , t时刻背景模型中像素点 (x, y) 处的像素值f (x, y, t-l) , 则背景差分法的数学表达式为:

然后对背景差分后的结果图像二值化:

其中fout (x, y, t) 为输出的检测结果, K为所设的阈值。

当摄像头固定时不需要背景图像也能检测出运动目标, 并且算法简单, 所以实际应用中可以保证实时性。但是当运动目标速率太快, 或者与背景颜色接近时效果不太理想。

1.2 背景差分法

背景差分法算法简单、对硬件的要求低, 同时运动目标检测的速度快、当背景环境不发生变化时, 精确度很高, 基本原理是用视频中当前帧与背景图像作差。当运动目标与背景的差别较大时, 不仅能检测出运动目标的位置, 而且能准确的检测出运动目标的大小。最关键步骤是得到准确的实时背景图像, 常见的背景建模方法主要有中值法, 均值法, 卡尔曼滤波器法, 单高斯分布法, 多高斯分布法。

假设在t时刻当前帧像素点 (x, y) 处的像素值为fn (x, y, t) , t时刻背景模型中像素点 (x, y) 处的像素值fb (x, y, t) , 则背景差分法的数学表达式为:

然后对背景差分后的结果图像二值化:

其中fout (x, y, t) 为输出的检测结果, K为所设的阈值。

一般情况下在对检测结果二值化以后都需要对其连通性进行分析和数学形态学处理, 以去除检测结果内部的空洞和图像中出现的噪声, 同时也可以对运动目标的分裂和多个运动目标融合的情况进行分析。由公式可以看出背景差分法最关键的步骤是得到准确的实时背景图像。

1.3 光流法

光流法其实是目前运动目标检测最准确的算法, 算法复杂度高。它主要是把三维空间中的运动投影到二维的平面中就会呈现中光流的表象, 通过二维平面中每一个像素的灰度信息的分析得到灰度运动的瞬时速度。在摄像机固定的时候, 背景一般不会发生变化, 所以其灰度不变, 其对应的光流为0, 也就是说光流不为0的地方就是前景, 当摄像机运动的时候可以分析像素灰度的相对运动来检测运动目标。

外界的光线变化时即使没有运动目标也会产生光流;灰度等级不够时由于被量化, 变化被隐藏观测不到光流。

2 运动目标跟踪

运动目标跟踪建立在运动目标检测基础上, 是计算机视觉领域的重要内容。目标跟踪主要分为特征提取和匹配搜索两个步骤。主要有基于目标模板的跟踪、基于目标特征的跟踪、基于目标区域的跟踪及基于目标轮廓的跟踪四种基本跟踪方法。

2.1 基于模板的跟踪

模板匹配法是最基本的算法, 基本原理是用运动目标的像素信息作为模板, 选用一种搜索算法用当前帧中搜索区域与模板进行比对, 判断的标准主要依据相似性度量, 核心是获得正确目标模板。

2.2 基于特征的跟踪

基于特征的跟踪是最普通的目标跟踪, 首先对目标的特征进行提取, 常见特征提取方法有不变矩特征、颜色特征、空间直方图特征等, 然后找到一种相似度量进行目标匹配。基于灰度图像相关度量有ABS (Absolute balance search) , 归一化相关匹配, 直方图匹配等算法。

2.3 基于区域的跟踪

基于目标区域的跟踪把检测到的运动目标区域当作目标模板, 用运动目标的颜色信息进行匹配。运动目标以颜色作为相似度量, 特征的提取主要包括以像素值统计为基础的颜色直方图, 以图像像素的矩为基础的颜色矩以及以视觉颜色空间为基础的颜色集。

2.4 基于轮廓的跟踪

基于目标轮廓的跟踪首先表示出运动目标的大体轮廓信息, 然后将目标边界作为特征模板进行搜索。比较经典的搜索算法主要有全局搜索, 分布搜索, 钻石搜索以及改进的三步搜索和四步搜索法。

3 相关性度量算法

目标的匹配通过计算相关性实现, 方法主要有ABS和归一化相关匹配。ABS匹配算法主要是用从运动目标中获取的像素模板图像与视频序列中的图像的像素值的差的绝对值来表示二者的相关性, 找出相关性最大的点作为最佳匹配点。常用算法有最小均方误差 (MSE) , 最小平均绝对值差值 (MAD) , 最大匹配像素统计 (MPC) 。归一化互相关匹配算法通过计算目标模板与当前帧图像互相关性匹配, 互相关性最大点就是最佳匹配点。

4 结语

目前运动目标的跟踪算法还存在一些尚未很好解决的共性问题, 如跟踪过程中目标性状、尺寸、位置、运动方向的改变;背景环境及光照条件的改变;目标被遮挡及部分遮挡的情况等。如何利用DSP等实现运动目标的实时性检测与跟踪, 多个摄像机之间如何进行联合跟踪, 这些问题都需要进一步探索和研究。

参考文献

[1]庞国瑞, 葛广英, 葛菁等.基于金字塔多分辨率和钻石搜索的目标跟踪算法及其在DSP上的实现[J].数据采集与处理, 2012, 27 (6) 710-716.

运动目标检测中背景更新算法研究篇8

1 背景算法建模

1.1 算法思想

背景建模是运动目标检测参考模型, 建立有效的背景模型是背景减法的核心部分。目前, 背景提取的算法有很多, 主要有基于时间轴的滤波方法、基于统计模型的方法、非参数模型等。三帧差分法、近似中位数法是常见的两种算法, 具有算法简单、易于实现且效果较好的特点。

本文首先运用近似中位数法获取更新背景, 但是, 当运动目标的灰度与背景图像灰度相近时, 背景相减法就不能将运动物体有效的检测出来, 因此通过三帧差分法得到差分图像, 将差分图像与背景减除法确定的运动目标区域相结合, 从而得到可靠的运动区域, 如图1所示。

具体步骤:

(1) 采用近似中位数算法获得运动场景的背景图像, 并将当前图像帧与背景图像相减获得运动物体的区域;

(2) 采取三帧差分法对连续三帧的灰度图像序列进行绝对差运算, 将得到的两个二值图像进行逻辑或运算, 并对二值图像进行形态学处理;

(3) 将差分图像与背景减除法确定的运动目标区域进行逻辑“或”运算, 从而得到可靠的运动区域;

(4) 通过运动区域提取运动目标。

1.2 近似中位数法

中位数法背景更新的假设是:在一个短时间中, 视频场景中的像素点, 在经过很多图像序列后, 处于动态目标上的时间小于处于背景状态的时间, 并且处于动态目标上的时候, 其强度值是随机分布的, 处于背景状态时其强度分布变化较小且是平缓的。

对于固定场景, 当运动物体在运动, 且速度较快时, 绝大多数时间内人们看到的背景都是静止的, 因此图像上某个像素点作为前景的时间相对作为背景的时间要短得多。因此使用中位数法能很好的进行背景恢复。但此方法不适合同时检测大量目标的场景, 如交通拥堵时的车辆检测。

近似中位数法算法原理:在被观测的视频帧图像序列中, 我们等分地抽取n帧图像 (n表示中值滤波样本数位的奇数) , 如果在位置 (x, y) 处像素处于动态目标上的时间小于处于背景状态的时间, 在这n帧图像上强度值表示为fn (x, y) , 在此情况下, fn (x, y) 所有值的中值即为背景强度, 此算法比较简单。

本文的中位数法背景建模以车道上的交通视频监控为例进行的, 我们选取帧间隔为4帧的9帧图像序列, 根据苏礼坤等证明, 车辆的平时时速为每小时60公里, 车辆平均长度为6米, 当帧间隔n>3.6时, 样本更新的视频时间段为1.08s, 在此时间段内更新背景, 可以认为背景是没有变化的, 能够很好地恢复背景。

1.3 三帧差分法

帧差分法是利用当前帧图像的像素值与前面某帧图像的像素值进行差分来获得运动区域的, 通过差值图像可以快速检测出差值的两幅图像中运动目标所产生的运动范围, 如式1所示。

这种方法在表示图像变化时可转化为一个二值图像来表示:

fi表示第i帧的帧图像, T是已设置的阈值, 当像素值差的绝对值大于T时, 检测出运动区域, fb置0, 否则, fb置1, 这样就可以快速检测出运动区域。帧差法具有实现简单、适合场景变化能力强、稳定性较好等优点, 但两帧间的目标重叠因素难以有效检测出来, 由于差分后仅保留相对变化的信息, 因此检测出的目标轮廓大小大于实际尺寸, 甚至在运动目标内部产生空洞现象。

三帧差分法将相邻的三帧图像作为一组进行再差分, 能较好的检测出中间帧运动目标的形状轮廓。设图像序列表示为fi (x, y) , 其中 (x, y) 表示图像中像素点的位置坐标, i表示第i帧图像。其算法过程可以表示为:

首先, 选取视频图像序列中连续的三帧图像, fi-1 (x, y) , fi (x, y) , fi+1 (x, y) , 分别计算相邻两帧图像的差值图像:

其次选取适当的阈值对差值图像进行二值化, 得到的二值化图像为:

在每一个像素点 (x, y) 将得到的二值图像逻辑相与, 得到二值图像Bi (x, y) , 如式7所示。

2实验结果分析

本文以Visual C++2006、OpenCV为软件开发工具, 在PC机 (Intel Pentium 3.0GHz, 4GB内存) 上对一段交通监控视频进行测试, 处理速度为每秒30帧, 视频图像大小为120×160像素。采用三帧法、近似中位数法、混合高斯法以及本文提出的算法进行实验, 检测结果分别得以证明。

实验结果中依次为采用三帧差法、近似中位数法、混合高斯法和本文算法获得的目标结果。

从实验结果可以看出, 三帧差法检测结果有“双影”现象且有明显的空洞问题;近似中位数法必须在物体处于动态上的时间小于50%时, 才能够很好的恢复背景, 但检测结果出现“拖影”;混合高斯法对场景动态变化有较强的鲁棒性, 且能够完整的检测出运动物体, 但是出现了明显的阴影现象, 以独立点噪声, 且混合高斯法检测的实时性不好;然而本文提出的算法, 有效地利用了近似中位数法和三帧差法的优势, 在目标形体和尺度上的检测结果较混合高斯法要好, 获得了比较完整的运动目标检测结果。

3 结论

本文针对传统的视频序列中运动目标检测算法, 提出了一种新的目标检测算法, 在背景被运动目标覆盖的平均时间小于不被运动目标覆盖的时间的条件下, 该算法充分发挥了近似中位数法和三帧差分法的优势, 能够克服光照变化等对背景减除的影响, 有效消除帧差法带来的空洞现象, 实验结果也表明, 在目标形体上, 本文提出的算法检测结果要优于比混合高斯法。

参考文献

[1]王亮, 胡卫明, 谭铁牛.人运动的视觉分析综述[J].计算机学报, 2002, 25 (3) :225-237.

[2]高辉, 杜庆灵.视频监控系统中动目标检测算法研究[J].计算机与数字工程, 2008, 36 (9) :34-37.

【运动小目标检测】推荐阅读：

运动目标检测与跟踪12-06

运动目标检测与识别01-09

空间运动目标07-16

运动点目标06-01

运动目标跟踪12-09

运动目标识别12-15

运动目标模拟系统设计07-05

目标定位目标检测06-02