ViBe

2024-08-26

ViBe(共5篇)

ViBe 篇1

背景差分法以其相对较好的噪声抑制能力和较低的计算复杂度, 成为实际应用中运动目标检测的首选。背景差分法的关键主要体现在背景模型的选择和更新机制的设计上。一般的背景差分方法, 如混合高斯算法 (Gaussian Mixture Model) [1]、码本算法 (Codebook) [2]等, 对光照敏感, 且需要几十帧的图像进行背景模型的构建, 实时性差。Olivier B等人在一致性建模算法 (SACON) [3]和SOBS算法[4]的启发下, 提出了ViBe算法[5]。

ViBe算法是一种非参数化聚类背景建模方法, 在不同环境下具有良好的适应性和实时性[6], 检测效果明显。传统的ViBe算法仍然存在一些缺陷, 例如, 光照突然变化时, ViBe算法会将大面积的背景点误检为前景点, 即使经过了很长时间, 也难以重新将其归类为背景。同时, ViBe算法背景模型的单帧初始化方式容易引入鬼影区域, 而且该算法模型更新策略并不能很好地处理噪声。针对这些不足, 本文依据光照变化并不会改变图像的纹理特征这一特性, 提出运用尺度不变局部三值模式 (SILTP) [7]对图像进行纹理特征提取, 通过比较SILTP值来对前后景像素进行分类, 实验结果表明, 改进后的算法对光照变化取得了较好的鲁棒性。此外, 本文采用20帧图像进行背景模型的初始化, 并且更新策略改进为替代异常值的方式, 实验显示, 改进后的算法在处理鬼影区域和抑制噪声方面取得了明显的效果提升。

1 ViBe算法思想和SILTP算子

1.1 ViBe算法思想

ViBe算法首次将随机化的方法引入到背景模型中, 同时根据图像中相邻像素的时空一致性原则, 采用单帧初始化策略和随机信息传播机制。

1) 背景模型表示:属于背景中每一个像素的背景模型用N个背景样本组成 (N取值为20) , 定义I (x) 为欧式空间中位于x处的像素, Ik为选取的样本像素, 则像素I (x) 对应的背景模型M (x) 如式 (1) 所示

2) 背景模型初始化:与其他背景差分算法不同的是, ViBe算法采用单帧初始化策略。如图1a所示, 在第一帧中, 从I (x) 的八邻域NG (x) 里随机多次选取N (N取值为20) 个像素值, 存放到对应的背景模型的N个样本中。如式 (2) 所示, 定义M0 (x) 作为第一帧的背景模型

3) 像素分类:在2-D欧式空间中, 定义SR (I (x) ) 是以像素I (x) 为中心, 距离R (R取20个像素) 为半径的球体 (见图1b) 。设定阈值#min (#min取值为2) , 当集合M (x) 与SR (I (x) ) 的交集大于#min时, 则判定I (x) 为背景像素, 反之, 则为前景像素。

4) 背景模型更新及信息传播:若I (x) 被分类为背景像素, ViBe算法将从I (x) 的背景模型M (x) 中随机选取一个样本Ik, 然后用I (x) 来替代。这种随机化更新方式, 保证了每一个样本的生命周期呈平滑指数递减, 避免了先进先出更新策略的缺陷。考虑到在实际应用场景中, 不必频繁更新背景, 该算法采用了二次时间取样的方式, 来延长模型中样本的生命周期。

为了保证像素邻域空间一致性以及恢复被前景遮挡的背景像素, ViBe算法在采用像素I (x) 对背景模型进行更新的同时, 还使用I (x) 对邻域中的像素的样本模型进行更新, 这就是随机信息传播机制。

1.2 尺度不变局部三值模式SILTP

在实际应用中, 光照突变等因素都会导致图像的多尺度变化, 对此, Shengcai L等人在LTP[8]的基础上提出尺度不变三值模式 (Scale Invariant Local Ternary Pattern, SILTP) 。其计算公式如式 (3) 所示

式中:Ic表示中心点像素值, Ik表示N邻域中所对应的像素值, 并且N邻域位于以Ic为中心, R为半径的区域中, 表示二进制串的连接运算符, t表示比例系数, st (Ic, Ik) 是一个分段函数, 定义如式 (4) 所示。由于比较结果只有三种可能, 因而采用两位二进制来表示结果, SILTP具体编码过程如图2所示, 从图中可以看出, SILTP对于噪声和尺度变化具有强鲁棒性。

SILTP算子的优势主要体现在三个方面。首先, 由于SILTP只比LBP多一次比较, 因此, 其计算效率较高;其次, 与LTP类似, SILTP引入区间范围, 从而对噪声的鲁棒性较好;最后, 也是最重要的一点, 就是SILTP引入尺度不变特性, 因此, 对于光照变化的处理效果较好。

2 改进后的运动目标检测算法

结合SILTP纹理描述算子, 利用像素的时间和空间特性, 提出改进后的运动目标检测算法。图3为本文的算法流程图, 下面将从背景模型初始化、运动目标检测和模型更新等方面介绍本文的改进算法。

2.1 背景模型的初始化

当视频的第一帧包含运动目标时, ViBe单帧初始化策略在初始化模型时, 会将运动目标像素作为背景像素值进行建模, 运动目标移动后, 采样得到的真正背景像素无法与背景模型匹配, 导致背景像素被误检为前景, 由这类像素形成的区域, 称之为鬼影区域。此外, 从邻域中随机选取背景初始样本的过程中, 可能会引入不同纹理的像素, 破坏了初始模型。

因此, 本文针对ViBe算法初始化的不足, 提出采用20帧图像进行初始化, 能够有效抑制鬼影。如式 (5) 所示, 从同一位置的20帧图像中选取样本构成初始化模型M0 (x) , Ik (x) 表示第k帧中位于x处的像素

2.2 运动目标检测

目前主流的运动目标检测算法都是依赖于概率密度函数和参数统计, 但是在实际应用中, 统计模型很难完整客观地反映运动场景。实际上, 如果把运动目标检测看成是分类问题, 那么只要正确地分出前景像素和背景像素就可以完成运动目标的检测。为此, 本文提出计算待检测点与背景模型中每个样本的SILTP值, 同时设定SILTP匹配阈值Th和样本匹配阈值#min, 若匹配度达到Th的样本数量超过#min时, 则判定该检测点为背景, 反之, 为前景。具体步骤如下:

1) 计算出待检测点像素I (x) 的SILTP值c (x) 和背景模型每一个样本的SILTP值, 则转化后的背景模型如式 (6) 所示

2) 式 (7) 表示用异或操作来计算c (x) 与式 (6) 中样本的匹配程度, 匹配程度通过统计异或结果中1的位个数来表示

3) 当该样本匹配程度大于阈值Th时, 标记该样本为1, 反之为0, 如式 (8) 所示

4) 统计样本中nk (x) 为1的个数, 得到结果Sum (x) , 如式 (9) 所示

5) 最后对I (x) 像素进行分类, 如式 (10) 所示

经过多次实验分析, 得到本文中参数Th=3, #min=2。

2.3 背景模型更新

在运动目标检测过程中, 背景模型容易混入异常样本, 比如误分类的前景像素或噪声像素, 这时, ViBe的随机更新方式并不能有效地处理。为此, 本文提出替代异常值的更新方式, 具体思想如下:

首先, 根据式 (6) 得到转化后的背景模型, 计算出每个样本与模型中其他样本的海明距离平均值, 如式 (11) 所示, Di表示第i个样本与其他样本的海明距离平均值。

其次, 找出平均海明距离最小所对应的样本, 如式 (12) 所示, index表示平均海明距离最小所对应的样本下标

最后, 设定更新速率为φ, 当某像素I (x) 分类为背景时, 则有1/φ的概率更新其背景模型中的样本, 即用c (x) 替代样本cindex (x) 。同时, 与ViBe算法传播机制相似, 本文利用邻域像素分布相似特性, 在更新该像素点背景样本的同时, 再次按照1/φ的概率随机选取I (x) 的8邻域的一个像素点, 将c (x) 替换其背景模型中的样本SILTP值。

3 实验结果与分析

本文实验的软件环境为配置了OpenCV 2.4.8的Visual Studio 2013, 硬件环境为3 Gbyte的内存和Intel Core i32.4 GHz的处理器。处理的视频序列来自UCSD的Beach People视频序列和CVPR的PETS视频序列。为了进行算法比较, 说明本文改进算法的性能, 实现了ViBe算法和本文改进后的算法, 其中, 在本文改进算法使用的是8邻域, 模型样本数N取20, SILTP阈值Th取3, 样本匹配阈值#min取2, 更新速率φ取16, 而ViBe算法采用原作者使用的参数, 即球形半径R取20, 样本数N取20, 更新速率φ取16, 样本匹配阈值#min取2。

3.1 Beach People图像序列实验结果

本图像序列主要用来检验改进算法在光照变化和噪声条件下的检测效果。在Beach People图像序列中, 阳光在海面反射会造成光照的突然变化, 同时, 波动的海面和抖动的树叶造成的噪声都会给检测效果带来挑战。在该图像序列上得到的实验结果如图4所示, 其中, 图4a表示截取的序列第230帧, 图4b表示理想状态下的检测结果, 图4c表示ViBe算法处理得到的结果, 图4d表示本文改进算法检测的结果。可以看出, ViBe算法对噪声和光照变化的处理不足, 导致树叶和围墙等背景物体误检为前景, 影响了机器视觉的后期处理, 比如目标跟踪。而从图4d可以得出, 本文的改进算法检测效果和ViBe算法相比有较大的提升。

3.2 PETS图像序列实验结果

本图像序列主要用来检验改进算法在鬼影抑制和复杂纹理场景下的检测效果。在PETS图像序列中, 背景纹理复杂, 同时, 静止的车辆移动后, 会造成鬼影区域。如图5所示, 图5a表示截取的序列第450帧, 图5b表示理想状态下的检测结果, 图5c是ViBe算法的处理结果, 图5d表示本文改进算法得到的检测结果。可以看出, 本文改进算法在鬼影抑制和复杂背景纹理处理方面和ViBe算法相比有较大的改进。

3.3 实验结果的定量分析

目前有许多的定量分析方法来评估背景差分法的检测效果, 但是很难选择最优的方法, 原因在于每个作者提出的分析方法都是有利于评估自身的算法, 有失公允。通过比较, 可以发现这些分析方法一般包括4个因素, 即正确检出的前景像素数量 (TP) , 误检的前景像素数量 (FP) , 正确检出的背景像素数量 (TN) , 误检的背景像素数量 (FN) 。根据文献[9], 正确分类比 (PCC) 公式包含了以上4个因素, 因而采用PCC来评估本文的实验结果, PCC公式如式 (13) 所示

为了抑制ViBe算法在初始化过程中容易引入鬼影问题, 本文采用了20帧初始化方式, 同时, 纹理特征的提取与比较都需要付出计算代价, 因而改进算法在处理速度上较ViBe算法有所降低。但是, 从表1中可以得出, 本文改进的算法在正确分类比率上较Vi Be算法有较大提升, 特别是在硬件较好环境下, 两种算法处理速度相近时, 改进后算法在性能上的优势更加明显。

4 小结

本文针对经典ViBe算法提出改进。首先, 对于模型初始化方面, 本文采用20帧初始化策略, 有效抑制了鬼影的形成其次, 对于前后景检测方面, 本文利用SILTP算子提取像素的纹理特征, 通过比较SILTP值来对像素进行分类, 提高了算法对光照变化的鲁棒性;最后, 对于模型更新方面, 本文采用替代异常值方式, 在处理噪声等异常像素时, 检测效果有明显的提升。实验结果显示, 本文提出的改进算法在满足实时性的基础上, 对复杂场景的鲁棒性较强。

参考文献

[1]ZIVKOVIC Z.Improved adaptive gausian mixture model for background substraction[C]//Proc.International Conference Pattern Recognition.[S.l.]:IEEE Press, 2004 (2) :28-31.

[2]KIM K, CHALIDABHONGSE T, HHARWOOD D.Real-time foreground-background segmentation using codebook model[J].Realtime Imaging, 2005, 11 (3) :172-185.

[3]WANG H, SUTER D.A consensus-based method for tracking:modeling background scenario and foreground appearance[J].Pattern Recognition, 2007 (40) :1091-1105.

[4]MADDALENA L, PETRESINO A.A self-organizing approach to background substraction for visual surveillance application[J].IEEE Trans.Image Processing, 2008, 17 (7) :1168-1177.

[5]BANICH O, VAN DROOGENBROECK M.Vi Be:a universal background substraction algorithm for video sequences[J].IEEE Trans.Image Processing, 2011, 20 (6) :1709-1724.

[6]邓博, 范文兵, 常伯乐.基于嵌入式系统的运动目标检测算法的设计及实现[J].电视技术, 2013, 37 (9) :214-217.

[7]LIAO Shengcai, ZHAO Guoying, KELLOKUMPU V.Modeling pixel process with scale invariant local patterns for background substraction in complex scenes[C]//Proc.2010 IEEE Conference on Computer Vision and Pattern Recognition.[S.l.]:IEEE Press, 2010:1301-1306.

[8]TAN X, TRIGGS B.Enhanced local texture feature sets for face recognition under different lighting conditions[EB/OL].[2014-12-10].http://link.springer.com/chapter/10.1007%2F978-3-540-75690-3_13.

[9]ELHABIAN S, ELSAYED H, AHMED S.Moving object detection in spatial domain using background removal techniques-state-of-art[J].Recent Pattern Computaional Science, 2008, 8 (1) :32-54.

ViBe 篇2

功能丰富的Natural ID FS4202传感器解决方案,对指纹模板数据进行AES256位加密,对于在智能手机上快速部署生物识别身份验证技术,这种加密方法起到了关键作用。此外,Synaptics在知识产权方面拥有强大的领先地位,可凭借超过240项已获得和正在申请的生物识别技术专利为客户提供保护,既增强了客户信心,又提高了移动身份验证的安全性。

FS4202已通过FIDO(Fast Identity Online)线上快速身份验证联盟的FIDO Certified?认证。FIDO规范专注于提供无密码便利性,目前有大量产品和服务支持FIDO规范,而FS4202可与生态系统中广泛的产品和服务互操作。FS4202与支付宝等快速增长的安全移动支付服务相互依存和促进。

联想公司核心技术与平台事业部部硬件总监Michael Zhu表示:“用智能手机完成移动支付的需求在日益增长,联想Vibe P1满足了这种需求。有了Synaptics指纹识别身份验证解决方案的支持,我们对未来生物识别安全技术充满信心。随着高度安全的指纹识别身份验证技术在智能手机上的广泛采用,整个生态系统都将从安全、简便的无密码操作中受益,其中最显著的受益方是消费者。”

Synaptics公司生物识别产品部市场副总裁Anthony Gioeli表示:“Synaptics指纹识别解决方案在联想Vibe P1上的最新应用,突出显示,我们的生物识别安全解决方案正在得到日益增多的、更加广泛的智能手机的采用。联想是手机领域主要的领导者和创新者,也是Synaptics的重要合作伙伴,与我们拥有共同的愿景,即实现高度安全和便利的移动支付。”

ViBe 篇3

关键词:经典Vibe算法,三帧差分,LUV色彩空间,行人目标检测

0 引言

运动目标检测是计算机视觉领域中重要的研究课题之一,融合了图像处理、模式识别、人工智能以及自动控制等多个领域的内容,是一个跨学科、富有挑战性的前沿课题。行人目标检测作为运动目标检测的一个实例,随着我国智慧城市建设的大力开展,智能视频分析需求的亟需提高,它在视频监控系统中得到了广泛应用[1]。但在复杂的现场环境中,诸如光照突变、动态背景、“鬼影”等干扰因素,给行人目标检测技术带来了很大的挑战。

目前常见的目标检测方法有: 光流法[2]、帧间差分法[3,4]、背景减去法[5,6,7,8]。光流法由于计算十分复杂,从而导致算法的实时性差、实用性低。帧间差分算法相对简单,利用图像序列中相邻帧之间的图像差分来提取运动的目标区域,但往往不能提取出完整的目标。背景减去法通过实时的背景提取和更新实现运动目标的检测,算法简单且实时性好,但其检测性能与背景模型的准确性有较大的相关性。

为了建立适应动态背景的有效背景模型,学者们提出了多种背景建模算法,例如: 混合高斯模型( Gaussian mixture model,GMM)[9]、码本模型( Code Book)[10]、GMG算法[11]和Vibe算法[12]。其中,Olivier Barnich等[12]学者提出的基于像素非参数化随机样本模型( Visual Background Extractor,Vibe)的背景减除算法,以其计算量小、检测速度快等特点得到了广泛应用,但该算法对“鬼影”的滤除以及光照的处理方面未做太多考虑。本文在Vibe基础上结合三帧差分以及LUV均匀色彩空间,提出了一种改进的Vibe算法,用于视频监控中行人目标的检测。实验结果表明,本文算法与传统Vibe算法检测结果相比,不仅实现了对“鬼影”的快速抑制并提高了对光照影响的鲁棒性,同时还保证了视频监控的实时性需求。

1 Vibe运动目标检测算法

Vibe算法,即视觉背景提取算法,用来实现快速的背景提取和运动目标检测。该算法首次直接对单帧图像进行初始化建模,并将随机化的方法引入到背景模型中,提出一种随机更新背景模型的策略。由于算法的实时性和鲁棒性较高,一经提出就很快被用于实际应用中。算法的核心思想主要包括背景建模、前景检测及背景模型的更新。

1. 1 背景建模及前景检测

对视频第一帧图像的每一个像素点建立一个包含N个样本的像素模型,根据相邻位置像素值具有相似时空分布的特性,随机选取每个像素的八邻域中某个像素值来初始化背景模型中该像素的值。定义v( x) 为RGB彩色空间中x处的像素值,vi为选取的样本,则像素v( x) 的背景模型记为:

定义一个圆域SR( v( x) ) ,如图1 所示,中心为像素v( x) ,半径为R ,统计落在圆域内的样本的个数,记为#{ SR( v( x) ) ∩ { v1,v2,…,vN} } ,给定一个阈值#min ,若满足:

且在RGB通道上,样本像素的色彩差满足公式( 3) 时,则将v( x) 分类为背景,否则认为是前景。

其中,c代表R,G,B这三个通道。

1. 2 背景模型的更新

随着时间的推移,背景不可避免会发生一些变化,如光照,前景遮挡等等。因此需要不断地更新背景模型,才能达到较强的抗噪性。Vibe算法在模型更新时引入随机策略,提出了一种简单快速的更新方法:

1采用无记忆更新策略,随机选取样本更新。每次确定需要更新像素点的背景模型时,从新像素点的八邻域中随机选取一个样本,替代原有背景模型中随机选取的一个样本值。这样保证了样本在背景模型中存在寿命的平滑指数衰减,避免了先入先出方法造成的变化速度不能正确处理的问题。

2随机决定是否更新背景模型。即并不是每处理一帧数据,都需要更新处理,而是按一定的更新率更新背景模型。增加一个时间二次抽样因子记为φ ,以1 / φ 的概率更新背景模型。从而进一步提高了背景模型的时间相关性,并有效地防止周期或者伪周期的背景运动。

3随机更新邻域像素点。图像中邻域的像素具有相似的时空分布,因此背景模型中的样本也要更新对应的邻域。增加一个时间二次抽样因子 φ ,以1 / φ 的概率更新该像素的八邻域中的某一像素。这样有效地保证了空间一致性,可以随时间恢复被前景遮挡的背景像素。

2 改进的Vibe算法

Vibe算法程序简单,特别是对于场景中有快速运动的物体、规律闪烁的背景以及遮挡的背景等情况的处理具有良好的鲁棒性。针对原算法中存在“鬼影”以及对于图像中发生光照突易产生误检现象的问题,本文对视频进行三帧差分[13]预处理并结合形态学及LUV色彩空间[14,15]的方法提出了一种改进的Vibe算法。

2. 1 基于三帧差分的背景获取

在Vibe算法中,由于直接对第一帧进行背景建模,若目标在第一帧中出现,则得不到纯净的背景,因此本文利用预处理过程来获取相对真实的背景。帧间差分法采用基于像素的时间差分来提取图像中的运动区域,具有实现简单,计算量小,对光线等场景变化不敏感,对动态环境具有较强的自适应性,且不会产生“鬼影”的特点。本文预留视频的前n帧( 当i < n时) 使用三帧差分算法得到运动目标的位置信息,通过运动特征在不同帧中提取内容来填充真实背景。背景获取预处理具体步骤为:

1设定预处理帧数n 、帧处理步长step ,当前处理帧号i ,背景生成帧号t 。

2获得运动目标的位置信息: 从第t帧开始,令i = t ,提取视频中第t - step 、t 、t + step帧图像做三帧差分,差分后的图像直方图具有明显的双峰特征,即背景和目标之间的类间方差很大。基于这种特性,使用大津法对结果进行二值化处理,获得第t帧图像中运动目标的位置,将第t帧中除去移动目标位置外的部分作为真实的背景信息。

3运动目标位置填充: 将当前处理帧后移step帧( 即i = i + step ) 。

当i < n时,用t - step 、t 、t + step做三帧差分,通过差分结果图像判断第i帧位于第t帧图像运动目标位置处是否有未填充的背景信息,若有,则将第i帧此位置的像素填充为背景,同时填充该像素的八邻域; 否则,转步骤3。

若第t帧图像运动目标位置已经全部填充完毕转步骤4; 否则转步骤3。

当i ≥ n时,根据邻域像素的相似时间分布特性,选择最近邻域背景像素填充,转步骤4。

(4)真实背景输出。

2.2 LUV颜色空间

RGB空间是非均匀色彩空间,对图像中的光照改变非常敏感,会导致错误地标记光照改变时的背景为前景。因此本文把RGB图像转换到LUV颜色空间,以提高算法对光照的抗干扰性。LUV全称为CIE1976( L*,u*,v*) ,是均匀色彩空间,具有视觉统一性。其中,L*代表亮度信息,u*和v*代表色度信息。LUV色度坐标可以由RGB坐标转换得到:

其中,R,G,B分别代表像素v( x) 在x处的色彩值。u' 和v' 是色度坐标,

采用式( 5) - ( 7) 形成标准化的坐标,令( Lb*,ub*,vb*) 为像素vb的采样值,( Lt*,ut*,vt*) 为vb在t时刻的采样值。如果背景完全静态,当光照变暗时,此时的背景像素对比原先的背景像素要暗: α ≤Lt*/ Lb*≤ 1; 相反,当光照变亮时,此时的背景像素对比原先的背景像素要亮: 1 ≤ Lt*/ Lb*≤ β。因此,光照强度的容差变化范围可以表示为: α ≤ Lt*/L*b≤β。

在LUV色彩空间中式( 3) 可以改写为式( 8) ,当#( v( x) ) ≥ #min时,像素v( x) 被判为是背景。

这里s、α 和 β 都是经验常数,本文实验中,设置s = 0. 03,α = 0. 6,β = 1. 5。

2. 3 算法步骤

本文算法流程框图如图2 所示,具体步骤如下:

1使用三帧差分算法预处理得到真实背景。

2背景建模。对预处理得到的背景进行建模,得到20 幅背景样本。

3前景检测。对图像中的每一个像素,根据式( 8) 计算与每一幅背景样本中对应像素的欧氏距离#( v( x) ) ,设定阈值R = 20 ,#min = 2 。即如果至少有2 个结果小于20,则该像素点判断为背景,转步骤4; 否则为前景,对二值图像进行膨胀处理,再做闭操作,填充小空洞。计算像素值为1 区域的面积A ,当A ≥ 300 时对区域做最小外接矩形,即为目标检测结果。

4更新背景。如果当前像素判断为背景像素,设定时间二次抽样因子 φ = 16 ,即随机选取背景样本中以1 /16 的概率更新样本。同时以1 /16 的概率更新该像素的八邻域中的某一像素。

3 实验结果分析

算法运行环境为CPU: Intel( R) Core( TM) i5 -2450M@ 2. 5GHz; 内存: 4. 00GB的笔记本上; 程序代码使用VS2010 + opencv2. 4. 8 编写。本文的实验过程中其它参数设置n = 50,step = 5,i = 5,t = 5,φ = 16。在对视频行人目标检测的效果进行评价时,本文采用主观评价。

实验采用Cell_phone_Spanish视频对本文算法进行测试,同时与传统Vibe算法进行比较。实验过程中,算法采用的参数与原文相同。实验结果如图所示,图3 是算法的背景图像对比图,图3( a) 为视频第一帧,即原始背景,图3( b) 为预处理后得到的真实背景。图4 是存在“鬼影”时检测结果图,图4( a) 为传统Vibe算法的检测效果,可以直观地看出,由于“鬼影”干扰,产生了误检现象; 图4( b) 为本文算法检测效果,预处理后很好地消除了“鬼影”影响,检测结果较好。实验视频是高速运行的列车上拍摄得到,外界光照变化对视频中目标检测存在影响。图5 给出了光照变化情况下的检测结果,图5( a) 为传统Vibe算法的检测结果,大片光照会产生误检,而且不做形态学处理,得到的检测结果也不够精确; 图5( b) 为本文算法的检测结果,转换色彩空间并加入形态学处理后,算法对光照的鲁棒性得到了显著增强,同时提高了检测的准确性。

4 结束语

ViBe 篇4

1系统平台介绍

1.1系统硬件架构

针对基于TI DM6446架构的运动目标检测,平台采用合众达SEED - DVS6446开发模块。其丰富的系统资源适用于智能视频分析系统,有效缩短了开发周期。SEED - DVS6446系统硬件 模块主要 包括: DM6446系统以及电路; CCD视频采集模块; LCD视频显示模块; ATA硬盘存储模块,用于存储图像、视频等信息; 电源模块; JTAG主要用于系统调试以及DSP算法开发; RJ45网口用于以太网开发。系统结构图如图1所示。

1.2系统软件平台配置

实验系统是包含ARM核与DSP核的双核处理器平台,DSP端运行视频检测算法,ARM端运行操作系统负责任务 调度和控 制。操作系统 采用SEED DVS6446中的Montion Vista Linux,而PC端还需要安装一个Linux系统主机作为与ARM端进行交互的平台, 进而可以进行后续的文件挂载、编译和烧写的操作。 系统中Linux主机Fedora 14安装在Windows上的虚拟机中,Linux主机与ARM交互需要通过DM6446评估板上的串口连接Linux虚拟机。Windows主机主要用作通过串口连接评估板的控制台,是Linux的载体, 连接好后再将网线连接公网,因为要实现远程调用及NFS网络文件系统调试,所以必须要通过网络IP地址来实现。系统连接图如图2所示。

在Linux平台环境的配置中,重要的是NFS网络服务配置,系统使用NFS服务使主机Linux上的Montion Vista Linux系统映射到DM6446上,使其自身在无文件系统的情况下执行各种任务。配置网络文件系统服务,需要修改/etc /exports文件,在/etc /exports文件中增加以下内容/opt/nfs * ( rw,sync,no_root_squash, no_all_squsah) 。

运行以下命令启动NFS服务: [root@ liujl/]#/user / sbin / exportfs - a [root@ liujl /]# / sbin / service nfs restart

2运动目标检测

2.1运动目标检测算法

随着运动目标检测技术的不断发展,运动目标检测所采用的方法[2]也不断增加。针对固定场景中运动目标检测较为常用的方法有光流法、背景差分法、帧间差分法、高斯混合模型码本模型[3]及VIBE算法等。

帧间差分法[4]能有效检测出简单场景下运动目标,算法简单、程序设计复杂度低,能够适应各种动态环境,稳定性好。缺点是当运动目标存在大量颜色一致的区域时,会导致检测前景目标存在大量孔洞,只能检测到物体的边缘。VIBE算法[5]运行速度快,并能快速抑制阴影及照相机晃动对前景检测造成的影响[6]。 具有较好的前景检测性能,但在背景干扰及噪声干扰影响下,VIBE算法检测稳定性大幅降低。

鉴于帧间差分法和VIBE算法各自的优缺点,本文设计出了由帧间差分法和VIBE算法相结合的运动物体检测方法,采用VIBE算法来检测运动物体,用帧间差分法处理监控场景下的背景突变。该方法主要针对室内、静态背景下运动物体的检测。

2.2图像预处理

在图像的采集及传输过程中,通常会受到随机信号的干扰,在图像上叠加一些噪音,形成图像噪声,为保证检测算法的准确性及稳定性,并且降低后续处理的计算量,视频处理第一步将对图像做预处理[7]。本设计综合考虑算法复杂度、可移植性、去噪效果等条件,使用中值滤波进行图像去噪处理。中值滤波通常利用某种固定结构的二位滑动模板来进行图像的预处理,将模板内包含的像素点按照其像素值进行大小排列,形成一个单调的二维数据序列,而噪声像素点由于很难被选上而大幅减小了对输出的影响。

2.3背景模型构建与前景检测

VIBE算法是由比利时列日大学首次提出的一种目标检测算法,针对VIBE算法的特点,本文利用VIBE算法来实现初始背景模型构建和前景检测[8]。VIBE算法为场景中每个像素p( x) 建立一个包含N个样本模型。

如图3所示,黑色实心点p1,p2,…,pN表示像素点Pt( x) 的N个背景模型,空心圆点Pt( x) 表示当前位置x的待分类像素点。定义一个球体区域S ( Pt( x) ) 来表示像素点Pt( x) 所允许的差异度范围。根据图像中待分类像素与模型M( x) 相似度来检测其前景,若不相似,则分类为前景,否则为背景。

背景模型的构建实际上就是式( 1) 中VIBE模型的构建。视频序列第一帧开始,从第一帧图像中随机N次选取当前像素领域中像素点的灰度值,存放到模型M( x) 中,从第一帧就完成了对模型的构建和初始化,第二帧就进行前景目标检测。

VIBE算法前景检测: 根据在前景目标区域定位的灰度模型M( x) 获得前景目标区域矩形框,由VIBE算法,当有运动目标进入时,模型M( x) 可迅速检测出前景区域。对前景区域进行形态学处理,使前景区域趋向完整,然后找出前景区域轮廓线,得到最大外接矩形框。矩形框里面的图像就是要检测出的运动目标。前景检测的算法流程图如图4所示。

2.4背景更新

当监控场景中出现异常物体运动或光线变化的干扰造成当前像素点的设计背景值无效时,使用连续帧间差分法,利用图像序列中相邻的两帧或多帧之间差异来处理背景突变。其基本原理为: 采集两帧实时图像,若两帧图像相位位置的像素点的值的差分不大于系统为该像素点维护阈值[9]。即满足条件

则对应计数值D( x,y) 增加1,否则D( x,y) = 0。当D( x,y) 增加到设定值N时,系统将实时像素值作为估计背景像素值。式( 2) 中E( x,y,k) 和E( x,y,k - 1) 分别是第k帧和第k - 1帧的亮度分量,T为阈值。在背景模型建立时,用输入的第一帧初始化背景图像。算法流程图如图5所示。

3实验结果

本文主要针对室内场景下见识系统进行研究,所以将来实验室作为本文的试验场所,系统算法在Linux集成开发环境下进行开发,并将算法移植到系统设计的硬件平台上进行脱机运行。系统处理速度为10帧/ s,达到满足实时性要求,在实验室环境下对运动目标进行检测结果如图6所示。该实验表明在复杂的背景下该系统依然能准确地提取背景,检测出运动物体,且检测画面能在显示器上流畅地显示。

4结束语

本文采用TI公司的TMS320DM6446作为系统图像处理器,在该硬件平台上采用由帧间差分法和VIBE算法相结合的运动目标检测算法,帧间差分法负责背景突变,VIBE算法运用于检测运动目标。实验结果表明,在室内场景背景下,系统在满足实时性情况下能够克服光线变化等因素的干扰,准确地检测出运动目标, 能够在显示屏上输出流畅的检测画面,现场试验取得了良好的效果。但系统也存在占用较大内存的缺点, 在运动目标提取方面还需要进一步优化。

摘要:针对运动目标在视频序列检测时易受各种因素干扰的问题,采用TI公司的TMS320DM6446作为系统图像处理器,提出了一种基于帧间差分法和VIBE算法相结合的运动物体检测方法,并在DM6446硬件平台上实现。实验表明,在室内场景背景下,系统在满足实时性情况下能够克服光线变化等因素的干扰,准确地检测出运动目标,现场试验取得了良好的效果。

ViBe 篇5

关键词:3D-TOF序列,VIBE序列,三叉神经痛,SNR,CNR

TN是原发性三叉神经痛的简称, 是由单条或多条责任血管压迫三叉神经的根部引起的, 也是较常见的脑神经痛, 其临床症状主要表现为分布区内短暂性反复发作性的刀割样或灼烧样剧痛[1]。三叉神经痛的诊断是根据具有高分辨率的神经及血管结构来显示的。目前, 磁共振血管断层的主要成像是3D-TOF序列, 但无法显示责任静脉以及小于责任静脉血管直径的神经和血管的间隙[2]。该研究将3D-TOF序列与VIBE序列联合起来进行三叉神经痛的诊断, 可为充分发挥核磁共振的高分辨率, 清楚显示三叉神经与责任血管之间的空间关系, 为脑外科进行三叉神经痛的减压治疗提供治疗依据, 现报道如下。

1资料与方法

1.1一般资料

2012年1月—2014年10月在该院方便收集96例确诊为三叉神经痛的患者, 其中男性60例, 女性36例, 年龄为25~73岁, 病程最长6年, 最短3个月, 平均 (45.5±4.0) 个月, 所有患者均以单侧头面部剧痛、牙痛及舌头麻木、咬齿困难等来院就诊, 且经常规MRI排除颅内占位肿瘤等能够引起相同症状的其他病变。96例患者中, 右侧发生病变的患者84例, 左侧发生病变的患者12例。所有患者的临床资料均经患者同意, 且经过伦理委员会的批准。

1.2使用仪器与方法

该研究使用德国西门子超导型Siemens Verio 3.0T型磁共振扫描仪进行常规的头颅MRI平扫后, 进行3D-TOF序列及VIBE序列的大、小体素模式扫描。其中, 以三叉神经为中心, 并以1.5 cm的扫描范围进行均行轴位小体素模式扫描, 以384×384为矩阵, 0.5 mm×0.5 mm×0.5 mm为成像体素;以大脑后动脉、基底动脉及小脑上动脉为上缘, 以椎动脉与基底动脉的汇合处为下缘进行大体素模式扫描, 以256×256为矩阵, 以0.1 mm×0.1 mm×0.1 mm为成像体素, 并将部分傅里叶技术关闭。

1.3图像的处理和分析

扫描所得的多方位、多角度的重组图像, 由2名经验丰富的长期从事核磁共振成像诊断的医师进行双盲法诊断, 判断三叉神经及相应责任血管的数目, 并对各扫描三叉神经的脑干段周围的血管包括分支血管的平均数目进行比较。在横断面的图像中选取脑干段层面设置面积为2.5 mm2的ROI, 并进行3次脑干段及背景噪声的强度的测量, 对脑干段的信噪比 (SNR) 及脑干段-周围脑脊液的对比噪声比 (CNR) 进行计算, 取3次测量的平均值。

2结果

2.1一般情况

96例经3D-TOF序列及VIBE序列扫描所得的图像均能对三叉神经及对应的血管形态、走向做出较满意的判断, 并直观地呈现了原始图像中难以明确判断的血管的走向及血管压迫与患者症状的关系。在96例患者中, 24例患者接受了手术治疗, 其中12例患者的责任血管位于右侧小脑的上动脉, 9例患者位于小脑前的下动脉, 3例患者位于右侧的小脑的上动脉桥静脉及前下动脉, 压迫三叉神经;三叉神经经3D-TOF序列及VIBE序列结果与三叉神经的血管压迫及患者的关系, 如表1所示, 其中, 三叉神经存在血管压迫或接触90例, 与周围血管无压迫或接触6例, 阳性率为94%, 见表1。

2.2脑干段周围血管数

采用3D-TOF序列扫描显示血管的数目少于VIBE序列扫描显示的数目, 大体素3D-TOF序列显示的血管数目最少, 小体素VIBE序列显示的数目最多。

2.3信噪比与对比噪声比

大小体素的3D-TOF序列影像与VIBE序列影像的信噪比与对比噪声比的差异具有统计学意义, VIBE序列高于3D-TOF序列。其中, 大体素VIBE序列显示的图像的信噪比与对比噪声比最高, 显示的脑干段的效果最好, 小体素次之。

3讨论

3D-TOF成像序列是核磁共振扫描成像序列中常用的观察动脉责任血管的成像序列, 其原理是采用三维稳态的快速成像序列进行责任静脉的观察[3];3D-TOF序列成像法是应用抑制静态的组织来突显出血流速度较快的动脉血管, 静态的脑干段由反复的脉冲波导致内部信号衰减, 从而成像[4]。一般情况下, 医疗工作者会采用增大成像序列的体素或者增加激励次数的方法来提高扫描中的信噪比和对比噪声比[5], 但增大成像序列的体素会降低图像的分辨率, 不能将核磁共振高分辨率的优势充分发挥出来[6];后一种方法则会明显增加图像采集的时间, 增加患者在扫描期间由于不自主运动导致的伪影的发生率[7]。在其他成像序列中, 一般具有脑脊液的信号高而三叉神经和周围的血管的信号低, 从而无法对神经及血管的接触或压迫进行区分[8]。

VIBE序列是应用K-空间内插的方法, 可以明显提高成像的分辨率[9], 该序列能够更好地进行软组织的对比, 更清晰地显示静态的脑神经的状况[10], 也能显示相对细小的、血流速度缓慢的趋向于静态的动脉、静脉血管, 显示的脑干段周围的血管数目高于3D-TOF序列, 拥有更好的软组织对比及高分辨率。由以上结果可知, 3D-TOF序列及VIBE序列直观地呈现了原始图像中难以明确判断的血管的走向及血管压迫与患者症状的关系, 96例患者中, 24例患者进行了手术治疗, 其中, 12例患者的责任血管位于右侧小脑的上动脉, 9例患者位于小脑前的下动脉, 3例患者位于右侧的小脑的上动脉桥静脉及前下动脉, 且三叉神经存在血管压迫或接触90例, 与周围血管无压迫或接触6例, 阳性率为94%, 同时, 经3D-TOF序列扫描显示血管的数目少于VIBE序列扫描显示的数目, VIBE序列高于3D-TOF序列, 以上结果与张礼荣等[11]在关于血管压迫性三叉神经痛责任血管的3.0T MRI研究一文中的结果相一致, 具有临床意义。

目前普遍的研究认为导致核磁共振的扫描假阴性的原因主要有3D-TOF序列不能显示血流速度较慢的动、静脉[12];由于血管边缘的血流速度较慢、信号较弱, 测量的背景噪声使信号模糊, 测量的血管直径小于实际的直径[13]。导致其假阳性的原因有三叉神经根与面神经和听神经相邻的小血管绕行, 血管袢的间隙较小, 对三叉神经造成压迫[14]。

应用VIBE序列中大体素扫描速度较快, 成像的信噪比及对比噪声比虽然较小体素模式的扫描高, 小体素模式的高空间分辨率高于大体素模式, 且具有三维的高空间分辨率, 能充分反映神经与血管的空间关系[15]。结合3D-TOF序列和VIBE序列, 既充分发挥加速大范围的成像的3D-TOF序列的优势, 迅速准确地分辨出责任动脉, 克服小体素VIBE成像缓慢的缺点;又能吸取VIBE序列的显示细小的血流速度缓慢的责任动脉和静脉。明确显示三叉神经与相关责任血管的关系, 明显降低核磁共振诊断三叉神经痛的假阳性率和假阴性率, 为脑外科诊断及微血管的减压技术提供科学的依据。

【ViBe】推荐阅读:

上一篇:固化反应下一篇:医药总费用

本站热搜

    相关推荐