特征值滤波器

2024-10-25

特征值滤波器(精选7篇)

特征值滤波器 篇1

在计算机视觉领域,目标跟踪一直是其中的重要研究课题之一。目标跟踪是各种高层视频图像处理的基础,如目标分析、三维重建、视频图像压缩编码、行为识别等[1]。现有的目标跟踪的主要方法包括:基于区域的跟踪、基于特征的跟踪、基于轮廓线的跟踪、基于模型的跟踪、基于运动场估计的跟踪以及混合方式的跟踪等方法[2]。

卡尔曼滤波是基于线性、高斯假设的,这对于目标跟踪要求太过严格。现实中的系统往往是非线性的,这使得卡尔曼滤波的适用范围受到严格的限制。近年来,粒子滤波(PF)[3,4]算法被认为是目前解决非线性、非高斯模型最成功的方法。粒子滤波算法是一种基于蒙特卡洛(MC)技术来求解贝叶斯概率的使用算法,它的基本思想是通过重要性函数产生带权值的样本(粒子)来逼近系统状态的真实后验概率分布。在本文中提出了融合[5]颜色特征[6]和运动边缘特征[7]的粒子滤波算法进行目标跟踪。使用颜色特征信息来实现目标跟踪快捷且容易实现,但在跟踪过程中由于目标所处的位置、光照等易发生变化,这会影响跟踪效果。另一方面,运动边缘特征信息可以很好地适应各种光照、背景变化的情况。两种特征融合可以弥补双方的不足,同时也能提高目标跟踪算法的有效性。这些效果在实验结果分析中都能得到很好的说明。

1粒子滤波基本原理

1993年由Gordon和Salmond[8]提出了一种新的基于序贯蒙特卡洛(SIS)方法的Bootstrap非线性滤波方法奠定了粒子滤波的算法基础。所谓粒子滤波就是指通过寻找一组在状态空间中传播的随机样本(粒子){xti, i=1,…,N},对概率密度函数p(xt|z1:t)进行近似,以样本均值代替积分计算,从而获得状态的最小方差估计的过程。粒子滤波主要有预测和更新两个阶段:

p(xt|z1:t-1)=∫p(xt|xt-1)p(xt-1|z1:t-1)dxt-1 (1)

p(xt|z1:t)=p(zt|xt)p(xt|z1:t-1)p(zt|z1:t-1)(2)

其中,p(xt|xt-1)由目标状态转移模型定义;p(zt|xt)由观测模型定义;p(xt-1|z1:t-1)为t-1时刻的后验概率密度;p(zt|z1:t-1)为归一化常数,即p(zt|z1:t-1)=∫p(zt|xt)p(xt|z1:t-1)dxtt时刻的后验概率密度p(xt|z1:t)是滤波问题的最终解。

但是在上述的计算过程中,需要通过计算积分来求解概率密度的分布,而一般的目标跟踪问题都是高维的、非线性、非高斯的问题,所以求解这类问题非常困难。因此,粒子滤波中采用了序贯蒙特卡洛方法来解决积分计算复杂的问题。它从一个被称为重要性概率密度的建议分布q(x1:t|z1:k)中进行采样从而得到状态集或者粒子集{xti, i=1,…,N}(N为粒子数目),和粒子对应的权重{wti, i=1,…,N}。因此更新方程(2)可以改变为:

p(xt|z1:t)i=1Νw˜tiδ(xt-xti)(3)

式(3)中,w˜ti=wti/i=1Νwti为归一化粒子权重,δ是Dirac-delta函数。粒子权重wti的递推公式为:

wtip(zt|xti)p(xti|xt-1i)p(xt-1i|z1:t-1)q(xti|xt-1i,z1:t)q(xt-1i|z1:t-1)=wt-1ip(zt|xti)p(xti|xt-1i)q(xti|xt-1i,z1:t)(4)

在取得提议函数的最优时的权值更新如下:

wti=wt-1ip(zt|xt-1i)(5)

N→∞时估计式(3)的值无限趋近于p(xt|z1:t)的真实值,进而得到t时刻目标状态的估计值。

2特征融合与目标跟踪

2.1目标颜色特征

颜色特征能简单地描述一幅图像中颜色的全局分布,有效地提高目标跟踪的鲁棒性。由于选定的目标跟踪区域一般为矩形,其中距离目标跟踪区域边界处必然包含了很多非可靠的像素信息。本文中采用基于RGB颜色空间模型的核加权颜色直方图对目标进行建模。其中,核函数的基本思想是:通过核函数根据像素点距离目标中心的距离远近对它们赋予不同的权值。给距离目标中心点比较远的部分像素点赋予比较小的权值,从而来减弱跟踪目标模块边界及遮挡等问题的干扰。本文高斯核函数,其定义如下:

Κ(r)=exp{-r2/(2σ2)}(6)

式(6)中r表示像素点与目标中心之间的距离,参数σ控制核函数的作用半径,实验中σ=1。

对于选定的目标区域内的各像素点{xi, i=1,…,M},其中M为目标区域内像素点的总数。设m为量化阶数,且定义颜色量化函数b(xi):R2→{1, 2,…, m,m=32},则第i个像素点颜色粒子所对应区域的核加权颜色特征直方图p(x)={pu(x)}u=1,2,…,m可定义为[9]:

pu(x)=Ai=1Μk(x-xih2)δ(b(xi)-u) (7)

式(7)中A为归一化因子,用来保证u=1mpu(x)=1,即A=1i=1Μk(x-xih2);M为目标区域内像素点总数,实验中M=400;k(·)为高斯核函数式(6);x为目标区域中心像素点;xi为目标区域中的某一像素点;h表示目标区域的大小,大小为202,‖x-xi‖2表示像素点xi与目标区域中心像素点x之间的距离;δ是Dirac-delta 函数。

对于候选区域所对应的核加权颜色直方图也可采用上述同样的计算方法,记为q(x)={qu(x)}u=1,2,…,m。Bhattacharyya系数是建立两概率分布相似性度量的有效工具。则对于目标区域p(x)={pu(x)}u=1,2,…,m与候选区域q(x)={qu(x)}u=1,2,…,m两个核加权颜色直方图,它们之间相似性可用Bhattacharyya系数来衡量,可定义为:

ρ[p(x),q(x)]=u=1mpu(x)qu(x)(8)

d[p(x),q(x)]=1-ρ[p(x),q(x)](9)

式(9)中ρ值越大代表目标区域与候选区域之间的相似性越高,当ρ=1时,即两个区域直方图完全相似。由此得出基于颜色特征的观测值的概率密度函数为:

pcolor(zt|xt,colori)=12πσexp{-(d[p,q])22σ2}(10)

实验中σ=0.25。

2.2目标运动边缘特征

为了适应目标光照变化及背景中相似颜色的干扰等,仅仅使用颜色特征达不到理想的跟踪效果,因此本文中引入了运动边缘特征。它利用相邻两帧图像之间的目标区域运动特征,生成差分图像进行梯度求解得到运动边缘图像信息,从而在复杂背景下使目标跟踪达到更好地效果。

假设视频中两帧连续的图像分别记为RtRt+1,对两帧图像进行差分处理可得到差分图像Dt为:

Dt=|Rt+1-Rt|(11)

对差分图像Dt进行梯度求解,则可得到该时刻t的图像运动边缘信息Et,即:

Et=Dt=[DtxDty]Τ(12)

式(12)中,DtxDty分别为跟踪区域中心点在x方向和y方向的速度值。由此可得边缘信息Et的方向角θ

θ=arctan(Dtx/Dty)(13)

式(3)中,θ的取值范围为0~2π。对方向角θ进行量化,分成n等份θi=[θΔθ](i=1,2,,n,n=16),其中Δθ=π/8。结合直方图公式Pt(θ)(x,y)=∑δ(θ-θi)统计落入各个角度区间的像素梯度幅度值,并对其进行归一化处理可得到目标区域的运动边缘方向直方图Pt(x,y),Pt(x,y)=[Pt(θ)(x,y)]θ=1,2,…,n,其中(x,y)为目标区域的中心点坐标。运用同样的计算方法,可得候选区域的运动边缘方向直方图Ft(x,y)。则该目标区域的运动特征定义如下:

Qt=xyFt(x,y)/xyΡt(x,y)(14)

当某一候选区域Qt值越接近于1时,说明候选区域与目标区域的相似度更高。利用Qt值得出基于运动边缘特征的观测值的概率密度函数为:

pmotion(zt|xt,motioni)=12πσexp(-d22σ2)(15)

式(15)中d=|1-Qt|,实验中σ=0.25。

2.3目标特征融合与跟踪实现

本文结合颜色特征和运动边缘特征的优点,通过将两种特征融合从而达到更好地跟踪效果,即得到一个关于多个观测值的融合概率密度函数。这里假设颜色特征和运动边缘特征两个观测过程是相互独立的,则定义融合后的概率密度函数为:

p(zt|xti)=w1pcolor(zt|xt,colori)+

w2pmotion(zt|xt,motioni) (16)

式(16)中w1,w2分别为自适应的归一化权值,即i=12wi=1wi的取值和跟踪过程中t时刻区域特征与目标的相似度有关。本文中利用t时刻目标区域与候选区域之间的Bhattacharyya距离d[p(x),q(x)]和根据运动边缘特征信息得到的相似度距离d中的两个最小值di,m来定义w˜i的值,即定义w˜i=1/di,m2,再对w˜i进行归一化得到wi,即wi=w˜iw˜1+w˜2。 最后可根据权值更新公式(5)对每一个粒子的权值进行更新:wti=wt-1ip(zt|xt-1i),进行归一化处理得到粒子权值w˜ti=wti/i=1Νwti

基于多特征融合的改进粒子滤波目标跟踪算法具体步骤见如表1的算法。

3实验结果分析

实验平台为P4 2.66 G的CPU,内存1.5 G的PC机上使用Matlab R2007a仿真实现。为了验证本文算法的有效性,分别对两组视频进行测试。两段视频中待跟踪目标区域都需在视频图像序列第一帧中手动标定。

视频一是对直升机降落的视频中的直升机进行跟踪,视频图像大小为320×240,视频总帧数为860帧,采样粒子数为500。视频中直升机背景逐渐有蓝色的天空转变为绿色的树丛,并且直升机的颜色与树丛颜色比较近似。基于本文算法跟踪的结果如图1所示。具体的误差数据分析见图2,实线为本文所提算法的实现数据,虚线为基于自适应颜色特征的粒子滤波算法[10]所实现的数据。本文中将误差数据分为x方向和y方向,其中目标真实位置在x,y方向的值为手动标定。在视频跟踪图像中我们选取200帧、330帧、363帧等作为显示跟踪结果,其中,在开始阶段,如第200帧时背景都为蓝天,从330帧开始有短暂的视频背景相似干扰,在第363帧时直升机目标被完全遮挡,以及当从580帧开始视频背景开始完全有蓝天变为绿色树丛。在这些情况下,结合图2中跟踪误差数据分析,我们可以看出从600帧左右开始基于自适应颜色特征的粒子滤波算法[10]出现了目标丢失的情况,但是本文中提出的算法都能较好地跟踪目标,不会发生目标丢失的情况。在这段视频中说明了本文中的算法融合目标的颜色特征信息和运动边缘信息能够很好地克服跟踪目标背景相似干扰的情况,表现出了较强的鲁棒性。

视频二是采用CAVIAR项目组[11]提供的标准视频序列“ThreePastShop2cor.mpg”进行测试,该视频采集于视频图像大小为384×288,帧速率为25帧/秒,从视频序列的第370帧开始截取其中的500帧视频序列做跟踪实验,采样粒子数为500。实验跟踪结果如图3所示。

在实验中第459帧附近跟踪目标第一次被短暂遮挡,因为遮挡人物穿着红色外套,背景区分比较明显,只有人物的黑色背包会造成一定干扰。当穿过第一个遮挡任务后跟踪效果即为第476帧,紧接着跟踪目标穿过第二个遮挡人物,这时在第492帧时跟踪目标被完全遮挡,而且由于遮挡人物同样穿着黑色外套,和跟踪目标比较接近,造成了跟踪目标中心的扰动,但在穿过遮挡人物后,正如第602帧跟踪效果显示的跟踪目标中心会自适应地调节到原来的跟踪中心。在视频截取的最后阶段第818帧时,有路过的行人对跟踪目标再一次的遮挡,实验效果如第847帧所示。

与基于自适应颜色特征的粒子滤波算法[10]跟踪效果对比的具体误差数据分析见图4,本文中将误差数据分为x方向和y方向,其中目标真实位置在x,y方向的值为手动标定。

4结论

本文给出了一种基于多特征融合的改进粒子滤波目标跟踪算法。该算法融合了物体的颜色特征信息和运动边缘特征信息,可以有效地解决视频目标跟踪过程中背景相似干扰以及运动目标遮挡问题。相比单一的基于自适应颜色特征的粒子滤波跟踪算法,本文中提出的算法更能有效地提高目标跟踪过程的稳定性与精确性。

参考文献

[1] Wang X G,Kinh T.Grimson W E L.Correspondence-free activityanalysis and scene modeling in multiple camera views.IEEE Transac-tion on Pattern Analysis and Machine Intelligence,2010;32(1):56—71

[2] Yilmaz A,Javed O,Shah M.Object tracking:a survey.ACM Com-puting Surveys,2006;38(4):1—45

[3] Arulampalam M S,Maskell S,Gordon N,et al.A tutorial on particlefilters for online nonlinear/non-Gaussian Bayesian tracking.IEEETransactions on Signal Processing,2002;50(2):174—188

[4] Hu W M,Tan T N,Wang L.A survey on visual surveillance of ob-ject motion and beha-viors.IEEE Transactions on System,Man andCybernetics,2004;34(3):334—352

[5]王永忠,梁彦,赵春晖,等.基于多特征自适应融合的核跟踪方法.自动化学报,2008;34(4):393—399

[6] Intill S S,Bobick A F.Visual tracking using closed-worlds.Int ConfComputer Vision,1995:672—678

[7] Li P.,Chaumette F.Image cues fusion for object tracking based onparticle filter.Intl Conf Articulated Motion and Deformable Objects-(AMDO),2004:99—107

[8] Gordon N,Salmond D,Smith A.Novel approach to non-linear andnon-Gaussian Bayesian state estimation.Proceedings of Institute Elec-tric Engineering,1993;140(2):107—113

[9] Comaniciu D,Ramesh V,Meer P.Kernel-based object tracking.IEEE Trans on Pattern Analysis and Machine intelligence,2003;25(5):564—575

[10] Katja N,Esther K M,Luc V G.An adaptive color-based particlefilter.Image and Visio-n Computing,2003;21(1):99—110

[11] CAVIAR Test Case Scenarios.http://homepages.inf.ed.ac.uk/rbf/CAVIAR/[2011—09—26]

有源高通滤波器的设计 篇2

关键词 GIC SC滤波器 高通滤波器

中图分类号:TN713 文献标识码:A

1 有源高通滤波器的特性

高通滤波器是一个使高频率比较容易通过而阻止低频率通过的系统,它去掉了信号中不必要的低频成分。在电力系统中,谐波补偿时用高通滤波器滤除某次及其以上的各次谐波。由于在基本的电路元件中电感是最不理想的,体积大,价格昂贵,不适合IC型式的大规模生产。文中介绍了频率限制在兆赫兹以下范围用运算放大器取代电感来设计高通滤波器的方法,并介绍了用级联设计方法和直接综合法实现高阶有源高通滤波器。

2 级联的方法设计高通滤波器

一阶和二阶滤波器是构建高阶滤波器的基本模块,一阶滤波器有反相和同相两种结构,二阶滤波器有Sallen-Key和多路反馈两种结构。

设计举例:设计一个三阶贝塞尔高通滤波器,要求滤波器的转折频率fc=1KHz。

设计思路是首先查表取出三阶贝塞尔滤波器的系数,然后计算每级滤波器的参数。先选定电容值,然后计算出电阻值。设定C1=C2= C3=100nF,第一级用一个一阶同相高通滤波器,R1=4.2k€%R;第二级用一个二阶Sallen-Key高通滤波器,R4=6.36 k€%R,R5=3.34 k€%R。图1是设计的滤波器仿真电路。

3 梯形模仿设计高通滤波器

从模块化设计的角度来说,要求级联滤波器的各部分相互独立。从灵敏度方面考虑,可以以无源RLC梯形原型作为出发点,用模仿模块来替代电感使滤波器变成有源结构。

举例设计,设计一个椭圆高通滤波器,fc=300Hz,Amax=0.1dB,Amin=40dB。

首先画出要设计的高通滤波器对应的高通全极点梯形电路,然后用通用阻抗转换器(GIC) 来模仿电感,并综合出与频率有关的电阻值,就可以来实现不同响应的高通滤波器。图2是最终设计的电路。

4 通用SC滤波器综合成高阶高通滤波器

LMF100CIWM通用SC滤波器是由两个双积分环路模块组成,在每一模块中都配置了一个独立的运放,借助外部电阻能独立的配置成低通、带通、高通、带阻和全通响应,具有可编程性。通过级联多个双积分器环路节可以实现高阶滤波器。

举例设计:采用两个LMF100CIWM,设计一个fc=500Hz,高频增益为0dB的八阶1.0dB切比雪夫高通滤波器。

设计过程,令fck=100fc=50KHz。查表取出各级参数,令LMF100CIWM的节A为低Q级,节B为高Q级,要避免各滤波器级的电路进入饱和,按Q值由低到高的顺序将它们级联以使滤波器动态特性最大。图3是设计的电路图,图中各电阻值都已经舍入到标准值的1%范围内。

5 结论

本文介绍了高通滤波器的特性,以及用三种方法通过举例设计贝塞尔、椭圆、切比雪夫三种响应的有源高阶高通滤波器,设计方法简单、直观。

参考文献

[1] R.Schaumann,M.S.Ghausi,and K.R.Laker.Design of Analog Filters;Passive,Active RC,and Switched Capacitor.Prentice-Hall,Englewood Cliffs,NJ,1990.

[2] Arther B Williams.ELECTRONIC FILTER DESIGN HANDBOOK[M].北京.电子工业出版社,2004.

[3] 祁国权.RLC串联电路谐振特性的Multisim仿真[J].电子设计工程,2012(1).

[4] 高立,陈书远.通用阻抗变化器在有源滤波器中的应用[J].电子元件应用,2007(10).

特征值滤波器 篇3

自然场景图像中的文本检测与定位对于基于文字内容的图像分析具有重要的作用。在任何地方,以任何形式出现的文字都具有某种强烈的目的性,它能帮助人们更好地识别和理解目标物体及场景。开展对这个方向的研究不仅对人工智能的发展具有理论意义,更重要的是它具有潜在的巨大商业应用价值,因此,工业界和学术界都十分重视这方面的研究。尤其是从上个世纪九十年代以来,每两年举行一次的国际文本文档分析与识别会议(ICDAR)极大的促进了场景图像文字检测与识别技术的发展。通过举行会议及开办场景文字定位与识别竞赛,学者们在这方面发表了很多的文章,做出了很大的贡献。这项会议仍在持续开展中,下一届会议即ICDAR2013国际会议将于2013年8月在美国华盛顿举行。

自然场景图像中的文本与其他类型文本不同,它不仅受到多种环境因素(如光照不均、背景复杂、阴影、反射等)的影响,同时文字本身属性也复杂多变(如文字的大小、颜色、方向、字体等不统一,不均匀)。因此,迄今为止,还没有任何一种方法能够快速、准确地检测所有图像背景下的文字。现有的检测方法虽然很多,但准确率和实时性都远远达不到商业应用的要求。尽管如此,学者们还是取得了不少成绩,为我们进一步研究提供了借鉴与思路。

总的来说,对于自然场景文字的检测与提取,目前的方法多种多样。有基于边缘检测的方法,如文献等[1]提出了一种基于边缘的双脉冲神经网络(PCNN)的算法来定位图像文字,首先利用最大颜色熵的通道检测边缘,然后用PCNN模型来分割图像,最后精炼并定位文字区域。文献[2]用边缘特征和数学形态学的方法提取场景文本串。该算法能根据笔画宽度将文本串分成不同的子图,实验结果表现良好。有基于特征聚类、机器学习等的方法,例如文献[3]提出了一种基于多核学习的文本定位方法。先通过连通域分析和提取图像纹理特征找到候选区,然后用经过训练的多核学习机进一步筛选出文本区域。也有基于纹理分析的方法,如文献[4]运用多尺度、多方向的Gabor滤波提取图像纹理特征,然后建立神经网络学习文字纹理,从而提取文字区域,达到了很高的检测精度,但是该方法对于背景纹理复杂的图像文字检测效果仍不理想。

通过对近些年的文献研究总结,我们发现综合运用多种技术与方法已成为解决这一难题的趋势。特征提取是模式识别系统最为关键的步骤之一,系统的性能在很大程度上取决于我们提取的特征是否具有足够描述性、区别力及稳定性,充分利用图像的自然特征(如颜色、亮度、边缘、纹理等)与统计特征(如均值、方差、能量、频谱、直方图等),就可以很好地提取目标信息,检测出文字区域。因此,我们提出了一种基于Gabor滤波与边缘特征相结合的方法来检测并提取场景图像中的文字。首先利用Gabor滤波获得图像的纹理特征,并通过均值、能量特征去除部分噪声区域,结合图像的边缘特征获得文本候选区;然后经形态学处理进一步去噪并形成文本块;最后经过投影运算定位文字区域,再通过特殊的二值化处理取得文字结果。实验表明本文方法能够适应各种场景下的文字检测,且准确度大幅提高。

1 特征提取

1.1 基于Gabor滤波的特征提取

Gabor滤波是最强大的纹理分析工具之一。经过Gabor变换可以达到时频局部化的目的:即它能够在整体上提供信号的全部信息,而又能提供在任意局部时间内信号变化剧烈程度的信息。换言之,它可以同时提供时域和频域局部化的信息,实现了人们对信号真正意义上的时间-频率分析。通过Gabor滤波得到的特征图像,压缩了背景像素,减少了噪声干扰,从而提高了后期处理的时间效率,在纹理特征提取中具有重要的作用。

1.1.1 Gabor变换基础

经典的Fourier分析方法是分析和处理平稳信号的最常用也是最主要的方法。Fourier变换建立了信号从时域到频域变换的桥梁,其逆变换则建立了信号从频域到时域的变换桥梁,时域和频域分析构成了观察信号的两种方式。然而,Fourier变换只能在整体上将信号分解为不同的频率分量,缺乏时间局域性信息,即它不能告诉我们某种频率分量发生在哪些时间内。为了解决这一难题,实现时频联合分析,人们在20世纪40年代开始研究时频分析方法,于是,Gabor变换应运而生,1946年,Dennis Gabor在其论文中最早提出了Gabor变换的基本理论[5]。经过几十年的研究和发展,Gabor滤波技术已经日渐成熟,被广泛应用到纹理分割、特征提取、目标物体识别等方面。

典型的2-D Gabor函数是由一个二维高斯核,通过一个复杂的正弦波调制而来,表达式为[6]:

g(x,y)=12πσxσyexp[-12(x2σx2+y2σy2)]exp(j2πWx) (1)

对应的Fourier变换为:

G(u,v)=exp{-12[(u-W)2σu2+v2σv2]} (2)

其中:W是正弦波的调制频率;σxσy分别代表了高斯核偏移xy轴的宽度,它们决定了Gabor滤波器的带宽;而σu=12πσxσv=12πσy。Gabor基函数形成了一个完整但不正交的函数集,使得滤波图像含有大量冗余信息,为此,学者们经过旋转和尺度变换得到了新的Gabor滤波函数,下面将具体介绍其形成与离散Gabor滤波特征提取。

1.1.2 Gabor滤波特征提取

g(x,y)按照式(3)进行旋转与尺度变换得到新的滤波传递函数[6]:

其中:x′=a-m(xcosθ+ysinθ),y′=a-m(-xsinθ+ycosθ),而a-m是尺度因子,θ=nπΚ代表了方向参数,K为多分辨率方向数。具体的参数计算可参考文献[6,7]。得到滤波传递函数后,可通过离散卷积运算计算一幅图像的Gabor滤波。设I(x,y)为给定的原图像,则有:

Gmn(x,y)=pqΙ(x-p,y-q)gmn(p,q) (4)

其中p,q代表了滤波掩膜的大小,其值由高斯核偏移xy轴的宽度,即σxσy决定;Gmn(x,y)为滤波后的图像。

按照上述理论,我们编程实现了滤波器功能。算法的处理过程如下:

1) 首先将输入图像转化为灰度图像,并检测数据矩阵是否为双精度型,若不是,则需转化为双精度型;

2) 根据给定的高斯核沿xy轴偏移量大小,以及滤波角度和频率等参数构造高斯滤波器;

3) 分别用高斯滤波器的实部和虚部对1)中的图像数据矩阵进行二维卷积运算;

4) 取3)中卷积运算结果的幅值响应作为Gabor滤波输出,并将输出数据矩阵转化为灰度图像。

其中核心算法的代码如表1所示。

由于自然场景文字背景复杂多变,对于滤波参数的选择显得十分重要。经过大量实验,发现滤波器参数取:尺度因子为a-m=1,滤波方向θ=π3,高斯核沿xy轴偏移分别为2和4,滤波频率为W=16时,提取到的纹理特征效果最好。表2列举了其中两组参数的对比实验,图1(c)和(d)展示了两组参数下经Gabor滤波后的图像结果。

由图1(c)与(d)对比可知,前者很好的保留了文字纹理特征,但是同时也引入了大量噪声信息;而后者虽然减少了噪声信息,但是文字区域信息也同时被削弱了。综合考虑,我们选择了1组的参数,因为这样虽然增加了噪声,但可以根据后面的边缘特征融合来去除它们,从而保证了文字信息不丢失。

1.2 边缘特征提取

边缘是图像最基本的特征信息之一,它反映的是图像中灰度或结构的不连续性,在图像分析中起着重要的作用。经过对文献进行总结统计,我们发现超过百分之九十的文章都直接或间接采用了边缘检测的手段。同时我们也做了一系列的场景文字检测预处理实验,发现基于边缘的方法是最稳定且最可靠的。这是因为存在文字的地方总是会存在边缘效应,即使文字与背景对比度极低,也能通过边缘检测得到文字边缘。本文采用了经典的边缘检测算子Sobel算子来对灰度图像进行小邻域的处理,获得文字边缘。这是因为Sobel算子能够最大限度的去除背景噪声,同时又不丢失任何的文字边缘。

本文的边缘检测是直接利用Matlab图像处理工具箱中的边缘检测函数,不需要任何复杂的预处理和改进即可达到需要的效果。其处理步骤是:

1) 首先将原始图像转化为灰度图像;

2) 然后直接利用边缘检测函数e=edge(I, 'sobel')对灰度图像处理得到边缘特征。

该算法不仅简单有效,同时节约了处理时间。图1(b)显示了边缘检测结果。

2 特征融合

经过特征提取处理,我们得到了两幅包含文字信息的特征图像,接下来就是要将上述两种特征图像进行有效的融合,使得两种技术取长补短,相互印证,以便更好地利用特征信息,从而提高检测精度。所谓的图像融合[8],就是将来自不同源、不同时间、不同模式的图像数据和信息按照一定的准则,综合为一个全面的高质量的图像,以提高图像信息的利用率、改善计算机的对图像描述精度和可靠性,方便人们进一步认识和处理图像。图像融合由低到高分为三个层次:数据级融合、特征级融合、决策级融合。融合过程常结合图像的亮度、纹理、平均值、标准差、熵值等特征信息,以消除可能存在的信息冗余和矛盾,增强对图像目标更清晰、完整、准确的信息描述。

具体融合算法描述如下:

1) 首先对特征图像进行滤波去噪,因为原始图像经过不同的处理得到了带有不同噪声的特征图像,为了减少噪声干扰,避免更多的噪声带入融合结果,应首先对其进行去噪。由特征图像可知文字区域的密度较为一致,且纹理属于较亮的高频区,因此我们用M×N的滑动窗口W来对图像进行滤波,并采用灰度均值和方差来控制特征输出,它们的定义分别如下:

Emean(i,j)=1ΜΝ(i,j)W|G(i,j)| (5)

Evariance(i,j)=1ΜΝ(i,j)W|G(i,j)-Emean(i,j)|2 (6)

其中灰度均值应大于某阈值,否则认为是噪声,将其置0,方差也应在一定范围内,过大的方差被认为是独立噪声点,过小的方差认为是噪声区域,都应该被舍弃。

2) 然后采用平均值法进行融合。平均值法的主要思想就是:令I1(x,y),I2(x,y)和I(x,y)分别为两幅待融合的特征图像和融合以后的图像在点(x,y)处的像素值,则融合后各点的像素值可按式(7)来确定。

Ι(x,y)={0if(Ι1(x,y)+Ι2(x,y)/2<11Οthers(7)

由于特征图像都是采用二值图像,即图像中前景的像素都是1,而背景则为0。按照式(7)的算法,如果两幅特征图像中对应点像素都为1,则认为该点为文本像素区。否则将其置0,即认为该点为背景噪声,应去除。经过这样的处理,除去了单幅特征图像中存在的噪声,同时使得文本区域更清楚、完整,可靠性也大大提高了。其中平均值法融合的核心算法可参考表3中的代码。

3 文本区域定位与提取

在经过特征图像融合后,我们得到了一幅包含少量噪声和文字区域的二值图像,下一步的任务就是要对文本区域进行定位和提取。本文采用以下三个步骤来定位并提取结果:

1) 首先,我们对融合特征图像进行形态学运算,以去除那些明显不是文字的噪声点与曲线并形成文本块。数学形态学运算的基本思想是利用一定形态的结构元素来度量和提取图像中的对应形状和结构。它是一种非线性的信号处理与分析工具,可将图像信号与其几何形状联系起来,以达到提取信号、抑制噪声的目的。它最基本的运算是腐蚀、膨胀,以及由它们组合而成的开启、闭合运算。形态学运算最重要的就是结构元素大小的选择,因为过大的结构元素会将文字信息一起腐蚀掉,而过小的结构元素又无法去除噪声区域。经过实验,本文选择了3×3的结构元素对图像进行腐蚀运算,以去除噪声点和曲线;然后进行7×7的膨胀运算,以将文字区域连接成块。

2) 然后,我们将得到的文本块分别进行x轴与y轴的投影运算PxPy,并用rectangle函数对文本区域进行标记。其中:

Ρx=yΙ(x,y)Ρy=xΙ(x,y) (8)

PxPy代表了图像沿x轴与y轴的灰度累积值,表示了该方向总的明暗变化程度,可以用来定位文字区域。记录x轴与y轴灰度累积值最先不为0的点的坐标(x0,y0)及文本块的宽度(w)与高度(h),并用rectangle函数在原始图像中标记文本块以形成矩形框,这样我们就得到了最终的文字定位结果,如图2(a)所示。其中投影法文本区域定位的核心算法如表4所示。

3) 最后,我们将原始图像中的文本定位区域进行一种特殊的二值化处理获得最终的文本输出结果,即将原始图像中矩形框以外的区域预先全部置0,这样便得到了一副具有单一背景的文字区域,然后利用普通的二值化函数进行处理,即可得到最终的文字提取结果。如图2(b)所示。

4 实验结果与分析

本文所有算法均在Matlab 2009a环境下编程实现。为了验证本文算法的有效性,我们从ICDAR2003数据库里选取了300幅不同环境下的场景图像进行实验测试。这些图像包含了各种标志牌、海报、广告语、商标等场景文本,图像的尺寸从640×480像素到1600×1200像素大小不等。这些场景文本包含了不同背景、字体、大小、颜色、光照等各种情况,具有充分的代表性。图3列举了部分比较理想的实验结果。

由图可知,本文算法对各种字体大小、方位,及复杂背景下的文字都实现了很好的提取,证明了算法能够很好地处理各种环境下的场景文字提取。但是,同时我们也发现一些错误的检测,如图3第一幅图像中的文字本身具有的边框,还有第四幅图像中夹在文字中间的标示牌指示。

另外本文算法对石刻文字,光照过强,阴影严重的图像文字检测效果也较差,往往会产生检测遗漏,定位不准等问题。尤其是当图像中存在较多的花草树木、门窗、栏杆等类笔划干扰时,算法会存在较多的错误检测,造成不能定位真正的文字区域。由于版面所限,并未列举。

为了比较和综合评价算法的可靠性,我们使用了目前比较通用的准确率(Precision)和召回率(Recall)来综合评价实验结果。设C为正确检测出的文本区域数,D为本文算法检测到的文本区域数,G为实际存在的文本区域数,则准确率与召回率由式(9)决定:

precision=CDrecall=CG (9)

经过测试统计,本文实验结果的准确率为0.79,召回率为0.86。表5比较了本文与部分ICDAR2011场景文本定位比赛[9]结果。由于每一个研究者所选取的样本测试集不一样,难易程度也不尽相同,因此,算法的可比性不强,无法做到真正公平、准确评价谁的方法更好。但是,通过对比仍然能够在一定程度上说明问题。

从表中可以看出:本文的方法比ICDAR2011场景文本定位竞赛的第一名的方法在准确率上仅低了三个百分点,比其他人的准确率都高很多;在召回率方面我们的方法远远高于其他人的算法,这说明算法的鲁棒性很好。通过以上对比,充分证明了本文算法的可靠性与有效性。

5 结 语

文章介绍了一种基于Gabor滤波结合边缘特征的场景文字检测方法。有效的利用了图像的纹理特征与边缘信息来获得特征图像,通过特征图像融合技术得到可靠的文本候选区域,并进一步处理得到文字输出。实验证明了本文方法的可靠性与准确度。但是由于场景文字背景复杂,干扰较多,需要在滤波参数的优化和自适应选择上进行改进。今后我们将改进算法,并引进新的技术以获得更好的效果。

参考文献

[1]Xin Z,Fuchun S.Pulse Coupled Neural Network Edge-Based Algo-rithm for Image Text Locating[J].Tsinghua Science&Technology,2011,1(16):22-30.

[2]Yuming W,Naoki Tanaka.Text String Extraction from Scene ImageBased on Edge Feature and Morphology[C]//IEEE,The Eighth IAPRWorkshop on Document Analysis Systems,2008:323-328.

[3]Shen L,Yanyun Q,Xiaofeng D,et al.Text detection in images basedon Multiple Kernel Learning[C]//IEEE International Conference onICMLC,2011:1538-1543.

[4]Jianqiang Y,Dacheng T,Chunna T,et al.Chinese Text Detection andLocation for Images in Multimedia Messaging Service[C]//IEEE nter-national Conference on Systems Man and Cybernetics(SMC),2010:3896-3901.

[5]陶亮,顾娟娟.实值Gabor变换理论及应用[M].合肥:安徽科学技术出版社,2005:1.

[6]申丽然,尹清波.Study on Affine Invariant Methods in Image Process-ing[M].哈尔滨:哈尔滨工程大学出版社,2009:53.

[7]Manjunath B S,Ma W Y.Texture Features for Browsing and Retrievalof image Data[J].IEEE.Trans on PAMI,1996,18(8):837-842.

[8]张兆礼,赵春晖,梅晓丹.现代图像处理技术及Matlab实现[M].北京:人民邮电出版社,2001:311.

基于DSP的有源电力滤波器设计 篇4

关键词:有源电力滤波器 谐波检测 DSP

中图分类号:TN713 文献标识码:A 文章编号:1674-098X(2015)08(a)-0146-03

随着我国电力电子技术的快速发展,电机、电弧炉、荧光灯、轨道交通设备等各种电力电子装置的应用越来越广泛,导致供电设施和用电设备运行状况恶化,功率因数降低,损耗增加,电能浪费。为了避免谐波的危害,保证较高的供电质量,行之有效的方案就是采用无源电力滤波器和有源电力滤波器对电力系统进行补偿。但由于传统的LC滤波器本身的缺陷,以及有源电力滤波技术的优势和快速发展,使得有源电力滤波器在谐波抑制中的作用越来越明显。与传统LC滤波器相比,APF具有如下优点:动态补偿、响应速度快以及平衡负载等。因此有源电力滤波器能够获得更好的滤波效果,为此该文设计了一种以TMS320F2812 DSP为控制核心的有源电力滤波器装置对电网中的谐波进行动态补偿。

1 系统原理及硬件结构设计

有源电力滤波器的基本原理如图1所示,其基本原理是:首先利用电流互感器检测出电网中的谐波电流,然后根据得到的谐波分量发出PWM信号给IGBT,实时调整IGBT的导通与关断,主电路受驱动电路控制产生与负载中的谐波一致的谐波,对负载产生的谐波进行补偿,从而通过电网电流的谐波分量与补偿电流之间的相互抵消来达到净化电网、节省电能的目的。

本系统主要由控制系统模块和主电路模块组成。

1.1 控制系统模块

控制系统是有源电力滤波器的核心部分,它直接决定了有源电力滤波器的补偿性能的好坏。为了满足有源电力滤波器控制系统实时性和准确性的要求,该文采用了DSP+FPGA为核心的数字化控制系统。该控制系统硬件电路主要由数据采集模块、核心控制模块、通信模块、驱动模块以及保护电路模块等辅助电路组成。该系统的电路框图如图2所示。

数字采集模块的作用是采集电网中的电压、电流等模拟信号。为了提高采样精度,该系统并未采用TMS320F2812内部集成的12位ADC,而是使用了TI公司的ADS8555芯片进行采样。该芯片包含一个6通道、16位逐次逼近型模数转换器,每个通道都包含一个能够完成同步高速多通道采样的采样保持电路。在信号转换中,各个通道是相互独立的,各个通道的转换结果的状态互不影响。6个通道的转换受片内时序控制器控制,每个通道的采样保持放大电路的输出从1至6通道依次进行转换,当所有通道全部转换完成后,系统将产生一个中断信号,对RD引脚依次施加读脉冲信号,以读出内部数据。

核心控制系统模块,主要由一片高性能DSP芯片TMS320F2812和一片FPGA芯片EP3C10E144I8以及相关外围电路组成。其作用是将数据采集模块输出的电压、电流等模拟信号转换为可被计算机处理的数字信号,然后通过一定的控制算法得到补偿电流,接着生成IGBT驱动信号对主电路进行控制。并且其还要根据不同的故障状态产生不同的保护动作,协调系统内部的逻辑、扩展IO接口、简化外围电路等功能。

电流检测电路主要负责利用霍尔传感器对APF输出的补偿电流、负载电流转换到控制系统采样的范围。检测元件采用LEM公司生产的HAX 600-S电流霍尔传感器和LV25-1000电压霍尔传感器,把电网电压及线路电流变成弱电信号,通过调理电路输入ADS8555转换芯片。

隔离驱动模块的作用是将核心控制模块产生的光脉冲信号转换为电脉冲信号,同时经过功放处理后,最终输出PWM信号,实现对逆变主电路IGBT的驱动控制。

硬件保护电路,为了保证有源电力滤波器装置可靠稳定的运行,该装置需要有完善的保护系统。当其发生驱动板过压或欠压、驱动板超温、待补偿负载电流波动太大、IGBT短路等故障时,相应的检测电路检测到故障信号,经过处理后发出报警信号,进而控制有源电力滤波器停止工作,达到其保护作用。

1.2 主电路模块

主电路采用三相电压源型逆变器结构,逆变器输出端经滤波电感与电网连接。如图3所示,其中L1-L3为滤波电感,HAT1-HAT3为霍尔电流传感器,C1-C6为突波电容,C7-C12为直流母线电容,Rz为均压电阻,PT为霍尔电压传感器;由于直流侧电容的电容量较大,当直接合闸充电时,有可能烧坏IGBT开关管等器件,因此要通过并联限流电阻来抑制启动电流,实现对直流侧电容电压的缓慢充电。当直流母线电压达到设定的750V时,核心控制模块发出控制信号,将限流电阻支路短接,使系统进入正常运行状态。

2 软件设计

系统软件主要流程图如图4所示。系统软件主要由主程序和中断子程序组成。中断子程序又包括电流检测、PWM驱动控制、电网频率检测、数据采集等。

3 实验结果

完成系统的设计、搭建后,如图5所示,为对某公司进行谐波治理前后所获得的测试数据。在变压器低压400V母线负载侧并联安装有源电力滤波器,就地补偿光伏逆变器在运行过程中产生的谐波。从图5中可以看出,补偿前电网电流含有大量的谐波成分,经过APF补偿后,电网电流中的大部分谐波被抵消或减少,避免了负载大量的谐波电流注入到电网中,造成对电网电流的污染。

4 结论

该文以TMS320F2812 DSP为核心,搭建了有源电力滤波器系统的硬件结构,并编写了相应的软件程序,完成了谐波电流检测测试和补偿测试。并研究了并联型有源电力滤波系统对供电系统谐波抑制的效果。结果表明本装置具有良好的谐波抑制和无功补偿性能,可以实现谐波污染抑制功能。当前,该有源电力滤波器装置已在一些低压配电系统中投入运行,并取得了良好的运行效果。

参考文献

[1]苏奎峰,吕强.TMS320F2812原理与开发[M].北京:电子工业出版社,2005.

[2]曲学基,曲敬铠.电力电子滤波技术及其应用[M].北京:电子工业出版社,2008.

[3]罗安.电网谐波治理和无功补偿技术及装备[M].北京:中国电力出版社,2006.

[4]杨君,王兆安,邱关源.并联型电力有源滤波器直流侧电压的控制[J].电力电子技术,1996(4):48-50.

特征值滤波器 篇5

行人跟踪技术是现代计算机捕捉运动目标技术的一种,其根据捕捉目标的方法和对象的不同,主要包括轮廓跟踪技术、特征跟踪技术、区域跟踪技术以及模型跟踪技术。其中以特征跟踪技术发展较快,并且应用比较广泛,融合梯度直方图(HOG)技术主要就是将特征跟踪技术和加权颜色的直方图特征跟踪技术相融合,利用粒子滤波的方法对行人形态和特征基于捕捉。这一技术的应用范围比较广泛,除了被应用在交通安全上以外,还能够被用于运动员动作捕捉、监控录像等多个方面。

1 融合梯度直方图技术的概述

融合梯度直方图技术,简称HOG技术,是在2005年时由法国计算机研究者提出的一种能够有效解决对人体目标进行捕捉的一种技术。该技术主要利用梯度方向直方图的特征来对人体进行表达,并且提取人体的外形信息和运动信息,形成一类具有丰富数据量的特征集。这一技术能够有效提取人体的特征,并且能够抑制在提取过程中行人形象产生的形变,避免对计算机的判断造成影响。并且利用加权的颜色直方图特征,降低了人体背景颜色所形成的干扰。同时该技术还加入了颜色分块扩展相似度技术,解决了人体被背景或其它景物混合遮挡的问题,提高了行人跟踪技术的效率。其具体算法如图1所示:

2 基于 HOG 和颜色特征的粒子滤波行人跟踪算法的概述

2.1 融合梯度直方图(HOG)特征提取

在融合梯度直方图技术下,其能够有效避免所捕捉的图像的几何或光学形变带来的影响,并且能够对行人的微小动作变化进行转却的判断。在融合梯度直方图技术在使用的过程中,其首先将图像分为各个小的单元,统计其中每一个单元的梯度直方图,然后根据其各个单元的大小来判断整个图像的大小,最后利用统计直方图将其进行归一化,利用串联的方法形成了具有融合梯度直方图特征的各类数据。在该技术下收集的各类图像中每一个像素点的梯度利用以下方程式进行表达:

在上述方程式中, px? x, y?、py? x, y?、f ? x,y?分别代表各像素点的水平和垂直方向上的梯度值和像素值。其中的每一个像素值的梯度模型的大小和方向的具体公式如下所示:

2.2 颜色特征的提取

一般情况下,在实际环境当中对人物形象进行捕捉时,其中的人物形象很可能会被部分景物所遮挡,或者发生旋转及形变的可能,这些情况都对行人跟踪系统的计算和分析造成了一定的影响。但是利用颜色直方图就能够有效地对这类情况进行适应,并且计算方法也比较简便。根据相关研究表明,在RGB空间内进行行人跟踪系统的测试很容易受到光线强弱的影响,容易发生行人目标跟踪丢失的情况,因此大多数实验中均采用的是HSV空间,这一空间模型技术能够将行人的图像分散成为多个不同的子区域,对于每一个区域内的像素点进行加权颜色处理,这样就能够保证对目标区域内跟踪对象的高程度加权检测,而对于目标周围区域则能够保证其低程度的加权处理,进而能够有效获得跟踪目标的准确像素分布,通过对该区域内各加权的颜色特征向量进行统计,就能够得出相应的颜色特征直方图,其具体的计算公式如下所示:

在上述公式当中, r表示的是各像素点与跟踪目标的中心的有效距离,其具体的计算公式如下:

在上述公式当中, x所表示的就是行人中心的有效位置,而c??cx,cy?则表示的是该跟踪目标确定区域内的有效半径,? 是作为Kronec kerdelta的函数值, n代表的是在该跟踪目标区域内具有的像素点的总和, b是每一个像素点对应的颜色直方图的条柱。

2.3 基于融合梯度直方图(HOG)和颜色特征的粒子滤波技术

粒子滤波技术主要被应用在非线性以及非高斯性的行人运动形态的计算过程中,根据计算过程所处时间的不同,将其分为预测和更新两个主要阶段。其中预测阶段主要是利用系统当中对于跟踪目标捕捉后行为的预判断能力对其进行计算,其具体公式如下所示:

而更新阶段主要是对通过摄像头所捕捉的人体图像具有新动作或改变了之前作出的动作状态下,系统根据新的动作图像,给予原始图像相关的修正,使计算结果能够保证与当前捕捉图像保持一致性,其具体公式如下所示:

在上述公式当中, N代表的是捕捉图像中的滤波粒子总数,而ikw代表的则是第i个粒子的权值大小,其权值在更新后主要以以下公式来进行表示:

在上述公式当中,所代表的是捕捉图像的特征观测值。在相关的研究当中可以看出,根据跟踪目标行人颜色、HOG的特征、候选区域的巴氏距离,就能够得到基于融合梯度直方图和颜色特征的观测值进而能够对滤波粒子的权重性进行判断,就能够对捕捉的人体图像的新行为和动作数据进行相应的更新。对更新前后的两个直方图的模型相似度的距离进行计算,其具体公式如下所示:

在上述公式当中, p代表的是捕捉的跟踪目标之前的动作模型,而q则是代表捕捉的跟踪目标新的动作模型,这样就能够对两个直方图的相似性进行计算,得出具体的滤波粒子的准确观测值,其具体公式如下所示:

在上述公式当中,表示的是缩放因子。利用这些公式能够对基于融合梯度直方图和颜色特征的观测值的观测值进行有效计算,其具体公式如下所示:

在上述公式当中,α,β 均代表的是可调控的参数系数,并且这两个系数的和恒定为1,其中的则分别代表的是颜色特征的观测值和融合梯度直方图特征的观测值。

2.4 遮挡检测

在基于融合梯度直方图和颜色特征粒子滤波行人跟踪技术的应用过程当中,在对跟踪目标进行捕捉时,有可能会出现目标遭周围景物遮挡的情况,而此时以跟踪目标的中心垂直方向进行划分,则能够得出两个呈左右对称的跟踪窗口和扩展窗口。假设在k时刻,系统捕捉的行人目标发生了遮挡的情况,则k-1时刻的扩展窗口就会与k时刻的跟踪窗口的直方图相似度差异较大,而k-1时刻的跟踪窗口与k时刻的跟踪窗口之间相似度差异较小,可以对其进行计算分析,其具体公式如下所示:

在上述公式当中, p1, p2 分别代表的是k时刻和k-1时刻时的相似度,而trck(x,k) 则代表跟踪窗口, ext(x,k) 则代表扩展窗口,其中x=(1,2)则分别代表左右两个对称的窗口,而k则代表的是某一个时间段的图像。

假设在计算的过程中,p1 >p 2,则说明在k时刻时捕捉的跟踪目标发生了泽当的情况,此时不进行特征的更新,对目标进行继续跟踪,当目标的遮挡状态结束后,再对其进行准确的跟踪。这样做就能够有效避免在对目标进行跟踪的过程中因遮挡造成的计算失误,避免了跟踪对象的丢失,也保证了整体计算的稳定性。

3 结语

随着现代计算机技术的不断进步,现代监控摄像人体跟踪捕捉系统的技术也在不断的发展。在传统的颜色特征粒子滤波技术下,对于目标的跟踪方法较为单一,仅能够对目标身上的颜色特征进行跟踪,当目标颜色与周围景物相接近时,则可能会导致系统跟踪丢失情况的发生,导致整体效果的下降。而基于HOG技术和颜色特征的粒子滤波行人跟踪技术则可以有效解决因背景颜色影响、目标微动作改变影响、遮挡影响等多种影响因素所导致的跟踪效果下降的情况,进一步提升现代导航、监控以及摄像等技术的功能,为未来相关行业的发展提供卓越的贡献。

摘要:行人跟踪技术是一种现代摄像预警技术,其能够起到对行人位置和动作的判定,并及时通过报警系统给予使用者相应的提示,能够有效避免过多的交通事故的发生。本文即是针对基于HOG和颜色特征的粒子滤波行人跟踪算法进行研究,对算法理论和算法描述进行分析,并对算法当中的HOG特征、颜色特征以及融合二者的粒子滤波算法进行了分析,同时针对于行人遮挡的检测情况进行了探讨,以期能为相关工作提供参考。

关键词:HOG,颜色特征,粒子滤波,行人跟踪算法,研究

参考文献

[1]相入喜,李见为.多特征自适应融合的粒子滤波跟踪算法[J].计算机辅助设计与图形学学报.2012.

[2]胡闽,刘纯平,龚胜荣.等.融合目标特征和空间信息的粒子滤波跟踪[J].计算机工程与应用.2011.

[3]韩志远,徐汀荣,王铁成,陈兆华.一种基于HOG和颜色双重特征的粒子滤波跟踪方法[J].计算机应用与软件.2013.

[4]王亮,胡卫明,谭铁牛.人运动的视觉分析综述[J].计算机学报.2012.

特征值滤波器 篇6

多源图像融合技术是指通过一定手段,综合两幅或多幅来自不同信源的图像信息,以获得对同一场景更精确、可靠的描述,通过融合能够扩大系统的工作范围,并降低图像信息的模糊度[1]。

机载光电平台通过搭载可见光电视、红外、激光等多模传感器,可获得监视区域的全天候图像,是现代战争条件下无人机不可或缺的装备之一[2]。随着任务载荷向全天候、多光谱、多模式探测系统的发展,光电平台的图像处理技术正向智能化、多模融合方向发展[3]。美国的雷神公司和诺斯罗普·格鲁门公司分别研制了具有图像融合功能的光电吊舱,经过融合后的图像有利于操作人员及时发现并识别目标。国内也逐步开展了这方面的研究,文献[4]设计了一种高帧频图像融合光学测量吊舱,初步实现了图像配准和融合功能。近30多年来,国内外研究学者对图像融合技术进行了广泛研究,提出了大量有效的图像融合算法[5]。目前的图像融合算法主要为像素级融合方法,典型算法包括加权平均法、金字塔变换法和小波变换法等。此外,研究学者提出了多种多尺度几何分析方法,逐渐用于图像融合领域[6,7]。通过对图像进行分割,对分割区域采用不同的融合规则,设计基于区域的图像融合算法能够获得更好的融合效果[8,9]。

为提高机载光电平台的战场态势感知能力,提高融合后图像中目标的对比度,本文提出了一种基于分形特征和导引滤波的可见光与红外图像融合算法。该算法首先采用分形特征对红外图像进行增强,然后根据分割得到的目标分布图,基于导引滤波分别计算得到可见光与红外细节图像和近似图像的融合系数,进而得到融合图像。最后通过实验验证了提出算法的有效性。

1 基于多尺度分形特征的红外图像增强

依据分形几何理论,分形测度与尺度的关系可描述为

其中:ε表示尺度,ε=1,2,...; M(ε) 表示在尺度ε下的测度,N和d分别表示分形维数和拓扑维数,K为分形参数。对于二维灰度图像,在尺度ε下图像灰度的表面积测度A(x ,y,ε )描述为

当度量尺度分别为ε 1、ε2 时,由式(2)可得:

对于一个理想的分形,其分形维数N是与所有尺度无关的量,为一常数。假设在不同的度量尺度下,式(3)和式(4)中的N为常数,设ε 1=ε,ε2=ε-1,当度量尺度为ε时,其对应的D维面积K(x ,y,ε )为

为突出自然景物与人造目标的D维面积随尺度ε变化而表现出来的差异,定义一个随分形参数变化的度量函数,即与D维面积相关的多尺度分形特征(Multi-scale Fractal Feature Related with K, FMFFK表示)为[10]

其中:εmax∈N,εmax≥2,是实际计算分形参数时所取的最大尺度。通过设置合适的最大尺度,对原始红外图像中每个像素计算FMFFK特征值,得到多尺度分形特征图像,即增强后的红外图像。为取得满意的增强效果并满足实时处理需求,本文选取εmax= 3。

考虑到增强后图像中背景区域像素值大部分为0或接近0,而目标区域像素值相对较大,故选定分割阈值为T,对增强后图像Ie进行分割得到目标分布图Io,如式(7)所示。

同一场景下的可见光与红外图像如图1(a)和1(b)所示。当T为5时,增强后图像及目标分布图如图1(c)和图1(d)所示。从图中可以看出,对增强后图像进行分割得到的目标分布图中人、道路和房屋均被有效检测到,其它区域主要为自然景物,即背景区域。

2 基于导引滤波的可见光与红外图像融合算法

He等人[11]提出了一种导引滤波算法,当给定待滤波图像Pi 时,该算法假设在一个局部窗口内滤波输出结果Oi 为指导图像Ii 的线性变换,如式(8)所示。

其中:ω k为以像素k为中心的(2r+1)×(2r+1)窗口区域, e为正则化系数,滤波系数a k和bk 可根据式(9)利用线性回归算法求得,具体参见文献[11]。经过滤波后的图像具有指导图像中的像素分布特性,边缘特征保持效果好,同时该算法计算量小。

文献[12]提出了一种基于上述滤波算法的图像融合算法,实验结果表明提出的融合算法原理简单且融合效果好。由于红外图像中的目标指示特性强,而可见光图像中的背景细节丰富,因而本文基于导引滤波算法,分别以可见光和红外图像作为导引图像,利用获得的目标分布图设计可见光与红外图像的融合系数,算法流程图如图2所示。

首先对可见光与红外图像分别进行一层分解,得到近似图像和细节图像。分解方法同文献[12],先对原始图像进行平滑滤波得到近似图像,然后二者相减得到细节图像。采用的平滑滤波器为均值滤波器,窗口大小为25×25。

由于红外图像中目标指示特性明显,而可见光图像中包含了丰富的背景信息,因此在设计融合系数时,以可见光图像Iv作为指导图像对1-Io进行滤波,获得可见光图像的融合系数;以红外图像Ii作为指导图像对Io进行滤波,获得红外图像的融合系数。具体如式(10)~(13)所示。

其中:G(i, r, e)表示以r作为参考图像对图像i进行导引滤波,e为正则化参数。c va和cvd 分别为可见光近似图像和细节图像的融合系数,cia和cid 分别为红外近似图像和细节图像的融合系数。进行导引滤波时,对近似图像的融合系数采用较大的窗口,窗口大小为25×25,正则化参数ea 为0.3;对细节图像的融合系数采用较小的窗口,大小为7×7,正则化参数ed 为10-6。

融合后的近似图像I fa和细节图像Ifd 分别为

其中:I va和I vd为经过一层分解得到的可见光近似图像和细节图像,I ia和Iid 为经过一层分解得到的红外近似图像和细节图像。最终的融合图像If 为

3 实验结果分析

为验证本文提出算法的有效性,比较分析了文献[12]中的算法、加权平均法(Weighted Average algorithmWA)和静态小波变换(Stationary Wavelet Transform, SWT)融合法四种算法的性能。由于阈值T会影响分割后目标区域的连通性,为取得较好的融合效果,本文后续实验均设定T=5。采用图1(a)和1(b)作为待融合图像,上述四种算法的融合结果如图3所示。从图中可以看出,本文提出的算法有效地结合可见光图像的背景信息和红外图像的目标指示信息,融合后的图像更自然,目标对比度更强。

为客观评价融合算法的性能,采用互信息(Mutual Information, MI),熵(Entropy),空间频率(SpatialFrequency, SF) ,边缘保持度 (Edge Preserving Degree, EPD) 和结构相似度 (Structural Similarity IndexMeasurement, SSIM)五个指标[13,14],来比较上述四种融合算法的优劣,具体数值如表1所示。

从表1中可以看出,本文提出的算法熵和互信息取得了最大值,说明融合后的图像中信息量最丰富,且充分结合了源图像的信息。从空间频率角度看,本文提出算法的融合图像边缘强度最强,文献[12]算法与之接近,说明采用导引滤波方法能够提高融合后图像的对比度。加权平均融合方法由于起到了图像平滑滤波的作用,因而融合后图像边缘强度最低,但边缘保持度和结构相似度方面加权平均法均取得了最好的性能。

为验证本文算法的适用性,采用如图4所示的可见光与红外图像进行融合实验。该场景为校园场景,场景中目标为两个行人,此时目标在两类图像中极性相反(可见光图像中为暗目标,红外图像中为亮目标)。

当采用加权平均法和小波变换法进行融合时,由于对待融合图像或分解得到的近似图像进行加权平均,所以融合后图像的对比度会下降,如图5(c)和图5(d)所示。当采用导引滤波方法进行融合时,融合后图像可保留导引图像的像素分布结构。由于文献[12]采用拉普拉斯滤波器来构建像素分布权重图,而可见光图像纹理丰富,故采用该算法融合后图像主要利用了可见光图像的信息,目标显示为暗目标。本文提出的算法由于采用增强后红外图像的分割结果作为导引图像,故融合时保留了红外图像中的目标指示信息,如图5(a)所示,融合后图像中的两个行人为亮目标,与周围背景均具有较强的对比度。文献[12]算法得到的融合图像其中一个目标由于遮挡情况,目标对比度低。

从表2知,采用本文算法融合后图像的空间频率和熵指标比文献[12]算法略低,但均好于加权平均融合法和小波变换法。综合融合结果和性能指标可以得出,本文算法融合后图像中目标对比度最强,由于有效地结合了可见光与红外图像的信息,因而有利于后续的目标识别任务,应用于战场监视任务时,可形成比较清晰的战场态势。

4 结 论

特征值滤波器 篇7

摘 要:在大型的组装型企业中,由于工序间错综复杂关系及各工序节拍时间的差异,造成流水线部分工序出现产品堆积或待料现象,直接导致整个生产线效率下降。本文以滤波器生产厂组装车间为研究对象,研究滤波器组装流水线各工序间的平衡问题,利用6西格玛的DMAIC流程对各工序进行现状分析和改进,使得各工序节拍时间趋于最优,以提升整个产线生产效率。

关键词:精益生产;DMAIC;滤波器;节拍时间

1 概述

随着企业对高效率、高质量以及低成本要求的提高,传统的生产模式和理念已经难以适应企业的发展,精益生产作为一个全新的企业生产管理理念,近些年已引起越来越多的关注。面对一种新的生产模式与理念,很多企业往往以偏概全,不能从全局进行考虑和策划,很难获得预期效果。对于精益生产来说,不仅需要企业要有全局观念,更要能够找准突破口,通过以点带面的方式顺利推动精益生产的导入和实施。而对于企业实际生产来说,工序平衡的好坏将会直接影响生产线效率,因此,如何利用精益生产中各种工具改进和完善工序平衡,是推进精益生产必须要面对和解决的问题,对企业生产效率的提高起着至关重要的作用。

2 滤波器组装车间现状分析

以某企业滤波器组装车间为研究对象,在滤波器装配过程中,由于工序安排及人力配置问题,造成生产效率没有被完全释放,导致严重的资源隐形浪费。因此,需要对整个滤波器组装生产线各工序进行分析和研究,找出瓶颈及改善点。

按照现有的生产流程图分别计算每个工序的节拍时间,再分别计算出组装线各工序的标准产能。滤波器组装流程如图1所示,滤波器组装过程主要包括两个步骤:预制过程和组装过程。部分材料需通过预先制作和装配,然后作为原材料输入到最终组装线。因此,需要解决两个问题:其一是预制材料必须能够满足组装线的生产需要;其二是必须发现和消除总装线的瓶颈工序,以提高产能从而满足规定数量的成品产出。

滤波器总装线和预制线节拍及产能分别如表1和表2所示,从滤波器生产节拍时间分析来看,瓶頸工序是“BMA压块装配(g)”和“焊接(h)”,每台产品的节拍时间都是75秒,以及“谐振杆装配(c)”工序的节拍时间是60秒。因此,如果能够降低上述工序的节拍时间便可提升生产线的整体效率。目前,该滤波器生产线的每天实际单班产出(P)为420台左右,组装线人员数为21人,预制线工人人数为10人。按照现有的工序安排,不难计算出生产线人员效率为79.5%。具体计算如下:

P/min(a,i)=420/528=79.5%

其中,P为单班产出;,a和i分别代表每个工序的代号。

3 DMAIC改善流程

DMAIC是指定义Define、测量Measure、分析Analyze、改进Improve、控制Control五个阶段构成的过程改进方法,一般用于对现有流程的改进,包括制造过程、服务过程以及工作过程等。

定义(D),我们将滤波器组装流水线的效率提升作为此次改善的项目。测量(M),我们按照改善前的流程进行相关效率的统计和测算。分析(A),根据节拍时间和瓶颈工序统计分析,找出需要改进的工序和改善点。改进(I),根据分析后得出改进的项目,从而进行相应的改善。控制(C),对于改善的项目进行固化,确保改善的落实。

由统计的节拍时间,可以清晰地看到瓶颈工序为:焊接和BMA压块装配,节拍时间为75秒。按照其余工序的节拍时间分析,工人在作业时负荷不是很重。因此我们需要对这两个工序进行优化改进,以提升整个流水线的生产效率。然后,通过分析预制线的节拍时间,可以看出,预制线中各工序的节拍时间较少,因此正常情况下,不会导致装配线停料现象。

根据对工序实际操作情况分析和研究后发现,可以将焊接和清洁由一个工位完成,焊接完成之后直接进行清洁,然后此工位由4个人进行作业。并且可以将预制线“小压块放螺钉”工序合并到“BMA电缆固定”中,这样便可节约一个操作人员。然而“BMA电缆固定”工序的节拍时间增加至65秒,而下个工序“BMA压块装配”的节拍时间为75秒,因此可以将节省的操作人员安排到这两个工序中间,用于承担这两个工位的部分工作。最终确定“BMA电缆固定”工序的人员数为1.5人,“BMA压块装配”工序的人员数为1.5人。因此,最后可得到这两个工序的节拍时间分别为44秒和50秒。优化后的滤波器组装流程如图2所示,优化后的总装线生产节拍及产能如表3所示。不难看出,经过DMAIC对滤波器组装线流程进行改善和优化后,整个装配流水线标准产能从原来的520pcs提升至609pcs,在没有增加流水线操作人员的前提下,标准产能提升约14.6%。

4总结

本文以某公司滤波器生产厂组装车间为研究对象,针对公司滤波器组装线的现状和特点,以DMAIC为工具对滤波器整个生产流程进行分析和改进,发现滤波器装配线瓶颈工序,并通过工序合并以及操作人员的重新配置,消除了滤波器组装线的瓶颈工序,改善和平衡了各工序间的负荷,在没有增加操作人员的前提下,较大幅度提升了整个装配流水线的标准产能,有效地提高了企业的生产效率。

参考文献:

[1]刘树华.精益生产[M],机械工业出版社,2010.

[2]J.Liker.The Toyota way[M].Machinery Industry Press,2013.

[3]张根保.汽车制造企业精益生产系统模型[J].机械工程学报,2010,46(2):94-98.

[4]赵国强.精益生产下企业变革[J].管理与科技,2013:126-126.

[5]周武静.精益生产、运营绩效与财务绩效之间的关系[J].软科学,2011,25(12):115-117.

[6]张震,黄淇.浅析现代制造业企业管理的精益生产方式[J].中国科技纵横,2010(22):180-181.

基金项目:国家自然科学基金项目51005160以及江苏省高校自然科学研究项目13KJB460005。

上一篇:城市理念下一篇:放疗计划论文