背景复杂度

2024-05-15

背景复杂度(共8篇)

背景复杂度 篇1

基于图像处理的光电成像跟踪系统中, 所获取的图像中目标与背景特性随着时间均处于不断的变化之中。远距离时目标通常在视场中表现为一个弱小目标, 其成像灰度低、面积小, 与背景中的云层、杂波难以区分。当目标与成像设备距离较近或具有尾焰等情况下, 其成像灰度迅速增高、面积快速增大, 在天空背景中呈现为一个明亮的面状目标。目标与设备距离更近时, 经常会覆盖大部分甚至超出整个视场, 表现为一个扩展目标。已有的研究表明, 通过采用适应不同目标特性的提取算法, 利用多模式[1,2]的跟踪方法进行处理, 可以大幅提升系统的可靠性。但另一方面, 由于使用场景的不同, 所获取图像中的背景也经常发生变化, 成像跟踪系统经常面临地面、天空、海面等不同复杂程度的背景。而对于不同背景的复杂程度判定以及不同背景条件下自动的算法切换决策机制与方法却研究较少。因此, 为了提高成像跟踪系统的生存能力, 对背景复杂度的判定方法以及算法切换依据的研究显得尤为重要。

首先讨论了图像结构相似度理论, 然后提出了基于结构相似度的背景复杂度判决算法, 解决了利用方差等简单统计特征判断背景复杂度时所存在的无界性与不确定性问题, 提高了判决结果的可靠性。进一步分析了不同目标与背景情况下多种图像处理算法的适应性。采用仿真图像与实际图像进行处理的结果表明, 提出的方法适应能力强, 对背景的复杂度判定具有良好的单调性。最后, 在新一代多核DSP TMS320C6474数字信号处理器上实时实现了本文方法。

1 图像结构相似度

图像的结构相似度[3,4]由图像中三个主要分量所定义, 包括了图像的对比度分量、亮度分量以及结构分量。对于图像块a与图像块b之间的差异, 可以采用结构相似度进行衡量。其计算可以通过它们之间的对比度、亮度与结构信息获取如式 (1) —式 (3)

对比度差异

亮度差异

结构信息差异

式中μ表示相应的图像块的均值, σ表示相应图像块的标准差, σab则表示图像块a与图像块b之间的协方差。其中亮度的计算采用原始图像, 而由于梯度图像更能反映图像中的细节信息, 更接近于人眼的视觉特性, 因此, 对比度与结构信息的计算采用梯度图像进行计算更为合理。C1、C2、C3为相应的三个常数, 用于防止相应的差异值计算中分母为零。进一步, 图像块a与b之间的结构相似度可以定义为式 (4)

从而, 整个图像的结构相似度可以按照式 (5) 定义

式 (5) 其中N表示全图的分块数。从上分析可以看出, 通过对GSSIM计算公式的分析, 可知该值是界于0和1之间的, 可以衡量出两幅图像的差异大小, 差异越大, 则输出结果越小, 而差异越小, 则输出结果越接近于1。

2 基于结构相似度的背景复杂度

通常, 比较复杂的城市、地面、山体、海面、跑道等充满杂波的背景, 图像内边缘信息丰富, 在小范围局部区域内像素之间通常存在强烈的灰度突变, 灰度值一般具有较大的方差, 而对于较为均匀的天空背景, 该方差值通常较小。因此, 可以通过统计方差的大小来衡量图像背景的复杂程度。然而, 由于待处理图像位数随着系统需求不同, 通常从8 bit到16 bit不等, 给采用方差进行复杂程度的衡量带来了难以统一处理难度。另外, 计算得到的方差是一个无界的值, 这也给结果的衡量带来了困难。

通过对不同质量图像的研究可以发现, 清晰的图像较之模糊图像具有更为丰富的纹理细节信息, 这些丰富的细节信息即为图像中的高频分量。当成像不清晰时, 图像中纹理丰富的细节信息大幅降低。进一步, 当图像模糊到一定程度后, 图像中原来强烈的边缘特征都几乎不可见了, 原始清晰的图像与模糊图像差异达到最大。因此, 借助于结构相似度的思想, 通过分析原图与低通平滑滤波后图像之间的差异, 实现对原图中高频分量丰富程度的估计, 进而完成当前背景复杂程度的判定。由于计算得到的结构相似度是一个介于0~1之间的有界值, 因此, 有利于结果的比较。当原始图像与人为模糊后图像的结构相似度越小, 说明当前计算的区域中背景越复杂, 反之, 则越简单。利用该思想, 提出了如图1显示的背景复杂度计算的流程。

首先采用中值滤波法对图像进行预处理, 实现了保持图像细节信息的同时去除孤立噪声点的目的, 减小了坏点与高频孤立噪声点对后续处理的影响。进一步采用9×9均值滤波器对图像进行平滑, 实现用于差异比较的去除大量细节信息的模糊图像的构造。通过分别对中值滤波与低通平滑后图像进行Sobel梯度算子检测, 获取到两幅梯度图像。

其中, 使用的垂直与水平方向的Sobel边缘检测算子模板如式 (6) 所示

利用fh与fv分别与图像进行卷积, 分别得到水平与垂直边缘检测后的两幅图像Eh与Ev, 进一步可得梯度图如式 (7)

设E1 (x, y) 与E2 (x, y) 分别为由中值滤波后图像与低通平滑后图像计算得到的梯度图。由于正常跟踪过程中目标始终保持在图像的中心区域, 因此, 在计算背景复杂度时去掉了全图中间区域的计算, 以尽量减少目标对于背景复杂度计算的影响。对E1 (x, y) 中剩余的背景区域, 进行子块划分并统计每块的方差, 进行排序后选择排序靠前的2/3子块, 然后计算E2 (x, y) 中位置对应的子块与所获取的E1 (x, y) 中的子块的结构相似度, 最终按式 (8) 进行最后的基于结构相似度方法的背景复杂度计算。

背景复杂度定义如式 (8)

该值始终介于0~1之间, 当背景越复杂时, 该值越大, 反之, 该值越小。图2中计算最终结果为Df=0.976 12, 可以通过该结果按式 (9) 判定原图背景较为复杂。

为验证所提出的背景复杂度方法的适应性, 分别采用仿真图像 (a) 、 (b) 与实际图像 (c) 进行了计算。其中, 仿真图像的生成采用将仿真的目标叠加在不同复杂程度的真实背景中的方法。这些背景通过实际相机获取, 包括天空背景、地空背景、地面背景等。

表1显示了不同背景下复杂度的计算结果:

通过表1, 可以构建一个背景是否复杂的判决方式

式 (9) 中Dth为判定当前背景复杂与否的门限值, 现取值为0.3。

3 基于背景复杂度的智能跟踪器

跟踪的可靠性与正确性主要由图像处理算法本身的能力及该算法与背景的适应性所决定。不同背景条件下需要采用不同的图像处理算法, 以提高目标的提取质量, 减小背景杂波的干扰。由于序列图像中目标所处的背景会随着时间不断变化, 为了提高跟踪系统的适应能力, 常采用多模图像处理技术, 以实现不同背景与目标类型的最优处理, 表2显示了不同背景与目标情况下目标提取算法的适应性。

0:可能适合1:非常适合X:不适合

其中峰值法虽可以保留高对比度目标, 提高检测率, 但在复杂背景条件下, 大量高对比度背景杂波的干扰会导致虚警大量增多。边缘对比度检测算法更能适应较低对比度与亮度的目标, 但由于其也是基于分割的方法, 在复杂背景条件下, 背景中大量的强边缘也会带来虚警率过高的问题, 目标边缘与背景强边缘经常产生黏连, 进而导致常无法有效从复杂背景中将目标分离出来。差分算法可在一定程度上解决受分割影响的复杂背景下目标提取问题, 算法实时性高, 通过采用基于编码器配准的方法进行差分计算, 可以替代基于图像配准的差分法。背景的运动参数可以采用如式与的方式计算得到

式中, Ak、Ak-1分别为第k帧与第k-1帧编码器的方位角度值, 而Ek、Ek-1则分别为对应的高低角度值, Deltax, Deltay分别为水平与垂直方向上的像素当量。此外, 相关跟踪法采用模板匹配的方式进行目标检测, 该方法也比较适合复杂背景条件下的目标跟踪。

对跟踪算法的决策依据当前所跟踪的目标类型以及背景复杂度进行, 在背景简单的情况下, 选择以分割方法为主的对比度跟踪, 包括峰值法以及边缘法, 而在背景复杂情况下, 则采用适合于复杂背景的差分法与相关法进行跟踪。

表3显示了序列图像1, 2中随着目标运动, 在几个主要的背景变化帧中其计算得到的复杂度结果:

从表3的结果可以看到, 计算得到的背景复杂度值与实际图像中背景复杂程度一致。序列1中飞机起飞过程中背景从地面建筑物、山体逐渐过渡为天空背景, 计算得到的背景复杂度值逐渐从1附近迅速变化为接近于0, 跟踪算法依据背景复杂度进行了实时切换。序列2为一个实际飞机降落的序列场景, 背景由于从平滑的天空逐渐变化为地面建筑物背景, 复杂度值从接近于0逐渐过渡到接近1, 实时采用的算法也自动的从边缘法过渡为相关跟踪, 可以看出, 对序列中飞机的跟踪, 整个过程跟踪平稳可靠, 未发生由于复杂背景的影响而丢失目标的情况。

4 智能跟踪器实现

多核DSP TMS320C6474[5]实时数字信号处理器, 包含三个高性能C64x+TM实时处理核, 其中各C64x+TM内核拥有独立的L1 P和L1 D, 三核共享3MByte的L2存储器。各内核间地址空间相互透明, 利于并行处理。利用EDMA3.0交换架构, 各内核可以做到共享与外部的通信接口地址, 如Serial Rapid IO高速串行接口等。

图5显示了本文提出的基于背景复杂度计算的智能多算法跟踪器的算法分配结构, DSP核1与核2均各自分配了一种适应简单与复杂背景的算法, 但两个核同时运行的只能是简单或复杂背景算法, 背景复杂度的计算以及算法的决策由DSP核3完成, 表4显示了各DSP的最大处理时间, 结果显示, 所完成的智能跟踪器具有很强的实时性, 可以满足每秒100帧的处理要求, 其中处理图像大小为704×576 16位图像, 跟踪波门大小为256×256。

5 结论

结合成像目标自动跟踪系统的需要, 提出了一种基于结构相似度的自动背景复杂度判定方法, 以此为基础, 实现了满足不同目标与背景特性的自适应算法切换决策方法。并将跟踪算法合理的分配到多核DSP TMS320C6474处理器, 完成了基于背景复杂度的智能跟踪器的实时实现。通过仿真图像与实际外场测试表明, 本方法计算背景复杂度可靠, 达到了自适应算法切换的目的, 提高了跟踪系统的稳定性与可靠性。

参考文献

[1] 刘永昌, 王虎元.红外成像制导多模实时识别跟踪算法研究.红外技术, 2000, 22 (2) :23—26Liu Yongchang, Wang Huyuan.Identification tracking algorithm of real time multi mode infrared image guidance.Infrared Technology, 2000;22 (2) :23—26

[2] 赫志成, 朱明.智能目标检测与跟踪系统的设计与实现.光电工程, 2007;34 (1) :27—31Hao Zhi-cheng, Zhu Ming, Design and implementation of target intelligent detecting and tracking system.Opto-electronic Engineering, 2007;34 (1) :27—31

[3] Wang Z, Bovik A C, Sheikh H R, et al.Image quality assessment:From error visibility to structural similarity.IEEE Transactions on Image Processing, 2004;13 (4) :600—612

[4] 杨春玲, 旷开智, 陈冠豪, 等.基于梯度的结构相似度的图像质量评价方法.华南理工大学学报 (自然科学版) , 2006;33 (9) :22—25 Yang Chun-ling, Kuang Kaizhi, Chen Guanhao, et al.Gradient-based structural similarity for image quality assessment, Journal of South China University of Technology (Natural Science Edition) , 2006;33 (9) :22—25

[5] Instruments T.TMS320C6474 Multicore Digital Signal Processor.www.ti.com:Texas Instruments Incorporated, April 30, 2011

背景复杂度 篇2

改革外汇管理制度有助于转型升级

中国经济现在存在一个这样的现象:在采取了遏制房价的政策之后,一些大宗产品的价格出现暴涨。于是,是不是可以假定市场上的货币过多呢?如果是,那么这些货币怎么来的呢?而且在央行采取了紧缩货币政策的条件下,為什么市场的货币还是很多,且出现了发达地区货币需求旺盛,欠发达地区货币供需相对均衡?通过研究中国的贸易占款、M1和M2的动态发行量,款区域分布不均衡,东部发达地区的贸易占款占绝大部分,中西部地区的货币被央行采用发行央票的形式将过多的货币收回,而贸易占款由从事贸易进出口业务的企业控制,他们决定这部分货币怎么使用,所以央行难以将这部分由于贸易占款而导致的结合中国现行的货币管理制度分析,可以发现贸易占款数额巨大,而且这种贸易占大量货币收回,且收回这部分巨额贸易占款的成本很高,可能会远远超过央行的承受能力。这种贸易占款大量存在的问题,会给国民经济的发展带了不少负面影响,譬如容易诱发高通货膨胀,提高货币政策调控的成本等等。因此,必须从改变现在的外汇管理制度,实现人民币可自由兑换,解决人民币被低估的问题,在这个过程,虽然会牺牲掉一些企业,失业会在短期内增加,但是经过这样一场洗牌,才能实现经济的成功转型升级。(陆懋祖,[英国]南安普顿大学)

建立消费导向、环境友好、内向依赖型经济增长模式

全球金融危机、经济危机背景下世界各国,尤其是经济发达国家对中国出口产品和服务的需求明显萎缩,中国投资依赖、出口导向型经济受到严峻挑战;同时,中国资源环境约束下的经济增长遇瓶颈,投资拉动型经济不可持续。中国资源环境约束下的出口、投资拉动型增长模式迫切需要转变為内向消费导向為主型增长模式。為此,我们要探寻导致中国消费滞后的最主要原因,以理解中国目前消费占GDP比重过低的形成过程;探索中国目前的发展模式及增长路径,以理解如何促使中国经济能够成功跃入新的发展阶段——即实现以消费需求為主要支撑点的经济增长新模式;提出推动中国经济向消费导向型增长模式转变的系列政策,為政府制定扩大消费需求政策提供选择空间。

中国个人消费占GDP的比重仅為36%上下,在世界上所有主要经济体中排名最后,在20国集团中排名倒数第二(沙特阿拉伯倒数第一),仅為美国的一半,欧洲和日本的2/3,而亚洲各国的均值在50%上下。从近20多年来的发展变化看,中国消费占GDP的比重下降了近15个百分点,并在全球危机之后继续恶化。

中国消费不足的深层原因是多方面的,首先,现在消费比重过低是体制性问题。中国现在的所有制结构主要包括两大部分,即国家所有制经济和民营经济。根据有关统计数据,民营经济占GDP的比重已经超过50%,即超过国有经济所占比重。民营经济的迅速发展是中国经济快速增长的主要引擎之一,但是另一方面,也是中国国民收入分配中资本等要素所占份额过高、劳动所占份额过低的内在原因之一。根据相关分析,劳动所占份额中国与经济发达国家相比,比美国低36.6个百分数,比日本低20.2个百分数,比英国低15.7个百分数,比加拿大低7.6个百分数;与新兴国家相比,比俄罗斯低17个百分数,比西班牙16个低百分数,比韩国低14百分数,比巴西低13个百分数。劳动所占份额过低,是消费不足的深层原因之一。第二,消费不足涉及到中国经济发展模式的核心问题:中国的投资导向性、工业密集型的增长模式,以及对出口的依赖抑制了消费。第三,中等收入阶层正在逐渐形成,消费能力不断增强,但因為收入差距扩大,消费能力增长不均衡,导致消费需求增长乏力。第四,社会保障体系不完善,消费者面对不确定性,风险意识强化。第五,城市化进程中农民工的城市化融入,因為进城打工的农民工收入水平远远低于城镇居民的收入水平,以及其他一些不利于农民工进城打工的制度性安排,农民工的消费支出受到极大制约。

要缓解以上问题必须开展全面的改革,既包括制度性、体制性的变革,也包括结构性的变革,还包括涵盖制度性变革和结构性变革与一体的某些一体性变革。前者如分配、再分配制度的调整,后者如经济结构大幅度向服务业转型,一体性变更如实施金融体制改革以加快非工资性收入的增加,即提高投资性收入在家庭收入中的比重(现在占家庭总收入不到2%)。

不必担心经济转型、消费导向為主形成后经济的增长问题。根据有关研究,如果政策得当,从现在到2025年,当中国的消费占GDP的比重提高到50%上下时,GDP仍然会以9%上下的年复合增长率快速增长,到2025年增至85至90万亿元人民币。(臧旭恒,山东大学产业经济研究所)

中国经济结构调整的几个战略思考

中国经济结构主要存在七大问题:(1)经济增速过快,导致通货膨胀、就业、政府债务、国际收支等其他宏观经济指标失衡。(2)经济增长严重依赖出口和投资,导致经济增长失去民生基础、外汇占款持续增加推动物价上涨、投资与消费结构严重失衡。(3)房地产投资成為经济增长主要引擎,房价上涨过快危及民生和社会安全。(4)政府经济政策短期行為明显,不能容忍经济增长减速,导致经济结构在每一次调控后越发失调。(5)居民收入比重过低、政府和企业在GDP分配中的比重过高,導致经济无法引导到以居民消费為基础的内需经济增长模式上。(6)产业结构粗放化、低端化特征明显,企业技术创新明显不足,企业家形成机制异化,产业的国际竞争力极度低下。(7)经济泡沫化倾向明显,导致通货膨胀日益严重,虚拟经济严重危害实体经济的发展。这些扭曲的问题在很大程度上是由我国不合理的经济结构导致的。

要实现中国经济“又快又好”的发展,有四大因素迫使我们必须进行经济结构的调整:第一,世界经济衰退迫使中国转向内需经济,特别是居民消费推动型经济增长。第二,中国投资驱动型增长弊端重重、难以為继:投资效率低下、资源环境压力、政府债务风险、房地产泡沫、通货膨胀。第三,中国的城市化战略失误造成巨大资源浪费:被遗忘的农村、失落的进城务工群体、城市化“乱战”的巨大失误。第四,人口结构变化迫使中国进行经济结构调整,特别是中国进入后刘易斯拐点时代。

刘易斯拐点将对中国未来构成巨大冲击,主要表现在:(1)以过往新兴国家的经历看,刘易斯拐点之后,低端工资无一例外地会出现一次持续的飞涨,低端消费市场迅速扩张,这种情形肯定会在中国出现。(2)工资上涨常态化,带来通货膨胀结构性上扬,此轮通胀之后,CPI的回落估计有限,中烈度通胀可能持续

存在。(3)低端住房需求与家居改善需求大增,不过这是一个与现有房地产市场不同的新市场,建材供应商、原材料供应商、家具供应商的受益程度料大过开发商。(4)加大投资力度,生产流程中机械化、自动化程度将明显提高,设备制造业会受惠。这次生产线向内陆省份迁移,不仅是简单的地理上的转移,也伴随着资本投入的加大。(5)外资结构出现变化,对成本敏感的制造商比重下降,主攻内需的海外品牌、服务供应商大量流入。(6)亚洲面临新的洗牌,以中国作為龙头及窗口的制造业垂直生产链逐步瓦解,抢占中国市场和抢夺流出中国的外资及中资成為新时尚。

那么,中国经济结构调整的方向与对策是什么呢?我们认為主要有:(1)将经济增长速度降下来,坚持实行紧缩货币政策,经济增长目标应当平衡其他宏观经济目标和社会目标。(2)提高制造业的技术、质量与品牌,提升产品的价值链。(3)提高家庭收入占GDP的比例:工资、要素价格、公共分享机制、反腐败。(4)稳定汇率机制,调整出口结构,关注发展中国家市场。(5)通过信贷、税收、法律等手段打击投机、消除资产泡沫,将经济重心转移到实体经济上来。(6)降低政府投资比重、消除不公平竞争给产业升级转型带来的不利影响。(7)实施大城市簇群战略和大力发展新农村战略。(曹建海,中国社会科学院工业经济研究所)

以全球价值链推动中国经济转型升级

新世纪以来,我国经济结构调整始终是经济发展的一个重要任务,但是实施效果不甚理想。其根本原因,在经济结构调整过多地依赖于政府的行政手段,忽视了市场机制的作用,忽视产业价值链上的协调,特别是忽视了在全球价值链上的协调。因此,我们立足于发挥市场在经济结构调整中的主导作用这个判断,提出应当从全球价值链角度引导我国“十二五”期间的经济结构调整。

近三十年的经济发展的主要动力是利用中国的“人口红利”去实现第一波“全球化红利”,依赖于低技能要素禀赋,以低技能要素加入全球价值链低端环节,实现了经济总量的快速扩张,但是所获的附加值不高。现阶段的经济发展,我们称之為“低技能要素偏向的经济发展”。

如何确定经济发展方式转变的方向,按照库兹列茨的定义,一国的经济增长是看人均GDP增长以及相伴随的人口增长和结构的巨大转变。在目前人口与资源环境的约束下,中国人均GDP的增长只能依赖于劳动力结构、经济结构的巨大转变,其关键是要能够形成以高附加值产业為主的产业结构,这又进一步依赖于劳动力结构以高技能劳动力為主。

因此,在全球分工体系中,这就要求中国应当从全球价值链低端定位,转变為全球价值链中高端定位,同时利用全球价值链这个手段,提升中国自身有比较优势的产业,形成一系列由中国主导的产业全球价值链。

这种定位就要求比较优势从依赖于低技能要素禀赋转变成依赖于高技能要素禀赋,这实际上要求经济发展方式,最终要转变成“高技能要素偏向的经济发展”,这也就是依赖于自主创新的内生性经济发展。

我们认為,下一阶段中国经济发展依赖于第二波“全球化红利”,关键是以一系列结构调整形成的“结构红利”替代“人口红利”。

(1)以全球价值链引导需求结构的调整。从制造业投资偏向的结构转变成创新投资与居民消费稳步增长并重的结构。

(2)以全球价值链引导三次产业结构调整,增强三次产业的竞争力。在三次产业结构上,逐步提高服务业占比,特别是知识密集型生产服务业的发展,东部沿海某些发达地区要率先进入以服务业為主的产业结构。

(3)以全球价值链引导区域结构调整。区域经济发展要从“制造业中心一外围依附式”结构向“服务业中心一制造业基地相互分工式”结构的转变,以此构建一系列有竞争力的国内价值链,以此培育一批以中国企业為领导者的全球价值链。

(4)要从城市偏向的城乡结构转变成城乡统筹的城乡结构,实现全球价值链与城乡结构相互促进。全球价值链攀升或形成中国主导的全球价值链有利于提高居民收入,提高城乡劳动力对人力资本投资的激励,进而缩小城乡差距。城乡统筹是為全球价值链攀升提供了的“后勤”保障,原因是提供的劳动力人力资本水平会较高。

(5)经济结构调整需要形成一种自我强化的状态,这还依赖于经济体制改革。将原来定位全球价值链低端的各级政府、各类企业之间的激励与协调机制转变成促进企业定位于全球价值链中高端的激励与协调机制。其关键之处是形成创新驱动的高技能要素偏向的投资体制,将知识和技术创新作為产业发展主要驱动力。因此,政府要应从大规模加工制造业投资偏向的体制,转变成创新投资偏向的体制;要从有限准入条件下企业体制转变成充分准入条件下的企业体制,将民营科技型企业,尤其是涉及前瞻性战略性新兴产业的民营科技型企业作為攀升全球价值链中高端的主体。

产业结构的转型升级要求政策思路也必须发生改变。第一,将政府调整经济结构的核心转变成引导市场,让市场成為调整的主要力量。第二,改变原来产业结构调整“考虑国内因素的多,考虑国际因素的少”的思路,转变為放眼于全球价值链,利用全球价值链攀升或控制全球价值链,在产业升级中调整产业结构。第三,利用全球价值链,实现“大进口”,“高出口”,缓解贸易不平衡格局。第四,资源产品价格、汇率、节能环保等一系列具体政策立足于全球价值链,方向更加明确,更有利于发挥市场的作用。第五,定位于全球价值链中高端,涉及研发、设计、信息化、营销和品牌建设等各个方面,这些环节要求的政策更具有针对性,涉及到政府各个相应的经济管理职能部门,為有利于各部门各司其职,分工落实。(郑江淮,南京大学产业经济学系,南京大学长江三角洲经济社会发展研究中心)

以创新驱动内需的扩张

随着欧洲债务危机的进一步演化和美国经济形势的持续低迷,世界经济“二次探底”的可能性加大。在世界經济形势日趋复杂化的背景下,我国的对外贸易尽管已经恢复到危机前的水平,但这更多是我国各级政府强化政策应对的结果,对外贸易的向好能否持续,还需作进一步的研判。

当前,我国以加工贸易為主要特征的对外贸易遇到了空前的挑战,其原因在于中国出口的比较优势发生了变化。这主要体现為:第一,人力成本不断上升,低端制造业比较优势风光不再;第二,环境成本持续上升,土地承载力几近极限;第三,能源价格高居不下,内涵能源消费模式招致负外部性;第四,政策支持效果日渐式微,极易引发贸易争端。尤其是在美国总统奥巴马近期宣布美国要“再工业化”和扩大就业以及人民币“被升值”的背景下,中国经济尤其需要改变发展方式和转型升级。

我们近期所做的系列研究表明,我国经济转型升级的一个重要方面在于要摆脱过于依赖外需的模式。具体而言,就是要把稳定内需与扩大外需结合起来,制定综合平衡政策以全面应对世界经济低迷可能带来的不利影响。在我国促进出口和扩大外需这个问题上,主要要在以下两个方面做好工作。一是继续发挥规模经济和集约边际优势,通过同时结合国内需求所创造的“本土市场效应”提高生产率和扩大出口;二是要继续发挥技术创新和市场创新的作用,促使企业沿

着“质量阶梯”发挥扩展边际所带来的新优势促进出口。

另外,我们的研究表明,我国制造业企业在出口过程中同时存在显著的“自我选择效应”和“出口学习效应”。前者表明我国出口企业必须努力创新以突破“门槛效应”和进入出口者的行列;后者表明在我国企业融入全球生产网络的过程中是存在明显的技术溢出效应的。特别值得一提的是,中小企业的上述两种效应都非常显著,该研究结果给我们的启发是,在下一步促进出口的政策制定过程中,要充分发挥中小企业的作用,要创造各种条件促进中小企业的发展和成长,不断提升我国企业的全要素生产率,构造其持续的核心出口竞争力,最终实现我国贸易增长方式的转变。(邱斌,东南大学经济管理学院)

以创新和服务业的发展促进转型升级

我国当前面临着较為复杂的外部经济形势,那么,在这种错综复杂的背景下,我国经济如何实现转型升级,完成“十二五”期间转变经济发展方式的目标?為回答这个问题,我认為中国应该着重以以下几个方面為抓手进行经济的转型升级。

一,调整产业结构,促进服务业竞争,大力发展服务业。中国经济的成长主要表现在制造业的崛起,而服务业的发展则长期停滞不前。近十年来,服务业增加值占国民生产总值的比重始终维持在40%左右,这一比例不仅远远低于美国等发达国家,也落后于许多人均收入水平相近的发展中国家。那么,中国经济要转型升级,就需要增加服务业增加值在国民经济中的比重,改善服务业长期发展缓慢的状况。对比服务业与制造业,在中国服务业的垄断程度远远高于制造业,尤其是在国民经济中处于基础地位的电信及信息传输业、交通运输和仓储业、金融业、租赁和商务服务业的垄断程度更為严重。这些行业的垄断一般表现為国家的行政垄断,国有资本占有较高比重,民营资本难以进入到这些行业中,因此,行业垄断导致了行业增长缓慢,使得服务业发展受到限制,进而影响了我国产业结构的调整升级。有鉴于此,中国需要深化具有垄断性质的服务业改革,打破对民营资本的限制,形成多种所有制共同竞争的格局,带动中国服务业快速发展,促进产业结构调整。

二,遵循产业发展规律,不断促进产业升级。改革开放以来,中国经济农业大国转变為工业化大国,带动了中国经济的快速发展。但中国尚处于工业化发展阶段,并没有进入到工业化成熟阶段,而且,地区间还存在着较大差异。工业化发展既带来中国经济增长的奇迹,但也是当前经济增长呈现粗放式特征的重要原因。按照产业周期理论,一国经济遵循产业发展的周期性规律,违背产业经济发展规律可能会导致经济增长缓慢。因此,中国在促进产业升级过程中,要遵循经济规律,按照区域经济发展的不同阶段,实施不同的产业升级政策。在东部一些地区或城市已经进入到后工业化时期,就要注重技术创新在经济增长中作用,着重发展制造服务业、研发业和高新技术产业,带动产业不断升级。而在中西部地区依然处于工业化发展时期,那么工业化发展会促进该地区的经济快速增长,改善地区收入差距,因此,要注重对东部地区产业的承接。為避免环境污染等问题,中西部地区政府要加强环境规制和基础设施建设。当然,目前世界经济形势复杂,中国也面临着人民币升值、生产要素上涨等因素的共同作用,中国加工制造的成本优势不再巨大,应通过产业升级与技术能力升级避开低层次的价格竞争,把中国参与全球产业竞争的水平和层次提高到新的平台。

三,打造世界一流高等教育,為提升自主研发能力提供重要保障。从长期看,国家经济要实现转型,必须要高端研发和管理人才来支撑,国家培养的研发人才与世界差距较大的话,那么,没有高端人才支撑,基础科研成果远远落后于发达国家,谈论自主创新可能就是空洞的,因此,加强高等教育对于国家经济长期转型升级来说是非常关键的因素。尤其,要加强博士研究生人才的培养力度,培养出世界一流的研发人才。对比中国与发达国家的教育水平,可能差距最大的就是博士教育,在中国目前存在一个现象就是博士生的课程设置远远滞后于国外,博士在没有打好基础情况下就从事科学研究,使得科研成果不够扎实,最终影响了国家的科研水平。中国博士生课程设置為何难以与美国等发达国家靠拢,并且难以站到学术前沿开展研究,因此,国家应该大力吸引从国外留学归国博士或教师,甚至在条件成熟时,聘请外籍博士毕业生或教师来中国任教,不断提升中国博士生教育质量,為中国培养出世界一流的科研人才。我认為在复杂的经济形势下,要有超前的眼光,决胜于未来,在其他国家疲于应付债务危机之际,中国应该韬光养晦,潜心于培育经济发展的长期能力,成功实现中国经济的转型升级。

四,加强官产学研合作,促进高新技术产业化。首先,要发挥政府在高新技术产业化工作中的引导作用。世界各国在高技术产业领域的竞争日趋激烈,如何发展我国高技术,实现产业化成為摆在政府面前的一项紧迫任务。从“九五”期间开始,中国政府实施高技术产业化专项工作,中央政府、地方政府、企业自身以及其他社会资金都进入到高技术产业化项目,為中国高技术产业化做出了较大贡献,带动了信息、生物、航空航天、新材料、能源、现代农业、先进制造、环保资源、海洋等高技术领域的快速发展。目前,我們对高技术产业化研究工作实证分析发现,政府引导高技术产业化工作促进了企业研发投入、财务绩效和国内国际竞争力提高,但是由于政府组织实施高技术产业化工作中,存在着道德风险问题,研究发现产业化工作在促进企业研发努力和项目管理方式上亟待改进。其次,进一步加强科技体制改革,促进产学研的资源结合与科技成果产业化。目前,中国科研成果转化率与发达国家相比较低,由于长期的体制问题,為研发机构的研发活动付费和买单的不是企业,而是政府。因此,造成了学研与产业的脱节,大量科技成果因缺乏产业化前景而束之高阁。為了促进科技成果转化,中国进行了院所体制改革,将学研企业化,促进其直接面向市场去转化成果,其结果是产业缺乏了先进技术的供给来源,而学研由于体制原因缺乏产业经验,使得产业化效果不佳,最终造成产学研的功能错位。為此,应积极加强创新体制与创新模式的科技体制改革,一方面理清产学研之间的市场供求关系和其各自的资源优势,通过市场利益机制与政府引导调动三方的优势结合;另一方面:尽快促进创新能力和创新动力的提高,最终形成以企业為主体、产学研相结合的创新机制与创新模式。(郑世林,中国社会科学院数量经济与技术经济研究所)

以现代服务业发展促转型升级

以美欧為代表的债务危机对中国经济有哪些影响?第一,从财富的角度看,中国长期以来积累的巨大财富面临大规模的缩水,表明过去我们的实际有效经济增长率也被大打折扣。第二,可能使中国加速从出口导向转向拉动内需,但发展方式转变过程需要时间,从而有可能使实际经济增长率动力不足。第三、美欧的债务危机使其货币处于动荡环境,人民币的相对升值速度加快,意味着中国目前的支柱产业如制造业进入了衰退期。

“在复杂经济形势下,我们面临着两个选择”,第一是继续保持出口,用高端取代低端,提升国际竞争力。这需要我们加速弥补“创新能力”的差距;第二是扩大内需,通过扩大内需来发展现代服务业。这需要我们加速弥补“市场转换能力”的差距。但是这两者都不是一朝一夕能够完成的。选择加快发展现代服务业,一是等同于扩大本地需求和扩大内需;二是等同于攀升全球价值链的高端的“非实体性活动”。换句话说,现代服务业是制造业的心脏和脑袋,能够促进服务业,制造业的发展。与传统服务业不同的是,在现代技术的支撑下,还可以提升了国际服务贸易和服务外包的水平。因此,我国经济的转型升级可以以发展现代服务业為“抓手”,通过率先转变服务业发展方式促进经济转型升级。另外,现代服务业的发展所带来的最直接、最显著的效益就是能够立即产生节能减排效应。(刘志彪,江苏省社会科学院,南京大学经济学院)

复杂背景的快速人脸检测研究 篇3

关键词:人脸检测,光照补偿,肤色分割,连通域分割,凹点分割

0 引言

人脸识别技术是模式识别和机器视觉的一个热点研究领域。人脸检测技术作为人脸识别的关键一步,具有重要的研究意义。人脸是一类具有相当复杂细节变化的自然结构目标,其检测结果容易受到光照、背景复杂程度、图像采集设备色彩偏差、附属物等的影响,使人脸检测过程变得十分困难。因此现在很多快速人脸检测技术都仅仅针对标准人脸库进行。而对于复杂背景的人脸检测,往往采用神经网络、支持向量机等算法,这需要花费大量的训练时间,过程相当繁琐费时。为了保证一定的检测率,同时提高检测速度,本文在肤色分割的基础上采用了一种新的分割粘连的大面积肤色区域的方法,从而得到了可能的人脸区域。

1 肤色区域分割

在图像采集的过程中,受光照影响,会造成图像偏暗或偏亮,受采集设备的影响图像会产生偏黄偏绿等情况,这些都会严重影响肤色分割。因此,在肤色检测前,要进行光线和色彩补偿。光线补偿方法参考文献[1]中计算光线补偿系数是否超过门限值的“参考白”方法。色彩补偿采用色彩均衡方法消除彩色偏移,具体思路如下:

1) 计算图像的R,G,B三个分量的各自平均值R,G,B,令avg=(R+G+R)3

2) 调整每个像素的R,G,B值,令aR=avgR,aG=avgG,aB=avgB使得每个像素CR,G,B分量为C(R)=aR×C(R),C(G)=aG×C(G),C(B)=aB×C(B)。

3) 将图像的各个分量调整到可显示范围。令k为图像中R,G,B三个分量的最大值,令k=k255,若k>1,则对于图像中每个像素C有:C(R)=C(R)k,C(G)=C(G)k,C(B)=C(B)k

经过光线和色彩补偿后,要从复杂的背景中提取出肤色区域还需要选择一个合适的色彩空间,目前常用的色彩空间主要有RGB,YIQ,HSV,YCbCr[2]。YCbCr与其他色彩空间相比,具有与人类视觉感知过程相类似的构成原理,被广泛地应用在电视显示等领域中,也是许多视频压缩编码,如MPEG和JPEG等标准中普遍采用的颜色表示格式,能将色彩中的亮度分量分离出来。而且YCbCr能够直接获得,或者从RGB经线性变换直接得到。检测结果也表明,YCbCr色彩空间中肤色的聚类特性比较好[2,3]。所以,本文选择在YCbCr空间进行肤色分割。

在不同的色彩空间建立合适的肤色模型[4,5]分割。YCbCr空间有多种模型[1,2,6],根据实验效果对比,本文采用Anil K. Jain等人提出的椭圆模型。椭圆模型的解析表达式为

(x-ecx)2a2+(y-ecy)2b2=1(1)

[xy]=[cosθsinθ-sinθcosθ][Cb¯-CxCr¯-Cy](2)

式中:各个常量分别为Cx=109.38,Cy=152.02,θ=2.53(弧度制),ecx=1.60,ecy=2.41,a=25.39,b=14.03。Cb¯,Cr¯是由文献[1]中的变换式由图像中每个像素的Cb,Cr转换来的。将转换得到的每个像素Cb¯,Cr¯值。带入式(2)计算后,带入式(1),如果得到的值小于或者等于1(即该点落在椭圆肤色模型内),则判断该点为肤色,反之为非肤色。将肤色点的值置为1,非肤色则为0,得到二值图像。图1是原始图像,图2是未加光照和肤色补偿直接进行肤色分割得到的,图3是由图1在光照和色彩补偿后进行肤色分割得到的。

2 连通域分割

由图3可见,图像做完肤色分割后,有大量类肤色区域、肤色区域粘连在一起,比如一个人的脸和手、人脸和背景中的类肤色区域、不同人的肤色区域相连在一起,为了提高人脸检测率时,必须对过大的连通域进行分割。经过实验发现,有人脸的区域像素值比没有人脸区域的大,在投影法中能形成波峰波谷,依据这个条件首先对过大的连通域粗略分割。算法思路如下:

1) 对得到的二值图像进行小面积区域去除后,标记连通域。遍历连通域,计算连通域的高和宽,若它的高或者宽大于一定值(本文设为大于二值图像高和宽最大值的1/3),则将这个连通域进行垂直投影和水平投影。用图4画框区域为例子,证明投影法的可行性,图5和图6分别为画框区域的垂直投影和水平投影图。

2) 分别找出垂直投影和水平投影的波峰和波谷位置,若相邻两个波峰波谷的像素差值大于一定值(本文取连通域高和宽最大值的1/3),且这个的波谷的像素值小于阈值,就在这个波谷位置进行垂直(水平)分割。结果如图7所示。

将过大的连通域分割成小块的连通域,去掉过小面积区域后,发现分割得到的小区域因为本身形状复杂,投影法不能对其进行分割。为了对其进行细致分割,去掉一些小角,为下面的凹点分割作准备,这一步思路如下:

1) 填充孔洞标记连通域,遍历连通域。对每一个连通域,按行找每一行连续白色像素段有几段,记下每一段连续的白色像素点的像素和,每两段白色像素段的间距是多少,若间距值大于阈值,则记下黑色间隔的中点,求中点坐标这一列的像素和,如果小于某个阈值,按这一列分割。若间距小于阈值,则保留这一行的最大白色像素段,其他的白色像素段全部置为零。

2) 对于连通域,按列的思路和按行类似,参照步骤1)进行。分割结果如图8所示。

细分割后,人脸区域基本上已经分离出来,标记每一个连通域,做出它的最小外接矩形,计算长宽比,超出某个阈值时,去除这个连通域,人脸的长宽比一般小于1.5,因为人脸区域不是完全被分割出来,所以将范围扩大到2.5,即把长宽比大于3的区域去除。含有人脸的区域,致密度(复杂度)[7]相对较小,根据致密度可以去除形状复杂的区域,经过这两个步骤,得到的图像如图9所示。

经过以上方法处理图像后,可能的人脸区域已经越来越少,为了使人脸的位置更加精确,还需要继续对图像做处理。因为人脸可能存在一定角度的偏移,水平垂直投影法已不再适用,文献[8]中的凹点匹配算法不符合实时性,GLV算法[9]是在假设粘连物体都是圆形的基础上提出的,而本文需要分割的图形不能保证都是圆形,所以根据需要改进了此算法,算法思路如下:

1) 标记连通,遍历连通域,计算每个区域的离心率。小于阈值,则提取连通域边缘,做出这个连通域的最小凸边形。取凸边形上距离最远的两点,将其中点设为所需要的中心点,即为凸边形的最小外接圆圆心。将凸边形上距离最远的两点以及周围一定范围的点的值置为0,则连通域的边缘被分成两部分,分别在两段边缘上找距离中心最近的点,作为潜在的凹点。

2) 如果中心点在连通域里,两段边缘上距离中心最近的点的连线作为潜在的分割线。如果中心在连通域外,则找两段边缘上距离中心最近的点中距离中心更远那一点,使该点与中心线的连线作为潜在的分割线。

3) 如果分割线的长度小于阈值(本文为凸边形最远距离的1/3),且分割后的其中一部分的离心率变大了,分割这个连通域。

步骤3)进行前,先要对图像进行开运算和闭运算,以填平小湖,去掉小桥。凹点分割后的图像如图10所示。

3 确定人脸

经过连通域分割后,可以得到可能的人脸区域。但是人脸的确切位置是未知的,为了得到人脸的确切位置,在可能的人脸区域范围寻找头发的位置,来确定人脸的位置。遍历连通域分割后的图,寻找每个可能的人脸区域的位置,将这个区域的长宽分别放大15个像素,得到需要的区域范围。同时将原图像转换为灰度图像,在灰度图像的对应位置,将灰度小于95的像素值置为1,反之为0,得到组图如图11所示。

根据得到的二值图来找确切的人脸范围,步骤为:

1) 计算二值图的平均面积。如果小于某个值(即存在头发的可能行很小),不是人脸区域。反之,进入步骤2)。

2) 对这个区域进行开闭运算,去掉小面积区域。由上至下找脸型的最上面位置,由左至右找脸部的最左边位置,由右至左找脸部的最右边位置,由下至上,找脸部的最下面位置,若找不到最下面的位置,记为脸部最上边的位置加上1.3倍脸宽。在灰度图上画出人脸位置,如图12所示。

4 结论

此组合方法简单,不用训练,也不用霍夫检测椭圆,节约了大量的时间。用此方法对来源于笔者生活中的50副图像进行人脸检测。实验证明,该方法能够较为准确地在复杂环境中检测出旋转不超过45°的多姿态人脸,将图像尺寸缩小到1 000×600像素(pixel),在HP500 PC上整个处理时间平均为1 s。但是对于偏光比较严重的图像,带浅色帽子的人脸图像存在漏检,在含有大量深色面积的类肤色区域存在错检。若在光照补偿部分改进算法、人脸验证部分再加验证条件,可提高检测率。

参考文献

[1]HSU R L,MOTTALEB M A,JAIN A K.Face detection in color image[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2002,24(5):696-706.

[2]邢果,戚文芽.彩色空间的肤色分割及其在人脸检测中的应用[J].电视技术,2006,30(7):91-93.

[3]何为.基于肤色的人脸检测与跟踪研究及系统实现[D].重庆:重庆大学,2007.

[4]舒双宝,罗家融,刘连忠.基于Direct Show的人脸快速检测系统实现[J].电视技术,2008,32(8):88-90.

[5]尹红梅,朱再新.基于动态轮廓的彩色多人脸检测[J].电视技术,2007,31(8):134-142.

[6]YANG M H,AHUJA N.Detecting human faces in color images[EB/OL].[2011-03-25].http://www.google.com.hk/url?sa=t&rct=j&q=Detec-ting%2Bhuman%2Bfaces%2Bin%2Bcolor%2Bimages&source=web&cd=4&ved=0CEsQFjAD&url=http%3A%2F%2Fciteseerx.ist.psu.edu%2Fviewdoc%2Fdownload%3Fdoi%3D10.1.1.55.5354%26rep%3Drep1%26type%3Dpdf&ei=uP2wTrS2NoKuiQf7w4nXAg&usg=AFQjCNGe7u5E-ShF3S3hSqPGyhhbQ-PElw&cad=rjt.

[7]杨帆.数字图像处理与分析[M].2版.北京:北京航天航空大学出版社,2010.

[8]韦冬冬,赵豫红.基于凹点匹配的重叠图像分割算法[J].计算机与应用化学,2010,1(27):99-102.

背景复杂度 篇4

随着视频监控的发展, 传统的需要专人职守的视频监控系统的各项缺点逐渐显露, 如浪费人力资源、报警不准确不及时甚至错过各种异常情况等等, 已经不能适应越来越高的监控要求。因此, 急需开发出具有一定智能性的视频监控系统, 自动对图像序列进行运动检测, 一旦发现运动物体而且运动物体的位置和形态满足一定条件, 就发出报警信号来通知监视人员及时有效处理及录像以作档案, 并为实现运动物体自动跟踪做好准备, 可在很大程度上减轻监视人员的负担, 又能使监控系统具备智能性。

文献[1]利用Bayes法则的门限检测算法加以改进, 提出了一种应用于视频监控的运动检测算法, 但Bayes法则需要样本训练过程, 这在实际监控中不实用;文献[2]提出了光流估计的鲁棒性多分辨率运动目标检测方法, 但光流算法复杂且计算量大, 目前用于实际目标实时检测非常困难;文献[3]提出一种基于高斯统计模型的背景图像估计算法, 该算法是背景图像的估计由初始化和更新两部分组成, 在背景图像的初始化算法中, 求取一段较长的时间段T计算视频序列图像每一像素的平均亮度, 并计算在该段时间内的每一像素亮度的方差作为初始的背景估计图像。文献[4]进行了目标检测最常用方法即帧差法和背景相减法的比较, 指出两种方法的优劣。通常背景相减算法将会占用很多内存空间, 不适合用于嵌入式系统对内存苛刻的要求;两相邻帧差分法简单、速度快、易于硬件实现, 但当两帧图像中都存在运动物体时, 将包括严重的背景变化, 为运动物体精确检测以及后续工作带来困难, 甚至不能继续工作。文献[5]提出了只用数学形态法进行物体检测的方法, 但这种方法在复杂背景下效果不好, 且速度较慢。由此, 本文提出了利用otsu法和数学形态法联合进行三帧差分图分割的运动检测方法。本文提出的三帧差分法与文献[6]提出的三帧差分法改进之处在于本文的三帧差分法的核心算法—分割更具有智能性, 在复杂背景下, 效果更好。实验证明, 本文方法具有智能性和鲁棒性, 能满足实时性要求, 特别能满足要求需内存少、速度快的嵌入式系统。

1 运动物体的检测

1.1 噪声处理

图像在实际应用中可能存在各种各样的噪声, 这些噪声可能在传输中产生, 也可能在量化等处理中产生。噪声产生的原因决定了它的分布特性及它和图像信号的关系。先去除噪声的影响。一般情况下, 由视频镜头产生的噪声, 以及视频序列中的随机噪声、亮度变化、背景纹理的变化等统计量噪声都服从均值为零的高斯正态分布, 而由运动物体引起的亮度变化与噪声的分布是独立的。文献[7]也指出视频图像中的噪声具有高斯特性, 噪声频谱要比一般图像的频谱高很多, 因此对视频图像进行了高斯低通滤波。

1.2 差分图

本检测算法利用连续三帧差分法, 即分别将第k-2和第k-1帧图像、第k-1和第k帧图像进行绝对相减, 得到两幅差分图, 然后利用这两幅差分图进行检测。

1.3 差分图的初步分割

差分图分割是运动检测以及跟踪的最重要的步骤, 是监控算法的基础。目前图像分割的方法很多, 如阈值分割方法[8,9]、边缘检测[10,11]、函数优化方法[12]、数学形态学方法[11]、基于对象的物理性质的分割方法[13,14]等, 这些方法各有特点及应用范围。Otsu方法[15]是由日本大津展之提出, 其基本思路是将直方图在某一阈值处理分割成两组, 当被分成的两组的方差为最大时, 决定阈值。Otsu法是一种自动的非参数非监督的阈值选择法, 具有很强的自适应性。现在Otsu法已发展到二维Otsu方法[16]即为任何一个像素, 就有了一个二元组:像素灰度值和邻域平均灰度值, 但二维Otsu方法运算速度太慢, 即使文献[17]提出了二维Otsu方法的快速算法, 但速度仍显得过慢。因此, 本文还是采用了一维Otsu法和数学形态学方法进行分割, 在监控中, 如人等在图像中的都占一定面积并进行了图像噪声预处理, Otsu方法效果良好。

本文Otsu方法计算步骤如下:设一幅图像的灰度值为1-m级, 灰度值为i的像素数为ni, 此时我们得到:

总像素数:undefined

各值的概率: Pi=ni/N (2)

然后用k将其分成两组C0={1-k}和C1={k+1~m}, 各组产生的概率如下:

C0产生的概率undefined

C1产生的概率undefined

C0组的平均值undefined

C1组的平均值undefined

其中:μ=undefined是整体图像的平均值:undefined是阈值为k时灰度的平均值, 所以全部采样的灰度平均值为μ=ω0μ0+ω1μ1。两组间的方差用下式求出:

undefined

从1-m间改变k, 求上式为最大值的k, 即求maxσ2 (k) 的k*值, 此时, k*值便是自适应阈值。

由于所得到的差分图前景图较弱, 为了取得良好的分割结果, 在大量实验基础上, 当阈值调小到0.4k*时效果较佳。此时, 可得二值图B:

undefined

此时, 完成了差分图的初步分割, 得到的运动物体图像是不连续或有孔, 并且可能包含背景的变化, 因此, 需要进行后分割处理。

1.4 差分图的二次分割

由于得到的运动物体图像是不连续或有孔, 并且可能包含背景的变化, 本文利用了数学形态法进行差分后分割处理。

算法步骤:

1) 进行差分图闭运算

作用为平滑轮廓, 融合狭窄的间断和细长的“沟壑”, 消除小的空洞。

2) 进行差分图填充

作用为填充前景图的空洞, 使其成为连续图像。

3) 进行后处理的图像进行与运算

作用为得到中间帧中完整的运动物体图像。

4) 对图像进行标注

作用为后续运动物体特征量的计算作准备。

5) 计算运动物体特征量

特征量主要包括区域的面积Skj区域的质心Pkj、区域的高宽比Rkj为确定目标物体做准备, 其中K, j分别表示第k帧图像及第k帧图像中的第j个运动物体。运动物体特征量是目标跟踪的基础。

此时, 便能得到运动物体的完整的图像, 为后继报警录像、运动物体跟踪目标的确定及目标跟踪做好准备, 本算法对单个或对多个运动物体检测效果都良好。

2 目标物体的确定

运动目标识别的目的是从检测到的运动区域中识别出是否对应为目标物体的运动。分割出来的运动区域可能对应于不同的运动目标, 比如室外监控摄像机所捕捉的序列图像中可能包含行人、车辆及其它诸如飞鸟、流云、摇动的树枝等运动物体;安装在室内的监控摄像机所捕捉的序列图像中可能包含入侵者、小动物以及被风吹动的窗帘等。为了提高报警的准确度, 减小误报警概率, 运动目标的正确识别分类是非常必要的。

利用检测出的运动区域的形状特征来判断是否为入侵者。本系统判断准则如下:

a. 区域的面积Skj是否大于设定的阈值。

b. 区域的质心Pkj是否在设定的范围内。

c. 区域的高宽比Pkj是否符合设定的比例。

如果以上的3个条件都满足, 系统就判定出现了入侵者, 报警并进行录像;如果有1个条件不满足, 系统将不会报警。当侵入物体仅一个时, 即为跟踪目标;当侵入物体为多个时, 根据侵入物体的面积Sk、质心 (xk, yk) 和高宽比Rk确定跟踪目标并报警录像。

3 实验结果

本实验为了说明问题, 实验环境是在有日光灯的室内, 日光灯因为本身的发光原理, 不停地闪烁, 这容易引起摄像机瞬间取真时仍然引起图像的变化, 但也更能证明本算法具有很好的鲁棒性。

图1、2、3是三帧原始图;

图4、5分别是第1、2和第2、3的差分图;图6是运动分割结果, 即为运动检测结果。

图7、8、9和图10、11、12分别是单个和多个物体的检测实验情况, 效果良好。

4 结 论

本文提出了运用otsu法和数学形态法进行差分图分割的三帧差分进行运动检测的方法, 对单个或多个运动物体检测效果都良好。此运动检测方法简单, 速度快, 自适应性强, 适于硬件实现, 且不要求保存过去的测量数据, 需要较少的内存, 符合了嵌入式视频跟踪系统的开发要求。实验证明, 本检测方法可行有效, 具有较强的稳健性和鲁棒性, 是我们开发的复杂背景下嵌入式视频跟踪系统核心算法之一 (复杂背景下嵌入式视频跟踪系统, 另有文章详述) 。

摘要:提出了利用Otsu法和数学形态法进行三帧差分图分割的运动检测方法, 对单个或多个运动物体检测效果都良好。此运动检测方法简单、速度快、自适应性强, 适于硬件实现, 且不要求保存过去的测量数据, 需要较少的内存, 符合了嵌入式系统的开发要求。实验证明, 本检测方法具有较强的稳健性和鲁棒性。

复杂背景下的车体检测和定位 篇5

车牌识别 (License Plate Recognition, LPR) 系统, 是智能交通系统 (Intelligent Transportation System, 简称ITS) 的重要组成部分, 是交通管理自动化的重要手段和车辆检测系统的一个重要环节, 在交通监视和控制中占有很重要的地位。一般可顺序地分为车辆图像获取、车体检测和定位、车牌定位、车牌字符分割和车牌字符识别5个基本部分。

目前的车牌识别方法主要是针对车辆自动注册和收费、停车场管理等场合, 所监视区域的背景一般比较简单。而实际应用中, 所监视的区域往往比较复杂, 普通的车牌识别算法显然不能满足要求。而应用复杂背景下的车牌识别技术, 则能够从各个方位很好的监控过往车辆, 大大提高对超速、失窃、黑牌等车辆的监控力度, 从而保障社会安全稳定, 其实际应用价值非常巨大。

1 车体检测和定位的研究现状

对于复杂背景下的车牌识别研究, 车体检测是非常重要的一步。传统车辆检测器有磁感应线圈、雷达、超声波、红外线等, 但是均有着诸多缺点和局限。随着计算机和图像处理技术的不断发展, 利用机器视觉检测器来进行车辆检测成为潮流的发展方向。

目前的车体检测算法, 大多是基于视频的。首先由摄像头拍摄得到实时交通场景的视频序列图像, 然后对序列图像进行感兴趣区域 (Region of Interesting, RoI) 提取, 其方法主要有帧差法、背景差法等。

帧差法将两帧 (或多帧) 连续图像逐像素相减, 以去除静止或移动缓慢的物体及背景, 它是消除两帧连续图像中的静止物体以及提供运动物体 (车辆) 运动轨迹最直接的方法。如Kameda采用概率统计的方法通过三帧连续图像间的运动信息找出RoI。Paragios等人则利用基于空间Markov随机场的连续帧图像间的差值统计量来描述帧间差异。

背景差法的基本思想是先形成交通场景的背景图像, 然后将待检测图像与背景图像逐像素相减 (理想情况下的差值图像中非零像素点就表示了运动物体) , 进而就可运用阈值方法将运动物体从背景中分离出来, 其中最常用的方法是多帧平均 (Frame Averaging) 法和选择更新 (Selective Updating) 法。

鉴于交通情况的复杂性, 在同一幅图像中不仅会出现路标、广告牌等物体, 也可能会出现行人等运动物体的干扰, 甚至可能会同时出现多个车辆, 而车辆之间有可能出现粘连现象, 使得大多数的算法都有其局限性, 复杂背景下的车体检测和定位技术仍需进一步改进。

2 复杂背景下瞬时差分法检测和定位车体

对于车牌识别, 特别是复杂背景下的车牌识别, 车体检测是进行识别的第一步。检测到车体后, 才能更准确的定位车牌。车体检测的方法很多, 考虑到目标识别系统的实时性要求, 本文在保证能很好的检测车体的前提下, 并不强调用最精确的车体检测方法, 因为精确的定位算法往往意味着所降低系统的实时性。

本文提出用瞬时块差分法来检测车体, 主要思想是对视频序列中连续两帧图像做以点为中心, 基于块差分的变化检测来定位车体。

2.1 经典瞬时差分法

瞬时差分法主要是利用视频序列中连续的两帧或几帧图像的差异来进行目标检测和提取。一个最基本的瞬时差分法的基本过程如图1:

首先, 利用公式1计算第k帧图像与第k-1帧图像之间的差别, 得到差分后的图像 , 然后对差分后图像进行二值化, 当差分图像中某一像素值大于某一给定的阈值时, 则认为该像素为目标像素, 即认为该像素可能为目标上的一点, 反之则认为是背景像素。在对差分图像 二值化后得到 , 最后对图像 进行连通性分析, 当某一连通的区域的面积大于某一给定的阈值, 则检测到目标, 并认为该区域就为目标所占的区域。

基于瞬时差分的两相邻帧差的方法进行目标检测和分割, 算法复杂度低, 便于实时使用。由于相邻帧的时间间隔一般较短, 因此该方法对场景光线的变化一般不太敏感。但是它提取目标的结果不令人满意。在跟踪任务中, 希望提取的目标尽量接近目标的真实形状, 也就是说, 提取出的目标应是完整的, 同时也应该尽量少的包括背景图像。基于瞬时差分的检测方法不可能从根本上解决精确分割目标的问题, 以下将介绍一种改进的基于瞬时差分的检测方法。

2.2 改进的瞬时差分法

对于复杂背景下的车体检测, 由于车体目标较大, 因此其检测相对容易, 关键是要快速检测出图像的运动区域和非运动区域, 并定位出车体。因此, 本文对瞬时差分法做些改进, 使得算法能够在保证实时性的前提下提高精确度。

经典的瞬时差分法是基于点差异的变化检测的, 提取目标的精度以及完整性可能不令人满意。为了突出灰度值的变化, 提高检测精度, 提取更接近真实的目标, 本文对经典法进行改进。改成以点为中心的基于块差分的变化检测, 并取差分的平方, 以加强运动像素与非运动像素的灰度反差。这里采用以点为中心的3 3 框架作为差分区域, 取该区域的灰度均值做差分 (如图2-4) 。差分过程则和经典差分法相似:

D′k (x, y) =|f′k (x, y) -f′k-1 (x, y) |2

其中, f′k (x, y) 为该点的差分区域的灰度均值。

对差分图像进行滤波及膨胀操作 (如图5) , 再根据连通域外接矩形的面积进行过滤并定位车体 (如图6) , 最后分割出车体 (如图7) 。

值得注意的是, 本算法可以用于复杂背景下的多车体检测, 同时检测多个车辆。对于各连通区域的外接矩形, 设定一个阈值, 矩形面积大于该阈值的即判定为车体。再针对不同的车体模块, 分别进行下一步的车牌定位处理。

3 结语

本文概述了运动目标的提取方法和瞬时差分法, 并针对复杂背景下的车辆检测, 对瞬时差分法加以改进。改进的瞬时差分法能够在保证实时性的前提下, 提高车体检测的精确度, 以提取更真实的目标。实验证明, 该算法具有很好的检测效果。

摘要:采用瞬时块差分法来检测车体, 通过对视频序列中连续两帧图像做以点为中心的3 3框架的块差分, 并取差分的平方以加强运动信息, 然后利用滤波、膨胀等技术准确定位车体。实验表明该算法具有很好的检测效果。

关键词:复杂背景,车体检测和定位,差分法

参考文献

[1]Paragios N., Deriche R..Geodesic Active Contours and LevelSets for the Detection and Tracking of Moving Objects[J].In:Proc.IEEE Transactions on Pattern Analysis and Machine Intel-ligence, 2000, 22 (3) :266-280.

[2]陈子辉, 王丽, 郁有建.基于背景差分与时域差分相结合的运动检测算法[J].天津城市建设学院学报, 2009, 15 (4) :297-300.

[3]Hoose N..AnImage Analysis Tool for Motor Way analysis and Sur-veillance[J].Traffic Engineering Control, 1992, 23 (4) :140-147.

背景复杂度 篇6

现在最为流行的无疑是双帧和三帧以及背景差分和光流算法这几种,这几种方法不是彼此之间相互独立的,而是可以相互之间进行变换和融合的。所谓的移动目标跟踪就是要创建一个以移动目标为对象的实时移动的数据模型来进行实时的跟踪计算。采用一种好的算法能够很大程度上保证最后得到的移动目标的计算跟踪结果更加精确和精准。这一算法将在以后的时间中一样被人们所热爱和研究,因为这些算法还有很大的提升空间来进行改进和创新。

1 运动目标跟踪的原理

运动目标跟踪是根据每一个移动的物体在每一个画面像素之间的序列位置来进行的移动目标的跟踪计算处理分析。那么随着社会科学技术的进步,对于这一方法出现了很多种的方法来进行移动目标的跟踪计算分析处理。那么主要的就是有下面的几种来进行我们的移动目标的跟踪计算分析结果处理。本文主要列举了几个简单具有明显特征的方法来进行移动目标跟踪信息的分析与计算处理。

1.1针对区域的跟踪

针对于某一个区域进行的移动目标的跟踪计算分析的主要中心思想是:首先把得到的捕捉的图像进行加工分割处理划分为一个个包含有有用信息的一些压缩包的模式板块,然后设定一个标准的量来进行模块的选取,在原油的图像目标中进行有用信息的收集处理。那么因为开始在进行额分割处理以后的一些小的模块中含有大量的完整的信息,所以在移动目标能够看见前,这一方法能够达到很高的精确度来进行移动目标的跟踪和计算分析。并且具有跟踪性能十分稳定等特点。但是主要缺点还是过于耗费时间,尤其是在一些较大的区域进行这种方法时,耗费的时间一般都较长。所以这一方法在进行区域性搜索时一般是运用于区域性较小的地方,或者是阴暗对比较差的区域来进行的。

1.2 针对于特征的跟踪

针对于某一个特征的跟踪计算分析处理的中心思想是:首先对于一个目标的某一个局部特点进行提取记录,然后再用计算机配对法里斯进行图像信息的对比,最后达到跟踪移动目标的目的。这一方法主要的优点就是即使被捕捉的目标某一个地方被掩盖,也能够通过局部特征法来进行跟踪分析计算,从而达到跟踪目标的目的。那么这一方法一般是和卡尔曼滤波器相互进行使用,这样能够达到最好的效果,所以这一目标一般常用的场所就是在一些较为复杂的背景下进行目标的跟踪。

1.3针对于活动轮廓的跟踪

针对于活动轮廓的目标跟踪的中心思想是:运用了曲线的封闭性能来进行的移动目标的跟踪计算和分析。主要是依靠了目标特征和数学计算来进行的曲线函数的数学运用更新,达到目标跟踪的目的。这一方法自从被发明出来以后,就被大家广泛的应用到目标搜索中去,因为它具有减少清晰敏感度的优点,并且能够在移动目标被物体所压盖以后还能够自动的进行目标对象的跟踪处理。但是这一方法主要的缺点也是受开始输入数据和噪音系数的影响较大。

1.4针对于模型的跟踪

针对于模型的跟踪方法的主要的中心思想是:首先由一定的数据库来进行目标数据的建模处理,然后再经过匹配计算达到跟踪目标的目的,并且能够自动的进行数据模型库的实时更新。从而得到较为完整的具有鲜明特点的数据结构据。但是背景差分法最大的缺点就是对于环境的要求太高,尤其是光的敏感度的干扰特别严。从而更好的确定目标的信息帧数,达到更为清晰的画面的展示。帧数之间的差分法对于背景为移动画面时的移动目标的画面捕捉是最为适合的,因为帧数差分法对于移动的物体更加的敏感,或者说这一方法只适合运用到移动的物体间。人工智能判断以及自动智能控制等多种技术学科进行相互交织的领域进行的技术研究,这一技术手段被大量的运用到了社会中各个方面其中就包含有军事领域的研究或者是航空行业以及其它的视频监控领域等,在这些研究领域中对于移动目标在复杂背景下的跟踪研究取得了很大的研究成果和重要的实际意义。尤其是对于大量运动物体的移动能够提取相关的信息输入进大脑,然后进行综合计算得到有用的信息。并且能够捕捉到有用的信息以后进行下一步移动物体的预算处理。

2 运动目标检测算法分析

从复杂的背景情况中进行移动目标图像信息的获取就是我们的移动目标跟踪技术。主要分别在于摄像机和我们的移动目标之间的动静关系的确定,其中分为两种,第一种是在背景为静态时移动目标信息的获取和第二种移动背景下移动目标信息的获取。第一种就是指我们的摄像机不产生移动,在整个的拍摄过程中保持静止的状态来进行拍摄。第二种就是我们的摄像机在拍摄时发生了平移或者是旋转等方向的移动而进行的拍摄。

2.1 背景差分法

这一方法是目前为止在进行这一移动目标信息获取方面最为人们所常用的一种方法,这一背景差分法中心思想就是在得到了一个收集了的数据背景模型以后,将现有的帧数和背景模块中的帧数进行减法运算得到一个差值,那么这一差值的结果如果大于一定的标准就可以知道这一信息为移动目标的信息,如果没有大于这一标准就可以判定这一信息为我们的背景模型中的数据。利用背景差分法能够有效的进行移动目标信息的判别,从而得到较为完整的具有鲜明特点的数据结构据。

但是背景差分法最大的确定就是对于环境的要求太高,尤其是光的敏感度的干扰特别严。那么针对于这一情况我们的技术人员最主要的方法就是创造出不同的背景模型来进行移动目标的跟踪计算,这样能够最大限度的减小因为环境因素的影响从而产生的对移动目标跟踪计算出现的失误等现象。对移动目标的跟踪计算至关重要的就是对于背景模型的创立和模式选取以及背景阴影的摒弃,将在很大程度上对整个的移动目标跟踪计算的结果造成关键性的影响。这一方法对于仪器设备的要求不是太高,能够简单的实现,除了要在固定不移动的背景下进行捕捉以外,其余的性能都很好,能够做到快速的进行移动目标信息的获取,从而能够精确的进行信息的取缔。但是这一方法最大的缺陷就是对于环境的要求很苛刻,容易受到光线强弱变化的影响,而这一影响将给整个计算带来严重的偏差。

2.2 帧间差分法

这一方法主要就死利用三三两两相互靠近的帧数在连续像素中的变化,利用时间差值来进行的时间差值分化从而进行的移动目标的信息帧数获取。这一方法对于移动的帧数具有相当强硬的适应性,但是帧数差分法主要的缺陷就是不能够提出所有的移动目标的关键性像素,从而导致最后的呈像会出现一些空洞的现象。那么针对于这一重大的缺点我们的技术人员就运用了我们的对称帧数差分法来进行缺陷的修补。

这一方法主要就是在进行获取了的图像帧数中针对于每三帧数的图像信息来进行的对称差分法的修补,对称差分法主要就是运用了从上一帧数的图像信息中进行模块的切割来进行的移动目标的帧数范围的确定,这样能够得到一个较为清晰的移动目标帧数的移动范围,从而更好的确定目标的信息帧数,达到更为清晰的画面的展示。帧数之间的差分法对于背景为移动画面时的移动目标的画面捕捉是最为适合的,因为帧数差分法对于移动的物体更加的敏感,或者说这一方法只适合运用到移动的物体间。其实,帧数间差分法捕捉的主要就是相对来说是移动的物体,从而造成了捕捉到的两个画面之间的时间值很短,所以就会不容易受到外界光照等因素的影响。这也是帧数间差分法和上一方法之间最大的区别之一,帧数间差分法具有简单有效并且不容易受到外界的影响,具有效果稳定,反应速度快等特点。

2.3光流法

这一方法能够充分的用捕捉到的图像信息来进行移动目标信息的获取。运动场能就是移动在空间力矩中的表示,那么要在一个平面上表现物体的移动就是通过平面中的阴暗对比色调来进行移动物体的展示的。最后就会使得整个的运动场在画面上进行展示,这种现象我们称之为光流现象。那么光流就是指一瞬间产生的运动力场而变现的现象,其中就有一些基本的移动物体的很多信息。那么针对于光流现象我们就采用了时间变化而变化的光速效应,因为光速流中包含有大量的信息可以进行有效的利用。在理想状态下可以进行移动目标的测量,并且可以不用其余的参照物来进行参照对比。能够做到最大限度的得到移动物体的移动信息,可以运用进行背景动态运转时对于移动目标物体的跟踪计算测量。

但是这一方法主要的缺点就是对于仪器设备的要求很高,不能够第一时间的进行分析计算处理。对称差分法主要就是运用了从上一帧数的图像信息中进行模块的切割来进行的移动目标的帧数范围的确定,这样能够得到一个较为清晰的移动目标帧数的移动范围,从而更好的确定目标的信息帧数,达到更为清晰的画面的展示。帧数之间的差分法对于背景为移动画面时的移动目标的画面捕捉是最为适合的,因为帧数差分法对于移动的物体更加的敏感,或者说这一方法只适合运用到移动的物体间。

3 结束语

跟踪目标的算法现在已经有很多种,每一种的类型和方式都是不一样的,但是这些算法无一例外都是只能够针对于某一种情况或者是多种情况来进行移动目标的跟踪计算分析处理,并不能够做到所有的环境都使用一种算法的理想状态,所以这也是以后要研究和解决的地方。现在最为流行的无疑是双帧和三帧以及背景差分和光流算法这几种,这几种方法不是彼此之间相互独立的,而是可以相互之间进行变换和融合的。所谓的移动目标跟踪就是要创建一个以移动目标为对象的实时移动的数据模型来进行实时的跟踪计算。其实,帧数间差分法捕捉的主要就是相对来说是移动的物体,从而造成了捕捉到的两个画面之间的时间值很短,所以就会不容易受到外界光照等因素的影响。这也是帧数间差分法和上一方法之间最大的区别之一,帧数间差分法具有简单有效并且不容易受到外界的影响,具有效果稳定,反应速度快等特点。采用一种好的算法能够很大程度上保证最后得到的移动目标的计算跟踪结果更加精确和精准。这一算法将在以后的时间中一样被人们所热爱和研究,因为这些算法还有很大的提升空间来进行改进和创新。

摘要:在进行背景非常复杂的情况对于移动目标进行监控并进行跟踪的算法研究已经取得了突破性的进展,那么人的眼睛对于自己所处的环境能够进行感觉和捕捉作用,尤其是对于大量运动物体的移动能够提取相关的信息输入进大脑,然后进行综合计算得到有用的信息。并且能够捕捉到有用的信息以后进行下一步移动物体的预算处理。这也是本文主要研究的对于移动目标物体在复杂背景下进行移动预测研究算法的主要目的。

关键词:移动目标,跟踪算法,算法原理

参考文献

[1]施家栋,王建中.动态场景中运动目标检测与跟踪[J].北京理工大学学报,2009(10).

[2]陆军,李凤玲,姜迈.摄像机运动下的动态目标检测与跟踪[J].哈尔滨工程大学学报,2008(8).

背景复杂度 篇7

红外热成像目标的跟踪是红外告警系统、空载下视系统对低空及地面目标的监视和红外寻的制导等军事领域中的关键技术。但是,红外热成像多为背景噪声干扰大,分辨率低的图像序列,尤其远距离检测时目标成为点源,缺少细节和形状等信息,加上在拍摄过程中目标相对于背景高速运动,使得红外目标的跟踪成为技术难题。

Mean Shift算法是目标跟踪广泛应用的一种方法,它是一种以目标区域像素值的概率分布为特征,搜索与样本点分布最相近模式的非参数统计方法[1]。由于采用了统计特征,该算法对噪声有很强的鲁棒性。另外,由于它采用核函数直方图建模,对边缘阻挡、目标的旋转、变形以及背景运动都不敏感,并且具有运算速度快、实时性好等优点。但是,该算法在跟踪快速运动的红外目标时,系统将会变得不稳定,最终可能导致目标丢失。因此,必须对Mean Shift方法改进[2,3,4],使其能增强跟踪复杂背景下快速运动红外目标的准确度。

为此,本文提出了一种基于非线性边缘检测和Mean Shift方法相结合的红外目标跟踪算法。非线性边缘算法可对复杂背景下运动图像序列进行快速边缘检测[5],以获取高质量目标边缘图像;在此基础上,利用Mean Shift改进算法对目标实施准确跟踪。

1 非线性边缘检测算法

在实际应用中,所获取的红外热图像包含着大量的噪声点,这些噪声点可能影响到边缘点的检测,得到的边缘图像不尽人意,因此这里所述的边缘检测算法首先利用传统的梯度算子[6](如Sobel算子)对图像边缘点进行初选,滤除绝大部分的噪声后,再利用一种非线性算子实现高质量的图像边缘检测,得到目标边缘的二值图像。非线性边缘检测算法思想如下:

在初选的灰度图像I(x,y)中选取一个像素点s为圆心,建立两个同心圆形窗口W1(s)(半径为R1)和W2(s)(半径为R2),求出两个圆形窗口的中最大灰度值(Max1、Max2)和最小灰度值(Min1、Min2)。定义双窗口算子D(s),其表达式如下:

任取候选边缘点集Ω0中的一点(x,y),计算D(x,y)的值,所得D(x,y)的符号可能为正、零或负。如果D(x,y)=0,则该像素点是边缘点;否则,如果D(x,y)>0,并且沿水平和垂直方向的4个领域中至少有一个像素点处的D(x,y)<0,即算子D出现了符号改变,则像素点也被认为是边缘点。

若令双窗口算子中的内窗口半径R1=0,外窗口半径R2的大小由边缘轮廓的尺寸确定,则式(1)变为

可见,I(x,y)在W2(s)中的最大值和最小值确定了s邻域中最大斜率的方向,D(s)近似于沿此方向的二阶导数,因此基于双窗口算子D(s)的零交叉检测可以用于提取图像边缘,这种算子与非线性的拉普拉斯算子类似,为一种高通的非线性算子。

2 改进的Mean Shift目标跟踪算法

传统的Mean Shift跟踪算法,依赖于由目标区域得到的灰度分布和纹理特征,利用统计分布的概念描述目标,通过相似函数计算图像空间中目标中心的位移。此算法所需参数少、鲁棒性较强、能够快速的实现模式计算,具有良好的实时性。但是由于红外目标对比度低,背景亮度经常高于目标亮度,此时仅使用灰度特征的核密度估计很难实现对目标的准确跟踪。为此在Mean Shift目标跟踪方法中,作了如下改进:一方面,融合由目标区域局部标准差的核密度估计所得到的信息[7];另一方面,为了克服用单一的灰度空间里建立目标灰度的概率密度分布时,目标灰度的概率密度分布描述不稳健的缺点,提出构造级联的灰度空间作为特征空间的想发。

局部标准差图像是通过源图像中每个像素的邻域得到的,是一种非常好的描述局部图像结构频率特性的方法。根据所定义的邻域M,图像中像素点s=I(x,y)的局部标准差计算如下:

式中:I为图像函数,Xi为空间坐标,N为邻域M中的像素个数。融合了目标区域局部标准差核密度估计的Mean Shift的跟踪方法如下。

2.1 目标模型的建立

目标模型是灰度值和局部标准差的概率密度函数,并采用核密度估计,核函数选用Epanechnikov核,因为该核在连续空间中能够产生最佳的积分均方误差(MISE)[8]。两个Epanechikov核的级联形式如下:

第一个核作为特征直方图的加权因子,即以特征值为中心放置一个一维核。第二个核是通过特征的空间位置与目标质心之间的欧氏距离来确定特征的空间关系,即以目标质心为中心放置一个二维核,核的值表示空间权重。使用联合核,目标特征u的核密度估计可由下式给出:

式中:C为归一化常量,

利用核密度估计方法建立目标特征的概率密度分布,实现目标模型的描述。假设包含目标的搜索窗口中,第u个特征值的概率密度函数:

式中:x0为搜索窗口的中心像素坐标,xi为第i个像素的坐标;k(||x||2)是核函数,h表示核函数的带宽,即目标的半径;b(xi)和δ函数的作用是判断目标区域中像素xi的特征值b(xi)是否属于特征值u,C是归一化函数。

在后续的帧图像中,使用相同的核函数和半径h,以y为中心,计算可能存在的目标特征u在候选模型中出现的概率,从而获取候选目标模型,形式如下:

其中:Ck为归一化因子,h决定了候选目标尺度。也称为描述目标和候选目标的灰度直方图特征。

2.2 目标跟踪方法

假定目标在第0帧首次出现,x0表示它的中心,利用式(5)分别计算模板的灰度图像QI和局部标准差图像Qσ每一灰度级的核密度估计。直接通过最小化模板和目标之间的距离,定位目标位置y,从而在当前帧中找到目标位置。距离定义如下:

式中:ρ(y)是修改的Bhattacharya系数,它融合了图灰度和局部标准差的特征。修改的Bhattacharya系数可理解为模板与候选目标分布的相似程度,其相似函数定义如下:

式中L为灰度和局部标准差分布的灰度级数。系数越大,距离值就越小,候选目标与模板也就越相似。因此,目标跟踪成了在当前帧中从上一个目标位置的邻域内搜索目标的新位置,使得以位置y1为自变量的距离函数取得最小值。利用Taylor展开式将式(8)在上一个目标位置y0处展开,其线性近似为

其中

可见,式(10)中第一项与y1无关。因此,要使d(y)最小,应使式(10)中的第二项最大,而该项代表着当前帧中位置y1处使用K2(X)计算的核密度估计,其中ψi为它的加权值。这样就可以使用Mean Shift向量不断的迭代,寻找邻域内该核密度估计的极大值。在这个过程中,核中心从当前位置y0移向新位置y1,其可表示为

重复以上过程就可以实现对当前帧中目标的跟踪。

2.3 模板更新

在上述的跟踪方法中,模板更新根据图像序列中目标特征的帧间相关性自动完成。为了利用目标特征改变的帧间相关性,可把相似度距离的分布看作高斯分布。在每一帧都通过下面两个公式进行更新:

式中k为当前帧序号。由公式可看到,模板的更新取决于当前的距离值dk,距离的门限值由上式决定,即如果dk<µk-2σk,则更新目标模板。

3 算法步骤及流程

首先,利用非线性边缘检测算法获取红外图像序列中边缘像素点集,其结果是滤除大量噪声点后的二值图像,并将其作为后续的目标跟踪数据源。边缘检测的流程如图1所示。

然后,对边缘检测后的灰度图像进行目标跟踪。假定目标出现在初始帧为0帧,当前帧为第k帧。计算目标模板灰度QI和标准差分布Qσ,利用式(6)计算目标中心的直方图;计算第k帧的候选目标灰度PI和标准差分布Pσ,利用式(7)计算候选目标中心的直方图。目标模板与候选目标分布之间的距离用dk表示。利用改进的Mean Shift跟踪算法进行红外目标的跟踪,步骤如下:

1)利用式(5)计算检测的目标的QI和Qσ;利用式(6)计算目标中心的;

2)在第k帧图像中使用上一次的目标中心初始化当前的目标中心,计算当前的PI和Pσ;利用式(7)计算候选目标的;

3)根据式(10)、式(11)、式(12)计算迭代的Mean Shift向量;

4)计算距离dk,根据其值确定是否跳转到第2步;

5)判断距离dk,是否满足dk<µk-2σk。若满足则更新QI和Qσ;

6)利用式(13),更新µk和σk,返回到第2步。

4 实验与结果分析

1)利用真实的红外图像,验证非线性边缘检测的性能。

原始图像为以天空为背景的高速运动的飞机目标。为了分析对比检测结果,分别利用了Sobel算子和本文提出的算法进行了实验,利用MATLAB6.5进行了结果仿真。实验采用两帧原始图像,一帧原始图像包含了弱小目标的图像,另一帧包含了面目标的图像,如图2中的(a1)、(a2)所示。图2中的(b1)、(b2)为利用Sobel算子检测的结果,(c1)、(c2)为Sobel初检后,又利用双窗口算子进行检测后的结果。

由检测的结果可看出,Sobel算子虽然可以滤除大部分噪声,把目标的边缘轮廓检测出来,但在背景噪声较大或高频噪声点时,检测结果中包含噪声点,如图2(b1)中目标被检测到,但同时也检测出背景的纹理;图2(b2)中目标比较清晰,但存在大量的噪声点。经过双窗口算子后,效果较好,如图2(c1)和图2(c2)。

2)跟踪效果的实验。

以地面背景下的运动汽车为目标的红外图像序列。该实验序列长度为300帧,每帧图像的大小为128×128。目标模型的大小(核函数的半径h和)为(h,h)=(6,6),图像处理速率为10(帧/秒)。首先利用本文提出的边缘检测算法对第0帧原始图像进行目标检测,如图3所示,并用手动方式确定目标的中心位置。图4为边缘检测和Mean Shift方法相结合的跟踪处理的结果,第0帧的图像为本实验红外序列图像的第0帧,其中十字叉丝的交点为目标检测后得出目标的中心位置。可以看到,本文方法能够对红外目标实现实时的准确跟踪。

5 结论

本文提出的红外目标检测和跟踪算法,结合了非线性边缘检测和Mean Shift跟踪方法的各自优点,其中非线性边缘检测具有计算量小、速度快、检测出图像质量高等优点;在目标检测出来的基础上,利用改进的Mean Shift跟踪算法,对红外目标实时跟踪,该方法克服了传统Mean Shift跟踪方法对目标对比度低的跟踪效果不佳的现象。实验结果表明,非线性边缘检测分割出的目标边缘清晰,图像质量好;在手动确定第0帧目标的中心位置后,可以对复杂背景下的红外目标准确跟踪,并能够自动更新目标模板。

参考文献

[1]宋新,沈振康,王平,等.Mean shift在目标跟踪中的应用[J].系统工程与电子技术,2007,29(9):1405-1409.SONG Xin,SHEN Zhen-kang,WANG Pin,et al.Application of Mean shift method in target tracking[J].Systems Engineering and Electronics,2007,29(9):1405-1409.

[2]程建,杨杰.一种基于均值移位的红外目标跟踪新方法[J].红外与毫米波学报,2005,24(3):231-235.CHENG Jian,YANG Jie.Novel Infrared Object Tracking Method Based On Mean Shift[J].J.Infrared Millim.Waves,2005,24(3):231-235.

[3]杨烜,裴继红,谢维信.基于运动特征的远距离红外目标检测方法[J].电子与信息学报,2007,29(8):1829-1832.YANG Xuan,PEI Ji-hong,XIE Wei-xin.Long Range Moving Target Detection Based on Motion Analysis[J].Journal of Electronics&Information Technology,2007,29(8):1829-1832.

[4]颜佳,吴敏渊,陈淑珍,等.基于Mean Shift算法的伪装目标跟踪[J].光电工程,2009,36(2):11-15.YAN Jia,WU Min-yuan,CHEN Shu-zhen,et al.Camouflaged Target Tracking Based on Mean Shift[J].Opto-Electronic Engineering,2009,36(2):11-15.

[5]梁燕,刘文耀.一种新型非线性边缘检测算法[J].光电子.激光,2003,14(12):1332-1335.LIANG Yan,LIU Wen-yao.A New Nonlinear Algorithm for Edge Detection[J].Journal of Optoelectronics.Laser,2003,14(12):1332-1335.

[6]王苑楠.图像边缘检测方法的比较和研究[J].计算机与数字工程,2009,37(1):121-127.WANG Yuan-nan.Comparison and Research on Image Edge Detection Method[J].Computer&Digital Engineering,2009,37(1):121-127.

[7]Comaniciu D,Ramesh V,Meer P.Real-Time Tracking of Non-Rigid Objects Using Mean Shift[C]//IEEE Conference on Computer Vision and Pat tern Recognition,Hilton Head Island,SC,June13-15,2000,2:142-149.

背景复杂度 篇8

车牌识别系统是现代智能交通系统中的一项重要研究与应用, 一般主要有三个步骤:车牌定位、字符分割和字符识别[1,2,3]。车牌定位是车牌识别系统的首要步骤, 是进行后续分割和识别的先决条件, 它的准确率和稳定性极大地影响了整个系统的准确率和稳定性[4,5]。

目前车牌定位技术主要分为两大类:一是基于车牌纹理特征的定位方法, 二是基于车牌颜色特征的定位方法。近十几年来, 针对前者的研究已相对成熟, 主要方法有:基于灰度特性方法[6,7]、基于遗传算法方法、基于神经网络方法[8]、基于数学形态学方法[9]和基于小波变换方法[10]等。这些方法在不同光照条件下可以快速定位车牌。但在复杂背景中, 如车牌区域周围有文字广告或车灯时 (如图1 (a) 、 (b) 、 (c) 所示) , 干扰区域的纹理与车牌纹理及其相似;车牌有污迹或字符缺失或严重倾斜时 (如图1 (d) 、 (g) 所示) , 车牌区域的句法特征改变。这些情况下, 仅利用纹理特征将车牌从复杂背景中精确定位出来是存在较大困难的。

机动车牌照具有固定的颜色搭配, 而且颜色本身就是强有力的描绘因子, 能提供更多的视觉信息。因此, 近年来基于颜色特征的车牌定位方法受到越来越多关注。例如王义兴[11]、Vahid Abolghasemi等[12]提出了检测车牌边缘颜色对的定位方法, 这对于颜色对比度强的车牌定位效果良好, 但当车身跟车牌颜色相近 (如图1 (e) 、 (f) 所示) 或车牌变色 (如图1 (g) 、 (h) 所示) 时, 定位往往失效。上海交通大学樊孝宏等[13]利用区域生成算法判定车牌颜色, 山东大学聂洪印等[14]采用多级灰度标记不同颜色定位车牌, 他们利用颜色作用于整幅图像来定位相对较小的车牌区域, 效率显然不高。郑成勇[15]提出的基于不包含亮度信息的颜色特征的车牌提取方法, 尽管适应了不同光照条件, 但忽略亮度来判断颜色相似性是不准确的。颜色的HSI/V三个属性互相制约, 一个颜色的某一个属性发生改变, 那么相应的颜色必然要发生改变。

目前, 由于背景复杂和车牌颜色定量不准确等难点, 车牌定位尚未有一种有效的解决方案。为此, 本文提出一种将车牌纹理和颜色相结合的车牌定位方法。基于纹理粗定位可以有效提取车牌等纹理信息较强的候选区域, 并排除车身颜色可能对精定位产生的干扰, 提高了定位效率和准确率。综合RGB三通道基于颜色聚类分割精定位可以充分利用颜色信息, 不用定量颜色范围, 即可将属于同一种颜色的区域聚为一类, 剔除纹理类似的区域, 精确分割出车牌。

1 复杂背景中基于纹理和颜色的车牌定位

1.1 量化定义颜色不准确的问题

当天气、光照等客观条件良好, 车牌颜色鲜艳, 根据上述文献中的算法定义颜色范围, 能够准确定位车牌区域。但是颜色范围的测定往往运用多次测量的平均值来代替真实值, 具有测不准性[16]。而且, 我国车牌虽然有固定颜色搭配, 但现实中不同地区和时间派发的牌照即使是同一种颜色, 也存在色差 (如图1 (e) 、 (f) 所示) 。另一方面, 由于车牌使用时间、光照明暗、天气情况、环境多样和摄像硬件等客观条件影响, 图像中的车牌颜色或变化或模糊 (如图1 (g) 、 (h) 所示) 。所以, 通过统计和数学变换RGB或HSI三分量, 定义一个明确的颜色范围来定位车牌在理论上是可行的, 但在现实中是有难度的。图1 (e) 、 (f) 两张图中车牌都是蓝底白字, 且车牌和车身同色。将图1 (e) 、 (f) 中车牌和车身分别随机取21×18个蓝色像素点, 以R→X, G→Y, B→Z的方式映射到三维空间中。映射结果如图2 (a) 所示, 其中蓝色和粉红色, 绿色和红色四种点集分别表示图1 (e) 车牌和车身, 图1 (f) 车牌和车身区域中的蓝色像素集。同样, 将图1 (e) 、 (f) 、 (g) 、 (h) 四图中的车牌底色映射到三维空间, 如图2 (b) 所示, 其中蓝、绿、黄和红四种不同点集分别表示四个车牌区域中的不同蓝色像素集。

如图2 (a) 所示, 车身与车牌的点集 (如蓝色和粉红色点集) 存在不少重合。车身和车牌同色时, 车身就是强干扰, 通过定义RGB取值范围定位出的车牌区域往往超越车牌边框。如图2 (b) 所示, 相同标记色的点集明显形成独立的堆, 不同标记色的点集间重合点很少。这四种车牌虽然都是蓝色, 但存在很大的差异性, 很难定义统一的RGB取值范围来覆盖。因此, 在RGB颜色模型下, 企图用定量颜色范围的方法来定位复杂背景图像中的车牌存在较大误差。在HSI/V颜色模型下也是如此。

1.2 本文算法思想

针对上述复杂背景中存在广告文字、车灯等纹理干扰, 同色车身等颜色干扰和量化颜色不准确等车牌定位问题, 本文提出了一种综合纹理粗定位和颜色聚类分割精定位的车牌定位方法。车牌粗定位算法中首先采用去背景增强法, 对车牌灰度图像进行预处理, 然后使用Sobel算子对预处理后的车牌图像进行垂直边缘检测, 分析和提取出纹理密集的区域, 使用行列扫描及形态学方法处理后得到车牌候选区域。精定位算法中, 提出了综合利用RGB三通道在空间的密度作为颜色的相似性度量, 基于该度量运用改进的k-means聚类算法处理候选区域, 将聚为一类的区域视为具有相同颜色的区域。最后基于车牌句法特征筛选精定位后的区域, 得到精确的车牌。算法流程如图3所示。

1.3 车牌粗定位

由于车牌区域通常只占图像的一小部分, 而且同色背景区域可能带来干扰, 直接基于颜色处理整幅图像效率和准确率都不高。故本文首先进行车牌粗定位, 利用车牌丰富的垂直边缘信息和字符纹理信息, 从图像中提取车牌候选区域。

复杂背景中, 车牌图像干扰较多, 通过预处理过滤干扰性纹理并增强车牌纹理是必要的。我们发现, 通过开运算处理图像可以消除小物体纹理, 并在纤细处分离物体与平滑较大物体边缘。因此, 本文首先将原始彩色车牌图像 (如图1 (a) 所示) 转变成灰度图像 (如图4 (a) 所示) , 然后将灰度图像进行开运算得到背景图像 (如图4 (b) 所示) , 运用灰度图像去除背景图像得到增强图像 (如图4 (c) 所示) 。

从车牌增强图像的效果可以看出, 不明显的车灯、车身表面的铆钉等干扰信息已经消除, 而车牌区域纹理和广告牌等某些干扰性纹理都被增强了。

观察分析可知, 即使背景复杂, 车牌区域的垂直边缘仍是相对稳定的纹理特征。因此, 本文在图像去噪增强的基础上, 使用Sobel垂直边缘检测算子提取边缘 (如图4 (d) 所示) 。利用与车牌尺寸相适应的掩模矩阵E对边缘图像进行卷积, 根据阈值T提取纹理密集区域 (如图4 (e) 所示) 。其中掩模矩阵E、阈值T的参数设置是根据图像分辨率决定的。而本文实验的车牌图像 (除图1 (d) 外) 都是从某一收费站的视频中获取, 这些参数值的设定都是统一的经验值。然后通过行、列扫描连接水平和垂直边缘, 并对连通区域进行闭运算和填充孔洞处理, 得到完整的连通区域 (如图4 (f) 所示) 。再在原始彩色图像中提取这些候选区域, 如图5所示。

由图5可知复杂背景中, 基于纹理的粗定位结果并不精确, 存在很多纹理丰富的强干扰区域。车牌区域和广告文字区域更是由于位置接近而被分割到同一个区域中, 但颜色存在很大差异。本文将利用车牌颜色特征进一步定位。

1.4 车牌精定位

为了去除相似纹理强干扰区域和改进量化定义颜色不准确导致车牌定位不稳定的问题, 本文提出将RGB三通道映射到三维空间, 利用其密度作为相似性度量来进行改进的k-means聚类。将聚为一类的区域视为具有相同颜色特征的一类, 无需判定车牌颜色, 实现车牌与周边干扰区域的分离。

k-means聚类算法是一种迭代式的无监督算法, 以确定的聚类数目K和选定的K个初始聚类中心为前提, 根据数据相异性度量, 不断调整聚类中心, 最终将对象划分为局部最优的K个类。这使得同一类内的相似度最大、差异性最小, 而不同类间的相似度最小、差异性最大。其优点是简单易行, 数据量不大时效率很高。但是该算法存在如下缺点:1) 聚类数目K需要预先给定;2) 算法对聚类中心初始值敏感, 易陷入局部极小;3) 当数据量非常大时, 算法的时间开销非常大[17,18,19]。

k-means聚类算法要求事先给定K值, 但在实际中由于缺乏经验, K值一般难以确定。而对于不同的初始聚类中心的选择, 可能会导致不同的聚类结果, 即聚类不稳定。为了避免这两大缺点, 有动态确定K值和确定适当的聚类初始中心两种途径。本文利用RGB三通道在空间的密度作为颜色的相似性度量, 改进k-means聚类算法。其具体步骤如下:

1) 将候选区域各像素点的RGB三通道映射到三维空间:

2) 计算空间所有点之间的距离:

3) 计算每个点t-邻域内包含点的个数P, 满足最小数目不超过Pt时, 将其加入高密度区域集合D中;

4) 将集合D中的点按P值降序排列后得到序列{k1, k2, k3}, 将k1加入到初始聚类中心集合C;

5) 若k1和k2的距离大于集合D中各点之间的平均距离, 则将k1加入到初始聚类中心集合C;

6) 继续从集合D中找出聚类中心, 最后得到K个初始聚类中心;

7) 从这K个初始聚类中心出发, k-means聚类分割车牌候选区域。

上述步骤基于车牌区域RGB三通道的空间密度动态确定了聚类数K值和初始聚类中心值。例如, 粗定位得到带有车牌的候选区域大小为244像素×26像素, 经过步骤1) -6) 处理后, 得到聚类数目和K个初始聚类中心点:

再从这5个初始聚类中心出发, 运用k-means算法得到的聚类效果如图6所示, 5个聚类区域分别用5种颜色标记。

由图6可知黄色标记区为要提取的目标区域。按外接矩形提取区域后得到精确的车牌区域 (如图7 (a) 所示) 和伪区域 (如图7 (b) 所示) 。

1.5 车牌筛选

精定位能得到精确的车牌区域, 但干扰性强的伪区域也较多, 直接进行字符分割和识别效率不高, 所以高效筛选车牌区域和剔除伪区域是必要的。车牌有特定的句法特征, 它由7个字符组成, 每个字符的高度和宽度都相等。故本文首先结合全局阈值法和局部阈值法提出一种改进的自适应二值化算法, 使之能够对复杂背景中定位得到的各区域, 特别是车牌区域, 准确二值化 (如图8 (a) 、 (b) 所示) 。选取二值图中的连通区域, 满足车牌句法特征, 则为车牌区域;否则为伪区域。剔除伪区域后就得到有效精确定位的车牌 (如图8 (b) 所示) 。

2 实验结果与分析

本文算法在2.0GHz CPU, 1G内存, Win XP系统平台下实现, 采用VC++6.0和Matlab.R2008b联合编程。为了验证其有效性和准确率, 分别对某收费站视频中获取的1130张低质量图像 (图像分辨率为720像素×288像素, 车牌分辨率低于120像素×40像素, 光照条件差) 和相机采集的104张高质量图像 (图像为1 600像素×1 200像素, 车牌分辨率高于300像素×100像素, 光照条件较好) 进行实验。实验结果如表1所示, 对于这些低质量图像的平均定位准确率达到99.646%, 每张平均定位时间为0.179s;对于高质量图像的平均定位准确率达到98.077% (样本量较少) , 每张平均定位时间为0.921s。

已有基于纹理的定位算法[7], 虽然剔除伪区域效果很好, 但无法将纹理相似的广告文字和距离过近的车灯与车牌分离 (如图9 (b) 、 (d) 所示) ;基于定量颜色范围的定位算法[15]虽然适应不同光照条件下的车牌, 但稳定性和鲁棒性不强, 车牌和车身同色时定位不精确 (如图9 (f) 所示) , 车牌颜色变化模糊时无法定位。不同算法定位效果对比如图9所示, 不同算法准确率对比如表2所示。

比较可知本文算法准确率高, 且具有很强的稳定性和鲁棒性。图1各具有强干扰的车牌图像都能准确定位 (如图10 (a) 所示) 。从复杂背景图像中定位得到的各种蓝色、黄色与白色车牌 (如图10 (b) 所示) , 可以很直观地反映这些蓝色与黄色存在很大色差, 难以量化定义。

3 结语

上一篇:社团实践理论下一篇:FibroScan