运动复杂度

2024-07-20

运动复杂度(精选8篇)

运动复杂度 篇1

0 引言

市场需求和技术进步共同推动着3G移动视频业务的快速发展, 并使其成为移动运营商、设备制造商和内容提供商等竞相追逐的“杀手锏”业务。目前消费市场对移动视频业务的认可度和期望值都很高, 预计在未来几年内移动视频业务将是推动3G网络发展的源动力。

H. 264 / AVC是由ISO / IEC与ITU-T制定的最新视频编码标准, 具有较高的图像质量、较强的抗误码性和良好的网络亲和性[1]。H. 264 目前已在移动通信、卫星广播、远程监控、电视会议、远程教育医疗、IPTV等领域获得广泛应用[2]。

移动终端设备的处理能力相对PC机来说有很大的差距, 这使得其对视频编解码器的运算量提出了极高的要求。况且H. 264 兼顾从低码率视频通信到高清电视等高码率的广泛应用环境, 在考虑具体应用时, 需根据应用的场景和对象的特点, 对编解码模块进行优化。

运动估计ME ( Motion Estimation) 是视频编码中的一项核心技术。研究表明, H. 264 中运动估计模块的运算量占整个编码器运算量的60% - 90%[3], 并且伴随参考帧数的增加该比重也逐渐增大。因此, 要想降低H. 264 编码器的计算复杂度, 提高其编码速度和图像质量等性能指标, 应首先考虑优化运动估计算法模块, 这也一直是视频编码领域的研究热点之一。

1 快速运动估计算法分析

H. 264 标准最新采用的非对称十字型多层次六边形格点搜索算法UMHexagon S[4 - 6]是目前综合性能最好的快速运动估计算法之一。该算法具有起点预测准确、多样化的搜索模板和搜索方式、采用率失真优化准则等优点, 在很大程度上提高了预测的有效性和鲁棒性。但是UMHexagon S算法没有考虑最佳运动矢量的分布特性, 且它兼顾从低码率视频通信到高清电视等高码率的应用环境, 导致运算复杂度依然较高, 不适合移动终端等特定应用。

资料显示[7,8], 适合硬件 ( 如DSP、ASIC、FPGA等) 实现的快速运动估计算法仍然是比较传统的新三步法 ( NTSS) 、四步法 ( FSS) 、菱形搜索法 ( DS) 以及基于块的梯度下降法 ( BBGDS) 等经典算法。综合比较而言, NTSS搜索速度最慢, 但是对具有大量运动和丰富细节的视频序列效果较好。FSS算法对于缓慢运动的视频序列性能较好。DS算法搜索速度快, 但性能不佳。BBGDS算法的搜索速度最快, 但很容易陷入局部最优, 适用于只含有少量运动的视频序列, 对于含有大运动的序列, 搜索质量明显下降。

针对移动视频通信系统的特点, 近些年许多学者开展了一系列研究。比如张永辉等根据运动矢量的空间相关性提出了一种快速算法[8,9], 适合小中运动的视频序列。毛小明等提出了搜索范围自适应的快速算法[10], 能根据相邻块运动矢量的大小来自适应地调整搜索范围, 以节省不必要的搜索点。Sarwer和张新安等改进了基于提前终止策略的快速算法[11,12], 引入提前终止技术, 虽然速度有很大提高, 但也势必会降低搜索准确度。从测试结果看, 这些算法对细节较少且运动缓慢的视频序列效果较好。纵观国内外最新的研究成果, 这些快速运动估计算法在编码复杂度和率失真性能之间取得了较好的平衡, 但是针对不同运动级别和不同纹理细节的视频序列, 各算法的鲁棒性和普适性都还需做进一步的研究。

2 本文运动估计策略设计

2. 1 块匹配代价准则

块匹配代价准则用于衡量图像块之间的相似程度, 但是据资料显示各种块匹配函数的性能差别并不显著。考虑到移动终端设备的硬件性能, 为了降低计算复杂度, 本文采用运算量最小的绝对差之和SAD ( Sum of Absolute Difference) 作为搜索算法的匹配准则, 其计算公式如下:

其中, mv表示当前块的运动矢量, pmv表示预测的运动矢量, f和g分别表示当前块和参考块的像素值, λ 表示拉格朗日系数, SAD为当前块与参考块之间的绝对误差和。

2. 2 自适应的提前终止阈值

本文提出一种自适应的提前终止阈值ETT ( early termination threshold) , 使其能对不同运动类型的视频自适应地修改阈值, 从而在准确度与速度间达到一个很好的平衡。提前中终策略的基本思想是“找到足够好的匹配块就停止, 而并非要找到最好的匹配块”。在运动估计过程中, 当块匹配代价小于提前终止阈值时, 即认为已经找到了足够好的匹配块, 并终止搜索, 从而提高运动估计的速度。

由于H. 264 中4 × 4 块是物理尺寸最小的宏块划分模式, 且运动矢量也都是以4 × 4 块为单位进行保存和编码。所以本文取相邻4 × 4 块最佳匹配代价Jrefmin的均值作为提前终止阈值ETT , 其定义公式如下:

其中, Jt ( a) 、Jt ( b) 、Jt ( c) 和Jt ( d) 分别表示当前编码块的左边、上边、右上边和左上边等相邻4 × 4 块的Jrefmin。本文提出的自适应提前终止阈值算法的核心思想是将预测矢量的Jmin与该阈值ETT比较来决定是否需要进一步搜索。

本文对每个4 × 4 块的Jmin与提前终止阈值ETT之间的离差分布情况进行了实验统计, 离差分布结果如图1 所示。实验中, 平均每帧的离差数组分布计算公式为:

其中, Jmin表示当前块的最佳匹配代价, ETT表示由式 ( 2) 计算得到的提前终止阈值, N表示编码帧数。

图1 中, “均值”表示相邻块Jrefmin的均值与当前块Jmin的离差曲线, “左块”表示左边相邻块与当前块Jmin的离差分布曲线。从图2 可以看出, 相邻块的匹配代价具有很强的相关性, 相邻块Jrefmin的均值最适合作为提前终止阈值ETT , 且它能根据周围块的匹配情况自适应地调整阈值大小。

2. 3 搜索模板和起始点预测

利用相邻块之间的运动相关性选择一个反映当前块运动趋势的预测点作为搜索起始点, 从预测点开始搜索可以有效提高搜索速度和搜索精度。本文采用中值法来预测搜索起始点, 其基本思想是: 选取左边、上边、右上边运动矢量的中值来预测搜索起始点。实验统计表明, 当前块与帧内左边、上边、右上边的相邻块的相关性最强, 而与其他位置的相关性则较弱。当前编码块运动矢量Vp的预测公式如下:

其中, Vp为当前块的预测矢量, 即预测的运动估计搜索起始点, V1、V2、V3分别为相邻参考块的运动矢量。由于宏块内依照ZigZag顺序先后编码的原因, 未必每个相邻块都已经完成编码, 也就没有相应的运动矢量可作为参考。因此, 如果右上边块不可得, 则用左上边块代替; 其他相邻块不可得, 则放弃选作参考。

2. 4 混合搜索策略

根据表1 的运动矢量相关性统计数据, 周边相邻块的运动矢量场表现出明显的中心偏置特性。在进行运动估计时, 本文根据局部运动矢量的一致性程度, 判断运动趋势的可预测性, 进而采取不同的混合搜索策略。运动趋势分类定义如式 ( 5) 所示, 其中Vpx和Vpy分别代表水平和垂直方向的预测运动矢量。

在初步判定运动趋势后, 便可以根据运动情况选择更合适、更具针对性的运动搜索策略。如果该局部对象的运动矢量场具有连续平滑的特征, 则用小模板配合提前终止策略直接进行精确定位搜索; 如果该局部的运动矢量场表现出一定的分散性, 则采用先快速跟踪搜索后精确定位搜索的混合搜索策略。由表1的运动矢量相关性统计数据可知, 当相邻块的运动矢量相同时, 最佳匹配点就在预测的搜索起始点附近, 本文算法对这种情况直接采用小模板搜索。

表1 的实验数据均采用JM85 全搜索算法编码测试100 帧得到, 表中“相邻相等”指3 个相邻块的运动矢量都相等的概率; “原点”指在相邻块运动矢量相等的基础上, 当前块最终运动矢量就是预测点的条件概率; “1 × 1”指最终运动矢量分布在预测点周边1 个像素范围内的条件概率。

3 本文运动估计算法的混合搜索流程

本文运动估计算法搜索流程如下:

( 1) 首先检测预测的起始搜索中心, 如果其匹配代价小于提前终止阈值ETT , 终止搜索; 否则进行步骤 ( 2) 。

( 2) 平滑区和小幅运动区, 小模板精确定位搜索。若满足max ( | Vpx | , | Vpy | ) < T, 即预测的运动幅度小于预先设定的阈值T, 则表明当前块极有可能是小幅运动。或者满足V1= V2= V3, 即3 个相邻参考块的运动矢量相等, 则表明当前块所在区域的纹理非常均匀, 当前块只需在预测的搜索起始点周围做小范围搜索就非常有可能找到全局最佳匹配块。

因此对这两种情况, 都进行步长为1 的小模板搜索。直至当前匹配代价最小的点为搜索中心, 或此轮搜索得到的匹配代价Jmin小于阈值ETT , 终止搜索。

( 3) 对于大运动, 先进行大模版快速跟踪搜索。继续比较| Vpx | 与| Vpy | 的大小, 判断运动方向。若| Vpx | > | Vpy | , 则表明水平方向的运动幅度要比垂直方向的大, 对当前块进行步长为2 的水平大模板搜索, 直至当前匹配代价最小的点为此轮搜索中心。如果其匹配代价Jmin小于提前终止阈值ETT , 终止搜索, 否则转入步骤 ( 4) 。

( 4) 后进行精确定位搜索。以步骤 ( 3) 搜索得到的最佳匹配点为中心, 进行一次步长为1 的小模板搜索, 所得匹配代价最小的点即为最终的搜索结果。

( 5) 对于| Vpy | > | Vpx | 的情况, 采用垂直大模板进行快速跟踪搜索, 具体搜索方法与水平大模板类同。

4 实验结果与分析

为了测试算法对各类型视频序列的鲁棒性、有效性, 本文选用了小运动、中运动、大运动等不同运动幅度的视频序列进行实验测试。又鉴于移动终端屏幕分辨率较低等原因, 本文都选用QCIF标准大小的测试序列进行实验测试。为了分析比较各算法的技术性能, 本文着重从以下几个指标进行实验比较: 即平均搜索点数ANPS ( Average Number of Points Searched) , 平均运动估计耗时AME ( Average Motion Estimation Time) , 编码比特率 ( Rate) , 平均峰值信噪比 ( PSNR) 等指标。

这些比较实验都是在H. 264 测试模型JM85 的baseline上进行的。JM平台本身是为算法研究提供的统一测试平台, 对于本文研究的运动估计模块, JM也提供了专门的时间统计数据。具体实验参数设置为: IPPP, FrameRate = 24, QP = 30, 5 个参考帧, SearchRange = 8, Use Hadamard = 1, 采用7 种块模式及CAVLC熵编码, Frames To Be Encoded = 70。PC机操作系统为Windows XP, CPU为Pentium Ⅳ 双核3GHz, 2GB内存, 编译软件为Visual C ++ 6. 0。

UMHexagon S指JM采用的非对称十字型多层次六边形格点搜索算法, BBGDS指基于块的梯度下降算法, Proposed指本文算法。运动估计性能提高百分比 Δ 的定义如下:

可以看出, Δ 为正表示该项指标性能有提高, Δ 为负表示该项性能有下降。其中, AMEref指UMHexagon S和BBGDS等参考算法的每帧平均运动估计时间, AMEproposed指本文算法的每帧平均运动估计时间。Δ ( U/P) 是指UMHexagon S算法和本文所提算法的性能比较, Δ ( B/P) 是指BBGDS算法和本文算法的性能比较。

表2、表3 和表4 都是各算法对不同运动类型的视频序列前70 帧的测试结果。Mother&daughter序列背景简单, 人物运动幅度不大, 属于小运动序列。News运动变化中等, 运动形式丰富, 画面有多个运动物体, 空间细节比较丰富。Foreman序列运动较快, 既有镜头的运动, 也有物体的运动, 且背景较为复杂。

表2、表3 和表4 的实验测试结果可知, 对于不同运动幅度和画面细节的视频, 本文算法在不同量化系数下都能保持优异的编码性能。按搜索点数 ( ANPS) 计算, 本文算法比其他快速搜索算法节省46. 2% ~ 75. 0% ; 按平均运动估计耗时 ( AME) 计算, 本文算法比其他快速搜索算法减少耗时33. 0% ~ 55. 0% 。与此同时, 本文算法的率失真性能几乎没有下降; 对Foreman序列, 本文的率失真性能甚至比UMHexagon S和BBGDS算法还要好。可见本文算法在各种情况下都能保持与UMHexagon S算法持平的编码性能, 而搜索点数和运动估计耗时大幅下降。

在本文算法中, 运动幅度区分阈值T的选取也是一个很重要的问题。使用阈值T的优点在于, 对不同运动幅度的视频序列可以通过设置阈值T来改进算法性能, 将会有助于加快搜索速度。根据大量实验测试结果证实, 当T = 3 时, 运动估计算法综合性能最佳。

图3 是各算法每一帧编码的PSNR比较, 可见本文算法编码图像的客观质量非常稳定、可靠, 平均PSNR与UMHexagon S算法相当。图4 是在不同量化步长下, 各算法的整数像素运动估计耗时比较。从图4 可见, 本文算法在不同量化系数下都能大幅降低运动估计耗时, 即大幅提高了编码速度。

图 3 各算法对 Foreman 序列编码,每帧的 PSNR 比较

图 4 不同量化步长下,各算法运动估计耗时比较,Foreman 序列

表2、表3 和表4 以及图3 和图4 的这些测试数据都充分说明, 本文算法对于大、中、小各种运动类型的视频有很强的自适应性, 率失真性能保持或者略优于其他算法, 但是运动估计的计算量得到极大降低。与UMHexagon S算法相比, 本文算法最多可以降低75% 的搜索点数, 最多可节省55% 的运动估计耗时, 平均节省52. 9% 的运动估计时间。

5 结语

本文分析总结了快速运动估计算法的典型研究成果, 剖析了可视电话等典型视频业务的特性, 针对移动终端硬件设备的性能特点, 提出了一种高性能、低复杂度的快速运动估计算法。该算法根据局部运动矢量的分布特性来判断运动类型的可预测性, 进而自动选择不同的混合搜索策略; 再结合自适应的提前终止阈值, 在保证精度的同时, 大幅度提高了搜索速度。实验结果表明, 本文算法获得了良好的率失真性能、有效降低了计算复杂度, 是一种具有高性能、低复杂度、高鲁棒性的快速运动估计算法。

摘要:针对移动终端硬件计算能力不足的问题, 提出一种高性能、低复杂度的运动估计算法。算法根据相邻块运动矢量的分布特性, 判断运动趋势的可预测性, 进而自动选择不同的混合搜索策略;再结合自适应的提前终止阈值, 在保证搜索准确性的同时, 大大减少了搜索点数。通过对各种类型的视频进行测试, 结果表明, 该算法对于不同运动类型、不同运动程度的视频序列都具有较强的自适应性, 分别比UMHexagonS (Unsymmetrical-Cross Multi-Hexagon Search) 和BBGDS算法节省55%和35.6%的运动估计时间, 同时率失真性能保持不变。

关键词:移动终端,运动估计,提前终止,混合搜索,自适应

参考文献

[1]Peng Q, Zhang L, Yang T W, et al.Key-frame Reference Selection for Non-Feedback Video Communication[J].The Journal of China Universities of Posts and Telecommunications, 2009, 16 (5) :92-102.

[2]ITU-T Rec.H.264/ISO/IEC 11496-10.Advanced Video Coding Final Committee Draft, Document JVT F100d2[S].Awaji island, Dec.2002.

[3]Zhu S P, Tian J.An Iimproved Fast Fractional Pel Motion Estimation Algorithm Based On H.264[C]//2010 IEEE International Conference on Industrial Technology.Washington, DC:IEEE Press, 2010:179-182.

[4]刘鹏宇, 贾克斌.基于UMHexagonS的快速运动估计编码算法研究[J].电路与系统学报, 2012, 17 (5) :139-146.

[5]刘易, 李太君.H.264中快速运动估计UMHexagonS算法的改进[J].电子技术应用, 2011, 37 (8) :128-130.

[6]黄平, 王绍源.基于子区域最佳运动矢量搜索的UMHexagonS改进算法[J].计算机应用研究, 2011, 20 (10) :59-62.

[7]阴法明, 赵晓铃.用于运动估计的基于梯度下降搜索扩展算法[J].计算机工程与应用, 2010, 46 (33) :139-141.

[8]张永辉, 李临生.一种适用于可视电话的快速运动估计算法[J].微计算机信息, 2010, 26 (3) :217-219.

[9]李强, 孙瑞杰, 于游, 等.一种用于移动可视电话编码的运动估计快速搜索算法[J].重庆邮电大学学报:自然科学版, 2011, 23 (5) :593-596.

[10]毛小明, 鲍可进.一种基于H.264/AVC的高性能快速运动估计算法[J].计算机应用研究, 2012, 29 (4) :1598-1600.

[11]Sarwer M G, Wu Q M J.Adaptive Variable Block-Size Early Motion Estimation Termination Algorithm for H.264/AVC Video Coding Standard[J].IEEE Trans on Circuits and Systems for Video Technology, 2009, 19 (8) :1196-1201.

[12]张新安, 宫彦军, 李小武.一种AVS_M整数像素运动估计快速算法[J].小型微型计算机系统, 2011, 32 (4) :793-796.

运动复杂度 篇2

复杂性、复杂系统与复杂性科学

本文在前人工作的基础上,研究和总结了复杂性、复杂系统与复杂性科学的`基本概念,尝试给出了复杂性科学的定义;总结了复杂性科学的研究对象、基本原理和基本研究方法;综述了国内外研究现状,指出了存在的问题和今后需要重点研究的问题.

作 者:宋学锋  作者单位:中国矿业大学管理学院,江苏,徐州,221008 刊 名:中国科学基金  ISTIC PKU英文刊名:BULLETIN OF NATIONAL NATURAL SCIENCE FOUNDATION OF CHINA 年,卷(期):2003 17(5) 分类号:N1 关键词:复杂性   复杂系统   复杂性科学  

运动复杂度 篇3

然而在H. 264编码过程中量化参数QP同时用于率失真优化和码率控制,导致“蛋鸡悖论”而不能直接套用以往编码标准的算法,如MPEG-2中的TM5[3]、H. 263中的TMN8[4]以及MPEG -4中采用的VM8[5,6]。为解决此 问题,现有的H. 264编码标准采用了由Ma等人提出的JVT - H017提案[7]中的算法,但该算法在视频序列存在快速运动或场景变换时,由于各帧的复杂度相差过大以及线性MAD预测模型的不准确,导致最终编码输出的码率波动性较大,图像质量不高。

因此,针对H017算法在基本单元层码率控制上的不足,学者们提出了多种码率控制算法进行改进。JVT-W042提案[8]沿用了H017的基本算法流程,着重于代码的优化重写,并支持全I帧和分级B帧的码率控制。另外,文献[9]通过一种简单的帧差法来衡量图像复杂度,进而改进帧层码率控制。文献[10]针对视频中的大量场景切换,提出一种基于非连接点的场景切换检测算法,结合自适应Go P分组技术提高码率控制性能。文献[11]在ρ域模型基础上提出平方根模型,用于改进基本单元层的码率控制。文献[12]提出一种结合人眼视觉特性的码率控制算法,在基本单元层引入视觉敏感因子进行目标比特分配。文献[13]利用视频信源的时空相关性提出一种新颖的编码特性预测机制,并利用Lagrangian优化技术推导出两种高效的位率失真优化分配算法。文献[14]采用两个率失真模型进行码率预测,即给出一种基于双模预测的自适应码率控制方法来提高码率控制精度。

本文将MAD值作为图像复杂性的度量参数来调整目标比特的分配。在MAD值的预测方面,充分利用视频序列中的空间信息来改进MAD预测模型,同时利用运动矢量的大小作为判断依据来决定所采用的MAD预测模型。实验结果表明,与JVT-H017以及较新的文献算法相比,本文算法可获得更好的图像质量,并且具有更高的码率控制性能。

1 JVT-H017 码率控制算法

JVT-H017码率控制方案由两层组成: Go P( Group of Picture) 层码率控制和帧层码率控制,若编码中基本单元不是一帧,则再增加额外的基本单元层码率控制。

H017提案中的基本单元层码率控制算法主要包括3个步骤: 1) 目标比特数的分配; 2) 预测当前基本单元的MAD值; 3) 基本单元量化参数QP值的计算。

1. 1 目标比特数的分配

假设P帧中未编码的基本单元数为Nbu,用frb表示分配给当前帧中未编码基本单元的剩余比特数,则对于当前编码基本单元所分配的目标比特数为frb/ Nbu,即平均分配剩余比特数。

1. 2 预测当前基本单元的 MAD 值

在H017提案中使用线性预测模型来预测当前基本单元的MAD值

式中: MADcur为当前基本单元的预测值; MADpre表示前一帧相同位置处基本单元的实际值; a1和a2为预测模型系数,初始值分别为1和0,之后通过线性回归技术进行更新。

1. 3 基本单元量化参数 QP 值的计算

完成MAD值的线性预测后,使用二次率失真模型[15]来计算当前基本单元的QP值。二次率失真模型如下

式中: Ri( j) 是编码第i帧第j个基本单元所需要的比特数; X1和X2为该模型的一、二阶系数,在每个基本单元编码结束后进行更新; MAD为上一步所得到的预测值,由此可计算量化参数QP。

2 本文的改进算法

通过对H017算法中的基本单元层码率控制方案的描述可知,该算法的MAD预测模型只考虑了基本单元间的时间相关性,没有利用其空间相关性。

另外,在对未编码基本单元的目标比特分配方面,H017中的算法同样没有考虑图像的复杂度因素,只是平均分配剩余比特。

这两方面的不足将导致该算法在处理高速运动或频繁发生场景切换的视频序列时出现较大误差,重新更新的模型参数也会同样因为缺少复杂度因子而造成误差传播,从而影响视频的码率稳定性以及图像编码质量。因此本文分别从MAD预测模型和分配剩余比特数两个方面来对原算法进行改进。

2. 1 改进的基本单元 MAD 预测模型

由于在一般的视频序列中,MAD值的大小在时间和空间两方面均有很强的相关性。因此本文利用基本单元间的空间相关性来改进MAD预测模型,并且引入运动矢量作为衡量图像复杂度的标准,根据图像的复杂程度来决定选用的预测模型。

如图1所示,编码过程中利用当前编码基本单元Cur和前一帧相同位置基本单元Pre的邻域对原算法进行改进。

具体的MAD时空加权预测模型为

式中:表示当前编码基本单元Cur的相邻基本单元D,E,B,G的MAD平均值;是参考帧中相同位置处基本单元Pre的相邻4个基本单元AP,BP,CP,DP的MAD平均值; b1,b2和b3为加权系数,且b1+ b2+ b3= 1;︱MVx︱和︱MVy︱表示基本单元中宏块的水平和垂直运动矢量大小,Th为运动矢量阈值,用来反映图像的运动剧烈程度,从而实现MAD值的分级预测。

由于自然界中视频序列运动类型的多样性,只根据一种模型来预测MAD值是不够精确的。例如常见的视频图像是水平方向的运动大于垂直方向的运动,可同时还有不少垂直方向的运动远比水平方向剧烈的运动情况,此时如果不加区分地采用同一模型必定会在很大程度上影响预测的精度。因此,本文在︱MVx︱+ ︱MVy︱> Th时可根据︱MVx︱与︱MVy︱的大小关系分3种情况调整模型参数。

2. 1. 1 水平运动矢量较大的情况

当,即图像序列在水平方向上远比垂直方向运动 剧烈的情 况时,将替换为,即6个基本单元 ( D,E,B,G,X1,X2) 的MAD平均值,此时预测模型为

式中: X1和X2为当前帧水平方向上的扩展参考基本单元,如图2所示。

2. 1. 2 垂直运动矢量较大的情况

当,即图像序列在垂直方向上远比水平方向运动 剧烈的情 况时,将替换为,即7个基本单元( D,E,B,G,X3,X4,X5)的MAD平均值,此时预测模型为

式中: X3,X4,X5为当前帧垂直方向上的扩展参考基本单元,如图3所示。

2. 1. 3 其他情况

在不符合前两种情况时仍然采用式( 3) 来计算当前基本单元的MAD值。

在上述4种预测模型中,加权系数为常数,算法复杂度低,并且考虑了基本单元MAD值之间的时间和空间相关性。在图像运动剧烈的情况下,不仅在原算法基础上加入了相邻基本单元的平均MAD值,还对加权系数分别赋予不同的权值来进行调整。

改进算法还通过设置4个预测模型来针对不同复杂度的编码图像,再结合运动矢量作为图像复杂度的判断依据来对加权预测进行分级处理。这也是利用了运动矢量的性质,由于运动矢量本身就部分体现了图像的复杂度,其绝对值越大,图像变换速度越快,运动也就越剧烈,以此作为衡量图像复杂度的标准可以使MAD的预测更为合理。改进的预测模型在引入运动矢量作为图像复杂度阈值判断的同时,也将其水平、垂直分量进行比较来判断图像的复杂类型,针对不同类型的视频序列在预测模型中分别添加水平或垂直预测基本单元,从而更精确地预测当前基本单元的MAD值。

通过大量实验,并且考虑到实时低码率下的应用,采用宏块作为基本单元,取b1= 0. 35,b2= 0. 45,b3= 0. 2,Th = 16( 在下文实验中均按此参数进行测试) 可提高预测精度。

2. 2 基于图像复杂度的目标比特分配优化

H017提案在基本单元层中采用将剩余比特数平均分配给所有未编码基本单元的码率控制方案,这样的平均分配方案并没有考虑到图像中不同基本单元之间复杂度的差异性,在场景快速变化时分配过少的目标比特,导致量化参数QP过大,影响码率控制的精度和图像编码质量。

文献[16]中用MADradio来代替MAD,其中MADradio是线性预测的MAD值与已编码帧的平均MAD的比值,即用已编码帧的平均MAD值来表征图像序列的复杂度,并指出MADradio能很好地反映当前帧相对于整个序列的运动剧烈程度。

为了更合理地给未编码基本单元分配目标比特,本文在MAD时空加权预 测模型的 基础之上,将式 ( 3 ) 所得到的MADcur引入到目标比特的分配计算中。

本文利用当前基本单元的预测值MADcur与之前已编码基本单元的MAD平均值MADave的比值作为复杂度衡量因子λMAD,用来调整剩余比特数的分配。具体算法如下

式中:为分配给待编码基本单元的目标比特数; 自适应参数λ是通过大量实验后的经验值来选取。由式( 6 ) ~ 式( 8 ) 可以看出,该算法能够根据MAD的比值自适应地调整剩余比特数分配。若当前编码基本单元的复杂度比之前的基本单元复杂度低时( λMAD< 0. 8) ,只需要分配较少的目标比特; 如果相差不大或略有增加时( 0. 8≤λMAD< 1. 8) ,可以根据情况增加分配的目标比特数; 若图像中当前基本单元的复杂度较高( 1. 8≤λMAD) ,则应该分配更多的目标比特。此外,由于算法中的MAD值计算在运动估计时是必须进行的一个步骤,采用此算法代替原提案中的平均分配算法,几乎没有给编码器增加额外的运算复杂度,同时也能保证算法的性能。

3 实验结果与分析

为了验证本文算法的有效性,所有的实验都是在JVT的开源模型JM10. 1上进行,并且与JVT-H017算法以及文献[9]的相关算法进行了比较。选用的测试序列为akiyo,si-lent,mother-daughter,foreman,carphone,highway的QCIF格式视频以及waterfall的CIF格式视频,其中waterfall视频代表了垂直方向运动大于水平方向运动的非常规运动序列。

在测试条件 上将目标 码率分别 设置为48 kbit/s和64 kbit / s,编码帧数为200帧,帧率为30 f / s( 帧 / 秒) ,参考帧数为1,采用Hadamard编码,熵编码类型采用CAVLC,初始量化参数为28,Go P结构为IPPP,即编码时第一帧为I帧,其余为P帧。

实验结果见表1与表2,两份表格分别记录和比较了各序列的峰值信噪比以及码率控制情况,其中码率偏差是实际码率与目标码率的差值与目标码率的百分比,比值越小说明算法码率控制得越精确。图4是foreman视频序列在目标码率为48 kbit/s时各帧PSNR的比较曲线,比较算法为JVTH017以及本文算法。图5是foreman视频序列在目标码率为48 kbit / s时的主观质量比较情况,左、右分别为JVT-H017和本文算法所得到的图像。

由表1及表2的实验数据可以看出,在低码率条件下,相比于其他算法,本文算法不仅得到了更高的PSNR,还使实际码率更接近于目标码率。同时本文算法对waterfall这一非常规类型的视频序列也能有较好的表现,在48 kbit/s的目标码率下能够使码率偏差由JVT-H017的0. 40% 降低到0. 17% ,这是由于本文算法考虑了垂直运动矢量较大这一情况后所得到的结果。

由图4和图5可以从客观和主观两个方面发现本文算法得到的视频质量更好,在视频主观质量上,本文算法更好地还原了人物的面部特征,这也是改进了JVT-H017算法中平均分配剩余比特方案后所带来的优势。

4 结论

本文分析了H. 264中的JVT-H017码率控制算法,指出该算法的不足并进行了相应改进。改进后的算法充分利用了编码过程中的运动矢量信息来预测MAD值,在此基础上根据MAD值的变化情况来反映图像序列的复杂度,从而更精确地分配目标比特。实验结果表明,与JVT-H017算法以及较新的算法相比,本文算法在码率控制方面更加精确,图像质量也有一定提高,从而改善了H. 264视频编码的性能。

运动复杂度 篇4

随着视频监控的发展, 传统的需要专人职守的视频监控系统的各项缺点逐渐显露, 如浪费人力资源、报警不准确不及时甚至错过各种异常情况等等, 已经不能适应越来越高的监控要求。因此, 急需开发出具有一定智能性的视频监控系统, 自动对图像序列进行运动检测, 一旦发现运动物体而且运动物体的位置和形态满足一定条件, 就发出报警信号来通知监视人员及时有效处理及录像以作档案, 并为实现运动物体自动跟踪做好准备, 可在很大程度上减轻监视人员的负担, 又能使监控系统具备智能性。

文献[1]利用Bayes法则的门限检测算法加以改进, 提出了一种应用于视频监控的运动检测算法, 但Bayes法则需要样本训练过程, 这在实际监控中不实用;文献[2]提出了光流估计的鲁棒性多分辨率运动目标检测方法, 但光流算法复杂且计算量大, 目前用于实际目标实时检测非常困难;文献[3]提出一种基于高斯统计模型的背景图像估计算法, 该算法是背景图像的估计由初始化和更新两部分组成, 在背景图像的初始化算法中, 求取一段较长的时间段T计算视频序列图像每一像素的平均亮度, 并计算在该段时间内的每一像素亮度的方差作为初始的背景估计图像。文献[4]进行了目标检测最常用方法即帧差法和背景相减法的比较, 指出两种方法的优劣。通常背景相减算法将会占用很多内存空间, 不适合用于嵌入式系统对内存苛刻的要求;两相邻帧差分法简单、速度快、易于硬件实现, 但当两帧图像中都存在运动物体时, 将包括严重的背景变化, 为运动物体精确检测以及后续工作带来困难, 甚至不能继续工作。文献[5]提出了只用数学形态法进行物体检测的方法, 但这种方法在复杂背景下效果不好, 且速度较慢。由此, 本文提出了利用otsu法和数学形态法联合进行三帧差分图分割的运动检测方法。本文提出的三帧差分法与文献[6]提出的三帧差分法改进之处在于本文的三帧差分法的核心算法—分割更具有智能性, 在复杂背景下, 效果更好。实验证明, 本文方法具有智能性和鲁棒性, 能满足实时性要求, 特别能满足要求需内存少、速度快的嵌入式系统。

1 运动物体的检测

1.1 噪声处理

图像在实际应用中可能存在各种各样的噪声, 这些噪声可能在传输中产生, 也可能在量化等处理中产生。噪声产生的原因决定了它的分布特性及它和图像信号的关系。先去除噪声的影响。一般情况下, 由视频镜头产生的噪声, 以及视频序列中的随机噪声、亮度变化、背景纹理的变化等统计量噪声都服从均值为零的高斯正态分布, 而由运动物体引起的亮度变化与噪声的分布是独立的。文献[7]也指出视频图像中的噪声具有高斯特性, 噪声频谱要比一般图像的频谱高很多, 因此对视频图像进行了高斯低通滤波。

1.2 差分图

本检测算法利用连续三帧差分法, 即分别将第k-2和第k-1帧图像、第k-1和第k帧图像进行绝对相减, 得到两幅差分图, 然后利用这两幅差分图进行检测。

1.3 差分图的初步分割

差分图分割是运动检测以及跟踪的最重要的步骤, 是监控算法的基础。目前图像分割的方法很多, 如阈值分割方法[8,9]、边缘检测[10,11]、函数优化方法[12]、数学形态学方法[11]、基于对象的物理性质的分割方法[13,14]等, 这些方法各有特点及应用范围。Otsu方法[15]是由日本大津展之提出, 其基本思路是将直方图在某一阈值处理分割成两组, 当被分成的两组的方差为最大时, 决定阈值。Otsu法是一种自动的非参数非监督的阈值选择法, 具有很强的自适应性。现在Otsu法已发展到二维Otsu方法[16]即为任何一个像素, 就有了一个二元组:像素灰度值和邻域平均灰度值, 但二维Otsu方法运算速度太慢, 即使文献[17]提出了二维Otsu方法的快速算法, 但速度仍显得过慢。因此, 本文还是采用了一维Otsu法和数学形态学方法进行分割, 在监控中, 如人等在图像中的都占一定面积并进行了图像噪声预处理, Otsu方法效果良好。

本文Otsu方法计算步骤如下:设一幅图像的灰度值为1-m级, 灰度值为i的像素数为ni, 此时我们得到:

总像素数:undefined

各值的概率: Pi=ni/N (2)

然后用k将其分成两组C0={1-k}和C1={k+1~m}, 各组产生的概率如下:

C0产生的概率undefined

C1产生的概率undefined

C0组的平均值undefined

C1组的平均值undefined

其中:μ=undefined是整体图像的平均值:undefined是阈值为k时灰度的平均值, 所以全部采样的灰度平均值为μ=ω0μ0+ω1μ1。两组间的方差用下式求出:

undefined

从1-m间改变k, 求上式为最大值的k, 即求maxσ2 (k) 的k*值, 此时, k*值便是自适应阈值。

由于所得到的差分图前景图较弱, 为了取得良好的分割结果, 在大量实验基础上, 当阈值调小到0.4k*时效果较佳。此时, 可得二值图B:

undefined

此时, 完成了差分图的初步分割, 得到的运动物体图像是不连续或有孔, 并且可能包含背景的变化, 因此, 需要进行后分割处理。

1.4 差分图的二次分割

由于得到的运动物体图像是不连续或有孔, 并且可能包含背景的变化, 本文利用了数学形态法进行差分后分割处理。

算法步骤:

1) 进行差分图闭运算

作用为平滑轮廓, 融合狭窄的间断和细长的“沟壑”, 消除小的空洞。

2) 进行差分图填充

作用为填充前景图的空洞, 使其成为连续图像。

3) 进行后处理的图像进行与运算

作用为得到中间帧中完整的运动物体图像。

4) 对图像进行标注

作用为后续运动物体特征量的计算作准备。

5) 计算运动物体特征量

特征量主要包括区域的面积Skj区域的质心Pkj、区域的高宽比Rkj为确定目标物体做准备, 其中K, j分别表示第k帧图像及第k帧图像中的第j个运动物体。运动物体特征量是目标跟踪的基础。

此时, 便能得到运动物体的完整的图像, 为后继报警录像、运动物体跟踪目标的确定及目标跟踪做好准备, 本算法对单个或对多个运动物体检测效果都良好。

2 目标物体的确定

运动目标识别的目的是从检测到的运动区域中识别出是否对应为目标物体的运动。分割出来的运动区域可能对应于不同的运动目标, 比如室外监控摄像机所捕捉的序列图像中可能包含行人、车辆及其它诸如飞鸟、流云、摇动的树枝等运动物体;安装在室内的监控摄像机所捕捉的序列图像中可能包含入侵者、小动物以及被风吹动的窗帘等。为了提高报警的准确度, 减小误报警概率, 运动目标的正确识别分类是非常必要的。

利用检测出的运动区域的形状特征来判断是否为入侵者。本系统判断准则如下:

a. 区域的面积Skj是否大于设定的阈值。

b. 区域的质心Pkj是否在设定的范围内。

c. 区域的高宽比Pkj是否符合设定的比例。

如果以上的3个条件都满足, 系统就判定出现了入侵者, 报警并进行录像;如果有1个条件不满足, 系统将不会报警。当侵入物体仅一个时, 即为跟踪目标;当侵入物体为多个时, 根据侵入物体的面积Sk、质心 (xk, yk) 和高宽比Rk确定跟踪目标并报警录像。

3 实验结果

本实验为了说明问题, 实验环境是在有日光灯的室内, 日光灯因为本身的发光原理, 不停地闪烁, 这容易引起摄像机瞬间取真时仍然引起图像的变化, 但也更能证明本算法具有很好的鲁棒性。

图1、2、3是三帧原始图;

图4、5分别是第1、2和第2、3的差分图;图6是运动分割结果, 即为运动检测结果。

图7、8、9和图10、11、12分别是单个和多个物体的检测实验情况, 效果良好。

4 结 论

本文提出了运用otsu法和数学形态法进行差分图分割的三帧差分进行运动检测的方法, 对单个或多个运动物体检测效果都良好。此运动检测方法简单, 速度快, 自适应性强, 适于硬件实现, 且不要求保存过去的测量数据, 需要较少的内存, 符合了嵌入式视频跟踪系统的开发要求。实验证明, 本检测方法可行有效, 具有较强的稳健性和鲁棒性, 是我们开发的复杂背景下嵌入式视频跟踪系统核心算法之一 (复杂背景下嵌入式视频跟踪系统, 另有文章详述) 。

摘要:提出了利用Otsu法和数学形态法进行三帧差分图分割的运动检测方法, 对单个或多个运动物体检测效果都良好。此运动检测方法简单、速度快、自适应性强, 适于硬件实现, 且不要求保存过去的测量数据, 需要较少的内存, 符合了嵌入式系统的开发要求。实验证明, 本检测方法具有较强的稳健性和鲁棒性。

运动复杂度 篇5

现在最为流行的无疑是双帧和三帧以及背景差分和光流算法这几种,这几种方法不是彼此之间相互独立的,而是可以相互之间进行变换和融合的。所谓的移动目标跟踪就是要创建一个以移动目标为对象的实时移动的数据模型来进行实时的跟踪计算。采用一种好的算法能够很大程度上保证最后得到的移动目标的计算跟踪结果更加精确和精准。这一算法将在以后的时间中一样被人们所热爱和研究,因为这些算法还有很大的提升空间来进行改进和创新。

1 运动目标跟踪的原理

运动目标跟踪是根据每一个移动的物体在每一个画面像素之间的序列位置来进行的移动目标的跟踪计算处理分析。那么随着社会科学技术的进步,对于这一方法出现了很多种的方法来进行移动目标的跟踪计算分析处理。那么主要的就是有下面的几种来进行我们的移动目标的跟踪计算分析结果处理。本文主要列举了几个简单具有明显特征的方法来进行移动目标跟踪信息的分析与计算处理。

1.1针对区域的跟踪

针对于某一个区域进行的移动目标的跟踪计算分析的主要中心思想是:首先把得到的捕捉的图像进行加工分割处理划分为一个个包含有有用信息的一些压缩包的模式板块,然后设定一个标准的量来进行模块的选取,在原油的图像目标中进行有用信息的收集处理。那么因为开始在进行额分割处理以后的一些小的模块中含有大量的完整的信息,所以在移动目标能够看见前,这一方法能够达到很高的精确度来进行移动目标的跟踪和计算分析。并且具有跟踪性能十分稳定等特点。但是主要缺点还是过于耗费时间,尤其是在一些较大的区域进行这种方法时,耗费的时间一般都较长。所以这一方法在进行区域性搜索时一般是运用于区域性较小的地方,或者是阴暗对比较差的区域来进行的。

1.2 针对于特征的跟踪

针对于某一个特征的跟踪计算分析处理的中心思想是:首先对于一个目标的某一个局部特点进行提取记录,然后再用计算机配对法里斯进行图像信息的对比,最后达到跟踪移动目标的目的。这一方法主要的优点就是即使被捕捉的目标某一个地方被掩盖,也能够通过局部特征法来进行跟踪分析计算,从而达到跟踪目标的目的。那么这一方法一般是和卡尔曼滤波器相互进行使用,这样能够达到最好的效果,所以这一目标一般常用的场所就是在一些较为复杂的背景下进行目标的跟踪。

1.3针对于活动轮廓的跟踪

针对于活动轮廓的目标跟踪的中心思想是:运用了曲线的封闭性能来进行的移动目标的跟踪计算和分析。主要是依靠了目标特征和数学计算来进行的曲线函数的数学运用更新,达到目标跟踪的目的。这一方法自从被发明出来以后,就被大家广泛的应用到目标搜索中去,因为它具有减少清晰敏感度的优点,并且能够在移动目标被物体所压盖以后还能够自动的进行目标对象的跟踪处理。但是这一方法主要的缺点也是受开始输入数据和噪音系数的影响较大。

1.4针对于模型的跟踪

针对于模型的跟踪方法的主要的中心思想是:首先由一定的数据库来进行目标数据的建模处理,然后再经过匹配计算达到跟踪目标的目的,并且能够自动的进行数据模型库的实时更新。从而得到较为完整的具有鲜明特点的数据结构据。但是背景差分法最大的缺点就是对于环境的要求太高,尤其是光的敏感度的干扰特别严。从而更好的确定目标的信息帧数,达到更为清晰的画面的展示。帧数之间的差分法对于背景为移动画面时的移动目标的画面捕捉是最为适合的,因为帧数差分法对于移动的物体更加的敏感,或者说这一方法只适合运用到移动的物体间。人工智能判断以及自动智能控制等多种技术学科进行相互交织的领域进行的技术研究,这一技术手段被大量的运用到了社会中各个方面其中就包含有军事领域的研究或者是航空行业以及其它的视频监控领域等,在这些研究领域中对于移动目标在复杂背景下的跟踪研究取得了很大的研究成果和重要的实际意义。尤其是对于大量运动物体的移动能够提取相关的信息输入进大脑,然后进行综合计算得到有用的信息。并且能够捕捉到有用的信息以后进行下一步移动物体的预算处理。

2 运动目标检测算法分析

从复杂的背景情况中进行移动目标图像信息的获取就是我们的移动目标跟踪技术。主要分别在于摄像机和我们的移动目标之间的动静关系的确定,其中分为两种,第一种是在背景为静态时移动目标信息的获取和第二种移动背景下移动目标信息的获取。第一种就是指我们的摄像机不产生移动,在整个的拍摄过程中保持静止的状态来进行拍摄。第二种就是我们的摄像机在拍摄时发生了平移或者是旋转等方向的移动而进行的拍摄。

2.1 背景差分法

这一方法是目前为止在进行这一移动目标信息获取方面最为人们所常用的一种方法,这一背景差分法中心思想就是在得到了一个收集了的数据背景模型以后,将现有的帧数和背景模块中的帧数进行减法运算得到一个差值,那么这一差值的结果如果大于一定的标准就可以知道这一信息为移动目标的信息,如果没有大于这一标准就可以判定这一信息为我们的背景模型中的数据。利用背景差分法能够有效的进行移动目标信息的判别,从而得到较为完整的具有鲜明特点的数据结构据。

但是背景差分法最大的确定就是对于环境的要求太高,尤其是光的敏感度的干扰特别严。那么针对于这一情况我们的技术人员最主要的方法就是创造出不同的背景模型来进行移动目标的跟踪计算,这样能够最大限度的减小因为环境因素的影响从而产生的对移动目标跟踪计算出现的失误等现象。对移动目标的跟踪计算至关重要的就是对于背景模型的创立和模式选取以及背景阴影的摒弃,将在很大程度上对整个的移动目标跟踪计算的结果造成关键性的影响。这一方法对于仪器设备的要求不是太高,能够简单的实现,除了要在固定不移动的背景下进行捕捉以外,其余的性能都很好,能够做到快速的进行移动目标信息的获取,从而能够精确的进行信息的取缔。但是这一方法最大的缺陷就是对于环境的要求很苛刻,容易受到光线强弱变化的影响,而这一影响将给整个计算带来严重的偏差。

2.2 帧间差分法

这一方法主要就死利用三三两两相互靠近的帧数在连续像素中的变化,利用时间差值来进行的时间差值分化从而进行的移动目标的信息帧数获取。这一方法对于移动的帧数具有相当强硬的适应性,但是帧数差分法主要的缺陷就是不能够提出所有的移动目标的关键性像素,从而导致最后的呈像会出现一些空洞的现象。那么针对于这一重大的缺点我们的技术人员就运用了我们的对称帧数差分法来进行缺陷的修补。

这一方法主要就是在进行获取了的图像帧数中针对于每三帧数的图像信息来进行的对称差分法的修补,对称差分法主要就是运用了从上一帧数的图像信息中进行模块的切割来进行的移动目标的帧数范围的确定,这样能够得到一个较为清晰的移动目标帧数的移动范围,从而更好的确定目标的信息帧数,达到更为清晰的画面的展示。帧数之间的差分法对于背景为移动画面时的移动目标的画面捕捉是最为适合的,因为帧数差分法对于移动的物体更加的敏感,或者说这一方法只适合运用到移动的物体间。其实,帧数间差分法捕捉的主要就是相对来说是移动的物体,从而造成了捕捉到的两个画面之间的时间值很短,所以就会不容易受到外界光照等因素的影响。这也是帧数间差分法和上一方法之间最大的区别之一,帧数间差分法具有简单有效并且不容易受到外界的影响,具有效果稳定,反应速度快等特点。

2.3光流法

这一方法能够充分的用捕捉到的图像信息来进行移动目标信息的获取。运动场能就是移动在空间力矩中的表示,那么要在一个平面上表现物体的移动就是通过平面中的阴暗对比色调来进行移动物体的展示的。最后就会使得整个的运动场在画面上进行展示,这种现象我们称之为光流现象。那么光流就是指一瞬间产生的运动力场而变现的现象,其中就有一些基本的移动物体的很多信息。那么针对于光流现象我们就采用了时间变化而变化的光速效应,因为光速流中包含有大量的信息可以进行有效的利用。在理想状态下可以进行移动目标的测量,并且可以不用其余的参照物来进行参照对比。能够做到最大限度的得到移动物体的移动信息,可以运用进行背景动态运转时对于移动目标物体的跟踪计算测量。

但是这一方法主要的缺点就是对于仪器设备的要求很高,不能够第一时间的进行分析计算处理。对称差分法主要就是运用了从上一帧数的图像信息中进行模块的切割来进行的移动目标的帧数范围的确定,这样能够得到一个较为清晰的移动目标帧数的移动范围,从而更好的确定目标的信息帧数,达到更为清晰的画面的展示。帧数之间的差分法对于背景为移动画面时的移动目标的画面捕捉是最为适合的,因为帧数差分法对于移动的物体更加的敏感,或者说这一方法只适合运用到移动的物体间。

3 结束语

跟踪目标的算法现在已经有很多种,每一种的类型和方式都是不一样的,但是这些算法无一例外都是只能够针对于某一种情况或者是多种情况来进行移动目标的跟踪计算分析处理,并不能够做到所有的环境都使用一种算法的理想状态,所以这也是以后要研究和解决的地方。现在最为流行的无疑是双帧和三帧以及背景差分和光流算法这几种,这几种方法不是彼此之间相互独立的,而是可以相互之间进行变换和融合的。所谓的移动目标跟踪就是要创建一个以移动目标为对象的实时移动的数据模型来进行实时的跟踪计算。其实,帧数间差分法捕捉的主要就是相对来说是移动的物体,从而造成了捕捉到的两个画面之间的时间值很短,所以就会不容易受到外界光照等因素的影响。这也是帧数间差分法和上一方法之间最大的区别之一,帧数间差分法具有简单有效并且不容易受到外界的影响,具有效果稳定,反应速度快等特点。采用一种好的算法能够很大程度上保证最后得到的移动目标的计算跟踪结果更加精确和精准。这一算法将在以后的时间中一样被人们所热爱和研究,因为这些算法还有很大的提升空间来进行改进和创新。

摘要:在进行背景非常复杂的情况对于移动目标进行监控并进行跟踪的算法研究已经取得了突破性的进展,那么人的眼睛对于自己所处的环境能够进行感觉和捕捉作用,尤其是对于大量运动物体的移动能够提取相关的信息输入进大脑,然后进行综合计算得到有用的信息。并且能够捕捉到有用的信息以后进行下一步移动物体的预算处理。这也是本文主要研究的对于移动目标物体在复杂背景下进行移动预测研究算法的主要目的。

关键词:移动目标,跟踪算法,算法原理

参考文献

[1]施家栋,王建中.动态场景中运动目标检测与跟踪[J].北京理工大学学报,2009(10).

[2]陆军,李凤玲,姜迈.摄像机运动下的动态目标检测与跟踪[J].哈尔滨工程大学学报,2008(8).

运动复杂度 篇6

红外多目标的跟踪和检测方法是卫星预警、精确制导、告警和监测等领域的一项关键核心技术,对复杂背景条件下的港口内运动多目标跟踪与检测研究是现今的热点之一。通常检测红外多目标的方法有基于运动轨迹质心迹累加的序列检测方法,基于多特征融合的方法,动态规划和航迹关联方法等[1]。基于运动轨迹质心迹累加的序列检测方法适用于深空背景下的点目标检测;多特征融合方法的运算量较大,可靠性较差;动态规划和航迹关联方法对于解决复杂红外环境里的目标检测问题的鲁棒性较差。同时,港口内大多存在如高大建筑物、停泊舰船、大铁架、码头和山峰等红外特征显著的物体。这些红外特征显著的物体对复杂动态背景下运动目标的检测有很大的影响[2]。运用上述传统算法很难有效的检测出目标。因此,根据红外多目标跟踪和检测中实时性和精确性的要求,结合港内红外分布的特点,文中提出了先用小波变换的方法实现动态复杂背景的抑制,然后运用区域主动轮廓模型的水平集方法实现红外多目标跟踪。

图1显示了本文在复杂动态背景条件下红外运动多目标跟踪和检测的流程图。先对序列图像采用小波变换,实现背景抑制;然后对各个连通区域运用区域主动轮廓模型的水平集方法求取区域的结构特征、灰度特征和运动特征等,并结合连通区域的先验知识,通过比较和判断实现前后帧间的各个连通区域的数据关联,从而实现对红外多运动目标的连续跟踪和检测目标。

文章的组织结构为:1)先介绍小波变换和采用小波变换实现复杂背景抑制的具体方法;2)背景抑制后,对序列图像的各个连通区域运用区域主动轮廓模型的水平集方法进行图像分割,并求出各个区域的结构特征、灰度特征和运动特征,这里用形状描述因子来表述区域结构特征,用区域的平均灰度来描述区域的灰度特征,用Kalman滤波来描述区域的运动特征;3)通过对前后帧各个连通区域比较以上特征来实现图像间各个连通区域的关联,在关联中会出现多目标“合并和分裂”现象,采用“记忆和填充”方法来实现对多目标的稳定跟踪;4)最后根据先验知识和检测条件来提取最终得到的目标和参数。

1 小波变换

小波变换具有低熵性、多分辨率、去相关性、选基灵活等特点,可同时进行时频域的局部分析,能够灵活地对图像局部奇异特征进行提取[3]。文中采用小波变换方法实现对复杂动态背景抑制的目标。用尺寸为M×N的函数f(x,y)表示原始图像,其二维离散小波变换[4]是:

其中:i代表了值H(水平),V(垂直)和D(对角),j0是任意的开始尺度,Wϕ(j0,m,n)系数定义了图像在尺度j0的f(x,y)的近似,Wψi(j,m,n)系数则表示图像对于j≥j0的水平、垂直和对角方向的细节。

由于Daubechies(db N)小波总结了多分辨分析的概念和金字塔式压缩编码方法,并把小波变换与传统的滤波器组概念联系了起来,因此,这里选用Daubechies小波族中的db3小波作为小波基系数进行小波变换。

2 基于小波变换的背景变化程度估计算法流程

传统背景变化程度估计方法是根据图像间像素的差异,这样处理的结果使得运算量过大,达不到实时处理的要求[5]。为了更准确、更具效率的实现背景抑制,这里,利用小波变换的细节特性,通过比对当前图像和参考背景图像小波变换后的细节若干部分来确定背景移动程度[6]。通过估计背景变换程度来确定参考背景,实现背景抑制,这样处理的目的是为了减少运算量和提高抑制静态场景的能力,为后续进行运动多目标的跟踪和检测打下基础。具体的算法流程如下:

1)选取第一帧图像作为背景图像b(x,y),根据此帧图像小波变换后得到四个子图像wbi(x,y)(i={A,H,V,D}),在wbi(x,y)(i={A,H,V,D})图像中根据式(5)选取数值最大点作为基准点,在内存中保存该点在原始图像的坐标及灰度数据,并记为S(x,y,g)(x、y分为该点横、纵坐标,g为该点灰度);

2)对接下来帧的图像f(x,y)进行小波变换得到图像wfi(x,y)(i={A,H,V,D}),分别保存水平子图像wfH(x,y)中大于一定阈值TH的区域{NHk}和垂直子图像wfV(x,y)中大于一定阈值TV的区域{NVl},并计算区域NH和NV对应原始图像的灰度和坐标点,可得到数据{NHk(x,y,g)}和{NVl(x,y,g)}。用式⑴中的基准点中的灰度分别比对这些区域的平均灰度值,当(NHk⋅g)/(S⋅g)或(NVl⋅g)/(S⋅g)值中有满足区间(0.8∼1.25)的值时,则从中取数值最接近1的数据,并把值赋于N(x,y,g),N(x,y,g)为此帧图像与背景图像的比较点,并转3);若所有比值都不在上述区间,则转1),并把此帧图像作为背景图像。

3)根据S(x,y,g)与N(x,y,g)中的x,y值大小调整此帧图像与背景图像的比对位置,可以得到背景抑制后的图像T(x,y):

当时,∆x=∆y=0(Tz为调整门限,这里根据多次试验结果取为5),也就是不调整背景图像的比对位置。

3 基于动态先验知识的区域主动轮廓模型水平集方法的多目标跟踪与检测

在对背景进行抑制处理后,利用基于动态先验知识的变分方法来实现图像分割和目标分类[7]。设抑制背景后的图像为I(t);图像I(t)中有M个轮廓区域,用标签L=(L1,…,LM)来标识这些区域。这里,在第一帧图像中按照区域面积大小来标识这些区域,在随后的序列图像中采用“竞争机制”来关联轮廓区域和标签,实现多目标的数据关联和跟踪。另设先验知识为At(Sk,Gk,Vk)(Sk:形状描述因子;Gk:灰度特征;Vk:运动特征)。

根据水平集通过最小化能量函数进行图像分割的思想,基于图像I、轮廓C和标签L的能量函数为[8]

式中前一数据项参考Chunming Li在文献[9]中提出基于可伸缩区域自适应能量函数进行图像分割的方法,该方法具有不需要重新初始化水平集、图像分割准确和快速等特点。所采用的最小化能量函数为

式中:第一项为自适应数据项,第二项为曲线弧度长度项,第三项为正则水平集项。其中:M1(φ)=Hε(φ),M2(φ)=1-Hε(φ),∫|∇H(φ(x))d|x为轮廓φ零水平集的长度;函数;1λ和λ2为正常数,f1(x)和f2(x)分为1Ω和Ω2近似图像;K:ℜn→[,0+∞)为高斯核:;σ为尺度参数σ>0,P(φ)为水平集正则项,。

文中通过上式实现f1(x)和f2(x)f的更新,从而实现不需要重新初始化水平集。固定f1(x)和f2(x),对φ求微分来最小化F(Φ,f1,f2),其梯度下降流为

另外

式中:前一项为与先验知识相关的概率项,后一项为约束项,满足:

加权系数:

Pi(A(t)|λ)(i=1M)为基于先验知识的概率函数。

总能量函数的梯度下降流为

3.1 动态先验知识中形状描述因子

为了在序列图像前后帧之间比较、匹配连通区域间的结构特征,可以通过式(17)来判断图像前后帧区域间形状{S1,S2}是否匹配[10]。这里,m为形状S1到形状S2的映射,κ1和κ2为对应的形状曲率。

根据式(17)表述的思想,对图像中区域轮廓结构特征可以用形状描述因子Sk(d vertex,sarea)来描述[11]。dvertex表示区域的拐点到中心点的距离总和,对应式(17)的第一项,dvertex=∑Ni=1((vix-Ox)2+(viy-Oy)2),vi为区域的拐点,vix和viy为对应的横、纵坐标,O为区域中心点,xO和Oy为对应的横、纵坐标;sarea为区域面积,对应式(17)的第二项。

图2显示了区域中的拐点(红色点)和中心点(蓝色)。

3.2 多目标跟踪中的目标合并和分裂现象

多目标在运动中会出现合并和分裂现象,这里采用对存储队列进行“记忆和填充”方法来解决这种问题。具体方法为:假设Ti和Tj为合并的两目标,Tij为Ti和Tj合并形成新的目标。首先,根据坐标和平均灰度特征判断该目标是不是新出现的目标,即:如果满足下式则认为Tij为合并目标。

式中:.xk和.yk为目标区域的质心横、纵坐标,.gk为目标区域的平均灰度,Th1和Th2为设定的门限,根据式(18)中的对称性和试验效果,这里取Th1=Th2=.11。然后把Tij这一时刻的参数作为Ti和Tj公有的参数存储在各自的队列里面。如果不满足式(18),则认为Tij为新出现目标,在内存里重新分配和定义一个新的目标空间,并把Ti和Tj目标空间在内存里删除。由于在Ti和Tj合并时都有对应的保存参数数据,因此在Tij分裂为Ti和Tj时,只要比较这一时刻与Ti和Tj合并前的数据就能实现对Ti和Tj连续参数数据的存储和跟踪。

3.3 候选目标排序和检测结果输出

N次累积后,根据目标特性,按照指定规则对预选的多目标进行排序,如果以目标灰度和区域面积为参考进行排序,具体的规则为按式中oi值大小进行排序,oi值大的排在最前面,其余依次递推。其中:λg和λs分别为灰度.gk和.sk权重系数,和为M个目标的平均灰度和平均面积像素点。最后根据先验知识和检测条件实现小目标检测。检测条件为根据oi值大小进行选大、选小或指定大小等进行选取最终检测结果。同样,也可以根据目标运动速度的大小进行排序和选取。

4 实验与结果分析

采用分辨力为320×240、速率为25帧/秒、响应波段为8∼14µm的红外成像设备进行红外实验和算法检验。实验计算机的配置为英特尔Core2 Duo 2.6 GHz的处理器,4 GB的内存。具体实现过程如下:

实验内容是检测港口内三艘快速交错运动的旅游快艇。多目标运动过程中,港口背景会发生上下和左右移动,其中的两艘快艇在第122帧前后会发生重叠现象。图3(a)分别显示了第10、122、264帧原始红外图像,图3(b)为对这三帧图像进行小波变换后得到的近似、水平、垂直和对角四个子带图像,图3(c)为背景抑制基础上水平集跟踪图像,图3(d)为最终水平集函数。

从图3(a)中可以看出,背景中不仅有高建筑物、码头等红外特征明显的物体,而且背景在整个过程中发生上下和左右晃动。根据2中的算法流程,进行小波变换后根据式(5),可以找到如图3(b)的第10帧中所示的红色标记点作为背景参考基准点(S⋅x=73,S⋅y=92,S⋅g=175),在随后的小波变换图像中,通过匹配该点的灰度找到与本帧图像对应的基准点,整个过程中(NHk⋅g)/(S⋅g)或(NVl⋅g)/(S⋅g)值都能在区间(0.8∼1.25)内,因此不需要更新参考背景,只需调整参考背景的位置就能达到背景抑制目的。

完成背景抑制处理之后,根据3,先采用基于可伸缩区域自适应能量函数方法进行图像分割,再根据式(19)实现目标聚类。式中,gk-1和gk、ak-1和ak、dk-1和dk、vk-1和vk分为k-1和k帧的区域平均灰度、区域面积、区域拐点到中心点距离(见图2)和Kalman滤波预测的运动速率。根据多次试验结果,式(19)、(20)中取ug=0.3,ua=0.2,ud=0.42,uv=0.08时分类效果较好。表1显示了多跟踪过程中测量的各项数据,T1、T2和T3依次为图3.a中从左到右的各个目标。

在第122帧,T1运动过程中与T2出现重叠现象,根据3.2中多目标跟踪中合并和分裂方法,T1与T2符合式(18),所以判别T1与T2合并为T12,并把T12的各项参数同时赋给T1与T2;继续运动,T1与T2将不满足式(18),于是判别T12分裂为T1与T2。这样就较好的解决了多目标运动跟踪中合并和分裂问题。

在对三个目标跟踪过程中,根据oi值,取λg=λs=0.5,可以得到o1=0.69,o2=1.37,o3=0.94。所以三个目标从小到大排序为:o1

结束语

在整个算法步骤中,先用小波变换抑制背景,然后使用基于可伸缩区域自适应能量函数方法进行图像分割,并结合动态先验知识实现数据关联,从而达到对多目标的连续跟踪目的,最后根据检测条件实现对目标的提取。试验表明:使用基于可伸缩区域自适应能量函数图像分割方法迭代8~10次就可趋向稳定,可达到实时性要求,算法是一种解决复杂动态背景下运动多目标检测问题的较好实现方法。如何根据水平集方法提高图像分割速度和在先验知识中改进运动特征提取方法是下一步研究和改进的重点。

参考文献

[1]Barniv Y.Dynamic programming solution for detection dim moving targets[J].IEEE Trans.Aerosp.Electron.Syst(S0018-9251),1985,AES-21(1):144-156.

[2]马超杰,杨华,李晓霞,等.复杂场景多传感器图像的多目标分割算法[J].光电工程,2009,36(1):47-51.MA Chao-jie,YANG Hua,LI Xiao-xia,et al.Multi-target Segmentation in Multi-sensor Images in Complex Scenes[J].Opto-Electronic Engineering,2009,36(1):47-51.

[3]Meyer Y.Wavelets and Applications[C]//Proceedings of the Second International Conference on Wavelets and Their Applications,Marseille France,May,1989,20:74-87.

[4]Daubechies I.Ten Lecture on Wavelets[M].SIAM,Philadephia,1992:135-149.

[5]SUN Yu-qiu,TIAN Jin-wen,LIU Jian.Background suppression based on wavelet transformation to detect infrared target[C]//Proc.Fourth Int.Conf.Mach.Learning Cybern,Guangzhou,China,Aug18-21,2005:4611-4615.

[6]Diani M,Baldacci A,Corsini G.Novel background removal algorithm for navy infrared search and track systems[J].Opt.Eng(S0091-3286),2001,40:1729-1734.

[7]Cremers D,Funka-Lea G.Dynamical statistical shape priors for level set based tracking[J].Workshop on Variational,Geometric and Level Set Methods in Computer Vision(S0920-5691),2005,3752:210-221.

[8]Bresson Xavier,Vandergheynst Pierre,Thiran Jean-Philippe.A variational model for object segmentation using boundary information and shape prior driven by the Mumford-Shah functional[J].International Journal of Computer Vision(S0920-5691),2006,68(2):145-162.

[9]Chunming Li,Chiu-Yen Kao,Gore John C,et al.Minimization of Region-Scalable Fitting Energy for Image Segmentation[J].IEEE Trans.On Image Processing(S1057-7149),2008,17(10):1940-1948.

[10]Chunming Li,Chiu-Yen Kao,Gore John C,et al.Implicit active contours driven by local binary fitting energy[C]//IEEE Conference on Computer Vision and Pattern Recognition(CVPR),Minneapolis,M N,June17-22,2007:1520-1537.

运动复杂度 篇7

传统设计方法下进行机械机构的结构参数设计往往费时、费力, 特别是复杂机构的参数设计难以得到较理想的设计参数。基于ADAMS-Matlab联合求解下的机构结构参数的优化设计, 利用计算机辅助软件在约束域内按预定目标高速有效地优选出最佳的结构参数, 是一种理想的高精度的设计方法。目前在机械优化设计常从应力-强度角度出发, 使用有限元数值计算方法进行结构设计, 还应在机械设计中常常要考虑机械结构的运动特点, 即要从运动学分析出发优化设计产品的结构参数。本文以科研项目中遇到的复杂结构为例介绍了基于ADAMS-Matlab联合求解进行运动结构优化的思路和方法。

1复杂机构的结构简图及设计参数的初步确定

如图1 (a) 所示的机械手系统, 其机构运动原理见图1 (b) :该机构的驱动来源于凸轮。由凸轮带动连杆AB运动, 从而带动杆BD运动。杆BD的运动带动连杆DEF绕E点转动, 进而使连杆FG运动。连杆FG的运动又带动连杆GHI绕H点转动, 从而带动连杆IJ, 最终带动滑块做直线运动。在设计中希望通过对凸轮轮廓曲线及相应杆件尺寸的设计, 得到执行构件滑块的理想运动学要求。如图1所示, 建立以E为原点的直角坐标系, 在该坐标系中可以得到机构中各个参数的值:

通过对凸轮的测量, 得到了凸轮与从动件接触点离转动中心随凸轮转动角度的变化关系, 该凸轮的转速为1.686 7 rad/s, 推程角为120°, 用五次多项式进行拟合, 只考虑对推程的优化, 得到的曲线为

式中 s为接触点到凸轮转动中心的位移;φ为凸轮的转角。

优化设计点D位置随着凸轮转动的关系, D点的坐标可以由下方程组求解

式中xd, yd为D点坐标;xb, yb为B点坐标。

显然, 通过这一方程组, 无法得到D点坐标关于凸轮转动的解析关系式。在此, 采用最小二乘法进行拟合。对编号在D之前的机构进行了七次采样, 得到了七次间相应的坐标, 凸轮自身的转动速度为96.6 m/s, 即1.685 rad/s。由此, 可以得到θ0各个值时相对应的时间。在Matlab中进行拟合后得到的θ0关于时间的函数为

2 机构的运动学优化设计

利用PRO/E计算机辅助软件提供的建模技术, 进行结构的参数化建模, 导入机械系统动力学分析软件ADAMS中建模。

对机构原型进行初步的运动仿真, 得到了机构运动过程的相关运动参数。机构末端整个运动过程中的位移、速度、加速度图2所示。

由图2可以看出, 末端在整个过程中的最大位移为187 mm, 在结束时存在较大的冲击, 这点对系统来说是十分不利的。

2.1 优化目标的选择

针对原型机构在运动最后阶段存在较大的冲击, 以末端的运动规律为最终的优化目标, 进行优化, 使得其最终的冲击尽可能的小。

在此次优化设计中只考虑推程, 其推程运动规律的通式为

式中 s为接触点到凸轮转动中心的位移;φ为凸轮的转角;φ为凸轮的推程运动角;φs为远休止角;φ′为回程运动角。

结合本机构的具体情况, 可以得到本机构符合摆线运动规律的位移规律为:undefined

因此, 该机构的优化目标的函数可以定为:min[F (t) 2]。

其中

式中 s (t) 为在机构中各个参数取不同值时在运动过程中末端各个时刻的实际位移, 优化参数根据需要选择各杆长度和相互之间夹角。

优化的实现是利用已经创建的参数和测量量通过在ADAMS软件中进行目标函数和约束条件的编写来实现的。

2.2 初步优化的结果与比较

初步优化的结果与原型比较见表1。

2.3 机构的进一步优化

在进行了以上优化的基础上, 对初步优化之后的机构进行进一步的改进, 并且将D点之前的机构也考虑进来, 希望得到改进后的机构能够达到期望的运动规律时凸轮的参数。

由D点各个时刻的坐标以及AB、BD杆的长度和A点的坐标, 可以得到B点在各个相应时刻的坐标, 结合凸轮中心C点在坐标系中的坐标和凸轮辊子的半径 (20) , 可以得到凸轮各个时刻相应位置上的半径, 最后得到凸轮升程的外轮廓随转动角度的拟合表达式

式中 ρ为凸轮轮廓曲率;θ为凸轮转动角度。

在第一次进行优化的模型的基础上将加于模型E点的驱动表达式改写为

将修改后的凸轮参数代入初步优化的模型中, 对机构再次进行修改, 仿真, 重复进行第一部的步骤得到末端从动件现在的运动规律。

3 模型的最终优化结果与比较

由图3~5可以看到, 末端的最终位移为187.9 mm, 最终的加速度为208.6 mm/s2, 较原先模型的847.1 mm/s2以及初步优化之后的590 mm/s2都有了较大程度的进步, 同时其末端的运动规律与所预想达到的运动规律也是基本一致的。

可以看出在改变了连杆机构参数之后, 同时也改变凸轮的相应参数可以实现末端运动规律较大幅度的改善, 比单纯改变连杆机构的参数效果要明显。

4 结束语

基于运动分析原则确定结构设计的约束条件, 以减少执行构件的运动冲击为优化目标, 利用Pro/E软件进行参数化建模, 利用Matlab数学数值计算软件进行凸轮轮廓曲线的拟合求解曲线方程, 再利用机械系统动力学分析软件ADAMS软件进行优化仿真, 可以对复杂机构进行优化设计, 绘制出执行构件的运动规律曲线, 进而提高产品性能。

参考文献

[1]孙靖民.现代机械设计方法[M].哈尔滨:哈尔滨工业大学出版社.2003.

[2]郑凯, 胡仁喜, 陈鹿民, 等.ADAM S 2005机械设计高级应用实例[M].北京:机械工业出版社.2006.

运动复杂度 篇8

齿轮轮系指由齿轮机构构成的传动系统, 简称轮系。复杂轮系由于结构构成复杂, 故而导致其系统运动分析、数学模型建立和方案设计具有较高复杂性, 特别是数学模型的复杂性极大地增大了计算机辅助方案设计的难度。

国内外学者在轮系分析和建模方面展开了大量研究。文献[1-3]提出了基于图论的轮系建模和分析方法, 该方法界定了行星单元体和拓扑单元回路, 并基于此进行了周转轮系传动比计算。文献[4-5]提出了基于运动分离和图论表达轮系的分析方法, 研究了同一拓扑结构中机架、输入构件和输出构件间变换对应速比的影响。文献[6-8]基于轮系分解计算了常见行星轮系的速比, 并通过分析各构件的转速和转矩, 建立了轮系的功率流图。Hsu等[9,10,11]提出了基于图论研究行星齿轮传动的运动和结构分析方法, 该方法采用矩阵描述的方法推导轮系的位移和运动回转方程。Hsu等还给出了轮系传动比的计算方法, 并利用计算机进行了行星齿轮轮系的分析。

学者们提出的轮系图论分析方法及其他运动分析方法对轮系的运动分析具有一定的指导意义, 但对于后续计算机辅助轮系方案设计而言尚有一定的局限性。文献[12-16]提出了机械运动方案设计的特征状态空间理论与方法。该方法首次利用现代控制工程的状态空间理论描述机械系统运动方案设计, 通过提取运动特征状态矢量, 建立了定性的运动特征状态变换方程, 从而将机械系统运动方案设计问题转化为状态空间中矢量元素的数学计算问题。本文在其基础上, 从组成轮系最基本的一对齿轮机构出发, 经过对原型拓扑机构进行变异演化得到完善的轮系基本单元, 此外, 针对轮系的功能特点, 笔者提取了其运动特征, 建立了基本单元的数学模型, 为后续实现计算机辅助轮系设计提供了理论模型支撑。

1 轮系的单元分析方法

1.1 复杂轮系结构分解

轮系可分为定轴轮系和行星轮系。定轴轮系中所有齿轮轴线相对机架位置均固定;行星轮系至少有一个齿轮的轴线相对于机架的位置不固定。复杂轮系是由定轴轮系和行星轮系构成的传动系统。

轮系构成的复杂性增大了其分析与建立数学模型的难度, 进而增大了后续方案设计的难度。一般地, 复杂系统的构成分解是简化其研究的一种有效方法。系统构成分解具有很强和很明确的目的性, 其分解的层次在一定程度上决定了后续建模的复杂度及设计可行解的局限度。本文为便于建立复杂轮系运动方案设计的数学模型, 以齿轮机构作为其研究基本要素进行运动构成分解。图1所示的轮系可拆分为4个基本齿轮机构:两自由度的外啮合圆柱齿轮机构和圆锥齿轮机构, 单自由度的内啮合圆柱齿轮机构和圆锥齿轮机构, 具体如图2所示。其中, 各单元中的构件以数字和H标识, H为行星轮系的系杆。

构成复杂轮系的齿轮机构是传递运动变换的基本载体, 是复杂轮系基本运动构成要素, 即是单元化分析方法的研究对象。

1.2 轮系方案设计的单元分析法

轮系方案设计的单元分析法通过离散与分解轮系构成, 利用单元及单元组合进行轮系分析与综合。本文通过分析轮系运动构成规律, 确定轮系基本单元的基本构型, 并给出其定义:能够独立完成运动变换且不可继续拆分成两个或多个独立运动的齿轮机构, 称为轮系基本单元, 简称基本单元。

任何复杂轮系均可由运动变换基本单元连接组合构成。单元组合的实质是施加连接约束。根据单元的连接约束, 其组合方式可以是串联、并联或混联。单元自身特性、单元之间连接约束和组合方式直接决定了整个轮系的特性。因此, 轮系方案设计的单元分析与建模方法是首先在深入分析轮系基本单元特性及输入输出特征的变换规律基础上, 研究单元各组合方式下构件的连接约束特征及组合特征;然后通过建立基本单元的特征模型及连接约束组合模型描述轮系的系统特征。轮系的系统特征数学模型是轮系方案设计的基础。

2 轮系基本单元构型设计

基本单元是轮系中最小功能转化实体, 其构型决定了轮系运动变换特征;其数量直接影响轮系可行方案的多寡。因此, 基本单元构型设计是轮系方案设计的关键问题之一。本文提出了基于基本单元原型、利用其拓扑结构不变性特征进行基本单元构型的设计方法。

2.1 轮系基本单元原型及其拓扑结构

轮系基本单元的基本构型是单自由度和双自由度的齿轮机构, 其他基本单元可通过基本构型的变异演化得到。在此, 轮系基本单元的基本构型称为基本单元原型, 图3a和图3b分别为单自由度和双自由度基本单元原型。两种基本单元分别具有定轴回转和行星回转运动特征。

机构的运动副、构件等运动构成要素以一定的方式连接, 构成了机构拓扑结构。机构拓扑结构主要描述了构成要素及其相互邻接关系, 而不考虑诸元素大小和元素之间的距离。分析基本单元原型机构的拓扑特征可知, 单自由度基本单元原型拓扑结构特征为含有一个齿轮副、两个转动副和三个构件;双自由度基本单元原型拓扑结构特征为含有一个齿轮高副、三个转动低副和四个构件。若约定实心圆和空心圆分别表示齿轮副 (GP) 和转动副 (RP) , 实线表示构件, 单双自由度基本单元原型机构的拓扑结构可分别描述为图4a和图4b。

基本单元拓扑图直观地描述了基本单元原型机构的构成要素类型和数量、要素间的邻接关系。

2.2 轮系基本单元的构型图谱

基本单元的拓扑结构决定于构件和运动副的类型、数目以及构件与运动副之间的连接关系。同构基本单元可具有不同的运动构型。基于基本单元原型及其拓扑结构的不变性, 以及构件运动特征变换、齿轮结构类型和啮合类型变换规律, 可推衍出不同的单元构型, 进而可建立完善的基本单元构型图谱。

构件的运动特征提取包括运动类型、运动方向及运动属性的提取。轮系中的构件运动类型主要为定轴回转运动、行星回转运动及零运动 (固定构件) 。其运动方向仅有正反向的回转;运动属性为连续的匀速回转。因此, 影响基本单元变异的运动特征主要是构件的运动类型。轮系中构件类型的变异是运动类型的转换, 即机架变换。轮系基本单元中的构件类型有机架、齿轮和行星架。由于一对齿轮是通过齿轮副实现动连接的, 即与齿轮副邻接的构件类型为齿轮;而与齿轮副非邻接的构件则为机架或行星架。若基本单元的一个构件指定为机架, 根据齿轮副在基本单元拓扑图中的位置, 即可确定基本单元中其他构件的类型及基本单元的类型。如图4a所示的单自由度基本单元, 构件2和构件3为齿轮, 若非齿轮构件为机架时, 该基本单元类型为定轴齿轮机构, 如图5a所示;若齿轮2或齿轮3为机架时, 该基本单元中构件1为行星架, 且行星架的回转轴线固定, 如图5b所示。同理, 双自由度基本单元的机架变换后得到的两种基本单元构型的拓扑图见图5c和图5d。

通过对同构基本单元进行齿轮结构类型和啮合类型变换, 可获得不同的单元构型。齿轮结构类型可分为圆柱齿轮和圆锥齿轮。啮合类型有内啮合和外啮合。单自由度基本单元经过齿轮结构及啮合类型变换, 可得到7种单元构型, 如图6所示。同理, 双自由度基本单元变换后可得到6种构型, 其中3种构型中出现2个行星架邻接现象, 从运动角度分析可知, 其中的1个行星架冗余, 去除冗余构型, 双自由度基本单元变换后得到3种有效构型, 如图7所示。

综上, 利用基本单元的拓扑结构、构件的运动和结构类型及齿轮啮合类型的变换, 获得了10种单/双自由度和内/外啮合的圆柱和圆锥齿轮基本单元构型图谱。

3 轮系基本单元的特征状态建模

3.1 特征状态向量

基本单元的运动类型包括定轴回转和行星回转运动。运动方向通过建立笛卡儿坐标系进行描述。运动属性描述运动的连续性、稳定性及其输入输出的变换特征等。轮系的主要特征属性是运动连续、稳定及输入输出的线性变换。

根据状态空间理论可知, 系统状态可以由一组独立变量来描述, 并称以这组变量构成的向量为状态向量。在机械装置中, 运动特征变换实质是特征状态的转变。因此, 定义一组变量描述轮系系统或基本单元的运动特征, 称之为运动特征状态向量。

首先建立基本单元的笛卡儿坐标系:以基本单元输入构件运动平面为坐标系的Oxy平面, 以该构件的运动方向为x方向, 以回转中心为坐标原点O。类似地, 建立各构件的坐标系, 并保持构件坐标系各坐标轴与基本单元的相应坐标轴同向。基本单元坐标系为定坐标系, 构件坐标系为动坐标系, 可利用构件坐标系相对基本单元坐标系的运动关系, 描述具有行星运动的构件的特征。轮系运动特征状态向量K定义为K= (KA, KB) T, 简称特征向量, 其中, KA表示构件坐标系在基本单元坐标系中的运动特征, KB表示构件在自身坐标系中的运动特征。对于具有定轴回转运动的构件, 特征向量中分量KA为零向量;对于行星运动构件, KA为非零向量。由于轮系各构件以回转运动为特征, 其特征状态变量定义为角速度在不同坐标系下的三向分量KA= (wAx, wAy, wAz) 和KB= (wBx, wBy, wBz) , 并规定当构件沿轴线方向逆时针转动时转速为正, 变量值描述其运动属性值。

运动特征状态向量很好地表达了系统的运动特征, 是建立轮系特征模型的基础。

3.2 轮系基本单元的运动特征建模

基本单元的运动特征变换是输出运动特征相对于输入运动特征的变换, 即由给定的输入构件特征向量转换为输出构件的特征向量。这种变换关系可抽象为数学描述, 并可进一步构建运动变换的特征状态方程。

3.2.1 轮系基本单元运动特征方程

理论上, 基本单元除固定的机架外, 其他任何构件均可作为输入构件或输出构件。若基本单元有m个输入构件、n个输出构件, 基本单元输入、输出运动特征向量分别为Ki、Ko, 且可表达为

其中, 第j个输入构件的运动特征向量;第j个输出构件的运动特征向量。

根据轮系基本单元输入输出运动变换的线性特征, 其特征状态方程为线性方程, 可采用矩阵形式进行描述。基本单元输出运动特征向量可由输入运动特征向量表示:

式 (3) 是基本单元的运动特征模型的一般表达式, 称为基本单元的运动特征状态方程, 其中A为m×n阶矩阵, 称为特征状态变换矩阵。

特征状态变换矩阵A描述了输入特征状态向量和输出特征状态向量间的变换关系。矩阵中的非零元素的位置表明输入输出特征向量间方向变换关系;非零元素值代表了两特征向量间变换的运动特征属性值。同时, 特征状态变换矩阵A反映了基本单元的变换特征, 任一基本单元均可由其进行描述。因此, A可作为计算机信息存储特征。

3.2.2 单自由度基本单元运动特征模型

单自由度轮系基本单元是单输入单输出机构, 仅有2个运动构件, 如图6所示。由前述可知, 平行轴圆柱齿轮基本单元和90°轴交角的圆锥齿轮基本单元, 由于只有一个输入构件和一个输出构件, 式 (1) 和式 (2) 的运动特征向量均为一维。由式 (3) 可知, 基本单元的特征状态变换矩阵A为6×6阶矩阵。该特征状态方程展开为矩阵形式如下:

根据基本单元坐标系构建规则, 输入、输出特征状态向量中的非零元素位置由输出构件的运动类型和方向决定。定轴回转运动的特征向量分量KA为零向量;行星运动的特征向量分量KA为非零向量。特征状态变换矩阵A的非零元素aij的数量、位置由输入输出特征向量确定, 其值由基本单元构型及参数决定。假设输入、输出定轴回转运动的特征向量的非零变量分别是wiBl、woBk, l、k为对应变量所在的行, 则i=k, j=l, 。

如图6a所示的基本单元, 其运动构件均具有固定回转轴线, 输入和输出特征向量平行且l=k=4, 则特征状态变换矩阵非零元素为a44, 其值为齿轮机构的传动比值。

同理, 其他单自由度基本单元特征模型均可由式 (4) 求得。

3.2.3 双自由度基本单元运动特征模型

双自由度轮系基本单元具有2个输入构件和1个输出构件, 依据式 (1) 建立输入特征状态向量Ki= (KiA1, KiB1, KiA2, KiB2) T和输出特征状态向量Ko= (KAo, KBo) T, 其特征状态方程同样满足式 (3) , 变换矩阵A为6×12阶矩阵。

同理, 特征状态变换矩阵中的非零元素、位置同样由输入与输出特征向量确定, 其值由单元传动比决定。

3.3 轮系基本单元存储

特征状态变换矩阵反映了基本单元的特征信息, 并表达了输入输出特征向量间的关系, 因此, 将其作为信息存储模型, 便于实现计算机辅助设计。对于同一个基本单元, 不同的输入输出具有不同的特征状态变换矩阵。基本单元的特征信息提取为:自由度、输入输出构件、特征状态变换矩阵的非零元素位置及特征值。基本单元的这些特征的存储是后续实现计算机方案设计的知识源。

4 结论

(1) 单元化方法是简化复杂轮系分析和综合的有效方法, 特别利于简化系统综合的数学模型。

(2) 利用机构拓扑结构不变性, 对轮系基本单元原型机构进行变异演化, 可获得完善的轮系基本单元构型。

上一篇:整合式阅读教学下一篇:地下滴灌系统