自适应估计

2024-09-18

自适应估计(通用7篇)

自适应估计 篇1

1 引言

视频编码标准H.264/AVC的压缩效率比MPEG-2、MPEG-4提高了近1倍[1],与此同时也造成了运算量的大幅增加,因此高效快速的运动估计算法成为H.264实时编码器实现的关键。由于运动是视频序列固有的根本特征,所以有效利用和适应运动特征的运动估计算法可以显著提高搜索速度和编码效率。

目前,典型的快速搜索算法有三步搜索法、四步搜索法、菱形搜索法、六边形搜索法、预测运动矢量场自适应搜索算法(PMVFAST)、具有匹配预判的自适应不规则模板搜索算法(AIPS-MP)等。此外,我国研究人员还提出了非对称十字型多层次六边形网格搜索算法(UMHexagonS)[2,3],这种算法采用整数像素运动估值,在高码率、大运动图像序列编码中能保持较好率失真性能,运算量很低,已被H.264标准采纳。

2 PAFME算法

实验发现,UMHexagonS算法的搜索策略也存在一些缺点和不足,如:对于不同的运动序列都采用固定的搜索模板和相同的搜索策略,这样虽能保证较高的搜索精度,但由于没有充分利用不同序列及不同块的特征,不能自适应地结束搜索,因此存在较多的冗余搜索点,造成搜索开销增大。笔者结合H.264标准采用的可变块尺寸运动估计技术的特点,提出了一种搜索模式自适应的快速运动估计算法(Search Pattern Adaptive Fast Motion Estimation,PAFME),并通过实验测试了算法性能。PAFME算法主要采用以下核心技术:初始搜索点预测,多搜索模式选择,利用经验阈值调整搜索模式的使用。

该算法的主要思想是在保证图像质量的前提下,减少算法中的冗余搜索点,从而加快运行速度。在该算法中使用由经验得到的整数型常数作为基值;对不同尺寸的块类型,采用对基值进行简单的移位操作,以作为不同的判断阈值。

在搜索的过程中,首先对初始预测点集中的部分预测点(中值预测点及原点)进行搜索,包括小菱形四点搜索和可能的密集搜索步骤;仍不满意,再搜索上层块类型预测点,而后按当前最佳点进行小菱形搜索或可延伸的六边形和小菱形搜索步骤。算法流程如图1所示。

3 实验结果与分析

把新算法嵌入到H.264的标准参考软件JM12.4中进行测试比较,以验证其有效性。测试条件:在基本框架下,采用SATD和RDO指标,搜索范围为所有编码模式,1/4像素精度,参考帧数为1,第一帧为I帧,其余为P帧。测试序列有:Forman(QCIF,10 f/s(帧/秒)),Paris(CIF,15 f/s),Football(SIF,30 f/s),各100帧。之所以选用纹理和运动复杂度各不相同的3种测试序列,格式、帧率均有差异,是为了充分测试算法对不同内容的视频序列在不同目标下的应用性能,并且选用4种量化参数以测试算法在不同码率下的性能。

采用亮度信号的峰值信噪比(PSNRY)、比特率、整数像素精度运动估计总时间(t)等指标对PAFME算法与JM12.4参考软件采用的快速算法(JM12.4FME)的性能进行比较,实验结果详见表1。可见,PAFME算法具有以下特点:1)PSNRY平均损失0.018 d B,最大不超过0.088 dB,所以新算法对视频重建质量的影响可忽略;2)比特率的增加未超过0.7%,所以新算法对编码效率影响很小;3)运算量有较大降低,整像素精度运动估计速度提升明显,耗时平均减少33%。

对上述测试序列,在不同量化参数下,PAFME算法与JM12.4FME相比,其整像素精度运动估计的耗时百分比(tPAFME/tJM12.4FME)见图2。由图可见,在不同量化参数下,PAFME算法性能稳定,即新算法的有效性受量化参数影响较小。对不同特征的信号序列,算法性能有所差异,对运动一致性较好的序列,整像素精度运动估计的耗时可减少35%以上,搜索速度较快。

4 小结

笔者针对现有算法的不足,提出搜索模式自适应的快速运动估计算法PAFME,结合H.264标准采用的可变块尺寸运动估计算法的特点,利用运动矢量在时空域及不同编码模式间的相关性,设计了初始搜索中心的预测方法。通过测试发现:自适应的搜索模式选择规则可以显著地加快运算速度,并保持了视频质量和码率基本不变,为高速的运动估计提供了一种新的方向。

摘要:提出了一种搜索模式自适应快速运动估计算法(PAFME),首先利用变块尺寸运动估计的特点与运动矢量的时空域相关性,预测初始搜索中心;采用多种搜索模式以适应不同运动特征,提出了搜索模式自适应的选择机制,以节省不必要的搜索点加快搜索速度;又能避免陷入局部极小。实验结果表明,与H.264/AVC的参考软件JM12.4相比,该算法使整像素精度运动估计的速度提高了30%~40%,同时保持了图像质量和码率基本不变。

关键词:运动估计,搜索模式自适应,H.264

参考文献

[1]OSTERMANN J,BORMANS J,LIST P,et al.Video coding with H.264/AVC:tools,performance,and complexity[J].IEEE Circuits and Systems Magazine,2004,4(1):7-28.

[2]CHEN Zhibo,ZHOU Peng,HE Yun.Fast motion estimation for JVT,Doc.JVT-G016[C]//Proc.7th JVT Meeting,2003.Pattaya,Thailand:JVT,2003.

[3]CHEN Zhibo,ZHOU Peng,HE Yun,et al.Fast integer pel and fractional pel motion estimation in for JVT,Doc.JVT-F017[C]//Proc.6th JVT Meeting,2002.Awaji,Island,JP:JVT,2002.

自适应估计 篇2

H.264/AVC由ITU-T视频编码专家组 (VCEG) 与ISO/IEC MPEG组成的JVT (Joint Video Team) 联合开发, 沿用了基于块的混合编码技术, 但在技术细节上做了很大改进, 采用了多参考帧预测编码、多种可变块大小的帧间编码模式、1/4像素精度的运动补偿等先进技术。由于上述先进编码技术的引进, H.264/AVC成为近年来最为高效的一个视频压缩标准, 与MPEG-2、MPEG-4相比, H.264/AVC的压缩效率为它们的2倍[1]。但与此同时也造成了运算量的大幅增加。由于运动是视频序列所固有的根本特征, 通过充分利用与运动特征相适应的运动估计算法, 可以显著提高编码技术在搜索速度和编码效率方面的性能。

本研究提出一种搜索模式自适应快速运动估计算法 (PAFME) 。

1 典型的运动估计算法

早期的快速搜索算法有:三步搜索法 (TSS) 、新三步搜索法 (NTSS) 、二维对数搜索法 (LOGS) 、十字搜索算法 (CS) 、四步搜索法 (FSS) 、菱形搜索 (DS) 、六边形搜索等。在上述算法中, 最高效、最常用的是减少搜索点数的新三步法[2]、菱形法[3]与六边形法[4]等。此类快速算法基于如下假设:运动矢量为中心偏离分布, 且搜索点在接近全局最优点时对应的匹配误差单调下降。由于上述假设条件并不总能成立, 特别在运动较大时, 此类算法容易陷入局部极小, 会显著降低视频质量。近几年发展起来的基于运动矢量预测的快速运动估计算法, 如预测运动矢量场自适应搜索算法 (PMVFAFST) [5]、增强的预测带状搜索 (Enhanced Predictive Zonal Search, EPZS) [6]与具有匹配预判的自适应不规则模式搜索算法 (Adaptive Irregular Pattern Search with Matching Prejudgment, AIPS-MP) [7]和UMHS算法 (hybrid Unsymmetrical-cross Multi-Hexagon-grid Search) [8,9]等, 显示出了更好的编码性能和较快的搜索速度。此类算法利用运动矢量的相关性预测初始搜索中心, 基于“初始搜索中心接近全局最优点”的假设, 仅在初始搜索中心附近按特定搜索模式进行局部搜索;此外常引入匹配预判方法提前终止局部搜索, 以进一步节省计算开销。显然, 其性能依赖于初始搜索中心预测的可靠性及搜索模式的设计, 且与块的局部运动特征密切相关。

而在H.264/AVC参考软件中使用的就是UMHS算法。UMHS算法采用了基于运动矢量预测的快速运动估计技术的基本思想, 只是在初始搜索点、搜索模板及搜索中止准则的设计上, 充分利用了H.264中多块尺寸运动补偿模式与多参考帧的特点, 以解决因减少搜索点数而容易陷入局部极小的问题。UMHS算法主要步骤如下:

(1) 初始搜索点预测—空域的中值预测、上一层块尺寸类型的预测、相邻参考帧间的预测与时域预测, 搜索以上所有的初始搜索点, 判断是否满足提前中止准则;

(2) 不对称十字形搜索, 并判断是否满足提前中止准则;

(3) 多六边形栅格搜索, 包括半径为2像素的正方形模板与多个六边形 (16像素) 模板;

(4) 可延伸的基于六边形的搜索, 包括六边形模板与菱形模板。

其中, 提前中止准则基于3种RDC预测方式—中值预测、上层块尺寸类型预测与相邻参考帧的预测, 并且为量化参数的函数。此算法中每一步都是以前一步搜索所得的最佳匹配点为搜索中心。

可见, UMHS算法利用了H.264中多块尺寸运动补偿模式与多参考帧的特点;采用了块尺寸类型间运动矢量预测方法以及相邻参考帧间运动矢量预测方法, 提高了初始搜索点预测的准确性;采用了不对称十字形、多六边形栅格、六边形搜索等搜索模板, 以尽量避免陷入局部极小;设计了基于块尺寸类型间RDC预测与相邻参考帧间RDC预测的中止准则, 使得在运动矢量预测准确时能快速中止。

2 PAFME算法

经过大量实验测试和深入分析发现, UMHS算法的搜索策略仍存在一些缺点和不足, 即对于不同的运动序列都采用固定的搜索模板和相同的搜索策略, 这样虽能保证较高的搜索精度, 但由于没有充分利用不同序列及不同块的特征, 不能自适应地结束搜索, 存在较多的冗余搜索点, 产生很多不必要的搜索, 从而造成搜索开销增大。笔者结合H.264/AVC标准采用的变块尺寸运动估计的特点, 提出了一种改进算法即搜索模式自适应的快速运动估计算法 (PAFME) , 并通过仿真测试了算法的性能。PAFME算法针对UMHS算法的特点做了3个方面的改进:初始搜索点预测;多搜索模式选择;利用经验阈值调整搜索模式的使用。

2.1 初始搜索点预测

在初始搜索点预测方面, 其仅采用了空域的中值预测与上一层块尺寸类型的预测;如图1所示, 对运动矢量采用中值预测, 利用位于当前块左边、上边、右上 (或左上) 相邻块的预测值来预测当前块的运动矢量。

pred_mv=median (Mv_A, Mv_B, Mv_C) (1)

预测运动矢量为 (pred x, predy) 。当A块位于图片或宏块边界以外时, 其运动矢量将被 (0, 0) 所替代;若C块位于图片或宏块边界以外, 则被D块的运动矢量所替代, 而当B和C都不在边界之内时, 则将被第3块的运动矢量所替代。

在H.264变尺寸块匹配运动估计中, 同一块在不同编码模式下所得运动矢量也具有相关性[10]。编码模式为m的块, 其上层块尺寸类型下运动矢量集合记为MVUP, m=1时对应空集, 其具体构成如下:

undefined

式中 MVm—编码模式m下此块的运动矢量。

2.2 多搜索模式选择

搜索模板的大小和形状不但影响运动估计速度, 而且直接关系到算法的性能。为了获得更好的搜索速度和性能, 确定搜索模板的类型, 必须分析运动矢量分布的状况。

视频图像序列的运动矢量分布一般具有如下特性:

(1) 约有81.80%的运动矢量位于以中值预测点为中心的正方形搜索窗口内;77.52%的运动矢量位于菱形区域, 特别是有45.44%的运动矢量是零矢量。这说明绝大部分的图像块是静止或准静止的, 运动矢量分布具有中心偏置特性[11]。

(2) 运动矢量的概率分布是以中值预测点为中心向四周递减的;

(3) 运动矢量分布在水平和垂直方向的概率要比分布在相同半径下的其他方向大。

根据上述运动矢量的分布特性, 在PAFME算法中先后采用了局部3×3正方形搜索模式 (如图2所示) 、小菱形搜索模式 (如图3所示) 以实现小运动矢量的快速搜索;对于运动较大的块, 采用六边形搜索模式 (如图4所示) 可以实现搜索范围和搜索速度的折衷;另外对于运动剧烈或运动矢量分布不规则的区域, 为了在搜索中避免陷入局部极小, 采用“十”字形模式 (如图5所示) 和多层六边形模式进行大范围的稀疏搜索。在算法的执行过程中通过使用一些经验阈值自适应地调整搜索模式。

2.3 利用经验阈值调整搜索模式的使用

根据RDC选择搜索模式, RDC阈值采用简单的经验阈值 (Jth, 由经验得到的整数型常数作为基值, 其经验阈值的计算方法参见文献[12]) , 通过J

(1) 收敛条件:若满足收敛条件 (J

(2) 密集搜索条件:若满足密集搜索条件, 则进行密集搜索以避免搜索到的是局部最优。

3 测试结果与分析

为验证新算法的有效性, 把新算法嵌入到H.264的标准参考软件中进行测试比较。测试过程中选用的H.264视频编码器版本为JM12.4。测试条件如下:基本框架 (baseline profile) 下, 采用RDO、SATD, 搜索范围为16像素, 1/4像素精度, 针对所有编码模式, 参考帧数设为1, 第1帧为I帧, 其余各帧都为P帧。测试序列为:Silent (QCIF) , 帧率15 fps, 150帧;Forman (QCIF) , 帧率10 fps, 100帧;Paris (CIF) , 帧率15 fps, 100帧;Mobile (CIF) 与Football (SIF) , 帧率30 fps, 100帧。这些测试序列的纹理和运动复杂度各不相同, 格式从QCIF到CIF, 帧率也有差异, 以充分测试算法对不同内容视频序列在不同目标应用下的性能。为在较大码率变化范围下测试算法的性能, 量化参数QP设置为8、18、28与38。QP=28时PAFME算法与JM12.4参考软件中的UMHS算法在亮度信号的峰值信噪比 (PSNRY) 变化情况、比特率 (Bit-rate) 变化情况、整数像素精度运动估计总时间 (Time) 变化情况等方面的比较结果如表1所示。Foreman序列和Football序列的率失真曲线如图6、图7所示。

从表1中可以看出, 对所有测试序列采用PAFME算法的情况与采用JM12.4FME算法时相比, 具有以下特点:

(1) 亮度信号的PSNR损失平均为0.018 dB, 最大不超过0.088 dB, 对视频重建质量的影响可以忽略;

(2) 比特率的增加很小, 最大不超过0.7%, 编码效率基本不变;

(3) 整像素精度运动估计的耗时平均降低了33%左右。

以上仿真结果同时表明, 搜索模式选择规则的有效性受量化参数影响较小, 主要依赖于序列的运动特征。与JM12.4FME算法相比, 所提出的搜索模式自适应的快速运动估计算法显著降低了计算量, 同时保持了编码效率基本不变。

4 结束语

在分析现有算法的优势和不足之处的基础上, 本研究提出了一种搜索模式自适应的快速运动估计算法。针对H.264采用的变块尺寸运动估计技术的特点, 笔者利用运动矢量在时域、空域及不同编码模式间的相关性, 设计了初始搜索中心预测方法, 并引入了搜索模式自适应调整的方法。通过测试发现:自适应的搜索模式选择规则可以显著地加快运算速度, 并保持视频质量和码率基本不变。

参考文献

[1]OSTERMANN J, BORMANS J, LIST P, et al.Video cod-ing with H.264/AVC:tools, performance, and complexity[J].IEEE Circuits and Systems Magazine, 2004, 4 (1) :7-28.

[2]LI R X, ZENG B, LIOU M L.A new three-step search al-gorithm for block motion estimation[J].IEEE Transac-tions on Circuits and Systems for Video Technology, 1994, 4 (4) :438-442.

[3] ZHU S, MA K K. A new diamond search algorithm for fast block-matching motion estimation[J]. IEEE Transactions on Image Processing, 2000, 9 (2) :287-290.

[4] ZHU C, LIN X, CHAU L P. Hexagon-based search pattern for fast block motion estimation[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2002, 12 (5) :349-355.

[5]TOURAPIS A M, AU O C, LIOU M L.Predictive MotionVector Field Adaptive Search Technique (PMVFAST) -En-hancing Block based Motion Estimation[C].Proceedings ofVisual Communications and Image Processing 2001 (VCIP-2001) .San Jose:[s.n.], 2001.

[6]TOURAPIS AM, AUO C, LIOUML.Highly efficient pre-dictive zonal algorithms for fast block-matching motion esti-mation[J].IEEE Transactions on Circuits and Systemsfor Video Technology, 2002, 12 (10) :934-947.

[7]NIE Y, MA K K.Adaptive irregular pattern search withmatching prejudgment for fast block-matching motion estima-tion[J].IEEE Transactions on Circuits and Systems forVideo Technology, 2005, 15 (6) :789-794.

[8] CHEN Z, ZHOU P, HE Y. Fast Motion Estimation for JVT, Doc. JVT-G016[C]. 7th JVT meeting 2003. Pattaya:[s.n.], 2003.

[9] CHEN Z B, ZHOU P, HE Y. Fast Integer Pel and Fractional Pel Motion Estimation in for JVT, Doc. JVT-F017[C]. 6th JVT Meeting 2002. Awaji: [s.n.], 2002.

[10]CHEN Z, ZHOU P, HE Y.Fast Motion Estimation forJVT, Doc.JVT-G016[C].7th JVT meeting 2003.Pat-taya:[s.n.], 2003.

[11]CHEUNG C H, PO I M.A novel cross-diamond search al-gorithm for fast block motion estimation[J].IEEETransactions on Circuits and Systerns for Video Tech-nology, 2002, 12 (12) :1168-1177.

自适应估计 篇3

H.264[1]是一种高性能的视频编解码技术,其既保留了以往压缩技术的精华又具有其他压缩技术无法比拟的许多优点,并且很好地兼顾了图像质量、网络带宽和网络稳定性的限制,在高清视频、视频会议、高清监控和移动多媒体等各个领域都有广泛应用。

然而H.264性能改进是以编码复杂度大幅增长为代价的,其编码时间与MPEG-4相比有大幅增加,严重降低了编码的实时性。因此针对H.264编码速度的优化和提高是H.264标准走向实时应用的关键。接下来,笔者针对H.264测试模型中所选用的典型运动估值算法非对称十字多重六边形网格搜索(UMHexagonS)算法进行深入分析,并针对其不足提出对应的改进方法,达到降低整体算法的运算复杂度的目的。

2 UMHexagonS算法

针对H.264算法复杂度高的问题,近年来各国学者提出了许多快速算法以减少运动估计的计算复杂度,同时基本保持了原有视频质量。Chen Zhibo等人[2]提出的UMHexagonS算法能很好地满足低码率和实时性的要求,已被H.264协议正式采用。以下是对UMHexagonS流程进行介绍。

UMHexagonS算法大致分为以下几个步骤:

阶段1:搜索起始点的预测。根据H.264采用多参考帧和7种分块模式,利用运动矢量间存在时间和空间上的相关性,使用5种预测模式来预测当前块的运动矢量(MVpred)。随后根据不同起始点的率失真结果使用阈值判别,分为非满意区、满意区和很满意区,然后进行分别处理。

阶段2:对于非满意区的子块进行搜索。对以上运动矢量所指向的点使用非对称十字模板搜索(如图1),获得当前的最佳预测起点,完成后转至阶段3。

阶段3:

1)以目前最优点为中心,在(-2,2)的方形区域中螺旋搜索5×5区域,类似于全搜索,但只搜前25个点;搜索完后,获得当前最优点,对残差值(min_cost)进行判断此处是否属于满意或很满意区,然后跳到阶段4中相应步骤。

2)进行非均匀多层次六边形格点搜索(如图1),直至搜索到能符合相应阈值而进入阶段四相应步骤的点位置,否则也结束阶段2进入阶段3。进行该种模板搜索的目的主要是预防陷入局部最小点。该步要搜索16×4=64个搜索点。

阶段4:

1)对于满意区的子块进行搜索。以目前最优点为中心,使用小六边形模板搜索(如图1),直到最优点在中心时跳转到下一步。

2)对很满意区的子块进行搜索。以当前在最优点为中心,使用小菱形模板搜索(如图1),直到最优点在中心时结束搜索算法。

UMHexagonS算法虽然是一种快速算法,但其仍然存在计算复杂的问题,同时,在某些块搜索匹配过程中还是易导致局部最优情况,故后期一些学者针对该算法上进行了进一步改进。清华大学徐晓中等人[3]在基于UMHexagonS算法基础上,结合统计特征和自适应阈值终止策略来进行改进。S.Saponara等人[4]提出了根据输入信号的统计特性来动态配置运动估计搜索参数的方法。Xiaomin Wu等人[5]基于UMHexagonS算法提出了类似的混合搜索算法,可以达到与UMHexagonS算法和EPZS算法相当的效果。Duanmu C.J.等人[6]对UMHexagonS算法中部分模板做出改进,提出采用多层次八角形格点搜索模板,减少复杂度以达到更好的搜索效果。吴晓军等人[7]采用动态搜索范围(DSR)的方法对UMHexagonS算法进行优化。Cai Canhui等人[8]提出采用分层块匹配法和空间邻域搜索策略来找出最佳全像素运动矢量的方法构造的新算法。

3 UMHexagonS算法优化及自适应策略

UMHexagonS算法性能优越,但其速度较慢,通过进行算法分析及不断试验测试,在模板匹配问题上,笔者发现UMHexagonS算法有几点不足:

1)算法阶段2采用十字模板是固定的模板,共有24个点。采用固定模板的缺陷在于最优起始点不一定会落在该十字型的模板上,这样有可能无法更精确地定位那些未落在轴线上的最优起始点,而运动矢量起始点对于运动估计算法的性能是至关重要的,故固定模板会导致算法性能缺陷。

2)算法阶段3-1中,通过分析运动矢量中心分布特性和参考台湾国立中央大学Tsung-Han Tsai和Yu-Nan Pan学者对测试序列的运动矢量分布研究,可知在半径为3的方形区域,如图2中所示,运动矢量在A,B,C和D点的出现的概率分别约占64.934%,13.026%,1.81%和4.286%。所以对于原算法搜索5×5正方形区域的25个点,其数量和分布可以有更优的选择。

3)算法阶段3-2中,通过分析可以得出,在整个编码过程中此步骤中计算的搜索点数是相当大的,而根据运动矢量场的分布空间方向性,非均匀多层次六边形格点搜索固然能保证运动矢量被精确搜索到,但其部分计算量是完全冗余的,这些浪费掉的计算量造成算法速度降低,且不能对编码性能有更多贡献。

针对以上3个问题,通过引入各种自适应模板和多层次搜索策略,设计出以下3种针对性解决方法:

1)自适应十字模板

针对问题1,可以采用一个小的自适应十字模板来进一步准确确定最优起始点,当最优点在十字模板的中心时跳到下一步,否则则向运动矢量落入的方向移动小十字模板。这样每进行一次搜索需要6个点,最大计算量(6+3×2+4+6+5×2=32点)与原非对称十字相差不大的情况下,可覆盖落在轴线以外区域的运动矢量起始点,每次运动估计只进行一次该流程,故可忽略增加的计算量,而获得的更精确的运动矢量起始点对后续运动矢量计算有较大贡献。模板如图3a。

2)引入双菱形模板

针对问题2来说,据Tsung-Han Tsai和Yu-Nan Pan学者的分析结果,可以设计如下两个菱形模板来覆盖中心区域,此搜索模板经测试可实现与原算法基本相同的算法性能。双菱形模板形状如图3b。

3)多方向的多层次模板

充分利用运动矢量分布特征,采用合适策略便可在保证运动矢量搜索精度前提下大大减少搜索点数。故可结合阶段1中的预测的运动矢量(MVpred)的相关信息,构建具有自适应能力的方向选择模板,并且通过模板层次可变策略来减少搜索点数。这样既可以有效避免陷入局部最小,也极大地提高搜索的效率。

(1)引入方向选择性的模板

由于运动矢量场的分布具有空间方向性,根据自适应非对称十字模板搜索结果得到的最优预测起点(设为N点)相对于UMHexagonS算法阶段1中经过5种预测模式得到的起始点(设为M点)的方位,来选择不同方向的多层次模板(每层5个点)。因为对于阶段1中得到的最佳预测起点,它基本可以保证运动估计后的最优点会在最佳预测起点附近,而在自适应非对称十字模板的搜索后可以确定最终的最优点相对于预测起点的偏离方向。利用该偏离的方向性来为下一步进行自适应地选择相应方向性模板提供信息,从而避免采用UMHexagonS算法中非均匀多层次模板中大量点的搜索,保证在加快搜索速度同时避免陷入局部最小。该种模板可分为水平方向多层次模板、垂直方向多层次模板、45°方向多层次模板和135°方向多层次模板。例如N点在M点的水平左边或右边,则相应采用水平模板,其余以此类推。4种模板形状如图4所示。

(2)引入搜索层次可变策略

在阶段1中的起始点预测中,根据预测得到的运动矢量(MVpred)的大小,可对视频序列的运动程度做出一个划分,即小运动、中运动和大运动。这3种运动类型决定了搜索要采用的模板。小运动对应为只采用模板的中间2层,中运动对应为只采用模板的中间4层,大运动对应为采用模板的所有8层。结合预测的运动矢量大小和多次实验测试经验值,设定判别阈值来对所要编码宏块的运动情况进行分类,则进行如下判定

对于整个算法的复杂度,可以由搜索点数来给出。对于16×16大小的宏块在搜索窗为16时,UMHexagonS算法的搜索点数至少为N1=124点,而本文给出的算法的搜索点数至少为N2=30点。由上可知,本文的算法有效地降低了搜索点数,相应地运动估计时间也极大地减少,总的编码时间也会减少。

4 实验结果及分析

4.1 测试平台及配置

为了对本文算法的性能做出综合性能的评价,采用JM10.2[9]为实验软件平台,实验计算机硬件主要配置为:Intel Core 2 Duo T6670@2.20 GHz,2 Gbyte内存。对本文算法和UMHexagonS算法分别进行仿真实验。测试序列集为5个QCIF格式序列。这5个序列是不同运动类型的标准视频序列:如剧烈运动序列为coastguard,中运动序列为foreman和mobile,小运动序列为slient和akiyo。

编码档次为Baseline Profile,实验主要的编码参数如表1所示,其他参数为缺省配置。

4.2 实验结果与分析

实验评价标准中采用亮度的峰值信噪比(PSNR)、码率、总编码时间及运动估计时间等对本算法与UM-HexagonS算法进行性能比较,实验结果详见表2。

由表2可见,本文算法的PSNR在一些测试序列上有所下降,但下降幅度非常小,可以保持图像质量。其次,本文算法的码率比原来的算法有所增加,但幅度变化在0.05%以下且对部分序列有所降低,幅度变化在0.04%以下。本文的算法的在运动估计时间上比原算法有一定的下降,并且对于中运动和剧烈运动序列也有很好的效果,运动估计时间平均可节省30%左右,该结果优于文献[6-8]中算法所提供的优化效果。

5 结束语

本文对H.264中的运动估计UMHexagonS算法进行了研究和分析后,首先用自适应非对称十字模板代替固定非对称十字模板,然后在进行5×5模板搜索时根据运动矢量中心分布理论的分析后,引入双菱形模板来进行替代,最后根据运动矢量的偏置情况来决定采用多方向多层次模板。在以上3个方面提出改进,提出了采用自适应模板策略的新算法,从而有效降低了搜索点数。实验表明,在保持图像的质量和码率基本不变的前提下,本文给出的算法的可以有效降低运动估计的复杂度。

参考文献

[1]WIEGAND T,SULLIVAN G J,LUTHRA A.Overview of the H.264/AVC video coding standard[J].IEEE Trans.Circuits and System forVideo Technology,2003,13(7):560-576.

[2]CHEN Zhibo,ZHOU Peng,HE Yun.Fast integer and fractional pelmotion estimation for JVT[C]//Proc.of the 6th JVT-F017 Conference.Awaji,Japan:JVT,2002.

[3]XU Xiaozhong,HE Yun.Improvements on fast motion estimationstrategy for H.264/AVC[J].IEEE Trans.Circuits and System forVideo Technology,2008,18(3):285-292.

[4]SAPONARA S,CASULA M,ROVATI F,et al.Dynamic control ofmotion estimation search parameters for low complex H.264 videocoding[J].IEEE Trans.Consumer Electronics,2006,52(1):232-239.

[5]WU Xiaomin,XU Weizhang,ZHU Nanhao,et al.A fast motion estimation algorithm for H.264[C]//Proc.International Conference onSignal Acquisition and Processing,2010.[S.l.]:IEEE Press,2010:112-116.

[6]DUANMU C J,ZHANG Yu,CHEN Xing,et al.Multi-octagon-gridsearch algorithm for fast motion estimation.information and automation[C]//Proc.ICIA 2008.[S.l.]:IEEE Press,2008:284-289.

[7]吴晓军,白世军,卢文涛.基于H.264视频编码的运动估计算法优化[J].电子学报,2009,37(11):2541-2545.

[8]CAI Canhui,ZENG Huangqiang,MITRA S K.Fast motion estimation for H.264[J].Signal Processing:Image Communication,2009,24(8):630-636.

自适应估计 篇4

关键词:无线传感器网络,传输功率控制,干扰估计,自适应速率调整

0 引言

无线传感器网络 (Wireless Sensor Networks, WSN) 系统的主要特点是平均工作速率较低, 通信距离较短。由于无线传感器网络具有分布随机性, 且节点数量大, 更换节点电源 (通常是电池) 几乎是不可能的。实际上, 限制无线传感器网络应用的主要问题是其供电时间较短, 因此, 研究无线传感器网络的核心问题之一是降低功耗[1-5]。

传输功率控制 (Transmit Power Control, TPC) 作为节省功率消耗的最直接方法, 在无线自组网中是一个很活跃的研究对象。研究人员提出了很多在自组网中采用功率控制机制的MAC协议, 理论上的功率控制协议称为OPC协议[6-7]。OPC协议是一个使用最小传输功率进行通信的协议, 它很好地实现了空间复用, 但是, 不对称的发射功率会使网络内通信冲突的概率增加[3]。参考文献[8]描述了一种适用于Ad-hoc网络的功率控制协议PARO, 后被称为BASIC协议[9]。 参考文献[10]提出了COMPOW协议。COMPOW协议在网络中寻找一个能保证各节点联通性的最低发射功率作为全网的统一发射功率, 并且其指出对于大规模节点, 最大化网络容量的方法就是选择最小的同传输功率。

上述功率控制算法均是基于载波侦听多路访问 (Carrier Sense Multiple Access, CSMA) 介入方式, 却没有充分考虑实际信道的干扰问题, 也就是说只考虑了降低传输功率带来的能耗降低, 而没有考虑其他并行节点传输干扰带来的连通性问题。本文首先分析了实际节点通信的无线传输模型, 并基于泊松分布, 在保证整个网络连通性的条件下得到最优传输功率;考虑到通信信道及活跃节点数目的时变性, 提出了自适应速率调整算法;最后通过试验验证了所提方法的可行性。

1 问题分析

以BASIC算法为例来分析现有功率控制算法存在的问题。BASIC算法工作方式:通信节点A, B分别使用最大功率传送RTS帧、CTS帧, 以便簇内其他节点侦听到CTS帧, 从而推迟其数据的发送;使用最小功率传送DATA帧、ACK帧, 以便节省能量。在BASIC算法中, 传输DATA帧、ACK帧所需的最小功率主要是通过RTS/CTS的握手交互信息来计算的, 一般有2种方法:① 先以最大发射功率Pmax发送RTS帧, 然后目标节点B根据RTS帧的信号强度Pr、Pmax以及接收点的噪声功率值计算数据传输所需的最小发送功率Pmin, 即在接收端根据信噪比来确定最小发送功率;目标节点B以最大传输功率发送CTS帧, 并将Pmin值嵌入到CTS中;当源节点A接收到CTS帧后, 便以指定的传输功率发送数据帧。② 以最大发射功率Pmax发送RTS帧, 当目标节点B接收到RTS帧后, 仍以最大功率来传送CTS帧, 当源节点A接收到CTS帧后, 它根据接收到的功率和Pmax来计算Pmin。

BASIC功率控制示意图如图1所示。当节点A, B之间以传输功率Pmin传输DATA帧时, 由于节点C无法侦听到A, B间的通信, 当它发起传输时必会干扰到节点B的正常接收, 也就是基于BASIC功率控制下的通信机制, 虽然提高了空间复用性, 但是却加重了隐藏终端问题。参考文献[9]中周期性地以最大功率发射DATA帧, 但没有考虑侦听区以外的干扰节点对其产生的影响, 如图1的节点D。当节点活跃度较高时, BASIC算法无疑会带来更多的重传, 也就增大了能量的消耗。参考文献[11-12]提出用基于busy tone的双信道传输机制来解决上述问题, 即数据包和控制包分别采用2个单独的信道来发送, 这在一定程度上解决了功率控制带来的隐藏终端多的问题, 但其要求每个节点配备2套收发机, 显然这对于功耗受限的WSN节点是不现实的。

2 无线传输模型

在分析干扰问题之前, 应首先明确实际网络中节点间的无线传输模型, 如图2所示。CSMA机制主要是基于载波侦听来实现多址介入。设A为源节点, B为目标节点, 根据实际无线传播特性可以定义以下3个区:传输区、可侦听区以及干扰区[9]。

3 考虑干扰的链路自适应控制

3.1 最优传输功率计算

由于干扰是影响连通性的主要因素, 所以接下来分析干扰的分布以及平均干扰的范围。

由参考文献[12]可知, 当节点间的距离大于3rmax时 (rmax为最大传输半径) , 相互间的干扰可忽略。设CTS帧的传输半径为rint, 则可知干扰来自于以3rmax为半径的区域去掉以rint为半径的区域 (这里考虑最坏的情况下, 将暴露终端也考虑在内, 即侦听到RTS帧而侦听不到CTS帧的节点仍可发起传输) 。改进Friis传输方程为[13]

式中:Pr, Pt分别为接收功率和发射功率;λ为波长;d0为标准距离;d为传输距离;n为损耗因子;Gt为发射天线增益;Gr为接收天线增益。

由式 (1) 可知, 当Pt不变时, 干扰值大小主要由干扰点与接收点的距离决定。令D为描述干扰点与接收点距离的一个随机变量, 则D的分布函数可表示为

式中:r为收发间距。

D的概率密度为

式中:S=π[ (3rmax) 2-ri2nt]。

假定每个节点的包传输状态均服从参数为λa (packs/s) 的泊松分布, 即

式中:k为随机变量;t为间隔时间。

可得总的干扰加权平均值为

式中:Pint_total为总的干扰功率;Ltotal为包的总长度;Rb为数据传输速率;NI=γS, γ 为干扰节点密度;ρs为节点密度, 0.005≤ρs≤0.1。

由参考文献[15]可知, 在采用避免暴露终端的CSMA/CA协议的情况下, γ 的曲线拟合方程为γ=0.002 634+0.000 174 1log2ρs-0.000 13ξ, 其中ξ为阴影衰落因子, 这里取为0。

取n=4, 化简式 (5) 可得

考虑到误码率更能直接反映当前的链路状态, 则由参考文献[13]可知, 相关解调BFSK误码率为

式中:Q (·) 为Q函数, ;P0为源节点接收功率;PN为背景噪声, PN=FKBT0, 其中F为接收机前端噪声系数, K为Boltzmann常数 (K=1.38×10-23) , B为等效噪声带宽 (理想情况下等于Rb) , T0为室温 (T0=300K) 。

P0的表达式为

式中:dlink为源节点与目标节点间的距离, 这里取网络中单跳最大距离dmax=max{dlink}, 这样就可以在保证整个网络连通性的条件下, 得到最优的传输功率。

当满足Pe≤Pe_th时 (Pe_th为给定阈值) , 接收节点可以可靠地接收来自源节点的数据。

式中:Poptim为干扰下的最优传输功率。

3.2 速率调整算法

由于网络中节点活跃的随机性, 当干扰程度弱时, 在发射功率Poptim及标准传输速率Rb_norm下传输数据, 误码率Pe<

定义:步长为H, 符号位为υ, Pt=Poptim。

初始化:Rb=Rb_init=Rb_norm, Н0=Hinit, υ0=1, 其中Rb_init是初始传输速率, Rb_norm为标准速率, Н0为初始调整步长, Hinit为初始步长 (取1kbit/s) , υ0为初始符号。

速率的调整由实时误码率Pe与Pe_th的比较结果来决定, 如算法1所述。在该算法中, 为了更接近理想的Pe_th, 当Pek接近Pe_th时, 让步长Hk缩小一半, 最后使得传输速率达到较理想的值。从算法1可看出, 该算法并非收敛到某固定的速率, 而是在一定的速率区间抖动。这样做的目的是为了使系统不因速率调整而带来额外的传输包能耗开销, 因为速率调整均是在不增加传输总包数的情况下进行的, 仅仅在控制包 (CTS或ACK) 中携带1Byte的速率反馈信息, 这样的能耗开销是可以忽略的。

算法1:

初始化:Pt=Poptim, Rb=Rb_init=Rnorm, Н0=Hinit, υ0=1。

4 试验分析

为了验证选取的优化传输功率的性能, 进行了基于简单拓扑的试验研究。整个试验采用GAINS节点平台完成[3]。

4.1 试验场景

节点布置如图3所示。

4.2 试验步骤

Sink节点通过串口连接到PC机上, 并将接收到的来自源节点A的数据上传到上位机进行后台处理。

节点A每隔2s发送1个数据包, Sink节点接收到第1个来自节点A的数据包后, 上位机开始计时。为了便于计算丢包数, 节点A发送1个数据包后, 如果发送失败则丢弃该包。其余节点则以与节点A一致的功率通过载波侦听的方式发送数据包, 同样是每隔2s产生1个数据包, 其目标节点通过随机选择自己的邻居节点来完成, 主要是考察干扰变化对节点A传输性能的影响。设包长为100Byte, 采用查表方式调整速率 (默认为19.2kbit/s) 。测试数据包的格式为

由于要根据实时信噪比调整传输速率, 所以, 首先要获得信号强度及背景噪声。设未检查到前导码时的RSS (和的平方根) 值为背景噪声大小, 接收到发送节点信号时得到的信号强度为S, 则可得到瞬时SNR (信噪比) , 通过查表获得相应的速率设置, 并通过CTS帧反馈到源节点, 本次通信结束后都恢复到默认值。为了便于计算能耗, 当本次生成包发送失败后 (未有效接收到ACK帧) , 则放弃本次包的发送, 这样可以确定地得到在某时间段内的发包总数。同样, 对于包序列号的处理, 也是在成功传输1个包后才将下一个待发送包的序列号加1, 以便于统计丢包情况。

4.3 试验评价指标

节点的平均吞吐量定义:Sink节点接收到的来自节点i的总包数nPack_i与接收所有包所用的总时间Tdura的比值, 即

节点A的能耗:为便于计算, 只统计试验时间内 (2min) 的能耗。整个过程能量消耗基本上包括发送RTS、DATA的能耗, 接收CTS、ACK的能耗以及载波侦听的空闲能耗。节点A的总能耗为

式中:Ntotal为试验时间内发送的总包数;Ri为瞬时包速率;Lrts, Ldata, Lcts, Rnorm分别为包RTS, DATA, CTS, NORM的包长度;Pr与Pi分别为接收功耗和空闲功耗。

由于Pr与Pi相差很小, 为了计算方便, 将式 (12) 等效为

则有效单比特能耗EPUB为

4.4 试验结果

设每次试验时间为2min, 节点每隔2s产生1个包, 测量节点A在每个2min间隔内到达Sink节点的包序列号, 分别选取了发射功率Pt为-20, -15, -8, 0, 4, 6, 7, 8dB·m几种情况, 结果见表1。

从表1可以看出, 当发射功率为-20dB·m时, 丢包很严重, 主要原因是环境噪声比较复杂, 而且, 由于发射功率较小, 可能存在多个节点正在传输数据, 也使得干扰叠加。但是随着输出功率加大, 可以看出每个时间段内包到达序列号的波动比较大, 可能的原因是随着传输功率的提升, 冲突的概率也相应提高, 所以当冲突发生时, 丢包就会变得明显, 而当没有冲突时, 由于信号强度高, 丢包会显著减少。有效单比特能耗分析结果见表2。从表2可看出, 有效单比特能耗最低的传输功率, 如取4dB·m时, 与基于式 (10) 计算得到的优化同传输功率3.31dB·m非常接近 (产生差别的原因可能是路径损耗因子、非相关接收的误码性能以及速率调整的粗略等效等) 。分析结果表明, 基于干扰估计的功率传输方案是可行的。这里EPUB较大, 是因为将2s内的空闲能耗也计算在内。

5 结语

自适应估计 篇5

时差定位系统具有高度的隐蔽性和精确的测向定位特性, 在电子对抗侦察和定位中具有很高的应用价值, 一直受到学者们的广泛关注[1,2,3]。时差定位系统通过估计空间来波信号到达位置分开的不同传感器的时差来对辐射源目标进行定位。因此, 能否对来波信号到达不同传感器的时差进行精确估计, 直接决定了时差定位系统定位精度高低。对来波信号的到达时差进行估计通常称为时延估计。时延估计的方法总体上可以分为基于信号各阶统计量方法[4,5]和自适应类的方法[6,7]。

时差定位实际应用中, 需要先对侦收的连续信号进行离散采样, 再做时延估计。信号到达2个传感器的时差D通常不是采样间隔T的整数倍。无论是用基于信号各阶统计量类时延估计方法, 还是自适应类时延估计方法, 即使在没有噪声的情况下, 时延估计误差也可能达到0.5T。为减小此误差, 可以通过提高采样频率即减小采样间隔T的方法, 也可以用插值方法。有学者应用插值方法[8]提高时延估计精度, 常用的插值方法有sinc函数插值、抛物线或其他多项式插值等。但插值方法的计算量较大, 导致时延估计速度较慢, 系统实时性差。

基于时延估计可以转化为对滤波器的权系数最大值的位置估计来实现, 文献[9]提出了通过参数途径进行时延估计方法。参数途径时延估计方法可以直接估计非整数倍采样间隔的时差, 且不需要插值运算, 运算量较小。应用LMS算法来实现参数途径时延估计方法, 新方法简称为P-LMSTDE, 下面详细论述。

1 时延估计转换为sinc滤波器的权系数

由于2部传感器的空间距离较远, 因此同一来波信号到达2部传感器有时差。假设时差为D, 2个传感器输出的信号可以表示为:

x (t) =s (t) +n1 (t) , (1)

y (t) =s (t-D) +n2 (t) , (2)

式中, n1 (t) 和n2 (t) 为相互独立的零均值高斯白噪声, 且与信号s (t) 相互独立。

为方便讨论, 先不考虑噪声影响, 定义信号u (t) 和v (t) 为:

u (t) =s (t) , (3)

v (t) =s (t-D) 。 (4)

根据文献[9]:

u (t) =k=-u (kΤ) w (t-kΤ) , (5)

式 (5) 中,

w (t) =sinc (tΤ) ; (6)

式中, T为采样间隔。不失一般性, 假设时差D= (m+f) T, m是整数, f是小数, 0≤f≤1。则时延信号v (t) 可以重构为:

v (t) =u[t- (m+f) Τ]=k=-u (kΤ) sinc[t- (m+f+k) ΤΤ]。 (7)

对时间t离散化, 则任意整数n:

v (nΤ) =k=-u (kΤ) sinc[n- (m+f+k) ], (8)

做变量代换, 让q=n-k, 式 (8) 变为:

v (nΤ) =q=-u[ (n-q) Τ]sinc (q-m-f) 。 (9)

定义:

wq=sinc (q-m-f) , (10)

un=u (nT) , (11)

vn=v (nT) 。 (12)

则式 (9) 可以改为:

vn=q=-wqun-q。 (13)

由式 (13) 可看到, 时间序列un通过一个权系数为{wq, q=-, , }的滤波器与其时延序列vn相联系, 且与时延D有关。由于{wq}是辛格函数sinc (q-m-f) 的采样, 当q-m-f=0时, 其取得最大值, 如图1所示。因此, 时延估计问题转换为寻找{wq}的最大值。

对式 (1) 和式 (2) 的时延估计模型进行离散采样得:

xn=un+n1n, (14)

yn=vn+n2n。 (15)

由式 (13) 和式 (15) 可得, xnyn的关系可以表示为:

yn=q=-wq (xn-q-n1n-q) +n2n。 (16)

实际应用中, 无法估计一个无穷大长度的滤波器权系数。当|n-m|足够大时, sinc{q-m-f}趋近于0。故式 (13) 变为:

vn=q=-ΡΡwqun-q, (17)

相应的式 (16) 变为:

yn=q=-ppwqxn-q+en。 (18)

式 (18) 中误差en由噪声成分和模型误差组成, 表达式为:

en=q=--Ρ-1wqxn-q+q=Ρ+1wqxn-q-q=-wqn1n-q+n2n。 (19)

有很多方法求解方程式 (17) , 最简单的方法是应用LMS算法来估计wq, 即:

W^n+1=W^n+μenXn。 (20)

式中, μ为LMS算法的迭代步长, 需满足条件0<μ<tr[RXX]

2时延估计

根据图1可得, 当f<0.5时, 式 (10) 中wqq=m处达到最大值;当f>0.5时, wqq=m+1处达到最大值。记wj代表权系数wq的最大值, wj+1代表最大值的后一个值, wj-1代表最大值的前一个值。则当f<0.5时, 可得:

wj=sinπfπf, (21)

wj+1=sinπfπ (1-f) , (22)

wj-1=-sinπfπ (1+f) 。 (23)

式 (21) 除以式 (22) , 得:

f=wj+1wj+wj+1。 (24)

f>0.5时, 可得:

wj=sinπfπ (1-f) , (25)

wj-1=sinπfπf, (26)

wj+1=-sinπfπ (2-f) 。 (27)

式 (25) 除以式 (26) , 得:

f=wjwj+wj-1。 (28)

假设经过LMS算法n步迭代后, 滤波器权系数进入稳定状态。此时最大值权系数标号为wj, 其后一个权系数为wj+1, 前一个权系数为wj-1。则根据式 (24) , 时延估计为:

D^= (m+f) Τ= (j+wj+1wj+wj+1) Τ, (29)

或根据式 (28) , 时延估计为:

D^= (m+f) Τ= (j+wjwj+wj-1) Τ。 (30)

f<0.5时, 由式 (23) 可以看出wj-1<0;当f>0.5时, 由式 (26) 可以看出wj-1>0。所以在实际应用中, 当wj-1<0时, 用式 (29) 估计时延;当wj-1>0时, 用式 (30) 估计时延。

3仿真验证

仿真参数如下:仿真信号调制样式为2PSK, 调制码元信号为Matlab7.0随机产生的0、1序列, 码元速率fk=5 kbit/s。根据通信原理2PSK调制有关理论, 已调信号第一零点带宽Bs=10 kHz。已调信号载频fc=20 kHz, 也就是一个码元宽度内4个载波周期。采样频率fs=10fc, 时差D=3.4T (T为采样间隔, T=1/fs) ;高斯带限白噪声中心频率fi=20 kHz, 带宽。在不同信噪比下对3种自适应时延估计方法各做50次仿真试验, 图2和图3为估计均值和方差结果比较。可以看到在小信噪比时, 本节提出的P-LMSTDE方法时延估计方差小于其他2种自适应时延估计方法;3种方法的估计均值基本相同。

4结束语

时差定位应用中, 需要对侦收的来波信号进行离散采样后估计时差。来波信号到达2个传感器的时差D通常不是采样间隔T的整数倍。参数途径时延估计方法可以直接估计非整数倍采样间隔的时差, 且不需要插值运算。把参数途径时延估计方法推广到应用LMS算法来实现, 通过理论推导给出了时延估计的方法和步骤。计算机仿真验证了新方法的有效性和正确性。

摘要:时差定位应用中, 需要首先对2个分开的传感器侦收的来波信号进行离散采样, 然后估计时差。时差通常不是采样间隔的整数倍, 导致常用时差估计方法的估计误差值可能达到0.5倍采样间隔。研究人员常用插值运算减小估计误差, 但运算量较大。参数途径时延估计方法可以直接估计非整数倍采样间隔的时差, 且不需要插值运算, 运算量较小。应用 (LMS) 算法来实现参数途径时延估计方法, 通过理论推导给出了时延估计的方法和步骤。计算机仿真验证表明了新方法的有效性和正确性。

关键词:时延估计,自适应,参数途径

参考文献

[1]BECKER K.An efficient method of passive emitter location[J].IEEE Trans on AES, 1992, 28 (4) :1091-1104.

[2]SO HC, CHING P C.Performance analysis of ETDGE-an efficient and unbiased TDOAestimator[J].IEE Proc Rardar, Sonar and Navig, 1998, 45 (6) :325-330.

[3]杨林.TDOA被动定位方法及精度分析[J].国防科技大学学报, 1998, 20 (2) :49-53.

[4]NIKIAS C L.Time delay estimation in unknown gaussian spatially correlated noise[J].IEEE Trans on ASSP, 1988, 36 (11) :1706-1714.

[5]WUYONG.LEYMINAR.Time delay estimationin unknown spatially uncorrelated gaussian noise using high-order statistics[C]∥International Conference Proceedings on ASSP, 1999:2813-2816.

[6]YOUN D H.On using the LMS algorithm for time delay estimation[J].IEEE Trans on ASSP, 1982, 30 (5) :789-801.

[7]WANGJIN-LIN.Application of adaptive filter in time delay estimation generalized interpolation method[J].Journal of Acoustics, 1992, 17 (3) :208-216.

[8]HUANG JIA-REN.An interpolation algorithm of the correlation peak for time delay estimation[J].Applied Acoustics, 1996, 15 (6) :33-36.

自适应估计 篇6

H.264视频编解码算法具有更高的压缩比, 在同等的图像质量下, 大约为H.263, MPEG-4编解码算法压缩比的两倍[1]。但是H.264高效的压缩性能是以计算复杂度的大大增加为代价的。H.264的运动估计和模式选择是编码器中最为复杂的编码模块之一, 其中运动估计是H.264视频编码中的核心技术, 运动估计算法的好坏直接影响到编码的效率和图像恢复的质量。在众多的运动估计算法中, 块匹配 (BMA) 搜索算法以其计算简单, 易于硬件实现等优点得到了广泛的研究与应用[2]。在块匹配搜索算法中以全搜索算法 (FS) 的搜索精度最高, 能够找到全局最优点, 可以达到最佳匹配, 但其计算量太大, 尤其是在视频电话、会议电视、无线通信等实时视频通信应用中不宜实际应用。因此, 后来出现了大量的快速运动估计算法, 大部分主要是通过减少搜索点来实现的, 如传统的二维对数法, 三步法 (TSS) , 新三步法 (NTSS) , 四步法 (4SS) , 菱形搜索算法 (DS) 等[1], 其中菱形搜索算法 (DS) 已经被MPEG-4压缩标准采用, 这些算法搜索模式简单, 易于实现, 但容易陷入局部无穷小;近来一些新的方法具有更好的搜索性能, 如六边形搜索算法 (HEXBS) , 运动矢量场自适应搜索算法 (Motion Vector Field Adaptive Search Technique, MVFAST) , PMVFAST (Predictive MVFAST) , 风筝十字菱形搜索 (KCDS) 等[3], 但是它们的搜索模板比较复杂, 对于H.264树状分块特点, 如果每一个16×16的宏块要遍历每一种模式来进行运动估计, 那么要进行41次, 每帧QCIF图像有99个宏块, 则这类算法具有相当大的复杂度, 所以它们不完全适合H.264。鉴于以上问题, 本文提出一种基于简单菱形六边形的新型搜算算法 (SDS-HEXBS) , 该算法模式简单, 易于实现, 并能大幅度地减少搜算点数, 提高块匹配搜索速率。

1 SDS-HEXBS搜索算法选择

如图1所示, SDS算法是参考菱形搜索算法DS提出的, DS采用2种搜索模板, 分别为大菱形搜索模板LDSP和小菱形搜索模板SDSP。LDSP需计算9个搜索点的SAD值, 而SDSP只需计算5个搜索点的SAD值。其搜索策略是:先以预测的起始搜索点为中心点, 计算LDSP中9个点的SAD值, 如果MBD点不为中心点, 则重复LDSP直至MBD点为中心点, 之后转入SDSP, 计算5个点的SAD值, SAD值最小点对应的运动矢量为全局最优运动矢量[4]。但是在匹配搜算过程中, 如果一帧数据被分割成大小不同的模块, DS算法中SDSP转化到LDSP需要时间就比较长, 特别是在转化相对频繁的时候, 其次DS算法也很容易陷入局部最佳点。

为此本文中采用的第一种搜索模型SDS就是对DS算法的改进。如图1所示, 该模型算法只在小模块匹配中使用, 并固定其每次的搜索步长为1的范围, 减少了DS算法中模式转化带来不必要的时间的浪费。实验表明, 以48×48像素的搜索范围, SDS算法只要搜索l7个点就能找到最佳点。对于原始的钻石形搜索算法 (DS) , 需要搜索的点数为21。所以在小的匹配模块下进行搜索时, 与DS算法相比, 使用SDS可以提高搜算效率, 减少搜算点数[5]。

六边形搜索算法如图2所示, 是对菱形搜索法的改进, 它将DS算法中的LDSP改为六边形, 而且六边形的搜索模式要比菱形的搜索模式少搜索两个点, 不管其搜索中心向哪个方向移动, 其只会增加3个新的搜索点, 其余3个是重叠的点, 故其搜索速度比菱形的要高。

2 SDS-HEXBS算法流程

为了提高搜索速度和搜索精度, 在新型简单菱形六边形搜索算法中, 综合了起始搜索点选择的判定、利用了零块判别提前终止技术。

2.1 起始搜索点的选择

起始搜索点的选择直接影响着块匹配的搜索效率。统计数据表明, 在诸多图像序列中, 如视频会议、视频电话等, 80%以上块的最优运动矢量分布在一个区域中, 区域中心为搜索窗口中心, 如图3所示[2]。基于此分布特性, 本文涉及的算法中选择区域中心点为搜索中心点, 然后利用SDS算法中的粗定位和细定位并行进行的思想, 这样既可以以最快的速度找到中心附近的运动矢量, 同时又可以快速定位那些远距离的运动矢量, 避免了陷入局部最优状态。

2.2 块匹配提前终止判定

为了提高搜算效率, 对于运动矢量很小的模块采用提前终止的判定, 减少运算量。根据视频运动矢量分布统计规律, 在块进行运动矢量搜索时先对零矢量 (0, 0) 进行判断, 判断方法就是设定域值。设定域值为:T=block_width×block_height, 可以看出和当前块的尺寸是成比例的, 块尺寸大, 则T就大;否则, T就小[6]。

2.3 当前块运动矢量的计算

获得当前块运动矢量的示意图如图4所示。首先, 设E为当前宏块, 其运动矢量为MVP。如果E的左侧多于一个块, 令E左侧最上方块 (图中为A块) 的运动矢量为MVA, 同理, 可以得到E正上方最左侧块 (图中为B块) 的运动矢量为MVB、E右上方最左侧块 (图中为C块) 的运动矢量为MVC, 采用运动矢量中值预测法可得:MVP= (|MVA|+|MVB|+|MVC|+1) /3。而当前块位于当前帧边缘时有三种情况:

(1) 当前块位于当前帧最右边, MVP= (|MVA|+|MVB|+1) /2;

(2) 当前块位于当前帧最左边, MVP= (|MVC|+|MVB|+1) /2;

(3) 当前块位于当前帧最上边, MVP=MVA。如果右上角宏块不可用, 可用左上角宏块的MV代替[9]。

2.4 自适应新搜索算法描述

根据当前宏块的运动类型不同, 对宏块进行不同的分块模式。如果是大运动类型的宏块, 只使用8×8, 8×4, 4×8, 4×4四种小模式;如果是小运动类型的宏块, 则只使用16×16, 16×8和8×16三种大模式[6]。不管是哪种模式的分块, 都先对其 (0, 0) 矢量进行域值判断, 若符合条件, 则直接得到运动矢量 (0, 0) , 终止搜索;否则, 根据不同的分块模式分别采用六边形法搜索和SDS搜索算法。

2.5 自适应新算法的计算流程

自适应新算法的计算流程如下:

(1) 确定起始搜索点后, 比较当前块的预测运动矢量MVP与阈值T的大小。

(2) 如果MVP<T, 则快匹配搜算提前终止。如果MVP≥T, 则转移到第 (3) 步, 否则, 跳转到第 (4) 步。

(3) 采用六边形法搜索:首先使用HSP模板搜索, 计算7个点的SAD值, 如果MBD点不为中心点, 则重复HSP直至MBD点为中心点, 之后转入SDSP模板搜索, 计算5个点的SAD值, SAD值最小点对应的运动矢量即为全局最优运动矢量。

(4) 采用SDS算法搜索:使用SDS模板搜索, 计算5个点的SAD值, 如果MBD点不为中心点, 则重复SDS算法直至MBD点为中心点, 该点对应的运动矢量即为全局最优运动矢量。

3 仿真结果比较

实验中采用了全搜索法 (FS) 、菱形搜索法 (DS) 、十字菱形搜索法 (CDS) 、运动矢量场自适应搜索算法 (MVFAST) 和本文提出的方法相比较。速度比较参数使用的是每次搜索的平均点数, 如表1所示。质量比较参数是重建亮度块的PSNR值, 如表2所示。实验软件平台: Windows XP操作系统, JM 8.6标准编码器。实验硬件平台:InterR○ CornTM2 Duo CPU T7250 @ 2.00 GHz, 内存2 GB。编码参数设置:使用1个参考帧, 视频帧格式IPP, 一共编码50帧, QP值为28, 帧率为30帧/s, 搜索范围为[-16, +16]。实验中分别使用了10个CIF视频序列作为测试对象, 并与全搜索法 (FS) 、十字菱形搜索法 (CDS) 、菱形搜索法 (DS) 和运动矢量场自适应搜索算法 (MVFAST) 做了比较。实验数据见表1, 表2。

通过表1的实验数据可以得到, 本文中使用的新型搜索算法SDS-HEXBS, 其平均搜索点数为5.89, 而FS算法的平均搜索点数是2 460, DS算法的平均搜索点数是15.67, MVFAST算法的平均搜索点数为6.78。相比可知, SDS-HEXBS算法的搜算点数仅是FS算法的0.24%, 是DS算法的37.6%, 比MVFAST算法搜索点数还要减少13.3%。该算法达到了研究要求, 减少了搜索点数, 提高了搜索效率。

结合表2实验结果可以看出, 本文所述算法与其他几种常规算法相比, 其质量比较参数几乎不变, 或者变化很小, 基本不影响图像质量。

综上可得该算法在保证了信噪比几乎不变的前提下, 平均搜索点数有较大的降幅, 完成了预期目标。

4 结 论

本文提出了一种高效快速块匹配搜索算法SDS-HEXBS, 实验结果表明, 该算法与传统的经典搜索算法相比, 极大地提高了搜索速度, 比DS、CDS、MVFAST分别要快250.5%, 165.9%和28.7%, 同时保持了和这几种算法相当的搜索精度。

参考文献

[1]毕厚杰.新一代视频压缩编码标准:H.264/AVC[M].北京:人民邮电出版社, 2005.

[2]刘海峰, 郭宝龙, 冯宗哲.用于块匹配运动估值的正方形-菱形搜索算法[J].计算机学报, 2002, 25 (7) :747-752.

[3]唐良瑞.图像处理实用技术[M].北京:化学工业出版社, 2002.

[4]余兆明.图像编码标准H.264技术[M].北京:人民邮电出版社, 2006.

[5]吴永海, 周开伦, 林涛.基于H.264的帧间预测算法及其SOC实现[J].数字电视, 2010 (1) :54-56.

[6]陈航, 陈占计, 陈芳.基于H.264的新型快速搜索算法研究[J].电子技术应用, 2007, 33 (3) :60-62.

[7]赵嵩, 刘兆瑜.一种面向H.264/AVC的快速块匹配搜索算法[J].计算机应用与软件, 2010, 27 (6) :210-212, 235.

自适应估计 篇7

关键词:自适应观测器,在线补偿,反馈,鲁棒性,无速度传感器

1 引言

交流感应电机矢量控制系统中,传感器的安装使电机的体积增大、成本增加,而且带来了机械安装精度和机械强度等问题,降低了系统的可靠性,同时失去了交流感应电机结构简单、坚固耐用的优点。而无速度传感器矢量控制技术利用电机参数来解算转子位置信息,在线估算电机转速,具有可靠性高、成本低、抗干扰能力强等优点,因此成为感应电机控制的一个重要方向。目前,国内外已有多种无速度传感器速度估算方案,主要包括:开环速度估计法、模型参考自适应法、自适应观测器法以及神经网络等智能估算法[1]。

本文应用转子磁链自适应观测器理论[2],以电机定子电流和转子磁链为状态变量对电机模型进行状态重构,观测出定子电流和转子磁链,并以定子电流误差和转子磁链观测值作为输入,构造一定的自适应率估计电机转速;同时考虑到电机运行过程中定子电阻和转子电阻随温升而变化,运用类似于转速估计的自适应率辨识定子电阻和转子电阻,并反馈补偿于观测器,以提高转速估计对参数变化的鲁棒性。

2 感应电机转子磁链自适应观测器

在两相静止坐标系下,以定子电流和转子磁链为状态变量,可得到感应电机的模型方程为[3]

ddt[isΨr]=[A11A12A21A22][isΨr]+[B10]us(1)

is=[C 0][isΨr]T (2)

其中 is=[isαisβ]TΨr=[ΨrαΨrβ]T

us=[usαusβ]T

式中:is,Ψr,us分别为定子电流、转子磁链和定子电压矢量。

A11=-[Rs/(σLs)+(1-σ)/(σTr)]I

A12=Lm/(σLsLr)[(1/Tr)I-ωrJ]

A21=(Lm/Tr)I

A22=-(1/Tr)I+ωrJB1=1/(σLs)I

C=[Ι0]Ι=[1001]J=[0-110]

式中:Rs为定子电阻;Ls,Lr分别为定子及转子自感;Lm为互感;σ为漏感系数,σ=1-L2m/LsLr;Tr为转子时间常数;ωr为电机角速度。

由上述状态方程可构造全维自适应观测器,其方程为

di^sdt=A11i^s+A12Ψ^r+B1us+G1(i^s-is)(3)

dΨ^rdt=A21i^s+A22Ψ^r+G2(i^s-is)(4)

其中G1=[g1-g2g2g1]G2=[g3-g4g4g3]

式中:G1,G2均为反馈增益矩阵。

在反馈增益的选取上,本文采用极点配置方法,即将观测器极点设置为与电机本身极点成比例,这样当电机稳定的条件下,观测器也是稳定的[4]。由此,可得G1,G2中各系数分别为

g1=(k-1)LrRs+LsRrLrLs-Lm2g2=(k-1)ωrg3=(k2-1)LrLmRs+(k-1)RsLr+RrLsLmg4=(k-1)LmωrσLsLr

反馈增益矩阵中g2,g4包含有转速信息,在实际应用中需根据不同运行工况在线调整反馈增益矩阵。通常将k取为1,这样反馈增益矩阵就为0。由于缺少定子电流误差反馈项,观测器低速性能往往不甚理想,甚至出现不稳定现象。但在一般工况下基本能满足稳定性要求,因此本文为简便起见将G取为0。

由观测器表达式可绘出其大致结构框图如图1所示。

3 转速估计自适应率

利用上述观测器,可以观测到定子电流和转子磁链,由此便可以定子电流误差和转子磁链观测值作为输入,构造一定的自适应率来辨识转速。这里,我们采用Lyapunov理论来推导自适应方案。从式(1)、式(2)可以将定子电流误差和转子磁链误差表述为[4]

dedt=(A+GC)e-ΔAx^(5)

其中

e=x-x^ΔA=A^-A=[0-ΔωrJ/c0ΔωrJ]c=(σLsLr)/LmΔωr=ω^r-ωr

现在,定义Lyapunov函数为

V=eΤe+(ω^r-ωr)2/λ(6)

式中:λ为一个正常数。

现对V求导,可得到:

dVdt=eΤ[(A+GC)Τ+(A+GC)]e-2Δωr(eidsΨ^rβ-eiqsΨ^rα)/c+2Δωrdω^rdt/λ(7)

其中eids=ids-i^dseiqs=iqs-i^qs

令式(7)右边后2项为0,便可得到转速的自适应率:

dω^rdt=λ(eidsΨ^rβ-eiqsΨ^rα)/c(8)

可以证明,当选择合适的G使矩阵(A+GC)满足负半定,则按式(8)自适应率构成的磁链观测器是稳定的[5]。实际上,电机转速变化很快,因此为了提高转速估计的动态响应,转速自适应率采用PI调节器,由此可得:

ω^r=Κp(eidsΨ^rβ-eiqsΨ^rα)+

Ki(eidsΨ^rβ-eiqsΨ^rα)dt(9)

4 定转子电阻补偿

感应电机运行过程中,电机温度变化将引起定子电阻和转子电阻等参数值发生变化,而转子磁通自适应观测器转速估计模块包含有定转子电阻信息,定转子电阻的不准确势必影响转速估计的精度。因此,应用上述观测器估计转速的同时需对定转子电阻进行辨识补偿,以提高转速估计的鲁棒性。

定子电阻同样可以定子电流误差作为输入,采用PI自适应率来观测,可得:

dR^s/dt=-λ1(eidsi^ds+eiqsi^qs)(10)

选择合适的积分系数λ1,当观测到的定子电流等于实际电流时,定子电阻收敛于实际值。

由于在稳态时速度推算误差和转子电阻推算误差处于耦合状态,故不能进行独立控制。在静止坐标系的励磁电流上叠加低频交流分量,则可解除稳态下转速跟转子电阻推算的耦合状态,在转速估算的同时在线辨识转子电阻[2,6]。其自适应率亦可由Lyapunov理论推导自适应方案,类似于转速估计的推导,最终可得:

ddt(1Τ^r)=ΨrLr[eids(Ψ^rα-Lmi^ds)+

eiqs(Ψ^rβ-Lmi^qs)](11)

i*sd=I*sd+i*sd1 (12)

式中,i*sd1为低频交流扰动,其幅值一般取额定电流的50%,频率为1~3Hz。

其原理性框图见图2。

经过公式化简,转子电阻Rr可用下式进行观测:

dR^r/dt=λ2Lreidsisd1*(13)

式中:λ2为任意正常数。

由此,可构建基于在线辨识定转子电阻的异步电机无速度传感器矢量控制系统,其系统框图如图3所示。

5 仿真分析

为验证上述速度估计系统算法的正确性,在Matlab/Simulink下建立了转差频率无传感器矢量控制仿真系统,仿真用到的电机为理想的三相感应电机模型,其参数为:Pn=3.2kW,Un=380V,p=2,ωn=303rad/s,Lm=0.078H,Ls=Lr=0.0819H,Rs=0.7Ω,Rr=0.926Ω。在t=0.1s,给定转速ω*=200rad/s,加载10N·m,仿真总时长为10s。

图4a、图4b分别为定子电阻、转子电阻的辨识值。可以看出,定子电阻和转子电阻均在2s时间内基本收敛到真实值附近,且辨识精度较高。

图4c为估计转速与电机实际转速的曲线对比,由图4c可知,动态过程的转速估计误差稍大,但稳态时两曲线基本重合,稳态误差在0.1rad/s之内,这得益于电机定子电阻、转子电阻的在线同时辨识。定转子电阻的在线同时辨识极大地提高了系统的鲁棒性,为无速度传感器控制系统的稳定运行提供了可靠的保证。仿真结果表明,本文提出的基于在线同时辨识定子电阻和转子电阻的速度估计系统性能良好,并能应用于无速度传感器系统,精确地跟踪给定转速。

6 实验验证

为验证本文提出的速度估计系统能稳定运行,做了感应电机的速度估计实验(见图5),电机参数为上述仿真时的参数。在电机启动到稳定运行过程中,记录电机运行时的电压电流波形(实验

采集到三相电压电流波形,然后经坐标变换得到两相静止坐标系下的电压电流波形),同时测得电机运行时的实际转速,然后将记录的电压电流作为本文速度估计系统的输入,得出转速估计值。其中,图5a、图5b为空载启动时测得的电机两相电流电压波形;图5c为空载启动时的估计转速与实际转速对比曲线;图5d为带负载启动时的估计转速与电机实际转速对比曲线。

由图5可以看出,无论空载运行还是带负载运行,转速估计都能较好地跟踪实际电机转速的变化曲线。由此可验证本文提出的速度估计系统可应用于实际电机运行的速度估计,且性能良好。

7 结论

本文提出了一种基于观测器的能在线同时辨识定转子电阻的转速估计系统,在估计电机转速的同时辨识定子电阻和转子电阻,并将辨识得到的定子电阻和转子电阻值对转速估计模块进行在线补偿。仿真及实验结果表明,所提出的观测器对感应电机的转速估计有着较高的稳态精度,对系统参数变化有较强的鲁棒性。

参考文献

[1]李永东,李明才.感应电机高性能无速度传感器控制系统——回顾、现状与展望[J].电气传动,2004,34(1):4-10.

[2]冯垛生,曾岳南.无速度传感器矢量控制原理与实践[M].第2版.北京:机械工业出版社,2006.

[3]Xiao Xi,Li Yongdong,Zhang Meng,et al.A SensorlessControl Based on MRAS Method in Interior Permanent-magnet Machine Drive[C]∥Proceedings of InternationalConference on Power Electronics and Drive Systems,Perth,Australia,1995:734-738.

[4]Hisao Kubota,Kouki Matsuse.DSP-based Speed AdaptiveFlux Observer of Induction Motor[J].IEEE Transactionson Industry Application,1993,29(2):380-384.

[5]袁超,郑宝周,李富强,等.基于自适应磁链观测器的无传感器检测技术研究[J].河南农业大学学报,2007,41(2):221-224.

上一篇:电器控制机械下一篇:农业基本问题