运动估计与补偿

2024-09-06

运动估计与补偿(通用4篇)

运动估计与补偿 篇1

0引言

传统的视频采集系统由于受到奈奎斯特 (Nyquist) 采样定理的限制,信号的采样率必须大于信号带宽的2倍,才能实现信号的准确重构。采集端首先要通过传感器阵列采样大量的原始视频数据,然后对数据进行稀疏变换,对变换后的前K个较大系数进行存储和传输。这种方式采样和压缩数据分开处理,采集到的数据量大,给数据的存储和传输带来较大负担,编码过程中计算量大,变换后的大部分系数被丢失,造成大量数据浪费。

近年来出现的信号采样新理论——压缩感知 ( compressive sensing, CS) 利用信号的稀疏性,可以在远小于Nyquist采样率的条件下 , 对信号进行随机采样,然后通过非线性算法重构信号,实现了采样与压缩的结合,因而极大地缓解了采集端的压力。由于视频图像通常在某些变换域上具有可压缩性,而且视频残差图像具有较强的稀疏性,所以CS理论在视频编码中有着良好的应用。

1压缩感知理论

设x为长度为N的一维信 号x[n],n=1,2,…,N,x在变换域Ψ上可表示为是N×N的变换矩 阵,s=[s1,s2,…sN]是N个权值系数。若向量x在变换域Ψ上K阶稀疏,即s的N个系数中有K个非零项,且K<

由(1)(2)式得到y=ΦΨs(3)。文献 [2]中证明了在矩阵Φ与Ψ 满足不相关的情况下,能通过M个观测值无损地重构出原始信号。重构原始信号的问题演变成求解以下最优化问题常见的求解算法有OMP, GPSR算法等。

2传统视频压缩技术

视频是一系列静止图像的集合,每帧图像内相邻像素之间具有相关性,帧与帧图像之间也具有较强的相关性。传统的视频采样处理过程如图1所示。采样与压缩分离,首先需要采样大量数据,然后进行压缩,传统的视频压缩主要包含对帧内图像数据压缩和帧间图像数据的压缩,其对于帧间压缩目前最普遍的方法就是运动估计与运动补偿技术,基于参考帧进行运动估计和补偿得到当前帧的预测值,将当前帧减去预测帧得到残差,再对残差进行量化、编码,然后存储和传输。

3基于压缩感知的视频处理模型

把CS技术应用到视频处理中,能够以少量的观测值重构原始视频信息。CS将信号的采样与压缩编码合二为一,视频的编码过程转化为对信号的压缩感知,而对视频的解码过程转化为对信号的重构。在编码端,将视频系列分组,每一组包含一帧关键帧 (I帧 ) 和多帧参考帧 (P帧 )。为简化操作,选取每组的第一帧作为关键帧,对关键帧采用帧内编码,通过结构化随机投影SRM方法直接进行整体测量,获得相应的观测值 ;对参考帧采用帧间编码,为了降低冗余度,先用前面解码重构出来的帧作为参考帧,并与当前帧求残差,由于残差的稀疏性更强,再对残差进行CS采样量化,这样只需要很少的测量观测值 ;然后对观测到的数据进行量化编码。解码过程是一个求解欠定线性方程组解的过程,也就是视频图像的重构算法的设计。在解码端对接收到的正确的编码进行反量化,然后利用GPSR算法进行反复迭代运算,对于I帧,得到相应的原始图像,送存储器进行存储, 而对于P帧,得到的仅仅是残差,将前面重构出的帧和残差相加得到原始图像,再送存储器存储。基于压缩感知的视频压缩和重构模型如图2所示 :

4实验仿真结果及分析

实验选取 了标准的Akiyo、Hall、Foreman和Football视频序列,采取结构随机矩阵作为测量矩阵、采用小波基对其进行稀疏化处理、利用GPSR算法对视频进行优化重构。首先考虑在关键帧和非关键帧采样率一致的情况下,不同视频系列的恢复重构情况,图4给出了几组视频获得的平均信噪比情况 :

由图3可以看出,本文所提出的系统模型能以较低采样率就能很好重构视频图像,达到较高的平均信噪比。在保持同一采样率的情况下,相比较变化较大的视频系列,变化不大的视频能够获得相对高的信噪比。

实验采用Foreman视频帧系列,依次选取8帧作为一组,其中第一帧为关键帧,其余帧为参考帧,分别测试I帧采样数量Ni和P帧采样数量Np对平均信噪比的影响,结果如图4所示。由图4可以看出,采样率越高,视频重构恢复的效果越好,关键帧的采样率比参考帧的采样率对视频质量的影响要明显。

5总结

将压缩感知理论应用到视频的编解码过程中,能够以较少的样本值重构原始图像,极大地缓解了视频存储和传输过程中数据量巨大的问题。本系统中视频的分组和关键帧的选取是固定的,只是采用了对后续视频帧的运动估计和补偿,如果考虑分组的合理性,如果能够根据视频特征自动确定分组大小和关键帧的选取,分别利用前一组的关键帧对后续帧进行运动估计和补偿,同时利用下一组的关键帧对向前对前面的帧进行运动估计和补偿,将能进一步改善视频重构效果。

摘要:针对传统视频编解码过程中计算量大,数据冗余的问题,利用新的压缩感知理论和运动补偿估计技术,提出了新的视频压缩处理过程。将视频帧分组,对关键帧采用压缩感知,对非关键帧利用运动补偿估计技术求残差,并对残差进行压缩感知,利用GPSR算法重构原始数据。实验仿真结果表明提出的模型能够利用较少的随机采样数据重构原始信息,达到较高的平均信噪比。

关键词:运动补偿,运动估计,压缩感知,视频

运动估计与补偿 篇2

OFDM(Orthogonal Frequency Division Multiplexing),也就是正交频分复用,它的提出已有40年的历史。它利用高速串行基带码流经过串/并转换变成N路并行的低速信号,然后分别用N个子载波进行调制。近几年来,由于数字信号处理(DSP)技术的飞速发展,OFDM作为一种频谱利用率高,抗多径干扰能力强的高数传输技术在无线信道和有线信道中得到了广泛的应用。特别是在EOC(Ethernet over cable)技术上应用的非常广泛。许多EOC技术,如MOCA[1],HINOC[2],HomePlug[3],降频WIFI等都是采用的OFDM技术。由于成本等因素,在OFDM系统中,射频一般采用基带连接。一个有线信道下的OFDM系统框图如图1所示。

由图1可知,在基带连接时,发端发送的I,Q两路时域波形经过正交上变频,cable信道,正交下变频之后经过两条线路到达接收端。通常在这两条信号流过的线路上,会出现IQ 不平衡现象[4,5]。目前,业界的研究主要集中在正交上下变频器的非理想特性导致的IQ幅度不平衡以及相位的不平衡问题上。而对IQ 时延不平衡(IQ delay imbalance)的研究却比较少。实际上,IQ delay imbalance的问题在OFDM系统基带连接系统中是经常存在的,并且对系统性能的影响也很大。因此,对系统的IQ delay imbalance量进行估计与补偿是很有意义的。

IQ delay imbalance是指I,Q两路时域信号经过两条线路时,所受到的延时量不同。在接收端ADC采样之前,I,Q两路时域波形分别要经过LPF I和LPF Q,由于这两个滤波器的特性不会完全一致,会使I,Q两路时域信号有一个相对群延时[4],这是导致接收端IQ delay mismatch的主要原因。

本文对IQ delay imbalance对系统的影响进行了分析,给出了一种在正交上下变频都存在IQ幅度和相位不平衡[5]的情况对RX端I,Q delay imbalance进行估计与补偿的一种方法,从而消除IQ delay imbalance对系统性能的影响。

2 IQ delay 不平衡对接收性能影响

理想情况下(系统没有IQ幅度和相位不平衡,cable长度很短,cable信道近似于AWGN信道),系统的IQ delay imbalance模型如图2所示。

图2中,τ0表示系统IQ delay imbalance的量的大小,其单位是数据采样间隔,也就是数据采样速率的倒数。假设系统的基带信号是i(n)+j×q(n),子载波的序号是undefined,表示直流。频域信号是X(k),则有X(k)=FFT(i(n)+j×q(n))。若系统存在图2所示的IQ时延不平衡,则在接收端接收到的信号为:r(n)=i(n)+j×q(n-τ0),对接收到的信号进行FFT变换,由FFT的时域频域变换性质可知:

undefined

由(1)可知,当τ0为0时,R(k)=X(k),接收到的频域信号与发端的频域信号一致,而当τ0≠0,R(k)就不是发端原始频域信号X(k),而是叠加了对应频点的镜像干扰undefined,由于在QAM调制中,X×(-k)在星座点的映射上具有随机性,因此,对应频点的镜像干扰也是一种随机干扰,并且影响的程度正比于undefined,当|τ0|=0.5时,n(k)与k的关系如图3所示(假设N=256)。

因此,当τ0较小(|τ0|<0.5)时,镜像干扰的幅度随子载波频率的增长而加大。而当τ0较大(|τ0|>0.5)时,镜像干扰的幅度将呈现周期性的变化,如图4所示。

undefined是于自身频谱固定的角度变化,可以通过均衡模块予以纠正。因此,存在系统delay不平衡时,子载波的SNR水平将与镜像干扰的幅度成反比。一个典型的有线OFDM系统模型(N=256,其中210个有效子载波)在IQ delay imbalance 量为时,系统接收信号的信噪比(SNR)曲线如图5所示。

从图5中可以看出,系统IQ delay imbalance会给接收端带来ICI(inter carrier interference),这种ICI干扰的结果是给系统带来了有色噪声,在IQ delay imbalance量比较小的时候,这种有色噪声随着系统子载波的频率的加大而增加。给系统接收性能带来严重的影响。

3 接收端IQ delay imbalance参数估计与补偿

对于有线信道的OFDM应用来说,由于正交上下变频器的非理想特性,一般会存在IQ幅度不平衡和相位不平衡。图6是在正交上下变频器有幅度和相位不平衡以及接收端IQ delay imbalance存在的情况下,I,Q信号路径的框图如图6所示。

如图6所示,αt、βt是发送端的幅度增益参数,θt、ϕt是发送端的相位旋转参数。βt/αt反映了发送端的I/Q幅度不平衡特性,ϕt-θt反映了发送端的I/Q相位不平衡特性。αr、βr是接收端的幅度增益参数,θr、ϕr是接收端的相位旋转参数。βr/αr反映了接收端的I/Q幅度不平衡特性,ϕr-θr反映了接收端的I/Q相位不平衡特性。τ0是接收端I器引入的群延时,τ1是Q路滤波器的群延时。τ0-τ1是由于I,Q两路上LPF的群延时不同导致的IQ delay imbalance。由于是有线信道,同时,在实际测试的时候,发端和接收端的cable连接可以比较短,这时正交上下变频器之间的cable信道可以看做是近似AWGN的理想信道。按照图6中的方框图可以得出接收端信号与发端信号的表达式如下所示:

yi(t)=αt×αr×cos(θt-θr)×xi(t-τ0)-βt×αr×sin(ϕt-θr)×xq(t-τ0)

yq(t)=αt×βr×sin(θt-θr)×xi(t-τ1)+βt×βr×cos(ϕt-θr)×xq(t-τ1)

设发端发送的频域信号为X(k)=FFT(xi(t)+j×xq(t)),-N/2

xi(t)=IFFT(X(k)),xq(t)=0

在发端构造满足上述条件的频域数据序列X(k),则接收端的信号为:

yi(t)=αt×αr×cos(θt-θr)×xi(t-τ0)

yq(t)=αt×βr×sin(θt-ϕr)×xq(t-τ1) (3)

考虑到实际情况下正交上下变频器的IQ幅度和相位不平衡量都是一个很小的值,也就是说在⑶式中,αt×αr≈αt×βr,θt-θr≈θt-ϕr≈δc,δc是上下正交变频的载波初始相位差,在实际情况下,上下变频其之间的频率不可能完全相等,会有微小的差别(但是这个微小的频差不会影响这里公式的推导),这个微小的频差会导致在不同的时刻发送帧,在接收端看到的上下变频其的载波相位差不同.因此,δc是随时间变化的,可以将其看成与发端帧索引号(帧的发送时刻不一样,用帧标明帧的发送顺序)相关的一个随机变量。

对接端接收到的I,Q两路信号分别作FFT变换即有:

观察(4)中表达式的可知:

由(3)式可知,接收到的I,Q两路时域信号的功率是随载波初始相位差δc而变化的,为了不让I,Q两路的功率相差太大而影响估计的精度,在接收端,先要计算I,Q两路波形功率情况,在功率比为一定范围内的时候,再开启估计运算。同时为了进一步提高估计精度,可以采用估计反馈补偿的方式进行参数的估计,原理框图如图7所示:

图7中,ri(t)与rq(t)是正交下变频的输出,τ是接收端IQ两路低通滤波器的群延时差。时延补偿模块是采用的lagrange插值[5]滤波器实现的,lagrange插值滤波器可以完成数字序列的非整数采样点的延时。同时,在建立模型的时候, IQ delay imbalance也可以用lagrange插值滤波器来实现。接收端估计经过时延补偿模块后的IQ delay imbalance量,并将估计结果乘以一个小于1的系数β反馈给时延补偿模块,时延补偿模块在原来补偿值的基础上加上这个修正值。这样,经过多次估计反馈之后,接收端时延估计模块估计出线路IQ delay imbalance近似于0,此时延补偿模块中的最终值即是线路IQ delay imbalance的参数。这样,即完成了线路IQ delay imbalance的估计,也完成了IQ delay imbalance的补偿。反馈系数β则控制估计的收敛速度和精度。实际系统中时延补偿模块应放在均衡模块之后(图中并未画出),对Q路的时域信号进行补偿。在后面的仿真中,补偿模块使用的是3阶lagrange插值滤波器。

4 仿真及结果分析

按图7搭建matlab仿真模型,其中,时延模块和时延补偿模块均是采用拉格朗日插值滤波器来完成的。线路添加的IQ delay imbalance从-1.2到1.2,以0.1递进,添加37dB的AWGN噪声。正交上变频器的IQ幅度不平衡量为1.05,相位不平衡量为5°,正交下变频器的幅度不平衡量为0.95,相位不平衡量为-5°,则本方法估计IQ delay imbalance的绝对误差如图8所示:

从仿真的结果可以看出,估计的绝对误差在0.007以下。在一个有线信道的OFDM传输系统模型中添加IQ delay imbalance 的估计与补偿,图9(a)是在CN=35dB,IQ delay imbalace为0.2时64QAM的星座图,图9(b)是IQ delay imbalnce经过纠正之后的星座图。

从图9(a),图9(b)中可以看到,IQ delay imbalance造成星座图的发散,通过不同后星座图得到了明显的改善。为了确定具体改善的程度,仿真系统在128QAM时,有无IQ delay imbalance参数估计与补偿的情况下系统的性能如图10所示。

图10中,no_delay表示系统没有IQ delay imbalance时的性能,d_0.05_comp表示仿真时设置的IQ delay imbalance的大小是0.05个采样间隔并反馈补偿后系统的性能。d_0.05表示仿真时设置的IQ delay imbalance的大小是0.05个采样间隔不补偿时系统的性能。从图9中我们可以明显的看出,IQ delay imbalance被补偿后系统的性能与系统没有IQ delay imbalance的性能几乎完全一样。若以的误码率来衡量,当系统有0.05倍采样间隔的IQ delay imbalance时,估计补偿后性能提升约0.2dB,0.1倍采样间隔的不平衡时性能提升约1dB,0.15倍采样间隔的不平衡时性能提升约4dB,而在0.2倍采样间隔的不平衡时性能提大于6dB。可以发现,在IQ delay imbalance越大的时候,补偿的方法对系统性能的提升越明显。

5 结束语

本文分析了在有线信道OFDM 系统IQ delay imbalnce对系统性能的影响,并针对有线信道OFDM系统提出了一种在正交上下变频都存在IQ 幅度和相位不平衡的情况下估计接收端IQ delay imbalance参数和补偿的方法。仿真结果表明,对于收端的IQ delay imbalance参数估计比较准确,同时补偿方法对系统的性能有较大的提升。

摘要:在有线信道OFDM传输系统中,IQ不平衡一直是影响系统接收性能的一个重要因素。自从OFDM进入实用化以来,人们对IQ不平衡研究的比较多。但是大多都关注于IQ的幅度和相位的不平衡的研究。对于IQ时延不平衡(IQ delay imbal-ance)的研究则相对较少。IQ delay imbalance也会对系统的接收性能造成较大的影响。本文分析了IQ delay imbalanc对OFDM系统接收的影响,提出了一种在接收端存在IQ幅度和相位不平衡情况下估计和补偿接收端delay不平衡的方法。仿真结果表明,该算法可以改善系统的性能。

关键词:有线信道,OFDM,IQ不平衡,IQdelay不平衡

参考文献

[1]张强.采用MoCA技术进行广电双向网改造[J].CATV Technology,2010,19(2):26-29

[2]高性能同轴电缆接入网(HINOC)物理层传输模式及媒质接入控制协议(面向NGB电缆接入技术的建议方案),Nov,2010

[3]C E Adams.Home Area Network Technologies[J].BT Technology Journal,2002,20(2):53-72

[4]Tim Schenk.RF Imperfections in High-rate Wireless Systems Impact and Digital Compensation[M].Springer Netherlands:2008.0-315

[5]Deepaknath Tandur,Marc Moonen.Efficient Compensation of Frequency Selective TX and RX IQ Imbalances in OFDM Systems[J].Electrial Engineering,2009:343-351

运动估计与补偿 篇3

地壳形变与各种精密工程变形监测,不论垂直位移监测,还是水平位移监测,常做定点、定期重复观测,要处理的数据是一组时间序列,处理目的是确定位移量与时间推移的动态变化规律,发现变形发生的原因、变形特征,以便做出科学预测、预报[1,2]。

时间序列方法分析定点复测数据的成果有很多,其讨论的问题主要集中在根据定点实测数据选用AR(p)自回归模型、MA(q)可逆滑动平均模型或者ARMA(p,q)自回归—可逆滑动平均混合模型;模型的识别方法;确定模型的阶数以及模型参数的估计等。事实上,由于变形机理的复杂性,定点观测数据随时间变化过程中会包含各种因素综合的系统误差和随机误差的干扰,使所建立的AR模型、MA模型或者ARMA模型只是实际问题的近似表达,不可避免地附加了模型误差,误差的存在势必影响所建模型及预测结果的准确性[2]。

近年来,研究人员从信号处理的角度出发,将定点观测数据分解成趋势项、周期项和随机项三部分,根据不同部分的特点,分别采用不同的模型进行模拟和逼近,取得了一系列的成果[3,4]。然而,趋势项与周期项相互影响,如果趋势有误差,对于提取周期项和随机项会造成较大的影响。因此,为了更全面地反映变形特性,有效滤除模型误差,本文以AR(p)模型为例,考虑模型误差对变形预测的影响,提出半参数补偿最小二乘精化AR模型,将模型误差用非参数项加以弥补,并将其运用于形变时间数据序列分析中。

1 顾及模型误差S的AR(p)建模

目前广泛采用的AR(p)模型为:

式(1)中:xt为观测数据序列,φi为自回归系数,at为白噪声序列。式(1)的平差模型可以写成:

L为n维观测向量;B为列满秩设计矩阵;x为t维参数向量(对应式(1)中φi);t为必要观测数;Δ为n维观测误差向量。此模型中,通常假定Δ是期望为0的偶然误差,也就是说除去观测误差,观测值L完全表示为未知参数x的函数。

考虑模型误差,设AR(p)的模型误差为S,当模型误差S与偶然误差Δ相比是一个微小量时,忽略模型误差S不会对参数估值产生太大的影响,即可采用式(1)对形变时间序列进行模拟;而当S比较大时,就会对参数的估计产生较大的影响(这一点可以从本文后面的计算结果中得到验证)。此时,式(1)、式(2)并不能严格成立,式(1)应改写为:

式(2)改写为:

式(3)即为考虑模型误差条件下的AR(p)模型,S=[s1,s2,Λsn]是一个描述模型误差的n维未知向量。考虑一般的情形,可认为模型误差或观测值的系统误差的性态非常复杂,无法用少数参数表示,因此给每个观测方程增加一个待定量,也就是所谓的非参数分量。这样在观测方程中既有参数分量又有非参数分量,因此式(4)称为半参数模型[2,3,5]。

2 补偿最小二乘估计下AR(p)的解

据式(4)写出误差方程:

式(5)的求解是在最小二乘的目标函数基础上增加一个非参数部分的补偿项,即求解如下条件极值问题:

式(6)即为补偿最小二乘平差准则。α是一个给定的纯量因子,在极小化过程中对V和S起平衡作用,称为平滑因子(平滑参数)。R是一个适当给定的正定矩阵,又称为正规化矩阵,是被用来估计参数S的某种函数关系类型,二次型STRS反映对向量S的某种度量。根据文献[5,6,7,8,9,10],得到补偿最小二乘模型的解:

其中N=BTPB,M=P+αR-PBN-1BTP。

这样就可通过式(7)、式(8)及式(5)计算AR(p)模型参数分量的估值、非参数分量的估值S及观测值改正数V。通过分析得到的非参数分量,就可以重新认识所选的数学模型,从而实现对模型的精化。补偿最小二乘法的关键是选择适当的正规化矩阵R和平滑参数α,R和α是事先给定的量[5,6,7,8]。本文计算中,根据变形数据时间序列的特点,取相邻两观测点模型误差之差的平方和来确定R,即R=TTT,α的确定采用作者提出的一种Xu函数法。

3 Xu函数确定平滑参数α

补偿最小二乘估计中,选择合适的R后,需确定平滑参数α,已有的研究文献可以通过信噪比值法、L-曲线法以及交叉核实法和广义交叉核实法等[6,7,8,9,10]来实现。作者在比较经典最小二乘与补偿最小二乘估计基础上,提出一种新的α确定方法,Xu函数(关于Xu函数的有效性及与其它确定α的方法比较见文献[10])。

偶然误差与模型误差相比是一个非常小的量,经典最小二乘平差中,不考虑模型误差的存在,事实上模型误差与偶然误差都看成误差来处理,补偿最小二乘估计则将模型误差看成一个独立变量来处理,如果我们选择了合适的正规化矩阵R和平滑参数α,那么补偿最小二乘求出来的模型误差与经典平差理论求出来的误差之间的差值应该是个很小的值,据此得出Xu函数:

式(10)中:e为经典平差求得的误差,R为正规化矩阵,S为求得的模型误差,V为补偿最小二乘求得的误差,P为观测量的权阵。

4 补偿最小二乘估计下AR(p)建模步骤

(1)根据定点变形观测数据,按式(1)建立AR模型,依据动态建模思想和F统计检验确定模型阶数p;

(2)按式(3)建立顾及模型误差条件下的AR模型,由补偿最小二乘估计理论确定AR(p)模型的参数分量φi,以及非参数分量(模型误差)的估值S;

(3)根据(2)中求出的参数值,可建立预测方程进行形变监测预报;预报方程为式(3)。

5 算例分析

为了说明补偿最小二乘估计AR(p)模型在变形数据处理中的应用及其处理模型误差的可行性,同时比较本文方法与现有方法的优劣性,利用某建筑物的36次沉降观测序列[11]进行建模计算,采用如下方案:

方案1:利用1~30期观测数据建立补偿最小二乘AR(p)模型;方案2:利用1~30期观测数据建立AR(p)模型;方案3:利用1~30期观测数据建立GM(1,1)模型;方案4:利用灰色–神经网络(GM+BP)[4]模型。

当考虑模型误差影响时,用补偿最小二乘估计解算AR(p)模型,采用Xu函数确定平滑参数α,α=0.001,其中参数分量φi为φ=(-0.924967,-0.589398,0.040616),模型误差估值见图1。当不考虑模型误差时,根据最小二乘解算的AR(p)模型参数φ'i,φ'=(0.041086,0.327809,0.635059),AR(p)模型、GM(1,1)模型及(GM+BP)模型计算结果见图2、图3。

比较补偿最小二乘估计下的AR(p)模型与经典最小二乘下参数AR(p)模型(图1、图2),发现半参数AR(p)模型得到的观测值平差值与其真值的拟合精度明显优于常规AR模型,其特点是能够在补偿最小二乘准则下分离出平差模型中的模型误差,削弱了对预测结果的影响,从而获取比较可(上接第53页)靠的参数估值。

从图2可以看出GM(1,1)模型计算拟合曲线,其只反应了变形观测数据序列的均值变化,相当于实测曲线的平均光滑曲线,究其原因,该模型建立在指数回归模型基础上,建议使用该模型时应结合形变观测数据的实际情况。

采用文献[4]时间序列的分解方法进行变形预测(图3),考虑变形数据的特点,在拟合预测精度方面比单一模型有所提高,但其精度明显低于半参数AR(p)模型。

6 结论

(1)由算例分析可知,对于形变时间序列数据建模,应考虑模型误差对预测结果的影响,函数模型存在模型误差时,经典最小二乘平差很难发现和识别,若忽略模型误差,将给参数估值带来不利影响;采用补偿最小二乘估计解算,同时兼顾了参数和非参数两类因素,精度有大幅度提高,可以达到毫米级,说明补偿最小二乘方法应用于形变时间序列分析是有效的,同时说明本文提出的Xu模型确定平滑参数α是一种合理的方法。

运动估计与补偿 篇4

VCL编/解码器关键技术主要有:整数变换、量化处理、Intra预测和编码、Inter预测和编码、熵编码等。对码率的节省:用7种不同的尺寸和形状的帧间预测以节省15%、用亚像素空间精度节省20%、用5个参考帧进行预测节省5%~10%、用基于内容的二进制自适应算术编码节省10%[1]。

离散余弦变换(DCT)采用分块技术,较好地去除图像信息的统计冗余,具有一定实时性和块操作与运动估计的匹配性。但在高压缩比条件下易导致方块效应,严重影响主观质量;不适合带宽较宽的图像信号。提升格式的整数SPIHT采用滤波器组对分块的图像进行提升运算,实时性好、运算简单、易于硬件实现、可省去量化过程。用提升格式的整数SPIHT取代DCT是一个较大的改进。

对运动估计有全搜索FS、基于块的梯度下降法(BBGDS)、交叉法(CS)、十字搜索CDS等多方法,它们都通过不同的搜索模板和搜索策略,在计算复杂度上比FS减小许多,而搜索的准确性不如FS。搜索时间最短、图像质量甚佳的是CDS。

1 主要算法

1.1 基于提升格式的整数小波变换

A.R.Callderbank、I.Dauberchieshe和W.Sweldens等人证明一个整数集经小波变换后仍然是整数集[2]。可见,无须量化就可实现无损压缩。

⑴整数小波变换[3]

对一数据集sj(原始信号)经小波变换分解为低分辨率的sj-1与高分辨率的dj-1,采用最简单的可逆整数小波贯序变换(Sequential)s变换。

正变换:

再用低通滤波器的系数,产生一个新的高通滤波器系数,一般形式为[3]:

一般取:α-1=0,α0=2/8,α1=3/8,β1=-2/8。其逆变换为:

其l为子数据集中元素的序号,骔」为取整函数。

提升方法也能将其它小波算法转换成可逆整数小波变换[3]。

(2)提升格式的整数小波变换的步骤[4]

提升格式(lifting scheme)是整数小波变换的基础,有分裂(split)、预测(predict)和更新(update)3个步骤。

分裂:将信号分成两个互不相交的子集Sj,2i和Sj,2i+1,通常是将一个数列分为偶数序列和奇数序列,即

预测:通常两个集合紧密相关,可从一个集合很好地建立另一个集合的预测P。先将与数据结构无关的预测算子P滤波器作用于偶信号上,得奇信号的预测值P(Sj,2i),再将该预测值与原奇信号Sj,2i+1相减得到奇信号的预测误差dj-1。预测表达式为:

更新:若dj-1和奇采样值已知,则有恢复信号:

令λ0.2k=x2k∈Sj,2i,λ0.2k+1=x2k+1∈Sj,2i+1,k∈Z,取λ-1,k=λ0,2k,k∈Z,用相邻两偶采样对奇采样进行预测,差值为:

若信号是相关的,则大多数小波系数γ-1,k将很小。用γ-1,k对γ-1,k提升,使,则更新算子U:

用U对Sj,2i作预测,生成更好的子数据集,并保持Sj的一些特性。Sj-1定义为:

于是,基于提升框架的整数小波变换的基本公式:

式中int[·]为四舍五入取整运算。

(3)基于整数的SPIHT的编码算法

核心思想是[4]:用“从1开始的正整数平方”作量化阈值,最大限度地增加了编码过程中零树的数量,也极大地提高了编码效率。

集合划分:

a、初始化不包括节点(i,j)本身的所有后代节点坐标集合D(i,j):对所有的(i,j)∈所有的空间方向树根结点坐标的集合H,将所有小波分解最高阶高频系数节点(i,j)置入D(i,j)及点集{(i,j)};

b、若D(i,j)是重要的,则分解为L(i,j)=D(i,j)-O(i,j)和节点(i,j)的直接后代节点坐标集合

O(i,j)={(2i,2j),(2i,2j+1),(2i+1,2j),(2i+1,2j+1)}中的四个节点;

c、若L(i,j)重要,则分为四个子集D(k,l)∈O(i,j)。

方法:

建立数组r(k),令r(k)=k2,k=(0,1,2,3…),其值为各级量化阈值,取所有子带中绝对值最大的像素幅值fmax,用折半法选r(k-1)

编码器:

将像素集划分成一些集合Tm,对于逐次循环减1的n,寻找大于r(k-1)的系数,进行幅值检测。

若Tm中所有系数都不重要,输出一个“子集不重要信息”,相应地,解码器接收该信息就知道Tm中所有系数都小于r(k-1);若Tm中有重要系数,Tm分解成更小的子集Tm,1,并对新子集实施上述重要性检测。重复划分这样的集合,直到所有子集都进行过系数重要性扫描,所有子集Tm,1里面的所有元素都不重要,量化阈值为1止。

把“输出”改为“输入”,可实现解码器的解码。

1.2 线性正方形搜索算法(Line 2S qua re Search,LSS)[5]

LSS算法特点:减少了搜索冗余,提高了搜索速度;采用正方形模板,保证了搜索算法的精度;在确定搜索方向的同时进行精确搜索;算法复杂度低,便于软硬件实现。

LSS算法的搜索步骤如下:

(1)以搜索区原点作为SP的中心点。

(2)在SP内模板上的9个点处分别计算出对应的运动矢量和、绝对差和(Sum of Absolute Difference,SAD)SAD,找MBD点。若MBD点位于中心,转(4);否则,计算MBD点所在方向上的虚拟搜索点的SAD;若其SAD值大于MBD的SAD值,则以MBD点为SP的中心点,转(2);若其SAD值小于MBD的SAD值,则以此虚拟搜索点为线搜索点,转(3)。

(3)在中心点和线搜索点所确定的方向上计算下一个检测点的SAD,若其SAD值小于线搜索点的SAD,则以线搜索点为中心点,以此检测点为线搜索点,转(3);否则,以线搜索点为SP的中心点,转(2)。

(4)将该MBD点作为最佳匹配点,得到运动矢量。

1.3 预测

在1.1中阐述了预测的含义,以下对5个参考帧进行预测,如图1所示:

2 VCL编码分析

实现并行或流水线处理,重要的是数据相关性,即一个操作需要另一个操作的结果。许多文献证明:运动估计在MPEG-4编码中计算量占据整个编码时间的50%以上[6],运动估值占整个运算时间的90%以上[7,8],运动估计大概要占总共编码时间的70%(一个参考帧)到90%(五个参考帧)[8]。由此可知,运动估计是十分重要的。VCL编码解码工作原理[1]如图2所示:

在图2中,存储切图是一个重要的环节,它是运动补偿、运动估计以及预切图的参考依据。注意到:运动补偿和运动估计可并行处理;变换、量化、逆量化、逆变换以及运动补偿和运动估计串行处理;熵编码的前提是量化和运动估计。

存储切图源于运动补偿和逆变换,而变换与逆变换存在差值,但初始的储存切图设定变换后的值,可认为变换与逆变换的差值为0,以后的输入值由逆变换和运动补偿得到,减少了量化、逆量化和逆变换的等待时间。实际上,整个系统是运动估计和熵编码的串行处理,运算量主要在运行估计和运行补偿,尤其运动估计,熵编码的运算时间相对很短。

所以在帧内部,经存储切图初值设定为变换的值,再将变换、量化、逆量化、逆变换、存储切图、运动补偿形成流水线或并行处理,进一步提高帧内的运算速度;硬件方面,利用快速的处理器,及多处理器并行操作。

3 TI DS P及系统结构

3.1 TMS 320DM642的特点[9,10,11,12]

DM642包括三个能够进行无延滞视频输入、视频输出或传输流输入的可配置视频端口。它们支持BT.656视频I/O,HDTV Y/C I/O,RGB I/O,MPEG-2传输流输入;一个10/100MBPS的以太网MAC(EMAC),一个多通道的串行口(Mc ASP),一个66MHz的32位PCI总线以及一些其它外设。C64X核内有8个并行的处理单元,分相同的两组,具有64个32bit的通用寄存器的专用存取结构,内置高效率的协处理器,采用VLIW(甚长指令集)结构,单指令字长为32bit,8个指令组成一个指令包,总字长为256bit。芯片内部设置了专门的指令分配模块,可将256bit的指令包同时分配同时运行的8个处理单元。

3.2 TMS 320C6455的特点[13]

C6455具有更高效能、更精简的程序、更多的芯片内建内存和频宽超大的整合式外围;提供2至12倍效能和I/O频宽可大幅提升应用系统效能,并在系统内整合更多的高频宽通道,实现更完美的影像画质;内建的Serial RapidIO提供高达25 Gbps连结能力,应用系统可透过它执行高效能的多处理作业;Gigabit以太网络媒体存取控制器(MAC);DDR2(Double Data Rate)外部内存界面;66 MHz PCI总线接口;2Mbytes第二层内存。大部分指令在单周期内完成,都可直接对8/16/32bit数据进行操作。对数字信号处理算法提供了特殊指令:为复杂计算提供的40bit的特殊操作的加法运算;有效的溢出处理和归一化处理;简洁的位操作功能等。最多可以有8条指令同时并行执行;所有指令均可条件执行,减少了转移和保持流水。提高了指令的执行效率,减少了代码长度和因跳转而引起的开销,提高了编码效率。

3.3 并行处理的系统结构

系统结构采用1394b[15]作为数据采集接口,与CCD传感器相连;利用DM642的三个视频端口,进行RGB三色处理,得到的数据存于多端口存储器;C6455(1)用于整数小波变换、逆小波变换、运动补偿等;C6455(2)用于运动估计及编码,由于运动估计是整个系统运行的70%到90%,所以将运动估计设计成6个运动估计,并行操作,每个对应一段存储区,还便于帧预测处理;利用I2C芯片K9W8G08UOM用于存储起动及初始化程序,采用四端口200MHz存储器IDT70V5388[16]与多处理器共享。系统结构如图3所示:

在软件上采用优化策略[8,9,10,11],同时为便于并行处理,依据数据相关性,采用拓扑排序的方式,对各处理的初始数据做必要的虚拟,待真正的输入数据得到后,所得信息才是有效的,这样方便并行代码设计。充分利用DM642和C6455的流水线结构,对算法的并行性进行相应的流水线处理,使系统处理大量数据,满足实时的视频效果。

4 系统分析

本系统采用TMS320C6455和TMS320DM642,充分利用内部资源。采用整数SPIHT的取代原来的整数转换,同时取消了独立的量化部分;采用先进的LSS算法,取代原来的运动估计;将变换、量化、逆量化、逆变换、切图和运动补偿,以先赋初值的方式,进行并行处理,实际的运行时间,可取为运算量较大的运动补偿;用6个运动估计程序同时对数据进行估计,而编码时间较短,所以信息量相同的情况下,整个运行时间约为改进前的1/6。CCD的分辨率的提高,处理的信息量十分庞大,需要的存储空间也较大,充分利用TMS320的寻址空间,同时合理利用片内的擦cache,并采用局部性原理,将数据放入片内数据cache中,避免系统抖动,同时加快数据传输速度。

5 结束语

本文在JVT的VCL的基础上提出整数的SPIHT编码,引用LLS算法,在对初始值虚构的,只牺牲最初2帧效果的前提下提高系统效率是可行的,同时大量采用并行处理,进一步提高处理速度,使系统性能大大改观。对于系统的存储容量,必要时可考虑磁盘存储技术。

摘要:加速运动估计在视频处理中占据重要位置。文章简要分析了JVT的VCL原理,用实时性好、运算简单、易于硬件实现的整数SPIHT编码取代整数DCT,合理设置存储切图初始值,解除JVT中VCL闭环结构,实现帧内与6级运动估计的并行处理,使加速运动估计速度进一步得到提高,系统效率也明显提高。

上一篇:静脉注射胺碘酮下一篇:检验科医院感染管理