空间自适应(精选9篇)
空间自适应 篇1
1 引言
预测控制是20世纪70年代产生于工业过程控制领域的一类算法, 具有深刻的工程背景和理论意义, 并且在系统控制中得到了广泛的应用[1,2,3]。传统的工业预测控制都是采用输入输出模型, 包括参数模型和非参数模型。但是为了进一步提高控制性能和控制精度, 学术界和工业界普遍认为应该采用状态空间模型, 这样近些年所发展起来的现代滤波理论和控制器设计方法就可以发挥作用。子空间辨识方法利用过程输入输出数据可以直接得到状态空间形式的模型[4], 辨识过程的中间结果直接用于预测模型输出。
传统的基于子空间辨识的预测控制采用批量处理方式, 将获取的历史输入、输出数据作为整体进行处理, 不利于子空间辨识的在线实施及非线性、时变过程的自适应控制应用[5]。针对该问题, 文献[6]在消减指数窗方法的基础上提出了一种通过比较模型匹配误差来切换和更新模型的策略。本文在滚动窗口方法的基础上提出一种在线更新R阵, 通过检查模型的精确性来更新模型的策略。保持建模数据集大小不变, 当新数据到达时添加新数据, 同时剔除窗口中最早的数据, 即时更新R阵, 经过计算求得新的预测模型参数矩阵, 得到预测模型输出, 通过比较更新前后预测输出与过程输出的预测误差来决定是否更新预测模型。
2 基于子空间辨识的预测控制方法
考虑如下的线性时不变系统:
其中输入瓗输出瓗状态瓗nx。噪声序列为零均值高斯白噪声, 其方差矩阵为。A、B、C、D、K为相应维数的矩阵。
根据输入uk的数据建立m行n列Hankel矩阵Up和Uf:
其中, p和f分别代表“过去”和“未来”;类似地, 可以根据输出yk的数据建立Hankel矩阵Yp和Yf、根据测量噪声ek的数据建立Hankel矩阵Ep和Ef。
由式 (1) -式 (2) 迭代可以得到预测输出:
式中:Γ———广义可观测矩阵;下三角矩阵;未来的状态序列。
根据式 (5) 得到线性最优预测输出:
为了采用子空间辨识法表达为[7]:
式中:Wp———过去的输入输出数据矩阵, 即Wp=[YpT UpT]T;Lw, Lu———子空间矩阵, 是要从Hankel数据矩阵中辨识得到的, 其中最简单的方法就是最小二乘方法:
问题式 (6) -式 (7) 的解是从列空间Yf到Wp和Uf的列空间的正交投影:
通过如下的QR分解:
式中:R———下三角阵;Q———正交矩阵, 可实施正交投影 (8) 。令:
其中上角标“”表示Moore-Penrose广义逆。则得到:
按照MATLAB的书写习惯, A (:, c:d) 表示A的第c列到第d列上的元素组成的矩阵。
预测控制的目标函数为:
式中:时刻的期望输出;;预测时域;控制时域;Q, R———正定或半正定的加权矩阵。
为了消除稳态误差, 把积分作用引入预测控制器中, 可以得到预测增量输出:
式中:Δwp, k=[ΔypT, kΔupT, k]T, Δyp, k=[Δyk-m+1, …, Δyk]T, Δup, k=[Δuk-m, …, Δuk-1]T, Δuf, k=[Δuk k, …, Δuk+Nu-1 k]T, Δyf, k=[Δyk+1 k, …, Δyk+N2 k]T, 这样, 易知模型预测输出为:
从Lw和Lu中得出:
其中1≤k≤N2, Inu为nu阶单位阵。
当非奇异时, 通过将式 (14) 代入式
(12) 并最小化Jk可得:
其中。在每一个采样时刻, 只需将的第一个值:
作为控制输入, 下一个时刻再重新计算控制输入。因此, k时刻的控制输入为:
3 基于滚动窗口的自适应预测控制方法
传统的基于子空间辨识的预测控制方法采用固定的线性模型来设计控制器。但在实际工业过程中, 通常存在非线性和时变特性, 这样采用线性模型的预测控制很难达到理想的控制效果。正如文献[8]指出的那样, 过程模型存在时变特性是对其进行在线更新的一个重要原因。在文献[9]的基础上提出:基于滚动窗口数据在线更新R阵、通过判断是否能够改进一步预测误差来决定是否更新模型。滚动窗口子空间辨识如图1所示。
其中。假设一组新的输入输出数据向量为:
滚动窗口QR分解是指将新数据Gn+1加入矩阵G, 并剔除G1得到G′=[G2 G3…Gn+1]后, 求取新数据阵G′的QR分解, 得到更新后的R′阵, 用于预测模型参数矩阵L′w和L′u的求取。滚动窗口QR分解的关键在于利用已有G的QR分解结果通过合适变换得到G′的QR分解。已知:
引入中间阵G+=[G1G2…GnGn+1], 令A=[R Gn+1], B=[G1R′], ai为矩阵A的第i行, 即ai=[ri1ri2…rii…0 0…0gi (n+1) ], bi为矩阵B的第i行, 即bi=[gi1r′i1r′i2…r′ii0 0…0]。根据QR分解定义, 中间阵G+满足:
根据Q及Q′的正交性, 得到。展开此等式后, 可获得R′阵中的未知变量:
根据
可得到:
上述滚动窗口方法在每一时刻添加了新数据, 但也剔除了旧数据, 故使整个窗口丢失了“信息”, 可能带来更大的预测误差[10]。另外, 在线扰动的存在也会影响辨识的精度。为此, 为了确定是否利用R′阵更新模型, 引入模型精度检查策略, 即以预测误差为度量, 来考虑是否更新模型。
采用未更新模型计算如下数值:
式中:时刻的过程输出;在k-1时刻对k时刻的预测输出。采用更新后的模型计算如下数值:
式中:在k-1时刻对k时刻的预测输出。
当时, 预测模型不变, 采用式 (17) -式 (19) 计算控制作用。当时, 模型更新, 采用如下式子:
和式 (18) -式 (19) 计算控制作用。
4 仿真研究
2-CSTR系统是一个非线性、时变、多变量的系统。不可逆放热反应A※B在反应器中进行, 2-CSTR系统结构如图2所示。
保持每个CSTR的质量、成分、能量平衡, 可得到如下六个非线性微分方程[11]:
式中:;;;u1, u2———过程输入变量, 分别表示反应器2的产品出口阀门开度和从反应器1到反应器2的热传递速率;Qc———冷却剂的流量;q1———反应器1的流出流量;q2———反应器2的流出流量;CAF, qF, TF———进料的浓度、流量、温度;V1, CA 1, T1———反应器1中的液体体积、化合物A的浓度、温度;V2, CA 2, T2———反应器2中的液体体积、化合物A的浓度、温度;E, R, ρ, cP, ΔH, k0, c1, c2———化学反应系数。具体参数与操作条件如表1所示。
反应器1既要接收进料流量, 又要向反应器2传递化合物A的流量, 故具有很强的耦合性。系统最终要得到的产品B的品质好坏由反应器2中A的浓度CA 2来决定, 但实际中A的浓度很难在线测量, 往往通过控制反应器2的温度T2来达到控制浓度CA 2的目的, 所以设定本系统的控制目标为T2跟踪参考输出。自适应预测控制 (APC) 调节参数选择为预测时域N2=3, 控制时域Nu=2, Q=I6, R=1.5I4, m=20, n=1 000。这里预测时域和控制时域选的都很小, 主要是减小系统的预测误差, 因为实际系统是非线性而基于子空间的预测是线性的, 更大的预测时域可能会引入更大的预测误差, m也选的较小, 主要是减小滚动窗口的长度, 从而降低自适应预测控制算法的计算量。
APC与自适应模糊控制 (AFC) 、PID控制器 (PID) 比较的跟踪曲线如图3所示, 其中AFC采用的是参数自校正模糊控制, 控制器初始参数与隶属函数可参考文献[12]中模糊控制在镁砖隧道窑中的应用实例, 为了使控制器具有自适应特性, 依据控制器在线辨识效果对量化因子Ke、Kec和比例因子Ku进行在线整定, 具体在线整定方法见文献[13]。PID控制器的控制律为其参数KP、KI、KD经过基本遗传算法迭代优化10次后得出:0.001 4, KD=0.229 3。图4所示为进料流量qF发生-10%变化时系统抗干扰性能的比较曲线。
从图3、图4中可以看出, 自适应预测控制器表现出良好的控制特性, 采用增量型能够消除控制中的稳态误差。当系统变量发生变化时, APC抗干扰性能明显优于AFC和PID。
5 结论
本文设计了一种在线子空间辨识的自适应预测控制器, 利用滚动窗口QR分解的方法在线更新R阵, 通过判断是否能够改进一步预测误差来决定预测模型的更新, 达到自适应的目的。将此控制器应用于2-CSTR的过程控制中, 选择合适的预测时域和控制时域进行仿真, 仿真结果表明, 在动态性能、鲁棒性等方面, 自适应预测控制器要比自适应模糊控制、PID控制器更为优越。
空间自适应 篇2
在八周的自适应控制学习中,我了解了自适应控制的基本概念和定义,自适应控制的原理和数学模型以及发展状况。其中,老师重点给我们讲了李亚普诺夫稳定理论设计MRAC系统和MIT方案,波波夫超稳定理论设计MRAC系统和MIT方案和自校正控制系统。虽然这些理论知识掌握的不是很牢固,理解的也不够透彻,但是这为我以后的学习和实践奠定了一定的基础。
自适应控制的定义:(1)不论外界发生巨大变化或系统产生不确定性,控制系统能自行调整参数或产生控制作用,使系统仍能按某一性能指标运行在最佳状态的一种控制方法。(2)采用自动方法改变或影响控制参数,以改善控制系统性能的控制。
自适应控制的基本思想是:在控制系统的运行过程中,系统本身不断的测量被控系统的状态、性能和参数,从而“认识”或“掌握”系统当前的运行指标并与期望的指标相比较,进而做出决策,来改变控制器的结构、参数或根据自适应规律来改变控制作用,以保证系统运行在某种意义下的最优或次优状态。
按这种思想建立起来的控制系统就称为自适应控制系统。自适应控制是主动去适应这些系统或环境的变化,而其他控制方法是被动地、以不变应万变地靠系统本身设计时所考虑的稳定裕度或鲁棒性克服或降低这些变化所带来的对系统稳定性和性能指标的影响。好的自适应控制方法能在一定程度上适应被控系统的参数大范围的变化,使控制系统不仅能稳定运行,而且保持某种意义下的最优或接近最优。
自适应控制也是一种基于模型的方法,与基于完全模型的控制方法相比,它关于模型和扰动的先验知识比较少,自适应控制策略可以在运行过程中不断提取有关模型的信息,自动地使模型逐渐完善。
李亚普诺夫稳定理论设计MRAC系统和MIT方案的学习中,如果要设计一个关于李雅普诺夫函数的MRAC系统。首先构造出系统的李亚普诺夫函数,然后用李雅普诺夫稳定性理论的设计方法,能够成功地设计稳定的模型参考自适应系统。在这一章的学习中,理解李亚普诺夫稳定性理论和构造系统的李亚普诺夫函数是重点。
超稳定性概念是波波夫于六十年代初研究非线性系统绝对稳定性时发展起来的。当时,波波夫对某种类型的非线性系统的渐近稳定性问题,提出了一个具有充分条件的频率判据,对研究的这类非线性系统的稳定性提供了比较实用的方法。波波夫所研究的这类非线性系统,是由线性时不变部分与非线性无记忆元件相串联而构成的反馈系统。波波夫超稳定性理论来设计模型参考自适应系统,它可以给出一族自适应规律,并且有一整套设计理论。因此,有利于学习掌握这种自适应控制的设计方法和结合实际系统灵活选择适当的自适应控制规律。
自校正控制系统又称为参数自适应系统,它源于随机调节问题,该系统有两个环路,一个环路由参数可调的调节器和被控系统所组成,称为内环,它类似于通常的反馈控制系统;另一个环路由递推参数估计器与调节器参数计算环节所组成,称为外环。自校正控制系统与其它自适应控制系统的区别为其有一显性进行系统辨识和控制器参数计算(或设计)的环节这一显著特征。自校正控制的思想是将在线参数估计与调节器的设计有机的结合在一起。自适应控制常常兼有随机性、非线性和时变等特征,内部机理也相当复杂,所以分析这类系统十分困难。目前,已被广泛研究的理论课题有稳定性、收敛性和鲁棒性等,但取得的成果与人们所期望的还相差甚远。
在传统的控制理论与控制工程中,当对象是线性定常、并且完全已知的时候,才能进行分析和控制器设计。无论是采用频域方法还是状态空间方法对象一定是已知的。这类方法称为基于完全模型的方法。在模型能够精确的描述实际对象时,基于完全模型的控制方法可以进行各种分析、综合,并得到可靠、精确和满意的控制效果。因此,在控制工程中,要成功设计一个良好的控制系统,不论是通常的反馈控制系统或是最优控制系统,都需要掌握好被控系统的数学模型。
然而,有一些实际被控系统的数学模型是很难事先通过机理建模或离线系统辨识来确知的,或者它们的数学模型的某些参数或结构是处于变化之中的。对于这些事先难以确定数学模型的系统,通过事先鉴定好控制器参数的常规控制难以应付。
面对这些系统特性未知或经常处于变化之中而无法完全事先确定的情况,如何设计一个满意的控制系统,使得能主动适应这些特性未知或变化的情况,这就是自适应控制所要解决的问题。
自适应控制技术在20世纪80年代即开始向产品过渡,在我国得到了较好的推广应用,取得了很大的经济效益。且理论研究也有一些开创性的成果。但总的来说推广应用还很有限,主要是由于其通用性和开放性严重不足。
虽然现已能设计出安全、有效、稳定、快速且现场操作比较简单的自适应控制系统,但今后较长一段时期内,相对简单实用的反馈、反馈加前馈或其他一些成熟的控制技术仍将继续占据实际应用的主流。
自适应控制理论必须有新的突破,才能在工程应用中对PID控制等传统方法取得显著的优势,结合人工智能技术,尤其是神经网络技术与模糊理论,或许是最终实现这一远景的可能途径。
空间自适应 篇3
自适应阵列处理作为阵列信号处理的主要分支之一,可广泛应用于雷达、通信、声呐、导航、语音信号处理、地震监测、地质勘探、射电天文以及生物医学工程等众多军事及国民经济领域。在近30年来,其得到了迅速发展,成为多个重要研究领域的热门研究方向。自适应波束形成技术是自适应阵列处理的关键内容之一。在实际应用中,阵列的阵元往往很多,例如相控阵雷达,其阵元数就可能成百上千甚至上万,如果进行全自适应处理方式,则所需的运算量与储存量极大,并且收敛性极差,工程上难以应用。本文从波束空间理论出发,运用了一种波束形成算法,可降低计算量和加快收敛速度。
1 算法描述
在某些电子系统中,有时阵非常大,可能包含几百至几千个阵元。若采用全自适应阵,则需要对等数量的高频通道、A/D转换和加权处理,系统复杂,造价极高。这时必须采用部分自适应阵技术。根据自由度的理论,若要求波束在L1个方向有最大响应,在L2个方向形成零点,则要求的自由度为L1+L2,要求的自适应加权系数为L1+L2+1。这往往比阵的总的阵元数小得多。对于大阵列来说,如何选择或形成这L1+L2+1个通道,即如何构建部分自适应阵就成为重要的设计任务,波束空间法就是构建部分自适应阵的一种重要方法,其原理如图1所示,其中采用一个变换处理将M路阵元数据变成M1路数据后再进行加权。这M1路输出可认为是M1个波束输出。因而对此波束输出进行的处理为波束空间处理。M1=M时为全自适应阵。M1<M时为部分自适应阵。
不失一般性,假设空间阵列是由M个阵元组成的均匀线阵,有N个远场信号源,则可以认为信号是以平面波形式入射到阵列上,则第k次快拍得到的数据向量为:
X(k)=AS(k)+N(k) k=1,2,…,K (1)
式中,K为快拍数,X(K)为M个阵元的输出,S(k)为N个信号组成的矢量,N(k)为M个阵元接受的噪声矢量,阵列流型矩阵A=[a(θ1),…,a(θn)],其中a(θ)为阵列方向为θ的导向矢量。
波束空间预处理相当于阵元空间到波束空间的变换。假设需要形成波束有M′个,波束形成矩阵为T,一般情况下,要求波束形成矩阵满足
THT=I (2)
则阵元输出数据经过波束空间预处理后得到的M′个波束输出:
B(n)=THX(n)=TH[x1(n),…,xM(n)]=
[b1(n),…,bM′(n)]
其中,X(n)为根据快拍的到的矩阵接收数据,B(n)为经过波束空间预处理后得到的波束输出数据,则根据传统的LMS、RLS等算法很快可总结出基于波束空间的LMS、RLS等算法,如基于波束空间的LMS算法的计算步骤可为:
①给定初始加权矢量w(0)和步长因子u。
②取得X(n)和d(n)。
③计算B(n)=THX(n)。
④计算y(n)=wHB(n)。
⑤估计误差e(n)=d(n)-y(n)。
⑥更新加权w(n+1)=w(n)+2ue*(n)B(n)。
⑦如果收敛,则结束;不收敛,则令n=n+1,重复步骤②-⑥。
对于阵元空间方法,阵列中的每个阵元相互的地位是对等的,每个阵元对有用信号或是干扰信号的响应都是完全相同的(除了相位差之外),取消其中任何一个对整体性能都会产生基本同等的影响。而波束空间方法则不同,每个波束都具有自己的方向性,这使得不同的波束在信号环境中对有用信号或是干扰信号都存在各自不同的响应。例如,主瓣接近有用信号来波方向的波束。因此完全可以利用这种不对等性,从波束中选择比较有用的那些波束进行处理,从而抛弃那些对信号响应较小,或对干扰信号信号响应较大的波束。这样做有以下好处:降低了信号处理维数,使得总体波束形成过程中计算量减少;整体性能并不因处理维数的降低有明显下降;如果能通过波束选择有效的扼制干扰,则算法本身也可以采用较简单的形式。
2 波束形成矩阵
一般情况下,要求波束形成矩阵满足式(2),即波束形成矩阵是正交矩阵,因此当遇到波束形成矩阵不是正交矩阵时,通常采用下式对其进行处理:
T=C(CHC)-1/2 (3)
式中,C为波束形成矩阵,以保证矩阵T满足式(2)。
在假设接收信号阵列为均匀线阵的情况下,进一步设入射信号为窄带信号,阵元间距为半波长,X(n)表示在n时刻测量得到的M×1维阵元空间快拍矢量,Xi(n)表示X(n)的第i个元素,i=1,2,…,M。则第n时刻快拍矢量的离散空间傅里叶变换(DSFT)定义为:
其中,U=sinθ,θ为信号入射方位角。从式(4)可看出,对于固定的n,f(u,n)是u的周期为2的函数,相对应于θ在-90°到90°之间取值,-1≤u≤1。
定义M×1维DFT波束形成加权矢量为:
υM(u)=[1,exp[-jπu],exp[-j2πu],…,
exp[-j(M-1)πu]]T (5)
而均匀线阵的导向矢量为:
其中,d为阵元间距,λ为入射波长,因此,当
a(θ)=[1,exp[-jπsinθ],…,exp[-j(M-1)
πsinθ]]T (7)
对比式(5)和式(7)可知,由式(5)的波束形成加权矢量形成波束主瓣指向为θ=arcsinu。
考虑一个由M个式(5)形式的DFT波束形成加权矢量组成的M×M波束形成矩阵:
则式(8)中的每一列表示波束主瓣指向u=sin(2k/M)的波束形成器,其中,k=0,1,2,…,M-1,式(8)中共有M个波束形成器,每个相邻主瓣指向的间隔为Δ=2/M。
图2给出了一个16阵元半波长间距天线阵采用DFT变换对应生成的16个正交波束的方向图,从该图中可以清楚地看到这些固定波束之间的正交。
本文的目的是通过波束空间预处理形成M′个波束,显然可以通过选择式(8)中从m列开始的相邻的M′个波束形成器来形成所需要的加权矩阵:
显然,上式满足式(2)。
图3画出了阵元间距为半个波长的16元均匀线阵在法线方向附近的5个正交波束方向图。
3 仿真分析
3.1 方向图
设天线阵列为d =λ/ 2 的等距均匀线阵,阵元数为16。
试验1: 波束空间算法与阵元空间算法的方向图仿真性能比较。干扰方向为-60度,信号方向为30度,假设有足够的快拍数,应用文中所述波束空间LMS算法。图4(a)为全自适应自适应方向图,图4(b)为DFT波束空间法采用全部16个DFT正交波束的自适应方向图。从两图中可以看出,两种方法的自适应方向图几乎相同。虽然性能上没有恶化,但此时没有达到降维的目的,计算量没有减少,工程实现的成本没有减少。
试验2:波束空间算法中不同波束数的方向图仿真性能比较。仿真条件同试验1,图5(a)、图5(b)分别画出了波束为2和5时的自适应方向图,当波束为2时,主瓣没有明显变化,副瓣电平与全自适应相差不明显,且干扰方向零陷深度减小;当波束为5时,主瓣没有明显变化,副瓣电平与全自适应相比有明显降低,且干扰方向零陷深度与全自适应相差不明显。
3.2 收敛速度和方差
试验3:波束空间算法与阵元空间算法的收敛方差和速度仿真性能比较。仿真条件同试验1,从图6中可以发现,采用波束空间法比全自适应法的收敛速度有明显加快,收敛方差也明显减小。
试验4:波束空间算法中不同波束数的收敛方差和速度仿真性能比较。仿真条件同试验1,从图7中可发现,采用2个波束和5个波束所得到的收敛方差和速度没有明显区别。
通过上述的理论与仿真分析,可得出如下主要结论。
①当波束数等于阵元数时,DFT波束空间算法性能与阵元空间算法相同。
②一般情况下波束空间算法中随着波束数的减少其算法收敛性能没有大影响,只要所应用的波束方向包括有用信号来波方向,这正说明了波束的不对等性。但随着波束数的变少其波束增益会明显变化,导致方向图副瓣明显升高,性能恶化。
③波束空间自适应滤波算法的优点在于:减小了计算量、降低了收敛方差、加快了收敛速度。
④波束空间算法属于空间谱估计算法中的预处理算法,所以可将其推广到大多数自适应滤波算法,如推广到RLS、SMI、QRD-LS 及盲自适应算法等。
参考文献
[1]Michael D Zoltowski,Gregory M Kautz,Seth D Silverstein.BeamspaceRoot-MUSIC[J].IEEE Trans.on SP,1993,41(1):344-364.
[2]Adams R N,Horowitz L L,Senne K D.Adaptive main-beam nullingfor narrow-beam antenna arrays[J].IEEE Transactions on Aerospace and Electronic Systems,1980,16:509-516.
[3]Xu X L,Buckley K.An Analysis of Beam-Space Source Localization[J].IEEE Trans.on SP,1993,41(1):501-504.
[4]王永良,丁前军,李荣锋.自适应阵列处理[M].北京:清华大学出版社,2009.
[5]金荣洪,耿军平,范瑜,等.无线通信中的智能天线[M].北京:北京邮电大学出版社,2006.
自适应算术编码的FPGA实现 篇4
在利用FPGA实现自适应算术编码的过程中,首先遇到的问题就是将浮点运算转化为定点运算,即将[0,1]区间的一个小数映射为一个便于硬件实现的定点数。考虑到硬件实现的简便性,本文中将[0,1]之间的浮点数与[0,256]之间的定点数对应。相应的对应关系如表2所示。
表2浮点与定点之间的关系
浮点00.20.50.71定点051128179256
编码器在实现编码的整个过程中按照耦合弱、聚合强的原则分为四个模块:修改码表、计算确定区间、并行编码、串行输出。四个模块相对独立,通过输入、输出信号使其构成一个整体。系统的顶层结构如图2所示。
3.2码表的设计及修改
自适应算术编码器可以在许多场合中得到应用。本文实现的自适应算术编码器应用在采用6符号对小波变换系数进行零树编码的小波域视频编码中[3],因此设计的码表中含有六个符号。这样根据自适应算术编码的基本原理,将区间分成六个子区间,整个区间含水量有七个分割点。所以码表可以用七个8位寄存器表示。初始时设定等概率,这时七个寄存器可以顺序地存储0到6这七个数,即每个子区间的数值为1。随着符号不断地输入,自适应地修改码表,并且在修改码表的过程中时刻要保持寄存器中的数值是递增的。
修改码表时,首先判断输入符号,确定其所在区间,同时为后续模块输出该子区间的两个端点值l_count和h_count以及码表的最后一个端点值scale,然后进行码表的修改:将当前符号所在区间之后的所有端点值都加1,即当前区间及后面所有子我间的h_count=h_count+1,这样即完成了码表的修改。在数值不断累加过程中,寄存器中的数值为255时,需要对每一个寄存器中的值都取半,并同时对相邻的两个寄存器中的值进行比较,时刻保持数值是递值的。这样,处理前后的概率十分接近,对压缩比影响不大。
修改码表模块在输出h_count、l_count和scale之后,后面的计算子区间的模块即可进行计算;而修改码表模块在输出h_count、l_count和scale之后,亦可进行码表的修改。因此,这两个操作可以采用并行处理的方法实现,极大地节省了所用的时钟周期,相应地提高了速度,达到了优化的目的。表3给出了输入符号为3(对应于寄存器2与寄存器3之间的区间)时码表的修改过程。
表3码表修改前后对照表
寄存器0123456修改前04345677112233修改后04345778113234修改前023545657234255修改后011272829117127
3.3区间计算及确定
初始时符号所在的总区间为high=0xff,low=0(high和low分别表示已编码的符号序列所在子区间的上下界)。随着符号的不断输入,high和low的值也不断地减小,用以表示输入符号序列所对应的子区间。通过如下的公式可确定输入符号的区间:
计算时,最耗资源的是乘法器和除法器。本方案中乘法器采用参数化模块lpm中的lpm_mult生成。而除法器则自动编写。虽然占用的时钟周期较多,但与使用lpm相比,这样做可以大大地提高工作频率,从总体上提高性能。
3.4并行编码
在区间计算过程中,high和low总是有限值,不可能无限制地划分下去。为了能够实现连续的编码,通过对high和low的处理,可以实现利用有限长的寄存器表示无限精度的区间,即在不断修改high和low的过程中输出high和low中相同的高端位,形成输出码流。详细过程如下:
在区间确定之后,将low和high按位比较,若首位相同,则输出首位二进制码,产生输出码流,同时把low和high左移,low末位补0,high末位补1。循环比较输出,直到首位不同为止。如:
high=00110110
low=00100111
输出码流为001,而high和low的结果为:
high=10110111
low=00111000
通过这种连续地处理便可生成符号序列的自适应算术编码结束。但随着待编码符号序列的不断输入,可能会出现high和low十分接近,并且high和low的首位没有相同位的情况,如:
high=10000000
low=01111111
称这种现象为产生了下溢。产生下溢后,后面的编码都失去了意义,此时需要特殊处理。
对于下溢的处理方法为:保留首位,同时删除紧接在首位后的high中连续的0和low中连续的1,并且保证对high和low删除的位数相同,若连续0和连续1的位数不同,则取其较小者;然后high和low左移相同的位数,同时high的低位补1,low的低位补0。表4给出了下溢处理前后high和low值。
表4下溢处理前后对照表
下溢处理前下溢处理后下溢个数high10001000110001113low0111011100111000
经过处理后,扩大了区间,使得后面的编码可以顺利地进行。
在考虑了下溢的编码输出中,下溢作为输出码流的一部分,使得解码时能对下溢进行同样的处理,达到编解码的一致。但是下溢产生后并不马上输出,只记下下溢的个数,下溢则是在下一个符号编码时进行输出的。在下一个符号编码时,如果high和low比较后高端有相同位则输出下溢,即在第一个输出后紧接着插入首位的反,插入首则反的个数为前面产生下溢的个数,然后输出相同的次高位及以后相同的各位。这样处理既保留了下溢的信息又使得输出码流不偏离编码符号所在的子区间,使得解码时很容易处理。但是如此high和low比较后没有相同输出则不输出下溢,而是把两次产生的下溢的个数进行累加,再输入下一个符号,直到high和low有相同首位才输出下溢。
例如:在一个符号编码计算后得到的high=11010010和low=11001101,而前一个符号编码产生的下溢为1个,比较后输出为1010,同时记录下产生的下溢2个,如表5所示。
表5含有下溢的编码输出
highlow下溢输出编码输出前110100101100110111010编码输出后11011111001000002
3.5串行输出
并行编码后产生的码流存储在并行数据中,但在大多的情况下只有两、三个输出,甚至没有输出,若采用并行输出,就会产生极大的浪费。为了充分利用资源,在并行编码之后进行并/串转换,使其一位一位地输出,并且这个输出过程与下一个符号编码的过程并行完成,因此并不占用多余的时钟周期。
在编码过程中,当一个符号编码结束后,触发reload信号,通知此次编码结束,进行下一次编码,读取输入的符号。同时需判断输入是否合法,如果是合法的输入,就进行编码;否则停止编码,否则停止编码,处于等待状态,直到复位信号ret置1,重新初始化、编码。
图3
4仿真结果
本文算法采用VHDL硬件描述语言实现,并在ALTERA公司的MAX+plusⅡ软件上编译仿真。市府采用全局同步时钟,避免了毛剌的产生,保证了信号的稳定性。编码的仿真结果如图书3所示。
其中,rst、clk、c为输入信号,rst为模块中各寄存器的初始化信号,clk为时钟同步信号,而c则为输入的编码信号;out_flag、out_bit、reload、end_code、为输出信号,out_flag和out_bit分别为输出标志位和输出位(若out_falg=1,则此时out_bit为有效输出;否则out_bit输出无效),reload为一个符号编码结束)下一个符号输入的标志位,end_code为编码结束的标志(若end_code=0,则继续编码,否则编码结束)。
在进行性能仿真时[4],采用的器件是FLEX1K系列的EP1K30TC144-1器件,其最大工作频率为40MHz,消耗1533个LC,平均编码时间为20个时钟周期。一个符号的编码时间不到500ns,对于QCIF格式的图像完全可以满足每秒钟实时编码30帧图像的要求。
空间自适应 篇5
WSN是具有数 据融合、 通信和计 算等特定 功能的节点 以自组织 的形式关 联在一起 的网络体 系 ,能够实时 监测、感知 和采集周 围环境的 相关信息 , 并把信息 经过处理后 通过路由 协议传输 给终端计 算机[1]。WSN在环境监测 、智能交通 等领域得 到了广泛 的应用[2,3]。
由于三维 空间的路 由协议更 符合实际 的应用环 境 ,近年来其 成为WSN研究的热 点。Li等人在文 献[4]中提出3D-SAEAR算法 ,通过迭代 分簇方法 一定程度 上平衡了网 络的能耗 , 但是簇首 死亡时才 发动选举 , 造成节点过 早死亡。Ke等人在文 献[5] 中提出了 三维胞元 空间模型和3D-CSR算法 , 建立了完 整的分层 路由体系 , 提出了自适 应选举机 制 ,但是采用 贪婪路由 方式选择 邻居胞父节 点中到目 的节点的 距离最短 的作为下 一跳节点 (此节点为邻 居最优胞 父 ), 没有建立 有效的能 量模型来 优化传输路 径 ,导致平均 能耗较多 。
3D-SAEAR算法和3D-CSR算法均存在簇首负担较大的问题, 本文在三维胞元空间模型的基础上, 提出了3DSMEER算法。该算法引入协同节点协助最优胞父转发消息包,减少了总的路径损耗,降低了网络的能耗;建立协同节点选举机制,保护了能量较低的节点,提高了能量利用率。
1 算 法模型
1 . 1 能 耗 模 型
当传输g bit字节时 ,总能耗Es表达式如 下所示[6]:
其中l表示节点 之间的距 离 ,Eelec表示发送1 bit字节时 ,启动电路 能耗 ,εamp为放大电 路能耗 ,γ为路径 损耗指数。 本文假设 在自由空 间模型下 ,取γ=2。
1 . 2 协 同 节 点 选 择 模 型
Bhardwaj等 [7]提出当采 用最佳传 输距离Lideal转发消息包 时 ,通过最佳 跳数Hideal, 能耗达到 最低 , 由Lideal确定的转发 位置称为 理想转发 节点位置 ,Lideal和Hideal表达式分别为 :
WSN中一般达 不到转发 节点相互 距离为Lideal的要求 ,因此提出协 同节点代 替理想转 发节点多 跳传输的 模型。
基于协同 节点的多 跳模式的 基本思想 为 : 首先在贪婪 策略下确 定邻居最 优胞父 ,根据Lideal确定理想 转发节点位 置Mi; 然后以Mi为球心 , 作半径为r的球体 , 球体内的节 点称为候 选协同节 点 ;最后根据 协同节点 的选择原则 进行选举 :
( 1 ) 低剩余能 量保护原 则 : 低剩余能 量保护系数 为β (0<β<1), 节点的初 始能量为Eini, 如果节点 剩余能量Eres< βEini, 则该节点 不能作为候 选协同节 点。
( 2 ) 重复选择 避免机制 : 球体半径r值增大时相 邻球体出 现相离、相 切与相交 的三种关系 ,若某节点 被选中为 协同节点 后不能作 为另外球 体的候选协 同节点。
( 3 ) 胞父优先 原则 : 球体中有 胞父节点 , 则优先选 择胞父作为 协同节点 。
( 4 ) 能耗节省 原则 : 同类型的 节点比较 时 , 优先考虑与 理想节点 位置距离 最短的节 点为协同 节点。
LEN ( A , B ) 表示节点A与节点B之间的距 离。图1为通过协同节点转发的示意图,其中LEN(C,M1)=LEN(M1,M2) = Lideal, d表示胞元 的边长 , 当前胞元 ( XI, YI, ZI)C中胞父节点C确定的邻 居最优胞 父P位于胞元 (XJ, YJ, ZJ)C内。球M1内有胞父 节点 , 由原则 (3) 选择胞父 为协同节点 ; 球M2内无胞父 节点 , 由原则 (4) 选择距离 理想转发节 点最近的 胞子为协 同节点。
2 3D - SMEER算法
该算法根 据自适应 多跳机制 决定传输 方式 , 利用协同节 点选择机 制选出转 发节点协 助当前胞 父传输消息 包。
2 . 1自适应多 跳机制
由公式(3)知 ,当前胞父 和邻居最 优胞父的 距离L与最佳传输 距离Lideal的关系决 定了最佳 跳数Hideal。图2 ( a )中当L<Lideal时 , 采用单跳 的方式到 达邻居最 优胞父 ;图2 ( c ) 中当L > 2Lideal时 , 由公式 (3) 得Hideal≥2, 即采用多 跳方式把消 息包传输 给邻居最 优胞父 ; 图2 (b) 中当Lideal<L < 2Lideal时 ,比较二者 传输消息 包的能耗 , 协同节点 位于M1处时 ,根据公式(1)计算比较 两跳能耗E2h和单跳能 耗E1h得 :当L>1.5 Lideal时 ,E1h> E2h, 即多跳能 耗更小。 但是理想转 发位置处 一般不存 在节点 ,所以采用 协同节点 进行多跳的最小距离为Lmin= 准Lideal( 1 . 5 < 准 < 2 ) , 即当L < Lmin时直接传输 ,否则选择 协同节点 转发传输 。
2 . 2协同节点 选择机制
选择协同 节点时需 要确定协 同节点的 选择范围 , 即球体的位 置和半径r。
2 . 2 . 1 球 体 半 径 r 的 确 定
理想转发 节点空间 坐标即为 球心位置 , 在图1中设邻居最 优胞父节 点为P, 其坐标为 (XP, YP, ZP) , 同时令当前 胞元(XI,YI,ZI)C中胞父为M0, 其坐标为 (XM0,YM0,ZM0) ,理想转发 位置处球 心Mi的坐标为 (XMi, YMi, ZMi) 。以Mi的X轴坐标XMi为例 ,表达式为 :
其中i∈N且[1,Hideal- 1 ] 。
对于节点 密度较小 的网络 ,r值过小 ,球体内找 不到协同节 点 ;反之 ,会增加传 输路径。 假设存在rmax使r<rmax时 ,通过协同 节点进行 多跳比单 跳能耗更 少。为了 求得rmax考虑一种 极限情况 , 即所有的 球体内只 存在一个 协同节点 , 且位于球 体边缘 , 即图3 (b) 是由图3 (a) 投影到XOZ平面所得 。在图3(a) 中 , 节点C为当前胞 父 , 协同节点J位于球M1的边缘处 ,节点P为邻居最 优胞父 ,α = ∠CM1J , d表示LEN ( C , P ) , d1表示LEN (C ,J) ,d2表示LEN ( J , P ) , 通过节点J传输和直 接传输的 能耗分别为 :
当cosα=1时 ,即节点J位于W点处时E2h取得最大值 ,此时可得 到rmax表达式为 :
考察式 (7) 得 ,0.5 Lideal< rmax< Lideal, 实际情况 中选择球 体半径r=φrmax( 0 . 5 < φ < 1 ) , 其中φ称 为球体半 径调整系 数。
2 . 2 . 2 协 同 节 点 的 竞 选 法 则
协同节点 的区域确 定后 , 由低剩余 能量保护 原则和重复 选择避免 机制确定 候选协同 节点。结 合协同节点 选择原则 , 提出候选 协同节点G的竞选权 重( Election Weight , EW ) , 其表达式 为 :
其中G表示当前 候选协同 节点 ,n表示候选 协同节点 总数 ,K[j] 表示球体 中第j个候选协 同节点 ,LEN(K[j],Mi)表示球体Mi中第j个候选协 同节点与 球心Mi的距离 ,Eres ( K[ j ] )表示第j个候选协 同节点的 剩余能量 ,权重系数 λ和η的关 系为 :λ+η=1(0≤λ≤1,0≤η≤1)。其中θ 的取值遵循 以下原则 :当球体内 候选协同 节点是同 类型的节点 , 即都是胞 子或者胞 父节点时 θ =1; 否则 , 胞父节点θ = 1 , 胞子节点 θ = 0。
协同节点 竞选法则 : 将球体内 每个候选 节点的剩 余能量和空 间位置带 入式(8)中 ,按照上述 原则比较 球体内候选 节点的EW, 最后选择 出EW值最大的 作为本球 体的协同节 点。
2 . 3 3D - SMEER算法的具 体过程
结合自适 应多跳机 制和协同 节点选择 机制 , 总结出基于 协同节点 多跳路由 的步骤为 :
( 1 ) 根据贪婪 策略 , 判断出邻 居最优胞 父P , 并计算LEN ( C , P ) 。
( 2 ) 由自适应 多跳机制 判断采用 多跳或者 单跳 , 如果结果为 单跳则直 接把消息 包传递给 邻居最优 胞父P, 否则进入步 骤(3)。
(3) 利用协同节点选择机制确定球心的空间位置和协同节点的选择范围,然后根据低剩余能量保护原则和重复选择避免机制确定是否存在候选协同节点,若不存在则直接把消息包传递给邻居最优胞父P,否则进入步骤(4)。
( 4 ) 依据候选 节点的EW选择出协 同节点 , 将消息包通 过协同节 点转发给 邻居最优 胞父P。
具体流程 如图4所示。
3 仿真实验
3 . 1 仿 真 环 境 及 参 数 设 置
仿真是在OMNet++ V4.1平台上进 行的 , 节点分布在 体积为400 m×400 m×400 m的立方体 内。与3D-CSR和3D-SAEAR进行仿真 结果比较 时 ,为了使仿 真结果更有 可比性 ,假定消息 包只按照 贪婪模式 进行传输 。参数设定 如表1所示。
3 . 2 仿 真 结 果 分 析
仿真结果 将通过平 均能耗和 节点存活 率进行对 比。平均能 耗 (average energy consumption) 为传输k条消息包所 消耗的总 能耗与k的比值 ; 节点存活 率 (Alive rate) 为传递k条消息包 后存活节 点占总节 点数的百 分比。
3D - SMEER , 3D - SAEAR与3D - CSR的平均能 耗曲线如图5所示。3D-SAEAR与3D-CSR相比增加 了角度机制 ,所以其平 均能耗比3D-CSR略有减少 。3D-SMEER通过协同 节点转发 消息包 , 相比3D-SAEAR与3D-CSR有效降低 了平均能 耗。图5(a) 和图5(b) 中每个胞 元的节点个 数N分别为2和4, 随着N的增加 ,3D-SMEER增加了中 间协同节 点的个数 , 使得传输 能耗减少 , 所以图5(a) 和图5(b) 中3D-SMEER的平均能 耗是逐渐 降低的 ,而3D-SAEAR与3D-CSR的平均能 耗基本不 变。
三者的节 点存活率 与消息包 的关系如 图6所示。图6 ( a ) 和图6 ( b ) 中胞元的 节点数N分别为2和4 , 3D - CSR通过自适 应胞父选 举平衡了 网络的能 耗 , 所以3D-CSR与3D-SAEAR相比提高 了节点的 存活率 , 并且随着 胞元内节点 数N的增多 , 选举机制 能够发挥 更好的作 用 ;3D - SMEER与3D - CSR相比 , 通过协同 节点转发 消息包 , 降低了邻 居最优胞 父的传输 负担 , 从而提高 了网络节点 的存活率 , 当网络的 节点密度 增加时 , 增加了其 他节点参加 传输消息 包的概率 ,所以提高 了存活率 。
4 结 论
空间自适应 篇6
对于空间机器人的研究[1,2,3,4,5,6,7,8,9],过去人们常常将其视为多刚体系统.然而实际应用中许多空间机器人均具有柔性,例如,空间机器人系统中机械臂的关节铰的链接难以达到绝对刚性,这将对整个系统控制的稳定性和精确度产生影响.因此对具有柔性效应的空间机器人的研究就具有十分重要的现实意义.目前具有柔性关节的机器人系统已经受到各国研究人员的重视,但大部分都是针对地面柔性关节机器人系统的研究.与地面机器人不同,柔性关节空间机器人系统具有非线性和强耦合性,因此地面机器人的控制方法难以直接应用于空间机器人中.而且由于系统惯性参数常常难以精确测量,造成了空间机器人的动力学模型往往具有不确定性.针对上述问题,文献[10]采用鲁棒控制方法对自由漂浮空间机器人系统进行控制,成功地解决了参数不确定的问题,但需要对系统动力学方程进行线性化处理;文献[11]采用自适应反演滑模控制方法对空间机器人进行轨迹跟踪控制,但未考虑关节柔性的情况;文献[12]对具有柔性关节的空间机器人进行模糊滑模控制,但针对的是系统参数已知的空间机器人系统.
本文利用拉格朗日第二类方法并结合系统动量、动量矩守恒关系建立了柔性关节空间机器人的动力学方程.首先为使奇异摄动技术能够应用于具有柔性关节的系统中,采用关节柔性补偿来等效提高系统的刚度;再利用奇异摄动理论,针对系统参数不确定的情况设计了带有干扰观测器的漂浮基柔性关节空间机器人关节空间期望轨迹跟踪的退步自适应滑模控制方案,利用干扰观测器来降低参数不确定对系统准确性的影响,通过退步自适应滑模控制来保证系统期望轨迹的跟踪.所提出来的控制方案不需对系统惯性参数线性化处理,结构简单,并且实现了系统关节运动的准确跟踪.系统数值仿真证明了该方法的有效性.
1系统动力学建模
如图1所示,对于载体位置、姿态均不受控的漂浮基柔性关节空间机器人,其满足动量守恒和动量矩守恒关系.
结合拉格朗日方程可导出系统动力学方程
式中,q=[θ0,θ1,…,θn]T,θ=[θ1,θ2,…,θn]T为机械臂各连杆转角的列向量;θm=[θm1,θm2,…,θmm]T为各关节驱动电机转角列向量;M(q)∈Rn×n为系统正定、对称的惯性矩阵;为包含离心力和科氏力的列向量;τ∈Rn×[1]为系统的关节控制力矩;Jm=diag(Jm1,Jm2,,Jmn)为驱动电机对称、正定惯量矩阵;Km=…diag(Km1,Km2,…,Kmn)为柔性关节的简化线性弹簧的刚度矩阵;τm∈Rn×[1]为电机的驱动力矩.
2 基于关节柔性补偿器的奇异摄动分解
由于传统的奇异摄动技术仅适用于弱关节柔性的系统中,特引进关节柔性补偿器来等效降低系统关节的柔性,便于奇异摄动技术的应用.
定义关节驱动电机的控制律为
式中,Kz∈Rn×n为待定参数矩阵;τz∈Rn×[1]为新的控制量;τc∈Rn×[1]为待引入的关节柔性补偿器.
将式(2)代入式(1c)中,结合式(1b),可得
令
其中,Kc∈Rn×n为正定、对角柔性补偿矩阵,其满足Kz=I+Kc,I∈Rn×n为单位阵.
将式(4)代入式(3)中,有
其中,Kf=KmKz.由式(5)可知,经过柔性补偿τc后可等效提高系统刚度.
基于奇异摄动理论,可以将新引入的控制量τz分解为两个子控制量进行设计,即
其中,τzs是针对慢变系统设计的控制力列向量;τzf是针对快变系统设计的控制力列向量.
3 控制器设计
3.1 快变系统控制器设计
定义奇异摄动因子α,使满足:Kf=Ka/α[2],其中,Ka∈Rn×n为正定对角常值矩阵.
将式(6)代入式(5)中,可得
为确保快变系统的稳定性,设计快变系统的控制律为:,代入式(7)中,可得
其中,Ks∈Rn×n的选取应保证系统式(8)的稳定性.
此时若令α→0且θm≈θ,,则可获得相应的慢变子系统.结合式(1a)和式(8)可得
式中,Me(q)∈Rn×n为慢变系统的正定惯性矩阵,其满足:为当简化后得到的列向量.
3.2 慢变系统控制器设计
在建模过程中,由于系统惯性参数常常难以精确测量,从而导致建模存在误差,所建立的动力学方程可表示为
其中,为估计的系统正定的惯性矩阵;为估计的包含有离心力和科氏力的列向量;d∈Rn×[1]为系统模型误差,其满足
此时如果直接采用退步自适应滑模控制,由于存在系统建模误差,系统将无法准确地完成相应的关节运动任务.为减小模型误差对系统的影响,提高系统控制精度,在进行控制器设计时,首先将使用干扰观测器对d进行误差观测补偿;再进行退步自适应滑模控制设计,从而保证系统各关节能够快速跟踪到期望轨迹.
3.2.1 干扰观测器的设计
根据实际所建立的系统动力学方程,本文所采用的干扰观测器具有以下形式[13]
式中,为误差d的估计值,为增益矩阵.
定义干扰观测器的观测误差D为
假设模型误差d的变化相对于观测器的动态特性是缓慢的,即=0.对式(12)进行求导,可得
由此得到观测器误差系统的动态方程为
因此,通过设计矩阵,可使观测器的观测误差按指数收敛.采用干扰观测器对模型误差d进行估计补偿后,系统误差就由d变为D,使系统总误差变小,原系统动力学方程可表示为
式中,τsD为观测器进行补偿后系统所需的力矩,其满足.
3.2.2 退步自适应滑模设计
根据退步设计控制方法的思想,结合滑模控制与自适应控制方法,对式(15)表示的系统进行控制器设计,具体可分为两个步骤.
假设系统的期望轨迹为
式中,θid分别表示机械臂关节铰转角θi的期望值.步骤1引入辅助变量
对式(17)进行求导,可得
取虚拟变量ur=c1e,其中c1∈Rn×n为对称、正定的常值矩阵.定义
选取如下的李雅普诺夫函数
对式(20)进行求导,有
由式(21)可知,若Z1=0,则可看做是系统轨迹误差向量e的二次型函数,且.为此进行下一步设计.
步骤2对式(19)进行求导,结合式(15)有
由于系统建模误差D难以估计上界,为了避免估计误差D的上界,对D进行自适应补偿.定义为观测误差D的估计值,则估计误差上限为
式中,D*为误差上界,有‖D*‖≥‖D‖.
选取如下的李雅普诺夫函数
式(24)中η为一正常数,σ为系统的切换函数,其定义为
其中,c2∈Rn×n为对称、正定常值矩阵.
对式(25)求导,结合式(22),有
对式(24)求导,结合式(21)和式(26),可得
设计如下退步自适应滑模控制器为
同时,设计误差控制的自适应律为
式中,φ∈Rn×n为对称、正定矩阵,kv为正常数.
将式(28)、式(29)代入式(27)中,可得
取
有
设;z=[e Z1]T,则式(30)可写成
通过适当选取常值矩阵c1,c2和φ,可保证F为正定矩阵,从而保证.通过上述退步自适应滑模控制器的设计,使得系统满足李雅普诺夫稳定性条件,e和z1以指数形式渐进稳定.
因此综合上述研究结果,在漂浮基柔性关节空间机器人系统中采用相应的快变子控制律,并对慢变子系统采用式(28)的退步自适应滑模控制律,对于误差控制采用式(29)的自适应律即可保证整个系统各关节铰准确跟踪到期望轨迹中.
4 仿真算例
以平面运动的两杆漂浮基柔性关节空间机器人系统为例.假设系统模型的真实参数分别为
进行仿真时,估计的模型参数分别为
其余参数相同.
设空间机械臂系统各关节铰的关节空间的期望运动轨迹分别为
仿真时所选的相应参数分别为
系统运动的初始值为
图2为开启干扰观测器和柔性补偿时空间机械臂各关节铰的空间轨迹误差跟踪图,其中实线表示关节1的轨迹误差,虚线表示关节2的轨迹误差;图3为关闭干扰观测器时空间机器人各关节铰的轨迹误差图;图4为关闭柔性补偿时空间机器人各关节铰的轨迹误差图.由图2到图4可知,经过柔性补偿和非线性干扰观测补偿后可保证各关节铰准确稳定地跟踪系统的期望轨迹.
空间自适应 篇7
航天技术的发展使得空间机器人在航天飞机及国际空间站上得到越来越广泛的应用。而空间机器人系统所处环境的特殊性,使其与地面机器人具有显著的不同!空间机器人的载体自由漂浮,位置控制系统在机械臂操作期间常处于关闭状态,机械臂与载体之间存在着强烈的动力学耦合作用。因此,空间机器人的动力学与控制问题远较地面机器人复杂。为了得到对空间机器人系统可靠的控制方法,国内外研究学者已经进行了许多的相关研究[1,2,3,4,5,6]。文献[7,8]采用神经网络技术,对空间机器人的控制问题进行了探讨。文献[9-12]分别设计了漂浮基空间机器人系统的自适应控制、鲁棒控制、鲁棒自适应控制方案。这些控制方案对系统惯性参数未知或不确定的情况下,可有效地控制空间机器人完成期望的运动,然而它们均要求系统动力学方程满足关于惯性参数的线性函数关系。
本文基于模糊系统,讨论了具有惯性参数未知的漂浮基空间机器人系统的自适应模糊滑模控制问题。首先,由系统动量守恒关系与拉格朗日第二类方法,建立了漂浮基空间机器人的系统动力学方程。以此为基础,借助于模糊系统及文献[13]介绍的GL矩阵{·}和其操作算子“●”,设计了空间机器人系统载体姿态与机械臂各关节协调运动的自适应模糊滑模控制方案。此控制方案无需预知系统的精确模型,也无需对系统动力学方程进行惯性参数线性化。最后,以一平面两杆漂浮基空间机器人为例进行系统数值仿真。仿真结果表明,该控制方案可有效地控制漂浮基空间机器人系统完成期望的运动。
2 系统动力学方程
考虑如图1所示作平面运动的漂浮基空间机器人系统。C0、C1和C2分别为空间机器人载体(记为B0)、连杆1(记为B1)和连杆2(记为B2)的质心。建立平动的惯性坐标系(O-XY),各分体Bi的主轴连体坐标系(Oi-XiYi)(i=0,1,2)以及末端爪手连体坐标系(O3-X3Y3),其中坐标系(Oi-XiYi)(i=1,2)分别建立在关节O1和O2上。矢量a0为C0指向O1的矢量,ai(i=1,2)为Oi指向Ci的矢量,bi为Ci指向Oi+1的矢量;ai和bi均在坐标系(Oi-XiYi)中表示。各分体的质量和中心惯量张量分别为mi、Ji(i=0,1,2)。
忽略微弱的重力梯度,载体位置无控、姿态受控的漂浮基空间机器人系统为无外力作用的无根多体系统,系统满足动量守恒关系。不失一般性,设系统的初始动量为零。由系统动量守恒关系及拉格朗日第二类方程,可以得到载体位置无控、姿态受控漂浮基空间机器人的系统动力学方程
式中,q=(θ0,θ1,θ2)T,其中θ0为载体姿态角,θi(i=1,2)为机械臂关节角;D(q)∈R3×3为空间机器人系统的对称、正定惯性矩阵;表示科氏力、离心力的非线性耦合列阵;τ=(τ0,τ1,τ2)T,τ0为载体姿态控制力矩,τ1、τ2为机械臂关节铰控制力矩。
式(1)的系统动力学方程也可变化写为
3 空间机器人姿态与关节协调运动的自适应模糊滑模控制器设计
由于本文考虑到的空间机器人系统所有惯性参数均为未知的,因此我们可采用模糊系统和来代替式(3)中的和g(q),实现空间机器人系统的自适应模糊滑模控制。
3.1 基本的模糊系统
设模糊系统由IF-THEN形式的模糊规则构成:
采用乘积推理机和中心平均解模糊算法,模糊系统
其中,为xi的隶属函数。
引入向量ξ(x),上式变化为y(x)=θTξ(x)其中,x=[x1…xn]T,θ=[y1…ym]T,ξ(x)=[ξ1…ξm]T,
3.2 自适应模糊滑模控制器设计
(a)模糊系统建模
基于GL矩阵{·}和其操作算子“●”,模糊系统可表示为如下形式
式中,{A}和{Z(z)}分别为元素αk和ζk(z)组成的GL矩阵;{B}和{H(q)}分别为元素βkj和ηkj组成的GL矩阵。
(b)自适应模糊滑模控制器设计
结合由式(5)建立的模糊系统,本节将进行空间机器人系统载体姿态与机械臂各关节协调运动的自适应模糊滑模控制器设计。
设qd(t)为空间机器人载体姿态角及机械臂各关节铰的期望运动轨迹;分别为与之相应的速度和加速度向量。则系统的控制输出误差向量e(t),可写作
为了得到漂浮基空间机器人系统载体姿态与机械臂关节铰协调运动的自适应模糊滑模控制规律,我们定义如下形式的切换函数:
其中,K1∈R3×3为任选的对称、正定常值矩阵。
其中,μ为一正常值;Nk=NTk>0,Γk=ΓTk>0;βk为由元素βkj组成的行向量。上述自适应模糊滑模控制输入规律式(8)和自适应调节律式(9)可有效地控制漂浮基空间机器人系统完成期望的运动。
(c)证明
定义最优参数为
其中,Ωf、Ωg分别为{A}、{B}的集合。
定义最小逼近误差为
ω=f(z)-f赞(z|{A*})+[g(q)-g赞(q|{B*})]τ(11)则s觶=-K1e觶-e咬=-K1e觶+f(z)+g(q)τ-q咬d
定义Lyapunov函数
根据模糊逼近理论,自适应模糊系统可实现使逼近误差ω非常小,同时适当选取μ值,可得:。
4 仿真算例
以图1所示的作平面运动的漂浮基空间机器人系统为例。系统的模型参数分别为:m0=60.0kg,m1=6.0kg,m2=6.0kg;a0=1.0m,a1=1.0m,a2=1.0m,b1=1.0m,b2=1.0m;J0=30.0kg·m2,J1=3.0kg·m2,J2=3.0kg·m2。利用上面的自适应模糊滑模控制输入规律式(8)和自适应调节律式(9),进行系统自适应模糊滑模控制仿真。
设空间机器人系统载体姿态的期望运动规律为
θ0d=π/3-sin(πt/5),单位:rad;同时,机械臂各关节铰在关节空间的期望运动轨迹为
θ1d=π/3-1.5sin(πt/5),θ2d=π/3+1.5sin(πt/5),单位:rad。控制器的相应参数选为
K1=diag[20.0],μ=80.0,Nk=diag[0.01],Γi=diag[0.01]系统运动的初始值为:θ0(0)=π/4,θ1(0)=π/3,θ2(0)=π/5单位均为rad;仿真过程全部耗时:t=15.0s。
图2为采用上述控制输入规律式(8)和自适应调节律式(9)得到的空间机器人载体姿态的实际运动轨迹(实线)与期望运动轨迹(虚线)的比较;图3(a)、图3(b)为机械臂各关节铰在关节空间的轨迹跟踪图。图4为轨迹跟踪误差图。仿真结果表明,本文所采用的自适应模糊滑模控制方案可有效地控制空间机器人的载体姿态与机械臂各关节协调地完成期望运动。
5 结论
本文采用模糊系统,对漂浮基空间机器人系统载体姿态与机械臂各关节协调运动的控制问题,进行了自适应模糊滑模控制方案设计。文中设计的控制器不要求系统动力学方程具有惯性参数的线性化性质,也无需预知系统惯性参数的信息。系统数值仿真,证实了该控制方法的有效性。需要指出的是,虽然本文针对的是平面二维的情况,但经简单的矢量运算推演,上述控制方法可以很容易的推广到三维一般情况。
摘要:重点研究了载体位置无控、姿态受控情况下,空间机器人姿态、关节协调运动的自适应模糊滑模控制问题。由拉格朗日第二类方法及系统动量守恒关系,建立了漂浮基空间机器人的系统动力学方程。以此为基础,针对空间机器人所有惯性参数均未知的情况,设计了空间机器人载体姿态与机械臂各关节协调运动的自适应模糊滑模控制方案。数值仿真的结果,证实了该控制方案的有效性。
自适应花盆 篇8
现在很多人喜欢在家养一些花花草草, 不过, 这些美丽的生命需要在精心的照顾下才能开放出美丽的花朵。但当你因种种原因而无法按时给花草浇水时, 过不了几天, 这些花草就会因为缺水而枯萎。于是我设计了一个特殊的花盆:在花盆底部放置一个隔板将花盆分隔开, 在底部形成一个储水槽。当主人在家时, 每天浇水时可适量多浇灌一些, 多余的水分会渗过土壤流进事前设计好的储水槽中保存起来。等到主人无法按时给花草浇水, 土壤过分干燥时, 储水槽内的水就会顺着引水装置被干燥的土壤吸收, 从而润湿土壤。花盆的口部有一个有孔封口, 它可以限制植物生长范围, 有了它就可以在最大限度上减少水分蒸发。
点评:作者从实际需要的角度出发, 能够积极地思考生活中的点滴问题, 并通过创意、设想进而解决问题。但在设计中还没有很好地将设想设计出来, 还可以进行一步改进, 以提高其实用性。
空间自适应 篇9
自适应网关发现方法可以认为是混合式网关发现方法的一种特殊情况,其基本思想可归纳为:网关节点通过分析MANET节点的活跃程度和请求网关服务的频率来感知网络状况,通过设置GWADV报文的转发跳数来扩展或收缩主动式网关发现覆盖区域。除了网关通告跳数TTL,如何避免广播风暴、如何基于节点和网关的负载动态选择或切换路由,也是自适应技术的研究范围。
本文结合现有的自适应网关接入机制,进行了改进设计并实现仿真。在所有MANET节点上运行AODV路由协议,网关节点同时运行AODV协议和有线路由协议[3]。在这种方案中,网关的自适应性主要体现在以下几点。
(1)MANET节点的自适应:
一是动态接入:多网关情况下,节点根据网关负载GW(Gateway Weight)对收到的GWADV进行判定,选择其中负载最小的网关进行反向路由建立。
二是流量感知:节点根据邻居列表NNL(Neighbor Node List)及自身负载NW(Node Weight)对收到的RREQ有选择的进行转发,避免浪费链路资源,引起不必要的洪泛。
三是路径质量感知:源节点收到路由回复RREP,根据路径质量PW(Path Weight)选择默认网关路由和备用网关路由。
(2)网关节点的自适应
一是接入网关广播的网关通告半径(TTL)和网关通告的发送间隔随着网络规模以及接入节点到接入网关的距离变化而进行变化。
二是网关收到源节点发送的转发数据包,根据其到达间隔,监控路径质量,及时提醒源节点进行路由切换以减少网络延迟和丢包率。
1 数据结构
1.1 源节点列表
网关节点维护一份移动节点列表MNL(Mobile Nodes List)[4],该列表记录所有请求网关服务的源节点的序列号、IP地址、距离网关的跳数和活跃时间。MNL相关表项的建立与更新基于源节点发送的RREQ,网关节点接收后对其中相关字段进行解析以获取信息。其中,源节点的活跃时间设定于其相关信息初次写入MNL列表,若活跃期内表项信息更新则予以延长,若过期表项信息未更新则删除信息,因为此时该节点或者是不再需要网关接入服务,或者是脱离网关的当前服务范围。
通过MNL列表,网关节点了解需要提供服务的源节点数目及其位置分布,下文中如何设置发送GWADV的TTL值也基于此列表信息,从而实现GWADV的最佳覆盖。
1.2 邻居节点列表及双向链路的判定
无论是移动节点收到GWADV后获取至网关的多跳路径,还是源节点创建并发送RREQ自行寻求至网关的多条路径,这一系列路由发现过程都会因为采用泛洪方式进行报文转发而给网络造成巨大开销,导致大量的冗余分组、激烈的信道竞争以及报文冲突,出现所谓的广播风暴。为排除因单向链路而产生的无效广播分组,相邻节点定时通过HELLO分组探测局部拓扑情况,判定彼此是否为对称无线链路,并判断彼此是否拥有相同的对称邻居节点。
移动节点S维护一份邻居节点列表NNL(Neighbor Node List),该列表记录接收到的HELLO分组的发送者M,将其视作自己的邻居节点。NNL结构如图1所示。其中,邻居ID记录M的IP地址,对称链路记录S与M之间是否为双向链路。若S在M的HELLO分组[5]中看到自己在其邻居名单中,就判定M为对称邻居节点(简称邻居节点),设置对称链路字段,否则不设置。
当M被设置为邻居节点,S还要判断自己和M的对称邻居节点是否完全相同。S检索M的HEL-LO分组中包含的邻居信息,若发现与M的邻居节点并不完全重合,设置共有邻居字段。最后,NNL中的每条记录都设置了存活期限并在被更新后延长。存活期内未再次接收到M的HELLO分组,则删除NNL中有关M的记录,表明以M为下一跳的全部路由已经失效。
2 路由判据设计
2.1 网关节点负载的定义
网关根据MNL的表项信息定义网关负载GW(Gateway Weight)为:
其中,DS为移动节点至网关节点的跳数,NN为向网关节点请求服务的源节点数目,QL为网关节点缓冲区内待转发的数据包队列长度,且n+m+k=1。
显然,MANET结点会选择距离最近、转发任务最轻的网关作为其服务请求对象。考虑距离和负载对网络通信的影响不同,取n>m>k,即跳数的影响最大,其次为请求服务的节点数目,待转发的数据包大小被认为影响最小[6]。权值的选取根据网络环境的具体情况及网络性能的具体参数而确定。
2.2 移动节点负载和路径质量的定义
由于无线通信的特性,节点在传输数据之前要侦听无线信道,判断是否有其他节点正在传输数据。只有共享信道空闲时,节点才能启动数据传输。因此,邻居节点的通信量直接决定了节点进行数据传输时的空等时间,即自组织网络中端到端时延不仅取决于当前节点的负载,而且受制于邻居节点的负载。
定义节点负载NW(Node Weight)为一定的时间间隔内待发送数据包队列的平均长度。对节点S,在采样周期内共采集M个样本,则节点S的负载为:
其中,NW(k)是第k次采样时队列的实时长度,NW是采样周期内队列的平均长度。M越大,对节点负载的度量越准确。
定义路由质量PW(Path Weight)为路径中各节点的负载与节点数目之和:
其中,PN为路径上的节点数目,s<t且s+t=1,即跳数越少且各节点负载越小的路径越好。
3 适应路由策略
3.1 自适应网关通告
网关周期性向MANET广播网关通告来表明自己的存在。GWADV[8]消息包含:消息ID、网关全局地址、网络前缀、TTL、网关当前服务的源节点数量NN和网关节点待转发数据包队列长度QL等,其中NN和QL作为移动节点收到公告后计算GW的依据。同时,为避免非对称链路的影响,对GWADV进一步扩展,将局部拓扑信息即邻居节点信息添加到消息中,使MANET节点对GWADV进行有选择的转发。
(1)TTL的自适应选值
已知网关节点通过查询MNL便可了解源节点的分布情况,据此来动态修正网关通告的TTL,实现GWADV自适应广播。每个发送网关通告的周期,网关节点根据下式计算网关通告半径TTL:
其中,NN为向该网关节点请求服务的源节点数量;DS(i)表示i节点与网关节点的跳数。
(2)GWADV的发送间隔
在一个广播网关通告的周期内加入或离开该网关的源节点数目S可反映源节点的活跃程度[9]。引入阈值low<high,则广播间隔I的自适应公式为:
网关通告间隔的调整主要是基于网络拓扑的变化程度。当网络拓扑不稳定且源节点较活跃时,网关需要缩短广播间隔以及时更新源节点信息,反之则增加广播间隔以降低网络开销。
(3)基于时延给出路径转换信号
当路由建立,源节点向网关发送分组数据包,网关节点对来自同一个源节点的数据包进行计时,并计算各分组的传输间隔T:
第一个分组传输间隔为T1,下一个分组传输间隔为T2,取ΔT=T2-T1。设n=0,若ΔT>0,则n=n+1,否则n清零。当n=k时,即连续k个来自相同源节点的数据包传输间隔处于持续增大的状态,网关节点通过反向路由通知各中间节点和源节点,源节点在发送下一个分组时,选择备用网关路由发送数据。
3.2 自适应网关发现
将MANET节点分成三类:请求网关服务的源节点、已知网关路由并回复RREP的节点和转发RREQ的中间节点,分别叙述其自适应寻路过程。
(1)源节点
在网关通告GWADV的广播范围之外的源节点,通过发送网关路由请求分组RREQ来寻求网关服务。对RREQ格式进行扩展,增加邻居节点信息NNL和节点负载信息NW,以此排除单向链路的干扰并为路由质量PW的计算提供依据。RREQ格式如图2所示。
当源节点收到RREP消息,进行网关路由的建立。从RREP中获取各节点负载NW,按照式(3)计算该路径质量PW。若源节点收到来自不同网关的路由回复,则根据不同的PW,选择值最小的路由作为其默认网关路由,再选取值次小的作为备用网关路由。路由表结构如图3所示。
(2)中间节点(具有到网关的有效路由)
当中间节点收到一个GWADV消息,首先检查是否曾收到与该消息ID和IP地址相同的GWADV,若有则丢弃新收到的消息,否则查看消息中包含的邻居节点信息:
一是若邻居节点信息中包含本节点,则认为本节点和发送GWADV的上游节点之间存在双向链路,建立或更新相应的反向路由,并转发该消息。
二是若消息中邻节点信息中不包含本节点,则认为本节点和发送GWADV的上游节点之间为单向链路,丢弃该消息。
建立或更新到上游节点的反向路由进行以下操作:
一是若该节点没有至网关的路由,则创建该路由表项,根据GWADV中的NN和QL字段,按照式(1)计算网关负载GW,并将自己的邻居节点写入相应字段,然后将该通告进行转发。若该节点收到来自不同网关的GWADV,则根据计算出的GW,选择负载最小的路由作为默认网关路由,并转发该网关的GWADV,其他网关的通告丢弃。
二是若该节点已有至网关的默认路由,则按照式(1)计算网关负载GW,并判断是否进行网关切换。网关切换的条件是新网关的负载与当前网关的负载之差大于一定阈值,以此避免频繁的网关切换所带来的路由抖动。
至此该节点成为具有到网关节点有效路由的节点,收到RREQ后回复RREP,RREP与RREQ结构相同,源节点根据其中包含的节点负载信息选择性的建立全局连接。
三是中间节点(不具有到网关的有效路由)
当中间节点收到一个RREQ消息,若曾收到与该消息ID和源地址相同的RREQ,则直接丢弃,否则根据本节点MAC层及网络层提供信息,按照式(2)计算自己的节点负载NW,决定是否进行转发。节点有两种状态:繁忙和可用(繁忙:NW>U;可用:NW<U;U为拥塞指数),当节点处于繁忙状态时,丢弃所有收到的RREQ;当节点处于可用状态,在RREQ中的节点负载列表中添加自己的NW,搜索邻居节点列表,向双向链路的邻居节点广播RREQ。
4 仿真与分析
设置一个MANET网络场景,各节点运行改进后的路由协议,并按随机的移动速度保持运动状态。在仿真区域配置2个网关,位于仿真区域的对角,并在其上同时运行改进后的路由协议和有线路由协议。每个网关通过一个路由器与一个固定节点连接,均通过100Mbit/s的有线链路连接。具体参数设置如表1所示。
选取以下参数作为比较标准,将上文进行改进的路由协议与普通混合式路由协议进行比对分析:
(1)分组投递率:成功投送到目的节点的分组数据包在源节点发送的所有分组数据包中的所占比率。
(2)网络延时:从源节点发送分组数据包到目的节点接收分组数据包,该过程产生的所有时延,主要包含路由建立时间、数据包在缓冲区等待发送时间和正常的传播时间等。
(3)网络归一化开销:与寻路有关的分组消息(GWADV、RREQ和RREP等)在网络所有传输分组中的所占比率。
分组投递率和网络时延决定了网络接入性能,由图4(a)-图4(b)可知本文算法的性能较优,因为在非对称链路普遍存在的环境下,普通混合式路由算法盲目转发RREQ,导致一些因链路不对称而实际无效的路径被采用。失败后重新进行路由发现,因为建立路由的时间延长,相关数据可能因超时而被丢弃。另外,没有自适应机制使得网关通告范围不能根据MANET状态动态改变,默认网关路由的建立不能根据网关和移动节点的负载进行选择,因此分组投递率较低且网络时延较大,特别随着节点活跃程度增加,链路断裂趋于频繁,互联性能进一步恶化。
在网络开销方面,由图4(c)可知普通混合式路由算法开销巨大,因为其MANET节点盲目转发沿所有链路而来的网关发现消息,且当非对称链路造成路由发现失败,重新寻路造成了更多的开销。源节点位置随机且各节点高速移动,固定网关通告范围使得更多节点采取被动式按需寻路,RREQ等分组数量巨大。本文算法不仅避免了非对称链路的影响,而且引入基于节点负载判定是否转发分组的机制,在很大程度上节省开销。虽然周期性发送包含大量邻居节点信息的HELLO消息牺牲了部分互联开销,但本算法的开销仍然较少,尤其当节点移动速度增加时,其优势更加明显。
5 结束语
对MANET网络和固定网络互联的自适应网关发现算法进行优化。利用邻居节点信息在路由广播消息中的扩展解决单向链路问题;依据网关节点对MANET的感知实现网关通告广播范围和周期的自适应调整;通过采样并计算各节点的负载情况实现路由建立选择与更新的自适应。与已有算法的仿真对比显示,本文算法实现了互联性能的优化和路由开销的降低。
摘要:在移动自组网接入Internet的过程中,为适应节点高速移动导致网络拓扑频繁更新的特性,在混合式路由发现中引入自适应机制,从网关通告跳数的合理范围、广播风暴的避免、各节点和网关负载的动态变化等方面进行自适应性优化。以AODV路由协议为基础,改进网关发现算法的自适应机制,在NS2平台进行仿真,实现移动自组网与有线网络的互联,且其接入性能有一定程度优化。
关键词:移动自组网,Internet接入,网关发现,自适应
参考文献
[1]Cavalcanti D,Kumar A,Agrawal DP.Wireless Ad Hoc Networking[M].New York:Auerbach Publications,2007:483-503.
[2]Jeonkeun Lee,Dongkyun kim,J J Gareia-Luna-Aeeves et al.Hybrid gateway advertisement scheme for eonnecting mobile Ad Hoc networks to the Internet[J].IEEE,2012:191-195.
[3]刘元安,刘凯明,翟临博,等.移动自主网与Internet互联中的自适应网关发现算法[J].吉林大学学报,2011,41(4):1157-1163.
[4]沈斌,柯海燕,胡中功,等.MANET与Internet互联时的自适应增强机制[J].计算机工程与应用,2012,36(3):112-116.
[5]沈彬,李波,石冰心.基于HELLO机制的Adhoc与Internet高效互联[J].微电子学与计算机,2006(10):90-95.