滑模学习算法

2024-06-29

滑模学习算法(精选5篇)

滑模学习算法 篇1

2009年3月27日收到迭代学习控制[1,2]的使用对象是诸如工业机器人那样的具有重复运动性质的被控系统,它的目标是实现有限区间上的完全跟踪任务。迭代学习控制采用“在重复中学习”的学习策略,具有记忆和修正机制。它通过对被控系统进行控制尝试,以输出轨迹与给定轨迹的偏差修正不理想的控制信号,以产生新的控制信号使得系统的跟踪性能得以提高[3]。迭代学习控制的研究,对具有较强的非线性耦合﹑较高的位置重复精度﹑难以建模和高精度轨迹跟踪控制要求的动力学系统有着非常重要的意义[4]。

滑模控制(Sliding Mode Control,SMC)是变结构控制(Variable Structure Control,VSC)的主要理论和方法。从20世纪50年代开始出现至今,滑模控制已经得到了充分的完善和发展。滑模控制实现简单,对外界干扰和系统匹配不确定性有完全的鲁棒性和自适应性[5]。这两大优点使得滑模控制以及其相关的研究迅猛发展,成为控制理论界的研究热点之一。

1 模糊滑模迭代控制器设计

迭代学习显著的特点是控制算法非常简单,控制精度很高,可以以任意精度跟踪给定。但是其主要问题之一是鲁棒性问题。由于不确定项的客观存在,实际应用中的迭代学习控制的鲁棒性问题难以解决,而滑模变结构控制却能够很好地解决鲁棒性问题。基于此,设计出将两种控制方法结合的新方法,可以更有效地提高系统的性能[6]。

普通ILC的收敛速度比较慢,如何寻找一个合适算法来加快收敛速度是ILC一个重要的研究方向。变结构控制具有响应快、对参数变化及扰动不敏感等优点,但单纯的变结构控制容易引起抖动问题,为此将模糊滑模控制算法[7]引入迭代学习控制,提出FSMILC算法,算法原理如图1所示。

由图1可以看出,模糊滑模迭代学习控制算法和其它迭代学习算法不同,这种算法是利用模糊滑模控制进行控制量的增量计算。滑模函数的输入为误差eK(t)和误差变化率e˙K(t),其中e˙K(t)如(1.1)式所示:

e˙Κ(t)=eΚ(t)-eΚ(t-1)(1.1)

滑模函数sK(t)和滑模函数变化率s˙K(t)如(1.2)式、(1.3)式所示:

sΚ(t)=ceΚ(t)+e˙Κ(t)(1.2)

s˙Κ(t)=sΚ(t)-sΚ(t-1)(1.3)

采用控制的变化量Δu作为模糊滑模控制器的输出,可使滑模控制成为无模型控制,依赖于被控对象的程度较小[5,6]。

设模糊控制器的输入为s(t)和s˙(t),它们分别是sK(t)和dsK(t)的模糊变化量,模糊控制器的输出ΔuK(t)是控制变化量Δu的模糊化变量。

被控对象的输入为:

uK+1(t)=uK(t)+ΔuK(t) (1.4)

(1.4)式中,ΔuK(t)为第K个迭代周期模糊控制器的输出,即第K个周期产生的控制变化量。uK(t)为第K个迭代周期的控制量,uK+1(t)为第K+1个迭代周期的控制量。

2 神经网络等效滑模控制器设计

迭代学习控制存在鲁棒性差的问题,由于外界不确定因素的存在,使其成为很难解决的问题。而滑模控制来说,系统如果进入了滑模状态,系统参数扰动与外部干扰对系统无作用,系统的稳定性与动态品质仅取决于滑模面及其参数,所以滑模控制的鲁棒性强、可靠性高。但滑模变结构控制本身也存在不足之处,促使其与神经网络控制相结合,以使系统在保持对摄动和外部干扰强鲁棒性的同时,尽量消除抖振的发生。从20世纪后期开始,许多专家学者就结合神经网络和滑模控制进行了很多研究工作,在诸多方面得到了非常有意义的成果[8]。

由图2可知,神经网络等效滑模迭代学习控制算法和其它迭代学习算法不同,这种算法是利用滑模的等效控制ueq(k)和神经网络输出un(k)之和作为总控制律。ueq(k)称为系统在滑动模态区内的等效控制。等效控制往往是针对确定性系统在无外加干扰情况下进行设计的。针对带有不确定性和外加干扰的系统,一般采用的控制律为等效控制加切换控制,即其中切换控制实现对不确定性和外加干扰的鲁棒控制,所设计的控制律u需要满足滑模稳定条件。在此方案中切换控制部分选用神经网络控制器。

uK(k)为第K次迭代控制被控对象的输入量,yK(k)为第K次迭代被控对象的输出量。滑模函数的输入为系统的误差eK(k)和误差变化率deK(k)。这里神经网络控制器的输入不是系统的误差eK(t)和误差变化率deK(t),而是滑模函数sK(t)和滑模函数变化率dsK(t)。神经网络的输出为uΚn(k),第K+1个迭代周期的总控制律:

uK+1(k)=uΚeq(k)+uΚn(k) (2.1)

uK+1(k)作为下一个周期被控对象的输入存放在记忆存储器中。

3 仿真实验

设对象传递函数为

G(s)=133s(s+25)(3.1)

将(3.1)式转化为状态方程为

x˙=Ax+Bu(3.2)

(3.2)式中

x=[x1x2]A=[010-25]B=[0133]

将状态方程式(3.2)转化为离散状态方程

x(k+1)=A1x(k)+B1u(k),y(k)=C1x(k)+D1(k) (3.3)

0.1sA1=[1.00000.036700.0821]B1=[0.33674.8833]C1=[10]D1=0

。期望轨迹为yd(t)=4sin(0.5t),假设系统的初始状态为零。

图3.1为期望曲线yd与第5,10,20个迭代周期的输出曲线yK之间的关系图,从图3.1中可以看出随着周期数目增加,输出值越来越趋近于期望曲线。图3.2为前30个迭代周期,每个周期内每个采样点误差的绝对值之和,从图3.2可知在第26个迭代周期中,采样点误差的绝对值和趋近于零,随着迭代次数的增加,误差和逐渐减小并趋于平稳,得到较好的跟踪效果。

将状态方程(3.2)式转化为离散状态方程

x(k+1)=A1x(k)+B1u(k),

y(k)=C1x(k)+D1(k) (3.4)

0.1sA1=[1.00000.008800.7788]B1=[0.00611.1768]C1=[10]D1=0

。期望轨迹为yd(t)=4sin(0.5t),假设系统的初始状态为零。

图3.3为期望曲线yd与第2,3,4个迭代周期的输出曲线yK之间的关系,可以看出只需要很少的周期就可以趋近于期望曲线。图3.4为前5个迭代周期,每个周期内每个采样点误差的绝对值之和,从图3.4可知在第3个迭代周期中,采样点误差的绝对值和趋近于零。可以看出,此控制方法比模糊滑模迭代学习控制有更好的跟踪效果。

4 结论

迭代学习控制为难以建模,有高精度轨迹控制要求,特别是具有重复运动特性的对象提供了很好的控制方法。本文将迭代学习控制与滑模变结构控制相结合,提高了控制器的鲁棒性,随着迭代次数的增加误差逐渐减小,验证了方法的有效性。

参考文献

[1]Gunnarsson S,Norrlof M.On the disturbance properties of high orderiterative learning control algorithms.Automatica,2006;42(11):2031—2034

[2]Ahn Hyosung,Moore K L,Chen Yangquan.Stability analysis of dis-crete-time iterative learning control systems with interval uncertainty.Automatica,2007;43(5):892—902

[3]Seshagiri S,Khalili H K.On introducing Integral action in sliding mode control.Proceeding of the41st IEEE Conference on Decision and Control,2002;2(12):1473—1478

[4]Mainali K,Panda S K,Xu J X.Repetitive position tracking perform-ance enhancement of linear ultrasonic motor with sliding mode-cum-iterative learning control.Proceedings of the IEEE International Con-ference,2004;7(6):352—357

[5]Tong S,Li H X.Fuzzy adaptive sliding-mode control for a nonlinear system.IEEE Trans F S,2003;11(3):354—60

[6]陈杨,林辉.基于神经网络的迭代学习控制参数拟合.计算机仿真,2003;20(7):62—64

滑模学习算法 篇2

尤其能有效地培养当今大学生的创新思维与能力。同时,数学建模的各种理论与思想方法的普及、数学建模的各种理论研究及其发展,对当前世界各国和各种行业带来了巨大的经济效益和不可估量的社会效益,并将对人类社会和经济发展产生深远的影响。因此,各类学校的教育工作者,特别是数学教师在教学与科研的工作中要更加自觉地注重数学建模的各种理论与思想方法的学习、研究及其应用。

其次,我对数学建模的理解已经发生了深刻、彻底的变化。学习这门课程之前,我总是认为:数学建模只不过是一整套现成的、千古不变的、直接套用的数学模式或公式与算法,是一种十分短视或者说应试背景下没有多少实际意义和新意的行为,只是教给学生一整套固定下来的数学模式或公式又缺少了创造性与灵活性的“死”东西,是一种通过传统的教学行为让学生接受而使之成为其解决问题的一种传统的、永恒不变的、缺乏创新思维的工具。通过全面系统学习和研究这门课程之后,我深深地感到:数学建模的方法与内容不仅不是一成不变和千篇 一律的,而且是与时俱进、灵活多样和丰富多彩的。

滑模学习算法 篇3

机械式自动变速器(automatic manual trans-mission,AMT)系统按照控制结构的不同可分为三种:电控液动、电控气动和电控电动[1]。其中,电控电动AMT因为结构简单、相对容易控制、易维护和成本低等优势,逐渐成为业内主流[2]。

电动AMT采用两个直流电机分别控制选换挡杆,实现选挡和换挡操作。选换挡系统的控制是电动AMT换挡控制中的重点和难点,其控制效果对换挡时间有较大影响,同时也影响AMT的换挡舒适性。因此,如何采用有效的控制算法实现电动AMT选换挡过程的精确控制,成为学者们研究的热点之一。任玉平等[3]采用模糊控制的方法,建立了选换挡电机控制的模糊规则;申业等[4]对电动AMT的换挡执行机构进行了建模,并设计了滑模控制器对电动AMT的换挡过程进行精确跟踪控制;高智等[5]基于最优控制理论,对电动AMT选换挡过程进行了仿真研究和试验验证。

动态滑模控制(dynamical sliding mode con-trol,DSMC)算法兼具响应速度快、抗外界干扰能力强和鲁棒性好的优点,且能有效抑制常规滑模控制器的抖振现象[6,7]。本文建立了电动AMT选换挡系统模型,在此基础上设计了该系统的动态滑模控制器,并对其换挡过程进行了仿真研究和试验验证。

1 电动AMT选换挡控制系统

电动AMT选换挡系统主要包括自动变速器控制器(TCU)、选挡电机和换挡电机、减速机构、选换挡执行机构和角位移传感器,电动AMT及其选换挡执行机构如图1所示。

执行机构的扭矩从两个额定电压为12V的永磁直流有刷电机输出,经过减速机构减速增扭,将扭矩传递到换挡拨叉上,从而控制同步器分离或同步,实现选换挡操纵。整套执行机构受自动变速器控制器控制,选换挡电机的位置通过安装在选换挡电机输出轴上的角位移传感器反馈给控制器,实现闭环控制。

2 电动AMT选换挡执行机构建模

AMT换挡可以分为离合器分离、摘挡、选挡、换挡、离合器接合五个过程。AMT换挡过程具有严格的时序要求,即必须实现前一过程的执行机构位置控制后,下一过程的执行机构才能开始动作。换挡电机和选挡电机并不同时工作,因此,可以将电动AMT选换挡系统的控制问题解耦成两个电机的单独控制问题。

永磁直流有刷电机的结构原理如图2所示。

根据牛顿第二定律和基尔霍夫定律,电机的转矩平衡方程和电压平衡方程分别为

式中,θ 为电机角位移;Tm为电机输出转矩;kt为转矩常数;im为电机电枢电流;TL为电机负载转矩;Jm为电机转动惯量;bm为电机阻尼;Um为电机电枢电压;Lm、Rm分别为电枢回路总电感和总电阻;kb为反电动势系数。

考虑减速机构传动效率的影响,对于选换挡电机,其负载可表示为[8]

式中,FL为选档力或换挡力;r为换挡力或选挡力的作用半径;i为减速比;η为减速机构的机械效率。

联立式(1)和式(2)可得

定义直流电机系统的状态变量为

根据式(4)和式(5),可以列出直流电机的状态方程:

式中,h(x,t)为外界的不确定干扰。

3 动态滑模控制器的设计

选换挡系统在不同车速和不同挡位下所需的换挡力不同,将造成选换挡系统建模的不精确,实现电动AMT汽车选换挡电机执行机构位置的实时、精确控制是比较困难的。 为了使选换挡系统对外部扰动具有较强的鲁棒性,解决抗干扰性能与位置快速跟踪控制的矛盾,本文采用动态滑模控制器实现对电动AMT选换挡电机的有效控制。

对于永磁直流有刷电机,定义系统的位置追踪误差矢量为

式中,Xd为电机的角位移设定值。

对于三阶非线性系统,其常规滑模面S可定义为

式中,c1、c2为切换面的常系数,且满足多项式p2+c2p+c1为Hurwitz稳定;p为拉普拉斯算子。

以常规滑模控制器的切换面s为基础构建动态滑模控制器的动态滑模面σ:

式中,λ 为正实数。

对动态滑模面求导可得

对于单输入单输出的电动AMT选换挡电机系统,若其滑模运动存在,则其满足,可求出动态滑模控制器的等价控制输出:

为了保证滑模面的到达条件成立,采用指数趋近率,则其趋近控制规律为

式中,k、ε 均为正实数。

可得到动态滑模控制器的输出:

定义Lyapunov函数V=σ2/2,根据稳定性定理,若要满足动态滑模面的到达条件,则必须满足

将式(13)代入式(10),可得

式(14)两边同时乘以σ,可得

由于式(15)中k和ε 均为正实数,且由式(8)和式(9)可知σ ≠0,故动态滑模控制器的输出满足Lyapunov稳定性条件,即定义的动态滑模面是渐近稳定的。

在实际应用中,选换挡电机本身的惯性和位置传感器检测的误差等因素容易造成系统产生抖振现象。抖振将影响系统的精确性,还可能会激发系统未建模动态,引起失稳。 为了避免这种现象,采用饱和函数法来将控制输入修正到连续化的边界层[9?10],即将式(12)中的符号函数用饱和函数取代,得到相应的动态滑模控制趋近律:

4 仿真结果分析

根据式(1)~式(16),基于某款电动AMT变速器在MATLAB/Simulink中建立了采用动态滑模控制的选换挡电机的仿真模型,并与采用传统滑模控制(SMC)及PID控制的系统进行比较,观察在不同控制器控制下换挡电机的动态响应特性。以换挡直流电机系统为例,仿真所采用的电机参数见表1。

假设AMT选换挡过程开始之前,电机处于静止位置,当TCU发出换挡指令时,控制器接收到的电机角位移目标值相当于一个阶跃输入,即电机的初始状态可表示为X[0]=[0 0 0]T。为了更好地与动态滑模控制器进行比较,常规滑模控制器也采用指数趋近律,其中k=300,ε=1。

仿真分别在四种工况下进行:①系统空载换挡;②系统带载换挡,且电机参数均变为原来的两倍;③系统带载换挡,且传感器输入信号受到方差为1的高斯白噪声干扰;④换挡结束后受到外界干扰,系统在2.5~2.8s期间受到0.5N·m的干扰力矩。系统仿真结果如图3~图6所示。

如图3所示,在换挡电机执行机构无负载的情况下,采用动态滑模控制器的直流电机系统响应速度最快,且和采用常规滑模控制器的系统一样,不会产生超调。而采用常规PID的直流电机系统为了达到较快的响应速度,不可避免地会出现超调现象。同样在图4中系统带载,且受到电机参数变化因素影响的情况下,采用常规PID控制器的系统响应速度明显变慢,而采用动态滑模控制器及常规滑模控制器的系统仍能保持原有的响应速度。为了证明动态滑模控制器的鲁棒性及抗干扰能力优于常规滑模控制器,在图5中系统受到方差为1的高斯白噪声干扰的情况下,当常规PID控制器及常规滑模控制器达到换挡位置后,电机角位移仍会由于噪声干扰而振荡,其振荡幅度分别为0.19rad、0.14rad,而动态滑模控制器的振荡幅度仅为0.06rad。如图5 所示,系统换挡结束后,在受到外界干扰力矩影响的情况下,常规PID控制器及常规滑模控制器所控制的直流电机在跟踪设定的角位移目标时,其跟踪误差分别为0.2rad、0.06rad,与之相对应的是动态滑模控制器的跟踪误差仅为0.03rad。通过仿真可知,本文使用的动态滑模控制器具有响应速度快、抗干扰能力强和鲁棒性好等优点,可以极大地提高控制系统的性能。

5 试验结果分析

为了进一步验证动态滑模控制器的有效性和正确性,基于dSPACE实时仿真系统的快速控制原型技术完成了AMT选换挡控制程序的开发[11],并进行了相应的台架试验。AMT选换挡控制系统快速原型架构如图7 所示,它主要由dSPACE、上位机、发动机、传感器、变速箱和执行机构组成。

在选换挡过程中,车辆达到设定的换挡点时,dSPACE发出控制信号使PWM驱动板通过改变直流电机电压的大小和方向来控制选换挡电机的运动速度及方向,电机会带动相应的执行机构完成选换挡操纵,同时集成在电机上的传感器将电机位置实时发送给dSPACE,从而实现选换挡电机的位置闭环控制。

试验模拟装备AMT的车辆在节气门开度为40%的情况下从静止状态开始加速的过程。在采用三种不同控制方法的情况下,图8、图9所示分别为1至2挡和2至3挡换挡过程中选换挡电机位置的变化情况。通过变速箱选换挡电机位置标定,换挡过程中电机的运动轨迹能够实现精确的控制[12],由于1至2挡换挡过程中选挡电机位置不变,故在1至2挡的换挡时序中只包括退挡和进挡两个过程,而2至3挡的换挡时序则包括退挡、选挡和进挡三个过程。

由图8和图9可知,常规PID控制在调节过程中出现了超调现象,这有可能会造成选换挡电机堵转,时间过长将导致电机过热甚至烧毁电机线圈。且常规PID控制的调整时间与上升时间相差不大,这就导致常规PID控制1至2挡的总换挡时间达到0.4s。同理,常规滑模控制方法在换挡调节过程中也存在一定的超调,不过其调整时间较短,1至2挡的总换挡时间为0.29s。与之相对应的动态滑模控制方法在调节过程中基本无超调,且响应速度也更快,换挡时间仅为0.19s。在2至3挡的换挡过程中,由于常规PID控制方法和常规滑模控制方法在退挡、选挡及进挡三个过程中都存在一定的超调,所以需要的调整时间相应也较长,这就导致常规PID及常规滑模控制的换挡总时间分别达到了0.6s、0.53s,而动态滑模控制方法由于在三个换挡过程中基本无超调,其换挡时间仅为0.38s。

采集台架运行过程中采用动态滑模控制器控制时不同挡位切换所需的换挡时间,在多次试验后分别对各个挡位切换所用的换挡时间取平均值,得出不同挡位切换时的换挡时间,见表2。

s

为了更好地体现动态滑模控制的响应速度快的特点,本文列出了文献[5]中采用最优控制算法的AMT换挡时间进行对标,见表3[5]。

s

比较表2和表3的数据可知,与采用最优控制算法相比,运用动态滑模控制算法的电动AMT换挡时间有明显缩短。1 挡升2 挡仅需0.19s,而采用最优控制的AMT选换挡系统需要0.42s;同理,在包含选挡过程的2挡升3挡的换挡过程中,采用动态滑模控制的电动AMT选换挡时间仅为0.38s,也要优于采用最优控制的0.66s。综合来看,动态滑模控制的响应时间相较于最优控制有较大的优势。

由于换挡过程中各个阶段受到的换挡阻力及影响因素不同,故换挡电机与选挡电机所需提供的转矩也不同[13],这就要求换挡控制系统对负载变化具有良好的鲁棒性及动态响应能力。同时,针对换挡时系统可能面对的外部干扰,也要求系统对外部扰动具有良好的抗干扰能力。经过对比可知,本文中的动态滑模控制器能在保证控制精度的同时,在这几方面的性能也要优于其他控制器,从而改善了AMT换挡控制系统相应的性能。

6 结语

新预算法学习心得体会 篇4

一、完善政府预算体系

在原预算法体系下,我国有相当一部分的政府收支活动没有纳入地方预算管理的范畴,比如第76条规定,预算外资金管理办法由国务院另行规定。预算外资金的存在致使政府预算只对预算内资金进行约束,预算外资金长期游离于预算监管之外。松江在财政管理过程中也产生了大量游离于政府预算体系的财政资金,如国库102账户、151账户、往来账户以及单位过渡户的资金等,截至年底,区级各部门过渡户资金为2748.68万元,其他账户资金为44352.09万元,经过清理后,实际停留在单位账户的资金为5908万元,这些预算外资金的存在,不仅增加了财政工作的复杂性,而且不利于发挥政府预算的作用,破坏了整体效率。

为此,新预算法重新界定了政府预算收支的定义,明确规定政府的全部收入和支出都应当纳入预算,不再有预算外这个概念。其中,第5条规定,预算包括一般公共预算、政府性基金预算、国有资本经营预算、社会保险基金预算。这就从法律上真正确立了四本预算的法定性,使预算编制的全口径有法可依。此外,第5条还强调了四本预算应当保持完整、独立,政府性基金预算、国有资本经营预算、社会保险基金预算应当与一般公共预算相衔接。可见,新预算法彻底颠覆了以往单一预算的概念,代之以全口径预算的理念,实现了预算体系的新跨越。

为了贯彻新预算法精神,松江区在推进全口径预算改革方面进行了积极探索。下一步,我区将按照新预算法的要求,切实加大工作力度:一方面进一步细化预算编制,提高预算科学性,并做好国库102账户、151账户及过渡户等资金的清理工作,逐步消除预算外资金,使政府预算真正做到不留死角,全面完整地反映政府收支情况;另一方面要建立起三本预算之间的合理联系,形成畅通的资金流动渠道,改善预算缺口与预算盈余并存的局面,增强政府调控能力,发挥预算资金的规模效应和集聚效应,切实提高预算效率。

二、硬化预算支出约束

尽管我区预算体系已基本形成,但在预算管理过程中仍存在年初预算不细、执行中追加支出频繁、追加程序不规范、支出标准体系不健全以及预算执行进度缓慢等问题。对此,新《预算法》强调:一是要求编实编细年初支出预算。一般公共预算支出,按功能分类要编列到项,按经济性质分类要编列到款。二是强化年初预算约束力。所有支出必须以经过批准的预算为依据,未列入预算的不得支出。三是严格限定预算调整。在预算执行中,各级政府一般不得出台新的增支、减收政策。必须作出的,要在向人大报送的预算调整方案中作出安排。以上几点为我区预算管理工作指明了前进的方向:一是要进一步强化预算执行管理。一方面严格执行批复的部门预算,并在预算草案中体现临时预算执行情况,另一方面加快部门预算执行进度,从源头上避免存量资金的产生,减少财政资金滞留。增强财政管理透明度,提高财政资金使用安全性、规范性、有效性。二是要进一步完善支出标准。基本支出要在定员定额标准体系基础上科学合理化,同时要加快推进对项目支出定额标准体系探索研究,充分发挥支出标准在预算编制和管理中对的基础支撑和源头控制作用。

三、完善转移支付制度

为进一步规范和完善转移支付制度,新预算法增加规定:财政转移支付应当规范、公平、公开,以均衡地区间基本财力、由下级政府统筹安排使用的一般性转移支付为主体。建立健全专项转移支付定期评估和退出机制。市场竞争机制能够有效调节的事项不得设立专项转移支付。除按照国务院规定应当由上下级政府共同承担的事项外,上级政府在安排专项转移支付时不得要求下级政府承担配套资金。上级政府应当提前下达转移支付预计数,地方各级政府应当将上级提前下达的预计数编入本级预算。这将有利于优化转移支付结构,提高转移支付资金分配的科学性、公平性和公开性,有利于减少“跑部钱进”现象和中央部门对地方事权的不适当干预,也有利于减少地区间财力差距、推进基本公共服务均等化、促进区域协调发展。

目前我区街镇接受资金的来源主要包括:财政一般转移支付、财政专项转移支付以及各区级部门直接拨付至街镇。而且,现在正处于由部门拨付向财政专项转移支付过渡的阶段。我区专项转移支付主要情况为:2014年专项转移支付执行数是2.28亿元,年预算数是5.48亿元。一般转移支付与专项转移支付的比例仍太低,因此,应当增加一般性转移支付规模和比例,逐步将一般性转移支付占比提高到60%以上。

四、全面推进预算公开

新预算法第32条、37条、46条等对预算细化问题做出明确规定,强调各级预算支出要按其功能和经济性质分类编制,报送各级人大审查和批准的预算草案应当细化到最末级;第75条规定决算草案应当与预算相对应;第14条对经本级人民代表大会或者会批准的预算、预算调整、决算、预算执行等情况公开的范围、主体、时限等提出明确具体的要求,对转移支付、政府债务、机关运行经费、政府采购等社会高度关注事项要求公开作出说明;第92条规定违反预算公开规范的法律责任。以上规定有利于确保人民群众知情权、参与权和监督权,提升财政管理水平,从源头上预防和治理腐败。

我区区级政府预决算公开体系不断丰富和完善,在全区范围制定了《松江区财政信息公开管理办法》(沪松府办25号)及《松江区2014年财政信息公开目录和工作要点》,规定了财政信息公开的原则及主题,细化了财政信息公开的内容。在同级政府及财政部门门户网站上设立专栏,向社会公开了公共财政收支预决算、政府性基金收支预决算以及区本级国有资本经营收支预决算。在人大会审议批准20个工作日后,财政预决算报告,公共财政收支、政府性基金收支以及国有资本经营等方面的预算、执行、决算情况向社会进行了公开。但新《预算法》的要求更进一步,公开时间大幅提前,公开的内容继续拓展,公开的科目更加详细,对照来看,我们仍有差距。因此,下一阶,我区将针对我们存在的问题及不足一一改进,一方面完善区级部门预决算的公开质量,另一方面稳步推进街镇的财政信息公开工作。

五、建立跨年度预算平衡机制

原预算法规定各级政府应当做到收支平衡,同时要求预算收入征收部门完成上缴任务。由于审批程序复杂、预算资金下达滞后、前期执行缓慢等原因,许多支出项目都集中在年末的一两个月内完成,“突击花钱”成为政府财政支出的常态。又由于时间仓促,很多项目都赶在短时间内完成,其应有流程和监督环节都流于形式,预算绩效更是无从谈起。在这种大背景下,松江区的财政支出也受此困扰,在一些刚性及人为因素的限制下,预算支出执行通常在前期较为缓慢,而预算法的硬性要求使得后期执行压力巨大。此外,匆忙的项目支出导致了财政资金的利用率不足,预算绩效更是明显不受重视。

为适应经济形势的新变化和财政宏观调控的新需求,新预算法第12条第2款明确规定,各级政府应当建立跨年度预算平衡机制。同时,第41条明确各级一般公共预算按照国务院的规定可以设置预算稳定调节基金,用于弥补以后年度预算资金的不足。以上规定为今后实行中期财政规划管理奠定了基础。目前,松江区财政局正在积极编制中期财政规划,致力于通过科学的分析与预测,强化其对年度预算的约束性,增强财政政策的前瞻性和可持续性。

跨年度预算平衡机制的建立是我国预算制度改革的重大突破,针对其在实行过程中面临的难题,我区可以从以下几个方面寻求突破:一是注重跨年度预算与年度预算、中期财政规划相结合,形成相互补充、相互促进的良性循环。二是建立健全预算稳定调节基金制度,明确预算稳定调节基金的主要用途和筹集方式,规范使用程序,强化监督机制,确立预算收入年度间以丰补欠的制度安排,从而为财政收支周期性平衡创造条件;三是推进权责发生制政府综合财务报告制度改革,进一步强化收支责任意识,完善收支信息披露,突出预算绩效管理,从而为跨年度预算提供详实的信息基础。

六、严格地方政府债务管理

原预算法第28条规定,除法律和国务院另有规定外,地方政府不得发行地方政府债券。实际上,我国的地方债由来已久,其发端于新中国成立之初,更是在金融危机之后进入鼎盛时期。据审计署公布的审计结果显示,全国地方债存量为10.72万亿元,为15.89万亿元,6月底该数字则达到17.89万亿元。松江区的债务清理甄别结果表明,截至2014年底,政府负有偿还责任的债务共计188.32亿元,其中一般债务93.98亿元,专项债务94.34亿元。地方债务规模的扩张以及管理模式的不完善将对地方财政的安全运行造成威胁,因此,改革地方政府债务管理势在必行。

新预算法规定,经国务院批准的省、自治区、直辖市的预算中必需的建设投资的部分资金,可以在国务院确定的限额内,通过发行地方政府债券举借债务的方式筹措。此外,新预算法还体现了“开前门、堵后门、筑围墙”的改革思路,在有限“开闸”地方发债的同时,对地方政府的举债主体、规模、方式等方面做出了诸多规定,以严格防范债务风险的扩张。从松江区2021年的债务情况来看,本年共取得上海市财政局转贷的32亿元地方政府债券资金,其中6亿元为新增债券,用于城市基础设施建设,26亿元为置换债券,用于置换高成本的存量债务,这有效减轻了本区政府的利息负担,优化了债务期限结构,降低了债务违约风险。

滑模学习算法 篇5

随着非线性、强耦合、多输入多输出机器人,数控机床,以及动力传动系统等精密机械系统对定位精度要求的不断提高,因摩擦的存在而引发的跟踪误差(特别是低速的情况下)、黏滑运动以及极限环振荡等非线性现象,对系统控制性能的影响越来越大。特别是对于一些重载的机器人[1],摩擦甚至造成了50%的误差。若负载、润滑条件以及环境条件改变,机器人系统中的摩擦也会发生相应的变化,即摩擦具有非线性、时变性、不确定性及复杂性。因此,对摩擦力进行辨识和补偿是一项不可缺少、重要和关键的研究任务。国内外众多学者以及技术人员采用了多种方法对机器人的摩擦进行补偿[2],若从控制策略角度来分类,主要有以下四种:①固定摩擦补偿技术;②基于部分摩擦特性的补偿技术;③自适应补偿方法;④不基于模型的补偿算法和神经模糊技术。

在处理动态摩擦这类具有不确定性、非线性的问题方面,RBF神经网络作为一种特殊的三层前馈神经网络,具有并行计算、分布式信息存储、容错能力强、自适应、学习收敛速度快等一系列优点,而模糊逻辑具有较强的定性知识表达能力和推理能力。因此,Kosko[3]综合两者长处,提出了基于结构等价型融合的模糊RBF神经网络系统,该系统的结构和权值都有一定的物理含义,在设计其结构时,可以根据问题的复杂程度及精度要求,并结合先验知识来构造合适的模糊神经网络模型,这样,网络的学习速度就会大大加快,并且避免了局部极值。

本文在遵循摩擦学的3个公理的前提下[4],结合机器人的动力学模型及7种重要典型的动态摩擦模型的特性[5,6,7,8],分析、总结了各种不同的摩擦补偿方法或技术的优缺点,提出了一种基于动态摩擦模型——LuGre模型的模糊RBF神经网络分块补偿的机器人数字鲁棒滑模控制算法,对机器人系统中的摩擦不确定项进行有效的估计、逼近、补偿,从而实现机器人系统高精度、高可靠、长寿命、大转矩、低能耗的目标。

1 带摩擦补偿的机械臂动力学模型

对于一个n自由度关节机器人,基于拉格朗日运动学建立的机器人动态方程为

D(q)q¨+C(q,q˙)q˙+G(q)+F(q˙)+τd=τ (1)

qRnq˙Rnq¨RnτRn×1D(q)Rn×nC(q,q˙)Rn×nG(q)Rn×1F(q˙)Rn×1

式中,qq˙q¨分别为机器人各关节的位置、速度和加速度;τ为控制力矩;D(q)为对称正定的惯性矩阵;C(q,q˙)为哥氏力和向心力矩阵;G(q)为重力矩阵;F(q˙)为动态摩擦力矩;τd为外部干扰。

x1=q,x2=q˙,则式(1)可转化为以下动力学方程:

x˙1=x2x2(k+1)=D-1(x1(k))(τ(k)-C(x1,x2)x2(k)-G(x1(k))-F(x2(k))-τd(k))}

(2)

在式(1)中,F为非线性动态摩擦补偿项。LuGre模型是一个比较完善的摩擦模型,能够准确地预测摩擦的各种重要特性,且对摩擦环节的动态补偿效果较好,已有学者用实验方法辨识了LuGre模型的参数[9]。但是,该模型动态参数的辨识迄今仍是一个难题。因此,本文采用模糊RBF神经网络来估计、逼近LuGre模型的动态参数。LuGre摩擦模型是基于鬃毛的平均变形来建模的。

鬃毛的平均变形用状态变量zi(关节i=1,2,…,n)表示[10],按照下式来建模:

Δzi(k)=x2(k)-σ0i|x2(k)|·(g(x2(k)))-1zi(k) (3)

式中,σ0i为鬃毛的刚度。

摩擦力由鬃毛的挠曲产生,可以描述为

Fi=σ0izi(k)+σ1izi(k+1)+σ2ix2(k) (4)

其中,σ1i是微观阻尼系数,σ2i是黏性摩擦因数。

函数g(x2)描述了Stribeck效应:

g(x2(k))=Fci+(Fsi-Fci)exp(-(x2(k)/q˙s)2)(5)

式中,Fc i为关节库仑摩擦力矩;Fsi为关节黏性摩擦力矩;q˙s为关节的虚拟速度。

根据式(3)~式(5),可以得出:

F(k)=σ0izi(k)-σ3ihi(x2(k))zi(k)+σ4ix2(k) (6)

σ3i=σ0iσ1iσ4i=σ1i+σ2i

hi(x2(k))=|x2(k)|(g(x2(k)))-1

2 模糊RBF神经网络数字鲁棒滑模控制

2.1 控制结构

本文所用的机器人数字控制系统框架如图1所示,采用三个RBF网络(图1中只画了一个网络)分别实现对F0iF3iF4i建模、估计[11],输入语言变量为z(q˙)h(q˙)z(q˙)q˙(k),FNN系统的输出为F,根据功能等价性,也可以把隶属函数层和T-范数层合并成一层,称为模糊化层。整个控制器输出的数字信号经过D/A转换成模拟信号(如电压或电流),用于控制机械臂各驱动关节,以一定的速度、加速度运动至一定位置,再经过A/D转换,与给定的位置、速度比较,得到相应关节的位置误差、速度误差,反馈到由滑模控制器、模糊RBF神经网络、鲁棒控制器构成的数字控制器,形成位置闭环、速度闭环,实现机器人的高精度、高可靠智能控制。则F0iF3iF4i的神经网络逼近、估计值为

F^0i(z)=[W^0i(z(q˙(k)))]ΤΞ0i(z(q˙(k)))F^3i(hz)=[W^3i(h(q˙(k))z(q˙(k)))]ΤΞ3i(h(q˙(k))z(q˙(k)))F^4i(q˙)=[W^4i(q˙(k))]ΤΞ4i(q˙(k))}

(7)

其中,Ξ(q˙)为权函数,W^0iW^3iW^4i分别为实际权值W0iW3iW4i的估计权值,摩擦项的估计F^=F^0i-F^3i+F^4i

2.2 控制律的设计

设位置指令为x1d(k),x1(k)为实际的位置,则跟踪误差定义为

e(k)=x1(k)-x1d(k) (8)

滑模函数设计为

si(k)=ei(k+1)+Λei(k) (9)

其中,Λ为正定阵。

与滑模面函数相关的设定速度为

x2si(k)=x2di(k)-Λei(k) (10)

式中,x2di(k)为机器人各关节的给定速度;sidi对应不同的机器人关节。

控制律设计为

τ(k)=D(x1)x2si(k+1)+C(x1,x2)x2si(k)+G(x1)+F^(x2)-ΚDsi(k)-Κssat(si)(11)

其中,KD=diag(Ki),Ki>0,克服模糊神经网络建模误差的鲁棒项为Kssat(si),Ks=diag(Ks i),Ks i>0,i=1,2,…,n。饱和函数设计为

sat(si)={1siδsi/δ|si|δ-1si-δδ0

(12)

式中,si为每个时刻滑模面函数的值。

自适应律设计为

ΔW^0i(z)=-Γ0i[ξ0i(z(k))]si(k)ΔW^3i(hz)=Γ3i[ξ3i(h(x2(k))z(k))]si(k)ΔW^4i(x2)=-Γ4i[ξ4i(x2(k))]si(k)}

(13)

其中,Γ0iΓ3iΓ4i为对称正定矩阵。

2.3 稳定性分析

定义Lyapunov函数为

V(k)=[s(k)]Τs(k)+i=1n[W˜0i(k)]ΤW˜0i(k)+i=1n[W˜3i(k)]ΤW˜3i(k)+i=1n[W˜4i(k)]ΤW˜4i(k)(14)

W˜0i=W0i-W^0i,W˜3i=W3i-W^3i,W˜4i=W4i-W^4i

根据D(k+1)-2C(k)的斜对称特性,并将式(1)、式(7)~式(13)代入式(14)得

ΔV=[s(k+1)]Τs(k+1)-[s(k)]Τs(k)+i=1n[W˜0i(k+1)]ΤW˜0i(k+1)+i=1n[W˜3i(k+1)]ΤW˜3i(k+1)+i=1n[W˜4i(k+1)]ΤW˜4i(k+1)-i=1n[W˜0i(k)]ΤW˜0i(k)-i=1n[W˜3i(k)]ΤW˜3i(k)-i=1n[W˜4i(k)]ΤW˜4i(k)0(15)

3 仿真结果及分析

两关节机器人系统(图2)动力学模型参照式(1),其中,n=2,忽略外部干扰,机器人各关节低速的位置指令分别为qd1=-0.1cos t,qd2=0.1sin t,高速时为qd1=-cos t,qd2=sin t;系统的初始条件:低速时为qd(0)=[-0.1 0]或[0 0],高速时为qd(0)=[-1 0],其他条件一样,z(0)=q˙d(0)=[00],控制器参数为Λ=10I,KD=20I,W=2I,Γ0i=Γ3i=Γ4i=0.000 05I,摩擦补偿F(q˙)采用式(6),其中,神经网络高斯基函数权值W(0)=0,中心ci=0.6rand(1,5),σi=150×[1],重力加速度g取为9.8m/s2,机器人参数及其摩擦力参数见表1,机器人的动力学模型如下:

Μ(q)=[m11m12m21m22]

(16)

m11=(m1+m2)L21+m2L22+2m2L1L2cosq2

m12=m2L22+m2L1L2cosq2

m21=m2L22+m2L1L2cosq2m22=m2L22

C(q,q˙)=[-m2L1L2q˙2sinq2-m2L1L2(q˙1+q˙2)sinq2m2L1L2q˙1sinq20]

(17)

G(q)=[(m1+m2)gL1cosq2+m2gL2cos(q1+q2)m2gL2cos(q1+q2)]

(18)

图3~图8反映了两关节机器人的轨迹跟踪、摩擦力矩、控制力矩随时间的变化关系及摩擦力矩与速度的变化关系。由图3、图4对应的数据可以得出,两关节机器人的轨迹跟踪精度高,最大位置误差为1×10-3rad,且动态摩擦补偿的效果也很好。由图5、图6可以看出,是否对机器人系统建模的不确定性进行动态LuGre摩擦补偿,对机器人控制力矩的稳定性影响非常大:特别是在速度换向(如2.446s)时,有动态摩擦补偿时,机器人连杆1控制力矩为28.0046N·m;无摩擦补偿时,连杆1控制力矩为32.0270N·m,控制力矩产生跳跃式增大。而在7.3750s时则产生了跳跃式减小,这对机器人高精度、高可靠的操作来说都是要极力避免或不允许的。因此,非常有必要对机器人中的摩擦力矩进行补偿。

图7、图8是低速运行时机器人中摩擦力矩随速度变化的相图,其形状类似菱形。由初始状态O→平衡状态时,其启动摩擦力矩存在一定程度的波动或者速度超调,即机器人的初始位置姿态对机器人的稳定性影响非常大。而达到稳态时,幅值达到最大,为24.1199N·m,且随着时间的推移,摩擦力矩与角速度x2之间存在菱形稳定吸引子。此时,在图7中,连杆1相图曲线由DA时,速度逐渐增大,而摩擦力矩幅值由正向最大→0→负向最大,摩擦力矩表现为负斜率现象,即Stribeck现象。同样地,该规律也存在于机器人连杆2。

图9是高速运行时,机器人中摩擦力矩随速度变化的相图,除了存在Stribeck现象外,当连杆1角速度x2由0.2805rad/s→1.0018rad/s(AB)或者由1.0018rad/s→-0.0545rad/s(BC)时,摩擦力矩与速度x2成比例增大或者减少,且力矩较稳定,因为此时z1为一常量,则dz1dt=0,式(5)中的g(x2)为一常量,式(6)中F的简化为关于x2的一阶线性函数,此时主要体现为黏性摩擦。同样地,相图中DEF的摩擦力矩与速度也成线性关系。该规律也存在于机器人连杆2。

4 结论

(1)本文提出了用模糊RBF神经网络分块补偿机器人中的动态摩擦不确定项及数字滑模机器人鲁棒控制算法,分析了控制器的Lyapunov稳定性,利用模糊神经网络在线自适应训练LuGre模型中的各摩擦分项,从而实现了机器人高精度的轨迹跟踪、高品质的动态响应。

(2)发现了在该两自由度机器人低速运动时,其关节中存在着Stribeck效应、类菱形吸引子等非线性动力学现象;高速运动时,其黏性摩擦为主。不合适的初始条件会使机器人的启动摩擦力矩出现较大振荡。

参考文献

[1]Kermani M,Wong M,Patel R,et al.Friction Com-pensation in Low and High-Reversal-VelocityManipulators[C]//Proc.ICRA’04,2004IEEE Int.Conf.on Robotics and Automation.New Orleans,2004:4320-4325.

[2]Basilio Bona,Marina Indri.Friction Compensation inRobotics:an Overview[C]//Proceedings of the 44thIEEE Conference on Decision and Control,and theEuropean Control Conference 2005.Seville,Spain,2005:4360-4367.

[3]Kosko B.Neural Networks and Fuzzy System[M].New Jersey:Prentice-Hall,1992.

[4]谢友柏.摩擦学的三个公理[J].摩擦学学报,2001,21(3):161-166.

[5]de Wit C C,Olsson H,Astrom K J,et al.A NewModel for Control of Systems with Friction[J].IEEE Transactions on Automatic Control,1995,40(3):419-425.

[6]Bliman P A.Mathematical Study of the Dahl’s Fric-tion Model[J].Eur.J.Mech.,1992,11(6):835-848.

[7]Armstrong B,Dupont P,Canudas de Wit C.A Sur-vey of Models,Analysis Tools and CompensationMethods for the Control of Machines with Friction[J].Automatica,1994,30(7):1038-1183.

[8]Dupont P,Armstrong B,Hayward V.Elasto-Plas-tic Friction Model:Contact Compliance and Stiction[C]//Proceedings of ACC 2000.Chicago,2000:1072-1077.

[9]Kermani M R,Patel R V,Moallem M.Friction Iden-tification and Compensation in Robotic Manipulators[J].IEEE Transactions on Instrumentation andMeasurement,2007,56(6):2346-2353.

[10]Haessig D A,Fliedland B.On the Modeling andSimulation of Friction[J].ASME Journal of Dy-namic Systems Measurement and Control,1991,113(3):354-362.

上一篇:思想道德素养下一篇:小麦秸秆还田