迭代控制

2025-01-09

迭代控制(共9篇)

迭代控制 篇1

迭代学习控制是一种先进的控制方法,适用于诸如工业机器人那样的具有重复运动性质的被控系统,它的目标是实现有限区间上的完全跟踪任务。1984年,日本学者Arimoto等人针对机器人系统的特点,模拟人类学习技能过程,开创性地提出了迭代学习控制理论,并构造了D型迭代学习算法[1]。随后的学者们相继研究了P型、PD型、PI型及PID型学习算法(统称为PID型学习算法)。除传统的PID型习算法外,不少学者提出了带遗忘因子的PID型学习算法[2,3,4],一定程度上加快了学习的收敛速度,吴东南等人应用历史数据首次提出了高阶学习算法[5],Sugie等人提出了滤波器型学习算法[6],Jayati Ghosh等人给出了基于输入输出模型伪逆的迭代学习新算法[7]。近年来,谢胜利等人首次引入了向量图分析给出了新的学习算法,提高了收敛速度和学习精度[8,9]。在学习过程中,学习控制器由于硬件(如A/D和D/A转换)、软件(如计算截断误差)等原因,存在着一定的控制器参数变化,出现不确定性,这种变化将导致闭环系统的性能下降,甚至稳定性被破坏,不能很好的跟踪目标,具有较大的保守性。然而对迭代学习控制器中含有的不确定性还很少有人研究。

非脆弱控制是处理控制器中含有不确定性的有效方法,已成为控制界研究热点,目前研究主要集中在鲁棒控制、切换系统、时滞系统等方面[10,11,12,13,14,15]。对迭代学习的非脆弱控制研究还很少见。杨胜跃等人[16]从学习的整个过程来考虑迭代学习控制的最优化问题,即以整个过程输出误差的最小化为目标,以控制增量的二次型作为罚函数,得到一类迭代域内二次性能函数,基于线性矩阵不等式(LMI)的方法,讨论了不确定离散线性系统的保性能迭代学习算法及其优化方法。文中基于文献[16]的迭代域内性能函数,针对离散线性系统给出了一种非脆弱保性能迭代学习控制及其优化方法,保证了学习的收敛性,具有较好的跟踪效果和较小的保守性。

1 问题描述

考虑线性时变离散系统

式中,状态变量x(i)∈RN,输出变量y(i)∈Rm,输入变量u(i)∈Rr,A(i),B(i),C(i),D(i)为相应维数的系数矩阵。

由式(1)导出迭代域内误差模型

ek+1(0)=ek(0)+C(0)[xk+1(0)-xk(0)]+D(0)u˜k(0)(2a)ek+1(i)=ek(i)+C(i)Φ(i-1,0)[xk+1(0)-xk(0)]+C

(i)j=0i-1Ψ(i-1,j)u˜k(j)+D(i)u˜k(i),i1(2b)

将误差模型式(2)表示成批量形式

Ek+1=Ek+GU˜k+Λwk (3)

式中Ek=[ekΤ(0),ekΤ(1),,ekΤ(Ν)],U˜k=[u˜kΤ(0),u˜kΤ(1),,u˜kΤ(Ν)]分别表示批量形式的输出误差及控制增量,wk=xk+1(0)-xk(0)表示相邻两次迭代初始定位差。

Λ=[CT(0),ΦT(0,0),CT(1),ΦT(1,0)CT(2),…,ΦT(N-1,0)CT(N)]T

下面定义一个迭代域内二次性能函数为

J=k=1[EkΤQEk+U˜kΤRU˜k] (5)

其中,Q=blockdiag(Q1,Q1,…,Q1),R=blockdiag(R1,R1,…R1)分别为N+1项Q1和R1组成的分块对角矩阵,Q1和R1为正定矩阵,因此QR也是正定矩阵。

为推导文中的主要结果,首先给出如下引理。

引理1[17] 给定适当维数的矩阵M,H,E,FX,其中X>0,FTFI,则

(1) 对于任意ε>0,有

HFE+ETFTHT≤εHHT+ε-1ETE

(2) 对于任意ε>0,且X-εHHT>0,有

(M+HFE)TX-1(M+HFE)≤MT(X-εHHT)-1M+ε-1ETE

2 非脆弱保性能迭代学习算法的设计及其优化

由于迭代学习控制一般假定初始定位误差wk=0,因此式(3)可以写为

Ek+1=Ek+GU˜k (6)

对于式(6)设计非脆弱状态反馈控制器如下

U˜k=(Κ+ΔΚ)Ek (7)

其中K称为控制器增益,ΔK称为控制器参数变化,其参数变化具有以下两种类型:

类型1:ΔK不依赖于控制器增益K(加法不确定性),即ΔK=L1F1M1;

类型2:ΔK依赖于控制器增益K(乘法不确定性),即ΔK=L2F2M2K

其中L1,L2,M1,M2为具有适当维数的已知常数矩阵,F1和F2为未知矩阵,且F1ΤF1≤I,F2ΤF2≤I

将非脆弱控制器式(7)带入式(6),导出的闭环系统为

Ek+1=(I+GK+GΔK)Ek (8)

定理1 对于式(6)和性能函数式(5),若存在矩阵K和正定矩阵P,使得对所有非零的Ek满足

ETk[(I+GK+GΔK)TP(I+GK+GΔK)-P+Q+(KK)TR(KK)]Ek<0 (9)

U˜k=(Κ+ΔΚ)Ek为式(6)的一个非脆弱保性能迭代学习控制,并且J<J*,其中性能上界J*=E1ΤPE1,E1表示第1次迭代时的输出误差。

证明:选取适当Lyapunov函数Vk=ETkPEk,则

Vk+1-Vk=Ek+1ΤPEk+1-ETkPEk=ETk[(I+GK+GΔK)TP(I+GK+GΔK)-P]Ek<-ETk[Q+(KK)TR(KK)]Ek

因此式(7)在迭代域内是二次稳定的

-E1ΤPE1=k=1(Ek+1ΤPEk+1-ETkPEk)<-k=1ETk[Q+(KK)TR(KK)]Ek=-k=1[ETkQEk+ETk(KK)TR(KK)Ek]=-k=1[EkΤQEk+U˜kΤRU˜k]=-J

J<ETkPE1,证毕。

有了如上定理,非脆弱迭代学习控制可由定理2给出。

定理2 式(6)在类型1非脆弱控制器作用时,对于给定的ε0>0,如果存在ε1>0及矩阵W和正定矩阵X,使得以下LMIs成立

(2)ε2L1L1Τ-R-1<0 (11)

那么U˜k=(Κ+ΔΚ)Ek是式(6)基于类型1的非脆弱保性能迭代学习控制,此时控制器增益K=WX-1。

证明:根据定理1,可以得出

[(I+GK+GΔK)TP(I+GK+GΔK)-P+Q+(KK)TR(KK)]<0 (12)

由矩阵Schur补[19]的性质,式(12)等价于

式(13),可以改写为

[-Ρ-1(Ι+GΚ)(Ι+GΚ)Τ-Ρ+Q+ΚΤΡΚ]+[0GΔΚ0ΚΤRΔΚ]+[00(GΔΚ)Τ(ΔΚ)ΤRΔΚ]+[000(ΔΚ)ΤRΔΚ]0(14)

现在把类型1的ΔK=L1F1M1代入式(14)得到

[-Ρ-1(Ι+GΚ)(Ι+GΚ)Τ-Ρ+Q+ΚΤRΚ]+[GL1ΚΤRL1]F1[0Μ1]+[0Μ1]ΤF1Τ+[GL1ΚΤRL1]+[000(L1F1Μ1)ΤRL1F1Μ1]0(15)

根据引理1和F1ΤF1≤I,式(15)成立的充分条件是下面的式(16)成立,即存在ε1>0和ε2>0,使得

整理得到下式

再由矩阵Schur补的性质,式(17)等价为

将式(18)左乘以和右乘以diag(I,P-1,I,I,I,I,I),可以得到

X=P-1,K=WX-1,由式(19),从而得到了式(10),证毕。

定理3 式(6)在类型2非脆弱控制器作用时,对于给定的ε1>0,如果存在ε2>0及矩阵W和正定矩阵X,使得以下LMIs成立

(2)ε2L2L2Τ-R-1<0 (21)

那么称U˜k=(Κ+ΔΚ)Ek是式(6)基于类型2的非脆弱保性能迭代学习控制,此时控制器增益K=WX-1。

证明:与定理2完全类似。

在定理2和定理3中,对于已经给定的ε1,非脆弱保性能迭代学习控制不具有唯一性,如下定理给出其最优化设计方法。

定理4 对于系统(6)和定理2或定理3已经给定的ε1,如果以下优化问题minε2,W,Xtrace(Ρ),约束条件式(10)或式(19)成立,且ε2>0

存在一个最优解(ε˜2,W˜,X˜),那么U˜k=(W˜X˜-1+ΔΚ)Ek就是式(6)基于性能函数式(5)的最优非脆弱保性能迭代学习控制。

证明:根据定理1,J<E1ΤPE1,在统计学中,假设E1是零均值随机向量,并且数学期望E{E1ET1}=I,因此,性能函数的数学期望E(J)<E{E1ΤPE1}=trace(P)。所以如果存在一个最优解(ε˜1,W˜,X˜),就称U˜k=(W˜X˜-1+ΔΚ)Ek为就是式(6)基于性能函数式(5)的在统计学上的最优非脆弱保性能迭代学习控制。

3 仿真举例

为了说明以上结果的有效性,不妨给定ε1=1考虑下面二阶系统

{x(i+1)=Ax(i)+Bu(i)y(i)=Cx(i)+Du(i),i[0,1,2,,Ν]

其中。系统初始状态x(0)=[0.2 0.1]T,期望输出,yd(i)=[i2/100-i+0.2 i2/500-i+0.1]T,L1=L2=0.000 3I,M1=M2=0.000 2I,Q=I,R=3I,F1=F2=0.003I,X有形如δI的形式,其中δ>0,I为42阶单位阵。

(1) 对类型1的非脆弱控制,根据定理4,应用LMI工具箱中的mincx来进行求解,得到ε˜2=2.8153×10-4,δ˜=0.1591,从而确定出最优非脆弱保性能迭代学习控制。此时,性能上界J*=2.920 9×104。计算第k次的累加性能函数Jk=l=1k[ElΤQEl+U˜lΤRU˜l]与输出误差平方和ETkEk,可以得到,如图1和图2所示。从图1中可以看到,在第8次迭代以后,JkJ*已经达到非常接近的理想效果,这说明了算法的有效性。

(2) 对类型2的非脆弱控制,根据定理4,应用LMI工具箱中的来进行求解。得到ε˜2=2.4158×10-4,δ˜=0.1591,从而确定出最优非脆弱保性能迭代学习控制。此时,性能上界J*=2.920 8×104。 计算第k次的累加性能函数Jk=l=1k[ElΤQEl+U˜lΤRU˜l]和输出误差平方和ETkEk,可以得到,如图3和图4所示。从图3可以看出,在第8次迭代以后,JkJ*已经达到非常接近的理想效果,这说明了算法的有效性。

4 结束语

文中研究了基于新的性能函数非脆弱保性能迭代学习控制器的设计与优化问题。针对离散线性系统,根据迭代域内性能函数,利用线性矩阵不等式方法,对控制器的加法和乘法两种不确定性,给出了非脆弱保性能迭代学习算法控制器的设计方法及其优化方法。仿真实验说明了结果的有效性。

迭代控制 篇2

汉语词典对“迭代”的解释为:更相代替;轮换。维基百科的定义为:在RUP(统一软件过程)中,迭代被定义为,迭代包括产生产品发布(稳定、可执行的产品版本)的全部开发活动和使用该发布必需的所有其他外围元素。在百度百科的描述中,迭代法也称辗转法,是一种不断用变量的旧值递推新值的过程,相对应的是瀑布式或直接法(一次解法),即一次性解决问题。

在人类实践活动中,源自计算机软件领域的迭代思想已经由一种算法逐步升级发展为一种方法、理念和思维模式。随着知识服务在情报工作中的快速推进,知识服务产品开发与服务活动正在逐步步入规范化、工程化、工艺化的轨道。在知识服务产品化活动中引入迭代思维,可以有效提高产品质量、开发效率和服务效果,增强开发活动的针对性、规范性、科学性和创新性。

迭代控制 篇3

数控机床正在向精密、高速和复合化的方向发展。轮廓精度和位置跟踪能力已成为多轴进给系统的两个重要指标[1]。传统数控机床的直线运动是由电动机的旋转运动通过机械设备转化而来, 然而由于机械设备在传动过程中不可避免的会产生摩擦和弹性形变等不利因素, 因此, 直线电机被应用到数控机床中[2]。但是, 由于直线电机是一个多变量和时变的非线性系统, 传统的PID控制器已经很难实现精确控制[3]。虽然自适应控制、鲁棒控制、神经网络控制和滑模控制等方法可以获得较好的输出效果, 但是它们都要求有精确的模型对象, 当模型不准确, 或者参数发生变化时, 就无法实现精确的位置跟踪[4~9]。而迭代学习控制器不仅不要求有精确的被控对象模型, 而且在模型参数变化时, 通过学习, 仍然可以实现高精度位置跟踪, 文献[10]实现了迭代学习控制直线电机的高精度位置跟踪。文献[11]在XY平台各轴上实现了迭代学习控制的应用, 但是没有考虑两轴的不匹配问题。

针对系统存在的负载扰动、XY轴动态响应不一致, 本文采用基于实时轮廓误差模型与迭代学习控制相结合的控制策略对XY平台进行轮廓和位置控制。为了提高系统响应速度, 使系统具有鲁棒性, 单轴采用IP与ILC控制器相结合的方法。现有的交叉耦合控制器和基于局部任务坐标系的轮廓运动控制器等都利用各轴的位置误差来估计轮廓误差, 这些方法成立的一个前提是位置误差远小于期望轮廓的曲率半径[12~14], 而在迭代学习初期, 各轴位置误差都比较大, 用轮廓误差来修正控制信号已经没有意义, 因此, 本文提出基于混合误差的迭代学习控制, 在迭代初期只用位置误差修正控制信号, 而当位置误差减小到一定程度后, 再用轮廓误差修正控制信号, 最终使系统达到轮廓加工的高精度要求。

1 双轴平台的实时轮廓误差模型

对于直线电机驱动XY平台, 由两台永磁直线同步电动机直接驱动两轴相互垂直的XY平台。其机械运动方程为:

其中, x (t) 为动子的位移, iq为动子q轴电流, Kf为推力系数, Fe为电磁推力, M为动子及所带负载的总质量, B为粘滞摩擦系数, F为外部扰动。

在连续轨迹控制系统中, XY双轴平台系统不仅对单个轴的运动速度和精度控制有严格要求, 而且在双轴联动时, 还要求各移动轴有很好的动态配合, 因此, 系统的单轴位置误差与轮廓误差对轮廓加工精度有较大的影响。而对于自由形态的跟踪任务中, 轮廓误差模型的精度将直接影响轮廓加工的性能。综上, 建立实时轮廓误差模型如图1所示。

其中, R1为指令路径, P1为实际路径, R1 (t) 为指令位置点, P1 (t) 为实际位置点, 而R2 (t) 是指令路径上距离P1 (t) 最近的一个点, L为当前跟踪误差Ep在点P1 (t) 处的切向投影, R2 (t) 点与R1 (t) 点的长度约等于L, 而轮廓误差定义为实际位置与给定指令位置的最短距离, 即为E'c, 因此, 自由形态轨迹跟踪任务中的轮廓误差可以利用P1 (t) 与R2 (t) 之间的距离来计算, 即:

其中, Ex与Ey分别为系统跟踪误差Ep在XY轴的分量, j为通过R2 (t) 与R1 (t) 的直线与X轴的夹角为:

其中, R2x (t) 和R2y (t) 分别为R2 (t) 在XY轴上的分量, R1x (t) 和R1y (t) 分别为R1 (t) 在XY轴的分量, R2 (t) 可计算为:

式中, V1x (t) , V1y (t) 分别为R1 (t) 点在XY轴的切向分量速度, V2x (t) , V2y (t) 分别为R2 (t) 点在XY轴的切向分量速度, Vx (t) 和Vy (t) 分别为系统X轴和Y轴的进给速度, 计算为:

通常平台系统的进给速度并不是常值, 所以, V2x (t) , V2y (t) 的值不能准确求出。那么假设R2 (t) 与P1 (t) 有相同的切向速度, 那么上述方程可以重新给出:

综上, 将式 (4) 、式 (5) 、式 (8) 和式 (9) 带入到式 (3) 中即为轮廓误差的数学模型。

2 单轴控制器设计

2.1 位置跟踪迭代学习控制器的设计

图2为XY平台系统单轴位置跟踪迭代学习控制框图。其中, Φ为迭代学习控制器学习增益, yr为y轴的期望位置, yj+1为系统进行第j+1次迭代时的位置输出, P为被控对象, uj和uj+1分别为第j次和第j+1迭代的控制信号。第j次的控制信号uj存到存储器里, 并在第j+1次迭代时, 构造出新的控制信号uj+1。系统的位置误差被ILC控制器处理后, 得到的新控制信号, 下一次迭代时, 再反馈给系统, 通过不断的学习, 位置误差得到不断的减小。

定义位置跟踪迭代学习的学习律为:

其中, f (z) 为学习增益, 为了突出系统的快速响应能力, 本文采用PD型闭环迭代学习控制律, φ (z) 为:

这里kp、kd和Ts分别是比例增益、微分增益和采样周期。

误差ej (10) 1定义为:

将跟踪误差和控制信号动态方程改写为:

由压缩原理得出, 系统收敛的条件为:

2.2 IP控制器设计

迭代学习控制器有一定的滞后性, 因此, 本文在XY平台的单轴位置控制器采用带速度前馈的IP控制器结构来提高系统的响应速度, 增强系统的抗扰动能力, 保证闭环系统具有较强的鲁棒性。设计单轴控制器如图3所示。

由图3可知速度环的传递函数为:

由式 (16) 可知, 增大ki可提高系统的响应速度, 由式 (17) 可以看出, 增大ki相当于增强系统抗扰动能力。为补偿时间延时对XY平台系统跟踪精度的影响, 加入速度前馈控制器降低系统的位置误差, 保证了系统响应的快速特性。

未加入速度前馈时, 单轴的传递函数为:

加入速度前馈后的传递函数为:

如式 (18) 和式 (19) , 加入速度前馈后, 系统增加了一个零点, 从而增加了系统的频宽, 提高了系统的响应速度。

3 轮廓控制器设计

轮廓误差迭代学习控制就是将迭代学习控制应用到轮廓误差模型中, 使系统在前一次的迭代中学习纠正系统中存在的负载扰动以及各轴响应速度不一致等各种不确定性。图4为轮廓误差迭代学习控制器。其中, ux, j+1、uy, j+1、ux, j和uy, j分别为X、Y轴在第j+1次和第j次迭代时的控制信号;xj+1、yj+1分别为X、Y轴在第j次迭代时的位置输出;Exc、Eyc分别为轮廓误差在X轴和Y轴的分量, 可以由式 (3) 、式 (4) 、式 (5) 、式 (8) 和式 (9) 得到。轮廓误差的学习律为:

由式 (21) 可以看出, 前一次迭代的控制信息和当次迭代的轮廓误差用来更新系统的控制信号,

式中:

如图4所示为直线电机XY平台的系统框图。

图中, k1、k2分别为混合误差迭代系统的转换开关;因此, 将轮廓-位置误差迭代学习律改写为如下形式:

式中wc、wt分别为开关k1、k2的转换因子, 其分别代表轮廓误差转换因子和位置误差转换因子, 其值可选为0或1。当转换开关k1闭合, k2断开, 即wc=0, wt=1时, 用各轴位置误差更新控制信号;当转换开关k2闭合, k1断开, 即wc=0, wt=1时, 则用轮廓误差更新控制信号。本文用每次迭代的位置误差来判断用哪种误差更新控制信号, 当位置误差小于10μm时用轮廓误差更新控制信号, 反之用位置误差更新控制信号。

4 仿真与分析

本文仿真采用日本Yokogawa LM110系列直线电机驱动XY平台进行仿真研究, 其参数分别为M1=4.4kg, M2=1.4kg, Kf1=10.9794N/A, Kf2=8.526N/A, B1=244.3192Ns/m, B2=82.0176Ns/m。指令路径为长轴长为a=0.05, 短轴长为b=0.04的椭圆形, 即两轴输入指令为

前馈控制器系数kv1、kv2为1;X轴的IP控制器的积分、比例增益分别为125、20.523, 迭代学习控制学习增益Kp、Kd分别为30.21、9.32;Y轴的IP控制器的积分、比例增益分别为100、39.354, 迭代学习控制学习增益Kp、Kd分别为50.698、10.324。为了验证系统的抗干扰能力, 在t=2.5s时突加50N的干扰力, 采样时间设为0.001s。通过Matlab7.10进行仿真, 得到仿真曲线如下。

图5为外部扰动和系统不确定性均存在时, XY平台的期望输入与实际输出轨迹曲线, 可以看出, 在本文提出的控制策略作用下, 指令轨迹与实际轨迹基本重合。图6为X、Y轴的在迭代轴上的位置误差曲线, 随着迭代次数的增加, 迭代学习控制器不断修正控制信号, 实际输出位置不断接近期望位置, 在迭代到第九次的时候, 位置误差达到稳定状态。图7为外加扰动作用, 跟踪各轴位置误差和混合误差情况下, XY平台迭代15次后的轮廓误差曲线, 可以看出, 无论在有无扰动情况下, 跟踪混合误差时的轮廓误差均小于跟踪位置误差情况下的轮廓误差, 跟踪混合误差时, 轮廓精度有明显提高。

5 结论

本文采用适用多轴轮廓控制的轮廓误差计算法则计算轮廓误差, 对XY平台系统进行控制。通过在单轴上结合IP控制器与跟踪位置误差迭代学习控制器有效地抑制了负载扰动对系统的影响, 保证了系统的鲁棒性, 速度前馈控制提高了响应速度, 提高了系统的跟踪性能。轮廓控制采用基于实时轮廓误差模型的混合误差迭代学习控制器, 削弱了由于双轴速度不匹配对轮廓精度的影响。仿真结果表明所设计的控制系统有效地提高了XY平台的轮廓加工精度。

摘要:永磁直线同步电动机直接驱动XY平台系统时, 负载扰动及各轴动态响应速度不同等不确定性因素对轮廓加工精度有很大影响, 本文提出一种将实时轮廓误差模型与混合误差迭代学习控制器相结合的控制策略。在单轴上, 基于IP控制器的位置跟踪迭代学习控制器可以有效地抑制负载扰动的影响, 保证了系统的鲁棒性, 但是并不能有效地改善由于系统各轴动态响应速度不同对轮廓精度的影响, 为此, 利用实时轮廓误差模型, 设计混合误差迭代学习控制器来使轮廓误差趋近于零。仿真结果表明, 该方案能够有效地提高系统的轮廓精度和鲁棒性能, 并且控制器结构简单。

顺学而变 迭代创新[定稿] 篇4

迭代创新

迭代思维,是移动互联网时代的重要思维方式。每一次迭代,都是在原有事物基础上的完善、升级、创新,是一个动态的螺旋式上升的过程。学校特色课程建设同样需要迭代思维,顺应学生的需求、学习的要求而变,在传承中发展、创新,经历从量变到质变、从局部到整体、从单一到多元的进步过程。

重庆市江北区洋河花园实验小学办学 20年来,一直致力于推动核心价值内涵的精进、培养目标的具体化、课程内容的演变、课程评价的精准化,在特色课程建设的道路上经历了从单一项目到“四游”项目再到“5-N”畅游课程的蝶变。

目标迭代:寻找课程建设的旨归

培养目标是学校特色课程创建的出发点和归宿。洋河小学培养目标的确定,是从对校园文化的追问开始的。洋河,有着堪称生命摇篮的“水”。教育如水,洋河人从“水利万物而不争”中感受到:利,就是滋养、滋润,体现了水对世间万物的成全。于是,“成全是一种教育”走进了我们的视野,“成全教育”成为我们共同遵循的核心价值。学校依据世界管理大师彼得?圣吉的“自我系统、我与他人系统、自然和世界系统”三层次系统教育观,将“成全教育”分为善待自我、善待他人和善待世界,实现孩子“成人成事”的成长总目标。

学校培养目标也在传承中发展。1.0版:创建“书香校园”,培养具有民族文化根基的现代人。2.0版:落实核心素养,将孩子们小学阶段的目标定位为大气、担当、尚学的“六一”儿童:一身好品德、一些好技能、一堆好创意、一套好习惯、一群好伙伴、一副好身板,形成了洋河学子核心素养的校本化表达。

需求导向:提供孩子自由选择的课程

学生的需求是课程建设的风向标。孩子的生活是多姿多彩的,孩子的成长路径是多向度的。什么样的课程才能服务以上目标呢?起初,我们只是将“阅读”作为特色课程建设的唯一取向。在实践中,我们感觉这种设计太单一,不能满足孩子的需求。于是,我们进行了全校性的问卷调查,发现学生非常喜欢动手实践、体验性强的学科、社团、活动,并从“游文于六经之中,留意于仁义之际”得到启发,把这些孩子喜欢的项目归纳为“游文、游艺、游戏、游历”四个方面。游文是学校原有“系列阅读”项目的传承和创新;游艺指向艺趣积淀素养;游戏指向活动强健体魄;游历指向体验增强知识。这样,学校构建起了可供孩子选择的“四游”实践课程,不断激活师生“无限可能”的生命活力。

整合创新:促成孩子核心素养的转化

课程建设的过程,不是简单地增加或删减课程门类和内容,而是要整合、发掘、创新课程资源要素,重构新的课程结构、课程内容、课程实施、评价体系,促进课程向孩子核心素养的转化。我们从市、区全面的质量监测中发现,通过几年的“四游”项目的实施,学生的阅读、艺趣、健康等有着较大的提升,但学生的动手能力、创新思维能力,尤其是直接经验的获得,相比之下还有一定的差距。于是,我们进一步整合创新已有课程,增加了培养孩子创新能力的“游创”项目,这样,便从“四游”课程走向了畅游课程。

(一)重构课程结构

畅游课程体现在“5-N”的课程体系的架构上,主要有两个层次:

一是国家课程的群落化实施。通过学科整合、综合化实施,形成了“游文、游创、游艺、游戏、游历”课程群,这是学校课程的主干、核心。“游文”课程群将语文与英语整合成“语言与文学”交叉课程群。“游创”课程群将数学、科学和信息技术整合成“创意与实践”交叉课程群。“游艺”课程群将美术与音乐整合成“艺术与审美”交叉课程群。“游戏”课程群将体育课程与地方特色游戏与体育健康活动整合成“体育与健康”交叉课程群。“游历”课程群将思想品德、综合实践活动以及学校的仪式教育活动、节日庆典等有机整合成“仪式与育德”交叉课程群。

二是校本课程的项目化实施。“N”是由“五游”课程群生成的项目,是基于学科的体验课程,是对国家课程的实施过程中直接经验不足而做出的补充。开设了“绘本教育(游文);儿童哲学、DI、思维导图、STEAM创客(游创);舞台艺术、儿童剧(游艺);传统游戏创生(游戏);社会通识教育、国际理解教育(游历)”等精品课程,将孩子引向“做中学”。

(二)改进课程实施方式

我们对畅游课程的实施一是在课时上有保证,二是在课堂教学中有变革。

1.畅游课程的课时分配。(见下表)

课程群 类别 周总

课时 课时分配

游文 语言与文学 11 语文+7 英语+3 整合项目1节

游创 创意与实践 8 数学+4 科学+2 信息+1 整合项目1节

游艺 艺术与审美 5 美术+2 音乐+2 整合项目1节

游戏 运动与健康 4 体育+3 整合项目1节

游历 仪式与育德 4 品德+2 综合实践+1 整合项目1节

2.畅游课程的课堂教学变革。

一是“五游”课程群落的教学。老师们把“综合化”实施的方法应用到自己的课堂中,关注学科间的学法和思维方法的相互嫁接。比如,语文课上嫁接音乐的表达,体育课上嫁接科学的方法,数学课上嫁接美术的审美等。科学老师在上《摆的研究》时,让学生关注不同组之间的数据处理方式,理解近似和比例等数学方法对科学规律发现的影响。

二是“N”?目体验活动的教学。老师们关注学生在解决问题的过程中直接经验的获得。在游历项目中,学生带着问题走出校园去参与田园生活,然后再回到课堂上分享自己的研究成果;在游创项目中,学生们在制作模型的过程中发现问题、解决问题,有的收获了误差与错误之间的区别,有的理解了广告设计会影响产品受欢迎程度……人文底蕴、科学精神、学会学习、健康生活、责任担当、实践创新等核心素养就这样悄然落实在了每一节课,每一个活动中。

(三)优化课程教学评价

考核评价是学校建设特色课程的另一大秘密武器。情境创设能引发学生的思考;避免教师用自己的思考去压制和取代学生的思考;学生有不少于20分钟的自主、合作、探索、反馈等学习活动的时间;有明确的学科思想方法、学习策略的梳理、提炼、运用;学生有不少于5分钟的学习小结、检测、展示反馈……这些指标成了教师们的课堂教学价值追求。学校通过课堂评价表,引导教师把时间留给学生、把方法交给学生;重视学生能力培养、重视学生学习内生动力的激发。教与学中的“学本”立场、学生发展中的“向学性”特质更加彰显,恰当高效。

学校还成立了“五游”教师工作坊,由跨学科的老师组成具体的实施团队,共同解读学校《课程指南》,集体备课、听课和评课,形成了良好的协同作战氛围,提高了课程开发与实施的效率和效果。

儿童是教育的落足点。“成全每一个孩子”的理念,就是要求教育者基于人的生成性以及可教性,相信每个孩子身上都有“美”,让每个孩子都能得到所需要的教育,获得个性化的成长。时代发展永无止境。学校教育唯有“顺学而变,迭代创新”,构建符合时代潮流、适合学生需求、体现学校特色的课程体系,才能真正地实现“成人之美”“美美与共”的理想目标。

迭代控制 篇5

许多运动控制系统需进行沿某轨迹的重复运动,例如数控机床沿一定的轨迹重复加工零件,机械手重复执行某一运动过程。通常的控制算法并未考虑此类运动的重复特性,每一次运行跟随误差都重复产生,跟踪精度不高。而且由于控制对象存在非线性因素且模型具有不确定性,因而使得设计高性能的常规控制器较为困难。迭代学习控制是一种较新的智能控制方法,它首先由Arimoto[1]提出并应用于机械手的控制中。近年来迭代学习控制理论体系越来越成熟[2],应用日益广泛。

迭代学习控制的基本思想是,通过学习每次运动的误差,对控制量进行前馈修正,从而在下次运动时提高运动的精度。它不需要精确的系统模型,对系统的未建模特性具有一定的鲁棒性,实时计算量小,在一定的条件下可保证迭代收敛。迭代学习控制通常要求运动轨迹、初始条件和系统特性具有重复性,并要有足够的存储器来存储上次运动控制的信息[3,4]。

概率方法、模糊方法和区间方法是目前不确定性建模的三种主要方法。概率方法和模糊方法均需要有足够的数据来分别确定不确定结构参数的概率密度或隶属度函数,区间方法是把这些不确定性结构参数视为未知变量,并在具有已知边界的区间内取值。参数区间不确定性迭代学习控制系统收敛性的研究主要集中在稳定性(asymptotic stability)和单调收敛性(monotonic convergence)上。本文讨论了参数区间不确定性迭代学习控制系统(IILC)的单调收敛性问题。

1 迭代学习控制的单调收敛性

z传递函数描述的离散线性时不变系统为

Y(z)=H(z)U(z)=(h1z-1+h2z-2+h3z-3+…)U(z) (1)

其中,hiH(z)的Markov参数,理想输出信号为yd(t),第k次迭代学习控制的输入、输出分别为uk(t)、yk(t),ek(t)=yd(t)-yk(t),t为离散时间变量,t∈[0,N]。

定义超向量(Supervectors)[5,6,7,8,9]:

Uk=(uk(0),uk(1),…,uk(N-1))T

Yk=(yk(1),yk(2),…,yk(N))T

Yd=(yd(1),yd(2),…,yd(N))T

Ek=(ek(1),ek(2),…,ek(N))T

Yk=HpUk,其中Hp为由系统Markov参数组成的N×N矩阵:

Ηp=[h1000h2h100h3h2h10hΝhΝ-1hΝ-2h1]

迭代ILC算法的目标是根据第k次及以前的信息计算出第k+1次的控制输入uk+1,使其收敛至u*(t),并使得ek(t)=yd(t)-yk(t)收敛到零。超向量法(supervector)将二维(时间轴、迭代轴)问题转换为一维多输入多输出问题。超向量表达的一般迭代学习控制为

Uk+1=Uk+LEk (2)

L=[γij]n×n

上述学习矩阵L的不同选择方法对应不同的ILC学习算法,显然,当γij=0(ij)、γij=γ(i=j)时为Arimoto算法。

定义T为列向量h=(h1,h2,…,hN)T到下三角阵Hp的Toeplitz变换,即Hp=T(h)。

l=[k1,k2,…,km,0,0,…,0]T∈RN×1,m为ILC算法的阶次,取L=T(l)为ILC算法学习矩阵。

考虑离散高阶ILC算法(式(2)),则

Ek+1=Yd-HpUk+1=(I-HpL)Ek=HeEk=T(he)Ek

He=I-HpLhe=vN-Hpl

vN≜(1,0,…,0)T∈RN×1

因此,ILC单调收敛的充分必要条件为相应的范数小于1,即

I-HpLi<1 (3)

Ι-ΗpL=Ιn×n-[h100h2h10hnhn-1h1][γ1100γ21γ220γn1γn1γnn]

2 区间鲁棒迭代学习控制的单调收敛性

对于区间矩阵集合:

AI={A:A=[aij[a¯ij,a¯ij]],i,j=1,2,,n}

其顶点矩阵集合:

Av={A:A=[aij{a¯ij,a¯ij}],i,j=1,2,,n}

其中,a¯ij,a¯ijaij的最小值和最大值,下文其他量的定义与此类同。

对区间鲁棒迭代学习控制系统稳定性和单调收敛性的讨论即为对给定的HIp进行讨论。显然,对Arimoto型迭代学习控制,稳定性的充要条件为

max(|1-γiih¯1|,|1-γiih¯1|)<1i=1,2,,n

对一般区间鲁棒迭代学习控制,设P=I-Hp⨂L,则其稳定性的充要条件为PI=I-HIp⨂L的谱半径小于1。而区间矩阵PI=I-HIp⨂L的谱半径为PPv的某个谱半径。

根据定理(证明略):xi为具有区间不确定性的参数,xi[x¯i,x¯i]i=1,2,,my=|k10+k11x1+…+k1nxn|+|k20+k21x1+…+k2nxn|+…+|km0+km1x1+...+kmnxn|,∀kij∈R,i=1,2,…,m,j=0,1,…,n

xi为某顶点向量时,即Xv=({x¯1,x¯1},{x¯2,x¯2},,{x¯m,x¯m})时,y达到最大值ymax。由此定理可知:对hihiΙ=[h¯i,h¯i]i=1,2,,m(hi为具有区间不确定性的Markov参数),当

max (‖I-HpΓ‖∞,∀Hp∈HI)=

max (‖I-HpΓ‖∞,∀Hp∈Hv)<1 (4)

时区间鲁棒迭代学习控制系统l∞范数意义单调收敛,其中,Hv为Markov顶点矩阵。对离散高阶ILC算法(式(2)),PD型ILC算法(m=2)为[6]

uk+1(t)=uk(t)+k2ek(t)+k1ek(t+1)=

uk(t)+kpek(t)+kd(ek(t+1)-ek(t)) (5)

其中,k1=kd,k2=kp-kd。则I-HpL各行为

(I-HpL)1=(1-h1k1,0,0,…,0)

(I-HpL)2=(-(h2k1+h1k2),1-h1k1,0,0,…,0)

(I-HpL)3=(-(h3k1+h2k2),-(h2k1+h1k2),

1-h1k1,0,0,…,0)

(I-HpL)n=(-(hnk1+hn-1k2),-(hn-1k1+hn-2k2),1-h1k1,0,0,…,0)

因此,有

I-HpL‖∞=max(‖(I-HpL)1‖1,

‖(I-HpL)2‖1,…,‖(I-HpL)n‖1)

对于hihiΙ=[hi¯,hi¯],可在hv=({h1¯,h1¯},{h2¯,h2¯},,{hn¯,hn¯})的顶点集合中计算以上范数,从而判断其单调收敛性。

3 数字仿真研究

对离散线性系统z传递函数Η(z)=z-a(z-0.5)(z-0.9)a为区间不确定参数,a∈[0.55,0.80],采样周期为0.1s。当a=0.80、0.72、0.55时,系统脉冲传递函数如图1~图3所示,此脉冲传递函数决定了H(z)的Markov参数。为简化计算,下面范数计算取Markov参数前9项。理想轨迹yd(t)为正弦函数曲线,迭代次数为50。

对上述区间不确定系统a∈[0.55,0.80],采用式(5)离散二阶ILC算法:

uk+1(t)=uk(t)+k1ek(t+1)+k2ek(t)

(1)选取控制参数k1=0.90、k2=-0.59[6],当a=0.80(上界)时,‖I-HpL‖∞=0.28<1,其输出轨迹及轨迹误差范数如图4、图5所示。可见,迭代学习控制取得了良好的单调收敛性能。当a=0.72时,‖I-HpL‖∞=0.46<1,其轨迹误差范数如图6所示。当a=0.55(下界)时,‖I-HpL‖∞=1.07>1,其轨迹误差范数如图7所示。可见,当参数区间变化至下界时,不满足式(4)条件,迭代学习控制不满足单调收敛的要求。

(a=0.80,k1=0.90,k2=-0.59)

(a=0.72,k1=0.90,k2=-0.59)

(a=0.55,k1=0.90,k2=-0.59)

(2)选取k1=0.80、k2=-0.59, 当a=0.80(上界)时,‖I-HpL‖∞=0.41<1,其输出轨迹及轨迹误差范数如图8、图9所示。当a=0.72,‖I-HpL‖∞=0.34<1,其输出轨迹及轨迹误差范数如图10所示。当a=0.55(下界)时,‖I-HpL‖∞=0.746<1,其轨迹误差范数如图11所示。可见,当参数取上下界时,均满足式(4)条件,迭代学习控制满足区间单调收敛的要求。

(a=0.80,k1=0.80,k2=-0.59)

(a=0.80,k1=0.80,k2=-0.59)

(a=0.72,k1=0.80,k2=-0.59)

(a=0.55,k1=0.80,k2=-0.59)

4 结语

本文研究了区间不确定离散线性时不变系统的鲁棒迭代学习控制(IILC)算法的单调收敛性,并针对常见的离散PD型ILC算法,给出了在l∞范数意义下区间不确定性迭代学习控制系统单调收敛性的判断方法。仿真实例说明,当Markov参数组成的顶点矩阵满足单调收敛性条件时,区间不确定系统的迭代学习控制具有鲁棒单调收敛性。

参考文献

[1]Arimoto S,Kawamura S,Miyazaki F.Bettering Op-eration of Robots by Learning[J].Journal of Ro-botic Systems,1984,1(2):123-140.

[2]Moore K L,Xu Jianxin.Special Issue on IterativeLearning Control[J].Int.J.Control,2000,73(10):819-823.

[3]Moore K L.An Observation about Monotonic Con-vergence in Discrete-time,P-type IterativeLearning Control[C]//Proceedings of IEEE Int.Symposium on Intelligent Control(ISIC’01).Mexico,2001:45-49.

[4]许顺孝,扬富文.不确定线性系统迭代学习控制器的设计[J].控制理论与应用,2002,19(4):650-652.

[5]Chen Yangquan,Moore K L.An Optimal Design ofPD-type Iterative Learning Control with Monoton-ic Convergence[C]//Proceedings of the 2002IEEEInternational Symposium on Intelligent Control.Vancouver,Canada,2002:27-30.

[6]李宏胜.离散系统单调收敛高阶迭代学习控制[J].机械工程学报,2006,42(6):72-76.

[7]Moore K L,Chen Yangquan.On Monotonic Con-vergence of High Order Iterative Learning UpdateLaws[C]//2002IFAC 15th Triennial World Con-gress.Barcelona,Spain,2002:21-26.

[8]Moore K L,Chen Yangquan.A Separative High-order Framework for Monotonic Convergent Itera-tive Learning Controller Design[C]//Proceedingsof the American Control Conference.Denver,Colo-rado,USA,2003:3644-3649.

迭代控制 篇6

关键词:有源滤波器,迭代控制,Ziegler-Nichols方法,模糊规则,优化,动态响应

0 引言

随着电力电子装置的广泛应用,电力系统的谐波污染问题越来越严重。注入式混合有源电力滤波器HAPF(Hybrid Active Power Filter)作为谐波治理的一个重要手段,已经引起一些学者的注意[1,2,3,4,5,6,7,8,9]。因为其特有的基波谐振支路,有效地减小了有源电力滤波器(APF)的容量,可以应用于配电网中高压系统。其中滤波器有源部分的工作原理是发出与负载谐波电流大小相等、相位相反的电流以消除电网电流的畸变。因此,对于APF,合理的控制策略及控制方法是提高工作性能的关键所在,也直接关系到系统的工作性能[10,11]。

由于检测的电网谐波电流信号是周期性的,传统PI控制器不能实现其无差控制。为了提高系统的控制性能,文献[12]提出一种PI型迭代学习控制算法,对电网谐波电流的补偿取得了较好的控制效果。但是文献[12]的研究存在以下不足:算法的收敛性严重依赖于学习控制的初始输入;初始控制输入的选取不容易实现;控制器的增益是人为选取的定常值,对系统控制性能造成一定影响。鉴于此,本文在该控制算法基础上提出一种新型PI迭代学习算法,并利用一种改进的Ziegler-Nichols方法实现控制器参数的优化。另外,为了改善系统的动态性能和提高控制精度,在谐波电流反馈控制器的基础上增加了一个电网谐波电流误差信号的微分型学习律前馈控制环节,并针对本文研究对象HAPF运用一种模糊规则对前馈控制器微分系数进行了优化。

1 混合有源滤波器的结构

本文针对一种注入式HAPF[11]进行研究,其单相结构如图1所示,其中直流侧电容C和电压型逆变器构成HAPF的有源部分,L0和C0构成输出滤波器;L1和C1被调制在基波频率,使有源部分基本上不承受基波电压和基波电流,从而减小APF的容量。注入电容C2及无源滤波器则可以为电网提供固定的容性无功功率。

2 控制器设计

2.1 传统PI型迭代学习算法

在APF中,文献[12]提出PI型迭代学习控制算法。PI型迭代学习控制器表示为

其中,λ为遗忘因子;v0(t)为学习控制的初始输入;K、φ为定常增益;en(t)为输出误差,定义为in*(t)-in(t),in*(t)、in(t)分别是第n次迭代学习时的期望跟踪电流和控制输出电流;重复学习次数n=0,1,…。

2.2 控制器结构及新型PI迭代学习算法

关于前述控制算法,存在如下不足:

a.算法的收敛性严重依赖于学习控制的初始输入[13];

b.不容易选取到初始控制输入;

c.迭代控制器的增益是人为选取的定常值,影响系统的控制精度。

针对上述问题,本文在HAPF装置的电流反馈控制器中应用一种带遗忘因子的新型PI迭代学习控制算法,HAPF控制器实现框图如图2所示。其中ism(t)、imsf(t)分别为第m次迭代学习时的实际电网电流和期望电网基波电流;通过检测计算得到的imsh(t)(imsh(t)=ism(t)-imsf(t))为第m次迭代学习时的期望电网谐波电流;em(t)为跟踪谐波电流误差信号,定义为em(t)=imsh(t)-icm(t),icm(t)为第m次迭代学习时的逆变器输出电流;um(t)为控制对象(由PWM调制和逆变器组成)的控制输入;um(1)(t)与um(2)(t)分别为控制器的前馈和反馈信号量;m=0,1,…,表示重复学习的次数。设工频周期为T,则imsh(t)在[0,T]上具有周期性特点。

控制对象的输入为

新型PI迭代学习控制算法的表达形式为

其中,λ为遗忘因子,遗忘因子的加入可以加速算法的收敛速度,增强迭代学习控制的鲁棒性[13];k′P、k′I为控制器的比例、积分系数。

为了改善系统的动态性能,现在考虑加入一个电网谐波电流误差的模糊微分型学习律前馈环节。

模糊微分型控制器表示为

其中,ψ为经过模糊算法优化得到的微分系数。

根据式(2)~(4),得到:

其中,Δum表示第m次与m-1次系统输入的差值。

设采样周期为TS,则在第k(k=0,1,…,T/TS-1)个采样周期内,式(5)的离散表达式为

在控制输入u的作用下,经若干个周期迭代学习后,在满足系统性能指标(em(k)

2.3 迭代学习控制器参数的优化

关于式(6)中的迭代学习控制器参数,现采用一种改进的Ziegler-Nichols方法对其进行优化,具体实现方式如图3所示。

图3中利用一个增益调节因子ρ对参数调整[14]如下:

其中,kP、kI分别为利用Ziegler-Nichols方法[15]优化得到的初始参数值;k1和k2为2个正常数,用来调整参数k′P和k′I的值;由图3得到增益调节因子ρ表示为

其中,em N(k)称为输出误差em(k)的归一化值,且

因此,控制器的离散输出表达形式为

2.4 前馈控制器微分增益的模糊优化

针对本文的研究对象HAPF,计算出采样时刻期望跟踪谐波电流ish与逆变器输出电流ic的差值e及差值的变化率Δe,将其输入到控制器,运用模糊推理,即可得到该时刻的Δψ,实现对微分系数的最佳调整。本文假设将输入、输出变量值均分为7个语言值,即{负大(NB),负中(NM),负小(NS),零(Z),正小(PS),正中(PM),正大(PB)}。模糊量e、Δe、Δψ的隶属度函数如图4所示,论域为[-3,3]。表1为参数Δψ的模糊规则表[16];图5是对应的控制器曲面,表示的是Δψ与e、Δe的关系。解模糊的方法采用最大隶属度法。

3 仿真和实验结果

将本文提出的控制算法应用到HAPF系统进行仿真研究,并与传统迭代学习控制结果作比较。仿真电路参数如下:负载RL1=40Ω,RL2=45Ω,LL1=15.03m H,LL2=20.01 m H;无源滤波器R5=0.09Ω,R7=0.05Ω,L5=1.62 m H,L7=0.85 m H,C5=250.4μF,C7=243.5μF;基波谐振支路R1=0.073Ω,L1=20.7 m H,C1=489μF;注入电容C2=305.2μF;输出滤波器R0=0.05Ω,L0=0.26 m H,C0=48.3μF。控制器参数为k1=0.8,k2=30。采用三相10 k V电源供电,工频为50 Hz,非线性负载由电流源和阻感模拟,第1组阻感为RL1与LL1串联,第2组阻感为RL2与LL2串联。

图6为本文控制方法与传统迭代学习控制动态治理效果对比,设定负载在1.6 s时发生变化(由投入1组负载变为投入2组),其中iL为负载电流,is为电网电流。对于式(6)的控制算法,可以根据第m-1次与m-2次迭代控制信号的加权作用及第m次PI控制环节获得的有效信息来修正当前控制信息的变化量。与传统迭代学习控制算法比较,算法中少了关于初始控制输入的项,降低了对于系统初始控制输入的敏感依赖性。同时在该控制器基础上加入一种微分型学习律前馈控制环节,并采用一种模糊规则对微分系数进行优化,能够加快系统的响应速度。从图6可以看出,在1.6 s时,负载电流发生变化,稳态的电流波形失去正弦特性,与传统迭代学习控制器比较,经过本文控制方法处理后,电流波形的正弦特性恢复得要迅速一些。

图7为2种控制方法下的稳态治理效果,从图中容易看出,传统迭代学习电流控制还存在一定的误差,电网电流仍含有一定的谐波分量;而在本文控制方法中,采用了一种改进的Ziegler-Nichols方法对控制器参数进行优化,有效地提高了系统的控制精度,电流波形更接近正弦。

为了进一步验证所提方法的正确性,进行了实验研究。实验参数如下:无源滤波器R5=0.09Ω,R7=0.1Ω,L5=0.56 m H,L7=0.43 m H,C5=724μF,C7=481μF;基波谐振支路R1=0.15Ω,L1=14.7 m H,C1=690μF;电源相电压为220 V。

图8是利用本文控制方法的治理前后电网电流波形对比,治理后的波形较治理前有了很大改善,电网中的5次、7次、11次、13次、17次、19次谐波含量分别从8.1%、7.6%、1.6%、7.7%、5.1%、4.0%降低到0.3%、0.2%、0.1%、0.2%、0.1%、0.1%。

4 结论

迭代控制 篇7

2009年3月27日收到迭代学习控制[1,2]的使用对象是诸如工业机器人那样的具有重复运动性质的被控系统,它的目标是实现有限区间上的完全跟踪任务。迭代学习控制采用“在重复中学习”的学习策略,具有记忆和修正机制。它通过对被控系统进行控制尝试,以输出轨迹与给定轨迹的偏差修正不理想的控制信号,以产生新的控制信号使得系统的跟踪性能得以提高[3]。迭代学习控制的研究,对具有较强的非线性耦合﹑较高的位置重复精度﹑难以建模和高精度轨迹跟踪控制要求的动力学系统有着非常重要的意义[4]。

滑模控制(Sliding Mode Control,SMC)是变结构控制(Variable Structure Control,VSC)的主要理论和方法。从20世纪50年代开始出现至今,滑模控制已经得到了充分的完善和发展。滑模控制实现简单,对外界干扰和系统匹配不确定性有完全的鲁棒性和自适应性[5]。这两大优点使得滑模控制以及其相关的研究迅猛发展,成为控制理论界的研究热点之一。

1 模糊滑模迭代控制器设计

迭代学习显著的特点是控制算法非常简单,控制精度很高,可以以任意精度跟踪给定。但是其主要问题之一是鲁棒性问题。由于不确定项的客观存在,实际应用中的迭代学习控制的鲁棒性问题难以解决,而滑模变结构控制却能够很好地解决鲁棒性问题。基于此,设计出将两种控制方法结合的新方法,可以更有效地提高系统的性能[6]。

普通ILC的收敛速度比较慢,如何寻找一个合适算法来加快收敛速度是ILC一个重要的研究方向。变结构控制具有响应快、对参数变化及扰动不敏感等优点,但单纯的变结构控制容易引起抖动问题,为此将模糊滑模控制算法[7]引入迭代学习控制,提出FSMILC算法,算法原理如图1所示。

由图1可以看出,模糊滑模迭代学习控制算法和其它迭代学习算法不同,这种算法是利用模糊滑模控制进行控制量的增量计算。滑模函数的输入为误差eK(t)和误差变化率e˙K(t),其中e˙K(t)如(1.1)式所示:

e˙Κ(t)=eΚ(t)-eΚ(t-1)(1.1)

滑模函数sK(t)和滑模函数变化率s˙K(t)如(1.2)式、(1.3)式所示:

sΚ(t)=ceΚ(t)+e˙Κ(t)(1.2)

s˙Κ(t)=sΚ(t)-sΚ(t-1)(1.3)

采用控制的变化量Δu作为模糊滑模控制器的输出,可使滑模控制成为无模型控制,依赖于被控对象的程度较小[5,6]。

设模糊控制器的输入为s(t)和s˙(t),它们分别是sK(t)和dsK(t)的模糊变化量,模糊控制器的输出ΔuK(t)是控制变化量Δu的模糊化变量。

被控对象的输入为:

uK+1(t)=uK(t)+ΔuK(t) (1.4)

(1.4)式中,ΔuK(t)为第K个迭代周期模糊控制器的输出,即第K个周期产生的控制变化量。uK(t)为第K个迭代周期的控制量,uK+1(t)为第K+1个迭代周期的控制量。

2 神经网络等效滑模控制器设计

迭代学习控制存在鲁棒性差的问题,由于外界不确定因素的存在,使其成为很难解决的问题。而滑模控制来说,系统如果进入了滑模状态,系统参数扰动与外部干扰对系统无作用,系统的稳定性与动态品质仅取决于滑模面及其参数,所以滑模控制的鲁棒性强、可靠性高。但滑模变结构控制本身也存在不足之处,促使其与神经网络控制相结合,以使系统在保持对摄动和外部干扰强鲁棒性的同时,尽量消除抖振的发生。从20世纪后期开始,许多专家学者就结合神经网络和滑模控制进行了很多研究工作,在诸多方面得到了非常有意义的成果[8]。

由图2可知,神经网络等效滑模迭代学习控制算法和其它迭代学习算法不同,这种算法是利用滑模的等效控制ueq(k)和神经网络输出un(k)之和作为总控制律。ueq(k)称为系统在滑动模态区内的等效控制。等效控制往往是针对确定性系统在无外加干扰情况下进行设计的。针对带有不确定性和外加干扰的系统,一般采用的控制律为等效控制加切换控制,即其中切换控制实现对不确定性和外加干扰的鲁棒控制,所设计的控制律u需要满足滑模稳定条件。在此方案中切换控制部分选用神经网络控制器。

uK(k)为第K次迭代控制被控对象的输入量,yK(k)为第K次迭代被控对象的输出量。滑模函数的输入为系统的误差eK(k)和误差变化率deK(k)。这里神经网络控制器的输入不是系统的误差eK(t)和误差变化率deK(t),而是滑模函数sK(t)和滑模函数变化率dsK(t)。神经网络的输出为uΚn(k),第K+1个迭代周期的总控制律:

uK+1(k)=uΚeq(k)+uΚn(k) (2.1)

uK+1(k)作为下一个周期被控对象的输入存放在记忆存储器中。

3 仿真实验

设对象传递函数为

G(s)=133s(s+25)(3.1)

将(3.1)式转化为状态方程为

x˙=Ax+Bu(3.2)

(3.2)式中

x=[x1x2]A=[010-25]B=[0133]

将状态方程式(3.2)转化为离散状态方程

x(k+1)=A1x(k)+B1u(k),y(k)=C1x(k)+D1(k) (3.3)

0.1sA1=[1.00000.036700.0821]B1=[0.33674.8833]C1=[10]D1=0

。期望轨迹为yd(t)=4sin(0.5t),假设系统的初始状态为零。

图3.1为期望曲线yd与第5,10,20个迭代周期的输出曲线yK之间的关系图,从图3.1中可以看出随着周期数目增加,输出值越来越趋近于期望曲线。图3.2为前30个迭代周期,每个周期内每个采样点误差的绝对值之和,从图3.2可知在第26个迭代周期中,采样点误差的绝对值和趋近于零,随着迭代次数的增加,误差和逐渐减小并趋于平稳,得到较好的跟踪效果。

将状态方程(3.2)式转化为离散状态方程

x(k+1)=A1x(k)+B1u(k),

y(k)=C1x(k)+D1(k) (3.4)

0.1sA1=[1.00000.008800.7788]B1=[0.00611.1768]C1=[10]D1=0

。期望轨迹为yd(t)=4sin(0.5t),假设系统的初始状态为零。

图3.3为期望曲线yd与第2,3,4个迭代周期的输出曲线yK之间的关系,可以看出只需要很少的周期就可以趋近于期望曲线。图3.4为前5个迭代周期,每个周期内每个采样点误差的绝对值之和,从图3.4可知在第3个迭代周期中,采样点误差的绝对值和趋近于零。可以看出,此控制方法比模糊滑模迭代学习控制有更好的跟踪效果。

4 结论

迭代学习控制为难以建模,有高精度轨迹控制要求,特别是具有重复运动特性的对象提供了很好的控制方法。本文将迭代学习控制与滑模变结构控制相结合,提高了控制器的鲁棒性,随着迭代次数的增加误差逐渐减小,验证了方法的有效性。

参考文献

[1]Gunnarsson S,Norrlof M.On the disturbance properties of high orderiterative learning control algorithms.Automatica,2006;42(11):2031—2034

[2]Ahn Hyosung,Moore K L,Chen Yangquan.Stability analysis of dis-crete-time iterative learning control systems with interval uncertainty.Automatica,2007;43(5):892—902

[3]Seshagiri S,Khalili H K.On introducing Integral action in sliding mode control.Proceeding of the41st IEEE Conference on Decision and Control,2002;2(12):1473—1478

[4]Mainali K,Panda S K,Xu J X.Repetitive position tracking perform-ance enhancement of linear ultrasonic motor with sliding mode-cum-iterative learning control.Proceedings of the IEEE International Con-ference,2004;7(6):352—357

[5]Tong S,Li H X.Fuzzy adaptive sliding-mode control for a nonlinear system.IEEE Trans F S,2003;11(3):354—60

迭代控制 篇8

将压缩感知应用与无线传感网络相结合, 可以有效减少感知节点的数目;并可以大大节约有限的节点资源, 其基本思想即通过无线传感器网络中多个节点的协作感知, 相对于单个节点分布式传输, 可大幅度提高数据感知精度与准确性。但这种协作感知无线传感网络在总资源开销方面与感知节点检测方面, 在实际中实现难度较大或难以适用具体的应用[3]。文献[4]提出了一种降低节点资源开销的数传节点感知方法 (记为OMP算法) , 即保证感知可靠性要求, 通过降低感知节点数目以降低资源开销;但并没有给出具体的协作方法, 也没有给出理论计算最优值;文献[5]提出了一种利用检测概率的协作感知方法 (记为DAOMP算法) , 但该方法需假设所有节点具有相同的检测与先验条件, 很难应用到实际场合;文献[6]提出了一种自适应迭代协作感知方法 (记为DOMP算法) , 有效提高感知精度, 但该方法需要知道每个感知节点检测概率, 同时也没有解决整个传感器网络资源开销问题;并且动态适应性较差。

为了对上述研究进行研究, 在研究大规模稀疏型传感网络数据属性的前提下, 从随节点数目急剧增大而导致网络堵塞的问题与节约资源的角度出发, 提出了一种基于协作感知的大规模稀疏网络数传节点优化方法。该方法利用大规模稀疏网络数传节点在空间上的相关性, 构建大规模联合稀疏模型, 自适应选择最优节点作为感知节点;并采用循环迭代控制算法对稀疏网络节点数据进行压缩, 以最大程度用有限节点获得最大信息量, 最后再利用信号稀疏性重构节点数据。

1 稀疏分布节点关联模型的设计

无线传感器网络数据节点数量及规模越来越大, 而数据节点增多导致资源与功耗急剧提高, 将压缩感知技术应用于无线传感器网络中可以减少感知节点数目, 降低资源开销。大规模稀疏型无线传感网络数据节点通信模型如图1所示, 假设该大规模稀疏型无线传感网络模型中, 总共包含N个数据传感器节点, 其中, 工作数据传感器节点数目为K, 观测几点的数目为M。

假设无线传感器网络信道为多径衰弱模型, 且包络服从瑞利分布, 则第n个传感器节点接收到第m个传感器节点数据信号的数学函数表达式为:

式 (1) 中, dism, n表示第m个观测传感器节点到第n个传感器节点的传输距离;α表示衰减因子, |rm, n|表示信号包络幅度模值。

那么包含N个传感器节点与M个传感器观测点的无线传感器网络传输函数表示为:

式 (2) 中, cm, n表示第m个传感器观测节点检测到第n个传感器节点的信号。

定义稀疏信号向量矩阵EN×1, 向量矩阵EN×1中的值为1或0, 其中, 1表示该数据节点传感器处于工作状态, 0表示该数据节点传感器处于非工作状态。假设信号中的噪声为高斯噪声, 服从均值为0, 方差为α2, 则观测传感器节点的信号数学表达式为:

式 (3) 中, CM×NEN×1表示为M个观测点传感的信号函数;εM×1表示高斯白噪声。选用该稀疏模型作为后文研究协作感知节点优化方法的基础。

2 基于稀疏分布的循环迭代控制策略

2.1 问题描述

压缩感知 (compressed sensing, CS) 技术采用低于原始信号频率进行欠采样, 有效降低数据存储量。基于压缩感知的无线传感器网络只要有一部分少量的传感器节点处于工作状态, 而另一部分传感器节点处于非工作状态, 就需要精确感知处于工作状态的数据传感器节点。但在实际应用中仍然面临着很多问题:一类是处于工作状态的数据传感器节点会随传输路径的增加而逐渐衰减;另一类是在实际传输场合下, 常常存在形形色色的噪声干扰;三是观测节点传感器就常常受到多径信号的干扰从而影响接收[7]。

压缩感知理论框架如图2所示, 第一步首先建立稀疏信号模型, 分析原始信号构建稀疏信号;第二步对构建的可压原始信号进行稀疏变换;第三步再对稀疏变换后的信号采用观测矩阵处理;第四步最后再利用稀疏信号最优化理论进行逆变换重构原始信号。

假设长度为N的可压缩信号, 经稀疏变换, 得到观测矩阵数学表达式为:

式 (4) 中, ΦM×N表示可压矩阵;ΨN×N表示稀疏基矩阵;SN×1为可压信号向量。

利用式 (4) 进行重构原始信号可以等价为欠定方程求解问题, 转化为求解最小范数解问题[8], 即

将压缩感知技术应用到无线传感器数据节点网络优化中, 利用大规模稀疏网络数传节点在空间上的相关性, 构建大规模联合稀疏模型, 自适应选择最优节点作为感知节点, 并采用循环迭代控制算法对稀疏网络节点数据进行压缩, 以较少节点资源获得最大的数据信息。

2.2 循环迭代控制算法

基于压缩感知的无线传感器网络数据节点, 使用较少的传感器观测节点来检测无线传感器网络中产生的稀疏事件, 需满足如式 (6) 数学不等式关系[9]。

式 (6) 中, c为常量。由式 (6) 可知, 当处于工作状态节点K值减小时, 其值也随之减小, 也一定程度上降低了数据观测传感节点的数量, 故可以以较少的数据传感节点资源获取最大的稀疏信号数据信息。稀疏矩阵求解可进一步转化为求解1范数问题:

令, 则式 (7) 进一步转化为:

根据欧拉拉格朗日定量求解目标函数表示为[10]:

同时式 (9) 两边求导可得:

根据稀疏梯度解目标函数最优解即可转化为:

式 (11) 中, wi (l+1) =1/ (|eil|+α) 为自适应参数可调因子。

可将上述目标函数求解问题转化为循环迭代求最优解问题, 在此基础上提出一种基于稀疏分布的循环迭代控制算法, 其具体步骤如下:

(1) 首先, 令i=0, l=0;初始化可调迭代参数w (l+1) i;

(2) 每次迭代根据公式 (10) 更新可调参数:

(3) 根据公式计算相邻空间节点的稀疏节点相对误差:

式中, WN×N=diag[ (|ei|+α) -1]N×N。

(4) 当迭代次数大于等于最大迭代次数时, 就停止迭代, 返回主程序, 传送检测结果;当迭代次数小于等于最大迭代次数时, 就跳转步骤 (2) 继续循环迭代。

循环迭代控制算法能够精确的恢复原始的信号, 并且具有良好的抗噪性能。

2.3 算法实现

基于协作感知的大规模稀疏网络数传节点优化方法。该方法利用大规模稀疏网络数传节点在空间上的相关性, 构建大规模联合稀疏模型, 自适应选择最优节点作为感知节点, 并采用循环迭代控制算法对稀疏网络节点数据进行压缩, 以最大程度用有限节点获得最大信息量, 最后再利用信号稀疏性重构节点数据。

该方法以有限的节点资源满足估计精确度的要求, 并有效减少了感知的节点数目, 从而降低系统的资源消耗。

3 仿真结果与性能分析

采用Matlab7.0软件对提出的基于协作感知的稀疏数传节点优化方法进行仿真验证。系统仿真参数设置如下:假设各感知节点是独立的, 且在空间存在一定的弱相关性, 无线传输信号为高斯白噪声, 且包络服从瑞利分布, 无线传感器网络中包括256有效节点, 其中, 处于工作状态的传感器节点有64个, 处于非工作状态的传感器节点有192个, 无线通信信道传输存在衰减, 主要对包括OMP算法, AOMP算法, DAOMP算法以及本文提出的算法进行仿真验证。

图3为各种算法信号重构对比曲线, 从仿真结果可以容易得出, 利用稀疏自适应匹配追踪算法和改进的稀疏自适应匹配追踪算法分别对的原始信号处理, 在其它条件相同的情况下, 本文所提出的重构信号与原始信号较为相近, 其恢复的信号基本就是原始信号的再现。

图4为各种算法节点数量与重构错误率对比曲线。在成功检测概率相同的情况下, 改进的循环迭代控制算法比传统OMP算法使用更少的观测传感器节点数目。同时, 随着观测传感器节点数目的增多, 循环迭代控制算法的检测曲线渐渐趋于平稳, 表明该检测算法具有较好的稳健性, 且收敛速度较快。

图5为两种算法稀疏检测概率对比曲线。比较这两种恢复算法的恢复结果, 可以得出如下结论:本文算法的恢复效果要比原算法好。该方法以有限的节点资源满足估计精确度的要求, 并有效减少了感知的节点数目, 从而降低系统的资源消耗, 有效提升了无线传感网络自适应感知稀疏信号的概率。

4 结束语

本文在研究大规模稀疏型传感网络数据随节点数目急剧增大而导致网络堵塞的问题基础上, 将协作感知与自适应相结合, 提出了一种基于稀疏分布的空间节点资源循环迭代控制算法。该方法以有限的节点资源满足估计精确度的要求, 并有效减少了感知的节点数目, 从而降低系统的资源消耗。

摘要:为解决大规模稀疏型传感网络数据随节点数目急剧增大时导致网络堵塞的问题, 提出了基于稀疏分布的空间节点资源循环迭代控制算法。该方法利用大规模稀疏网络节点在空间上的弱相关性, 构建了一个表达联合稀疏关系的模型。通过通信特征做到自适应选择最优节点作为感知节点, 针对稀松节点数量有限、无法传递海量信息的问题, 采用循环迭代控制对稀疏网络节点数据进行压缩, 以最大程度用有限节点获得最大信息量;再利用信号稀疏性特征重构节点数据。仿真结果表明, 该方法以有限的节点资源满足估计精确度的要求, 并有效减少了感知的节点数目, 降低系统的资源消耗。

关键词:无线传感网络,压缩感知,稀疏分布,循环迭代

参考文献

迭代控制 篇9

近年来, 许多学者研究了发生执行器故障的容错控制系统。文献[6]利用线性矩阵不等式 (LMI) 技术对非线性系统进行状态反馈补偿, 设计了离线可恢复故障模式的容错控制器, 提出了4种主动容错控制器来满足系统的不同需求。由于使用了被动容错控制方法, 控制器的保守型较强。文献[7]针对高速运行条件下的PMSM系统的位置传感器故障, 利用缩放法估计系统的转速和位置, 然后结合最大似然算法, 使系统保持鲁棒渐进稳定。文献[8]在卫星姿态控制系统发生了一个或多个飞轮故障的情况下, 用Back Stepping方法设计了在线自适应容错控制器, 使得控制器对参数、干扰和执行器故障有很强的鲁棒性, 保证了系统闭环的稳定性。但是, 该方法只针对执行器完全失效的情况, 并没有讨论其他执行器故障比如卡死、部分失效等。文献[9]利用T-S模糊模型设计了可靠控制器, 最后利用Lyapunov方法证明了系统的稳定性, 取得了良好的效果。

迭代学习控制算法被广泛应用于工业制造、机器人控制等重复性强的生产过程中。文献[10]将迭代学习过程抽象为时间和批次2个维度的学习过程, 将传统的迭代学习过程转换为二维模型, 使其输出满足预设的跟踪条件。但是, 该文献并没有考虑执行器故障的情况, 并且系统需要满足一定的线性条件才能使用。

本文提出了利用迭代学习控制算法解决重复系统发生执行器故障后的控制问题。针对连续时变系统, 提出了一种开环PD型迭代学习律, 并结合算子理论和范数理论分析了系统控制器保持稳定的充分条件。仿真结果表明, 本文的算法收敛性快、实时性强, 保证了系统在发生故障的情况下的鲁棒稳定性。

1 问题描述

考虑如下线性连续时变系统:

式 (1) 中:t∈[0, T], x (t) ∈Rn为状态变量;u (t) ∈Rr为系统的控制输入量;y (t) 为系统输出;A (t) 、B (t) 、C (t) 为系统状态矩阵。其中, t分段连续。

当执行器发生故障时:

此时, 执行器发生失效故障。

式 (2) 中:α为执行器故障的失效因子, 0<α<1;d为执行器有界增益故障, 一般认为是一个有界常量。

当系统在第k次运行时, 系统状态方程为:

定义系统的输出误差:

式 (4) 中:yd (t) 为系统的期望轨迹, 在t∈[0, T]上连续。

2 设计迭代学习控制律

针对式 (3) , 设计了迭代学习控制律:

式 (5) 中:Γ, L分别为开关迭代学习D型增益矩阵和P型增益矩阵;uk+1 (t) 和uk (t) 分别表示第k+1次和第k次的系统控制输出。

对于系统的迭代次数k, uk (t) 分段连续。常见的执行器故障分为卡死、失效和增益等。本文讨论的故障形式是执行器失效故障, 具体表现为, 系统控制器的实际输入是预设输入和失效因子的乘积, 即:

式 (6) 中:α为执行器故障的失效因子, 0<α<1.

设故障线性连续时变系统 (3) 在初始状态都满足xk (0) =x0的条件下, 采用迭代学习控制律 (5) , 并且控制器增益满足条件为:

当每次迭代初始条件一致时, 即xk (0) =x0 (k=1, 2, 3…) , yk (0) =yd (0) , 即当k→∞时, 有yk (t) →yd (t) .

3 收敛性分析

定义向量函数h:[0, T]→Rn的λ范数:

非线性方程 (4) 的解为:

取Φ (t, τ) =eA (t-τ) , 可得:

将式 (10) 带入式 (11) 可得:

利用分部积分:

将式 (13) 代入式 (12) 可得:

在式 (14) 两端取范数, 则:

将式 (15) 两边同乘e-λt, 得:

整理式 (16) 可得:

由此可见, 只要故障系统满足上述条件, 就可以保证在执行器发生失效故障的情况下, 系统的输出收敛到指定轨迹的邻域内。

4 仿真实例

有以下2输入2输出线性时变系统:

期望跟踪轨迹为:

仿真结果如图1、图2所示。图1是迭代次数为10时, 系统在执行器失效故障发生前后的跟踪曲线;图2为系统发生故障前后的最大误差曲线。

图1表明, 在执行器故障发生的前后, 本文设计的迭代学习控制器使得系统输出单调收敛于期望轨迹的领域内, 系统有较强的跟踪能力。故障系统经过10次迭代学习后, 输出与所设定的目标相匹配。图2表明, 故障系统的输出误差应用本文迭代学习算法的收敛过程。当故障发生时, 系统的2个输出误差较大, 随着迭代次数的增加, 误差的最大值不断减小。经过6次迭代过程, 系统误差便会很小;经过10次迭代过程后, 系统的输出误差最大值接近0.这说明, 本文提出的算法保证了故障系统的跟踪性能, 并且收敛速度较快。

5 结束语

本文以线性时变系统作为研究对象, 在系统发生执行器失效故障的情况下, 采用PD型开环迭代学习算法的控制器, 使得故障系统保持鲁棒稳定, 并且有良好的跟踪特性。仿真结果表明, 此算法具有有效性和可靠性。该方法将传统迭代学习控制与容错控制结合起来, 具有应用范围广、算法易于执行、可靠性强等特点, 这对故障系统的容错控制有非常重要的意义。

参考文献

[1]Seron MM, De Dona JA.Actuator fault tolerant multi-controller scheme using set separation based diagnosis[J].International Journal of Control, 2010, 83 (11) :2328-2339.

[2]Liu L, Shen Y, Dowelle E, et al.A general fault tolerant control and management for a linear system with actuator faults[J].Automatica, 2012, 48 (8) :1676-1682.

[3]Zhang Y, Jiang J.Integrated active fault-tolerant control using IMM approach[J].IEEE Transactions on Aerospace and Electronic Systems, 2002, 37 (4) :1221-1235.

[4]Hwang I, Kim S, Kim Y, et al.A survey of fault detection isolation and reconfiguration methods[J].IEEE Transactions on Control Systems Technology, 2010, 18 (3) :636-653.

[5]吴方圆, 孔峰, 姚江云.线控转向汽车传感器的智能容错设计[J].计算机仿真, 2012, 29 (5) :343-347.

[6]余臻, 刘利军, 沈毅.容错控制器设计及其在线优化选择容错控制[J].控制理论与应用, 2014, 31 (4) :417-424.

[7]韩艳萍, 李红梅.位置传感器故障的PMSM系统容错控制[J].合肥工业大学学报, 2013, 36 (5) :551-554.

[8]蔡超, 姚雪莲, 齐瑞云.卫星姿态系统执行器故障的自适应控制设计[J].航天控制, 2013, 31 (4) :46-55.

[9]张刚, 王执铨, 韩祥兰.执行器故障下不确定非线性系统的鲁棒保成本控制[J].信息与控制, 2006, 35 (4) :474-480.

上一篇:戏剧生态平衡下一篇:会计研究方法