神经网络逆系统

2024-07-12

神经网络逆系统（共7篇）

神经网络逆系统篇1

0 引言

近年来,多种先进的非线性控制方法被应用于发电机励磁系统控制,如逆系统方法[1]、反馈线性化方法[2]、鲁棒控制方法[3]等。基于神经网络的控制方法[4,5,6,7,8,9,10]也得到了广泛应用。

为了提高发电机机端电压和转速的综合控制性能,本文设计了附加神经网络电力系统稳定器(NNPSS)的在线学习神经网络逆(OLANNI)励磁控制器。设计的OLANNI励磁控制器和线性控制器一起组成自适应AVR控制器,在线学习的NNPSS则用于构成自适应PSS控制器。神经网络逆励磁控制器和NNPSS均在离线训练的基础上在线学习,有效增强了控制器对于被控励磁系统不确定性的自适应能力与鲁棒性;基于稳定性理论选取神经网络在线学习的学习速度,保证了神经网络在线学习的收敛性。针对典型的2区域4机电力系统进行的数值仿真结果表明,本文设计的控制器能较好地兼顾发电机的机端电压和转速的控制性能,具有良好的自适应能力。

1 多机励磁系统的可逆性

假定多机电力系统中的所有发电机均采用性能良好的汽门控制器,且不考虑励磁系统的动态环节时,多机电力系统的同步发电机组内部的动态过程可表示为[11]

选择同步发电机机端电压为被控量,即

对式(2)求导,根据逆系统理论,易得:

需要指出的是,式(3)中,E′qi、Idi、Iqi为不直接可测变量,因此式(3)所示的逆系统难以实现。为便于控制器实现,需将不直接可测变量转化为由本地直接可测量表示。根据电机有关理论,课题组已有的研究工作已经证明了可将不直接可测变量E′qi、Idi、Iqi由直接可测变量Uti、Iti、Pti表示[12],从而得到多机励磁系统的逆系统的表达形式为

2 附加NNPSS的OLANNI励磁控制器设计

由于发电机励磁系统难以精确建模,式(4)所描述的逆系统难以解析实现,因此可离线训练神经网络逼近式(4),构造神经网络1阶逆系统;然后,将离线训练得到的神经网络1阶逆系统与被控励磁系统级联,便可得到1阶伪线性复合系统;在此基础上进一步设计闭环控制器。有关离线训练神经网络逆的具体步骤可参见文献[7]。

离线训练得到的神经网络逆系统是在被控励磁系统特定的工况和系统参数下得到的,因此在被控系统工况和系统参数保持不变时,基于离线训练的神经网络逆控制方法具有较好的控制性能。但是,由于电力系统运行中往往很容易遭受各种扰动,而离线训练的神经网络缺乏对被控系统动态的自学习能力,因此会导致系统控制性能的下降。为了提高被控电力系统在不确定性下的机端电压控制性能,本文在离线训练的神经网络逆励磁控制器的基础上设计了OLANNI励磁控制器;同时,为在控制机端电压的同时兼顾转速的控制性能,设计了在线学习的NNPSS。

传统的AVR/PSS控制器的原理图如图1所示(为简单计,原理图中省略了下标i,下同),但由于AVR/PSS是在电力系统特定的运行点处设计的,因此当系统的工况发生变化时,控制性能就会下降。本文借鉴AVR/PSS的控制结构,提出了附加NNPSS的OLANNI控制器,其原理如图2所示,包含OLANNI控制器和NNPSS 2部分。OLANNI和设计的线性控制器一起,主要用于机端电压的稳定控制;NNPSS则主要用于阻尼系统的振荡,提高转速的控制性能。

2.1 OLANNI励磁控制器设计

OLANNI用于在线辨识被控励磁系统的1阶逆系统,并与设计的线性控制器一起取代AVR控制器,用于机端电压的稳定控制,其原理图如图3所示。

2.1.1 神经网络逆在线学习算法

为简单计,将第i台发电机励磁系统的神经网络逆的输入、输出关系描述为输入“1”对应神经网络的阈值,σ(·)为隐层的激活函数,本文取σ(x)=[1-exp(-2 x)]/[1+exp(-2 x)];ni为神经网络隐层节点的个数;分别表示神经网络隐层到输出层的连接权值矩阵、输入层到隐层的连接权值矩阵;mi为xi的维数,即mi=dim(xi);ui为神经网络逆的期望输出。

神经网络逆在离线训练的基础上在线学习。有关神经网络逆离线训练的具体步骤参见文献[7]。神经网络逆在线学习时,选取如下的性能指标:

神经网络逆励磁控制器在离线训练的基础上在线学习,这有利于被控系统的初始稳定和神经网络的收敛。但在线学习时需要调节神经网络逆的权值矩阵W1i和W2i,计算量很大。考虑到当单隐层神经网络的隐层节点个数ni≥2时,神经网络输入层到隐层的连接权值的调整对网络的逼近特性影响很小,所以可固定输入层到隐层的连接权值矩阵,只调整隐层到输出层的连接权值矩阵[13,14]。本文基于上述思想,将离线训练后神经网络逆输入层到隐层间的权值矩阵W2i保持不变,将σ(WT2ixi)作为基函数,从而在监督学习方式下只需在线调节神经网络逆的权值矩阵W1i,这大幅减少了神经网络在线学习时的计算量。这样,可得神经网络逆在线学习算法如下:

当时,eui=0,此时复合系统是伪线性系统,神经网络不更新权值;而当时,eui≠0,此时如果,则根据式(6)在线调节权值。其中ci取为0.01~0.05的常数。

需要指出的是,神经网络在线学习时,学习速度η1i对神经网络的收敛性具有重要的作用。下面给出神经网络逆在线学习的收敛性证明。

2.1.2 OLANNI的收敛性分析

定理:当OLANNI的学习速度η1i满足时,在线学习的神经网络收敛。

证明:设计Lyapunov函数

根据式(6),有

由式(7)可得:

由误差增量与神经网络权值增量的关系[15],可得:

将式(8)(10)代入式(9),有

在线学习的神经网络收敛。

解得:

证毕。

2.1.3 OLANNI的工作过程

下面描述OLANNI励磁控制器在闭环时的工作过程。

步骤1 t=0,导入离线训练后神经网络逆的连接权值,以初始化OLANNI。

步骤2闭环控制下,在t时刻采集信号Uti(t)、Iti(t)、Pti(t),并使用数值微分技术(七点求导法)计算相应的导数

步骤3如果,根据式(6)在线更新神经网络逆控制器的连接权值;否则,不更新。

步骤4 t=t+T,返回步骤2。

2.2 NNPSS设计

NNPSS控制器包括神经网络辨识器(NNI)和神经网络控制器(NNC)2个部分。NNI用于在线辨识被控系统的动态,NNC则用于取代传统的PSS控制器,提供励磁控制的辅助控制量。

NNPSS控制器的原理图如图4所示。

2.2.1 NNI在线学习

NNI主要用于被控系统的在线辨识。NNI基于被控系统的非线性自回归滑动平均(NARMA)模型设计,NARMA模型中输入和输出的延迟阶数可根据经验或试凑的方法获得。本文中NNI选用广泛使用的单隐层神经网络;同时为有利于NNI的收敛,NNI采用串-并联结构。

假设第i台发电机的实际转速与同步转速之差满足如下的NARMA模型[5]:

其中,

使用NNI逼近式(13)所描述的非线性映射。为简单计,将NNI的输入、输出描述为

此时,NNI的输入为,“1”与NNI输入层到隐层的偏置相对应。

选取NNI在线学习时的性能指标为

NNI同样基于基函数思想在线更新权值,其权值更新的算法如下:

此时,NNI的输入为

在线学习NNI具有2个作用,一是用于在线辨识系统的动态特性,二是用于在线计算偏导数,并将其用于NNC权值的在线更新。

2.2.2 NNC在线学习

NNC主要用于取代传统的PSS控制器,提供励磁控制的辅助控制量,以阻尼系统的振荡。为简单计,将NNC的输入、输出关系表示为

其中,输入为

文献[5]设计了一种NNC在线学习时的性能指标,但是在所选取的性能指标下,不能直接通过NNI得到。为便于NNC的在线学习,本文选取NNC在线学习时的性能指标为

其中,Δωdi(t+2 T)=0,为转速误差的期望值。在t时刻,为了得到的值,应取NNI的输入为[1 upssi(t)upssi(t-T)upssi(t-2T)Δωi(t+T)Δωi(t)Δωi(t-T)Δωi(t-2T)]T。当NNI达到一定的辨识精度时,Δωi(t+T)可用NNI的输出代替,即。

NNC在线学习的算法为

其中,可由NNI在线计算得到。具体的计算公式为

其中,mi、ni分别为NNI的输入层和隐层节点的个数。可通过NNC计算得到,具体为

2.2.3 NNPSS的工作过程

下面是所设计的NNPSS在闭环时的工作过程。

步骤1 t=0导入离线训练后NNI和NNC的连接权值,进行初始化。

步骤2计算NNI的输出,如果有,根据式(16)(17)在线更新NNI的连接权值,并计算。

步骤3计算,如果,根据式(19)~(22)在线更新NNC的连接权值。

步骤4 t=t+T,返回步骤2。

在本文中,取kωi=0.05,ki=0.01。此外,为保证神经网络在线学习的收敛性,NNI和NNC的学习速度取值为

证明过程与神经网络逆在线学习类似,限于篇幅,此处不再赘述。

3 数值仿真

以图5所示的典型的2区域4机电力系统为例进行数值仿真研究。多机系统中各发电机组参数以及线路参数参见文献[11]。

根据分散控制思想,分别对发电机G1~G3设计OLANNI励磁控制器和NNPSS。神经网络逆励磁控制器离线训练的步骤可参见文献[7]。NNPSS中的NNI和NNC离线训练样本采样于AVR/PSS控制器作用下的被控系统。为了能较充分获得系统的动态特性,在AVR/PSS控制器作用下,对被控系统设置不同的机端电压参考值Utref和机械输入功率Pm。本文设置的机端电压参考值Utref变化范围为被控系统稳定工作点对应的Utref的90%~110%,机械输入功率Pm的变化范围为被控系统初始稳定工作点对应的Pm的80%~120%。

离线训练时,通过多次试验比较的方法确定各神经网络逆和NNI、NNC隐层节点的个数。经过离线训练后,最终确定发电机G1~G3的神经网络逆控制器的结构分别为6-20-1、6-40-1、6-20-1;NNPSS中NNI的结构分别为7-16-1、7-16-1、7-20-1;NNC的结构分别为7-20-1、7-20-1、7-30-1。神经网络逆和NNPSS均在离线训练的基础上在线学习。针对各发电机的神经网络逆和各发电机励磁系统组成的复合系统设计的闭环控制器均为P型控制器,且比例系数均为20。

数值仿真分别考虑了仅发电机G1安装所提控制器和发电机G1~G3均安装所提控制器2种情形,并比较了所提出的附加NNPSS的OLANNI励磁控制器与AVR/PSS控制器、OLANNI励磁控制器的控制性能。

3.1 仅发电机G1安装所提控制器

针对发电机G1的数值仿真考虑了多种扰动情形。限于篇幅,此处仅给出机端电压参考值变化和三相短路故障2种运行方式,并比较了所提控制器与AVR/PSS、OLANNI的控制性能。

运行方式1:假设2 s时,发电机G1的机端电压参考值Utref由初始值增加10%,G1的机端电压和转速控制效果如图6所示(曲线1为AVR/PSS,曲线2为OLANN+NNPSS,曲线3为OLANNI,后同)。

运行方式2:假设1 s时,系统发生三相短路故障,0.05 s故障切除,系统重新恢复到双回线运行。发电机G1的机端电压和转速控制效果如图7所示。

从图6可见,在机端电压参考值发生变化时,AVR/PSS控制器控制下的机端电压存在稳态误差(约5%),而OLANNI励磁控制器和本文提出的附加NNPSS的OLANNI励磁控制器控制均能较好地实现机端电压的控制;但附加NNPSS的OLANNI励磁控制器的机端电压控制性能不及OLANNI励磁控制器,这是因为被控系统工况(机端电压参考值)改变后,发电机的转速振荡需要一定的时间才能平息,从而使得NNPSS的输出(upss)在机端电压设定值端增加了扰动,因此增加了用于机端电压稳定控制的OLANNI与PID控制器的调节时间。同时可见,AVR/PSS和本文提出的附加NNPSS的OLANNI励磁控制器均能实现转速的稳定控制,而未附加NNPSS的OLANNI不能快速平息转速的振荡。

从图7可见,在系统遭受到大扰动时,AVR/PSS、OLANNI以及本文提出的附加NNPSS的OLANNI励磁控制器均能较好地实现机端电压的稳定控制,但是本文提出的附加NNPSS的OLANNI励磁控制器能更快地平息转速的振荡。

因此,可以认为,就本地发电机的分散控制而言,本文提出的附加NNPSS的OLANNI励磁控制器能较好地兼顾发电机机端电压和转速的控制,提高了发电机的综合控制性能。

3.2 发电机G1~G3均安装所提控制器

多机电力系统控制时G1~G3均安装所提附加NNPSS的OLANNI励磁控制器。数值仿真考虑了三相短路故障的情形。假设系统开始工作在双回线稳态,0.1 s时,被控电力系统发生三相短路故障,故障持续0.05 s后,切除一回线,线路单回线运行。发电机G1~G3的机端电压和转速控制效果如图8~10所示。

从图8~10可见,在系统发生大扰动且扰动后系统进入一个新的运行状态时,本文针对各发电机组提出的附加NNPSS的OLANNI励磁控制器仍能较好地实现机端电压和转速的稳定控制;未附加NNPSS的OLANNI励磁控制器虽然能较好地实现机端电压的稳定控制,但难以平息转速的振荡;而AVR/PSS控制器控制下的机端电压存在稳态误差。

可见,本文针对各发电机组设计的附加NNPSS的OLANNI励磁控制器能较好地兼顾各本地发电机机端电压和转速的分散控制,从而有利于整个电力系统的稳定控制。

4 结语

针对多机电力系统设计了附加NNPSS的OLANNI励磁控制器,该控制器具有3个特点。

a.OLANNI励磁控制器和线性控制器一起组成了自适应AVR控制器,在线学习的NNPSS则构成了自适应PSS控制器。由于OLANNI励磁控制器与NNPSS均在离线训练的基础上在线学习,具有在线学习和自适应能力,因此能有效增强控制器对于电力系统不确定性的适应能力与鲁棒性。

b.基于李亚普诺夫稳定性理论证明了当神经网络在线学习的学习速度满足一定条件时,神经网络在线学习的收敛性。

c.附加NNPSS的OLANNI励磁控制器较好地兼顾了机端电压和转速的控制,提高了系统的综合控制性能。

该附加NNPSS的OLANNI励磁控制器是基于分散控制的思想设计的,各分散控制器的协调控制是有待进一步研究的问题。

神经网络逆系统篇2

微逆监控系统是监控微逆设备运行状态的软件系统, 就其数据通信而言, 主要涉及了三种形式的通信:

(1) 微逆与监控单元之间是通过电力线载波来通信[1];

(2) 监控单元与监控服务器之间是通过互联网来通信;

(3) 监控服务器与监控客户端之间是通过局域网或互联网通信。

监控单元负责监控微型逆变器的工作状态以及与监控服务器之间的通信传输, 它通过电力线载波通信采集微逆的工作数据或向微逆发送控制命令, 同时监控单元具有网络模块, 可通过互联网将微逆数据传向监控服务器, 也可接收服务器的控制命令[2]。

1 微逆监控系统通信方面存在的问题

1) 监控单元数据量庞大

投入商业运营的监控单元在数量上是很大的, 以每年增加5万台计算, 要求每台监控服务器能监控的监控单元尽可能多, 也就是服务器的并发处理能力要非常强。

2) 开发复杂度高

实现高性能的服务器必然涉及较为复杂的网络通信 (例如IOCP完成端口) 以及操作系统 (例如多线程) 方面的技术细节, 如何能让监控系统, 尤其是监控系统应用层的开发, 避免底层通信的复杂与繁琐, 又能得到高质量的代码, 是整个系统开发与灵活扩展的关键。微逆监控系统构成如图1所示[3]。

2 Data Link的实现原理与构成

Data Link的开发是基于插件方式的, 所谓基于插件的开发, 就是将整个软件开发工程, 分解为若干插件开发子工程以及插件容器 (主程序) 开发的一种软件开发方式, 每个插件子工程都是独立的, 可以单独维护、升级, 也可以不断地添加插件。插件方式是一种在很多方面都有优势的软件开发方式, 其具有可扩展性强、软件复用方便、便于团队协作开发等优势[4,5]。

Data Link的基本插件功能由专门开发的插件平台 (“Plugin Platform”, 简称“Platform”) 提供, “Platform”有以下几方面的特点:

(1) 开发语言, 环境是VC++6.0;

(2) 在物理上, 插件是独立的动态链接库 (dll) ;

(3) 开发时, 插件的代码是独立的工程, 独立编译;

(4) 提供简单、一致的协议 (可以称之为“插件消息”) , 完成相互之间的调用;

(5) 实现了一种简单的插件发现与加载机制, 各插件与容器之间的集成是二进制意义上的“即插即用”;

(6) 运行时, 插件运行在容器的进程空间中, 调用开销小, 运行效率高。

Data Link以解决网络通信任务为核心, 与插件平台有机结合, 把通信功能的内部实现封装在一些专门的插件中, 实现了网络消息与插件消息的相互转化, 形成一套基于插件的、高效、良好封装、方便集成与使用的网络通信开发架构。网络通信架构如图2所示。

Data Link的实体部分主要由以下两部分构成:

(1) 通信服务器 (Server) ;

(2) 客户端通信插件 (Networking) 。

Data Link是与具体业务逻辑无关的, Data Link与负责具体业务逻辑的若干插件集成, 就构成了完整的软件系统, 比如微逆监控系统。

另外, Server和Client是插件容器, 各自包括若干业务插件。Server中的插件称之为Plug S, 可以有若干Plug S:Plug S1, Plug S2, …;Client中的插件称为Plug C, 可以有若干Plug C:Plug C1、Plug C2、…, Networking其实也是一个Plug C。

在Data Link体系中, 一个能很好地体现代码复用的地方是:许多插件, 尤其是用到网络的应用插件, Plug C和Plug S往往是成对出现的, 在代码工程上是一个, 通过设置的编译开关:_4SERVER将代码编译为不同的插件, 比如, 定义了预编译符号_4SERVER, 将编译为服务器端插件, 没有定义预编译符号_4SERVER, 就被编译为客户端插件。

在Data Link体系中, Plug C和Plug S都属于应用层, 即上层业务逻辑部分, 它们主要处理与业务相关的工作, 需要收、发网络消息时, 只需要按照通信协议, 简单地调用准备好的服务即可。

2.1 Server (通信服务器)

Server是Data Link体系中最重要的组成部分, 负责侦听、管理客户端连接, 以及接收、发送数据, 采用IOCP完成端口通信模式[6], 同时, Server也是Plug S插件的容器。通信服务器核心流程如图3所示。

2.2 Networking (客户端通信插件)

Networking是一个专门负责与服务器进行通信的客户端插件, 由Networking处理网络通信的细节工作, 其他的客户端插件Plug C通过它完成网络通信的工作。

Networking采用WSAEvent Select网络I/O模式, 创建一个专门的线程来处理相关的网络事件, 遵循Data Link通信协议, 将接收到的数据, 封装成“消息”, 发向其他Plug C。

对于其他的Plug C来说, 调用Networking的服务, 完成网络通信操作是非常简单的, 几乎完全不需要了解网络通信的细节, 发送数据的主要代码举例如下:

连接的初始化、数据“消息化”、自动重连、保存连接设置等功能都封装在Networking插件中, 通信插件界面如图4所示。

3 Data Link的通信协议

为了获得可靠连接和传输的优越性, Data Link选择了TCP/IP协议作为底层的通信协议, 同时, 为了便于上层业务逻辑的开发, Data Link应具有以下特点:

(1) Data Link能够支持消息方式。TCP/IP协议是一种“流” (stream) 协议, 本身并没有消息 (message) 的概念, 但基于消息的方式对上层业务逻辑的开发是方便的, 因此在Data Link中引入消息的概念, 即让Data Link与上层业务逻辑 (Plug C、Plug S) 之间使用消息的方式传输、处理数据。

(2) Data Link与业务逻辑相分离。Data Link不涉及具体的上层业务逻辑, 具有高度的抽象性。

3.1 网络消息结构

Data Link定义的网络消息结构:

3.2 协议详细解释

3.2.1 应用层标识

应用层标识是消息标识 (token) 的低字节 (WORD) , 是纯应用层相关的标识, 由上层业务逻辑插件 (Plug C、Plug S) 自己定义、自己使用。

3.2.2 网络传输标识

网络传输标识, 用于标识网络消息传输过程中的一些特性, 是消息标识 (token) 的高字节。网络传输标识又分为传输类型和其他标识。

1) 传输类型

传输类型决定一个消息的传递目的地, 以及其他一些特性, 数据类型是一个BYTE, 是网络传输标识的低字节。共有三种传输类型, 如表1所示。

2) 其他标识

设置在token的最高的字节上的一系列位开关, 一般由应用层使用。

3) 消息体

消息体存放与具体业务逻辑相关的内容, Data Link不关心消息体的内容, 只是按照消息的传输类型, 对其进行传送或接受, 上层业务逻辑 (Plug C、Plug S) 负责解释和使用。

4 微逆监控系统开发

微逆监控系统一般由:监控单元、通信服务器、监控客户端、终端用户客户端、数据库等部分构成, 通过互联网或局域网传输数据与控制命令, 每个组成部分的开发又涉及很多功能模块, 比如监控客户端, 要有人机界面部分, 具有安全管理、数据库操作功能及网络通信功能等。

以负责微型逆变器工作状态的数据传输、保存、显示的功能模块为例, 介绍如何在Data Link中开发这部分功能。为处理这部分功能, 创建一个插件工程:PLUGIN_ECU, 该工程被编译为成对的两个插件:

(1) PLUGIN_ECU.dll

这是个客户端插件, 是监控客户端的一部分, 负责微型逆变器相关的客户端功能。

(2) PLUGIN_ECU_S.dll

这是个服务器端插件, 运行在服务器容器中, 负责处理服务器端的微型逆变器数据逻辑。

4.1 监控单元向监控系统发送微逆工作状态信息

微逆工作状态数据包括:系统状态、电池板电流值、电池板电压值、输出功率值、电网电压值、电网频率值、机内温度值。插件工作示意图见图5所示。

4.2 监控客户端向监控单元发送关机命令

监控客户端向监控单元发送关机命令, 其流程如图6所示。

4.3 系统测试

采用两台计算机作为客户端, 每客户端产生5 000个线程, 每个线程连接服务器, 并循环向服务器发送长度50字节的数据, 两台客户端大约可以模拟10 000个并发连接。通信服务器是一台4CPU、4 GB内存的计算机, 运行时, 通信服务器共产生10个通信线程, 服务器CPU占用平均为30%, 内存消耗维持在35 MB左右, 120 min测试, 内存消耗波动在5 MB以内。经测试, 通信服务器能稳定地支持万级的并发连接, 达到了预期的设计目的。

5 结语

Data Link在支撑微逆监控系统开发与运行中具有如下三方面的突出优势:

(1) Data Link大大减轻了上层应用开发处理网络通信方面的负担, 使应用功能的开发者只需专注于解决应用逻辑方面的问题, 而几乎不需要了解网络通信方面的知识。 (2) 由同一插件工程两种编译结果的方式 (如PLUGIN_ECU.dll和PLUGIN_ECU_S.dll) , 分别在客户端和服务器端处理同一方面的业务逻辑, 在软件升级、维护的时候容易保持一致。 (3) Data Link提供了:无服务器模式;客户端、服务器通信模式;级联服务器模式等多种通信模式。

参考文献

[1]王思彤, 袁瑞铭, 孙志杰.低压电力载波技术及其在抄表系统中的应用[J].电测与仪表, 2008 (3) :31-34.

[2]李秉键.光伏并网逆变器人机接口单元的设计[J].低压电器, 2011 (11) :28-32.

[3]仝世君.网络远程控制系统关键技术设计[J].制造业自动化, 2011 (5) :204-206.

[4]张喜铭.远程方式维护变电站监控系统研究与实现[J].广东电力, 2011 (6) :72-74.

[5]张继平.通信网络智能管道架构与技术实现[M].北京:电子工业出版社, 2012.

神经网络逆系统篇3

关键词：逆系统,逆模型,逆模型控制系统,航空发动机

航空发动机是一个复杂的强非线性系统, 过去采用线性化的方法虽然能够保证发动机在小范围内较好的工作, 但随着对发动机性能要求的提高, 这种方法已经不再适用。近年来, 各种非线性控制理论被应用于航空发动机控制的研究中, 如自适应控制、鲁棒控制、神经网络控制等[1,2,3], 但是由于各种原因, 例如控制的稳定性、发动机精确数学模型的建立等, 目前这些控制方法均未应用到实际的发动机控制中。

1986年, 美国斯坦福大学著名教授Widrow首次提出逆模型控制 (Inverse control) 的概念[4], 也就是利用逆系统方法为对象设计逆模型控制系统。经过近二十年的发展和应用, 逆模型控制已经成为现代控制理论向智能控制发展的一个全新的活跃分支。资料显示, 逆模型控制已经在船舶[5]、电炉温度预报[6]、飞行模拟器[7]等领域中得以应用。20世纪末期, Rolls-Royce公司为了提高航空发动机的性能, 将逆模型控制引入航空发动机的控制中[8,9]。从理论上讲, 逆模型控制是解决非线性系统控制问题的最佳方法, 因为一旦完全准确地建立系统的逆模型, 那么将期望输出作为整个系统的输入, 最终输出的也就是期望值。因此, 对于航空发动机这样一个复杂的强非线性系统来说, 逆模型控制是一种非常好的方法。Rolls-Royce公司的试验结果也显示, 逆模型控制系统能够很好地完成发动机的稳态和过渡态控制, 并且能够达到较好的控制精度和稳定性。在随后的十几年间, Rolls-Royce公司不断地完善了逆模型控制方法, 并已成功地把它利用在Trent1000的控制系统上。

本文将把逆模型控制方法应用到国产某型号涡扇发动机上, 在原有模型的基础上, 通过仿真建立该发动机的逆模型, 并基于此逆模型设计了相应的逆模型控制系统。仿真结果显示, 逆模型控制系统能够较好地完成此型号发动机的稳态和过渡态控制, 并且控制精度和稳定性较好。

1逆系统方法的基本思想

众所周知, 逆概念具有普遍意义。对于函数, 有反函数;对于矩阵, 有逆矩阵;对于系统的运动亦有逆运动。一般意义上, 这些关系都可看成映射和逆映射或变换和逆变化。从数学模型角度看, 所谓系统相当于对象在给定初始条件下, 输入到输出的一个变换, 即

T: $u \to y (y (0) = y_{0}, \dot{y} (0) = \dot{y}_{0}, \dots, y^{(n - 1)} (0) = y_{0}^{(n - 1)})$ 。

n为系统阶次, y为n阶可微函数。若在满足初始条件的情况下, 存在一个系统即便换 $\hat{Τ}$ :y→u, 则称该系统为原系统的逆系统, 既有 $Τ \hat{Τ} y = Τ u = y$ 。

设非线性系统的微分方程为 $y^{(n)} = f [y, \dot{y}, \dots, y^{(n - 1)}, u, \dot{u}, \dots, u^{(m)}]$ 。假设原非线性系统存在连续解 $u^{(m)} = g [y, \dot{y}, \dots, y^{(n)}, u, \dot{u}, \dots, u^{(m - 1)}]$ , 且满足原系统所给的初始条件。取φ=y (n) (t) , 将n阶积分逆系统和原系统相串联构成的复合系统称为伪线性系统。当系统中y, $\dot{y}$ , …, y (n-1) 均可测量时, 伪线性系统的结构如图1所示。

逆系统方法为非线性系统控制器设计指出一条新途径。对于给定系统f, 如果存在上述定义的逆系统 $\hat{f}$ , 则称系统f为可逆系统。将 $\hat{f}$ 作为控制器的一部分串接在原系统f之前, $\hat{f}$ 和f构成的系统就是一个单位映射的理想系统。

2发动机逆模型

发动机是一个典型的非线性系统, 在这里采用上述逆系统方法建立发动机的伪线性系统, 进而完成发动机逆模型控制系统的设计。

2.1发动机伪线性系统

选取被控量为发动机高压转子转速加速度 $\dot{Ν}$ h, 控制量为燃油流量wf, 那么发动机的微分方程为 $\dot{Ν}_{h} = F (Ν_{h}, w_{f})$ , 假设发动机非线性微分方程存在连续解 $w_{f} = G (Ν_{h}, \dot{Ν}_{h})$ 。使发动机伪线性系统输入等于发动机输出 $\dot{Ν}$ h, 则根据上一部分理论, 可以得到发动机伪线性系统结构图。

那么就需要寻找供油量、高压转子转速, 高压转子转速加速度三者之间的关系。在这里采用仿真实验的方法来获取上述关系。

2.2发动机逆模型的建立

逆模型可以看作是对象输入输出的“倒置”, 因此需要对发动机输入输出之间的关系有一个清晰的认识。只考虑燃油流量对高压转子转速的影响, 不考虑各喉道、尾喷口面积变化和各可调导叶角度的变化对高压转子转速的影响, 就可以把发动机看做是一个单输入单输出的模型。模型输入为燃油流量wf, 输出为高压转子转速Nh。在设计点时, 发动机模型的输出仅取决于当前的供油量。那么, 发动机模型可以用下面数学表达式表示:

Nh=f1 (Fss) 。

上式模型可以用来表示发动机稳态过程, 其中Nh为稳态高压转子转速, Fss为对应的稳态供油量。而在过渡态中, 供油量除了维持当前转速还需要提供转速变化量, 因此过渡态模型表示为

Nht+1=Nht+ΔNh=f1 (Fss) +f2 (Δwf, Nht) 。

即下一时刻转速Nht+1由前一时刻转速Nht加上转速的变化量ΔNh。因为在其他条件不变 (转子质量、质量分布等) 时转子惯性可以表示成转速的函数, 所以ΔNh由燃油变化量和前一时刻转速决定。

考虑到发动机在某个转速下, 转子转动惯量不变, 因此对应转速下单位燃油变化量dwf引起的转速加速度dNh是不变的, 即 $\frac{d Ν_{h}}{d w_{f}} = f_{3} (Ν_{h})$ 。则ΔNh可以表示为:

$Δ Ν_{h} = f_{2} (Δ w_{f}, Ν_{h_{t}}) = Δ w_{f} \frac{d Ν_{h_{t}}}{d w_{f}} = Δ w_{f} f_{3} (Ν_{h_{t}})$ 。

通过上面分析, 可以了解到发动机某一时刻的转速Nht完全取决于该转速下的稳态供油量和提供转速变化的燃油变化量之和。那么控制器需要解决的问题就是计算出发动机某转速下稳态供油量和产生转速变化所需的燃油变化量:

$w_{f} = F_{s s} + Δ w_{f} = \hat{f}_{1} (Ν_{h}) + Δ Ν_{h} \frac{d w_{f}}{d Ν_{h}} = \hat{f}_{1} (Ν_{h}) + \frac{Δ Ν_{h}}{f_{3} (Ν_{h})}$ 。

上式中 $\hat{f}$ 1即为f1的逆。可以注意到上面的公式都未给出精确函数。变量间的关系可以通过实验的方法得到, 本文通过对发动机模型进行稳态和过渡态仿真得到。通过仿真获取发动机输入与输出变量数据, 对这些数据处理得到发动机的逆模型, 在这里只考虑发动机在地面状态工作。具体方法如下:

(1) 在MATLAB/simulink下搭建如图3所示模型, 其中Engine模块内为封装的发动机模型。

(2) 使发动机模型模块输入的燃油流量wf从580 kg/h缓慢变化至5 200 kg/h, 在这里选取步长为0.015 kg, 也就是每秒的变化值仅为0.6 kg。因此完全可以用来模拟发动机的稳态过程。选取不同的满足条件的数据会稍微影响逆模型的精度, 但特性不会发生变化。通过仿真收集稳态过程中燃油流量和相应的高压转子转速数据, 得到两者的函数关系并制成曲线, 如图4 (a) 中实线所示。

(3) 由于原控制器燃油最大变化量为50 kg, 在这里令输入燃油流量wf从580 kg/h变化至5 200 kg/h, 步长为50 kg/h, 也就是模拟发动机的加速过程, 同样收集发动机输出高压转子转速和燃油流量数据, 得到两者的函数关系并制成曲线, 如图4 (a) 中虚线所示。

(4) 由于在稳态和过渡态中, 同一转速下稳态燃油流量和过渡态是不同的, 将此转速下转子加速度dNh与流量差值 (wf-Fss) 相除, 得到该转速下单位燃油变化量所引起的转子加速度, 其关系曲线如图4 (b) 所示。在这里 $\dot{Ν}_{h} / d F = d Ν_{h} / (w_{f} - F_{s s})$ 。

图4 (a) 中稳态曲线和图4 (b) 即为发动机逆模型, 本文将以此为中心设计发动机控制器。

3发动机逆模型控制系统设计

本文构建以逆模型控制器 (IC, Inverse Control) 为核心的逆模型控制系统结构如图5所示。其中控制对象为与前面相同的涡扇发动机非线性模型, 在MATLAB下将原模型C程序封装成一个模块, 输入为燃油流量wf, 输出为发动机压比EPR。控制回路将期望压比EPR Demand与反馈的实际压比EPR作差得到误差EPRError, 经过比例环节转换成期望转速变化量 $\dot{Ν}$ h Demand。IC通过计算将 $\dot{Ν}$ h Demand转换成发动机当前所需燃油流量指令wf_d, 并输入到发动机模型中。

图5中IC模块的内部结构为

图6中Nh为高压转子转速, $\dot{Ν}$ h为该转速下单位燃油变化量dF所产生的转子加速度, Fss为该转速下稳态供油量, wf_d为IC计算得到的当前燃油流量, wf为发动机模型反馈回IC的燃油流量, 在本文中忽略了控制器和模型之间的供油装置, 因此可以认为wf_d和wf是相等的。

从图6中可以看到IC获取由发动机模型反馈回来的当前燃油流量wf, 通过计算转化成发动机的高压转子转速Nhm;Nhm经过动态表 $\dot{Ν}_{h} / d F$ 对应Nh输出该转速下单位燃油变化量引起的转子加速度 $\dot{Ν}_{h} / d_{F} ‚ \dot{Ν}_{h} / d_{F}$ 的倒数与期望转速变化量 $\dot{Ν}$ hDemand相乘得到加速或减速所需的燃油变化量Δwf;Nh经过稳态表输出该转速下对应的稳态燃油量Fss。稳态燃油量Fss与燃油变化量Δwf相加得到下一时刻发动机所需燃油量wf_d。

而且可以注意到, 图6的结构中采用的转子转速并非来自发动机输出反馈, 而是通过反馈当前燃油量, 经过计算得到的转速。这种结构可以消除因逆模型建立不准确所带来的误差, 具有较好的鲁棒性[8]。

4仿真验证

在MATLAB/Simulink下搭建图5所示的逆模型控制系统, 进行地面状态 (H=0 km, Ma=0) 下全过程仿真。在实验过程中, 发动机油门杆角度首先由中间状态30°加大至最大非加力状态70°;稳定一段时间后, 发动机进口压力增加5%, 模拟外部干扰, 查看控制器消除干扰的能力;最后发动机减速, 至油门杆角度40°。发动机各参数变化如下表所示。

图7 (a) 中实线为发动机实际压比随时间的变化曲线, 从图中可以看出, 加速指令给出后, 发动机压比快速爬升至稳定状态。在进口条件出现变化时, 压比发生突变, 但很快回归原值。图7 (b) 为发动机压比误差随时间的变化曲线, 加速指令给出后, 压比误差陡然增大, 并快速回落至0, 在进口条件出现变化后, 控制系统也可以很快将误差调整至0。

图8、图9分别为发动机高低压转子响应曲线和高压转子稳定裕度曲线, 设定发动机到达目标转速95%为加速上升时间, 仿真结果显示, 发动机转子上升时间为2.825 s。稳定裕度在大部分时间都是在0.1以上, 只在加速初期略小于0.1, 基本满足发动机稳定性要求。

从仿真结果中可以看出, 逆模型控制系统动态过程响应迅速、无稳态误差, 发动机加减速性能良好, 同时控制系统有较好的抗干扰能力。

5结论

本文针对航空发动机强非线性的特点, 将逆模型控制方法引入到发动机控制中。通过对某型发动机稳态和过渡态下燃油流量和高压转子转速变化情况进行分析, 建立了发动机的逆模型, 并以此为基础, 设计了该型发动机的逆模型控制系统。仿真结果显示, 逆模型控制系统能够保证发动机稳定工作, 并且其各项动态性能满足设计要求。通过研究还可以发现, 逆模型控制系统具有结构简单、易于实现和计算量小等优点。

参考文献

[1]袁春飞, 孙建国, 姚华.航空发动机模型参考模糊自学习控制.南京航空航天大学学报, 2004;36 (2) :15—158

[2]王海泉, 郭迎清, 陆军.航空发动机二自由度鲁棒控制LMI方法研究.航空动力学报, 2009;24 (6) :1413—1419

[3]刘延峰, 郭迎清.基于新型神经网络的航空发动机多变量控制.航空发动机, 2005;31 (1) :34—36

[4] Bernard W.Adaptive inverse control.United States:Int Soc for Opti-cal Engineering, 1990:13—21

[5]赵隽, 战兴群, 张炎华.基于自适应逆控制技术的船舶操纵仿真控制.上海交通大学学报, 2003;37 (8) :1168—1171

[6]芦春甍, 顾佳畏, 孙彦广.基于SVM逆模型的电炉静态温度预报模型研究.仪器仪表学报, 2008;29 (4) :821—824

[7]袁朝辉, 李凌.基于自适应逆控制的无人机负载模拟器复合控制.西北工业大学学报, 2005;23 (4) :256—260

[8] Mahmood S, Griffin I A, Fleming P J.Robust control of a gas turbinewith variable power offtake.American Society of Mechanical Engi-neers, 2006:919—926

神经网络逆系统篇4

飞行安全是一个非常重要的研究课题,而飞行控制系统的设计对飞行的安全性和稳定性有着决定性作用。应用动态逆方法的飞行控制系统设计,实现了被控对象的线性化和输入输出解耦[1]。然而,动态逆方法要求精确模型解析式,在实际应用当中大多数工业过程呈现出较强的非线性性且难以用解析式描述,这样对于应用动态逆方法的系统来说具有很大的挑战。基于这些因素的考虑,MacKunis W, Patre P M等人将神经网络模型参考自适应控制系统与动态逆结合[2],根据系统实际输出和模型输出的误差调整控制器参数,以保障控制系统的输出特性和鲁棒性。本文针对飞行安全控制,应用遗传蚁群算法[3]优化神经网络,设计了一种基于神经网络的模型参考自适应动态逆方法。将本方法应用于波音747—100/200飞机模型的飞行控制系统,仿真结果表明,文中提出的飞行控制方法有良好的效果,有效地补偿建模误差,提高了算法的收敛速度,并且保证了系统的鲁棒性。

1 建立动态逆模型

本文采用动态逆方法对系统进行线性化。考虑飞行控制系统,可以用如下非线性方程描述[4]。

${\begin{cases} \dot{x} (t) = f (x (t)) + g (x (t)) u (t) + δ (t) \\ y (t) = h (x (t)) \end{cases} (1)$

式(1)中, x(t)∈Rn为状态向量;u(t)∈Rm为输入向量;y(t)∈Rl为输出向量;δ(t)为系统的测量噪声和对象扰动。f:Rn→Rn,一阶连续;h:Rl→Rl,充分可微,均为非线性映射函数;对原系统求逆,选择适当的控制输入u(t):

$u (t) = g^{- 1} (x (t)) [v (t) - f (x)] (2)$

获得期望的动态响应:

$\dot{x} (t) = v (t) (3)$

原系统被补偿为线性系统,我们称为伪线性系统,v(t)称为伪控制变量。

由于外界干扰的影响以及飞行控制系统的复杂耦合关系,同时加上求取逆模型进行的是近似计算,不可避免地存在参数摄动和建模误差。式(3)可改为:

$\dot{x} (t) = v (t) + ζ (4)$

ζ是逆模型误差,采用神经网络补偿器进行补偿,再根据模型参考自适应控制方法设计自适应控制律,使得故障系统能很好地跟踪参考模型输出。

2 基于BP神经网络模型参考自适应逆控制器

模型参考自适应控制[5]的目标是使跟踪误差收敛于零,将系统实际输出与参考模型输出之间的偏差信号输入到自适应机构,以此对控制律中的参数进行调整。

本文中,自适应机构采用BP网络算法。神经网络模型参考自适应系统如图1,其控制器部分由神经网络构成,利用误差来调整神经网络控制器参数,同时加入逆模型实现线性化和解耦,逆模型由神经网络进行补偿,使得系统达到满意的动态特性。

首先补偿系统的建模误差,然后根据模型参考自适应方法设计自适应控制律,使得故障系统逼近参考模型输出。

选择如下线性参考模型:

${\begin{cases} \dot{x}_{m} (t) = A_{m} x_{m} (t) + B_{m} u_{m} (t) \\ y_{m} (t) = C_{m} x_{m} (t) \end{cases} (5)$

选择神经网络自适应控制律为:

$v = Κ (x - x_{m}) + \dot{x}_{m} - u_{Ν Ν} (6)$

式(6)中,K为增益对角矩阵,uNN为自适应神经网络控制器输出,K(x-xm)主要目的是更快产生期望的动态响应。此时系统可改写为:

$\dot{x} = Κ (x - x_{m}) + \dot{x}_{m} + u_{c e} - u_{Ν Ν} (7)$

uce为神经网络补偿器误差,定义系统与参考模型的误差为e=x-xm,则

$\dot{e} = Κ e + u_{c e} + u_{Ν Ν} (8)$

系统调节的目的是跟踪误差 $\lim_{t \to \infty} e = 0 ‚ e$ 指数收敛,当神经网络控制输出uNN抵消补偿误差uce的影响,闭环系统(8)稳定,则可以保证整个自适应系统渐近稳定。逼近补偿误差采用基于遗传蚁群算法的BP神经网络的方法来实现,具体算法如下。

2.1 BP神经网络

单隐层BP神经网络[6]结构如图2所示。

输入层为I,即有I个输入信号,表示为xi(i=1,2,…,I),隐含层为J,输出层为K,输入层到隐含层的权值为ωij,隐含层到输出层的权值为ωik, O(k)(k=1,2,…,K)为输出层第k个节点输出。D(k)为期望输出。输出层第k个节点的实际输出O(k)为:

$Ο (k) = f_{2} (\sum_{j = 1}^{J} ω_{j k} f_{1} (\sum_{i = 1}^{Ι} ω_{i j} x_{i})) (9)$

输出层第k个神经元的误差信号为ek=D(k)-O(k)。神经网络学习的误差总能量总和为E,以此参数判定逼近效果。

$E = \frac{1}{2} \sum_{k = 1}^{Κ} e_{k}^{2} (10)$

为了克服传统方法的缺点,在此引入遗传蚁群算法优化神经网络参数。

2.2 遗传蚁群算法

遗传算法[7]对系统中的反馈信息无法很好地利用,蚁群算法[8]初期信息素随机产生,具有很大的不确定性。将这两种算法结合起来,可以取长补短,使系统能够更快更好地收敛。遗传蚁群算法的基本思想是算法前期采用遗传算法,充分利用遗传算法的快速性、随机性、全局收敛性,其结果是产生有关问题的初始信息素分布。算法后期采用蚁群算法,在有一定初始信息素分布的情况下,充分利用蚂蚁算法并行性、正反馈性、求精解和效率高等特点,这样就可以克服遗传算法搜索到一定阶段效率低的缺点和蚁群算法初期无信息素信息的缺点。

将遗传蚁群算法应用到BP神经网络算法中,优化其权值参数,可以避免传统算法的缺陷,使BP算法具有更好的逼近效果。具体步骤如下:

步骤1 参数初始化。令时间t=0,初始化进化种群Pop,遗传代数gen,令循环次数Nc=0,设置最大循环次数Ncmax,初始化信息素τij,△τij,△τij=0,设有M个权值,将I只蚂蚁置于蚁巢。

步骤2 计算种群中每个个体的适度值val

$v a l = τ_{i j}^{α} (t) η_{i j}^{β} (t) (11)$

式(11)中α表示路径上的信息素对蚂蚁选择路径所起的作用大小,β为期望启发式因子,ηij(t)为启发函数。

步骤3 根据对val评估,对种群Pop进行选择、交叉以及变异操作,得到新的群体Pop,具体过程参考文献[7]。判断是否达到最大遗传代数或者是否进化过程中所得到的具有最大适应度个体作为最优解输出,若满足其一,转向步骤4,否则转向步骤2。

步骤4 遍历规则。每只蚂蚁k(k=1,2,…,I)按照概率Pijk(t)选择下一个顶点j,将j置于解集,权值和阈值为蚂蚁选择的路径,分别为wij,bij。

$Ρ_{i j}^{k} (t) = \frac{τ_{i j}^{α} (t) η_{i j}^{β} (t)}{\sum_{s = 1}^{Μ} τ_{i s}^{α} (t) η_{i j}^{β} (t)} (12)$

k=k+1循环,直到蚁群到达目标源。

步骤5 令t←t+M,Nc←Nc+1。为了避免陷入局部极小点,在每只蚂蚁走完一步或者完成对M个权值遍历后,应该对信息素进行更新操作。因此,t+n时刻,路径(i,j)上的信息素调整规则为

$\begin{array}{l} τ_{i j} (t + Μ) = (1 - ρ) τ_{i j} (t) + Δ τ_{i j} (t) (13) \\ Δ τ_{i j} (t) = \sum_{k = 1}^{Ι} Δ τ_{i j}^{k} (t) (14) \end{array}$

ρ∈[0,1)为挥发因子,1-ρ则是信息素残留因子,△τij为信息素增量。

$\begin{array}{l} Δ τ_{i j}^{k} (t) = \\ {\begin{cases} \frac{Q}{L_{k}} ‚ 若第 k 只蚂蚁在本次循环中经过 (i, j) \\ 0 ‚ 其它 \end{cases} (15) \end{array}$

式(15)中,Q表示信息素强度,Lk=ek,表示第k只蚂蚁选择的权值导致的神经网络输出层的输出误差。

步骤6 若蚁群全部收敛于一条路径或者循环次数Nc≥Ncmax,则循环结束输出结果。否则,转向步骤4。

在线更新参数的BP神经网络来逼近建模误差,形成反馈补偿回路。令期望输出D(k)= ζ,我们通过训练,使得E尽可能小并达到一定精度,此时视为网络输出逼近建模误差ζ,完成反馈补偿作用。然后根据模型输出和实际输出的误差e,利用基于遗传蚁群算法神经网络的自适应机构调节输入参数,使系统逼近参考模型输出。

遗传蚁群算法优化神经网络参数,避免传统梯度下降法收敛速度慢和局部极小的缺点,提高算法的效率。

3 飞行仿真与应用

将本方法应用到波音747—100/200飞机模型上进行仿真实验。x=[β r p φ]T为状态向量,其中β, r, p, φ分别表示飞机的侧滑角、偏航速率、滚转速率以及倾斜角;u=[δrδa]T为控制输入向量,其中δr,δa分别表示方向舵偏转角和副翼偏转角。根据MIL—8785C军标规范要求,选取参考模型[9]:

$A_{m} = [\begin{array}{l} - 0.093 1 - 0.945 0 0.078 6 0.020 9 \\ 3.073 4 - 3.539 4 - 0.112 7 0.987 5 \\ - 3.001 7 0.608 2 - 3.867 5 - 6.992 4 \\ 0 0.080 5 1.000 0 0 \end{array}]$ ;

$B_{m} = [\begin{array}{l} 0.007 29 0 \\ - 0.475 0 0.007 75 \\ 0.153 0 0.143 \\ 0 0 \end{array}]$

种群规模popu=50,遗传代数gen=50,蚂蚁数量为40,最大循环次数Ncmax=100,假定飞机在2 s时发生故障,故障函数为f=1+0.5cos(4πt),仿真曲线如图3、图4所示,图3中传统未改进应用梯度下降法的系统有一定的鲁棒性,偏航速率r、滚转速率p能够逼近参考模型,但存在较大误差,且侧滑角β、倾斜角φ都在2 s处发生震荡使系统失去稳定性,侧滑角最大偏差为0.123 rad,倾斜角最大偏差为0.021 rad,而图4中应用遗传蚁群算法改进的系统,在故障发生瞬间系统会产生小波动,但能很快地调整系统参数,在扰动的情况下,侧滑角最大偏差为0.022 8 rad,倾斜角最大偏差为0.008 7 rad,系统输出能很好地逼近参考模型,保证了闭环系统良好的动态特性,可知改进后的系统对不确定的干扰具有较强的鲁棒性。此外,改进后系统其快速性和实时性更好,滚转速率训练17次即达到精度,而当训练次数达到最大时,传统未改进系统的滚转速率仍未达到精度要求,所以改进后系统收敛速度也有所提高。

4 结语

本文将动态逆引入到控制系统中,对非线性系统线性化,克服了系统的非线性因素,实现了输入输出解耦,将神经网络算法应用到模型参考自适应逆控制方法中,设计了一种基于遗传蚁群算法的BP神经网络,算法前期使用遗传算法,保证了种群多样性,后期的蚁群算法利用前期遗传操作得到的较好的信息素分布,在求解时能够避免局部最优,将该算法用于模型的自适应机构,优化参数,调节控制器输入,解决了动态逆依赖精确数学模型的问题,使系统响应能够很好地逼近参考模型输出。仿真结果表明改进的神经网络提高了收敛速度,且对扰动具有较强的鲁棒性,能够保证飞行安全,该方法是可行的和有效的。

摘要：针对飞行安全控制问题,结合动态逆方法和神经网络理论,提出了一种基于改进BP神经网络的模型参考自适应逆控制方法,应用到飞行控制系统中。该方法在控制器中引入神经网络算法,在经典BP神经网络控制算法的基础上,使用遗传蚁群算法优化神经网络参数,在线调整网络的权值和阈值,避免了传统梯度下降法的缺点,提高了自适应算法的效率,达到了抗干扰的目的。从而改善了飞机飞行稳定性和操纵性。在波音747—100/200飞机模型上仿真实验表明了该方法的可行性和鲁棒性,能够保障飞行安全。

关键词：神经网络,自适应逆,模型参考,飞行安全

参考文献

[1] Li L,Zhang H M.Neural network based adaptive dynamic inversionflight control system design.Intelligent Control and Information Pro-cessing,2nd International Conference,2011:135—137

[2] MacKunis W,Patre P M,Kaiser M K,et al.Asymptotic tracking foraircraft via robust and adaptive dynamic inversion methods.IEEETrans.on Control Systems Technology,2010;18(6):1448—1456

[3] Xuan Z,Zhen Y T.A study on the optimization of the constrainedrouting problem based on genetic-ant Colony algorithm.Genetic andEvol utionary Computing,Fourth International Conference,2010:860—863

[4]杨伟,章卫国,杨朝旭,等.容错飞行控制系统.西安:西北工业大学出版社,2007:158—166

[5] Slotine J J E,Li W P.Applied nonlinear control.New Jersey:Pren-tice hall,1991:311—389

[6] Neural H S.Networks and learning machines.BeiJing:China Ma-chine Press,2009:129—185

[7] Juang J G,Huang M T,Liu W K.PID control using presearched ge-netic algorithms for a MIMO system.IEEE Trans on Systems,Man,and Cybernetics,Part C:Applications and Reviews,2008;38(5):716—727

[8] Dorigo M,Gambardella L M.Ant colony system:a cooperative learn-ing approach to the traveling salesman problem.I EEE Trans.on Ev-olutionary Computation,1997;1(1):53—66

神经网络逆系统篇5

运动学逆解是机械手轨迹规划和控制的基础，在机器人控制中占有非常重要的地位。运动学逆解的精度直接影响到机械手控制精度的提高，由于机械手逆解本身存在的复杂性，目前通用的代数法[1]和迭代法在一定程度上都存在计算量大、收敛速度受限等缺点并导致了求解精度低和实时控制性能差。神经网络技术发展为机械手逆解的研究带来了方便，径向基函数（Radial Basis Function,RBF）神经网络是一种局部逼近网络，具有良好的非线性逼近能力和较快的学习速度[2]。因此本文主要利用RBF神经网络与正交最小二乘法相结合的求解方法研究机械手运动学逆解问题。

1 逆解基础

1.1 机械手逆运动学问题描述

机械手运动学实质是描述工作空间内机械手末端执行器的位姿与该位姿所对应的机械手各关节变量之间的转换关系。例如，一个n自由度的机械手的关节变量可表示为：

位置变量可以表示为：

机械手关节变量和位置变量的关系可由下式表示：

而运动学的逆解即是已知机械手各位置变量x(t)求解各关节变量θ(t)的过程。可由下式表示：

1.2 RBF神经网络

径向基函数（Radial Basis Function,RBF）神经网络[3]是20世纪80年代末由J.Moody和C.Darken两人提出的，它是一个三层前馈网络，并且只具有一个隐含层，多输入单输出RBF神经网络的结构[4]如1图所示。

RBF网络的输出可表示为：

输入向量与隐含层通过高斯基函数非线性映射连接起来，高斯基函数下：

1.3 RBF神经网络进行逆解时样本及网络参数的确定

使用RBF神经网络进行运动学逆解之前必须经过一个学习过程，此学习过程是为了将实际输出与期望输出不一致而产生的误差控制在允许范围内，从而使网络达到一个稳定的状态，也即是求下步工作过程所需的网络结构。由RBF网络结构特性可知：确定RBF神经网络径向基函数的中心矢量cj和基宽参数bj的最优值是确定网络结构的关键[4]，当这两个参数确定之后，就可以由隐含层与输出网络之间的线性关系求解方程而得到输出层权值。

在进行网络的学习过程前，首先要确定输入样本，本文在建立机械手正运动学方程的基础上通过MATLAB对正运动学方程进行编程获取样本，用该样本对RBF神经网络进行学习，直到网络达到稳定状态。该过程可由图2表示。

从图中可以看出，进行运动学逆解的关键就落在了采用怎样的算法来求解cj,bj,wij，从而确定RBF网络结构，当采用一定的算法训练网络使网络达到稳定状态时，可将待测的样本（机械手末端的位置）输入训练稳定的RBF网络，从而可以得到运动学逆解（各关节的关节变量）[5]。通常K-means聚类算法被用于求解RBF网络结构参数cj,bj,wij，但该算法容易受到初始参数选择的影响而收敛于局部极小值，而且在从隐含层输出到网络输出的线性关系中逆解矩阵求权值wij时，由于矩阵的非奇异性而很难保证wij的唯一性，这将影响网络的最终训练结构，而正交最小二乘算法（OLS）可以有效的避免上述问题。

2 正交最小二乘（OLS）学习算法

正交最小二乘法[6]主要是利用了线性回归模型，以单输出为例可由式(7)表示：

其中，d(n)表示期望输出，ai是指模型参数，xi(n)为模型的回归因子，它是输入训练数据的固定函数，e(n称为误差。将式(7)可表示为矩阵形式如下：

回归因子xi的集合组成了一组基向量，由于回归因子之间是相关的，无法知道它对输出d的贡献率大小，于是矩阵乘积Xa将回归变量xi变换为一组正交基ui，由于任意两个列向量ui和uj(i≠j)都有uiuj=0这样的线性无关的关系，这样就可有正交ui计算出每个基向量对输出的贡献率。基变换过程如下：

正交向量ui构成的空间与xi构成的空间是同一个空间，因此期望输出可以写成d=ug+e,g代表新的回归向量，可由式求出。对于RBF网络来说，选择样本点x1,x2,…,xM的子集t1,t2,…,tM作为中心，可用上述方法一个个选择，直到满足一定要求为止。用该方法进行逆运动学求解的算法流程图如图3所示。

3 仿真结果与分析

本文在建立机械手正运动学方程的基础上通过MATLAB对正运动学方程进行编程获取样本，在得到400组训练样本后，应用MATLAB中神经网络工具箱[7,8的newrb函数进行RBF神经网络的创建和训练，并在MATLAB中编程，利用最小二乘算法确定高斯基函数的中心和宽度，并在求逆解时考虑最佳柔顺性准则[9]，最后用newrb函数创建神经网络并进行训练。根据多次训练，设置隐节点扩展常数sp取0.6，目标误差取0.01。待网络训练稳定后把15组待测样本带入到两个已经训练到稳定的RBF网络，得到计算结果如表1所示，关节角θ1和θ2的仿真输出与期望输出的对比如图4所示。

从表1和图4可以看出，实际输出与期望输出之间的误差很小，且实际输出曲线连续光滑，说明了正交最小二乘法用于RBF神经网络进行运动学逆解具有较高的精度并且可以避免进行大量的矩阵计算。

4 结论

本文通过RBF神经网络与正交最小二乘法相结合的方式进行机械手逆运动学求解，根据RBF神经网络的非线性局部逼近能力及快速学习能力和正交最小二乘法确定RBF神经网络结构参数的特性，使得该算法学习过程能够更快地收敛于期望值并且算法实现简单，从计算及MATLAB仿真分析的结果可以看出，实际计算输出值与期望输出值的误差小；仿真曲线光滑而连续，偏离程度小，证明了采用该算法进行机械手逆运动学求解可获得较高的精度并能很大程度上减少求解逆矩阵时的大计算量问题，为机械手轨迹规划和实时控制精度的提高奠定了基础。

摘要：针对用于求运动学逆解的代数法存在计算量大、求解精度低等问题,提出了一种将RBF神经网络与正交最小二乘法相结合的求解方法。根据RBF神经网络的非线性局部逼近能力及快速学习能力,确定了进行运动学逆解所要的RBF神经网络参数,利用正交最小二乘算法对RBF神经网络进行稳定性训练,并设计了其逆运动学求解的算法流程图。运用MATLAB软件对该算法进行仿真分析,结果表明采用该方法能有效减少人工计算量且具有较高求解精度。

关键词：运动学逆解,RBF神经网络,正交最小二乘法,MATLAB仿真

参考文献

[1]John J Craig.机器人学导论[M].贠超,译.北京:机械工业出版社,2006.

[2]臧小刚,唐斌.一种基于免疫系统的RBF网络在线训练方法[J].电子学报,2008.36(7):1396-1400.

[3]Moody J,Darken C.Fast Learning in networks of locallytunedprocessingunits[J].Neural Computation,1989,1(1):281-294.

[4]魏海坤,徐嗣鑫,宋文忠.最小RBF网设计的进化优选算法及其在动力配煤过程状态预测建模中的应用[J].中国电机工程学报.2001,21(1):63-72.

[5]魏海坤,宋文忠.R B F网的动态设计方法[J].控制理论与应用,2002,19(5):673-680.

[6]Chen S,Cowan C F N,Grant P M.Orthogonal least squares learning algorithm for radial basis function networks[J].IEEE Transactions on Neural Networks,1991,2(2):302-309.

[7]葛哲学,孙志强.神经网络理论与Matlab R2007实现[M].北京:电子工业出版社,2007:61-118.

[8]闻新,李翔.Matlab神经网络仿真与应用[M].北京:科学出版社,2003:288-295.

卷积与逆系统问题讨论篇6

在近代时域分析方法中, 系统的零输入响应和零状态响应是两个最重要的基本概念。在引入系统的冲激响应以后, 将冲激响应与激励信号进行卷积积分, 这样可以求得系统的零状态响应。卷积积分方法有清楚的物理概念, 运算过程比较方便, 并为使用计算机打开了前景。此外, 卷积概念在变换域方法中也得到广泛应用, 它是联接时间域和变换域两种方法的一条纽带。在线性系统理论中, 卷积方法占有十分重要的地位, 在许多问题中都要运用卷积概念和卷积计算方法。

1 LTI系统分析中的卷积

1.1 卷积积分 (Convolution) 的定义

卷积积分 (Convolution) 的定义:设有两个任意时间函数f (t) 与h (t) , 则

称为f (t) 与h (t) 的卷积积分, 可记为f (t) *h (t) 。

1.2 卷积积分的图解

设有两个任意时间函数, 例如f (t) =U (t) 和h (t) =Ae-αtU (t) (α为大于零的实常数) , 其波形分别如图1 (a) 、 (b) 所示。我们利用图解法进行如下五个步骤的运算, 从而引出卷积积分的定义。

1) 将函数f (t) 、h (t) 中的自变量t改换为τ, 从而得到f (τ) 、h (τ) , 这并不影响函数的图形, 因为函数的性质和图形与自变量的符号无关, 故其波形仍如图1 (a) 、 (b) 所示。

2) 将函数h (τ) 以纵坐标轴为轴折叠, 从而得到折叠信号h (-τ) , 如图2-1 (c) 所示。

3) 将折叠信号h (-τ) 沿τ轴平移t, t为参数变量, 从而得到平移信号h[- (τ-t) ]=h (t-τ) , 如图1 (d) 所示。t>0时为向右平移, t<0时为向左平移。

4) 将f (τ) 与h (τ) 相乘, 从而得到相乘信号f (τ) h (t-τ) , 其波形如图1 (e) 所示。

5) 将函数f (τ) h (t-τ) 在区间 (-∞, +∞) 上积分, 即由于积分变量为τ, 其积分结果必为参变量t的函数, 故用y (t) 表示。该积分就是相乘函数f (τ) h (t-τ) 曲线下的面积[图 (e) 中画斜线的部分]。上式所描述的内容即称为函数f (t) 与h (t) 的卷积积分, 用符号“*”表示, 即

读作f (t) 与h (t) 的卷积积分, 简称卷积。观察图 (e) 可见, 当τ<0-和τ>t时, 被积函数f (τ) h (t-τ) =0, 这是因为f (τ) =U (τ) 、h (τ) =Ae-αtU (t) 均为单边函数的原故。故上式卷积积分中的积分限可改写为 (0-, t) , 即, 若将f (τ) =U (τ) 与h (τ) =Ae-αtU (t) 这两个具体的函数代入上式中并积分即得

但要注意, 卷积积分的严格定义式则仍然是 (式1) 。

1.3 卷积积分上下限的讨论

卷积积分的严格定义应如 (式1) 所示, 其积分的上下限应为区间 (-∞, +∞) 。但在具体计算时, 积分的上下限可视函数f (t) 与h (t) 的特性而做些简化。 (1) 若f (t) 和h (t) 均为因果信号, 则积分的上下限可写为 (0-, t) 。 (2) 若f (t) 为因果信号, h (t) 为无时限信号, 则积分的上下限可写为 (0-, ∞) 。 (3) 若f (t) 为无时限信号, h (t) 为因果信号, 则积分的上下限可写为 (-∞, t) 。 (4) 若f (t) 和h (t) 均为无时限信号, 则积分的上下限可写为 (-∞, +∞) 。

2 系统分析中的卷积积分的代数律和性质

作为一种数学运算, 卷积运算具有一些重要性质, 这些性质可简化卷积运算, 而且在信号与系统分析中有重要的物理内涵, 特别在科学研究工作中利用卷积计算系统零状态相应的一些实际数字时必然会遇到这个不可回避的问题。以下的讨论均设卷积积分是收敛的或存在的。

2.1 卷积的代数律

2.1.1 卷积的交换律

证明:

若将f1 (t) 看成系统的激励, 而将f2 (t) 看成是一个系统的单位冲激响应, 则卷积的结果就是该系统对f1 (t) 的零状态响应。卷积的交换律说明, 也可将看成系统的激励, 而f1 (t) 看成是系统的单位冲激响应, 即图2中 (a) 、 (b) 两个系统的零状态响应是一样的。

从图3-1可见, 以系统的观点看交换律, 信号可由系统来实现, 系统也可由信号来仿真。

2.1.2 卷积的结合律

卷积结合律的图示如图3。

从系统的观点来看, 两个系统级联时, 总系统的冲激响应等于子系统的冲激响应的卷积, 即h (t) =f2 (t) *f3 (t) , 且与级联次序无关。有些函数的卷积积分或卷积和满足卷积的结合律, 而另一些函数的卷积则不满足此性质。当满足卷积结合律时, 参与卷积的函数之间有一定的约束关系。如果x (t) 、h (t) 和g (t) 是三个信号, 且x (t) *g (t) , x (t) *h (t) 和g (t) *h (t) 都有确切的定义, 而且是有限值, 则结合律即

2.1.3 卷积的分配律

分配律具有以下物理解释及说明: (1) n个信号相加作用于系统所产生的零状态响应, 等于n个信号分别作用于系统所产生的零状态之和。 (2) 激励信号e (t) 对冲激响应等系统产生的零状态响应之和, 等效于对冲激响应之和的系统产生的零状态响应。

2.2 卷积性质

2.2.1 时域卷积性质

从信号分解的角度来看, 系统响应的卷积运算实际上是将激励信号分解为一系列冲激信号后进行加权积分的结果, 那么, 从频域分析来看, 信号的卷积运算又意味着什么呢?它表明, 如果两个信号在时域进行卷积运算, 则卷积信号的傅里叶变换等于这两个信号傅里叶变换的乘积。卷积的应用是多方面的:首先, 我们可以利用卷积性质简化某些信号傅里叶变换的求解;其次, 我们可以用卷积性质表述线性时不变系统的频域特性。

2.2.2 频域卷积性质

既然时域卷积对应于频域相乘, 那么, 根据傅里叶变换的对称性不难想到, 时域相乘必然和频域卷积相对应。利用傅里叶逆变换的定义式, 可以证明上式的正确性, 其证明过程同时域卷积性质的证明, 这里不作详述。在一般情况下, 如果两个相乘信号的频谱都是复函数时, 利用频域卷积求解相乘信号的傅里叶变换并不能简化求解过程, 然而, 当两个相乘信号中有一个信号的频谱是d函数, 或者有一个信号是某个特殊的信号, 利用频域卷积性质就可以简化求解过程, 而频域卷积性质的主要应用也正在于此。

3 利用卷积求零状态的物理应用

为了求解在任意激励下通过LTI系统的零状态响应, 要充分利用LTI系统的叠加特性和时不变特性, 即把输入的激励分解为一系列具有不同强度和不同延时的基本信号, 然后再让这些基本信号一一的通过系统, 根据线性时不变得叠加特性和时不变特性, 进行响应的合成, 最终求得的响应, 这就是信号分解和响应合成的两个重要概念。

如果将施加于线性系统的信号分解, 而且对于每个分量作用与系统产生之响应易于求得, 那么, 根据叠加原理, 将这些响应取和即可得到原激励信号引起之响应。这种分解可表示为象冲激、阶跃或三角函数、指数函数这样一些基本函数之组合。卷积方法的原理就是将信号分解为冲激信号之和, 借助系统的冲激响应, 而求解系统对任意激励信号的零状态响应。

线性非时变系统对任意激励f (t) 的零状态响应yf (t) , 可用f (t) 与其单位冲激响应h (t) 的卷积积分求解, 即

4 LTI系统分析中逆系统相关问题

4.1 逆系统的定义

若系统在不同的激励信号作用下产生不同的响应, 则称之为可逆系统。对于每个可逆系统都存在一个“逆系统”, 当原系统与此逆系统联组合后, 输出信号与输入信号相同。设h (t) 是一个系统的单位冲激响应, 并假设第二个系统的单位冲激响应g (t) 有如下性质:h (t) *g (t) =δ (t) 对所有输入x (t) , 当x (t) *h (t) 和x (t) *g (t) 都有确切定义且为有限值时, 系统的两种级联所起的作用都相当于恒等系统, 因此这两个系统都可以相互认为是另外一个系统的逆系统。例如, 若h (t) =u (t) , g (t) =u1 (t) , 只要限定输入满足就可认为这两个系统互为逆系统。因此可以看出, 只要涉及的所有卷积都是有限的, 那么f1 (t) *[f2 (t) +f3 (t) ]=f1 (t) *f2 (t) +f1 (t) *f3 (t) 的结合律性质和由h (t) *g (t) =δ (t) 给出LTI逆系统的定义都是正确的, 由于在任何实际问题中确实都是这种情况, 一般在应用这些性质时都务须加以评注或者限制。应该指出:尽管大多数讨论都是以连续时间信号和系统为例, 但是相同的结论在离散时间情况下也能得到。

4.2 可逆系统应用

可逆系统在信号传输与处理技术中应用广泛。许多信号处理都希望能从处理或变换后的信号中恢复原信号如发送设备中的幅度压缩器、编码器、调制器和频率预加重等, 这些信号处理都应是可逆的, 以便在接受设备中, 用相应的逆系统恢复出发出端的原信号。

例如:延时器是可逆的LTI系统, 其h (t) =δ (t-t0) , 其逆系统是g (t) =δ (t+t0) , 显然有:h (t) *g (t) =δ (t-t0) *δ (t+t0) =δ (t) 累加器是可逆的LTI系统, 其h (t) =u (n) , 其逆系统是g (n) =δ (n) -δ (n-1) , 显然有:

4.3 逆系统问题分析

判断下列系统是否是可逆的, 若可逆, 给出它们的逆系统;若不可逆, 指出使系统产生相同输出的两个输出信号。

分析:若系统在不同激励信号作用下产生不同的响应, 则该系统是可逆的。两个互逆系统的冲击响应h1 (t) , h2 (t) , 满足关系h1 (t) *h2 (t) =δ (t) 。

解:由以上分析可知,

1) 该系统可逆, 且其逆系统为r (t) =e (t+5) 。

2) 该系统不可逆。因为当e1 (t) =C1, e2 (t) =C2 (且均为常数) 时, r1 (t) =r2 (t) =0, 即不同的激励产生相同的响应, 所以系统不可逆。

3) 该系统可逆。因为微分运算与积分运算是可逆的运算, 所以其逆系统为。

4) 该系统可逆, 且其逆系统为。

5 LTI系统的可逆性

考虑一下响应应为h (t) 的连续时间LTI系统, 根据以上讨论, 仅当存在一个逆系统, 其与原系统级联后所产生的输出等于第一个系统的输入时, 这个系统才是可逆的。再者, 如果一个LTI系统是可逆的, 那么它就有一个LTI的逆系统, 给定一个系统其冲击相宜为h (t) , 逆系统的冲激响应是h1 (t) , 它的输出是w (t) =x (t) , 而h1 (t) 又必须满足它是逆系统冲激响应的条件, 即h (n) *h1 (n) =δ (n) , 同样, 在离散时间情况下, 一个冲激响应为h[n]的LTI系统的逆系统的冲激响应h1[n]也必须满足h (n) *h1 (n) =δ (n) 。下面实例用来说明可逆性及其逆系统的构成。

例如:考虑一个纯时移组成的LTI系统y (t) =x (t-t0) 若t0>0, 系统是延时;若t0<0, 是超前。例如, 若t0>0, 那么在t时刻的输出等于更早一些的时刻t-t0的输入值。若t0=0, y (t) =x (t-t0) 式就是恒等系统, 因此是无记忆的;而对于其它的任何值t0, 系统都有记忆的, 因为系统与之响应的输入值不在当前时刻。令输入为δ (t) 可得上式系统的单位冲激响应h (t) =δ (t-t0) , 因此x (t-t0) =x (t) *δ (t-t0) , 即, 一个信号与一个移位冲激的卷积就是该信号的移位。为了从输出中恢复输入, 也即其逆系统要做的就是将输出在往回移回来, 那么具有这种补偿时间移位的系统就是逆系统, 即h1 (t) =δ (t+t0) , 那么h (t) *h1 (t) =δ (t-t0) *δ (t+t0) =δ (t) 同样在离散时间情况下, 一个纯时移系统其单位冲激响应为δ[n-n0], 这样任一信号与一个移位单位脉冲的卷积就是改系统的移位。另外, 具有单位脉冲响应为δ[n-n0]的LTI系统的逆系统就是将输出朝相反方向再移位相同量的LTI系统, 即具有单位脉冲响应为δ[n-n0]的LTI系统。

参考文献

[1]郑君里, 应启珩, 杨为里等.信号与系统.高等教育出版社, 2000.

[2]奥本海姆, 刘树棠译《.信号与系统》中译本 (第2版) , 西安交通大学出版社, 1998.

神经网络逆系统篇7

目前,高效、节水和不污染环境的封闭循环工厂化水产养殖技术日益引起关注。应用此项技术,扩大了温水鱼类养殖的地域范围,同时还可以节约养殖用水。特别是在难以开展传统水产养殖的水资源匮乏地区,采用水循环技术可以弥补这一缺憾。水循环装置投资较大,必须进行高密度养殖才具有经济性,高密度养殖需要对水环境进行精确控制。虽然各国对这种高效、节水和无污染的封闭循环工厂化水产养殖技术已开展了大量研究,但研究的重点偏向水质净化技术[1],而对养殖池中环境精确控制的研究也主要集中在孤立的参量上,对水池环境中多变量的控制研究还较少。

循环流水水产养殖技术是一种新兴技术,相关的设计数据十分有限,因此一般都先建造小比例的系统进行一段时间的调试改进,然后再建造商业比例系统[2]。对于小比例养殖池系统,现在还没有合适的数学模型,加上养殖过程参数的时变性、多样性、耦合性和不确定性,采用传统的线性控制方法显然不合适。因此,研究水产养殖系统的自动控制和优化运行,具有重要的理论意义和使用价值。

微分几何方法解决了一类非线性系统的控制问题,但该方法需要李导数、李括号或矢量场等数学概念,应用时还需要求解微分方程,因此其应用普及性受到一定的限制。最近发展起来的逆系统方法物理意义直观,求解时只需要代数运算,比较容易应用。

本文通过机理分析的方法建立了循环流水水产养殖系统养殖池的控制动态数学模型,给出了解析表达式,提出了阶逆系统控制方法,并进行PID闭环控制。

1 循环流水养殖池的控制模型

本文所建立的数学模型主要是为了研究养殖池水环境的控制问题,在模型建立过程中基于以下简化前提或基本假设:对于小型养殖池,不涉及水温分层现象;使用较快的相对流速,加上对每个输入都采用沿池壁多层多点注水,使之在短时间充分融合,从而在模型中忽略时延时间。因此可以认为:水中的状态变量是处处相等且同步变化的;水池水会随时间偏向酸性,只考虑向水中加碱液来调节pH值;现代的循环流水水产养殖系统一般由养殖池、沉淀池和过滤池组成,假设回流进池前水已变成中性淡水。

水环境中需要监控的量通常为浑浊度、氨氮量、盐度、温度、pH值和溶氧(DO)等。由前面的假设可知:在较快的循环流水下,浑浊度是可以得到有效控制的,即水不会变混浊;水中的氨氮通过过滤去除;溶氧在本项目中是通过变频电机带动空气泵进行增氧,与其它量没有耦合关系,可以单独控制。剩下的温度、盐度、pH值和液位高度之间有耦合关系,将在下面建立数学模型。本项目中为了加强工程可实现性和扩大适用范围,除了可控流量的回流冷水,另外分别加上了可控流量的热水、碱水和盐水阀门来调节温度、pH值、盐度和液位,如图1所示。

1.1 动态数学模型的建立

1.1.1 池水体积的状态方程

$\frac{d V}{d t} = (Q_{1} + Q_{2} + Q_{3} + Q_{4} + Q_{5})$ (1)

式中 V—池水体积(m3),V的初始值为V0>0;

t—时间(s);

Q1,Q2,Q3,Q4—分别为热水、冷水、碱水和盐水的流量;

Q5—出水口流量(m3/s),Q5 <0 。

1.1.2 水温的状态方程

根据热量守恒定律,不考虑与周围环境的热交换,则有

$\frac{d q_{v}}{d t} = Σ_{i = 1}^{5} c ρ Τ_{i} Q_{i}$ (2)

式中 qv—池水总热量;

c—水的比热;

ρ—水的密度;

T—各个入水和出水口的温度。

设T为池水温度,则T5=T。但在实际环境中,水体与周围存在热交换,主要的热交换途径有水面的辐射、蒸发和传导,还有水体和水池的表面传热。传热的大小与许多因素有关,仅水面辐射就包括太阳短波辐射、大气长波辐射和水体长波的返回辐射。蒸发还与湿度、风速、气温和水面温度等有关[3]。因此,如果都考虑会导致后面的控制部分无法计算。

在本文中,所有的热交换都看成对温度的大周期干扰。此干扰项可表示为

$\overset{°}{Τ} = f (Τ_{h}, Τ)$ (3)

式中 Th—环境温度,它是气温与池体温度的综合。

因为连续函数可以按照泰勒级数展开,所以把此函数线性化,可近似看成环境温度与水温的差乘以一个实验测定的系数,再加上一个实验测定的常数。最后,因为水体表面积变化的原因,再给干扰一个随机浮动的范围。根据

qv=cρTV (4)

将(2)式化简得

$Τ \frac{d V}{d t} + V \frac{d Τ}{d t} = Σ_{i = 1}^{4} Τ_{i} Q_{i} + Τ Q_{5}$ (5)

代入(1)式与(3)式,进一步化简得

$\frac{d V}{d t} = \frac{1}{V} Σ_{i = 1}^{4} Q_{i} (Τ_{i} - Τ) + f (Τ_{h}, Τ)$ (6)

式中的温度为绝对温度(K) 。

1.1.3 盐度的状态方程

根据质量守恒定律可知

$\frac{d (C V)}{d t} = C_{4} Q_{4} + C Q_{5}$ (7)

式中 C—池水盐度;

C4—流入盐水的盐度(kg/m3),C4>C>0。

将其代入(1)式化简,则有

$\frac{d C}{d t} = \frac{1}{V} (C_{4} Q_{4} - C Σ_{i = 1}^{4} Q_{i})$ (8)

1.1.4 非水电离的氢氧根离子的状态方程

在水中,氢离子与氢氧根离子满足式(8)[4]

$C_{Η} C_{Ο Η} = α e^{- \frac{β}{Τ}}$ (9)

再根据物质的量守恒定律,有

$\frac{d Μ}{d t} = Q_{3} S_{3} + Q_{5} [\frac{α e^{- \frac{β}{Τ}}}{C_{Η}} - C_{Η}]$ (10)

式中 $α e^{- \frac{β}{Τ}}$ —水中氢离子与氢氧根的离子积(α=13.184,β=6 277.4)(mol2/m6);

CH—水中氢离子浓度(mol/m3);

S3—注入碱水的氢氧根浓度(mol/m3);

M—池中非电离的氢氧根离子的物质量(mol)。

1.1.5 水中氢离子浓度的状态方程

在池水中,由假设得水为非酸性,所以水中氢离子与氢氧根离子满足方程

$(\frac{Μ}{V} + C_{Η}) C_{Η} = α e^{- \frac{β}{Τ}}$ (11)

方程两边对时间求导,并代入(1)式(5)式和(8)式,求出CH的导数,得

$\begin{array}{l} \frac{d C_{Η}}{d t} = \frac{[Σ_{i = 1}^{4} Q_{i} (Τ_{i} - Τ)] α β V e^{- \frac{β}{Τ}} + Τ^{2} Μ C_{Η} Σ_{i = 1}^{5} Q_{i}}{V Τ^{2} (2 V C_{Η} + Μ)} - \\ \frac{V Τ^{2} (C_{Η} Q_{3} S_{3} + Q_{5} α e^{- \frac{β}{Τ}} - Q_{5} C_{Η}^{2})}{V Τ^{2} (2 V C_{Η} + Μ)} (12) \end{array}$

1.1.6 输出量方程

液位、水温和盐度的输出方程为

h=V/A (13)

T=T (14)

C=C (15)

式中 h—液位高度(m);

A—养殖池的底面积(m2)。

由于氢离子浓度是每立方米而不是每升,所以pH值的输出为

[pH] $= - \lg \frac{C_{Η}}{1000}$ (16)

式中 [pH]—pH值。

由此系统模型可表示为

${\begin{cases} \overset{°}{V} = Σ_{i = 1}^{5} Q_{i} \\ \overset{°}{Τ} = \frac{1}{V} Σ_{i = 1}^{4} Q_{i} (Τ_{i} - Τ) + f (Τ_{h}, Τ) \\ \overset{°}{C} = \frac{1}{V} (C_{4} Q_{4} - C Σ_{i = 1}^{4} Q_{i}) (17) \\ \overset{°}{Μ} = Q_{3} S_{3} + Q_{5} [\frac{α e^{- \frac{β}{Τ}}}{C_{Η}} - C_{Η}] \\ \overset{°}{C_{Η}} = \frac{[Σ_{i = 1}^{4} Q_{i} (Τ_{i} - Τ)] α β Τ e^{- \frac{β}{Τ}} + Τ^{2} Μ C_{Η} Σ_{i = 1}^{5} Q_{i}}{V Τ^{2} (2 V C_{Η} + Μ)} - \\ \frac{V Τ^{2} (C_{Η} Q_{3} S_{3} + Q_{5} α e^{- \frac{β}{Τ}} - Q_{5} C_{Η}^{2}}{V Τ^{2} (2 V C_{Η} + Μ)} \end{cases}$

令X=[x1,x2,x3,x4,x5]T=[V,T,C,M,CH]T (18)

U=[u1,u2,u3,u4]T=[Q1,Q2,Q3,Q4]T (19)

Y=[y1,y2,y3,y4]T=[h,T,C,[pH]]T (20)

可得系统状态方程和输出方程为

${\begin{cases} \overset{°}{x}_{1} = Σ_{i = 1}^{4} u_{i} + Q_{5} \\ \overset{°}{x}_{2} = \frac{1}{x_{1}} Σ_{i = 1}^{4} u_{i} (Τ_{i} - x_{2}) + f (Τ_{h} - x_{2}) \\ \overset{°}{x}_{3} = \frac{1}{x_{1}} (C_{4} u_{4} - x_{3} Σ_{i = 1}^{4} u_{i}) (21) \\ \overset{°}{x}_{4} = u_{3} s_{3} + Q_{5} [\frac{α e^{- \frac{β}{x_{2}}}}{x_{5}} - x_{5}] \\ \overset{°}{x}_{5} = \frac{[Σ_{i = 1}^{4} u_{i} (Τ_{i} - x_{2})] α β x_{1} e^{- \frac{β}{x_{2}}} + x_{2}^{2} x_{4} x_{5} (Σ_{i = 1}^{4} u_{i} + Q_{5})}{x_{1} x_{2}^{2} (2 x_{1} x_{5} + x_{4})} - \\ \frac{x_{1} x_{2}^{2} (x_{5} u_{3} S_{3} + Q_{5} α e^{- \frac{β}{x_{2}}} - Q_{5} x_{5}^{2})}{x_{1} x_{2}^{2} (2 x_{1} x_{5} + x_{4})} \end{cases}$

${\begin{cases} y_{1} = x_{1} / A \\ y_{2} = x_{2} \\ y_{3} = x_{3} \\ y_{4} = - \lg \frac{x_{5}}{1000} \end{cases}$

(22)

1.2 模型的仿真实验

在仿真实验中,A=1m2,S3=100 mol/m3,C4=250 kg/m3,绝对零度取-273.15℃,从而T1、T2、T3和T4分别为333.15 K、288.15 K、 291.15 K和 293.15 K。Q5=4.5×10-3 m3/s;初始状态为h0=1 m,T0=288.15 K,C0=5 kg/m3,M0=0,开始水为中性,在T0条件下pH值为7.17。干扰项计算系数设为-0.000 021。仿真使用的是matlab 7.0的simulink。在0时刻由4个输入端开始输入,大小都为1.5×10-3 m3/s,测量记录的时间是300 s。测量结果如图2所示。由图2可知,图中(a) 、(b)、(c) 和(d)4个输出量的仿真值是符合日常实际规律的,从而建立的方程组反映了循环流水水产养殖系统的养殖池环境的运行特性。

2 养殖池控制的逆系统方法

根据多变量系统的逆系统控制方法[5]原理,可由(18)式～(22)式求得循环流水养殖池的α阶逆系统的状态反馈算法公式

${\begin{cases} u_{1} = \frac{(x_{2} - Τ_{2}) (A v_{1} - Q_{5}) + x_{1} v_{2}}{Τ_{1} - Τ_{2}} + \\ \frac{(Τ_{2} - Τ_{3}) u_{3} + (Τ_{2} - Τ_{4}) u_{4}}{Τ_{1} - Τ_{2}} \\ u_{2} = A v_{1} - Q_{5} - u_{1} - u_{3} - u_{4} \\ u_{3} = \frac{A x_{2}^{2} x_{4} x_{5} v_{1} + x_{1}^{2} θ β v_{2}}{x_{1} x_{2}^{2} x_{5} S_{3}} - \\ \frac{r x_{1} x_{2}^{2} x_{5} (2 x_{1} x_{5} + x_{4}) v_{4} - x_{1} x_{2}^{2} Q_{5} (θ - x_{5}^{2})}{x_{1} x_{2}^{2} x_{5} S_{3}} \\ u_{4} = \frac{(A v_{1} - Q_{5}) x_{3} + x_{1} v_{3}}{C_{4}} \end{cases} (23)$

其中, $[v_{1}, v_{2}, v_{3}, v_{4}]^{Τ} = [\overset{°}{y}_{1}, \overset{°}{y}_{2}, \overset{°}{y}_{3} ‚ \overset{°}{y}_{4}]^{Τ}$ ,从而系统成为无耦合的线性系统,得到循环流水养殖池的控制模型的状态反馈解耦线性化结构示意图,如图3所示。图3(b)为规范化的线性系统,其中方框代表一阶线性环节系统。

(a) 状态反馈线性化 (b) 规范化线性系统

这样一个复杂的非线性系统的控制就转化为对4个简单的一阶积分线性系统的控制。对于干扰,可以分别采用PID控制器实现闭环控制。因为输入ui的大小不能为负数,所以中间加了一个去ui负数的环节,对于即所有计算得到的ui,如果小于零都使它等于零。根据式(21)可知,这样不会改变输出的一阶导数符号,但会使响应时间延长。循环流水养殖池的综合控制系统框图如图4所示,其中下标ref表示期望值。

3 控制效果仿真

在前面模型的实验初始条件下,输入期望值液位高度为1m,温度为16℃,盐度期望值是3×10-12,pH值期望值设定为7.2,在0时刻开始输入。图5的(a)、(b)、(c)和(d)分别反映了300s之间的4个输出量的动态响应。其中,(a)和(c)中前100 s左右的异常变化是由去负数的环节引起的,这使得在开始变化阶段系统有弱耦合关系。但仿真实验表明,这不影响最终的控制效果, 在120 s时基本达到了控制目标, 这在水产养殖领域中是能满足生产要求的。

4 结论

应用α 阶逆系统方法解耦控制,能成功地实现循环流水养殖池环境中液位高度、温度、盐度与pH值之间的动态解耦控制。仿真实验表明,这种控制策略能够实现循环流水养殖池环境中液位高度、温度、盐度与pH值之间的动态解耦控制。池水环境能够在较短时间内达到期望状态,而且具有良好的动静态性能。本文的控制策略对于温室环境和畜舍环境等也具有参考作用。

参考文献

[1]Lawson,Thomas B.Fundamentals of aquacultural engineering[M].Massachusetts:Kluwer Academic Publishers,1995.

[2]Euzen,Jean-Paul,Pierre Trambouze.Scale-up methodology for chemical processes[M].Texas:Gulf Publishing Company,1993.

[3]杨世铭.传热学基础[M].北京:高等教育出版社,2003.

[4]梅桂友,郭伟英.论中性水体pH值与温度的定量关系[J].重庆环境科学,1994(4):55-57.

【神经网络逆系统】推荐阅读：

神经网络逆模型06-22

神经网络系统10-23

神经系统05-30

神经模糊系统07-07

神经系统检查10-17

神经系统损害05-18