混杂控制系统

2024-10-19

混杂控制系统(共8篇)

混杂控制系统 篇1

摘要:针对一类混杂系统,提出具有稳定性保证的混合预测控制器设计方法。首先,针对每一个子系统,设计有界控制器,并构造出系统的稳定域估计集。然后,在稳定域估计集内,提出了混合预测控制策略,并保证了不同子系统之间切换的稳定性。仿真结果证明了该方法的有效性。

关键词:混杂系统,预测控制,有界控制,稳定性,切换控制

0 引 言

分段线性(Piecewise Linear, PWL)系统作为一类基本的混杂动态系统模型,能够用来描述许多工程实际系统中的混杂特性,如饱和、继电器、死区等环节[1,2],也可以用来近似非线性系统。因此,对PWL系统控制问题的研究具有重要的理论和实际意义。

目前,预测控制已经被成功应用于PWL系统[3,4,5,6,7],其中,PWL系统预测控制的稳定性综合问题是大家关注的焦点[5,6]。针对这个问题,本文对含有两个子系统的连续时间PWL系统进行预测控制器设计。首先,对每个子系统,设计有界控制器,在此基础上,提出一种预测控制和有界控制相结合的混合控制方法,并给出子系统之间的稳定切换规则,从而保证系统的全局稳定性。这种方法的好处是只需要对每个子系统求解二次规划问题,避免了对整个PWL系统求解含有逻辑变量的二次(或线性)规划问题,降低了算法的复杂度。

1 有界控制

考虑如下的连续时间PWL系统

undefined (1)

其中,x(t)=[x1(t)…xn(t)]T∈Rn是状态向量,u(t)=[u1(t)…um(t)]T∈U⊆Rm是控制输入向量。U是输入约束,定义为undefined。系数矩阵分别为Ai∈Rn×n,Bi∈Rn×m,i∈{1,2}。undefined。

考虑第i个子系统,设其Lyapunov函数为Vi=xTPix,存在满足Ricatti方程

undefined (2)

的正定矩阵undefined。针对第i个子系统的连续有界控制器可以设计为[8]

ui(x)=-2ki(x)BTiPix∶=bi(x) i=1,2 (3)

其中

undefined

我们发现,如果状态轨迹满足如下条件

undefined

那么,根据Lyapunov理论,有界控制器(3)满足输入约束,并且Lyapunov函数是单调递减的。利用集合Φi(umax),可以构造一个包含在Φi(umax)的最大椭圆集作为稳定域

undefined (5)

其中,cimax>0是满足Ωi(umax)⊆Φi(umax)的最大值。

对于系统(1)来说,稳定域估计集可以如下构造。假设undefined为状态分区的边界,undefined

① 如果undefined,构造椭圆集

undefined

使得undefined (6)

其中,c′jmax是满足条件的最大值。则系统(1)的稳定域估计集

undefined (7)

undefined

② 如果undefined构造椭圆集

undefined

使得

undefined

其中,c′imax、c′jmax是满足条件的最大值。则含系统(1)的公共的稳定域估计集为(7)的形式,

undefined。

定理 1 考虑系统(1),对第i个子系统,通过构造Lyapunov函数Vi,得到该子系统的有界控制器(3),稳定域估计集Ψ。假设初始状态为x0∈Ψi,i∈{1,2}。如果在tundefined时刻

x(tundefined)∈Ωj(umax)∩Xj (10)

那么状态切换到第j个子系统,反复此控制过程,可得闭环系统是渐近稳定的。其中,tundefined=tundefined, tundefined是第r次离开第i个子系统的时间,tundefined为第m次进入第j个子系统的时间,tundefined为第m-1次进入第j个子系统的时间。

虽然定理1给出的有界控制策略能够保证闭环系统稳定,但是,有界控制对系统的最优性没有要求,因此在有界控制的作用下系统的控制性能较差。

2 混合预测控制

由于预测控制是在最优性能指标的情况下,求解满足系统状态和输入约束的控制律,因此,其具有良好控制性能。基于上述分析,本文将预测控制和有界控制相结合,在系统的稳定域估计集内,采用两种控制律切换模式以达到系统稳定性和最优性的兼顾。

2.1 子系统预测控制

针对系统(1)的每个子系统,设计相应的预测控制器。 考虑第i个子系统,x(t)为系统在t时刻的状态,可以通过求解如下优化问题得到预测控制

undefined (11)

使得undefined (12)

undefined

W=W(t,Ni)是一组由[t,Ni]映射到U的分段连续函数,Ni是预测时域,{ui[k]=ui(kT)}为要求的控制序列,满足:ui(·)∈W ,ui(t)=ui[k],t∈[kT,(k+1)T],T为采样周期。xui(ω;x,t)是式(12)的解, Q和R是严格正定对阵矩阵,F是终端加权。

在时段[kT,(k+1)T]内,通过求解上述优化问题,可以得到一组预测控制序列。通常我们只采用第一个uundefined(·)∈W,即

Mi(x)∶=uundefined(t;x,t) (14)

作用到第i个子系统。

2.2 混合预测控制

定理2 考虑系统(1),假设初始条件x(0)=x0∈Ψi,tundefined≤t

其中,Tundefined>0是下列不等式成立的最初时刻

undefined

在tundefined=tundefined时刻,undefined,系统从第i个子系统切换到第j个子系统。重复上述混合预测控制,能够保证系统(1)的全局渐近稳定性。

3 仿真研究

为了验证混合预测控制的有效性,考虑下面例子

针对(17)描述的两个子系统,分别考虑对应的Lyapunov函数xTPix。取undefined,通过求解Ricatti方程,可知

undefined

根据(7)的描述形式,系统(17)的稳定域估计集,预测控制目标函数的参数选择为Q=2×I2,R=0.1,时域长度T=0.4。取初始状态为x0=[2,3]T∈Ψ1,采用定理2提出的混合预测控制策略,闭环系统状态轨迹渐近到达原点。

4 结论

本文针对一类混杂系统,提出了一种保证闭环系统稳定性的预测控制策略。对每个线性子系统,分别设计相应的有界控制器,并在此基础上,基于子系统之间的状态切换条件构造出系统的稳定域估计集。在稳定域估计集内,给出有界控制和预测控制相结合的控制策略,保证了不同子系统之间切换的稳定性。

参考文献

[1] SONTAG E. Nonlinear regulation: The piecewise linear approach[J]. IEEE Transactions on Automatic Control, 1981,26(2): 346-358.

[2]张聚.混杂系统理论及在非线性系统中的应用研究[D].浙江大 学,2005.

[3]邹媛媛,邹涛,李少远.混杂系统的预测控制.控制与决策,2007,22 (4): 361-365.

[4]丁宝苍.预测控制的理论与方法[M].北京:机械工业出版 社,2008.

[5]曾锋,高东杰,李秀改.一类有约束的分段线性系统双模预测控制.控 制与决策,2006,21(5): 597-600.

[6]ZKAN L,KOTHAREM V,GEORGAKIS C. Model predictive control of nonlinear systems using piecewise linear models[J]. Computers and Chemical Engineering,2000,24(2-7): 793-799.

[7]LAZARM,HEEMALSW PM H. Predictive control ofhybrid systems: Input-to-state stability results for sub-optimal solutions[J]. Automatica, 2009,45(1): 180-185.

[8]El-Farra N H,Mhaskar P,Christofides P D. Uniting bounded control and MPC for stabilization of constrained linear systems[J]. Automatica, 2004,40(1): 101-110.

混杂网络时间同步系统研究 篇2

为了满足各领域随时随地需要正确的时刻, 由各国有关天文台提供标准时刻和频率标准的这种工作, 就叫做时间 (包括频率) 服务, 也称为授时工作。随着各种新技术飞跃发展, 对时间测量精确度要求不断提高。于是短波授时、长波授时、电视授时 (同步) 、卫星授时、网络授时、电话授时等授时技术相继问世, 从而把时间工作的精确度推进到微秒 (10~6) 量级, 甚至更高。

对于联网的计算机, 通常使用的对时方式是采用网络对时协议 (NTP) 作为网络内对时协议, NTP是一种在网络计算机上同步计算机时钟的协议, 现在是一个因特网标准, NTP使用的调整的格林尼治时间 (UTC) 对计算机时钟的时间进行同步, 精确到毫秒, 有时比毫秒的精度还要高。UTC时间是使用多种不同的方法得到的, 包括无线电和卫星系统。但是, 在每台计算机都安装这些接收机是不实际, 也是不经济的。作为替代, 指定的时间服务器的计算机上安装这种接收机, 并使用如NTP的协议来同步时间。

对于物理相对隔离的网段及物理分离的计算机, 采用服务器间通过串口或USB扩展接口间通信的解决方案, 通过特殊的自定义协议和自主知识产权的算法实现准确对时, 同时有效保障了安全性。

由于故障录波等系统只提供G P S接口, 对这一部分的系统对时采用主控PC服务器直接通过GPS集线器 (各端口相互独立) 向GPS端口发送标准GPS时钟格式的方式时间同步 (非标准GPS格式需提供专用协议) 。

1 NTP协议

NTP适用于运行在计算机上的和客户端/服务器程序和协议, 程序由作为NTP客户端、服务器端或两者的用户编写, 在基本条件下, NTP客户端发出时间请求, 与时间服务器交换时间, 这个交换的结果是, 客户端能计算出网络时间的延迟, 形成弥补值, 并调整与服务器时间同步。冗余服务器和不同的网络路径用于保证可靠性的精确度, 除了客户端/服务器商的同步以外, N T P还支持同等计算机的广播同步。N T P在设计上是高度容错和可升级的。这也为以后方案的升级以及时间精度的进一步提高提供了保证。

时间精度误差由传输延时 (T1) 与程序运行时间消耗两部分组成 (T2) 。这里首先介绍传输延时的提取。

基于局域网环境的对时系统, 采用NTP协议完成时间的传输与校准。NTP协议的包头结构与SNTP时间戳结构定义如下 (参见RPC2030) 。

由包结构可知:客户端获取的精确时间=时间内容-参考点延时。

2 232/485/USB端口对时技术

所有参与时间同步的物理隔离的服务器及分离的计算机通过串口/USB HUB集联到时钟服务器, 时间同步信息发送由时钟服务器通过串口H U B集中推送。串口/USB HUB支持级联方式扩展。

由握手协议可知, 时间精度误差主要由传输延时 (T1) 与程序运行时间消耗两部分组成 (T2) 。

传输延时测试:计算出一个误差参考值。

T1=[服务器开始发送完整时间信息→客户端接收到完整时间信息]时间间隔

在实际误差计算中:

T1= ([服务器开始发送完整时间信息→客户端接收到完整时间信息并返回→服务器接收到完整时间信息]时间间隔) /2

经测试, 在传输距离稳定的情况下, T1通常稳定在某个典型值区间, 精度误差为25ms左右。因此, 在对时前的基准误差测试中, 我们采用多次采样, 然后取平均值的方法来确定服务器到每台客户机之间的传输误差。

3 实验结果与分析

经实地大量测试, 本系统对广域网时钟服务器时间同步精度误差低于±50ms, 局域网时间同步精度误差见表1, 从实验结果上看, 可以有效满足实际工作中故障检测等事项对时间精度的需要。

由上表可见, N T P协议仍然能获得最小的精度误差;232/485/USB接口模式在传输条件大致相同的情况下, 误差比较稳定在30ms左右, 高于NTP协议的误差, 其原因在于算法中采用了多次误差取平均值的方法, 造成了误差计算精度的损失。

4 结语

在本文中提出了一种综合采用NTP时间协议与232/485/USB接口模式的时间同步方法;其中NTP协议用于局域网内时间同步, 而232/485/USB接口对时方法则用于GPS时钟下达, 物理隔离计算机及物理隔离的网段之间时间同步。通过实地实验, 本文中的时间同步方法获得了不错的效果。

但是从实验结果来看, 232/485接口模式的时间精度误差仍然高于NTP协议, 这是由误差计算方法造成的, 因此如何减小232/485接口模式的时间同步精度是下一步的研究方向。

摘要:随着电网自动化水平的不断提高, 电力系统统一时钟的重要性也愈来愈突现出来, 因此在全网自动化装置的实时时钟必须统一。考虑到电力系统计算机及计算机网络的特性, 在本文中提出了一种综合采用NTP时间协议与232/485接口模式的时间同步方法;其中NTP协议用于局域网内时间同步, 而232/485接口对时方法则用于GPS时钟下达, 物理隔离计算机及物理隔离的网段之间时间同步。通过实地实验, 本文中的时间同步方法获得了不错的效果。

关键词:时间同步,NTP协议,接口

参考文献

[1]周书民, 刘玲.网络环境中的时间同步[J].计算机与现代化, 2003 (2) :41~42.

混杂控制系统 篇3

对祁连山西段香毛山组正层型及其周边地区的地质调查和岩石学、地层古生物学研究发现,原划香毛山组并非正常的.正式岩石地层单位,而是一个奥陶系蛇绿构造混杂岩带.在介绍该混杂岩的物质组成的基础上,对其构造性质进行了讨论.认为该混杂岩带是奥陶纪北祁连洋壳向北俯冲消减--镜铁山-捷达坂微陆块与东大窑-妖魔山-石灰沟岛弧带碰撞而形成的地壳缝合带.

作 者:王永和 焦养泉 李建星 WANG Yong-he JIAO Yang-quan LI Jian-xing  作者单位:王永和,WANG Yong-he(中国地质大学,湖北武汉,430074;西安地质矿产研究所,陕西西安,710054)

焦养泉,JIAO Yang-quan(中国地质大学,湖北武汉,430074)

混杂控制系统 篇4

由于电力电子变换器本质的高阶非线性, 闭环控制问题多年来未能得到较好的解决。线性、非线性和智能控制理论在电力电子中先后得到应用, 由于模型存在误差或者控制理论本身的不完备, 这些解决方案都未能达到最佳。近年来随着半导体技术的发展, 高精度的高速微处理器的出现和普及, 使现代控制及智能控制方法的实时计算或近似估算成为可能。在设计高性能的电力电子系统时, 先进控制理论的应用是很有实用价值的。

本文对混杂系统控制理论的发展现状做了总结, 对电力电子变换器的混杂系统建模及混杂系统控制理论在电力电子学的应用进行了总结和展望, 指出切换系统最优控制的应用是一个比较新颖的研究方向。

1 混杂系统控制的研究现状

混杂系统是一类包含相互作用的连续动态过程和离散动态过程的动态系统, 混杂系统控制理论是继线性系统、非线性系统控制理论之后发展起来的系统控制理论。经典及现代控制理论研究的数学模型可以视为混杂系统的一个特例, 而将传统控制的理论体系推广到混杂系统控制理论还有大量的理论研究要做。混杂系统的模型有很多种, 如层次结构模型、自动机模型, 混合逻辑动态模型, 切换模型等, 其中应用最广泛的是自动机模型。

混杂系统的控制方法与现代控制理论类似, 也包括自适应控制、学习控制、容错控制、镇定控制、最优控制和鲁棒控制等, 这里仅对三种研究较为深入的控制方法加以说明。

(l) 镇定控制:是指在给定平衡点下, 调整控制策略, 使系统由不稳定转换为稳定的控制策略。类似传统控制中用输出或状态反馈令开环不稳定系统闭环稳定。

(2) 最优控制:就是在约束条件下, 满足初值和终值条件, 并使系统的给定性能指标达到最优的控制策略。

(3) 鲁棒控制:实际的混杂系统通常存在各种不确定性, 鲁棒控制器按标准状态设计, 也能够分析并克服这些不可预见的干扰因素, 令闭环系统具有一定的鲁棒性。

2 电力电子变换器的混杂系统建模

电力电子变换器中开关器件的存在, 使它成为一个典型的开关非线性系统。随着开关的通断, 电路处在不同的工作状态;每一个状态中, 系统都随时间连续运行。在变换器外部或内部事件的驱动下, 系统在各个状态间循环跳转, 输出由在几个状态间的切换平均实现。变换器的运行特征与混杂系统完全吻合, 因此可以说, 电力电子变换器是一类典型的混杂系统。

目前在电力电子变换器的混杂系统建模中应用较多的有自动机模型和切换系统模型, 按这两种思路得到的变换器数学模型基本是一致的。

3 混杂系统控制在电力电子中的应用

在国内, 从20 世纪末开始, 越来越多的学者投入到混杂系统控制理论的研究, 并致力于将混杂系统控制理论应用于电力电子变换器, 目前取得了一定的成果。

文献[3] 是国内较早将混杂系统理论引入电力电子变换器研究的论文, 对电力电子电路进行了混杂系统建模、故障诊断、事件辨识以及小波故障分析等方面的研究。

文献[4] 对变换器用自动机模型建模做了有益的探索, 利用混杂自动机理论建立了电力电子电路的统一抽象模型, 并设计出新型滑模变结构控制器。将混杂系统模型和非线性控制方法结合是有益的尝试。

文献[5-6] 建立了DC-DC变换器的切换线性系统模型, 并引入了切换线性系统投影法的概念, 提出最小投影法切换律的控制策略。仿真和实验结果表明最小投影法切换律在DCDC变换器中具有普遍适用性。为了实现切换控制的鲁棒性, 与PI控制进行了结合在扰动情况下对平衡点进行修正。最小投影法切换律的本质是切换系统在任意初始状态都能够选择一个指向平衡点的速度矢量场, 使系统轨迹不断逼近并最终稳定运行于平衡点。

4 切换系统最优控制及其在电力电子中的应用展望

对混杂系统的最优控制问题的研究, 取得了一定的成果, 特别是基于切换线性系统的最优控制。基于经典的动态规划方法, 文献[7] 针对切换线性系统的最优控制提出了一种二阶段算法。首先固定切换序列, 在此条件下求得切换系统最优控制问题的次优解;然后改变切换序列 (改变切换次数和顺序) 来求全局最优解。

当把电力电子变换器视为周期的切换线性系统, 可以用来实现多种目标的最优控制。这种情况下系统不能达到一般意义上的最优, 但是其运算较为简单, 在一定程度上可以达到设计目标, 具有一定的实用价值。文献[8] 给出基于范数、基于收敛路径、基于收敛距离、基于收敛方向和基于综合的周期切换线性系统的最优切换律的设计方法, 可以尝试推广到更复杂的情形, 检验其性能。

切换系统控制本身还不成熟, 有很多问题在控制理论上未能很好地解决。由于切换线性模型可以精确地描述电力电子变换器, 切换线性系统最优控制期望能得到更好的特性。

5 结论

作为一门交叉学科, 电力电子学的发展与控制理论的应用密切相关。目前混杂控制理论还有较大的发展空间, 它在电力电子的应用更是刚刚起步。切换控制是新兴的控制方法, 由于它所处理的切换系统模型可以较为精确地刻画电力电子变换器, 它在电力电子中的应用具有较好的前景。

摘要:为了更好地解决电力电子系统闭环控制的问题, 非线性控制、智能控制等现代控制方法都曾尝试应用于电力电子, 而混杂系统控制理论和电力电子的结合才刚开始。本文对混杂系统控制理论的研究现状及其在电力电子学中目前的应用进行了总结和展望, 并着重指出切换系统最优控制是一个有较好前景的研究方向。

关键词:混杂系统控制,最优控制,电力电子

参考文献

[1]张波.电力电子学亟待解决的若干基础问题探讨[J].电工技术学报, 2006, 21 (3) :24-35.

[2]杨宽, "基于混杂系统理论的电力电子电路建模与控制研究[D]"2010.

[3]胡宗波, 张波, 邓卫华, 等.基于切换线性系统理论的DC-DC变换器控制系统的能控性和能达性[J].中国电机工程学报, 2004, 24 (12) :165-170.

[4]胡宗波.基于切换线性系统的DC-DC变换器控制基础理论研究[D].广州:华南理工大学, 2005.

[5]肖文勋.电力电子变换器切换线性系统模型的稳定性与最小投影法切换律[D].广州:华南理工大学, 2008.

[7]Zhengdong Sun, Shuzhi S.G..Switched Linear Systems:Control and Design[M].Germany:Springer, 2005:3-18.

混杂控制系统 篇5

1 季诺混杂系统

1.1 混杂系统

混杂即在系统和组成方面的非单一性。而混杂系统是指组成系统的状态和过程随着时间不断变化, 其包括离散时间动态系统和连续变量动态系统两种混杂情况, 且系统中的离散时间和连续变量之间是相互作用和约束的, 在控制系统中, 这种不同特性行为表现为具有连续动态行为和离散时间驱动的动态行为以及这两种行为相互作用构成的复杂系统就是混杂系统[7]。

1.2 季诺混杂系统概述

季诺混杂系统是混杂系统的一个特征系统, 也可以理解为是混杂系统在有q0, 限x0的=时间内进行无限次离散变迁。在实际的实物系统中不存在季诺问题, 但由于在基于季诺混杂系统建模时, 模型过度抽象, 导致实际的实物系统的混杂系统模型可能是季诺问题。例如连续和混杂系统中普遍存在的颤动和松弛控制都可以认为是在不同控制作用中进行无限次快速切换。

季诺混杂系统能够接受在有限时间内进行无限次离散变迁的执行, 这类混杂系统在一般情况下很难进行分析和设计。显然, 确定一个问题是否属于季诺的非常重要。

对于多交叉口的信号联动控制, 从宏观上看是一个连续变量的动态系统, 但在微观方面实则是一个离散的动态变化过程。各个交叉口随着信号灯的控制车辆有序运行, 但将多个交叉口看成一个整体时, 交叉口车辆的运行成为无序运行的状态。因此, 可以将多交叉口的信号联动控制问题看成是一个季诺混杂系统的优化控制问题。

1.3 季诺混杂系统的算法

我们可以说混杂系统接收一个执行c。

对于一个运行来表示c的初始状态。运行时间为混杂时间轨迹间隔数, 通过上述分析, 给出季诺执行的定义如下。

定义1:如果t是无限序列, 则为无限执行;如果执行是无限的, 且t¥ (x) <¥时, 则混杂系统执行是季诺的。季诺执行的运行时间则称为季诺时间[8]。

为了研究混杂系统的季诺特性, 先介绍ω极限状态集合季诺状态集的概念。

定义3:季诺时间的ω极限点称为一个季诺点。所有季诺点的集合则是季诺执行的季诺集。

2 季诺混杂系统在区域交叉口协调控制中的应用

2.1 问题描述

城市交叉口信号灯的控制问题是解决城市交通拥堵的关键措施之一, 而交叉口车辆的进出是一种非线性的、时变的、滞后的大系统, 其既存在交叉口车辆数实时变化的连续部分, 又包含各个交叉口相位切换的离散部分, 对于多交叉口问题, 其连续部分和离散变化表现得尤为突出, 因此, 也就是说交叉口车辆的变化过程, 实际上是一个由相位切换来控制的复杂的动态过程。而季诺混杂系统理论, 为研究由连续的动态行为和离散的事件驱动相结合的动态过程提供了一个理论平台。

本次采用季诺混杂系统主要解决多交叉口信号灯协调控制两个层面的问题:第一个是两个交叉口信号灯的优化组合问题, 寻找最佳的相位切换时间;二是优化组合相位次序问题。

考虑一种四相位交叉口, 两交叉口之间的距离相距500 m, 两个交叉口车道的表示分别为第一个交叉口为L11, L12, L13, L14, 和第二个交叉口为L21, L22, L23, L24, 如图1所示, 两个交叉口的相位设置如图2所示。

为了方便研究, 作如下简化: (1) 由于黄灯时间比较短, 放进来不便研究, 因此, 这里信号灯只设红和绿两种状态; (2) 交叉口在一定时间内的平均到达率和平均驶离率是一个常数; (3) 车辆的排队长度是连续变量; (4) 两个需要协调控制的交叉口均为“十”字路口; (5) 为了简化模型的表述, 假设两交叉口的左转车流较小, 交叉口均采用两相位控制, 即东西直行和左转, 南北直行和左转, 右转不设信号灯控制。

2.2 模型的建立

基于以上假设, 可知, 两交叉口的相位有四种可能的搭配组合, 分别为 (1) (3) 、 (1) (4) 、 (2) (4) 、 (2) (3) , 显然可以将两交叉口看作一个整体, 为四相位交叉口形式, 但此时, 存在四种优化组合相位次序, 分别为 (1) (3) 、 (1) (4) 、 (2) (3) 、 (2) (4) ; (1) (3) 、 (2) (3) 、 (2) (4) 、 (1) (4) ; (1) (4) 、 (1) (3) 、 (2) (3) 、 (2) (4) ; (1) (4) 、 (2) (4) 、 (2) (3) 、 (1) (3) 。这四种优化组合用Xr表示, 其中r=1, 2, 3, 4。

设j为交叉口的编号, 则这里j=1, 2;且设交叉口的平均到达率和驶离率分别为lji和mji。当交通灯为红色时, 车道上车辆的变化只受到达率的影响, 当交通灯为绿灯时, 车道上车辆的变化受到达率和驶离率的影响。设Sji表示车辆在交叉口Lji车道的排队长度。

根据前面假设, 车辆排队长度是一个连续变量, 因此, 在进行双交叉口优化过程中, 应该从排队长度的角度出发, 计算出每个交叉口一个最佳切换时刻, 这一时刻将是各个相位之间实际最佳切换时刻的近似值。

下面写出表示切换时刻和排队长度关系的方程。

在X1的情况下, 对于相位1, 即时间段从0t到1t, 则两交叉口相位组合 (1) (3) 为绿灯, 其他相位均为红灯, 则根据上述假设可得出各个车道上车辆排队长度的变化率为:

根据上述分析, 可得出如下假设:

用A1~A16, 分别表示四种不同相位切换情况下的各个车道的延误情况, 现列出A1~A4。

依次, 可以得出A5~A16的车道延误情况。

显然系统的动态方程可以表示为:

对于两交叉口的四相位交通流的动态模型, 可以分为四种离散状态, 基于这样的模型, 在给定平均到达率和驶离率的情况下, 选取一种性能指标:平均排队长度最短、相位切换时间、相位优化组合。显然, 交叉口的信号灯控制问题转化成求取切换型混杂系统的最佳切换时刻和最佳相位组合问题。

3 季诺混杂系统的优化控制问题

通过分析, 上述两个交叉口信号灯的协调控制问题即为混杂系统的季诺问题, 对于任何一个离散的分系统, 如X1。季诺混杂系统优化的目的是寻求一个最有控制输入到系统中, 使得两个交叉口车辆的平均排队长度最短。因此, 于整个优化过程, 可以分为以下三个步骤进行:

(1) 固定某一个输入系列θ, 使得每个子系统由传统的离散问题转化为容易求解的连续系统最优问题。

(2) 寻找两交叉口的最优相位组合, 使得车辆在通过交叉口时所用时间最短。

(3) 寻找最优的切换序列θ, 使得目标函到达最小, 交叉口车道排队的平均长度最短。

其具体的算法如下:

(1) 固定总的切换次数k和离散子系统的切换序列θ, 并确定目标函数, 对于多种不同的相位组合模式和时间变量t0, t1, Ltn, 采用动态优化和静态优化相结合的方法, 求得最佳相位组合。

(2) 保持总切换次数不变, 改变连续子系统的切换次序, 进而寻得最优解。

(3) 改变切换次数, 求得最优切换时间。

根据上述提供的优化过程和算法的执行过程, 采用1.3所提供的季诺混杂系统的算法, 采用仿真系统, 代入相关数据, 可以得出, 不同车道的到达率和驶离率, 交叉口1和交叉口2到达率的取值集中在0~0.4辆/s之间, 不同车道的驶离率为0.4~1辆/s之间, 所确定的最佳相位组合方式为; (1) (4) 、 (1) (3) 、 (2) (3) 、 (2) (4) , 交叉口的周期为130 s, 在上述最佳相位组合方式下求得最佳切换时间:交叉口1为[30 s, 50 s, 80 s, 100 s]。在一个周期内, 交叉口道路平均的最短排队长度为15辆。

4 结论

本文将城市道路两个单点信号控制交叉口作为一个整体, 且以此为研究对象, 根据多个交叉口信号控制的现状问题, 建立了交叉口平均排队长度最短的目标函数, 用以解决交叉口信号灯的时间切换最优问题、相位组合优化问题以及平均排队长度最短的问题, 运用季诺混杂系统自动化分别对所建立的目标函数进行优化, 对实际交叉口进行多次验算, 均取得了较好的结果, 从而证明本文所建立的函数模型及采用的优化算法具有可操作性和使用价值。同时, 本论文需进一步研究的问题有:第一:所优化的目标函数是两个交叉口道路的平均排队长度, 而并没有分别针对每一条道路的平均排队长度进行分析;第二:文章针对各个交叉口两相位的情况进行了研究, 但对于多相位的情况却没有进行深入研究。

摘要:随着城市路网的不断密集化, 城市交通拥堵的不断加剧, 而城市交叉口的信号控制成为解决城市交通拥堵的有效策略之一。在此背景下, 文章首先分析了交叉口信号灯控制的特点, 得出其具有季诺混杂系统的特点, 然后针对两个交叉口相位优化组合问题和时间切换问题建立了基于交叉口排队长度最短的目标函数, 最后, 文章采用季诺混杂系统的优化策略对所建立的目标函数进行了求解, 结果表明, 采用季诺混杂系统可以对多个交叉口信号进行协调控制。

关键词:多交叉口,季诺混杂系统,相位优化组合,切换时间,排队长度

参考文献

[1]赵晓华, 李振龙.基于切换模型的两交叉口信号灯Q学习协调控制[J].北京工业大学学报, 2007 (11) .

[2]赵晓华, 陈阳舟.基于混杂系统理论的单交叉口信号灯控制[J].北京工业大学学报, 2004 (12) .

[3]张辉, 杨玉珍.基于分布式Q学习的区域交通协调控制研究[J].系统仿真学报, 2006 (10) .

[4]齐驰, 侯忠生.信号灯区域自组织控制[J].

[5]王秋平, 谭学龙.城市道路多交叉口信号协调控制优化研究[J].西安建筑科技大学学报, 2008 (6) .

[6]牛虎, 李桂萍, 林磊.城市单点交叉口信号灯模糊控制建模与仿真[J].交通与安全, 2009 (9) .

混杂控制系统 篇6

关键词:混杂自动机,信号灯控制,协调控制,Paramics

0 引 言

交通拥堵问题是当今大城市发展遇到的主要问题之一。通常城市路网的拥堵问题主要靠建设更多的道路来缓解,可是在城市中心区域,路网建设遇到瓶颈,交通拥堵问题就只能通过智能交通系统(ITS)的实施和应用来缓解。交通信号控制在ITS中有着重要的地位,尽管在这方面已进行了大量的研究工作,但是对于处理城市区域交通路口的拥堵仍然有很大的研究空间。

现今,主要的交通控制系统主要分为2类:①固定时间策略,这种方式基本都是基于历史交通数据的离线优化算法;②车辆激励策略,这是一种通过利用实时道路车辆状态和信号控制策略同步进行的在线优化方式。固定时间策略不依赖于实时的道路车辆信息,而第2种方式可以通过交通网络实时信号条件自动地响应出相应的信号控制策略。信号控制主要的决定因素是信号周期,绿信比和信号延时。

最早的也是应用最广泛的系统是英国的SCOOT系统,它通过实时信号的测量给出信号周期、绿信比和信号延时的增减量来控制城市交叉口区域信号。但是其绿信比的优化依赖于饱和度的估算,并且以小步长变化对其进行调整,因此有可能不足以及时响应每个周期的交通需求[1]。Lo[2]采用了一个元胞传输模型,提出动态信号时间策略来优化相关问题,然而其结果对于真正的现实交通网络问题是启发式的并且计算量很大。此外,Lei 和Ozguner[3]提出了一种交通响应方案,但是这种方案需要的与交叉口有关的输入数据是由混杂Petri网模型[4]提供。

本文提出一种城市区域交通信号控制策略,它能基于固定信号周期决定实时信号的绿信比,使相应交叉口信号区域的车辆排队长度最小,并应用于一个实际的两相邻交叉口信号灯控制。结果表明能有效地减轻交通拥堵,对于实际应用有其现实意义。

1 城市区域交通网络模型

1.1 相关模型分析

根据Barisone等人[5]提出相关道路宏观模型来描述道路网络。在此模型的基础上,加入路口信号周期分析,交叉口间通行时间的评估来模拟现实道路状况进行两交叉口信号灯的动态协调控制。

普通交通信号区域是由信号灯控制的一系列交叉口组成的。为了得到实时的交通信号控制策略来协调相邻路口的绿时信号比与相位差,通常认为各路口交通信号有相同的周期长度T。整个信号区域交通网络状态可以由变量ni(k)表示,其代表在K周期中,每个周期开始时各个车道Li上排队车辆数。车辆排队数量在一个信号周期内随信号变化而增减,为了描述每个车道Li车辆动态变化,用变量ui(k)和yi(k)分别表示在相同的时间间隔k周期内进入和驶离车道Li的车辆数,ppi表示这一段时间内车道Li的车辆的驶入率与驶离率,tg为绿灯时间。则车道Li的车流状态方程为:

ni(k+1)=ni(k)+ui(k)-yi(k),i=1,…,I

yi(k)=ptg

ui(k)=piT

1.2 交叉口混杂自动机模型的建立和周期计算

1.2.1 线性混杂自动机对T形交叉口控制理论的应用

交叉口信号控制系统可以看作一个混杂切换系统,可以将信号灯控制的相位切换看作离散事件部分,道路车辆行驶状态看作是车辆实时变化的连续时间动态行为部分。

具体的交叉口系统如图2所示.此系统[6]包含4个车流方向,其中x0方向车流因不受交叉口影响故不加以考虑,设定其他3个车流方向车流以输入率pi到达路口xi,i=1,2,3。每个路口的交叉口驶离率统一为常量p>0。而且,在当车流在路口xi切换至路口xj(ij)的过程中,需要加入一个切换时间δij>0,这个时间包含路口黄灯时间及绿灯时刻驾驶员起步延迟时间。

所有路口驶入率及驶离率满足条件[7]

p>p1+p2+p3

对于此路口情况,定义如下切换规则:

1) 车流由图2中第1相位开始。

2) 当相位j中的相应j车道车流排空时刻,经过一个短暂的调整时间δj(j+1),相位将切换至j+1,j=1,2。当第3相位车流排空的时候,相位将在δ31时刻后转至第1相位。

此交叉口混杂自动机系统周期可表述如:

Τ=(δ12+δ23+δ31)pp-(p1+p2+p3)

1.2.2 线性混杂自动机对十字交叉口控制理论的应用

具体的十字交叉口系统见图3。

对于此路口情况,定义如下切换规则:

1) 车流由图4中第1相位开始。

2) 当相位j中的相应jj+4车道较大车流排空时刻,经过一个短暂的调整时间δj(j+1),相位将切换至j+1,j=1,2,3,4。当第4相位车流排空的时候,相位将在δ41时刻后转至第1相位。

将T形交叉口控制理论拓展到十字交叉路口,在p>0,p1,p2p3,…,p8>0,δ12,δ23,δ34,δ41>0且满足pi=14max(pi,pi+4)的条件下基本周期T可以表示为

Τ=(δ12+δ23+δ34+δ41)pp-i=14max(pi,pi+4)

1.3 相邻交叉路口通行时间评估

假设车辆在路段中的平均速度为vi,而且在每个周期内都固定。对于路段Li的旅行时间为τi(k)=li/vi。式中:li为道路长度。旅行时间τi(k)影响同一个相位内进入和驶出道路的车辆的数量。此公式在交通欠拥堵的状态下是有实际意义的。然而,在道路拥堵的时候,路段内车辆聚积,旅行时间随车辆排队数量ni(k)一直在变化。

如图4所示,对于旅行时间τi(k)的评估的简单表达可以看作由两部分构成:车辆到达排队末端所需要的时间Tfi(k)(自由行驶时间),所有的排队车辆离开此路段所需要的时间Tci(k)(排队清空时间)。则有:

τi(k)=Tfi(k)+Tci(k)

不考虑车辆运动学,将所有车辆模型宏观化,将ta,tr分别记为车辆平均加速时间和驾驶员平均起动反应时间。设定车辆的平均长度为5 m。那么路口ni(k)数量的车辆所需要的必须的车辆排空时间Tci(k)为:

Τci(k)=ta+trni(k)+5vi(ni(k)-1)

车辆由上游进入车道Li,自由通行路段长度为li-5ni(k)。因此,自由行驶时间Tfi(k)的估计为:

Tfi(k)=li-5ni(k)/vi

然而,当车辆驶入车道Li时,排队长度同时也在减小,致使进入车道的车辆自由行驶的距离增加。事实上,在li-5ni(k)/vi的时间内,有yi(k)辆车离开车道。给出其动态估计量y^i(k)来估计,则可以用li-5ni(k)/vi来代替Τci(k)y^i(k)代替ni(k),经过一系列计算可知:

y^i(k)=max([li-5(ni(k)-1)-tavivitr+5],0)

因此,自由行驶路段现在长度为li-5(ni(k)-y^i(k)),所以自由行驶时间调整为:

Τfi(k)=li-5(ni(k)-y^i(k))vii=1,ΙkΝ+

则旅行时间根据上式可得:

τi(k)=li-5(ni(k)-y^i(k))vi+ta+tr(ni(k)-y^i(k))+5vi(ni(k)-y^i(k)-1)i=1,Ι,kΝ+

2 动态交通信号控制策略

文章提出的交通控制方法基于实际的交通需求。在设定的K周期优化时间内,评估每个周期时间城市交通网络内各车道车辆排队长度ni(k)。即在每个时间间隔内,控制器都需要选择一个合适的控制方案来动态地改善性能函数的表现使其最小。此方案的确定是基于前一个周期的路口检测器得到的实时交通流量参数,利用混杂自动机模型确定各路口信号周期单元,道路车流运动模型确定两相邻交叉路口的信号延时参数并将其应用于接下来的信号周期内。

为了使两路口之间车辆拥堵和回流情况的风险最小,引入以下性能指标函数[8]表示控制目标,使两路口相邻车道的车辆排队数量较小。对于两相邻路口网络之内的相关车道,其在周期时间内的平均车辆数目为:

Ji=1Κk=1Κni(k),i=1,Ι

动态的交通信号控制策略[9]如图5所示,本策略可以认为其在每一个离散的时间间隔内动态的评估整个交通网络的车流状况并给出相应的路口协调方式。此种方式既可以在线地应用产生实时的交通信号控制方案,也可以离线地针对历史数据得到一系列应对不同交通状况的信号控制方案,控制者可以根据相应的交通路况动态选择应用。

3 交通控制信号的协调

这一部分将讨论信号化城市区域2个相邻路口的同步协调控制方式,目的是使车流顺利通过此相邻路口。为了达到此目的,必须设定两交叉口信号延时策略,即从第1个路口绿灯相位开始到下游路口绿灯相位开始之间的时长。

假设一个路段Li内有2个相邻的交叉路口,Oi为相应的2个固定周期绿灯信号相位的信号延时表示。通常信号延时Oi=li/vi然而此表达式只在交通不拥堵状态下具有实际意义。相反,当车辆沿着道路聚积,信号延时相应的应考虑清空排队的时间,因此提出一个合适的信号延时计算方式:

由3.1内定义的Tfi(自由行驶时间)和Tci(k)(排队清空时间),对于车辆进入车道后的不同状况下,有:

1) Tfi(k)>Tci(k)。自由行驶时间大于排队清空时间的情况下,为了避免车流在车道中拥堵,建立车辆通行的绿波段,需要延迟下游路口的绿灯信号相位开始时间,相应修正信号延时为

Oi(k)=Tfi(k)-Tci(k)

2) Tfi(k)≤Tci(k)。自由行驶时间小于或者等于排队清空时间。道路拥挤程度很严重。为了尽快清空下游路口排队并使下一周期信号阶段上游到达的车辆部分排出,相邻路口相应绿灯信号相位应该即时启动。

Oi(k)=0

总的来说,在控制器端定义的相应周期时间内的信号延时的动态评估的公式为:

Οi(k)=1Κk=1Κmax(Τfi(k)-Τci(k),0)

此动态评估的信号延时为优化周期内的平均值,即相邻2路口这一段时间内绿灯信号差的最佳选择。这种信号延时的选择方法也可以拓展应用到多个路口信号协调控制。

4 实例仿真研究与分析

以北京市CBD地区朝阳北路路段为研究对象,通过微观交通仿真软件Paramics构建朝阳北路两相邻路口交通区域仿真路网,然后对信号控制策略进行仿真,见图6。可知区域之内的车道数共有7个,分别为link1~link7。连接路段link6=link7=800 m。

仿真实验中所采用的交通OD数据如见表1。数据为仿真时间段内模拟实际路况所设定的车流量数目。实验各参数为:

仿真步长,120 s;

仿真时间,2 h;

车辆自由行驶时的速度,50 km/h.

由于CBD地区道路渠化设计较宽,可以认为车道中车辆驶离率较大,满足混杂自动机模型的周期计算所需条件。根据第二部分相关内容,可以设定两相邻路口周期均为120 s。通过OD矩阵的车流量表示可知,此通行方向上一个公共周期内两路口信号延时约为56 s,则相邻两路口最佳相序变化见图7。

采用系统性能指标函数Ji为目标函数来评价得到的结果。link1~link7分别对应一个Ji(见表2),即采样时间内车道平均排队数量,可以总体上评估各路口排队的总体状态。将此动态2相邻路口协调控制方案与普遍应用的定时控制方案相比较。

通过分析可知在主要方向上车道7在此交通状态下定时控制通常是有较大程度的排队现象,然而在优化的动态协调控制策略实施之后,车辆可以顺畅的通过此两个相邻交叉路口之间的车道,为缓解整个路线上车流状况起到了良好的作用。

5 结束语

文章在混杂自动机模型的基础上提出了一种动态信号协调控制策略来减轻交通拥堵和车辆在道路中的积聚。此策略仿真应用于CBD地区朝阳北路相邻的交叉口路段。结果显示其对于已知交通条件下的交通状态有良好的实时优化能力。

今后的研究将以此方法为基础,继续探讨更广泛路网大区域交通信号协调控制方法,以寻求更好的方式缓解整个路网的拥堵现象,实现整个交通网络的智能控制。

参考文献

[1]刘智勇.智能交通控制理论及其应用[M].北京:科学出版社,2003.

[2]Lo H K.A cell-based traffic control formulation:Strategies and benefits of dynamic timing plans[J].Transportation Science,2001,35(2):148-164.

[3]Lei J,Ozguner U.Decentralized hybrid intersectioncontrol[C]∥Proceedings of the 40th IEEE interna-tional conference on decision and control.Orlando:Florida USA,December 2001:1237-1242.

[4]Di Febbraro A,Giglio D,Sacco N.Urban traffic con-trol structure based on hybrid Petri nets[J].IEEETransactions on Intelligent Transportation Systems,2004,5(4):224-237.

[5]Barisone A,Giglio D,R Minciardi R,et al.A macro-scopic traffic model for real-time optimization of sig-nalized urban areas[C]∥Las Vegas,Nevada USA:Proceedings of the 41th IEEE Conference on Deci-sion and Control December 2002:900-903.

[6]Savkin A V,A Mateev S,Cyclic linear differentialautomata:a simple class of hybrid dynamical sys-tems[J].Automatica,2000,36(5):727-734.

[7]Perkins J R,&Kumar P R.Stable,distributed,real-time scheduling of flexible manufacturing/assembly/disassembly systems[J].IEEE Transactions on Au-tomatic Control,1989,34(2):139-148.

[8]Bart de Schutter.Optimizing acyclic traffic signalswitching sequences through an Extended LinearComplementarity Problem formulation[J].EuropeanJournal of Operational Research,2002(139):400-415.

混杂控制系统 篇7

传统的负荷频率控制,即狭义的自动发电控制(AGC)采用的控制信号是将区域控制偏差(ACE)进行积分后送到二次调频回路调整发电机组出力。基于线性理论进行分析时,由于控制回路中采用负反馈,因此,不论积分增益系数如何设置,比例积分环节都能够将误差消除从而达到最终的稳定状态[1]。这是传统的AGC理论的基础[2,3]。但在实际系统中,用线性控制原理去指导实际AGC系统,其动态性能无法令人满意[4,5]。其原因就是由于无论是水电系统还是火电系统都存在非线性环节,且二次控制回路的比例积分增益系数ki不仅与系统结构参数有关,还与负荷变化相关[1],因此,ki的整定应随着系统负荷的变化实时调节,才能满足负荷变化时频率的变化要求。水火电机组都面临着如何设定积分增益系数以满足系统实时变化需求的问题。

文献[6]中,用具有先验知识的Q学习方法设计了火电机组自动发电控制器:将非线性的AGC系统离散化成Markov链;ACE作为状态变量;用Q学习方法控制器代替传统的比例积分控制器,为了进一步加快学习速度,用模糊综合决策的方法获得火电机组AGC环境信息,为强化学习提供先验知识。

但是,在多区域系统中,不仅包括火电机组还包括众多的水电机组。为了全面考虑,本文侧重描述水电机组AGC控制器设计,突出水电机组AGC的特点及如何获得水电机组AGC的环境知识,并结合文献[6]中火电机组控制器的设计提出了水火混杂系统AGC控制器设计思想。最后采用典型的三区域系统模型进行仿真验证。由于文献[6]已经对火电机组AGC控制器进行了详细描述,本文侧重描述的是水电机组AGC控制器设计,结合文献[6]给出了完整混杂系统的仿真结果。

1 水轮机AGC系统中的非线性环节

文献[6]只针对火电机组AGC系统中存在的非线性环节进行阐述,主要包括延时、发电机调节容量限制和机组爬坡率限制、死区等。本文针对水轮机系统中影响AGC的非线性环节进行介绍。

水轮机调节系统是一个非线性时变系统,主要是因为电液伺服控制系统(或机械液压控制系统)存在非线性及其引水系统自身存在非线性。其引导阀辅助接力器和主配压阀接力器都存在起限幅作用的饱和非线性环节。水轮机调节系统的非线性直接影响发电机输出电能频率和过渡过程中的动、静态特性,是不利于系统稳定的重要因素[7]。水流水头因水电站类型不同而存在很大区别,本文假设引水系统为刚性水锤,即不考虑水头因子和水流不稳定作用。

1.1 水轮机AGC系统的非线性约束

1.1.1 延时

为了实时跟踪负荷变化以调整机组出力,SCADA系统需要收集相关的系统状态数据并将遥调指令下发到各个发电厂或直接下发到机组。因此,信息的采集分析、命令的下发和执行都需要一定的时间来完成。本文只考虑由上述各个环节所造成的固定延时。

1.1.2 水轮机调节系统非线性环节

1)频率死区设定。

为了在电网频率变化较小情况下提高机组运行的稳定性,调速器一般都有频率死区设定。当频率偏差小于死区设定值时,调速器停止动作。本文中,水轮机调速器死区的设定值与汽轮机相同,为±0.033 Hz[8]。

2)调速器机械液压系统中的非线性。

以往采用的水轮机调速器以机械液压调速器居多,现今采用较广泛的是电液压调速器,主要区别是后者更灵活,便于使用[9,10]。因为两者功能基本相似,在此只讨论机械液压系统调速器的非线性问题。在机械液压系统中主要考虑接力器关闭时间和关闭特性,关闭时间是接力器从100%开度关闭到0%开度的最短时间,它限制着接力器的关闭速度,其特性类似于火电机组爬坡率约束[10]。因此,文献[7]特别强调指出,机械液压系统模块中必须加入饱和度模块和比例限幅模块来表示系统固有的非线性特性。

1.2 非线性因素影响比较

为了比较非线性因素对频率变化的影响程度,将上述非线性环节即延时、死区、机械液压系统中的比例限幅模块分别加入传统AGC模型中,其他参数不变情况下的仿真结果可参照图1。仿真过程中,假设积分增益系数ki=0.3,延时取2 s,调速器死区设置为0.033 Hz,比例限幅值为每秒0.01(标幺值),负荷扰动相同。

从仿真结果可以看出,对频率影响最大的是调速器的比例限幅环节(见图1(b)),其次是延时的影响(见图1(a)),然后是死区(见图1(c))。其中,死区的影响体现在当频率偏差小于调速器死区设定时,会在小范围内引起频率波动,这种波动会增加发电机无谓的出力调节,从而增加机械磨损。

2 水火电混杂系统AGC控制器强化学习步骤

AGC系统是一个周期性控制系统,因此可以根据其控制周期进行时间离散化处理,即AGC系统在这个时刻所采取的措施只与当前状态有关而无需考虑系统的初始状态以及前一个状态如何,这是一个典型的Markov链。基于此,可以用强化学习控制器代替传统二次调频控制中的比例积分环节,将ACE作为系统状态量,将机组出力调整值作为行动值。实际系统中对ACE的设定有一个范围,即当区域联络线误差大于某一个值时,AGC机组挂机不动作,交由其他控制系统去处理,例如切负荷;当ACE小于某一个数值时,系统认为这是一个无意识交换量,AGC机组也不必动作。因此,很容易将ACE值在有限的状态空间中进行离散化处理。机组出力即行动值也受机组最大出力及最小出力约束,也可以在有限的状态空间中进行离散化处理。不难看出,AGC控制算法实际上就是一个从ACE构成的状态空间到机组出力变化的映射,这个映射就称为策略。

Q学习是一种没有环境知识的动态决策过程,学习过程缓慢。为了改善AGC控制器的初始学习状态,在文献[6]中介绍了基于先验知识的Q学习方法,它是借助于模糊综合决策的方法将专家经验和环境知识转化成AGC控制器学习的先验知识。

用于评估AGC系统非线性的因素集已经在第1节加以介绍,并比较了每个非线性因素对系统的影响。调整AGC控制策略时如果能够充分考虑这些因素对决策的影响,将更有利于选取正确的行动。因此,模糊综合决策方法被用来评估这些非线性因素对系统的影响[11]。其中,决策集就是强化学习行动集。模糊权重集表示每一个因素对决策的影响,权重可以通过经验直接得到。因此,可以通过因素集、决策集和模糊权重集获得综合评估结果,这就是Q学习的先验知识。基于先验知识的Q学习步骤如下。

步骤1:建立状态集、决策集和因素集

1)状态集X={x1,x2,…,x11}由离散化的ACE值组成。将ACE值离散化成11个区间值:0.020~0.016;<0.016~0.012;<0.012~0.008;<0.008~0.004;<0.004~0.001;<0.001~-0.001;<-0.001~-0.004;<-0.004~-0.008;<-0.008~-0.012;<-0.012~-0.016;<-0.016~-0.02。其中,ACE死区值代表的是最小ACE值,即AGC不需要动作的最小区域控制误差值,其范围是0.001>x6>-0.001。参数用标幺值表示。

2)决策集,即强化学习的行动集,是AGC系统中每个控制周期内机组调整的出力值。由于受机组爬坡率约束,每一个周期的最大行动值ΔPmax可以设定为周期内机组可能的最大技术出力上限值。汽轮机最大行动值Δpt设为0.002 5,水轮机最大行动值Δph设为0.005。将其离散化成7个区间,则汽轮机和水轮机的行动集可表示如下:

{ΔΡt={0.0025,0.00503,0.00253,0,-0.00253,-0.00503,-0.0025}ΔΡh={0.005,0.0103,0.0053,0,-0.0053,-0.0103,-0.005}

3)汽轮机的因素集由机组最大出力约束(GRC)、爬坡速率约束(URC)、延时和调速器死区构成。GRC可划分成3个区间值,分别为大于出力最大上限值、小于最小出力下限值、介于两者之间[1]。调速器死区设置为±0.033 Hz。汽轮机爬坡速率一般设为每分钟2%~5%,即每个周期(AGC周期设置为2 s)的URC为0.001~0.003。水轮机的因素集包括延时、死区和调速器机械液压系统中的饱和度和比例限幅约束。饱和度模块与汽轮机的GRC相似,设定为从1到-1的区间段,机械液压变化速率设置为每2 s变化0.005(标幺值)。死区设置与汽轮机相同。

步骤2:依据专家经验建立模糊评估矩阵和权重集。依据第1节的叙述,可以将因素集进行排序,对系统频率变化影响最大的是URC,然后是延时,随后是死区。这个次序是确定因素集权重的重要依据。利用模糊综合决策方法计算状态集X中的所有状态xi值,按总体目标综合衡量采取各个决策的优越度向量Bi。将各个状态xi下的Bi进行“归一”调整,其结果作为Q学习的先验知识,对状态xi下的Q值进行初始化。

步骤3:开始Q学习。在周期t内,根据当前状态xt,选择动作aj,到达新的状态xt+1,以及获得一个立即回报r(xt,aj),更新Q值,重复该过程直到学习结束。

3 混杂系统AGC仿真结果分析

水火混杂三区域系统AGC模型见附录A图A1,其中区域2为水电机组。二次调频系统控制器采用Q学习算法代替传统的比例积分控制器。在控制系统模型中,非线性因素被充分考虑并表示出来。3个区域的控制器独立运行,即强化学习智能体之间没有耦合。所有参数采用文献[12]的数据。

仿真过程中采取的措施如下:

1)用MATLAB/Simulink中的白噪声模仿系统负荷扰动,负荷在0.02到-0.02之间随机扰动。

2)为便于比较,方法A中的Q函数初始值随机生成,而在方法B中的Q函数初始值是基于方法A,然后将环境先验知识加入Q函数的初始值中。方法A和B中的负荷扰动均发生在区域3。

3)机组爬坡速率约束着机组在每个周期的最大调整出力值,为了比较爬坡速率大小对AGC系统的影响,方法A和B中水轮机和汽轮机的最大行动值均设置相等,为ΔPtmaxPhmax=0.002 5。事实上,水轮机可以在几分钟内就达到满出力,因此方法C中设置水轮机最大出力为方法B的2倍,即ΔPtmax=0.002 5,ΔPhmax=0.005。在方法C中,负荷扰动发生在区域2。

4)学习结束的判据是3个区域的Q函数前后2次差值小于给定误差值,且频率偏差值在允许范围之内。

表1列出了3种方法比较结果。从表中数据可以得出以下几个结论:

1)如果设置Q函数前后误差值小于0.005结束学习时,方法A需要1 450幂(episode)的学习,而方法B由于有先验知识,因此只需要840幂学习。方法C的最大行动值是方法B的2倍,因此只需要609幂就能达到要求。

2)Q函数误差值从0.005减少到0.001时,方法A和B的学习幂数基本相同,都经历了大约700幂,而方法C只需要400幂;从0.001 0减少到0.000 2时基本都需要200幂的学习。这是因为方法C将机组出力调整到0.02只需要4个周期就可以完成,而方法A和B需要8步。

方法B和C的仿真结果如图2、图3所示。由图2可见,在区域3为了响应负荷0.02的扰动,控制器经过8个周期来调整机组出力,且每个周期都采用最大出力值0.002 5。区域1和2由于不需要对区域3发生的扰动做出响应,因此机组出力没有变化。在方法C中,由于水轮机最大行动值为0.005,因此只需要4个周期就可以调整机组出力来平衡负荷变化。从图2(b)和图3(b)的曲线变化可以看出,由于方法C中水轮机调整没有方法B中汽轮机平缓,因此引起频率波动也较大,需要达到平缓的时间也比较长。

4 结语

1)学习方法中加入先验知识能有效改善学习过程,而当Q学习达到一定程度时,由于智能体积累了一定的经验,因此学习速度也会加速。

2)尽管本文采用了较复杂的水火电混杂系统,但由于每个区域的控制器是独立学习的,相互之间没有耦合,也简化了算法。

与文献[1]相比,本文中采用的模型更复杂,且充分考虑了水电机组和火电机组所特有的非线性环节的特点,因此也更符合实际混杂系统的变化,能够满足实际系统需求。用智能化的学习控制器代替传统的比例积分控制将是AGC系统在智能化电网要求下的一个可能的新的发展方向。

附录见本刊网络版(http://www.aeps-info.com/aeps/ch/index.aspx)。

参考文献

[1]熊观佐.互联系统分析与运行.北京:水利电力出版社,1995.

[2]ELGERD O I,FOSHA C E.Opti mum megawatt frequency control of multi-area electric energy systems.IEEE Trans on Power Apparatus and Systems,1970,89(4):556-563.

[3]NANDA J,KAUL B.Automatic generation control of an interconnected power system.IEE Proceedings-C,1978,125(5):385-390.

[4]HIYAMA T.Applications of rule based stabilizing controller to electrical power systems.IEE Proceedings:Generation,Transmission and Distribution,1989,136(3):175-181.

[5]DASH P K,LIEW A C,MISHRA B R.An adaptive PID stabilizer for power systems using fuzzy logic.Electric Power Systems Research,1998,44(3):213-222.

[6]李红梅,严正.具有先验知识的Q学习算法在AGC中的应用.电力系统自动化,2008,32(23):36-40.LI Hongmei,YAN Zheng.Application ofQ-learning approach with prior knowledge to non-linear AGCsystem.Automation of Electric Power Systems,2008,32(23):36-40.

[7]罗旋.水轮机调节系统的研究与仿真[D].北京:华中科技大学,2005.

[8]魏守平,伍永刚,林静怀.水轮机调速器与电网负荷频率控制.水电自动化与大坝监测,2006,30(1):18-22.WEI Shouping,WU Yonggang,LI N Jinghuai.Hydro-turbine governor and grid load frequency control:Part two si mulation of grid load frequency control.Hydropower Automation and Dam Monitoring,2006,30(1):18-22.

[9]KUNDUR P.Power system stability and control.New York,NY,USA:McGraw Hill,1994.

[10]魏守平,伍永刚,林静怀.水轮机调速器与电网负荷频率控制:(一)水轮机控制系统的建模及仿真.水电自动化与大坝监测,2005,29(6):18-22.WEI Shouping,WU Yonggang,LI NJinghuai.Hydro-turbine governor and grid load frequency control:Part one modelingand si mulation of hydro-turbine governor control system.Hydropower Automation and Dam Monitoring,2005,29(6):18-22.

[11]杜春霞,高云,张文.多智能系统中具有先验知识的Q学习算法.清华大学学报:自然科学版,2005,45(7):981-984.DU Chunxia,GAO Yun,ZHANG Wen.Q-learning with prior knowledge in multi-agent systems.Journal of Tsinghua University:Science and Technology,2005,45(7):981-984.

混杂:杭州运河旅游集散中心 篇8

混杂作为遗传学概念可以追溯到亚里士多德及他们关于自发的动物杂交所形成新的动物种类的猜想。“混杂建筑,从某种意义上讲,也像植物和动物一样被杂交,将不同的建筑功能、不同的使用用途加以混合的适应城市肌理的建筑物”。

城市是复杂的,所以从某种意义上讲,地块的城市设计也可以像植物和动物一样被杂交,将不同时代的建筑、不同的使用用途加以混合的城市,是一种设计操作的产物。正如各种各样的、形状各异的例子所显示的,城市的混杂有无限多种可以交换搭配的组合。对其分类应审视形式、功能、技术、城市背景以及社会与在各个部分之间建立起一种协调平衡的复杂关系。

混杂“网格、母题”

双网格:景观网格、肌理网格。

在场地中大部分沿用原大河造船厂的建筑尺度和肌理走向,形成正交向水的长条形网格。同时,根据和场地形成-45度夹角方向的半山景区轴线和形成+45度夹角的洋关视线,设计与原有场地肌理扭转45度的景观网格。新时代网格叠加于历史网格之上遵循了历史发展新陈代谢的一般规律,记录了该地块功能特点和使用性质的变迁。

双母题:院落、街道。

建筑在空间上围合成院落组织活动。在城市的空间节点处形成半围合院落。在滨水核心区域的双层步行系统中形成虚实两种组团。街道不仅能体现出城市的文化和肌理,也能造就良好的视廊并将城市和运河完全地连通成一气。

混杂“四种时代风格”

场地中从南到北设计近代以来杭州运河两岸经历的四种时代建筑风味。

民国岛:保留场地最南端原有民国老建筑并加以利用,形成以民国风格建筑为主的酒吧娱乐岛,同时沿分流河道设计沿水民国风格建筑,呼应运河一期高家花园等民国建筑群。

大河建筑群:设计通过多角度的评估系统对场地内的工业遗产进行不同程度的改造利用,对建国后造船产业建筑类型给予保护和城市记忆的延续。

现代购物休闲区:随着该地块性质从原有的工业区向旅游商业区的转换,富有时代感的新功能建筑开始充斥场地,将历史建筑元素组织起来。

新时代生态集散中心区:节能环保的生态建筑是未来建筑必然的发展趋势,保持集散中心建筑的长久不衰。

业态研究推论:

由此得出南地块城市设计适宜引进业态:休闲性旅游、娱乐休闲、购物餐饮、时尚店铺、文化展示、创意产业、女装。

创意产业发展规模:建筑面积34695平方米

本地块包含食、住、行、购、旅、娱、文化、创意产业八大功能。其中永久功能相对固定, 其余功能按照市场规律和需求自由混杂分散在场地各处, 以此全面提高场地活力, 适应不同人群不同时间的活动需求, 避免产生活动盲区, 并为在运河上游览的人群创造丰富的业态景观。

优势:自由混杂、自然生长、抑制盲区。

混杂“八种功能”

八种功能:产业、旅游、住宿、商业、餐饮、文化、娱乐、交通。

针对没有功能任务书的现状,我们通过相关类型的纵、横向比较,对场地做了针对性策划。在功能设置上,设计采用“混杂”的模式,形成全地块在功能上的特色。通过对场地功能的混杂,使得有着不同使用时间段、不同使用者的功能在平面、空间上相互交错,力求实现场地全天昼夜人气不断,形成在同一个功能聚集区有着不同类型的人的参与,打破传统功能分区人员成分单一的缺点。

混杂城市本质上与建筑的不同时期、风格、甚至文化的混杂元素息息相关,所以,无可置疑,混杂城市是过往一切元素积累沉淀的产物。

上一篇:小组考核模式下一篇:移动终端产品