多智能体协调控制技术(精选6篇)
多智能体协调控制技术 篇1
0 引言
分布式电源 (DG) 、微电网 (MG) 接入配电网运行时将给配电网的电压、电能质量、系统保护和调度运行等带来一系列的影响, 而电压稳定性问题是其中一个重要的方面[1,2,3]。近年来出现的虚拟发电厂VPP (Virtual Power Plants) 被认为是更适合和更有效的DG接入方式[4,5,6]。
VPP是通过分布式电力管理系统将配电网中地理位置分散或集中的DG/MG、可控负荷和储能系统合并作为一个特别的电厂参与电网运行, 以期在充分挖掘DG为电网和用户所带来的价值和效益的基础上, 同时有效地解决大量DG接入后对配电网的冲击和影响。在VPP的控制管理系统中, 通常采用多智能体技术[6]。多智能体系统将大的复杂系统划分为小的彼此相互通信及协调的、易于管理的系统, 具有比其他控制更优越的性能[7,8,9]。
现阶段关于VPP的相关研究尚处于起步阶段。本文将针对含VPP配电网的静态电压稳定性进行分析, 充分利用VPP所具有的优点, 研究相应的协调控制方法, 以提高配电网的静态电压稳定性。本文首先对含DG的配电网进行了电压稳定性分析, 根据系统各节点的电压失稳系数判断系统中的电压稳定性薄弱节点;并在薄弱节点接入常规调压设备;其次对配电网中的DG进行VPP等效, 并将多智能体控制理论应用于配电网的电压协调控制中, 同时利用VPP和配电网常规调压设备实现配电网的多智能体协调控制, 并给出了电压协调控制的体系框架。通过仿真表明本文所提出的电压协调控制方法的正确性和有效性。
1 含DG的配电网电压稳定性分析
本文采用概率特征根电压稳定性分析方法, 将含VPP的配电网在稳态运行点线性化, 可得到:
其中, Δx为状态变量, ΔU为输入电压变量。
式 (1) 中消去ΔU, 得到状态空间方程dΔx/dt=AΔx, 其状态矩阵A可表达为:
节点电压的直角坐标形式可表示为U=[UR, UJ]T的形式, 下标R和J表示实部和虚部, 则输入电压变量ΔU可表示为:
设节点电压幅值向量Ut=[Ut1, Ut2, …, Ut N]T, 则节点电压幅值偏差列向量与状态变量向量的关系为:
根据文献[10]中的变换, 可得到节点电压幅值偏差向量与特征值之间的关系为:
其中, U表示矩阵A的右特征向量;W=A″U=[w1, w2, …, wn]为特征根对节点电压的失稳系数, wj的第i个元素wji (j=1, 2, …, n) 被称为特征根对节点电压的电压失稳系数, 其大小反映了特征值λi对节点电压偏差量ΔUt j的影响程度, 如果某个wji较大, 则说明相应节点的电压不稳定性较高, 本文将利用该指标来判断配电网静态电压不稳定程度。
2 含VPP的配电网结构
选取配电网中部分DG构成VPP, 配备中央控制器对VPP中的DG进行控制管理, 典型的含VPP和常规调压设备的配电网结构如图1所示。
图中粗实线表示功率连接, 带箭头的细实线代表信号连接及其流向, 以N1、…、Nn表示常规调压设备 (如STATCOM) , 相应的控制器以N1C、…、NnC表示;虚线框内为VPP, 包括DG以及MG, 图中以DG1、…、DGn、MG1表示, 相应的控制器以DG1C、…、DGnC、MG1C表示。
3 基于多智能体配电网电压协调控制
本文提出的基于多智能体的配电网电压协调控制体系如图2所示。本文将配电网、VPP、常规电压设备 (包括STATCOM、无功补偿电容器、变压器分接头等) 、MG、DG及负荷等均视为智能体。
该多智能体系统共分为以下3层。
a.第1层为配电网智能体层。配电网智能体进行整个控制体系的组织管理, 其中配电网中央控制器负责进行配电网状态的判断和工作模式的切换 (如潮流计算、稳定性分析以及紧急调压等) , 同时对下层智能体进行协调控制, 实现VPP智能体和常规调压智能体的一致性调节。
b.第2层包括VPP智能体和常规调压设备智能体。其中VPP智能体协调VPP内部的MG智能体、DG智能体和负荷智能体, 完成上层智能体发布的任务, 同时实现下层智能体的控制策略和参数计算, 并将下层智能体的状态上传至上层智能体;常规调压设备智能体根据上层智能体发布的任务主要实现配电网局部电压调整。
c.第3层包括MG/DG智能体以及负荷智能体。MG/DG智能体主要是监控MG和DG的运行状况, 根据VPP智能体的任务要求来调节自身的有功和无功出力, 在适当的情况下可以限制孤岛运行, 以达到VPP的电压调节目标。负荷智能体与MG/DG共同达到VPP的电压调节目标, 在MG/DG出力达到极限的情况下, 可通过切负荷的方式达到调压的目的。
基于多智能体的配电网协调控制工作流程为:当配电网出现电压稳定性问题时, 配电网智能体发送调压命令, VPP智能体接收到调压命令以后, 对其下层的MG/DG智能体和负荷智能体发出调压请求, MG/DG智能体和负荷智能体接收到VPP智能体的请求以后, 做出调节有功和无功出力以及切负荷等响应, 以实现VPP智能体的调压;常规调压设备智能体在接收到调压命令以后也进行调压。同时VPP智能体与常规调压设备智能体之间通过相互通信以达到协调控制目的。
4 多智能体协调控制方法实现
4.1 问题描述
考虑配电网智能体是由多个VPP智能体和常规调压设备智能体构成, 单个智能体状态方程可描述为:
其中, xi (t) 为智能体i的信息状态值;Aii、Bii和Aij为已知的系统矩阵;uii (t) 为t时刻智能体i的反馈输入;Kii为状态反馈增益矩阵。
协调控制的目的是求得反馈控制器式 (7) 和协调控制器式 (8) 使得配电网智能体系统式 (9) 是渐近稳定的。
其中, Bij、Kij分别为已知的常数矩阵和状态反馈增益矩阵;uij (t) 为智能体j给智能体i的状态反馈输入, 称为协调控制器。
根据块矩阵的Hadamard积[9], 闭环系统可以描述如下:
其中, “莓”表示Hadamard积。
4.2 协调控制方程的求解
多智能体系统式 (10) 达到协调控制的条件是存在正定矩阵Pii (i=1, 2, …, n) 、矩阵Pij (i≠j, i
由以上可见, 一致性问题可转换为求解具有双线性矩阵不等式 (BMI) 约束的可行性问题:
考虑到不等式 (12) 是关于矩阵Pij和Kij的BMI, 其具体求解步骤如下。
a.初始化。给定初始值k=0, Kij=K0ij (i, j=1, 2, …, n) 。
b.循环。k=k+1, 求解问题minλ和s.t.-L (Pij) <λI, B (Pij, Kikj-1) <λI的解Pij (i, j=1, 2, …, n) , 并令Pkij=Pij (i, j=1, 2, …, n) , 继续求解优化问题minλ和s.t.B (Pij, Kkij-1) <λI的解Kij (i, j=1, 2, …, n) , 并令Kkij=Kij (i, j=1, 2, …, n) 。
c.结束。当Pkij、Kkij同时满足不等式L (Pkij) >0和B (Pkij, Kkij) <0时结束。
5 系统仿真分析
5.1 仿真模型及参数
本文以如图3所示的IEEE 33节点配电系统为对象进行算例验证, 其中偶数节点接入模型为文献[11]中的电动机负荷。电路参数见文献[12]。系统电压基准值为12.66 kV, 视在功率基准值为10 MV·A, 根节点电压为1.05 p.u.。在配电网中的节点17、24、32接入DG, 其有功和无功分别为500 kW、1 000 kvar, 200 kW、300 kvar, 500 kW、1 000 kvar。
图3中, 虚线框图内3个DG组成1个VPP, 在本文的仿真中, VPP中不包含MG。
5.2 系统的电压失稳系数
5.2.1 含DG的配电网的电压失稳系数
本文中DG采用文献[13-14]中的降阶模型, 取ΔP、ΔQ、ΔUo d、ΔUo q为状态变量。经计算, 系统产生20个特征根, 部分特征根如表1所示。
从表1可以看出, 特征根7、8、11、12包含有正实部, 可能导致电压失稳。这4个特征根对负荷节点的电压失稳模式系数见表2。由表1和表2可知, 节点11和29存在较大的电压不稳定因素, 故在这2个节点安装常规调压设备 (本文使用STATCOM) 最为有效。
5.2.2 DG和STATCOM同时接入配电网
在节点11和节点29安装容量为2 000 kvar的STATCOM, 并采用文献[15-16]中的模型, 取ΔId、ΔIq、ΔI0、ΔUdj为状态变量。重新对系统进行小信号稳定性分析, 得到的20个特征值实部均为负数, 满足电压稳定性条件, 但通过对每个智能体的状态变化轨迹进行分析, 得到图4波形。
从图4可以看出, DG2的状态轨迹最后收敛于零, 但DG1、DG3以及STATCOM1和STATCOM2的状态轨迹最终是发散性的, 即系统未达到渐近稳定状态。
5.2.3 VPP和STATCOM采用多智能体协调控制
将配电网中的DG进行VPP等效, 并构建含VPP和STATCOM的多智能体协调控制体系, 按照多智能体协调控制算法, 得到的增益矩阵如下:
图5给出了采用多智能体对DG和STATCOM协调控制时, 整个系统的状态轨迹图。
从图5可以看出, 当采用多智能体协调控制时, 该系统的状态轨迹在1 s以后均收敛至零, 因此说明在多智能体网络系统达到了渐近一致。
6 结论
本文应用了多智能体理论, 对DG和常规调压设备进行协调控制, 以提高配电网的静态电压稳定性。采用特征根分析法进行了含DG配电网的电压稳定性分析, 采用基于特征根对节点电压的电压失稳系数来判断电压稳定性薄弱节点。提出了3层结构的VPP和配电网常规调压设备的协调控制体系结构, 基于协调控制理论, 得出了电压稳定性协调控制的数学模型, 并通过对具有双线性矩阵不等式约束的可行性问题的求解, 设计了多智能体的反馈控制器和协调控制器。通过对DG和常规电压控制手段分别独立控制以及VPP和常规电压控制手段协调控制的仿真, 验证了本文所提出的电压协调控制方法的正确性和有效性。本文为在充分发挥DG益处的同时, 降低对配电网的影响和冲击提供了较好的思路和技术手段。
多智能体协调控制技术 篇2
长期以来, 供应链配送网络的设计与优化都是物流研究领域的重要课题。研究的内容主要包括单一配送中心 (Distribution Center, DC) 选址方法和多个配送中心选址及分配方法两个方面[1]。人们也提出了很多著名的方法和模型来求解这些问题[2]。但是却很少考虑运输过程中, 在运输能力有限的条件下如何最大限度地发挥运输效率的问题。配送网络的流通效率是影响供应链绩效的关键因素, 发挥供应链配送网络最大流通效率解决方案的文献较少, 这些研究的主要方法是通过建立物流的数学模型, 运用运筹学和最优控制理论来控制和优化整个供应链配送网络。但由于供应链系统的复杂性、物流模型的局限性等因素, 导致供应链优化控制的效果不理想。
具有自主性、移动性、协作性等特点的智能体 (Agent) 为供应链配送网络这个复杂的大系统开辟了新的解决途径, 基于多智能体的供应链系统已成为一个研究热点。区域协调是基于多智能体的供应链配送网络协调的一个主要问题, 它是指在运输能力有限的条件下, 根据不同的运输策略, 均衡某几个节点企业所组成的小区域的运输量, 从而提高整个供应链配送网络的流通能力。它要求各小区域间的良好协作, 而现实中的供应链配送网络是由利益相对独立的多个企业通过联盟或合作关系组成的, 为实现整个供应链配送网络的协调必然会引起各小区域之间一定程度的冲突。因此, 如何解决这些冲突是急需解决的重要问题。博弈论是研究理性的主体之间冲突及合作的理论, 它研究主体的行为是如何相互影响的, 主体是如何在相互作用中做出自己的行为选择和行为决策的[3,4,5]。用博弈论的方法来分析问题, 使问题的研究不仅局限于站在某个决策方的立场上找出针对其他方的对策, 更重要的是在分析这些决策过程时能够发现各方相互制约、相互作用的规律, 从而导出合理的结果并用以解决相应的实际问题[6]。将供应链配送网络上的各个仓库、配送中心、中转仓库、分销商、零售商等都看成是一个个的中转站, 而将原材料、装配件、半成品、成品等都看成是运输的资源, 使供应链上的全部资源在配送网络中最大效率地流通顺畅。
二、Agent代理供应链配送网络系统的运作机理
配送网络是由多个单元构成的, 基本的单元包括仓库、配送中心、中转仓库、分销商、零售商等, 这些单元可以称为子系统[7], 这些子系统当中任何一个或几个结合起来都可以构成一个配送网络。这些不同的单元共同构成了配送网络不同的具体内容和功能。所有这些单元互相区别又互相联系, 它们既是不同的单元, 彼此又互相联系着。由它们的互相区别性, 可以各自发挥自己的特长, 由它们的互相联系性, 又可以起到互相协作、互相补充的效果。根据单元在配送网络上所处的位置, 可以把整个的供应链配送网络分成一个个的区域, 而每个区域又分成一个个的单元, 在每个区域内的单元都是交互的。因此, 多Agent供应链配送网络协调系统主要包括两类Agent:由单个单元组成的单元Agent和由几个单元所组成的区域Agent。
每个Agent主要包括3个层次[8]:通信层、协作层和控制层。通信层由通信模块构成, 主要完成与其他Agent的信息交互;协作层由学习机、推理机、规则库和知识库4个部分组成, 主要完成和其他Agent进行协调并生成最终决策的功能;控制层由控制模块构成, 主要完成指导控制任务, 并将控制任务的信息通过通信层传递给其他Agent。
所有的单元Agent和区域Agent都有着共同的全局目标———使得整个配送网络绩效最优。而又有自己的局部目标———尽量使本单元利润最大 (或是本区域利润最大) 。单元Agent之间, 单元Agent与区域Agent之间, 区域A-gent之间是相互影响、相互作用的, 因此, 每个Agent的决策必然要受到另一些Agent策略选择的影响, Agent之间必然会发生一定程度的冲突。下面应用博弈论的相关知识, 建立基于Agent的供应链配送网络系统运输模型, 实现博弈均衡, 实现配送网络的整体运输效率最大, 以提高整个供应链系统的绩效。
三、供应链配送网络系统协调优化模型
1. 基本符号和定义
为建立供应链配送网络运输系统的协调模型, 引入以下符号和定义:
(1) 将每个单元都看成是中转站, 在某一时段内要运出的资源数量是一定的, 运输能力也是一定的。用东、西、南、北4个方向表示资源要运去的4个其他单元。Qi (t) 表示t时段内等候在第i个单元的产品数量的向量。Qi (t) ={Qi, E (t) , Qi, S (t) , Qi, W (t) , Qi, N (t) }, Qi, E (t) , Qi, S (t) , Qi, W (t) , Qi, N (t) 分别表示t时段内等候在i单元的运往东、南、西、北4个单元的资源数。
(2) Qi表示第i单元的资源数值的向量, Qi={Qi, E, Qi, S, Qi, W, Qi, N}, Qi, E, Qi, S, Qi, W, Qi, N分别表示运往不同单元的等候资源的数量值, 可以根据具体情况进行修改。
(3) A表示博弈协调中的行为和决策Agent, 它的目的是通过选择行动策略以最大化自己的效用水平, 是所有A-gent的集合。A={Agent1, Agent2, …, Agent n}。
(4) I表示每个Agent拥有的信息, 包括其他Agent的特征和行动策略的信息。
(5) S表示Agent的所有可能的策略或行动的集合, 一个Agent的全部可行策略称为它的策略空间。每个Agent有一个纯策略的有限集, 为了表示有限运输能力和运输的有序性, 运输策略S只取4种策略, S={东西直运、南北直运、东西双左运、南北双左运}。例如:东西直运表示在东西方向等待的资源运往东西两个单元, 那么运往南北两个单元的资源要继续等待。东西双左运表示在东西方向等待的资源分别运向南北两个单元, 而南北方向的单元要继续等待。在每个方向上运输能力也是有限制的, 用阈值表示, 阈值就是每个方向上可运输资源的最大量。阈值可根据具体情况进行修改。
(6) U表示Agent获得的利益, 是指在既定策略组合条件下Agent的得失情况, 即在一个特定的组合下得到的效用水平。U为Qi (t) 的收益函数。收益即是排队的资源数。排队的资源数越少, 效用水平越高。
(7) Nash均衡:设有n个Agent的博弈描述为G={A, S, U}, 若此问题中战略组合S*={S1*, S2*, …, Sn*}是一个纳什均衡, 则必须满足Ui (Si*, S*-i) ≥Ui (Si, S*-i) , 坌si∈Si, 式中:Si*表示第i个Agent选择的战略;S*-i表示除i之外的所有Agent的策略组成的向量;Ui表示第i个Agent的效用水平;Si表示第i个Agent的策略空间。
2. 协调模型[9]
一个Agent的决策会影响其他Agent的决策, 同时, 也受其他Agent决策的影响, 因此, 一个Agent在做决策时, 应考虑其他Agent可能采取的战略来决定自己的战略。通过Agent间的相互通信, 每一个Agent对其他Agent的特征 (策略空间、效用函数等) 有完全的了解, 这决定了Agent间的协调过程是基于完全信息的博弈过程。一次博弈协调, 定义为G={A, I, S, U}, 式中:A={Agent1, Agent2, …, Agent n}, I表示每个Agent拥有的信息, S={东西直运、南北直运、东西双左运、南北双左运}, U为Qi (t) 的收益函数。每个Agent依据它所拥有的信息I, 在S中选择合适的策略, 通过不断的协调, 使它们的盈利达到纳什均衡, 即:
整个协调过程分为3个层次:下层是单元Agent与其相邻的单元Agent之间的协调;中间层是区域Agent与单元Agent之间的协调;上层是区域Agent与其相邻的区域Agent之间的协调。如图1所示。
3. 协调算法:Q2 (T|s1, s1)
第一步, 单元Agent的资源排队数超过阈值, 则向相邻的单元Agent发出请求。
第二步, 相邻的单元Agent响应请求, 并构建如图2所示的博弈树 (博弈树分枝上的字母代表Agent的策略) , 根据式1寻找Nash均衡。
第三步, 如果Nash均衡存在, 则Agent的行动策略就是达成Nash均衡时的策略, 每个Agent按照该策略控制单元策略, 本次协调结束。如果没有Nash均衡, 则向该单元Agent所在的区域Agent发出请求。
第四步, 区域Agent响应请求, 对其所管辖的单元Agent进行博弈协调, 寻求Nash均衡, 如果Nash均衡不存在, 则该区域Agent向相邻的区域Agent发出请求。
第五步, 相邻的区域Agent响应请求, 进行博弈协调, 寻求Nash均衡, 如果Nash均衡不存在, 协调失败, 则每个Agent保持原先的策略不变。
四、计算案例
用图3所示的一个简单供应链配送网络来说明上面的协调算法。Agent 1、Agent 2、Agent 3分别是3个单元Agent, 它们由区域Agent管辖。为分析方便, 每个Agent的策略集为S={东西直运、南北直运、东西双左运、南北双左运}。图中的数字为t0时段内各个单元向各个方向等待运送的资源数。
由于运输能力有限, 当等待的资源数超过阈值时, 单元Agent间就要进行协调。在t0时段西口的排队产品数Q2, W (t0) =19, 大于阈值QW (设QW=15) , 则Agent 2向Agent 1发出请求, Agent 1响应请求并进行博弈协调, 博弈协调的收益即是排队资源数, 它是Agent 1、Agent 2博弈协调的目标和得失情况的体现, 收益的多少取决于它们的策略组合。假设每个运货周期, 到达单元的每个方向的资源数为λ, 可运往到各单元的资源数为μ, 并假设μ=1.5λ, 那么单元1和单元2在t1时段的排队资源数是由在t0时刻采取的策略决定的。通过构建博弈树可以知道有以下的4种情况:
(1) Agent 1, Agent 2都选择s1, 两个单元的资源数分别是15+2λ, 13+3.5λ。
(2) Agent 1选择s1, Agent 2选择s2, 两个单元的资源数分别为15+2λ, 25+2.5λ。
(3) Agent 1选择s2, Agent 2选择s1, 两个单元的资源数分别为16+2.5λ, 13+2λ。
(4) Agent 1, Agent 2都选择s2, 两个单元的资源数分别为16+λ, 25+λ。
当λ<12时, Agent 1, Agent 2都选择s1, 达到Nash均衡;当λ>12时, Agent 1, Agent 2都选择s2, 达到Nash均衡。Agent 1, Agent 2根据其相应的策略控制单元。以上介绍的是下层协调, 如果单元3南口的资源排队数Q3, S (t0) 等于18而不是图中所示的9, 那么Q3, S (t0) 大于阈值QS (设QS=15) , 则Agent 3向Agent 2发出请求, 而此时Agent 2也向Agent 1发出请求, 这种情况下Agent 3和Agent 2, Agent 2和Agent 1之间的Nash均衡很难达到。于是它们向区域Agent发出请求, 区域Agent响应请求并进行博弈协调, 开始中间层协调。
通过搜索博弈树可知, 当Agent 1选择策略s2, Agent 2选择策略s2, Agent 3选择策略s2, 达到Nash均衡。上层协调与下层协调类似。
通过区域Agent与区域Agent间的协调, 可以使在各个单元等候的资源数达到最少, 从而可以最大限度地使资源在整个配送网络上流通顺畅。
五、结束语
供应链配送网络是配送过程中相互联系的组织与设施的集合。它的最终目的是为了使最终顾客满意, 从而实现整个供应链的价值, 并增强供应链的竞争能力。但是因为配送网络中的元素是属于不同实体所有的, 这些不同实体之间都有着自己的利润和风险, 因此它们会从自己的利益出发, 采取相应的措施使自己利润最大化。一方做出的看来合理的决策有可能会对整个系统带来很大的影响。因此, 在进行配送网络协调时就要把供应链的协调和整合机制作为指导思想, 从而把供应链中的不同实体作为一个整体来进行协调。
用Agent技术来协调供应链配送网络, 就可以发挥系统协调整合的优势。每一个配送网络都是—种有机结合体, 而不是一个组合体。系统各个单元之间变成一种互相联系、不可分割的关系, 只有这样才能互相协调力量。使系统的整体功能大于各个单元功能之和。只有这样, 供应链配送网络的协调才能从整个系统的角度进行较为全盘的优化。
摘要:供应链配送网络的流通效率是影响供应链绩效的关键因素。在运输能力有限的条件下, 加快企业间的资源流通, 促使配送网络最大限度地流通顺畅, 对提高供应链整体绩效有着十分重要的意义。本文以多智能体技术为基础, 利用博弈论的相关知识提出了供应链配送网络优化的协调模型, 以求网络运输系统最终达到Nash均衡, 从而较好地解决有限运输能力条件下的供应链配送网络的整体优化问题, 达到整个配送网络的整体绩效最优。
关键词:Agent,供应链配送网络,博弈协调,Nash均衡
参考文献
[1]李延晖, 马士华, 刘黎明.基于时间约束的供应链配送系统随机模型[J].预测, 2004 (4) .
[2]日通综合研究所.物流手册[M].吴润涛, 等, 译.北京:中国物资出版社, 1986:226-245.
[3]Martin J Osborne, Ariel Rubinstein.博弈论教程[M].魏玉根, 译.北京:中国社会科学出版社, 2000.
[4]施锡铨.博弈论[M].上海:上海财经大学出版社, 2000.
[5]Fei Yue Wang.A Coordination Theory for Intelligent Machines[D].Rensselaer Polytechnic Institute, 1990.
[6]陈进.论区域博弈分析的方法研究[J].管理科学, 1999 (4) :66-68.
[7]任春玉, 王晓博, 李子群.基于供应链的物流配送网络模型研究[J].哈尔滨商业大学学报:自然科学版, 2006, 22 (4) .
[8]陈森发.复杂系统建模理论与方法[M].南京:东南大学出版社, 2005:42-43.
多智能体协调控制技术 篇3
电动汽车 (EV) 作为一种新型交通工具, 在缓解能源危机、减少环境污染等方面具有非常大的优势。电动汽车的普及已成为一种趋势[1], 工信部《电动汽车发展战略研究报告》预测, 2030年全国电动汽车保有量将达到6 000万辆。
电动汽车作为一种新型的、大容量的负荷, 大量接入电网时会给电力系统的安全与经济运行带来新的挑战。电动汽车的充电行为在时间和空间上具有不确定性, 其无序充电会导致电网高峰时段的负荷明显上升, 需要增加发电容量, 甚至需要新增电力网络容量, 大幅增加了系统运行成本和投资成本;此外, 也会引起电压控制、谐波、供需平衡等方面的问题[2,3,4]。同时, 电动汽车也可作为分布式储能元件, 如果对电动汽车的充放电进行优化控制, 不仅能够实现削峰填谷, 有效地降低总的充电成本和系统运行成本, 而且能够平抑可再生能源的间歇性, 为系统提供调频、调峰及备用等辅助服务。因此研究电动汽车的负荷模型及其充电优化策略, 充分发挥电动汽车对电网负荷削峰填谷等作用, 对提高电网供电可靠性和能源利用效率具有重要的意义。
目前, 国内外学者在电动汽车充电优化问题上做了一系列开拓性的研究。文献[5-8]主要以集中控制和分层控制的模式对电动汽车的充电负荷进行优化, 这种模式能够在理论上获得较优的控制结果, 但是如果考虑到将来大规模电动汽车接入电网, 该模式相应的优化问题中会出现严重的“维数灾”, 难以求解;另外, 集中调度模式要求调度机构与每辆电动汽车之间都要进行频繁通信, 这对通信网络的可靠性和带宽的要求极高。因此, 这种集中调度模式在实际应用中难以实现。
多智能体系统是分布式人工智能研究的一个重要分支, 是由多个可计算的智能体组成的集合, 其中每个智能体是一个物理的或抽象的实体, 能作用于自身和环境, 并可与其他智能体通信, 其目标是将大的复杂系统建造成小的、彼此相互通信及协调的、易于管理的系统, 是研究复杂自适应系统CAS (Complex Adaptive System) 的有效方法[9,10]。大规模电动汽车接入之后的配电网实际上就是CAS, 所以采用多智能体的方法来解决大规模电动汽车的充电优化问题是一个很好的探索。
本文以慢充方式的家庭用电动汽车为主要研究对象, 在分析电动汽车充电负荷特性和管理架构的基础上, 将电动汽车和充电桩定义为具有智能的主体, 并建立了单个电动汽车智能体的负荷模型和基于多智能体系统的充电优化模型, 采用多智能体协同控制的策略对电动汽车的充电优化问题进行求解分析。
1 电动汽车充电负荷特性分析
电动汽车充电负荷的建模是研究电动汽车充电优化策略的基础。首先需要分析充电负荷的影响因素, 主要包括以下几个方面。
a.电动汽车类型。电动汽车的主要类型为公交车、出租车、公务车、私家车等[11]。不同类型电动汽车的用户用车行为和充电行为差别较大。像公交车、出租车、公务车这类公用车的日行驶里程远远大于私家车, 一般需要快速充电或者换电池的模式。私家车使用非常灵活, 一天中90%以上的时间都处于停驶状态, 有足够的时间充电, 便于协调调度, 而且将来私家车的比例会越来越大, 研究其充电优化不仅可以为用户节约充电成本, 而且可以为电网提供“移峰填谷”等服务, 所以本文中主要研究私家车的充电优化。
b.电动汽车的电池特性。包括电池类型、电池容量、充电速率等。
电动汽车的电池主要包括铅酸、镍氢、镍镉、锂离子、钠硫等类型[12]。虽然当前可用于电动汽车的动力电池类型较多, 但是根据对电池比能量、效率、比功率等方面的性能对比得出结论, 锂离子电池具备最佳的综合性能[12,13], 将有望推动电动汽车的大规模商业化。电池容量决定了电动汽车的续航里程。充电速率决定了实际的充电功率及充电负荷曲线。
c.出行需求和使用习惯。主要指用户的日行驶里程、出行时间、出行频率与出行目的等, 它们决定了用户的充电时间、需求电能以及获得充电服务的情况。当前基于出行需求的计算方法认为是电动汽车对传统车辆的替代使用, 不会影响用户的出行特征, 从而可以利用用户出行特征的统计数据进行研究, 通过蒙特卡洛模拟抽样, 可以方便地获得具有时序特征的充电负荷信息。
d.电动汽车充电方式。不同的充电方式对应的充电负荷具有显著区别。从充电速率的角度而言, 可以分为慢充、快充和电池更换3类;从控制的角度而言, 可以分为直接、间接2类。直接控制是由调度机构直接制定充电计划, 并且发送给各电动汽车执行充电。间接控制是指通过制定峰谷电价、实时电价或辅助服务价格等途径对用户充电行为加以引导[14], 本文主要考虑慢充方式和间接控制方式。
2 电动汽车的充电管理架构
2.1 电动汽车充电管理架构分析
在近期的一些文献中介绍了多种电动汽车充电管理的架构, 比较有代表性的有集中控制、分层控制和分布式控制3种。
a.集中控制。
文献[8]中对电动汽车调度问题采取的是由调度机构进行直接调度的模式。对电动汽车的充电进行控制需要电动汽车与电网进行信息交互, 交互的内容包括电动汽车的充电需求、停车状态、电池荷电状态等。但目前配电网的信息化程度还不够, 配电控制中心对于配网运行实时信息掌握不全, 基于在线运行的电动汽车大规模充电控制难度较大, 而且大规模电动汽车接入电网时, 集中调度模式还会导致在相应优化问题中出现“维数灾”问题。
b.分层控制。
文献[2]中采用分层分区控制的模式来缓解集中控制中遇到的维数灾和通信要求高的问题。在该模式下, 一般由配电系统调度机构或第三方电动汽车代理负责某一区域内电动汽车的协调调度, 这样电动汽车的调度问题就分解成为了输电系统调度问题和若干区域调度问题, 可以缓解调度中心的压力, 研究的重点可放在配电系统内各区域的电动汽车最优调度问题上。
c.分布式控制。
由于电动汽车分属于千百万不同的用户, 它们接入电网及其充电的操作权限也相应地归属于不同用户, 所以具有明显的移动、分散以及不确定性, 其充电优化实质上是一个分布式决策的问题[15]。文献[16]将电动汽车和充电设备看作是多代理系统中的智能体, 该智能体可以根据本身的状态和外部环境的变化做出相应的决策, 自主选择充电站、充电方式, 较好地仿真模拟了电动汽车的充电行为。这种分布式控制的方式可以在一定程度上有效地整合规模庞大但时空特性分散的电动汽车进行有序充电, 实现电动汽车的分散自治。
2.2 基于多智能体的电动汽车充电管理架构
2.2.1 CAS
CAS理论是在1994年由Holland教授正式提出的。CAS理论的核心是适应产生复杂性, 其成员称为具有适应性的主体。主体的适应性, 是指它能够与环境以及其他主体进行交流, 在这种交流的过程中“学习”或“积累经验”, 并且根据学到的经验改变自身的结构和行为方式[17]。整个宏观系统的演变或进化, 包括新层次的产生、分化和多样性的出现等, 都是在这个基础上逐步派生出来的。CAS理论是复杂性科学研究的一个重要领域, 它的提出对人们认识、理解、控制和管理复杂系统提供了新的思路和视角, 对于认识与解释经济、社会、生态和生物等复杂系统具有特别的意义[16]。
CAS所涵盖的范围非常广泛, 小到微观粒子的内部相互作用, 大到宏观经济、宇宙运行, 都被认为是CAS。当配电网中有大量的电动汽车接入时, 电动汽车与充电设备、配电网等构成的系统实际上就是一个CAS。电动汽车充电选择在时间上和空间上具有随机性, 可以看作是具有适应性的主体, 能够根据电网环境的变化改变充电时间、目标充电量等参数进行动态响应。
2.2.2 多智能体系统
多智能体系统是由多个可计算的智能体组成的集合, 其中每个智能体是一个物理的或抽象的实体, 能作用于自身和环境, 并可与其他智能体通信。多智能体系统没有中央控制器, 信息的交换和分享也只是在部分个体间进行, 每个个体根据分布式的邻域规则来更新自身的状态, 但是就是基于这些简单的局部信息的作用规则却能产生一些期望的宏观行为[18]。在自然界中, 多智能体系统可以是神经网络、生态系统、新陈代谢系统等;在工程中, 多智能体系统可以是电力网、有线/无线通信系统、传感器网络、机器人网络、软件系统等。
2.2.3 基于多智能体的电动汽车充电管理模式
结合分层控制和分布式控制, 本文提出基于多智能体的电动汽车充电管理模式, 其架构如图1所示。
该模式将电力系统分成3个层次:第 (1) 层为输电网络层;第 (2) 层为变压器以上的配电网络层;第 (3) 层为变压器以下的用电层。
在变压器以下层面, 采用多智能体协同控制的策略对电动汽车充电进行管理。将电动汽车作为具有适应性的智能体, 同一变压器下的电动汽车组成一个充电群体, 它们之间可以利用现今比较主流的基于Wi Fi的无线传感网络进行信息传递[19], 其通信机制如图2所示。并根据需要将1 d分为多个时段, 当电动汽车接入配电网时, 该智能体获取所接入的变压器在该时段的负荷信息以及后续时段的预估负荷信息, 同时结合自身的充电需求和可用时段, 制定自身的充电计划, 并将更新后的变压器负荷信息发布给其他智能体, 按照接入时间依次生成各自的充电计划, 共同完成其所在变压器负荷的“移峰填谷”任务 (本文中假定电动汽车用户和上层的电动汽车服务商或配电网调度中心之间有辅助服务协议, 暂不考虑充电电价的影响) 。
可在配网变压器上安装信息发布终端, 按照时段定时将该变压器的预测负荷信息发布给该时段内接入的电动汽车智能体;上层的配电系统调度和输电系统调度采用和传统电网中相同的调度策略即可。该架构的好处在于因变压器下的充电设备可以在较大程度上实现自适应协同, 将上层调度机构的范围缩小在变压器以上, 从而可以有效地避免大规模电动汽车充电优化的“维数灾”和“通信要求高”等问题。
3 电动汽车充电优化模型
3.1 单台电动汽车充电负荷模型
(1) 变量和参数。
表1列举了本文中单台电动汽车充电负荷所考虑的主要变量和参数。
充电时间可以通过式 (1) 、 (2) 计算:
(2) 需要考虑的约束条件。
a.电量状态约束:
即用户出行离开电网时, 其电动汽车完成充电的实际电池电量状态应该大于用户自行设定的目标值, 最大为1;考虑到电池过度放电对其寿命的不利影响, 用户回家接入电网时, 电动汽车的实际电池电量状态的最小值常取值为0.2[20]。
b.充电时间约束:
即电动汽车应该在用户可用的充电时间段完成充电。如果未能达到目标电量状态, 则需要用户重新设定目标电量状态或调整可用充电时间段。
本文中假设充电装置给电动汽车电池的充电过程为恒功率充电。对单台电动汽车而言, 能够在满足自身基本电量需求的情况下参与多智能体系统的协同控制, 并且尽可能使自身的起始充电时间最早:
3.2 基于出行需求的电动汽车充电负荷模拟
对电动汽车充电产生影响的用户行为主要包括用户出行开始和返回的时间、日行驶里程等, 2009年美国交通部对全美家用车辆的出行进行统计, 并发布了调查结果[21,22]。对统计数据进行归一化处理后, 用极大似然估计的方法可以分别将车辆最后1次出行结束时刻和第1次出行开始时刻近似表示为正态分布函数, 而日行驶里程可近似为对数正态分布函数[23,24]。
最后1次出行返回时刻, 即到家接入电网的时间满足正态分布, 其概率密度函数为:
其中, μS=17.47;σS=3.41。
第1次出行开始时刻, 即出行离开电网的时间满足正态分布, 其概率密度函数为:
其中, μe=8.92;σe=3.24。
日行驶里程满足对数正态分布, 其概率密度函数为:
其中, μm=2.98;σm=1.14。
3.3 基于多智能体系统的电动汽车充电优化模型
a.变量和参数。
表2列举了本文中电动汽车多智能体充电负荷所接入的变压器需要考虑的主要变量和参数。
b.变压器容量约束:
即叠加了电动汽车充电负荷之后的变压器总体负荷小于变压器的最大负载功率, Li, j为电动汽车i在j时段的充电功率, M为j时段内电动汽车充电的数量。
c.目标函数。
根据配电网内变压器的历史常规负荷, 可以预测当日此变压器的常规负荷曲线。本文将1 d分成24个时间段, 以每辆电动汽车每个时间段的充电功率为变量, 以叠加了电动汽车充电负荷的变压器负荷曲线的峰谷差最小为目标函数, 即:
4 基于多智能体的电动汽车充电协同控制策略
本文提出了一种基于多智能体的电动汽车协同充电优化策略。在该策略中, 每个电动汽车智能体可以根据自身的充电需求参数和配电变压器的负荷信息, 在满足自身需求的情况下, 以变压器负荷的“移峰填谷”为目标, 制定自身的充电计划。其充电时段选择示意如图3所示, 电动汽车智能体在自身可用充电时段 (Ta至Td) 中, 可选择Tr个较低的变压器负荷时段来进行充电。
基于多智能体的电动汽车协同充电流程如图4所示。
a.初始化电动汽车的参数。包括电动汽车的数量、用户接入电网和离开电网的时间 (可以获得该用户可用的充电时段) 、日行驶里程、充电效率、额定充电功率等。
b.初始化迭代参数。将1 d分为24个时段, 每个时段内接入电网充电的电动汽车的数量为M (根据蒙特卡洛抽样获取) 。
c.根据时间段数进行迭代, 将电动汽车按照接入电网时间分配到各个时段。
d.在每个时间段内根据电动汽车的数量进行迭代, 每个电动汽车根据自身的接入电网时间、离开电网时间、充电需求等参数, 同时结合迭加了该时段内该车接入之前的电动汽车充电负荷的变压器负荷信息, 从而计算出适合自身的充电时段。
e.计算叠加了当前电动汽车充电负荷之后的总负荷Lj, r, 并和变压器的最大负荷Pj, max进行比较, 如果Lj, r
f.按时段循环迭代至T=24, 随时间的推进依次获取1 d内每台电动汽车的充电计划。
5 算例分析
5.1 仿真参数设置
仿真环境设置为上海某一35 k V片区配电网, 表3列举了该片区中10 k V变压器和假定接入充电的电动汽车的情况。
变压器额定容量Prc, 假定变压器的功率因数cosФ为0.85、效率ηt为0.95, 则该变压器的最大负载可以根据下式计算:
变压器的日预测负荷曲线根据历史数据来模拟。
本文仅考虑居民小区内家庭用电动汽车的充电负荷, 根据对其充电负荷的分析, 并参考目前电动汽车的发展状况, 对仿真的环境做出如下假设。
a.电动汽车的电池为锂电池, 容量为30 k W·h。
b.额定充电功率为5 k W。
c.充电效率为90%。
d.行驶100 km耗电量为15 k W·h。
e.电动汽车在最后1次出行返回后接入电网, 第1次出行开始时离开电网。接入电网时间、离开电网时间、日行驶里程都通过蒙特卡洛抽样来模拟。
f.假定用户和电网公司之间有双赢协议, 需要参与电网公司的“移峰填谷”任务。
g.默认用户每次设置的期望电量状态都为100%, 如有的用户在可用的充电时段内不能充满, 则默认利用完其全部可用充电时段即可。
5.2 结果分析
5.2.1 单台10 k V变压器接入电动汽车充电
以1台1 200 k V·A变压器为例, 在无序充电模式下, 电动汽车在回家接入电网之后即开始充电, 直至电池充满, 整个充电过程不被控制和调整, 从图5可以看出, 电动汽车接入变压器充电的高峰时段和变压器负荷的峰值时段基本一致, 所以会导致高峰时段的负荷明显上升, 甚至会影响到电网的安全运行。
在多智能体协同优化充电模式下, 电动汽车作为独立的主体, 接入变压器后能在自身的可用时间段内自动寻找变压器负荷低谷的时段进行充电, 可有效地实现负荷的“移峰填谷”。
5.2.2 35 k V片区配电网接入电动汽车充电
以35 k V片区配电网为例, 从图6可以看出, 在多智能体协同优化充电模式下, 各台10 k V变压器下的电动汽车能够按照接入时间逐渐实现负荷的“填谷”, 其效应迭加之后就能实现35 k V变压器负荷的“填谷”, 极大降低了“峰谷差”, 从而可以有效地降低发电机组的启停次数, 提高配电网运行的安全性和经济性。
5.2.3 比较分析
表4列出了单台10 k V变压器接入电动汽车充电和整个35 k V片区配电网下电动汽车充电的叠加分别对应的峰值、谷值和峰谷差, 可见多智能体协同优化充电模式下的峰谷差相对于无序充电模式下的峰谷差大幅减小, 起到了“移峰填谷”的作用, 说明了该模式的有效性。而且相对于集中控制模式, 并不需要和上层的调度机构之间进行频繁的通信, 避免了大规模电动汽车充电优化的“通信要求高”的问题, 同时也不需要调度机构采集各台电动汽车的具体参数, 极大简化了优化问题的求解, 从而也有效地避免了大规模电动汽车充电优化“维数灾”的问题。
6 结论
本文针对大量电动汽车接入电网之后的充电优化问题展开研究, 分析了电动汽车充电负荷的特性和管理架构, 根据CAS理论的核心思想, 提出了基于多智能体的电动汽车协同充电管理架构。基于建立的电动汽车充电优化模型, 应用基于多智能体协同充电的优化算法进行仿真求解, 并做了对比分析。
仿真结果表明, 在变压器以下采用基于多智能体协同优化的充电模式, 能够有效地实现电动汽车充电负荷的“移峰填谷”, 减小电网峰谷差, 并且可以将上层调度机构的范围缩小在变压器以上, 从而有效地避免了大规模电动汽车充电优化的“维数灾”和“通信要求高”等问题, 为电动汽车充电优化提供了一条新的途径。
多智能体协调控制技术 篇4
随着现代城市化建设的高速发展,人们愈发受到城市交通阻塞、交通事故频发、环境污染加剧和能源消耗上升所带来的困扰。充分利用现有道路的通行能力,采用先进的城市交通信号控制系统对改善交通状况起着非常重要的作用。城市交通系统是一个时变的、分布式的、非线性的随机系统,本文根据A-gent的特性和城市交通控制系统的现状以及控制方法,提出了基于Multi-Agent和“分层递阶”的交通控制系统的体系结构。该系统分为三层:路口Agent、区域Agent、中央Agent,将控制策略的决定权下放到路口级,各路口Agent根据所获取的实时交通信息相互协调并进行交通系统的控制,提高了路口的智能决策能力,从而使控制系统更加灵活地适应交通复杂多变的特点,为实现交通系统的实时智能控制提供了可能。
2 特点、原理及应用
城市交通系统是时间和空间上分布均非线性、时变的随机系统。对城市交通系统的实时优化控制不仅要求在系统稳定的前提下实施,而且还应具有一定的自适应和智能控制能力。交通系统的特性非常适合采用多智能体系统,基于Multi-Agent的城市交通控制是实现城市交通智能化控制的重要途径。
2.1 Agent的特点
Agent具有交互协作性、目标任务驱动性、自主可控性、适应性等特点[1]。一个自主的Agent应具的基本特性有:
(1)感知能力:具有感知周围环境变化的能力,这样才能在变化的环境中保持正确的决策性。
(2)通信能力:具有与其它Agent通信的能力,通过通信实现Agent之间的相互协作,达到共同完成任务的目的。
(3)行动及控制能力:对环境具有反应能力和控制能力。
(4)学习和推理能力:能根据自身获取的信息和历史积累经验对自身的行动及其它Agent的行动进行学习和推理,以修改自身行为以适应新的环境。
2.2 Agent的结构模型
一个Agent由感应模块、决策控制模块、知识库、通信模块等几部分组成。其特点是具有对环境和智能行为进行逻辑推理的能力。Agent可以分为:
(1)认知型Agent具有表示内部状态的主动软件,包括知识表示、环境表示、问题求解、具体通信协议等。
(2)反应型Agent是一种感知-动作模型,其特点是包含了感知内外状态变化的感知器,根据条件行动规则并产生动作行为,是一个依据感知器激活的控制系统。
(3)混合型Agent结构模型,其结构模型吸取了反应型Agent快速响应环境和认识型Agent高智能的优点,是在一个Agent中包含两个或多个子系统,一个是认知子系统,一个是反应子系统,而且是分层组织的,前者建立在后者之上。
2.3 Multi-Agent组成的集合应用
由于城市交通控制的复杂性,单个Agent能力有限,在实际操作中应用Multi-Agent System(MAS)。MAS由多个Agen组成,以达到解决单个Agent不能完成的复杂问题。MAS作为整体的问题求解能力大于各Agent问题求解能力的简单相加,能够更好地实现全局目标。MAS中每个Agent都具有问题求解能力,是一个独立的自治系统,Agent能利用自身所获取的信息进行自主规划、自学习、自适应,并能通过学习推理解决局部冲突问题,完成自身的局部目标。Agent能在一定的环境下持续自主运行,并且能够自学习、自增长,调整自己的行为,同时又可以和其他Agent进行协商与协作,以更好地完成全局目标。MAS作为基于分布式问题求解的整体,除了具有单个Agent的特征外,还具有如下特点:
(1)每个Agent具有不完全的信息和问题求解能力;
(2)数据是分布或者分散的;
(3)计算过程异步、并发或并行;
(4)Agent之间通过交互、动态自组织、协调和合作,大大提高求解问题的能力。
3 基于Multi-Agent的城市交通控制系统的实现
3.1 采用MAS实现交通控制的优越性和可行性
城市交通控制系统是一个在时间上和空间上动态的、非线性、分布式的复杂系统。采用Multi-Agent技术进行城市交通控制系统的研究,其优越性和可行性有:
(1)分布性:城市交通控制系统的拓扑结构具有分布式特征,而MAS的数据、资源分散在系统的各个Agent中。因此,非常适合采用MAS的分布式处理和协调技术。基于MAS的城市交通控制系统,结构上具有易于实现系统间的信息共享、可靠性高、灵活性强、易于扩张等特点。
(2)协作性:MAS的协作和协商机制非常有助于解决多目标优化中的目标冲突问题。系统中各个Agent相互协调以解决大规模复杂问题,能够解决建立一个庞大知识库所造成的知识管理和扩展的难题。
(3)可靠性:采用Multi-Agent技术不依赖于某个单一的控制器去协调所有的任务,如果某些Agent不能正常工作,系统的整体性能也不会显著下降或引起系统崩溃,并具有较高的问题求解率和可靠性。
(4)并行性:把一个复杂系统问题,分解为相对独立的问题,降低计算复杂性,更易于处理、调试与维护,并且系统对软件、硬件的错误具有容错能力,使系统更为简单可靠[2]。
3.2 基于Agent的智能城市交通信号控制系统的基本架构
基于多Agent系统构架的城市交通智能控制系统中,A-gent主要通过软件来实现,具体可以将Agent按功能模块分为以下几类:
(1)路口Agent的组成结构。位于控制系统的最低层,按照单点信号控制配时方式,建立路口局部控制方式。其功能有:按接收到的控制信息对本路口进行信号灯控制;对本路口各相位的交通状况进行评估;对本路口的控制知识进行管理;生成针对本路口的交通控制规划;对本路口入口上各相位的车辆到达和驶离状况进行检测。
(2)区域Agent的组成结构。区域Agent与路口Agent的构成相似,区域Agent主要包括数据信息模块、决策模块、协调模块、通信模块和知识库。其主要功能有:对区域交通状况进行评估,负责组间信息交互;对区域的控制知识进行管理;对本区域的主要路段实时交通流量进行检测;生成针对本区域的交通控制规划。
(3)中央Agent的组成结构。为了保证整个城市的交通顺畅,及时解决突发交通事件和合理安排重大活动时的交通控制策略。中央Agent可以与区域Agent、路口Agent地进行通信,并且从区域Agent中提出的意见和方案中进行学习、推理和归纳,以知识库中的实例为参考,对决策方案的某些不足之处进行改进。根据具体情况采用适当的控制策略,及时消除成员间的冲突,协调各成员间的行为,使交通控制策略顺利产生[3]。
3.3 城市交通控制系统中运用“分层递阶”的Agent结构
3.3.1“分层递阶”的功能及目标特点
根据城市交通控制系统的分布式结构的特征,应用“分层递阶”来组织各层结构。各层的功能及目标为:
(1)执行层:该层由若干路口Agent构成,根据来自检测器的实时交通流检测数据的分析处理结果及区域协调层的协调控制指示,确定适当的策略,优化设计和调整对应路口的信号配时方案。另外,执行层还需将有关局部交通状况和控制效果传送给区域协调层,以作为中央Agent协调的参考。
(2)区域协调层:该层由若干区域Agent构成,分别接受各自所辖交叉口控制系统的局部路况信息和信号配时,在综合分析评估的基础上给定相应的控制策略,以最优化控制相应干线或区域路网运行交通流为目标,产生协调控制参量,下传至执行级,予以实施。
(3)中央Agent:该层根据路网结构特征、交通流预测等交通影响因素,对交通运行状况做出评估,中央Agent可对跨区域的区域Agent进行协调,根据各方面的汇总信息,进行推理、规划和决策,以达到系统最优。
3.3.2“分层递阶”在城市交通控制系统中的实现
在城市交通控制系统中,多个中央Agent管理若干区域Agent,每个区域Agent管理若干路口Agent。在该系统中,所有Agent都处于一个大环境中,但各自又根据它周围的局部小环境,进行独立的适应性学习和演化。Agent在环境中不断调整自己的行为以便更好地适应环境,大量适应性Agent在环境中的各种行为又反过来不断地影响和改变着环境,动态变化的环境则以一种“约束”的形式对Agent的行为产生约束和影响,如此反复,Agent和Agent之间,Agent和环境之间就处于一种永不停止的相互作用、相互影响、相互演化的过程之中[4]。假如某些路段发生拥挤,Agent就按“分层递阶”的组织方式进行重新组合,通过各个Agent之间的相互协作来共同缓解交通拥挤,协调整个交通控制系统适应交通流的动态变化,各Agent根据实时交通流的变化,以“分层递阶”的组合原则进行自动地组合或分解,通过这样的动态组合,整个交通控制系统协调实施表现出动态响应的组织结构和动态组合的组织方式[4]。
3.4 系统整体控制方案
初始状态下,单个路口Agent实行自主控制,采用基于动态均衡的交通控制协调算法寻找单个路口的最优控制,如果单个路口制定的控制策略已经不能满足交通需求时,向相邻路口发送协调请求,如果能得到一个令双方都满意的协调时,执行控制策略,否则就向区域Agent发送请求,区域Agent根据各个路口Agent传送过来的数据,进行多目标决策,并将决策结果传送给各个路口Agent,由区域Agent来制定相关控制策略;如果不能满足交通需求,区域Agent把信息上传给中央Agent,由中央Agent对几个子区域进行协调控制[3]。
在交通控制系统中,每个Agent有自己的局部目标并尽量使本路口交通通畅。每个路口是系统的执行级,路口之间的协调是实现整个系统协调的基础。在系统中,为了在一定程度上保证整个控制系统利益及系统运行的稳定性,Agent之间除了基于动态均衡的协调之外,还需要协议协调。一方面保证了整个系统的稳定性,另一面节省协调的持续时间。当所有交叉口均处于高饱和度时,通过协调很难缓解交通拥堵问题,各路口之间就停止协调,执行各自的控制信号,这时的协调由中央Agent根据经验知识对整个交通系统进行控制。分布式层次结构由具有智能性和适应性的Agent组成,采用“分层递阶”的协调实施模式,建立城市交通控制系统的体系结构,实现对系统的整体控制。
4 结语
针对目前城市交通存在的问题及城市交通控制系统的发展现状,在前人理论的基础上,将Agent技术应用于城市交通控制系统中,构建了基于Multi-Agent的城市交通信号控制系统的体系结构,开展了城市交通信号控制系统的研究。研究了基于Agent的城市交通控制系统的整体控制策略,以及各个级别Agent的组成结构和协调机制。为Agent技术在城市交通信号控制系统方面的应用提出一个新思路、新方法,对城市交通信号控制系统的发展起到一定的促进作用。
参考文献
[1]蔡白兴,徐光佑.人工智能及其应用.第2版.北京:清华大学出版社.
[2]孙建平.基于的城市交通区域协调控制及优化研究.长春:吉林大学,2003.
[3]孙晋文.基于的智能交通控制策略与可视化动态仿真研究.中国农业大学,2001,5:10-25.
[4]杨晓敏.基于多智能体的城市交通控制系统研究.长安大学,2009.
[5]朱茵,唐祯敏,钱大琳.基于多智能体技术的交通管理系统的研究.中国公路学报,2002,15(3):80-83.
多智能体协调控制技术 篇5
迭代学习控制是一种被广泛应用于工程应用的学习控制策略, 最早于1984由Arimoto等人正式提出。迭代学习控制适于有限时间区间上可重复运行的系统, 它通过应用先前试验得到的信息来修正不理想的输入信号, 改善跟踪性能。迭代学习控制方法用于解决多智能体系统问题已经有了大量的研究。最早将迭代学习控制算法用于多智能体系统协调控制问题出现在Ahn[5]的文章, 主要考虑用于多智能体编队问题。之后, 文献[6-9]中采用迭代学习控制算法处理多智能体系统的一致性跟踪问题。文献[10]讨论了迭代学习控制方法处理高阶多智能体系统协调控制问题。传统提法的迭代学习控制对初始定位有着严格的要求, 规定在每次迭代时, 初始状态都要和期望初态一致。文献[11]中给出了初态偏移下的多智能体系统在D型和PD型学习律下的极限轨迹, 表明了初始定位误差对多智能体一致性跟踪型性能的影响。文献[12, 13]提出带初态修正的迭代学习算法, 实现了多智能体系统在给定区间上的完全跟踪。
本文讨论多智能体系统初态学习下的一致性跟踪问题。与经典迭代学习控制中要求的初始状态条件相比较, 讨论放宽初始状态条件是更有工程应用意义的。初态学习可以放宽初始状态条件, 它允许初始状态可以不精确定位在期望初态上。文献[12, 13]分别将文献[14]中的单个系统初态学习律应用于非线性时变和线性时变多智能体系统, 形象地以提出多智能体系统初态学习律这种形式放宽了初始定位条件。但该多智能体系统初态学习律要求:
(1) 多智能体系统的输入矩阵精确已知;
(2) 迭代过程中的初态需要严格的落在由初态学习律确定的轨迹上, 仅有第一次的初态是可任意给定的。
本文针对多智能体系统, 给出新的初态学习律, 不对输入矩阵做要求, 且初态收敛条件也与输入矩阵无关。在文献[12, 13]中的初态学习律的学习增益与输入学习律的学习增益相同, 因而导致了迭代过程中初始状态的严格定位。而本文中的两个学习律增益可以不同, 这样使得多智能体系统在迭代过程允许初态在一定范围内变动, 相比已有的初态学习律, 具有更强的鲁棒性。
1问题的提出
考虑一组由N个同类动态智能体构成的多智能体系统, 且其第j个智能体的动力学方程可用如下的线性时不变模型来描述
原始提法的迭代学习控制对于每一次迭代, 都要求系统初态严格设置在期望初态上。这对于多智能体系统很难实现, 主要存在以下问题:
(1) 多智能体系统模型的不确定性影响期望初态的确定;
(3) 多智能体系统对于给定初始状态的定位所能达到的精确程度。以上问题表明了对多智能体系统而言, 每次迭代时都将初态设置在期望初态上这一要求是苛刻的。
2多智能体系统初态学习
考虑系统 (1) , 为了采用迭代学习控制方法解决一致性跟踪问题, 提出如下的学习控制规律和初始状态学习规律
为了更清楚的描述, 我们将输入学习律和初始状态学习律也写为如下形式
引理2若
证明:
由初态学习律 (10) 知,
利用条件 (11) , 易证出引理2成立。
定理1对于多智能体系统 (1) , 在输入学习律 (5) 和初态学习律 (6) 作用下, 若引理1中的条件成立, 且
证明:根据跟踪误差的定义, 可知第j个智能体的跟踪误差为:
由式 (13) , 将所有智能体的跟踪误差写成紧凑形式, 我们可以得到
多智能体状态轨迹在相邻两次迭代下的偏差为
根据分部积分, 有
为了更简洁的描述问题, 定义以下符号用于后续的证明
对式 (18) 两面取范数:
根据λ范数定义, 可得
故当λ足够大时, 结合
3仿真算例
考虑一组包含1个虚拟领导者和4个智能体的多智能体系统, 第j个智能体模型如下
期望参考轨迹
描述所有多智能体之间关系的拓扑图如图1所示, 其中多智能体0代表虚拟领导者。从图中可以看出, 虚拟领导者0与智能体1和3之间存在直接联系, 即智能体1和3可以直接得到期望参考轨迹信息。根据之前的图论知识。可以得出该连通图的Laplacian矩阵为
4结论
多智能体协调控制技术 篇6
在多Agent故障诊断系统中, 每个Agent都是自治的、实时性很强的基本模块单元, 各个高度自治的Agent相互作用、相互合作与协调, 建立系统组织结构的关键是选择Agent的粒化类型和程度。
多Agent故障诊断系统在实践中取得了较好的成效, 但随着系统设备和功能的日益复杂化, 各种故障现象成因越来越复杂, 同时异常故障也时有发生, 现有固定的诊断推理模型却难以满足复杂系统诊断面临的全部要求[1]。在实际诊断中, 如何针对新需求, 重构诊断系统, 以提高系统的适应性, 改进故障确诊断率是一个需要迫切解决的问题。
生物免疫系统有非凡的异物 (抗原) 识别能力, 通过分布在全身的不同种类的免疫细胞识别和清除侵入生物体的抗原性异物。免疫细胞的上述功能在本质上已经具备了诊断Agent的共性特点, 免疫系统在整体上形成了一个分布式的多Agent协调自治系统, 借鉴免疫机理构建易于重构的多Agent诊断系统成为可行。
1 免疫调节机理
在免疫系统中, 通过抗原的对位与抗体的表位以及抗体之间的表位与对位进行识别与被识别, 抗体不仅能够识别抗原, 同时也能够识别其它抗体和被其它抗体识别, 因此抗体具有识别和被识别的特性。通过抗体表面的受体, 抗体识别抗原, 抗体与抗体之间相互识别和被识别, 被识别的抗体受到抑制, 识别抗原及其它抗体的抗体得到促进和增殖, 构成独特型免疫网络调节。
当抗原入侵免疫系统时, 这种平衡遭到破坏, 应答抗原能力强的B细胞进行增殖, 并导致免疫应答, 待抗原被清除后, 依赖于免疫网络调节使抗体数目达到新的平衡, 独特型免疫网络[2]的调节功能是免疫系统能够产生免疫应答的根本原因。
在多Agent故障诊断系统中, 类似于生物免疫中的抗体间的促进和抑制关系, 各个Agent诊断模型间既有相互协作的关系, 相同类别的Agent诊断模型间又有一定的排斥性。基于免疫调节的思想, 诊断重构意指把构成Agent诊断模型的单个Agent个体看作一个抗体, 视故障处理对象作为抗原, 引入浓度调节机制, 设计抗体适应度方案, 对现有智能诊断模型中的Agent个体进行进化, 并由进化后的个体进行重构组成新的智能诊断模型, 实现抗体间促进和抑制的免疫调节作用关系[3]。
2 面向重构的Agent知识结构
免疫系统具有的识别多样性, 使其使用少量的抗体就可以识别数量比它大得多的抗原, 抗体最优的分布情况应该是以最少的抗体数量覆盖几乎整个抗原空间, 这也是免疫系统进化的目标。同样在多Agent诊断系统中, 诊断系统也可以看作是由多个智能体诊断单元组 (AFDU) 形成的多诊断模型的智能体联盟。
2.1 Agent知识结构
基于Agent的BDI理论模型, 研究者提出了不同的Agent结构模型, 试图从不同角度对Agent进行实现, 主要Agent结构模型有慎思Agent、反应Agent、混合Agent等。
在诊断领域中, Agent[3,4]在结构上可表示为六元组Agenti::= <IDi, TSi, DKi, CKi, BBi, COMMi>, 组中六元组分别代表智能体标识、智能体任务求解器、智能体领域知识、智能体协作知识、智能体信息黑板、智能体通信, 其中:
IDi::=<Name, Address, Role> 智能体标识由智能体姓名、地址、地位三部分组成, 是对智能体在系统中的身份约定。
DKi::=<Know-B, Data-B, Deci-B>智能体领域知识由能力表、知识库、数据库以及决策库等组成。它既可以是独立的智能系统, 和智能体具有特定的接口;也可以内嵌在智能体的内部。智能体领域知识提供了对局部问题求解的智能支持。
CKi::=<PCM, C-E, A-M>智能体协作知识由计划与协作模块PCM、智能体协同进化模块C-E、熟人模型和其它智能体知识, 形式化描述如下:
<PCM>::=<Task, Evaluation, Initiation >智能体规划与协作模块PCM用以对任务进行评估, 决定该任务是否需要和其他智能体协作完成。
<C-E>::=<CE-Operation, Evaluation, Pop>智能体协同进化模块C-E用执行自身和其它智能体的协作要求, 按照协同进化机制给出一个问题求解策略, CE-Operation代表协同进化算子, Evaluation代表评价, Pop代表相应的进化群体。
<A-M>::=<A-Name, Task, Inputs, Outputs>智能体熟人模型中包含熟人姓名、协作任务、请求变量以及结果返回值。每个智能体的熟人模型以关系表形式表示, 每一表项构成了智能体的一个协作通道。
2.2 Agent知识粒度分解
在智能诊断系统的重构中, 将Agent作为一个应用框架来开发, 需要集成的应用功能可以作为某个Agent的功能模块, 并把它描述知识存入知识库中, 以后Agent就能根据消息来调用该功能模块, 通过添加相应的功能组件构成特定功能的Agent, 就可形成不同的功能Agent。
为满足诊断系统重构的需要, 各Agent诊断能力形成按参数、原子事实和知识形式不同粒度构件组织[5]。参数类组件用于存放是反映系统运行状态的基本参数, 如频率﹑相位、幅值﹑温度等;原子事实类组件是具有确定信息的一个判断、关系表达式或指令, 用以描述知识的一个条件或结论, 是组成知识的基本单位, 当参数类组件被赋值后, 就可以得出一个事实;知识类组件的属性包括知识名称、前提、结论和可信度等, 其基本操作有:判断某一个给定事实或结论是否在知识的前提或结论中, 计算总的结论数据, 计算总的前提数。
根据前面参数类、原子事实类和知识类组件的定义, 可以建立三个数据表—参数类组件表、原子事实类组件表和知识类组件表, 三个表之间并不是完全相互独立的, 图1说明了三者之间的关系。
3 基于知识的诊断重构方法
重构一个诊断模型, 需要了解诊断问题涉及到哪些数据量以及这些数据量之间的关系, 需要知道诊断问题所属领域的知识以及求解这个问题的诊断模型具有怎样的结构[6]。
重构知识可以按照诊断模型知识、诊断领域知识和诊断数据知识组织成三个不同层次。诊断数据知识具体地实施每个重构步骤, 完成诊断模型的构建, 诊断模型知识和诊断领域知识都是通过调用其它知识完成其应用的, 在系统内部可以表示为对底层知识的调用, 表示为知识运用的过程。
3.1 诊断重构机制
借鉴免疫应答过程的信息传递机制, 每一个故障诊断单元组AFDU由一个控制智能体、感知智能体、识别智能体、诊断智能体、记忆智能体和进化智能体组成[3,4]。在AFDU中每个Agent作为自治的基本模块单元, 各自承担相应不同的功能, 内部的各Agent相互合作与协调, 构成了一个具有进化特性的故障诊断推理模型。
从重构诊断出发, 诊断系统可被简化地认为若干不同领域的AFDU集成:AFDU1∪…∪AFDUj∪…∪AFDUm∪CSU, j=1, 2, …, m;CSU为一个公共服务单元, 若AFDUx∩AFDUY≠Ф, 则两个子系统中的功能是可以重用的[3,7]。
面对新出现故障, 相应的智能体诊断单元组可以“进化”重构成新的智能体诊断单元组, 从而有效地实现对异常类故障的诊断。诊断系统分析诊断个体面临的进化需求, 通过对已有诊断个体内的基本组件对象进行组合或删减, 动态地构造出新的诊断个体, 体现出诊断个体的自适应性, 从而有效地适应诊断对象的动态变化。
采用组件后, 粒度不同的智能体及其集合, 均可由相同的公共服务组件集合中的个体按一定的结构形式组合构成, 对组件的调整会使诊断模型完成自身重构, 主要的重构机制如表1所示。
3.2 多诊断模型演化
从系统性能和优化角度出发, 诊断系统不可能使用无限大的诊断模型集合覆盖整个非我空间, 诊断模型的数量存在一个合理值。若要实现用有限数量的诊断模型集合尽可能多地识别故障模式, 就必须不断地改善现有的诊断模型集合, 重构模型使其达到最优的效果。
在协同进化理论研究基础上[8,9], 结合基本免疫算法, 分析了诊断系统中多诊断模型的免疫协同进化过程, 如表2所示。
为了实现免疫协同进化, 在组成模型的智能体单元结构中, 设计了特定的智能体协作知识模块CKi完成具体进化控制任务。在诊断系统中, AFDU通过其内部的控制Agent中的智能体协同进化模块C-E为AFDU提供进化决策, 各个AFDU中的C-E进化算法并不是独立运行的, 而是与诊断系统中其它AFDU中的C-E进化算法按照免疫协同机制共同进化的, 各群体向各自的AFDU提供诊断决策的结果, 就会产生AFDU之间的协调合作行为, 最终形成AFDU之间和AFDU与诊断环境之间的共同适应。
3.3 诊断重构流程
重构流程是针对一项具体的诊断重构需求, 结合已有重构知识库, 如何在现有基础上, 得到一个合理的重构操作, 以便于从诊断组件库中选择一组满足需求的业务组件, 组装为满足诊断重构需求的诊断业务模型和软件系统的过程。
为论述方便, 将重构知识的前提和结论都统称为条件, 以C (CONDITION) 表示条件, 则形式变为:
IF C (J) THEN C (I) (CF (C (I) , C (J) ) )
为便于叙述重构流程, 先做如下定义[10]:
定义1 知识矩阵R:
R矩阵每一行即代表原先的知识前提 (不包括对角线上的条件) ;R矩阵元素为Eωi, 对角线元素均为1, 每一条件蕴含其自身, 其他值为0。
定义2 真值状态矩阵UNх1:
UNх1 =[U (1) , U (2) , …, U (N) ]T
当相应条件出现时, 对应矩阵元素值为初始证据可信度值, 其他对应元素值等于0。每次执行结束后, 更新相应条件可信度值。
定义3 知识阈值矩阵SNх1:
SNх1 =[λ1, λ2, …, λN]T
SNх1元素值代表对应知识λ值, 在所有知识结论中未出现条件对应矩阵元素值等于0。
定义4 结论矩阵HNх1:
HNх1 =[CF1, CF2, …, CFN]T
HNх1元素值表示每一条知识结论位置对应条件CF (C (i) , E) (i=1, 2, …, N) 。
在上述概述定义基础上, 若诊断重构知识库中有如下N个重构条件:
C (1) , C (2) , …, C (N)
则诊断重构算法可描述如下:
(1) 在重构知识库基础上, 可生成知识矩阵R、知识阈值矩阵S、结论条件可信度矩阵H;
(2) 通过已获得重构信息, 生成真值状态矩阵U和U*, 若ui=0 (i =1, 2, …, N) , 则转入 (5) ;
(3) 执行矩阵运算:
1) 知识矩阵R与真值状态矩阵U相乘, D=R×U, 当rij≠0时, 若uj≠0 (i≠j) , 推理真值状态矩阵D中矩阵元素值通过
2) 比较算子Compare (D, S) , 当di≥si, 且si≠0时, di取值不变, 否则di=0 (i=1, 2, …, N) ;
3) 可信度取小算子Min ( D, H) =D*, 当di≥hi, 且hi≠0时, di*= hi, 否则di*= di (i =1, 2, …, N) ;
4) 更新算子Update (D*, U) =U, 若di*≠0, ui= di* ( i =1, 2, …, N) ;
(4) 若U ≠U*, 则U*=U, 转入 (3) ;
(5) H输出结论及可信度值, 重构诊断结束。
通过以上步骤, 基于知识的诊断重构过程可表示为矩阵运算形式:
Update (Min (Compare ( (R×U) , S) , H) , U) =U
4 实例分析
励磁系统[11,12]是发电厂 (站) 的核心设备, 一旦发生故障若不能及时修复, 将直接影响发电, 造成巨大经济损失。所研究的励磁系统在调试运行期间, 智能电力模块在工作负载为感性负载, 可控硅控制角为30度的运行条件下, 诊断系统采集到的电力模块输出电压Vd波形如图2所示。
诊断系统对该波形进行采样、分析频谱后, 在已有诊断模型库中并无现成诊断模型, 重构知识库中有如下的规则:
已知初始条件:T1 (W, αC, 10, J) 初始可信度为0.90、T2 (W, VK, 10, J) 初始可信度为0.7、T3 (W, βC, 20, Z) 初始可信度为0.8、T4 (Y, LC, 20, Z) 初始可信度为0.7。要解决的问题是:采用诊断重构行为Tk1能获得解决故障的诊断模型可行性如何?
将上述知识改写为如下形式:
(1) 知识库中有7个条件, 则知识矩阵为R为7×7矩阵, 真值状态矩阵U、阈值矩阵S和结论矩阵H都为7×1矩阵。
规则矩阵R:
知识阈值矩阵S和结论矩阵H分别如下:
(2) 真值状态矩阵U:
U=U*=[0.9 0.7 0 0.8 0.7 0 0]T;
(3) 执行矩阵运算:
Update (Min (Compare ( (R×U) , S) , H) , U) =U:
U=[0.9 0.7 0.82 0.8 0.7 0.77 0]T≠U*
(4) 令U*=U, 转入 (3) :
U=[0.9 0.7 0.82 0.8 0.7 0.77 0]T
同样继续执行矩阵运算 (3) :
U=[0.9 0.7 0.82 0.8 0.7 0.77 0.81]≠U*
再次执行 (3) 后, 有:
U=[0.9 0.7 0.82 0.8 0.7 0.77 0.81]=U*
停止重构推理, 转入 (5) ;
(5) 获得重构推理结论:在C (1) 、C (2) 、C (4) 和C (5) 初始可信度分别为0.9、0.7、0.8和0.7的情况下, C (7) 为真值的可信度为0.81, 即Tk1为真的可信度为0.81。
按照Tk1重构行为模式, 经过对相似诊断模型集合进行比较, 系统选择对应组件对象, 重构生成一个新诊断模型, 该诊断模型以波形频域中Vd直流分量、Vd基波幅值, Vd2次谐波幅值等为频域特征量, 从而可诊断出该智能电力模块存在的故障为:同一相电压的2只可控硅故障, 在进一步结合其他条件, 就可以准确定位到故障元件。
5 结束语
为了改变现有的诊断策略在集成化程度和异常故障诊断方面的不足之处, 本文面向诊断重构技术, 对重构诊断系统中Agent结构、诊断模型、重构方法等进行了相应的讨论。在下一步的研究工作中, 将对重构控制方式、重构流程等进行深入的分析。
摘要:智能故障诊断技术为保障工程技术系统的可靠性和安全性开辟了新的途径。随着系统设备和功能的日益复杂化, 发生故障的机率以及由此带来的损失越来越大, 现有单一、固定的故障诊断方法却难以满足复杂系统诊断的全部要求。针对故障诊断特点, 探讨了重构故障诊断系统的解决方案, 提出了系统的多智能体模型, 讨论了诊断重构的方法, 并通过实例初步验证了可行性, 为今后故障诊断系统的开发提供了新的理念和方法。
关键词:故障诊断,重构,智能体
参考文献
[1]徐波, 于劲松, 李行善.复杂系统的智能故障诊断[J].信息与控制.2004, 33 (1) :56-59.
[2]莫宏伟.人工免疫系统原理与应用[M].黑龙江:哈尔滨工业大学出版社, 2002:188-231.
[3]樊友平, 黄席樾, 柴毅, 等.基于细胞免疫应答理论重建故障诊断智能体[J].系统仿真学报, 2003, 15 (1) :50-55.
[4]陈善勇, 何永勇.多Agent故障诊断原型系统研究[J].中国机械工程, 2002, 13 (13) :1084-1087.
[5]任明仑, 朱卫东, 杨善林.基于构件的信息系统体系结构模型[J].小型微型计算机系统, 2004, 25 (7) :1160-1163.
[6]王彬, 张云生, 王川, 等.在实时系统中由基本组件构建Agent[J].计算机应用, 2002, 22 (4) :28-33.
[7]向阳, 于长锐.基于知识的规划模型构造系统研究[J].系统工程学报, 2002, 17 (1) :71-77.
[8]Mitchell A.Poter, Kenneth A.De Jong.A Cooperative coevolutionaryapproach to function optimization[A].In:Davidor (eds) , Proceedingsof the third conference on parallel problem solving from nature.Spring-er-Verlag, 1994:249-257.
[9]郑浩然.基于生态特征的进化与协同研究[D].中国科学技术大学, 2000:56-89.
[10]王守臣, 李大芃.基于多值规则的知识表示及其应用[J].电子学报, 2000, 28 (5) :40-43.
[11]SGE-III型励磁装置说明书[M].重庆西蜀电力控制设备公司, 2002:3-6.
【多智能体协调控制技术】推荐阅读:
多智能小车控制05-16
信息与智能控制技术05-23
智能温室控制系统技术06-29
综合智能控制技术分析08-14
智能控制技术及其发展趋势05-17
智能控制与技术实验室09-02
体智能课程总结07-01
智能体程序设计11-19
幼儿园体智能反馈09-22
幼儿园体智能亲子活动方案06-17