交通分布预测(精选8篇)
交通分布预测 篇1
0 引言
为了建设智慧交通系统,需要准确预测城市未来的交通分布情况,在通行瓶颈处加强基础设施建设,从而提高未来城市的交通容量。交通分布(Traffic Distribution)指调查区域内各小区之间出行的数量在整个调查区域内出行总数量中所占的比例[1]。分布交通量又称OD表(Ori-gin and Destination Table)是在各交通小区发生与吸引交通量一定的条件下求出交通小区之间的交通量,是交通规划四阶段法的主要步骤之一,成为交通设施规划和交通政策立案不可缺少的资料[2]。分布交通量的预测是利用给定的将来发生与吸引交通量,求出将来的OD交通量。对于分布交通量的预测,目前有多种方法[3],主要有充分利用现状OD表求出将来OD表的增长系数法、重力模型法和概率模型法[4]。概率模型法的计算方法过于复杂,使用较少;在近期预测时,增长系数法的精度通常高于重力模型法,因此规划部门在交通小区、交通方式没有发生变化时,将优先选用增长系数法[5]。本项研究将在ArcGIS平台上,采用增长系数法开发交通分布预测程序[6,7]。
1 佛莱特模型计算过程
增长系数法假定将来OD交通量的分布形式和现有的OD表分布形式相同,在此假定的基础上预测未来年份的OD交通量。增长系数法包括增长函数方法和弗尼斯(Fumess)约束条件方法两大类。增长系数法具体包括常增长系数法、平均增长系数法、底特律(Detroit)法、佛莱特(Fratar)法。其中,常增长系数、平均增长系数法分析方法过于简单,逐渐被底特律法和佛莱特法所取代。佛莱特法收敛速度极快,使用最为广泛,而且该算法作为成熟的交通分布预测方法,极短期预测无需检验精度[8]。
佛莱特法认为,预测年份i小区发生量中被j小区吸引去的出行量为tij,tij应与i小区预测年份的i小区发生量Pi成正比,同时也和j小区的吸引系数bij成正比。得:
再从吸引区j区的角度分析,得:
由于上述t1ij'、t1ij" 表示同一个量t1ij,因而预测值取平均值:
称为第k轮第i区“产生位置系数”。
称为第k轮第j区的“吸引位置系数”。
故佛莱特模型为:
佛莱特模型的计算过程比较复杂,但收敛速度快,具有较好的工程实用价值。
2 佛莱特模型求解
按数学模型的推导过程,确定佛莱特模型的程序流程图(见图1),并应用VFP9.0开发求解程序,实现了公式(3)的迭代求解。
以下是求解程序的迭代过程源码片断。迭代停止条件为上一次计算的交通量和本次计算的交通量相对误差小于万分之一,可以视为再迭代也无法进一步提高计算精度。为了提高收敛效率,设置了“L_D”逻辑型状态符,最新计算结果“Tgm”高于上一次计算结果“Tod”,设置“L_D”为真。进行新的迭代时,上一次迭代的“L_D”设为“L_D_old”,当本次的“L_D”和“L_D_OLD”不相等时,说明本次迭代计算精度不升反降,应当减小搜索步长,并且按相反的方法搜索精度最高的位置。采用此项设计进一步提高了佛莱特模型的收敛速度。
编写的求解程序运行界面如图2所示。
3 程序应用
程序在福建省南平市的“畅通工程”项目中投入了实际应用,交通工程人员先以南平市的ArcGIS地图为依据,将工业、经济、人口条件相似且地理位置相邻的片区划分为同一个交通小区。南平市市郊共被划分为20个交通小区。
统计运输公司和公交车公司的生产日志,通过交警部门对汽车驾驶员进行短信调查,了解各类汽车在市内交通的起点和终点及频次。对数据进行加工整理,把各种型号的车辆交通量都换算为小车交通量,最终获得2014年的南平市交通量OD表。
在ArcGIS地图上分析各交通小区2018年的土地资源利用情况,预测2018年各交通小区的交通产生量和吸收量,结合2014年的OD表,应用本研究开发的佛莱特的求解程序,可以预测2018年小区之间的交通量OD表,从而预见未来的交通瓶颈。
4 结语
本研究应用VFP9,开发了交通分布预测佛莱特模型的求解程序,其界面简单、结构清晰,具有简单易学、操作方便、输入快捷等特点。其适宜交通工程领域基层技术人员使用,可应用于智慧城市、智慧交通前期阶段的交通基础数据处理。
参考文献
[1]卫翀,邵春福.考虑交通量随机波动的随机用户均衡配流模型[J].吉林大学学报:工学版,2015,45(5):1408-1413.
[2]林宇洪,沈嵘枫,邱荣祖,等.南方林区林产品运输监管系统的研发[J].北京林业大学学报,2011,33(5):130-135.
[3]蓝岚,伍炜.基于交通量特性分析的山地城市交通发展策略[J].重庆交通大学学报:社会科学版,2015(1):24-26.
[4]林宇洪,林森,景锐,等.木材运输IC卡读写器的开发[J].福建农林大学学报:自然科学版,2010,39(4):435-438.
[5]肖颖,刘晓建.轨道交通客流预测的扩展反馈四阶段法研究[J].都市快轨交通,2014,27(5):48-51.
[6]曹志成.交通量预测中分布交通量预测的几种计算方法解析[J].建筑工程技术与设计,2015(11):1912-1917.
[7]林宇洪,胡连珍,蒋新华,等.基于二维码的农超对接供应链追溯系统的设计[J].黑龙江八一农垦大学学报,2015,27(6):83-87.
[8]孟博翔.基于四阶段法的兰州市雁滩商业圈交通需求预测[J].交通科技与经济,2014,16(2):27-30.
交通分布预测 篇2
辽宁省南部金刚石分布及找矿预测
详细地介绍了辽宁省南部发现的金伯利岩岩体和金刚石砂矿形成地质条件、分布范围,特别是金刚石砂矿成因类型、分布规律及成矿远景区预测.
作 者:张树林 郭阳春 吴德军 ZHANG Shu-lin GUO Yang-chun WU De-jun 作者单位:辽宁省第六地质大队,辽宁,普兰店,116200 刊 名:吉林地质 英文刊名:JILIN GEOLOGY 年,卷(期):2009 28(2) 分类号:P619.24+1 关键词:金伯利岩 金刚石砂矿 分布规律 远景区 辽宁南部交通分布预测 篇3
关键词:交通控制,智能交通,图论,分布式系统
1 引言
随着经济的快速发展和城市化进程的加快,城市车辆快速增长,大中城市的交通拥堵问题日趋严重。各大城市都在努力拓展交通网络,同时也推出各种限制车辆出行的政策和方法来缓解交通拥堵。然而这些方法的作用都是有限的。利用智能交通控制技术解决交通拥堵问题已成为一个重要的研究领域[1]。在智能交通控制领域中,对交通信号灯的优化控制是研究的重点[2]。
由于车流量变化是伪随机过程[3],所以很难根据交叉路口的车流量状况,建立一个准确的数学模型。近几年,出现了很多智能化的交通控制策略。这些智能化控制策略通常被应用于单个或少量的交叉口[4,5]。然而解决大型复杂系统问题的最佳方案就是采用Multi-agent技术实现智能化的分布式交通网络控制。
Multi-agent技术非常适用于交通网络一类的大型动态分布式系统[6]。它可以把大型的分布式动态系统分成若干由智能agent控制的子系统,这些agent之间互相沟通协作,从而共同实现一个全局任务。基于Multi-agent的交通网络控制系统是将交通网络中的控制器(通常是交通信号控制器)视为agent。Agent之间相互沟通合作,并根据实时交通状况进行交通控制管理。
Roozemond(2001)[7]提出了一种基于Multi-agent技术的城市交通信号控制系统,该系统可以通过切换预定规则使智能系统适应交通环境的变化。在Cai和Yang(2007)[8]介绍了一种包含四种agent的交通控制系统,但其中央式的管理结构不但增加了系统复杂性,也降低了系统的灵活性。Choy等(2003)[9]和Srinivasan等(2006)[10]提出了一种三层Multi-agent结构。该系统中agent的设计是基于神经网络和模糊逻辑理论。该系统还提供了机器学习机制,包括强化学习和自适应权重。同时采用演化算法对模糊逻辑中的关系函数进行动态更新,从而使a-gent可以适应不断变化的环境。
近几年来,对agent的算法研究也是智能交通网络的研究重点。这些agent的控制方法大都采用了人工智能技术,例如:机器学习、神经网络、遗传算法、模糊逻辑[11]。
Gregoire等(2007)[4]设计了一种基于强化学习的自适应交通信号控制agent。Weiring(2000)[5]也同样描述了如何利用强化学习的方法控制交叉路口的交通信号灯。Wen等(2008)[12]和Dai等(2010)[13]提出了基于机器学习的自适应交通灯控制模型。Prashanth和Bhatnagar(2010)[14]也同样设计出带有自适应性质的交通信号控制方法。上述方法已经在单独的交叉路口[12]、网格式交通网络[13]或者含有多个路口的单一道路[14]上进行了测试。但其计算的复杂度会随着网络的增大呈现指数级上升。因此,这些算法也很难在大型复杂交通网络中实现。
最近的研究成果中,出现了很多基于模糊逻辑控制器的交通信号控制系统[15]。虽然这些方法与传统控制方法相比,表现出更好的性能。但研究表明模糊逻辑在处理大型交通网络的不确定因素和突发事件时,依然有局限性[16]。为了解决上述问题,很多研究采用了模糊逻辑与机器学习、遗传算法等智能算法相结合的控制方法[17]。在这些工作中,仿真结果表明智能化的模糊逻辑控制器比传统的模糊逻辑控制器具有更好的性能。但由于其算法的复杂性,这些基于智能算法的模糊逻辑控制器依然不适用于大型的复杂交通网络。
上述研究表明,基于Multi-agent交通系统研究往往采用集中式控制。这种中央式的管理控制方式极大地限制了系统的灵活性和鲁棒性。而且中央控制器的系统负担,会随着交通网络的扩展呈指数级上升。另一方面,a-gent的控制方法研究往往会采用模糊逻辑、神经网络或遗传算法等智能化算法。这些算法虽然表现出良好的性能,但其复杂性却限制了这些算法在大型交通网络中的应用。
本文建立的智能交通系统采用分布式方法对整个交通网络进行控制,可极大地缓解庞大的交通系统对中央控制机构的压力;该智能交通系统可以根据道路的车流量进行分布式调整,进而缓解交通资源分配不合理所造成的交通阻塞。该系统最大的优点在于随着交通网络的增大,计算的复杂度并不会增加;智能交通系统采用简单高效的方法实现智能控制,易于实现且有效地节省了建设成本。
2 交通网络模型
2.1 基于图论的交通网络模型
本文中交通网络模型的构建是基于图论和矩阵理论。道路的交叉口可以视为agent,道路可以视为agent之间的连线。因此交通网络可以视为agent和agent之间的连线组成的网络图。由图论可知,图的结构可以用集合G=(V;E)来表达。其中V为agent的集合,E表示agent之间的连线的集合。与agent i之间存在连线的agent称为i的邻居,agent i的邻居集合可以表示为Ni={j1,j2,…,jn}。图1中所描绘的是建立交通网络模型的一个简单例子。
如图1所示,处于地图中心的agent被定义为agent i.agent i连接着4个邻居:Ni={1,2,3,4}。邻居之间有道路相连。为了直观理解,本文设定每一条道路皆为双向6排道。在到达agent i所控制的交通路口时,占在右排车道的车辆只能向右侧拐弯;占在左道的车辆只能向左侧拐弯。而占在中间车道的车辆只能直行。每一个agent包含四组控制信号。其中信号1控制的是北行方向车辆的信号灯。当信号1设为红色时,所有处于该路口向北行驶的车辆都需要停车等待。反之,当信号1为绿灯时,所有北行方向车辆都可以向北运动。与之类似,信号2、信号3和信号4分别控制东行,南行和西行方向的车辆。在一个变化周期内,当某一组信号为绿色时,其他三组必须为红色。在正常情况下,一个周期内四组信号应该依次变为绿色。如图2所示。
图2所示为路口信号变化时序的一个简单例子。信号1在Ti1时间内为绿色,此时北行方向车辆通行。而其他方向禁止通行。在Ti2时间内,信号2为绿色,东行方向车辆通行,而其他方向禁止通行,依次类推。
2.2 车流量控制模型
传统交通控制研究都是以某一条道路上的车流量作为研究对象。本文中介绍的交通网络控制算法是以agent为研究对象,因此需要建立agent的车流量表达式。假设agent i与agent j互为邻居。它们之间的连线Eij上有xij个车辆正在从agent j向agent i移动,称xij/Lij为agent i在Eij方向上的车流量。其中Lij为agent i和agent j之间的道路长度。如果agent i的邻居集合为Ni,则agent i的车流量可以表示为:
由式(1)可以看出,xi是从各个方向流向agent i的车流量之和。xi越大说明即将通过agent i的车辆数越多,a-gent i在未来一段时间内面临的交通压力就越大。
如果要控制agent i驶向agent j的车流量,可以通过控制通往agent j方向的绿灯时间来调整。如果agent i向agent j方向的绿灯开放时间为Tij,则agent i的车流量变化方程可以写为:
其中,为xi对时间的微分,k为常数系数。如果把a-gent i的所有邻居都考虑在内。则xi的控制函数可以写为:
由式(3)可以看出,只要调整时间Tij就可以控制a-gent i的车流量。后文将利用拉普拉斯矩阵收敛性控制交通网络车流量,并找出控制Tij的有效机制。
3 智能交通网络控制机制
本文的主要研究内容是建立分布式的交通网络车流量预警机制和控制机制。该机制的主要目的是:合理的分配交通网络中的道路资源,缓解交通网络资源分配不均造成的交通网络阻塞。图3描绘的是本文中所要建立的智能系统工作流程。
由图3可知,该智能系统由两个模块组成。第一个模块为“交通网络流量预警”模块。该模块的输入为网络中各agent的车流量,输出为交通网络车流量的总体状况,称之为预警指数。当预警指数小于某个指定数值的话,交通网络会持续监控网络中各条道路的车流量变化,而不会采取任何措施。当预警指数大于指定数值的话,第二个模块“交通网络流量控制机制”就会启动。该模块的主要作用是调节网络中各条道路的车流量,使各条道路的车流量趋于平衡,最终达到缓解交通阻塞的目的。下面讨论如何利用设计agent的智能算法进行流量预警和流量控制。
3.1 拉普拉斯半正定矩阵
在图论中,每个网络拓扑图都可用一系列的特征矩阵来表达。假设在交通网络中有n个结点,则该网络图的邻接矩阵“A”是由1或者0组成的n×n矩阵。当两个结点之间有道路相连接的话(互为邻居),则相对应的邻接矩阵上的元素为1。如果两个结点之间不存在道路,则对应的元素为0。除了邻接矩阵,度矩阵“D”也是分析网络结构的重要工具。度数矩阵是一个n×n的对角矩阵。对角线上的元素是相应结点的邻居数目。
拉普拉斯矩阵的定义为L=D-A.由邻接矩阵A和度矩阵D的定义可知,拉普拉斯矩阵L是一个对称的半正定矩阵。根据文献[23]提出的拉普拉斯矩阵收敛性,如果一个连通网络系统的系统方程为,则该系统将会以渐进的方式趋近于一种稳定的平衡态:x1=x2= …=xn=1/n∑x.下面利用拉普拉斯矩阵的性质,来构建分布式交通网络流量监测系统。
3.2 交通流量预警模型
如上文定义道路的车流量代表了交通压力程度。车流量越大交通压力越大。所以,本文将各条道路车流量的均值C作为交通流量预警指数。如果系统中存在一个中央系统,则中央系统很容易通过收集所有的agent的车流量信息,计算出网络中的预警指数。但如果中央系统无法工作或者根本没有中央系统,则整个系统就会瘫痪。因此,本文提出了利用分布式算法计算交通网络的预警指数。
交通网络的预警指数的分布式算法需要每个agent都参与预警指数的计算。对于agent i及其邻居来说,分布式算法的计算过程如下:
其中,ci、cj分别表示agent i与agent j的车流量信息。是agent i车流量信息关于时间的微分。式(4)是通过agent i与其邻居交换彼此的车流量信息,来完成预警指数的计算。也就是说,通过分布式算法式(4)的计算,可以获得agent i与其邻居的平均车流量信息。考虑交通网络中所有agent,则交通流量预测的分布式算法可以表示为:
其中,,L表示交通网络拓扑的拉普拉斯矩阵。根据前文中提出的拉普拉斯矩阵性质,式(5)中的c会以渐进的方式趋近于一种稳定的平衡态:c1=c2=…=cN=C.而且平衡状态就是车流量的均值C,即交通流量预警指数。换而言之,通过式(5)每个agent都可和获得整个交通网络的车流量平均值。
应当指出,式(5)的计算过程,只需要相邻的agent交换极少量的信息就可以实时得到整个交通网络车流量的平均值,而不必获得所有agent的车流量信息。由于交换的信息量极少,对通信设备的要求很低,易于实现。而且,由于采用了完全分布式算法,即使个别agent出现问题,也不会影响到整个交通网络的预警效果,这就避免了对中央系统的依赖。
综上所述,整个交通网络通过式(5)可以获得预警指数C.如果预警指数高于预设阈值,agent将启动交通网络车流量控制机制,协调控制网络中的车流量。下节将构建交通网络流量控制机制。
3.3 交通流量控制模型
为了减少交通拥挤、提高道路的利用率,最优的交通信号灯控制是能够实现每个交叉路口的车流量基本相等。为了实现这一目的,采用分布式的交通流量控制算法。假设交通网络中有N个交叉路口,整个网络中N个交叉路口的车流量x可以用矢量表示为:
为了实现最优的交通信号灯控制,就需要整个交通系统达到稳定状态(所有交叉路口的车流量相等,即x1=x2=…=xN)。显然,仍然可以采用拉普拉斯矩阵的收敛性实现这一目标。交通流量控制的分布式算法可以表示为:
其中,,x=[x1,x2,…,xN],L表示交通网络拓扑的拉普拉斯矩阵。根据前文提出的拉普拉斯矩阵性质,式(7)中每个agent的车流量都会渐进的趋于一致。
应当注意,根据交通流量控制的分布式算法式(7)获得的每个agent车流量x是理论值。最终的车流量是由交通信号灯控制的。所以,还需要计算每个agent交通信号灯的绿灯时间。上文式(3)给出了信号灯绿灯时间决定的agent车流量。因此,只需根据式(3)反推每个agent交通信号灯的绿灯时间,即:
其中,Tij表示agent i通往agent j的绿灯时间,k为常数系数。考虑到每个交叉路口有多个车流方向,假设每个a-gent的交通灯周期为T,则agent i通往agent j的绿灯时间Tij为:
利用式(9)控制交通系统中每个agent的绿灯时间,就可以将交通网络中的车辆均衡的分配到道路中,进而实现道路资源的最大利用率。这个交通流量控制算法不但可以减少交通网络的阻塞现象,还可以提高车辆运行的速度。
下节将利用模拟实验的方式验证该系统的稳定性,并通过不同的参数衡量系统的灵活性和鲁棒性。
4 模拟实验
4.1 传统控制方式下的交通网络
本文中采用MATLAB构建模拟实验平台。首先选取北京市海淀区南部区域的地图作为实验对象,并得到图4所示的交通网络拓扑图。该网络中包含了34 个agent和55条道路。为了比较传统控制方法和智能交通系统的不同,在第一组实验中没有使用分布式智能控制,而是采用图2所示的传统固定时序交通信号进行控制。网络中每个信号灯的周期皆为100秒,而每组信号的时长为25秒。
图5描绘的是交通网络在初始情况下的状态。图5中每个agent上的箭头代表了当前该路口允许车辆行驶的方向。agent之间的连线为道路。每条道路皆为双向6排道。道路上的黑点代表车辆,车辆的运动模型采用Na-Sch运动模型[18]。车辆随机的进入交通网络,定义每秒进入网络的车辆数为CI.初始状态下CI=30 辆车/秒。进入的车辆在NaSch模型控制下沿着道路行驶。在初始状态下,车辆随机的分布在少数的几条道路上。
随着时间的推移,更多的车辆加入到交通网络,并在交通系统的控制下在网络中运行。图6描绘了交通网络t=800秒时的状态。由图可知,更多的车辆进入交通网络,并且在网络的各个路口呈现了不同程度的拥堵。
为了模拟交通高峰时期的状况,在t=1000~2000秒,设定CI=130辆车/秒。图7描绘的是交通网络在t=1500秒的状态。由图7 可知,车辆完全的积压在各个路口,整个网络呈现出了瘫痪状态。
高峰期在时刻t=2000 秒结束,CI再次降为30 辆车/秒。图8描绘的是交通网络在时间t=2400秒的状态。受到交通信号的限制,依然有大量车辆滞留在网络的中部,而且各条道路的车流量呈现不平衡状态。
为了更加直观的观察整个交通网络的车流量变化情况,计算出所有道路车流量的平均值,并在图9中画出车流量平均值随时间变化的曲线。图9 中X轴为时间,单位为秒;Y轴为平均车流量,单位为车辆数/每格。由Na-Sch模型定义可知,每条道路agent车流量的最大值应为1辆车/每格。由图9 可以看出,在初始状态下各条道路的车流量较小。随着时间的推移,各条道路的车流量逐渐上升并在t=500 秒左右趋于平稳。 在时间t=1000~2000秒,交通网络出现了车流量高峰,最大值一度达到0.6辆/每格。高峰期在t=2000秒结束。车流量缓慢的恢复到0.2辆/每格。应当指出,根据上文定义车流量反映的是道路的拥挤程度。也就是说,车流量越大道路的拥挤程度越高。
在整个模拟过程中,每个agent利用交通网络流量预警机制估计交通网络的预警指数(C)。图10中描绘的就是任选的7个agent所计算出的预警指数。由图中可以看出,虽然预测值之间存在一定的偏差,但大体趋势和数值与图9中的平均车流量基本一致。由此可知,该预警机制可以比较准确的估算出交通网络预警指数。
4.2 智能交通系统控制下的交通网络
第二项实验测试智能交通网络控制机制。交通网络的车辆进入量(CI)与上一实验相同:当t=1000 秒,CI=30辆/秒;当t=1000~2000 秒,CI=130 辆/秒;当t=2000~3000秒,CI=30辆/秒。但控制方式却有所不同,在开始阶段,依旧采取传统的交通控制方法。而且每个a-gent利用预警机制实时的计算预警指数C.为了对比试验结果,本文将每个agent设定一个较高的阈值,取值为0.43。应当指出,在实际的交通流量控制中可以采用更小的阈值。采取的控制规则如下:
(1)如果C<0.43,使用传统的控制方法。
(2)如果C>0.43,使用智能交通系统控制方法。
初始阶段与第一项实验的情形相似。交通高峰期在1000秒左右到来,而车流量的高峰期出现在t=1200秒左右(如图11所示状态)。此时交通网络的车流量达到C=0.43。而各个agent相继开启了智能交通系统控制模式。在智能交通系统控制下,车辆不断地向各个路段疏导,并充斥整个交通网络。在t=1500秒(图12),车辆均匀的分布在整个网络中。虽然车流量依旧很高,但各个agent处没有发生明显的拥堵现象。
高峰期在t=2000秒结束,车流量逐渐降低。为了和同时期传统的控制方式进行比较,依旧保持使用智能交通控制机制进行交通管理。图13描绘出t=2400秒时智能交通网络状态。从图13可以看出,智能交通系统控制下的交通网络运行状态明显优于同时期(图8)传统的网络控制方法。不仅车流量更低,而且各条道路的车流量保持均衡。为了进一步验证,将利用交通网络平均车流量和平均车速等参数,来定量的分析两种方法的不同。
利用平均车流量来验证系统的性能。图14中的曲线代表了交通网络车流量随时间变化的情况。初始状态与前一项实验相同,车流量随车辆数增多而缓慢上升。t=500秒以后平均车流量稳定在0.15 左右。高峰期在t=1000秒到来,车流量进一步飙升,在t=1200秒左右达到0.43。而此时agent通过预警机制所测算的预警指数也达到了0.43左右(如图15)。此时系统开启智能交通系统控制机制,平均车流量开始快速下降并恢复到了0.15左右的状态。尽管此时平均车流量与t=500 秒相似,但此时正处于高峰期,车辆进入量(CI)比t=500秒时多了100辆/每秒。这也说明了智能交通控制系统能够更好地协调各条道路的车流量,并可以有效地缓解交通阻塞。随着高峰期的结束(t=2000秒),在智能交通系统控制下的交通网络平均车流量逐渐减小。在t=2200 秒之后交通网络平均车流量下降到了0.05。这一数值也远远小于同时期传统控制机制的平均车流量0.15(如图9)。另一方面,由图15中描绘的预警指数可以看出,在整个过程中预警机制准确且快速地为各个agent提供了预警信息。
为了分析网络中各条道路的变化情况,将所有道路的车流量曲线画在同一图中(图16)。如图16所示,各条道路的车流量在传统交通控制机制下(t=0~1000秒)差异很大。到t=1200秒之后,智能交通系统控制机制开始接管交通网络控制,各条道路的车流量基本上保持了一致。这也验证了该算法确实可以平衡的分配各条道路的资源。
为了进一步验证,采用交通网络车辆平均速度这一参数。如图17所示,初始状态下网络中的平均车流量达到了30公里/小时。随着车辆的增多,平均速度逐渐减小。由于刚刚进入车道的车辆速度较快,因此在高峰期出现了小幅上升,但总体还是下降趋势。在时间t=1200秒左右降到了最低点15公里/小时。此时智能交通网络控制机制启动。平均速度开始快速上升,并保持在高位,甚至有一段时间超过了30公里/小时。t=2000秒以后,车辆逐渐减少。平均速度保持在了30公里/小时。这一结果证明了,智能交通网络控制机制不仅可以协调控制网络中的车流量,也可以使车辆保持较高的运行速度。
4.3 极限测试
为了测试智能交通网络控制机制的极限,用不同等级的CI(CI=30、CI=150、CI=300)冲击交通网络。并测试不同等级的冲击对网络平均车流量和车辆平均速度的影响。根据实验数据,我们得到图18和图19的曲线图。图18中三条实线为三种不同的CI,冲击智能交通网络控制机制下交通网络平均车流量。而三条虚线为传统网络的平均车流量。由图18可知,CI越大则车流量越大。而且在CI相同的情况下,智能交通网络控制机制下的交通网络车流量总是小于传统控制的交通网络。图19描绘的是三种不同的CI对车辆平均速度的影响。同样三条实线为智能交通网络的平均车速,三条虚线为传统网络的平均车速。由图19 可知,CI越大,则网络中的平均车速越小。而且智能交通网络的车速总是高于传统网络的平均车速。可见,车辆不用长时间等待红灯,从而保证车速不减,大大提高了道路的利用率。
5 总结
本文采用Multi-agent技术,建立分布式交通网络车流量预警和控制系统的方法。该系统利用拉普拉斯矩阵收敛性预测网络平均车流量、优化交通网络中各条道路的车流量,达到缓解交通阻塞、提高道路利用率的目的。由于agent所使用的智能算法简单、高效、易于实现,因此大大降低了建设成本和系统复杂性。另外,该系统采用完全分布式结构,不但提高了系统的灵活性和鲁棒性,同时也缓解了复杂交通网络对中央控制机构的依赖和压力。
利用地震振幅属性预测砂岩分布 篇4
为了搞清该区嫩三段河道砂岩储集层的分布情况, 在准确确定油层、精细落实构造的基础上, 利用地震属性预测砂体发育区, 预测结果与实钻结果十分吻合, 这项工作为研究区黑帝庙油层的勘探奠定了基础。
1 油层确定及构造精细解释
1.1 油层确定
嫩三段黑帝庙油层自上而下分为HⅡ1、HⅡ2、HⅡ3三个油层组。应用三维连片处理后的地震资料, 用声波测井资料制作合成地震记录。制作了区内20余口井的合成地震记录, 确定过井地震剖面地质层位, 准确确了油层顶面反射层位。
1.2 构造精细解释
在层位确定的基础上, 利用Landmark解释系统, 从多视角研究分析油层顶面反射层特征, 进行层位追踪解释。在精细追踪对比断层和层位时, 充分利用人机联作的快速、直观和多功能优势 (三维立体解释、水平切片显示、连井剖面显示、图分析技术等) , 充分注意小断层和小幅度构造的解释, 利用变速成图技术, 完成油层顶面构造图。
2 砂岩储集层分布趋势预测
在上述工作的基础上, 应用地震属性提取技术对嫩三段河道砂岩储集层的横向变化进行定性预测。
2.1 地震属性的定义
地震属性是指那些由叠前或叠后地震数据, 经过数学变换而导出的有关地震波的几何形态、运动学特征、动力学特征和统计学特征的特殊测量值。有些属性可能擅长于揭示不易探测到的岩性变化, 而有些属性可以直接用于烃类检测。
地震属性分析的目的就是以地震属性为载体, 从地震资料中提取隐藏的信息, 并把这些信息转换成与岩性、物性或油藏参数相关的、可以为地质解释或油藏工程直接服务的信息, 从而达到充分发展挥地震资料潜力, 提高地震资料在储层预测、表征和监测能力的一项技术。
2.2 地震属性提取过程
(1) 确定钻井和地震资料的时深关系, 即层位标定;
(2) 层位追踪解释, 确定时窗, 并进行地震属性提取;
(3) 地震属性优化, 优选出用于预测的数量最少的属性组合;
(4) 地震属性分析, 建立地震属性、地质特征之间的统计关系, 从而在密集的地震数据指导下对井间油藏特性进行预测。
本次应用Landmark的PAL模块, 单道分时窗提取出四大类 (振幅类、相关类、频率类及相位类) 20多种属性。应用专家优化方法, 凭着多年的各种地质条件下的地震属性分析经验, 结合钻井、测井资料, 确认在本区振幅类属性可以定性揭示河道砂岩的分布 (图1) , 振幅高值区 (红黄色) 对应河道砂体发育区。
2.3 砂岩储集层分布预测
理论与实践证明:薄互层地质条件下, 砂岩厚度小于1/4波长时, 地震反射波振幅随着砂岩厚度的增大而增强, 在砂岩厚度达到1/4波长时, 地震反射波振幅最强。由此可见, 在砂岩厚度小于或等于1/4波长的情况下, 可以通过振幅的强弱来预测砂岩的厚薄。
研究区三维地震资料黑帝庙油层的主频为40Hz左右, 频宽为8-80Hz。根据调谐原理, 地震可检测地层厚度3-22m。本区储层以砂泥岩互层为主, 砂岩厚度较薄, 多数为2-8m, 个别厚度达到20米, 但是基本落在可检测的范围之内。因此, 在本区利用振幅预测砂岩厚度是可行的。
预测方法是:
(1) 从已知井出发, 用井点处的振幅值与砂岩厚度值进行相关计算, 拟合出反射波振幅值与砂岩厚度之间的关系曲线, 进而导出一个用振幅值计算砂岩厚度值的计算公式。
(2) 用这个计算公式进行外推计算, 得到黑帝庙油层各个砂组的预测砂岩厚度平面分布图 (图2) 。对比分析预测结果与实钻结果, 砂岩厚度误差为1-2米。
3 结论
(1) 地震属性提取技术在研究地区黑帝庙油层的砂岩储集层预测中取得了很好的效果, 所预测的砂岩发育的区域与实钻结果十分吻合, 说明这一储集层预测方法是行之有效的。
(2) 此方法适用用地震资料品质较好、以泥包砂地层结构的地区, 其预测结果有效直观。对于地震资料品质不好的地区, 则首先要采用影像加强、提高信噪比方法处理, 再采用本文方法进行预测。
参考文献
[1]姜秀清等, 地震属性分析技术在不同油气气藏中的应用[J].石油物探, 2004, 43 (增刊) :70-72[1]姜秀清等, 地震属性分析技术在不同油气气藏中的应用[J].石油物探, 2004, 43 (增刊) :70-72
交通分布预测 篇5
1 实验
1.1 原油性质和反应数据收集
分别测定原油原料的性质组成,性质组成包括密度、残炭、粘度、平均分子量、元素含量(H,C,N,S)、H/C、金属Ni和V的含量、饱和分、芳香分、胶质和沥青质。同时,还要对原油的原料进行催化裂化反应[1]和热转化反应性能的研究。最终,将性质组成和反应数据存储于数据库,为下一步数据分析提供数据基础。部分原油催化裂化反应数据见表1。
1.2 化学计量学校正理论
校正理论是化学计量学最重要的组成部分,所谓校正就是利用化学量测系统或数据和已有被研究体系的知识或信息,采用适当的统计学方法建立的一个模型,然后利用该模型定性或定量分析未知对象或样品,并预测被分析对象各方面信息的过程[2]。原油的性质和反应数据经测定收集后,利用校正理论方法,便可以建立性质与性质、性质与反应产物分布的定量数学模型,最后利用该模型定量预测未知原油样的性质和反应产物分布数据。
本文选取了六种常用的校正理论建模方法建立定量数学预测模型,六种方法包括:
1)多元线性回归(Multiple Linear Regression,MLR)
多元线性回归中,随机变量y与一般变量x的线性回归模型为[3]:
在原油知识预测模型建立时,y为因变量代表原油的某个性质或是某个反应产物的质量分布,x为自变量代表原油的性质。当得到n组原油观测数据(x1,x2,…,xp,yi)时,i=1,2,…,n,线性回归模型可写成矩阵形式,其中,
X为原油性质矩阵,β为回归系数向量。
原油性质组成数据和反应数据作为模型的训练数据,利用多元线性回归方法,求解回归系数β,便可以建立性质与性质、性质与反应产物分布的数学关联模型。最后,将未知原油的性质数据输入数学模型,就可以达到定量预测未知原油性质和反应产物分布的目的。
2)逐步线性回归(Stepwise Regression,SR)
参加多元线性回归(MLR)的n个原油的性质特征量x1,x2,…,xn中,单独观察时有些性质特征量x与因变量y(性质或反应产物分布)的相关程度很密切,有些性质特征量x显得不重要。若把这些不重要的特征量保存在回归方程中,不仅增加计算工作量,而且会增加方程的不稳定性[4]。因此,希望从n个性质特征量中选出与预测值因变量y最密切,最具有代表性的性质特征量x。为此,本文采用逐步线性回归法,在原油的性质中,分析选出与需要预测的原油的某个性质或某个反应产物分布关系最为密切的关键性质,作为线性回归方程的自变量x。
3)主成分回归(Principal Component Regression,PCR)
若原油性质特征量相互间无“共线性”(原油性质自变量呈线性、无干扰和无变量间的相互作用)问题,则利用多元线性回归方法建立的数学模型可以达到很高的预测精度[5]。但原油分析中数据总是带有误差,此时将多元线性回归建立在整体性质数据矩阵的基础上,就会造成模型失真,降低预测精度。为此需要采用主成分回归法,首先对原油性质做主成分分析,选取重要因子,然后采用常规多元回归分析方法建立重要因子与待预测性质或反应产物分布的数学模型。可以看出主成分回归实际上是主成分分析和多元线性回归的组合。
4)偏最小二乘法(Partial Least Squares,PLS)
偏最小二乘法(PLS)是化学定量校正理论最常用的一种方法[6,7],PLS模型建立过程见图1。在预测原油性质或反应产物分布过程中,利用训练数据(数据库中的原油性质、反应产物分布数据)和偏最小二乘法,首先求出系数矩阵b,建立多元线性模型,输入未知原油的性质组成数据,便可以得到预测结果。
偏最小二乘法与主成分回归有着相同的模型结构,主成分回归(PCR)的主要目的是要提取隐藏在自变量矩阵X中的相关信息,然后用于预测变量Y的值,这种方法可以保证只使用那些独立变量,噪音将被消除,从而达到改善预测模型质量的目的。但是,主成分回归仍然有一定的缺陷,当一些有用变量的相关性很小时,在选取主成分时就很容易把它们漏掉,使得最终的预测模型可靠性下降。偏最小二乘回归可以解决这个问题,它采用对变量X和Y都进行分解的方法,从变量X和Y中同时提取因子,再将因子按照它们之间的相关性从大到小排列,要建立一个模型,只要决定选择几个因子参与建模就可以了。
5)非线性回归最小二乘法(Nonlinear Least Squares,NLS)
一般的非线性回归模型可以表示为[8]:
本文中,X是原油性质数据矩阵,β为待估计的参数向量,y是准备预测的原油的性质或反应产物分布,ε为随机误差。函数形式f(·)是已知的。与多元线性回归法类似,求取β,便可以建立非线性回归数学预测模型。
6)支持向量机(Support Vector Machine,SVM)
支持向量机于1995年由Vapnik首先提出,它是一种监督式学习的方法,它广泛的应用于统计分类以及回归分析中[9]。支持向量机的体系结构如图2所示。
本文中,X为原油性质矩阵,K为支持向量机的核函数,本文核函数选取为“radial basis”,b为偏置项,a为权重向量,则预测的原油性质或反应产物分布结果为:
1.3 校正理论模型开发软件
本文所有化学计量学方法都由R 2.13.0(http://www.r-project.org/)开发,所用到的工具包(Packages)有:stats、e1071(LIBSVM)、Chemometrics With R、MASS和chemometrics。
2 结果与讨论
利用化学计量学校正理论的目的就是为了建立性质与性质、性质与反应产物分布之间的数学预测模型。本文采用了六种不同的方法建立数学模型,各种方法在实际应用中存在不同(见表2)。例如:MLR、SR、PCR和PLS为线性方法,而NLS和SVM为非线性方法;在数据建模前,PCR、PLS和SVM需要对数据进行标准化处理,消除量纲和数量级不同引起的不引人注意的权重,而且这三种方法是将主成分分析后的因子作为自变量进行数据建模的;在数据建模过程中,PCR和PLS需要对特征参数“ncomp(Number of Components,主成分因子数)”进行优化,SVM需要对特征参数“gamma”和“cost”进行优化,达到对数据模型优化的目的。
本文为了研究化学计量学校正理论在原油数据分析中的应用,根据所收集的原油数据,重点分析研究原油粘度的预测,对原油反应产物分布预测进行探索性研究。
2.1 原油性质预测
粘度是评定原油流动性的重要指标,表征其分子间相对运动时因摩擦而产生的内部阻力大小,是原油加工、过程模拟等设计必不可少的基础物性数据。随着原油馏分的变重、沸点升高,其粘度增大。但在粘度测定过程中,升高温度会导致原油裂解,而且采用旋转粘度计法测定粘度,误差较大,因此有必要寻找新的预测粘度的方法。本文利用所收集的原油性质数据,结合化学计量学校正理论的六种方法,分别建立粘度的预测模型。
因为粘度分布范围很宽且不均匀(见图3),所以在关联过程中一般取粘度的对数与其它性质关联,取对数后的粘度箱线图见图4。
在数据建模过程中,粘度取对数后作为模型的因变量y,而其它的13个性质(密度、残炭、平均分子量、元素含量(H,C,N,S)、H/C、金属Ni和V的含量、饱和分、芳香分和胶质)作为模型自变量x。
首先,经多元线性回归(MLR)建立预测数学模型,并对数学模型分别进行方差分析与t检验。t检验结果给出了每个因变量的回归参数、常数项值、标准差、t值和相应的P值(见表3)。由方差分析可以得出模型的P=2.2e-16<0.0001,故预测粘度的模型是有意义的。由t检验结果可见:密度、残炭、N含量、Ni含量和V含量回归参数的P值小于0.05,可认为这些自变量对粘度有显著的影响;而平均分子量、C含量、S含量、H/C、饱和分和芳香分回归参数的P值远远大于0.05,可认为这些自变量对粘度没有显著的影响;其它几个自变量,H含量和胶质对粘度影响则不太显著。
通过以上t检测结果,可以看出有些自变量对粘度没有显著影响,出现这种结果可能的原因是自变量之间存在“共线性”。因此,可以利用逐步线性回归法(SR),剔除一些变量,最终回归模型中,自变量均为显著的,也就是说最终用于建立粘度预测模型的原油性质对粘度都有显著的影响。利用逐步线性回归建立数学模型,由方差分析可以得出模型的P=2.2e-16<0.0001,故预测粘度的模型是有意义的。由t检验结果可见(见表4),所有自变量P值都远远小于0.01,说明这些性质都对原油粘度有显著影响。
为了消除原油自变量之间“共线性”,除了利用逐步线性回归法(SR)还可以利用主成分回归(PCR)和偏最小二乘法(PLS)两种线性方法。两种回归方法在预测粘度模型建立过程中都必须选取最优主成分因子数(Number of Components,ncomp),通过优化算法,选取结果分别见图5和图6,通过图可以看出,主成分回归的ncomp为5,偏最小二乘法的ncomp为2。
以上四种方法均为线性方法,本文还利用非线性回归最小二乘法(NLS)和支持向量机(SVM)两种非线性方法建立预测粘度的模型。其中SVM为人工神经网络技术,具有较强的人工智能功能和模拟多元非线性体系的能力,与传统的线性回归技术相比,它不仅具有自适应和自组织功能,可以很好的描述复杂关系的内在特征。SVM利用训练数据(数据库中的原油性质、反应产物分布数据)和优化算法分别得到特征参数“gamma”为0.4和“cost”为4,模型的核函数选取“radial basis”。另外一种非线性方法NLS通过优化选取自变量x,建立粘度预测模型为:
数学模型中,Viscosity为原油的粘度,Carbon Residue为原油的残炭,Molecular Weight为原油的平均分子量。
最终,利用数据库中的原油性质数据和上述六种校正理论方法,分别建立了数学模型,然后利用这些数学模型分别对20种原油油样的粘度进行预测,预测结果比较见表5,通过表5中各种方法预测值与测量值的决定系数可以看出,人工神经网络方法支持向量机预测结果最好,其它方法也能够达到较为准确预测原油粘度的目的。
此外,通过图7也可以看出支持向量机预测粘度值与实际测量值接近,达到较好的预测效果。
2.2 原油反应产物分布预测
通过上述六种方法预测原油粘度的结果来看,都能较为准确的预测原油的粘度,其中以人工神经网络方法支持向量机预测(SVM)结果最为准确。因此,本文将支持向量机也利用于原油反应产物分布的预测,用于预测原油催化裂化汽油的分布。
同样,在数据建模过程中,原油催化裂化汽油产物分布作为模型的因变量y,13个原油关键性质(密度、残炭、平均分子量、元素含量(H,C,N,S)、H/C、金属Ni和V的含量、饱和分、芳香分和胶质)作为模型自变量x。
SVM利用训练数据(数据库中的原油性质、反应产物分布数据)和优化算法分别得到特征参数“gamma”为2和“cost”为4,模型的核函数选取“radial basis”,建立数学模型后,对32种原油的催化裂化汽油产物分布进行预测,预测结果与实际测量值的决定系数为0.96,两者之间的关系见图8。
从决定系数和图8中可以看出,通过人工神经网络方法支持向量机(SVM)建立的数学预测模型同样可以对原油反应产物分布有很好的预测效果。
3 结束语
1)利用化学计量学校正理论六种常见方法,将数据库中存储的原油性质数据作为训练数据,建立原油粘度预测模型,经过对六种预测模型的数学分析和比较,六种模型都可以对原油粘度进行准确的预测,其中以人工神经网络方法支持向量机预测结果最为准确。
2)利用人工神经网络方法支持向量机建立原油催化裂化汽油分布预测,同样可以达到很好的预测效果。从分析过程来看,如果要达到好的预测效果,要尽可能多的提供训练数据,如果训练数据过少,会影响到人工神经网络的预测效果。
摘要:该文通过收集整理原油实验室积累的大量有价值的原油评价数据,建立了原油数据库。同时,将数据库中的原油性质和反应产品分布数据作为训练数据,结合化学计量学校正理论,建立了性质与性质、性质与反应产物分布的数学关联模型。结果表明,利用各种校正理论方法建立的数学关联模型都有很好的预测效果,能够达到对性质组成和反应产物分布快速、准确预测的目的。
关键词:原油,化学计量学,校正理论,粘度,催化裂化R语言
参考文献
[1]Xu C,Gao J,Zhao S,et al.Correlation between feedstock SARA components and FCC product yields[J].Fuel,2005,84(6):74-669.
[2]史永刚.化学计量学[M].北京:中国石化出版社,2010.
[3]Kapur G S,Ecker A.Meusinger R.Establishing Quantitative Structure Property Relationships:(QSPR)of Diesel Samples by Proton-NMR&Multiple Linear Regression(MLR)Analysis[J].Energy&Fuels,2001,15(4):8-943.
[4]梁朝林,沈本贤,刘纪昌,等.用延迟焦化逐步回归法模型预测焦化产物的分布[J].华东理工大学学报:自然科学版,2009(2):91-185.
[5]Varmuza K.Introduction to Multivariate Statistical Analysis in Chemometrics[M].CRC Press,2009.
[6]褚小立,许育鹏,陆婉珍.偏最小二乘法方法在光谱定性分析中的应用研究[J].现代仪器,2007(5).
[7]Molina,Uribe U N,Murgich J.Partial Least-Squares(PLS)Correlation between Refined Product Yields and Physicochemical Proper ties with the 1H Nuclear Magnetic Resonance(NMR)Spectra of Colombian Crude Oils[J].Energy&Fuels,2007,21(3):80-1674.
[8]王斌会.多元统计分析及R语言建模[M].广州:暨南大学出版社,2010.
交通分布预测 篇6
此外, 电力系统负荷预测模型一般关注负荷时间序列的一阶矩, 即从数学期望层面上讨论, 而综合考虑时间序列的高阶矩预测模型则相对鲜见。这里所建的非高斯分布GARCH模型包含的条件方差方程, 为剖析时间序列二阶矩提供了平台。
1 ARCH模型简介
时间序列建模时常出现波动集聚现象。时序的二阶矩在某个时期密集地出现高值, 在某个时期密集地出现低值。这种异方差现象不可忽视。
1.1 标准GARCH模型
ARCH模型[9,10]通常可用于时间序列模型的随机扰动项建模。
对于模型均值的方程:
如果有
条件方差方程为
vt~i.i.d.N (0, 1) , 即vt服从正态独立同分布;α (B) 为滞后算子多项式;ht为εt的条件方差。需同时满足非负约束条件和二阶平稳约束条件。
GARCH模型[11]为广义自回归条件异方差模型。
引入滞后算子B, GARCH (p, q) 的条件方差为
其中, α (B) 为滞后算子, p≥0, q>0, α0>0, αi≥0, i=1, 2, …, q, θj≥0, j=1, 2, …, p。且满足模型的二阶平稳条件:α (B) +θ (B) <1。
一般参数p、q均取1的GARCH (1, 1) 模型即可描述大量时间序列的波动集聚效应。为和下述GARCH-t和GARCH-GED相区别, 本文称采用正态分布假设的GARCH模型为标准GARCH模型。
1.2 厚尾特征与非高斯条件分布
在很多应用场合, 随机过程的分布具有极厚的厚尾特征[12]。不仅εt的无条件分布是厚尾的, 甚至条件分布可能也是厚尾的。为了进一步增强刻画随机过程的分布厚尾的能力, 可以考虑将式 (1) 中的vt由服从正态分布扩展成为服从尾部较厚的非高斯分布, 如t分布和广义误差分布 (GED) 。
1.2.1 t分布
t分布在自由度为无穷时, 渐近变为正态分布;通常情况下则拥有比正态更厚的尾部。当模型中vt服从t分布时, GARCH-t模型比标准GARCH模型更适合描述具有厚尾特征的时间序列。
1.2.2 GED
GED概括性较强, 其概率密度函数为
当厚尾参数v=2时, GED退化为正态分布, v<2时, GED较正态分布有更厚的尾部。
1.3 ARCH效应检验
判断一个序列 (如模型残差{εt}) 是否存在ARCH效应, 最简便也是最常用的检验方法是拉格朗日乘子检验, 即LM检验。
1.4 模型参数估计
ARCH模型参数的估计方法主要有2大类:极大似然估计 (MLE) 和矩估计 (ME) [13,14,15]。似然函数可求时, 一般倾向于采用MLE。这里采用MLE。
通过最大化条件对数似然函数, 可得标准GARCH模型的参数估计。
当vt服从t分布时, 参数估计变为在自由度k>2约束下使条件对数似然函数最大化问题, 函数形如
当vt服从GED时, 其有待最大化的条件对数似然函数形如
其中, 厚尾参数v>0, 当v<2时, GED拥有比高斯分布更厚的尾部。
2 算例分析
现结合日用电量时间序列传统模型分析ARCH效应, 并在标准GARCH模型基础上建立了非高斯分布GARCH模型。最后, 将非高斯分布GARCH模型、标准GARCH模型以及传统的自回归移动平均 (ARMA) 模型作了综合比较。
2.1 数据
选用南京地区日用电量数据进行时序建模。样本空间为2002年1月至2004年5月。使用所建各种模型分别对2004年6月4个星期的日用电量数据进行预报, 以检验和比较各模型的预测能力。
2.2 GARCH效应分析
用电量时间序列建模均值方程采用乘法模型:
其中, Ttrend、Sday、Iday依次为趋势变动分量、季节变动分量、不规则变动分量。
2.2.1 趋势分量与季节分量的提取
趋势分量利用指数模型刻画, 表达式如下:
季节分量Sday的提取, 采用了文献[1]的日负荷数据广义季节调节技术。至此, 已获取Ttrend、Sday。
2.2.2 不规则分量建模
首先, 使用ADF test、PP test验证了Iday序列的平稳性, 确认ARMA建模前提是满足的。
参考Iday序列自相关函数 (ACF) 和偏相关函数 (PACF) , 比较可行阶的ARMA模型的赤池信息准则 (AIC) 和贝叶斯信息准则 (BIC) , 最终筛选出阶数最为适当的ARMA模型。
经权衡各个模型的AIC、BIC, ARMA (15, 19) 优于其他备选模型, 模型参数估计结果参见表1。
注:C为参数估计的截距项;AR (i) 、MA (i) 分别为滞后i阶的AR项系数、MA系数的参数估计。
本ARMA模型参数均显著, 信息指标良好, 但是如果考察模型残差平方时序的ACF, 可以观察到显著的相关关系, 即残差时序似乎是非独立的。
下面使用LM检验就此问题给出一个相对正式的统计检验。经初步计算, ARCH (1) 效应检验中LM值远高于临界值, ARCH (1) 效应是极为显著的。随后动态调节LM辅助方程的q值, 可以进一步分析ARCH (q) 效应的存在性。
不同q值对应的LM值绘成曲线如图1所示。由图1可见, 所有阶次对应的LM值均比较高 (即从低阶到高阶ARCH效应都是显著的) , 残差非独立。鉴于传统模型的同方差假设是不满足的, 方程残差的条件方差改为时变方差较为合理。
2.3 非高斯分布GARCH建模
残差的这种非独立性一定程度上可以用GARCH模型加以刻画。
模型均值方程定阶方法如前, 在反复比较大量备选模型之后, 可得新模型ARMA (15, 15) -GARCH。
使用MLE估计GARCH-GED、GARCH-t模型的参数 (标准GARCH模型的参数估计亦列于后, 以供比较) 。3种GARCH模型的均值方程参数估计见表2。
标准GARCH模型条件方差方程为
GARCH-t模型的条件方差方程为
同时估计得t分布自由度k=4.366 450, 显然具有比正态假设更厚的尾部。
GARCH-GED模型的条件方差方程为
其中, 厚尾参数v=1.204 462<2, 正符合GED拥有厚尾的情形。同时也为厚尾假设选取的合理性提供了依据。在这个问题上, 2种非高斯分布GARCH模型的结论是一致的。
由表2可见所有模型均值方程参数的显著性情况均良好 (条件方差方程亦然) 。并且本算例中, GARCH采用厚尾分布假设有数理依据, 可通过比较考核非高斯分布GARCH模型的预测能力。
2.4 预测结果
预测模型乘法模型形式为
其中, I!day依次采用ARMA、标准GARCH、GARCH-t、GARCH-GED模型的预测值。
分别使用上述模型进行样本外预测, 将4周数据的预测值和真实值对比, 计算出预测误差, 并归纳其统计特性如表3所示 (用GARCH-GED模型代称TtrendSdayIGARCH-GED模型, 余者类同) 。
其中, GARCH系列模型平均大误差归算方法为
式中j为ARMA模型中预测误差>3%或>4%
的诸点的序号。
通过表3的对比, 不难得出3点结论。
a.从平均误差指标看, GARCH系列模型均稍优于ARMA模型。其中GARCH-GED模型表现最好。
b.对比各种模型的最大预测误差, GARCH系列模型有一定优势。其背景是因为该最大误差是正在波动集聚的状态下出现的。模型的GARCH部分一定程度上捕捉到了这一信息。在大误差 (3%、4%) 抑制这项指标上, GARCH系列模型相对ARMA模型有一定改进, 且本算例中GARCH-GED表现最出色。
c.以GARCH-GED为代表的非高斯厚尾分布假设GARCH模型总的实际预测能力在均值意义上不逊于ARMA模型 (本文算例中略胜一筹) , 在一些统计指标上非高斯分布GARCH模型甚至略优于标准GARCH模型。考虑到厚尾假设模型参数估计中参数的显著性水平, 可以认为非高斯厚尾假设的选取是有理论依据的。
此外, 不容忽视的一点是, 非高斯分布GARCH模型不存在同方差假设问题的建模瑕疵, 从数学严密性角度看, 同样具有较完善的理论背景。
3 结论
基于对负荷时间序列ARCH效应的研究, 在为负荷时间序列建立标准GARCH模型基础上, 从vt角度扩展了GARCH模型, 并建立了非高斯分布GARCH模型 (GARCH-t、GARCH-GED) 。算例表明, 所提出的非高斯分布GARCH模型预测能力良好。
此外, 标准GARCH模型可归于GARCH-GED的一个特例情况 (v=2) 或GARCH-t (自由度k∞) 的极限情况, 非高斯分布GARCH模型 (如GARCH-GED) 比标准GARCH模型具有更为细致地刻画尾部特征的能力, 模型概括性更强, 适用范围更广。
总之, 基于非高斯分布GARCH模型为电力系统短期负荷预测提供了一种思路, 理论层面设计较为完备, 具有一定的实际应用意义。
摘要:提出一种基于非高斯分布的广义自回归条件异方差 (GARCH) 模型的短期负荷预测方法。在论证自回归条件异方差 (ARCH) 效应存在性的基础上, 将标准GARCH模型的正态条件分布假设推广为非高斯条件分布的形式 (t分布、广义误差分布) 。用极大似然估计获得ARCH族各模型的参数估计, 建立了非高斯分布假设GARCH模型 (GARCH-t, GARCH-GED) 。比较了ARMA、标准GARCH、非高斯分布GARCH模型的预测能力, 分析平均预测误差、最大预测误差能力等指标显示GARCH-GED模型表现最出色。算例表明, 基于非高斯分布GARCH负荷预测模型是有效而可行的。
交通分布预测 篇7
关键词:电压协调控制,模型预测控制,分布式模型预测,辅助问题原理
0 引言
电压稳定控制是保证电力系统正常运行的重要手段,是一个多目标的全局优化问题,需要有效的控制策略[1,2]。随着计算机和通信技术的发展、系统建模方法的完善及高效的优化求解方法的出现,使得模型预测控制(MPC)理论在电力系统控制领域逐渐受到重视,已取得的研究成果表明其具有解决电压协调控制问题的潜力[3,4,5,6,7,8]。
传统的MPC是一种全局集中控制技术,需要全系统的数据。电力系统规模庞大,某些敏感区域的模型数据可能难以获得,并且优化问题求解的复杂度与系统规模有关。随着分布式计算及通信技术的发展,非集中式的MPC技术受到了重视。文献[9]提出了一种基于协作的分布式MPC算法,并将其应用于电力系统自动发电控制。文献[10]利用拉格朗日分解技术,提出了一种电压紧急控制方案及分布式求解格式,采用拉格朗日函数来处理边界约束,由于仅使用线性项,在系统规模扩大后会存在收敛问题。本文基于MPC理论对分布式电压协调控制进行了研究。
1 电力系统电压稳定控制
本文主要针对中长期电压控制,通过系统范围内的电压协调控制,防止崩溃发生。控制的目标是:控制所有母线电压在合理的范围内以及实施的控制代价最小。
进行电压协调控制主要包括协调的无功电压控制、切负荷与无功电压控制的协调。合理运用自动电压调节器(AVR)、静止无功补偿器(SVC)等控制方法的作用,可以极大地减少切负荷的损失[11]。具体来说,对控制方案作如下考虑:①主要考虑在AVR和SVC等连续控制及其他无功电压控制措施,为简单起见,离散控制按连续变量考虑,取距离最近的离散值来近似;②考虑到重要性及对可靠性要求,协调的切负荷措施作为独立的系统保护方案,只有在其他控制措施无法阻止电压失稳时才使用;③进一步,可以考虑合理的有功功率控制措施,如自动发电控制、高压直流输电的支援等。
2 电压协调控制的关键问题
预测模型、价值函数及优化求解是MPC的基本组成部分[4]。
2.1 预测模型
电力系统模型由以下微分代数方程组描述:
式中:x为状态变量;y为代数变量;u为控制变量;h(·)表示系统中的限制,如发电机励磁系统限制、SVC容量限制等,均可直接计及。
为简化计算,中长期电压稳定性可忽略发电机等元件的快动态,采用准稳态模型。由于负荷在电压失稳中的重要性,因此负荷恢复动态应予以考虑。
为满足在线使用的要求,采用线性—离散化预测模型[5,6]。在当前状态(不一定是平衡点,记为(x(k),y(k-1),u(k-1)),k为采样时刻),对式(1)进行线性化;进一步,对线性化方程离散化,本文采用梯形法进行离散化。经整理,可得整个预测区间的预测模型为:
式中:
此处只需与电压幅值相关的预测方程,即变量y由母线的电压幅值组成。为防止优化问题无可行解,引入松弛变量s使电压幅值的约束转化为软约束,满足如下关系:
式中:ymax和ymin分别为y的上、下限。
电压控制量及其变化速率限制为:
式中:j=0,1,…,N-1;umax和umin分别为控制变量的上、下限;Δu为控制变量调整量;Δumax和Δumin分别为控制变量调整量的上、下限。
2.2 MPC模型
MPC模型的目标函数J为:
式中:
式(5)等号右边第1项用于惩罚母线电压违反约束;第2项用于惩罚控制量变化速率;第3项用于惩罚控制量的大小,主要用于切负荷。由于切负荷控制单独考虑,可去除第3项。文献[7]中阐述了目标函数中惩罚矩阵选取的一般原则。基于MPC的电压控制问题是由目标函数(式(5))及式(2)~式(4)构成的二次规划问题。有关求解方法已经比较完善,有很多成熟的软件包可供利用。
3 分布式电压协调控制模型
基于分布式模型预测的电压协调控制依赖于MPC模型的分解及其分布式求解方法。
3.1 MPC模型的分解
MPC模型的分解,包括目标函数分解和预测模型的分解。假设系统由m个子系统组成,易知目标函数(式(5))可直接分解为如下形式:
式中:下标i表示该变量属于子系统i;Jloc,i为由J中仅与子系统i的变量相关部分组成。
采用分解协调法[12,13,14,15]进行预测模型的分解,通过复制边界节点及相应的变量,将系统直接分解成多个相对独立子系统。以图1(a)所示的两区域系统为例进行说明,区域i,j通过边界节点A和B相连,VA∠θA和VB∠θB分别为节点A和B的电压相量。复制节点A和B,相应的变量也进行复制,记为VA′∠θA′和VB′∠θB′,满足边界约束VA∠θA=VA′∠θA′及VB∠θB=VB′∠θB′,见图1(b),分解后的系统与原系统等价。同理可实现多区域的分解。
对于图1所示系统,区域i和j的连接变量为节点A和B的电压相量,定义yrji=T为区域i关于区域j的输入变量,yoji=T为区域i关于区域j的输出变量;yrij=T和yoij=T分别为区域j关于区域i的输入及输出变量,说明示于图2。
分解后子系统i(i=1,2,…,m)表示如下:
式中:yri为区域i的输入变量,由yrji(j∈Ni)组成;Ni表示与i直接相连的子区域。
对式(7)进行线性化及离散化,可得子系统i在预测区间的预测模型为:
式中:
该子系统需满足边界一致性约束:
式中:
此时,原控制问题等价于由目标函数(式(6))及式(3)、式(4)、式(8)及式(9)构成的优化问题,除式(9)外,所有约束均是子区域内部的隐性约束,目标函数是仅与所在子区域的内部变量有关的区域目标函数。
3.2 辅助问题原理及分布式求解方法
利用增广拉格朗日函数法,将式(9)从约束集中移去,以二次项和线性项的形式添加到目标函数中:
式中:
(11)
γ为惩罚因子;
进一步,根据辅助问题原理(APP)[13,14,15,17],辅助函数F(z)的一般形式如下:
F(z)=K(z)+〈εJ1′(z*)-K′(z*),z〉 ε>0 (13)
式中:
构造仅与边界变量相关的二次型核函数[15,17]:
为简单起见,取ε=1.0,二次型核函数保证了ε=1.0时算法的收敛性[17],根据APP的两层算法,经过推导可得2层迭代格式。对于第p+1次迭代,第1层问题由如下m个独立的子问题组成:
式中:
第2层问题可直接求解下式:
式中:i=1,2,…,m;j∈Ni;ρ>0。
各参数满足:γ≈ρ≈β/2,按此原则选取各参数,可取得更好的收敛效果[13,14]。至此,原MPC问题可通过2层结构实现并行协调求解:在第1层中,各子问题在各区域并行独立求解,只需求解后交换连接变量信息;在第2层中,按式(16)更新拉格朗日乘子。分布式电压协调控制结构及求解步骤见附录A。
4 仿真计算
本文分别采用IEEE 9节点改进系统(见附录B图B1)和新英格兰39节点系统(见附录C图C1)进行仿真测试。仿真中,预测步长tp=0.5 s,预测长度N=6,采样周期Ts=3.0 s。取惩罚矩阵Qs和QΔu对角元素分别为50和1,体现了首要的控制目标是把母线电压控制在要求的范围内。分布式求解方法中,γ=ρ=0.3,β=0.6,收敛精度ξ=0.001。动态负荷采用综合指数恢复负荷模型[18],其中,有功功率、无功功率静态电压特性指数αs和βs均为0,有功功率、无功功率暂态电压特性指数αt和βt均为2.0,有功功率、无功功率自恢复时间常数Tp和Tq均为8.0。优化问题及其求解通过MATLAB v7.5实现。
4.1IEEE 9母线改进系统仿真结果
IEEE 9母线改进系统结构和参数附录B。系统中的电压控制器包括同步发电机的AVR和SVC,母线电压要求范围为0.90~1.15(标幺值)。扰动为线路6-9在0.5 s发生断线,若无其他控制措施,随着负荷的恢复,在约42.5 s时发生电压失稳,母线6的电压响应见附录B图B2。
图3所示为分别基于集中式MPC与分布式MPC进行控制的系统电压响应曲线。2种协调控制方式下的控制输入(电压参考值)序列如图4所示。
由图3和图4可见,通过协调控制可维持较高的系统电压,有效地防止系统电压失稳,分布式MPC方案可以获得与集中式MPC方案相似的控制效果,分布式MPC方案平均一个控制周期的计算时间约为0.85 s,能满足中长期电压控制的要求。仿真结果表明,协调控制并未严格地使所有母线电压在0.90~1.15(标幺值)之间,这是由于线路6-9断开后,系统对母线6的传输能力降低很大,母线6电压的控制主要由发电机G1承担,发电机G3及SVC对其控制能力很弱,即使实施很大控制量,对提高母线6电压效果并不明显,母线电压软约束使得提高母线电压的同时,防止控制母线电压过高。
4.2新英格兰39母线系统仿真结果
新英格兰39母线系统结果和参数见附录C。系统中的电压控制器是同步机的AVR,母线电压要求范围为0.90~1.15(标幺值)。扰动是母线2-3间线路在1.0 s发生断线故障,随着负荷的恢复,若无其他控制措施,系统将会在约55 s时发生电压崩溃,系统电压响应见附录C图C2。
图5所示为基于集中式MPC和分布式MPC方案进行控制的系统电压响应曲线。可见,通过协调控制AVR,能有效地防止电压失稳,采用分布式MPC可获得良好的控制效果。分布式MPC方案平均一个控制周期的计算时间约为2.46 s,能满足中长期电压控制的要求。
在目标函数(式(5))中,用动态仿真的结果代替预测结果,评估系统的实际动态性能,记为Jstage。2种控制方式下Jstage变化曲线如图6所示。进一步表明通过协调控制,能很快减小甚至消除违反的约束,基于分布式MPC的电压控制可取得良好的控制效果。
4.3 分析与讨论
在本文电压控制问题的模型中,计及了与电压稳定相关的主要动态及约束,其他相关模型及约束可直接考虑,特别是动态负荷模型;除了仿真中涉及的SVC和AVR,其他措施能直接考虑进来,在问题的描述和求解上没有本质的不同。可直接处理各种约束及控制措施是MPC一个突出的优点。
在基于分布式MPC的电压控制问题中,各子系统的预测模型只与区域内的系统模型及参数有关,不必知道其他子系统的确切模型及参数,当某子系统内部结构发生变化时,只需对本区域的模型进行调整,不需要通知周围其他子系统,提高了模型预测控制的灵活性和安全性。
分布式控制算法可在各分区并行计算,各分区只需要本区域的数据及边界数据,这使采集的数据量减小,避免了电网数据的跨区域采集及传输,真正做到了电网数据采集及计算的分布式进行。随着系统规模的扩大,分布式算法在数据传输、处理及优化求解上的优势会越来越明显。
5 结语
本文从集中式MPC模型出发,利用分解协调技术及APP构造了一种分布式MPC模型,提高了控制方式及求解的灵活性和安全性。基于典型系统的仿真结果表明:基于MPC的电压控制方案可以获得与集中MPC电压控制相似的控制效果的同时,可有效地避免求解规模过大造成的维数灾问题。该方案能进行自动有效的调整控制,减轻系统紧张情形下运行人员的工作负担。
交通分布预测 篇8
根据经济和气象上的因素, 研究和分析电力系统负荷变化规律的历史数据, 继而提前推测出电力系统的符合需求, 称之为电力负荷预测。
电力负荷预测的结果直接关系到电力系统运行的安全性和经济性, 精准的电力负荷预测结果可以有效的帮助电力系统调度对未来负荷变化情况做出正确的估计, 继而指导工作人员合理的操作发电机组, 降低发电所消耗的能源及经济支出, 提高发电效率和经济效益。此外, 对电力网络的规划和建设也起着重要的指导作用, 以便提前确定新增发电机组的组装容量、时间、地点等信息[1]。
二、当前电力负荷预测方法存在的问题
电力负荷预测的常用方法有回归分析法、趋势外推法、时间序列外推法、灰色模型法、指数平滑法、专家系统法、模糊预测法、人工神经网络法、小波分析法等[2]。
这些电力负荷预测方法可以分为三类:一类是单纯以历史负荷或电量的数据寻找变化规律, 进而推演出未来的趋势, 如趋势外推法, 灰色模型法等;第二类是考虑历史数据的发展规律、变化特点及其相关因素, 如天气情况、经济形势、宏观调控等, 模糊预测法、神经网络预测法等属于这一类。第三类是组合上述各种单一模型的预测方法进行综合预测的方法, 这种方法近年来已成为研究中的热点。
但是, 这些预测方法仍然是集中式的预测方法, 预测的参考数据往往都是全局的数据, 而很少考虑全局内部各地区之间的不同与变化, 对于管辖范围大、负荷分散、负荷特性复杂的供电公司, 集中式预测方法的预测结果往往存在较大的误差。
三、分布式算法概述
分布式算法具有狭义和广义之分, 狭义的分布式算法就是在两个或多个软件互相共享信息, 这些软件既可在同一台计算机上运行, 也可以在通过网络连接起来的多台计算机上运行。广义分布式算法则是研究把一个需要庞大计算能力才能解决的问题分割成很多小的部分, 然后分配给许多计算机进行处理, 最后再将计算结果综合起来得到最终结果的方法。
分布式算法的核心思想是共享稀有资源、在多台计算机上平衡计算负载、把程序放在最适合运行它的计算机上。分布式算法可以发挥出世界各地成千上万的计算机的闲置计算能力, 其计算结果往往具有庞大的计算量。因此, 基于分布式算法的负荷预测方法可较好的解决电力负荷预测中计算量越来越庞大和复杂的问题, 并具有更好的预测精度。分布式算法具有分布性和并发性的特征, 但是缺乏全局状态知识和时钟框架, 非确定性因素大大提升, 还有可能引发计算密集性、数据密集性、通信密集性和可信计算问题。
四、分布式算法的实现途径
基于分布式算法的电力负荷预测就是将上级供电公司的负荷预测任务分解到下级单位, 各个下级供电公司电力负荷预测工作人员根据本辖区内的负荷情况、经济形式、天气情况、产业结构调整以及影响负荷变化的其它因素, 采用适合本辖区特点的预测算法对电力负荷进行预测, 并对预测结果采取必要的干预措施, 再将干预后的结果发送到上级供电公司, 上级供电公司对预测数据进行求和或修正处理, 最终得到全局的负荷预测结果, 大大提高了负荷预测的准确度[3]。
由于分布式系统执行中存在着较多的非稳定性, 设计一套分布式算法十分复杂和困难。分布式预测策略首先要解决的问题是历史数据和预测结果在上、下级供电公司之间共享和通信的问题。当前, 主要有远程连接数据库、电子邮件和FTP模式三种方式实现。
但是, 由于远程连接数据库的连接实现采用专用的光纤数据传输通道, 成本昂贵, 而目前互联网上各种形式的垃圾邮件和病毒邮件蔓延严重影响了电子邮件传输数据的安全性, 因而均不适合作为分布式预测通讯工具。
FTP文件传输协议是使用最为广泛的互联网通讯协议之一, 当运行FTP协议时, 用户即可连接到服务器上传或下载文件, 同时, FTP模式无需专用通信通道, 是目前进行分布式负荷预测的有效的实现途径。
五、结语
随着电力系统朝着智能化和数据海量化、高维化的方向不断发展, 单台计算机已无法承受电力负荷预测中庞大而复杂的数据计算量, 分布式算法是解决这一问题的有效方法, 有利于提高电力负荷预测的准确度。然而, 基于分布式算法的电力负荷系统的实现仍然较为复杂和困难, 也将是今后国内外学者研究的一个重点方向。
参考文献
[1]肖国泉, 王春, 张福伟, 电力负荷预测[M], 北京:中国电力出版社, 2000;
[2]东晓, 曹树华, 赵磊, 电力负荷预测技术及其应用[M], 北京:中国电力出版社, 1999;
【交通分布预测】推荐阅读:
交通量分布06-07
分布预测07-27
交通噪声预测08-05
交通流量预测08-06
公路交通量预测07-25
短期空中交通流量预测10-02
道路交通噪声预测模型10-02
交通量生成预测研究论文05-10
真菌分布07-17