动态组合预测

2024-07-25

动态组合预测(精选7篇)

动态组合预测 篇1

0 引 言

陕西省兴平市位于关中平原中部,渭河北岸,属黄河流域渭河水系,境内没有河流,渭河自西向东,从市境南部流过。兴平市水资源比较紧缺,在农田灌溉、工业及乡镇企业、城镇生活以及农村人畜生活供水方面,地下水占有相当大的比例,是兴平市的主要供水水源之一。随着国民经济的发展,水资源的需求将不断增大,兴平东城区和西城区均出现了地下水严重超采的现状,目前已经出现了“兴化漏斗区”这样较大范围的地下水水位下降区[1],漏斗区面积约为30 km2。为了合理开发、综合利用、科学保护地下水, 必须对地下水动态进行全面研究分析[2],并根据预测结果, 结合实际情况, 推演地下漏斗区的发展,制定相应的防治方案与保护措施,有效地实现对水位的调控,这对于解决水资源紧缺、保证居民生活用水、促进经济社会可持续发展具有重要意义。

1 变权组合预测模型简介

1.1 基本思路

在预测问题中,由于建模机制和出发点不同,通常同一问题有不同的预测方法,将这些不同的预测方法进行适当组合,便可形成所谓组合预测方法。组合预测的研究在目前预测方法领域中最为活跃,但对变权组合预测模型的研究却进展缓慢。变权组合预测模型的应用是提高预测精度、增强预测模型实用性的有效途径。变权组合预测方法是基于多种预测方法的组合预测方法,它的关键是变权系数的确定。由于变权系数是随时间变化的函数,所以确定变权系数就显得比较困难。首先要建立样本点的组合预测优化模型,求出各单项预测方法在各样本点的最优组合权系数;其次根据这些权系数确定各预测方法中“预测时点”的组合权重[3]。

1.2 符号说明

设对于某一预测问题,有n种预测模型(或者预测方法)f1t,f2t,f3t,…,fnt,并假设:

Yt为第t(t=1,2,…,M)期的实际观测值;

Kit为第i预测方法在第t期的加权系数,且满足i=1nΚit=1;

eit=Yt-fit为第t期第i种预测方法的预测误差;

ft=i=1nkitfit为变权组合预测方法在第t期的预测值;

et=Yt-ft=i=1nΚiteit为变权组合在第t期的预测误差。

1.3 样本点组合预测优化模型

求组合预测权重系数的基本原则是使样本点处组合预测误差最小。目前常用的确定变权系数的方法有以下3 种:①以相对误差的最大值达到最小为目标确定最佳变权系数;②以绝对误差和达到最小为目标确定最佳的变权系数;③以误差平方和达到最小为目标函数.这里采用组合预测误差绝对值最小的方法[4],考虑到权重系数自身的要求,得到如下组合预测优化模型:

{minJt=|et|=|i=1nΚiteit|sti=1nΚit=1,Κit0(t=1,2,,Μ)(1)

对所选用的预测方法,采用模型(1)进行求解,可求得该预测方法在各样本点的最优权系数Kit

1.4 预测时点组合预测权系数的确定

根据上述模型,实际上仅仅求出使组合预测模型的拟合精度达到最优的变权系数,而构建组合预测模型的目的是为了预测,需要确定预测时点的组合权系数,即Ki,M+j(i=1,2,…,n;j=1,2,…)。确定预测时点组合的方法很多,常用的有如下两种方法:

其中i=1nΚt,Μ+j=1,且Kt,M+j≥0。这种方法适合于观测样本量较少,或各方法在时点序列上的权系数无明显规律的情况。

(2)利用回归法拟合权系数函数W(t),如取W(t)=b0+b1t,然后确定各预测时点的组合预测权系数。其步骤如下:

①设第i种预测方法在各拟合时点的最优组合权系数为Ki1,Ki2,…,KtM;

②以Ki1,Ki2,…,KtM为样本,用回归模型求权系数函数W(t);

③当t=M+j时,计算各预测方法的组合预测权系数函数值Wi(M+j);

④将Wi(M+j)归一化,这时将得出t=M+j时各预测方法的组合权系数 其中Κi,Μ+j=Wt(Μ+j)/i=1nWi(Μ+j)。其中i=1nΚt,Μ+j=1,且Kt,M+j≥0。

本方法适合于观测样本量较多,且各方法在拟合时点序列上的权系数具有一定规律性的情况。

2 兴平市地下水动态预测

本文以兴平化肥厂区域地下水水位下降所形成漏斗区的059号观测井为研究区,该区历年地下水水位埋深见表1,可以看出兴平市地下水埋深的变化幅度较大,离散性程度比较高。为了检验变权组合预测模型的预测效果,本文利用实测资料,建立基于指数预测法、线性回归预测法及灰色预测法的变权组合预测方法的模型,对地下水动态进行预测研究。

2.1 预测数据与模型的选择

选取2000-2011年水位埋深数据作为样本点,并根据样本数据图(图1),选取了3种预测模型,即指数模型(f1)、线性回归模型(f2)和灰色预测GM(1,1)模型(f3)[5]。各模型的拟合方程如下(t=1,2000;t=2,2002;…t=12,2011)。

f1:Y=21.188e-0.0076tf2:Y=-0.1525t+21.173f3:Y=-25959e0.0081t+2615.8

2.2 变权组合预测

各模型的预测值与实际值比较如表2。由于灰色预测是从t+1年开始,因而各模型的拟合误差(表3)均从第2年开始的。

2.3 预测结果

根据模型(1)计算出各时点的最优组合权系数。由于各方法在时点序列上的权系数无明显规律性,因而采用了1.4节中介绍的第一种方法预测时点组合预测权系数。预测时点组合预测权系数如表4,最后计算得出预测值如表5。其中指数模型、线性回归模型、灰色GM(1,1)模型、组合预测模型的误差平方和分别为0.635 2、0.636 5、0.617 7、0.576 6。

从预测结果来看,拟合值与实际值的绝对误差很小,可以表明预测值的可信度(图2)。

3 结 论

变权组合预测模型是组合预测研究的重要课题之一。因为权重是时间的函数,预测精度将会得到提高,所以变权组合预测模型的预测结果会更接近实际。本文采用基于指数模型、线性回归模型、灰色GM(1,1)模型的变权组合预测方法对兴化漏斗区的地下水位埋深进行预测,相比4种预测方法的误差平方和,可以看出利用变权重组合预测模型比任意一种单一种预测方法的预测精度都要高、实用性更要强。

通过对兴化漏斗区059号观测井地下水水位埋深的动态预测, 可以看出近几年来该区域地下水水位埋深有逐年回升的趋势, 水资源量正逐渐恢复,到2016年内,兴化漏斗区的地下水水位埋深为18.57 m,相比2011年水位回升幅度为4%。利用此预测结果可以为区域地下水资源合理开发利用、地下水和地表水联合调度等提供依据。

参考文献

[1]柳娟.兴平市水环境污染控制研究[D].陕西杨凌:西北农林科技大学,2007.

[2]于春霞,徐建新.优化GM(1,1)模型在地下水水位预测中的应用[J].安徽农业科学,2008,36(12):4810,4819.

[3]藏淑英,冯仲科.变权组合预测模型的建立及其在区域生态风险中的应用[J].北京林业大学学报,2007,29(2):203-208.

[4]赵国忻,王明涛.一种变权重组合预测方法研究[J].西北纺织工学院学报,2000,14(3):226-232.

[5]王晶,张鹏.综合灰色和ARIMA的变权组合预测模型[J].河北电力技术,2007,26(增刊):21-24.

动态组合预测 篇2

近年来,风电场规模不断扩大,穿透功率和装机容量不断增加,由于风电具有间歇性及随机性的特点,大规模的风电接入给电网调度运行带来了新的问题,增加了电网调频的负担,风电对电网安全运行的影响日益显现。对风电功率进行较为准确的预测,可以使电力调度员及时调整调度计划及风电机组控制方案,从而减少系统的备用容量,降低电力系统运行成本,保证电力系统的稳定运行和供电可靠性,因此准确而有效的风电功率预测是实现风电常规化、规模化并网的关键[1,2,3,4,5,6,7,8]。

风能的随机性导致风电场输出功率波动幅度较大且波动频繁,给功率预测带来困难。现商用在线风电功率 预测系统 多采用基 于数值天 气预报(NWP)数据的预测模型,NWP是风电功率预测的重要输入,有效利用NWP的预报物理量(风速、风向、温度、湿度等)作为预测模型输入能得到较好的预测效果。目前采用的风电功率预测模型主要有物理模型[9]、统计模型[10]、人工智能模型[11,12]等,不同预测模型的不同输入变量从不同角度影响着模型的输出,从预测效果来看不同模型各有优缺点。单体的预测模型可能在特定的预测环境下具有较好的预测效果,但也会导致某些测量点出现较大的误差,并不能保证在所有情况下都能取得较好的预测结果。为了优化预测流程和提高预测精度,针对各种单体预测方法在理论上存在的固有局限性,采用综合多种预测模型的组合预测已经成为当前的研究趋势。

对适当的单体预测方法进行组合对提高预测精度有重要意义,根据组合预测方法的建模差异可将其分为4类,即结合数据预处理的组合方法、基于模型参数寻优的组合方法、结合误差处理的组合方法及基于权重系数的组合预测方法[13]。结合数据预处理的组合方法通过在基本预测方法前加入小波分解、经验模态分解等方法对数据进行预处理,从而改善预测效果[14,15,16];基于模型参数寻优的组合方法通过寻优算法实现对预测模型参数的选择和优化,如遗传算法[17];结合误差处理的组合方法通过对历史残差的预测从而改善预测效果[18]。以上3种组合方法的本质均是采用某种优化机制对一种单体预测方法进行改进,从而提高预测精度。

基于权重系数的组合预测方法以参与组合的单体模型的预测效果为依据,对几种预测方法得到的预测结果,以适当的加权组合方法得到组合预测结果,避免了某一个或多个因素对预测精度的集中影响。该方法通过利用一个附加的组合模型对若干种单体模型预测结果分配权重,实现对预测结果的优化,基于这一思路的组合方法现已成为组合模型领域的研究热点。从本质上来讲,组合预测方法的加权组合过程就是要确定各单体模型的相对有效性,并为其分配合适的权重系数以反映它们在组合模型中的重要程度,能充分利用各种单体预测方法的有用信息,克服单体预测模型的局限性,进而有效地减少较大误差的出现概率,消除单体预测方法可能存在的较大偏差,提高预测的准确性。其关键之处在于如何将各种预测方法进行适当的组合,并给出各种预测方法所对应的加权系数[19,20]。

国内外已有专家学者开始研究基于权重系数的风电功率组合预测方法。文献[21]在6种单体风电功率预测方法的基础上采用等权平均组合预测法、均方差倒数法和多层感知器(MLP)智能算法作为组合方法的融合策略确定各单体模型所占权重。上述方法对提高风电功率预测精度较为有效,但在确定组合模型权重时,仅通过简单的定权重组合预测模型,难以准确地表征风电场复杂的功率波动特性。文献[22]通过最大信息熵原则确定每个单体模型的权重建立组合预测模型。该组合模型在多数预测点的预测精度优于单体模型,但在建模过程中仅对基于神经网络的同类型模型进行组合,由于组合预测旨在结合不同类型的单体模型(如线性模型与非线性模型),提取不同类型预测模型的有效信息,从而实现预测优化,因此采用同类型模型进行组合可能会在组合过程中造成信息冗余。文献[23]将风电功率组合预测看做一个信息融合问题,利用交叉熵理论按支撑度大小变化,动态设置各个预测模型的权值,建立风电功率组合预测模型。由于尚没有成熟的方法求解最大熵和交叉熵问题,此外,对于交叉度的识别,交叉熵方法只能识别不同预测方法之间的交叉度,无法识别相应单体预测方法的预测偏差。当某两种预测方法预测偏差均很大且交迭程度很高时,此时将赋予此两种方法较大的权值,对组合预测方法的精度产生不利影响。

组合预测权系数的计算能通过许多途径实现,组合模型通常以其权系数确定方法命名。比如等权重组合模型、回归组合模型等。但是由于风电场所处环境特点具有时变性,在前一时刻得到的模型最优权重值并不一定对下一时刻是最优的。因此,恒定权系数的风电功率组合预测模型并不能满足实际需要。有必要采用动态变权重组合优化模型来实时跟踪环境的变化。基于此,本文利用两步动态优选组合的思路,通过3种不同的基于权系数的组合方法实现对单体预测模型的加权组合,然后在3种加权组合结果的基础上,利用基于可变向量遗忘因子的自适应指数组合模型动态确定上述各个组合预测模型的权重系数,对加权组合预测结果再次组合,建立以加权组合为基础的优选组合模型,优化预测结果,实现组合模型的优选,从而实时跟踪风电的动态变化,确保预测模型的效果始终保持较高的有效性和稳定性。

1 计及可变向量遗忘因子的自适应指数风电功率动态优选组合预测模型

基于权重系数的组合预测模型的通用表达式为:

式中:上标^表示相应量的预测值;为t时刻风电功率的组合预测结果为第i种模型t时刻的预测值;фi为对第i种预测模型所赋权重;M为组成组合预测模型的模型个数。

1.1 基于 Cook距离的自适应向量遗忘因子

遗忘因子λt是自适应过程的主要特点,对算法的动态跟踪能力起到决定性作用,对预测结果有重要影响,在应用于自适应过程中时,需要预先确定λt的值。

通过引入式(2)的损失函数来解决式(1)的回归问题。

式中:pj为j时刻的实测功率;为损失函数中第j组残差在t时刻的权系数,其中j<t;Φj为M维列向量,其元素为фi;fj为M维行向量,其元素为

利用t时刻得到的新观测数据,使算法能够合理跟踪输入数据统计特性的变化,引入遗忘因子λt,0<λt≤1[24]。遗忘因子λt主要用于决定新旧数据的权重,λt越小,加强新数据弱化历史数据的程度就越强,系统的跟踪能力越强;λt越大,加强新数据弱化历史数 据的程度 就相对弱,系统跟踪 能力越弱[25]。式(3)和式(4)给出了参数向量估计的迭代运算过程。

式中:为预测误差为增益矩阵预测值。

由式(3)和和式(4)可知的递归估计值与λt有关,适当的遗忘因子序列的选择对自适应过程有重要影响。在递归过程中,引入Cook距离有效评估新观测值对参数估计的影响[26]:

式中为未将遗忘因子应用于递归过程中时的值;为未将遗忘因子应用于递归过程中时的值,即t时刻λt=1时,权系数矩阵从的变化受t时刻得到的新观测值的影响为利用完全数据算得的单位权方差[26]。

Cook距离Dt利用非线性刻度来表示自适应遗忘因子λtCook,通过Cook距离与卡方分布概率进行估计,即

式中:Ht为Cook距离利用 卡方分布 计算得到 的值;χ2M为自由度为M的卡方分布。

如果新观测数据的Cook距离较大,则表明参数估计值会发生较大变化,因此λtCook应随之减小以实现对递推过程更快的自适应;反之如果新观测值的Cook距离较小,则表明参数估计是合理的,因此λtCook保持接近于1的值以提高自适应效率。

由式(6)可知,随着参数的不断变化,Dt增加,Ht减小。通过对其设置上、下限使其能够适应于递归过程的需要以及遗忘参数的要求,在自适应递推过程中减轻异常值的负面影响,从而确保自适应过程的稳定性,基于Cook距离的遗忘因子表达式为:

式中:λmin和λmax分别为Cook距离的最小和最大值。

然而,上述递归过程是根据参数变化的整体信息来决定一个适用于整个系统的遗忘因子从而达到跟踪时变参数的目的。但是对于参数变化各不相同的时变系统,需要针对系统中参数变化率的不同而采用相应的遗忘因子(λ1Ctook,λ2Ctook,…,λCMotok),以适用于不同的参数变化率。

将基于Cook距离的自适应向量遗忘因子λkCtook引入增益矩阵得到:

式中为一个由向量遗忘因子组成的对角矩阵。

λkCtook将新观测数据的Cook距离分解到每种加权组合预测模型中,由新观测值得到的第k种模型的Cook距离是:

式中其中ui为一个N维列向量,其第i个位置为1,其他位置 为

最后,通过Hkt=Pr(χ21>Dkt)将Dkt的值转换为遗忘因子,将式中的Hkt应用于不同的参数估计。

1.2 自适应指数动态优选组合模型

通过AFTER (aggregated forecast through exponential reweighting)算法[27,28]对不同预测模型进行组合可以得到较好的预测结果。该算法在权重系数的计算中,新近数据和历史数据同等重要,且对历史信息分配相等权重。因此,为适应组合预测模型中不同单体预测模型权系数变化率的时变特性,在AFTER模型的基础上,将基于Cook距离的自适应向量遗忘因子引入组合权系数的递归估计。通过自适应指数动态模型动态更新权系数矩阵,得到最终的功率预测值。该动态优选组合方法的具体步骤如下。

步骤1:初始化权系数矩阵 Φ、增益矩阵Γ 及向量遗忘因子λi,i=1,2,…,M。

步骤2:分别求得M种组合方法加权预测结果的误差序列e(i)=[e1(i),e2(i),…,et(i)],i=1,2,…,M。

步骤3:由t时刻得到的新观测信息,根据所得的t-1时刻的实际功率pt-1及加权组合方法i的预测值ft(i-)1,i=1,2,…,M,算得t-1时刻的误差et(i-)1,并根据式(8)更新增益矩阵Γ。

步骤4:在新信息更新的时刻t,根据式(10)至式(12)算得各模型在组合预测中的权重系数фj,t。

其中Ij,t-1的计算中 利用EWMA(exponentially weighted moving average)估计得到的条件方差为:

权重系数的计算过程中,针对不同权重系数参数估计采用不同的遗忘因子,其取值由新观测信息确定。在自适应过程中,当某种组合算法表现出持续稳定优越的预测效果时,该最优方法的权重趋于1,实现模型的优选。

步骤5:将t时刻更新的权重系数矩阵记为Φt,应用于优选组合预测。

步骤6:根据新观测信息更新误差序列,重复步骤3至5动态更新 Φt,直至完成预测目标。

2 自适应指数动态优选组合模型基本思路

利用两步加权组合的思路,在第一步组合预测结果的基础上通过基于自适应可变向量遗忘因子的风电功率预测优选组合模型动态确定模型权重,实现对预测精度的优化,其求解步骤如下。

步骤1:采用单体预测算法进行风电功率预测。

利用基于回归功率曲线优化(ORPC)模型[29]、最小二乘支持向量机(LSSVM)模型和极端学习机(ELM)模型的3种单体预测方法对某时间段内风电场输出功率序列进行预测。以上3种单体预测方法既有线性方法,又有非线性方法,并且综合利用了物理信息和统计信息。

步骤2:利用组合方法确定单体模型的权重系数,得到加权组合预测结果。

在历史数据的基础上,分别采用递归最小二乘(RLS)组合方法、协方差优选组合方法及MLP网络通过对单体预测结果分配其权系数实现对单体预测模型的组合,作为动态优选组合模型的基础。

步骤3:通过优选组合预测模型为加权预测结果动态分配权重系数,实现模型优选,得到最终结果。

由于无法预知步骤2中3种加权组合模型的有效性,因此利用Cook距离评估新观测值对参数估计的影响,将向量遗忘因子引入组合权系数的递归估计,根据新观测信息动态分配权系数,实现模型优选,从而得到最终的预测结果。

计及可变遗忘因子的自适应指数动态权重优选组合模型的算法流程如图1所示。

3 算例分析

本文以国内某风电场2014年6月的NWP数据和风电场实际出力数据为研究对象,采用本文给出的两步组合预测模型对单体预测结果进行动态加权组合。模型采用的NWP数据来自丹麦某气象公司,时间分辨率为15 min,并每隔1h(每4个采样时间间隔)利用新观测数据进行变权重计算。算例风电场的总装机容量为297 MW,图2是采用3种单体预测方法所得到的2014年6月某日的预测结果,风速和风电功率在该时段内波动幅度较大且波动次数较频繁。3种预测方法都能较好地预测出风电功率变化趋势,但某些点预测值与实际功率仍存在较大偏差,尤其是在5~9h输出功率突变到高水平阶段时,风电出力几乎达到了其额定功率,单体预测方法的预测结果较实际功率有明显偏差。

采用Q/GDW 588—2011《风电功率 预测功能规范》给出的均方根误差和平均绝对误差计算方法对预测结果进行误差分析,各预测模型的误差分析结果如表1所示。

ELM作为较新的网络预测算法,其预测最大误差发生在风电出力最低的时刻;ORPC的预测稳定性较好,其最大误差发生在风电功率剧减 的时刻;LSSVM引入了风速、风向和温度作为模型的输入,其平均绝对误差较ELM和ORPC有显著降低,但其最大误 差较大,发生在风 电功率剧 增的时刻。NWP作为风电功率预测系统的重要输入,在不同天气状况下预测能力差异较大,影响了单体预测模型的预测精度,由图2可知,采用不同的建模方法和输入变量的模型预测效果在不同时刻有较大差异。

组合预测中,首先分别采用3种加权组合方法得到对单体预测模型第一步组合预测的结果。图3中的3条曲线给出了第一步组合预测的绝对误差。

图3显示,并不存在某一种组合方法在整个预测时间尺度上均优于其他方法。例如在5~9h通过RLS组合方法对单体预测方法的组合能够得到较好的预测效果,在3~4h及15~17h采用协方差优选组合方法更贴近功率的变化曲线,而在大多数时刻采用MLP网络的预测误差较低,表现出最优的预测效果。而这些都不是能够事先预知的,因此需要一种二次优选组合算法,通过对预测结果动态分配权系数使得组合预测结果能够尽量贴近最优结果,实现模型优选。

在二次优选组合中,采用基于可变遗忘因子的自适应指数动态权重组合模型对第一步组合得到的3种预测结果进行再次组合,得到最终的预测结果。计算得到的自适应指数动态权重组合方法预测结果的绝对误差及预测结果曲线分别如图3和图4所示;两步组合预测的误差分析结果如表2所示。

由图3和图4可知,采用自适应指数动态权重组合方法得到的最终预测结果与第一步得到的最优组合结果十分接近,其绝对误差曲线在大多数时刻贴近第一步组合中最优组合方法的误差曲线,甚至优于最优组合方法的预测结果。在该日共96个预测点中,共有92个点的绝对预测误差在15%以内,占总数的95.83%,其中误差 在10% 以内的点 共80个,占总数的83.33%,误差在5% 以内的点 共43个,占总数的44.79%。因此,本文给出的优选组合预测模型能够通过动态分配组合预测模型的权系数实现对模型的优化组合,从而有效降低点预测误差。

单体预测模型是组合预测模型的基础,算例分析给出了当个别单体模型预测效果较差时,组合预测的误差分析,如附录A表A1所示。以其中的算例三为例,3种单体预测方法中,ELM和ORPC预测效果较差,LSSVM的预测效果最好。经过第一步组合,由于不同组合方法存在的差异性,无法保证3种组合方法均优于3种单体方法,如协方差优选组合方法的预测效果虽然优于ELM和ORPC,但比单体预测精度最高的LSSVM的预测效果要差。但是经过第二步的优选组合,预测误差不仅明显小于3种单体模型的预测误差,而且与第一步组合方法中最优组合模型的预测结果贴近,甚至能够进一步减小第一步组合中最优模型的预测误差,从而较好地解决了传统单步组合方法对单体预测模型的精度过于敏感的问题。

算法的执行效率是工程实际应用中必须考虑的因素之一。各预测方法对该风电场某日预测执行时间如附录A表A2所示,考虑到即使是相同条件下算法的执行时间也会有小的波动,表中的执行时间取各方法5次执行时间的平均值。可以看出,本文提出的优化组合算法经过二次组合虽然较单体方法和一次组合方法所需时间更多,但仍能保证在0.5s内实现预测,保证预测的实时性。

4 结语

风电场的输出功率在一定程度上呈现随机性和波动性的特点。单体预测模型会导致某些测量点出现较大的误差,组合预测模型可有效地减少较大误差的出现。

1)单体预测方法是组合预测的基础,其结果对组合预测效果有较大影响。本文将不同的NWP信息作为3种单体预测模型的输入,并综合利用了不同模型的预测优势,有效避免了采用相似的单体预测方法进行组合所造成的模型信息冗余。

2)本文基于两步组合的思想首先采用RLS组合方法、协方差优选组合方法及MLP网络对单体模型的预测结果进行组合,然后采用自适应指数动态权重组合模型对上一步组合得到的3种预测结果进行第二步优选组合,得到最终的预测结果。

3)基于可变遗忘因子的自适应指数动态权重组合模型将基于Cook距离的自适应向量遗忘因子引入组合权系数的递归估计。通过算例验证,二次优选组合得到的最终预测结果在大多数时刻与最优的预测结果相似,甚至优于最优的预测结果,具有一定的自适应能力,预测效果较为理想,可以减少较大误差的出现,提高预测精度。

动态规划组合程序 篇3

1.1 动态规划原理

在奥赛竞赛中最重要的算法则是“动态规划”, 现在是动态规划满天飞, 认为任何程序都可以用动态规划来解决。但是动态规划的两个基本前提却被忽略了, 即“最优化原理”和“无后效性”。动态规划所处理的问题是一个多阶段决策问题, 一般由初始状态开始, 通过对中间阶段决策的选择, 达到结束状态。这些决策形成了一个决策序列, 同时确定了完成整个过程的一条活动路线 (通常是求最优的活动路线) 。

初始状态→│决策1│→│决策2│→…→│决策n│→结束状态

动态规划的设计都有着一定的模式, 一般要经历以下几个步骤:

(1) 划分阶段:按照问题的时间或空间特征, 把问题分为若干个阶段。在划分阶段时, 注意划分后的阶段一定要是有序的或者是可排序的, 否则问题就无法求解。

(2) 确定状态和状态变量:将问题发展到各个阶段时所处于的各种客观情况用不同的状态表示出来。当然, 状态的选择要满足无后效性。

(3) 确定决策并写出状态转移方程:因为决策和状态转移有着天然的联系, 状态转移就是根据上一阶段的状态和决策来导出本阶段的状态。所以如果确定了决策, 状态转移方程也就可写出。但事实上常常是反过来做, 根据相邻两段各状态之间的关系来确定决策。

(4) 寻找边界条件:给出的状态转移方程是一个递推式, 需要一个递推的终止条件或边界条件。

动态规划的主要难点在于理论上的设计。确实动态规划的作用是非常大的。

1.2 一个动态规划题目

砝码称重:

设有1g, 2g, 3g, 5g, 10g, 20g的砝码各若干枚 (其总重≤1000g) , 要求:

输入:

a1 a2 a3 a4 a5 a6 (表示1g砝码有a1个, 2g砝码有a2个, ......20g砝码有a6个)

输出:

Total=N (N表示用这些砝码能称出的不同重量的个数, 但不包括一个砝码也不用的情况)

输入样例:1 1 0 0 0 0

输出样例:Total=3, 表示可以称出1g, 2g, 3g 3种不同的重量题解

按照第1种砝码、第2种砝码、……第6种砝码的顺序分析。在分析第i种砝码的放置方案时, 依次在现有的不同重量的基础上, 放1块、2块、……a[i]块, 产生新的不同重量。

1.3 程序分析

看上述动态规划方程:n0[n0[0]+1]=total│total=n0[j+k*weight[i], visited[total]=false, 1≤i≤6, 1≤j≤no[0], 1≤k≤a[i]

表面上看似乎是正确的。我把程序贴在下面 (用C++改写, 程序中还作了说明) :

程序中的问题有两处: (1) for (j=1;j

2 解决方案

2.1 改进方案

修改后的源代码如下:

程序中引入了新的数据结构PEIZHI和新的函数bool searchTotal (int i, int k, int w) , 解决了问题1“j值因为是按照递增规律, 可能以前并未算出, 而现在用来计算了”。而问题2“j值中的砝码重量和个数可能是以前计算过的, 现在又被重复计算了”只解决了部分。开始以为程序正确无误了, 但是仔细验证程序返回的每一个值时, 发现后面的几个是错的, 重复计算了。

2.2 引入组合

此题目只能用组合的方法来完成, 原来的int weight[]={0, 1, 2, 3, 5, 10, 20};//砝码的重量序列和int num[N+1]={0, 0, 0, 2, 2, 2, 0};//N种砝码的个数, 废除0位, 1-N。

可以把同一种类砝码的不同个数也看成是不同种类的, 这样就将二维问题降到了一维问题。很明显这是一个典型的组合问题。上网搜索发现一种组合程序只是计算数字组合的结果, 根本无用。还有一种组合程序可以, 出现过在信息学奥赛复赛试题上, 计算过程也是相当的繁琐, 3个函数嵌套调用, 且要传递多个参数, 这样的程序看到都会头痛。不知为什么引入了计算机教材中去了。万事万物皆复杂, 同时也皆简单。为什么呢?学过辩证唯物主义理论的人都知道, 无论多么复杂的事物, 在外部看来只是一个系统, 内部才是无数个要素, 如果细心计算每个要素对外发生的作用, 以及要素之间发生的作用, 如果要素个数很小, 问题不大。如果要素个数超过1千亿呢?那是无法计算的。但是如果只计算这个系统对外发生的作用, 那就很简单。

2.3 堆栈调用

这个程序是正确的, 比起教科书上的组合代码, 虽然繁琐一些, 但是看起来是简单明快。

用堆栈解决了原来的n-2个参数调用, 将参数转化成了数组, 这样就好处理了。全局变量的使用也是很重要的:

int n[1000];//堆栈使用的临时变量,

int stack[10000];int top=1000;

但还是太繁琐了, 而且每一个组合函数需要事先手工输入。于是又改进了一下代码将它的规模精简成了教科书的组合程序的规模。

2.4 最终代码

除了ONE () 和TWO () 函数无法归并, 其他都归并了。一个函数void组合 (int x)

比起以前的代码不但简单, 而且通俗易懂。代码编码的原则, 是正确、通俗易懂, 而且要快速。如果一个代码尽管运算正确而且很快, 但是代码深奥难懂因此含混晦涩。

3 结语

动态组合预测 篇4

电子商务产业发展快速, 阿里巴巴、京东商城、当当网、1号店等行业领先企业的发货量每年都高速增长。据发改委6月20日公布1-5月物流数据显示:2012年1-5月, 全国社会物流总额75.1万亿元。其中单位与居民物品物流总额增长明显, 达到26.4%;工业品物流总额68.6万亿元, 增长9.4%;进口货物物流总额5.0万亿元, 增长5.2%。高速发展的电商对物流业的要求越来越高, 而物流业的发展依赖于准确的物流量预测;随着经济一体化步伐的加大, 区域物流系统规划、管理等也依赖于准确的区域物流量预测。因此, 物流量预测越来越引起研究者的关注, 很多预测方法都被尝试用来预测物流量。灰色预测是一种应用广泛的时间序列数据预测方法, 但不加改进的独立地应用于物流预测时, 效果一般并不佳[1]。陈秀锋, 孟红 (2011) 将融合残差修正策略的灰色预测模型用于区域物流量预测中, 结果表明精度较原始算法有提高[2]。但由于物流量影响因素过多, 单一预测方法的预测精度难以满足高效物流业的发展需求。王丰效, 周伟萍 (2012) 将指数平滑法和灰色模型结合并用于奶类消费品人均消费量的预测上, 结果表明方法较单个方法有进步[3]。杨新仓, 李枫 (2012) 在对潍坊市的客运量进行预测时采用了灰色模型和回归分析模型的组合预测方法, 结果表明也能在一定程度上提高预测精度[4]。也有学者在进行物流量预测时将影响物流量的因素考虑进来, 并建立多元回归模型进行预测, 所得结果有一定意义 (陈德良, 王文科, 2009) [5]。由此, 组合模型应用于物流量预测得到了较多研究者的肯定;而组合模型成功运用的关键在于组合系数的确定。孙莹, 鲍新中 (2011) 在组合模型权重的界定上引用方差最大法, 结果表明预测精度得到很大程度提高。本文将在综合已有文献研究的基础上, 综合采用灰色预测方法, 指数平滑法和多元回归分析模型对广州市的物流量进行预测。

二、模型及实证

下面分别简要介绍灰色预测、指数平滑法、多元回归分析和本文构建的组合模型, 然后对广州市的物流量进行预测。数据来自广州市统计局, 由于物流数据统计的滞后性, 我们只找到1996-2008的广州市物流量数据;为了验证预测模型的精度, 我们训练样本截取1996-2003的数据, 测试样本选用2004-2008的数据。

1、灰色预测

灰色理论认为系统的行为尽管是模糊的, 数据是复杂的, 状态变化随机性大, 但它毕竟是有序的, 是有整体功能的, 这种系统产生的序列即为灰色序列, 或称为灰色过程;而以灰色序列建立模型称为灰色模型。灰色模型一经产生就在人口预测、股票预测等领域成功应用。用灰色模型预测物流量优点在于:不用考虑广州市物流量的影响因素, 该模型的所有影响因素都归在时间序列数据的波动之中。

我们根据历史数据, 最后建立广州市物流量预测模型为:

平均绝对百分比误差

根据此模型对广州市2004至2008年物流量进行预测, 结果如下:

2、指数平滑预测

指数平滑法又称指数加权平均法, 实际是加权的移动平均法, 它是选取各时期权重数值为递减指数数列的均值方法。指数平滑法通过某种平均方式, 消除历史统计序列中的随机波动, 找出其中的主要发展趋势。根据平滑次数的不同, 指数平滑有一次指数平滑、二次指数平滑、三次指数平滑和高次指数平滑。指数平滑法的具体应用, 一般可根据原数列散点图呈现的趋势来确定。如呈现直线趋势, 选用二次指数平滑法;如呈现抛物线趋势, 选用三次指数平滑法。或者, 当时间序列的数据经二次指数平滑处理后, 仍有曲率时, 应用三次指数平滑法。

指数平滑法的基本思路是:首先对原始数据作平滑处理, 然后根据平滑值进行预测。经过可视化分析初步判断, 广州市1996-2008年物流量的发展趋势是曲线增长的, 且呈现一定波动型, 因此选用三次指数平滑模型。

通过分析计算, 借助于matlab软件, 我们得到当α=0.8时, 残差的平方和达到最小;因此, 预测模型为:

平均绝对百分比误差

根据此模型对广州市2004至2008年物流量进行预测, 预测结果如下:

3、多元回归预测模型

多元回归分析成功应用的关键在于影响变量的选择和回归方程拟合的精度, 我们选择广州市地区生产总值、广州市第一产业生产总值、广州市第二产业生产总值、广州市第三产业生产总值、固定资产投资总额、房地产开发总额作为广州市物流量的影响因素。然后分别对这些影响因素做显著性分析, 找出与物流量有较强相关的因素。最后通过多种多元回归拟合方法, 确定最佳模型。

影响物流量的因素一般有广州市地区生产总值 (x1) 、广州市第一产业生产总值 (x2) 、广州市第二产业生产总值 (x3) 、广州市第三产业生产总值 (x4) 、固定资产投资总额 (x5) 、房地产开发总额 (x6) 。本文把它们作为自变量, 物流量为因变量, 建立多元回归预测模型。经过最小二乘法拟合, 得到回归模型如下:

平均绝对百分比误差

根据此模型对广州市2004至2008年物流量进行预测, 预测结果如下:

4、组合预测

组合预测的关键是确定各预测方法的权重, 接下来确定权重。记物流量实际观察值为yi (i=1, 2, …, n) , 有m种预测方法, 其预测值分别记为fij (i=1, 2, …, n, j=1, 2, …, m) 。设种预测模型的权重为wj (j=1, 2, …, m) , 为该预测问题在时刻i的预测值, 设第j个预测模型的方差为Dj, 则有

进行归一化处理, 那么此模型的权重

在本次问题中, i=5, j=3, p、t、r依次为前面三种模型的预测数据。同样借助于matlab软件, 计算得灰色预测、三次指数平滑和多元回归分析的权值分别为0.01、0.32、0.67;因此组合模型的加权预测结果的总体平均绝对百分比误差为:

与组合前三个预测方法的误差做比较:2.06%<2.1%<3.5%<19%, 由此推出本文构建的组合模型在广州市物流量预测中具有较高的精度。

三、结论

本文将灰色预测、三次指数平滑和多元回归分析按照0.01、0.32、0.67的权重进行组合, 结果表明预测精度最高。同时也可以看出, 灰色预测的权重最低, 说明针对物流量预测这个问题灰色预测效果不佳。多元回归分析的权重最高, 说明多元回归分析的预测结果相对比较有效;且同时显示物流量预测不能仅考虑物流量本身的数据, 要充分的将物流量的影响因素考虑进来。因此, 关于物流量预测的模型可从两个方向进一步改进, 一个是添加物流量的影响因素, 比如说区域人口数。一般来讲, 区域人口规模与区域物流量应有一定的关系。第二个是可将现代高维非线性预测方法引进来, 比如神经网络、支撑向量机等。

摘要:综合了灰色预测模型、指数平滑法和多元回归分析模型的特点, 根据预测方差最大组合系数最小原理建立了组合模型, 并对广州市的物流量进行了预测。结果表明, 组合模型的预测结果是最优的。

关键词:物流量预测,灰色模型,指数平滑法,回归分析,组合模型

参考文献

[1]罗永华, 何忠伟.基于灰色系统理论的茂名市物流需求预测分析[J].物流科技, 2010, (07) :19-21.

[2]陈秀锋, 孟红.灰色残差修正模型在区域物流量预测中的应用研究[J].商业时代, 2011, (32) :34-35.

[3]王丰效, 周伟萍.基于灰色模型和指数平滑的统计组合预测方法[J].喀什师范学院, 2012, 33 (3) :1-4.

[4]杨新仓, 李枫.组合预测模型在公路客运量预测中的应用[J].山西建筑, 2012, 38 (4) :1-2.

[5]陈德良, 王文科.多元线性回归模型在物流需求预测中的应用[J].中国物流与采购, 2009, (20) :66-67.

动态服务组合的研究 篇5

随着网络的发展,Web服务正逐步成为Internet网络环境中资源封装的标准形式,部署在Internet上的Web服务也在不断丰富[1],这些可被公共访问和集成的服务构成了一个潜在的巨大的标准组件库。因此,在Web服务互操作技术的基础上,提供高层的服务集成手段、实现服务组合成为Web服务技术发展的自然需求,大量研究从不同角度深入这个主题,本文简单介绍了目前服务组合技术的研究现状,并对其进行了总结分析。

1 动态服务组合的概念及特点

服务组合是指基于面向服务的体系结构,根据特定的业务目标,将多个已经存在的服务按照其功能、语义以及它们之间的逻辑关系组装提供聚合功能的新服务的过程,是面向服务的计算范型中实现资源聚合与应用集成的主要模式。与基于传统中间件的集成技术相比,动态Web服务组合技术具有如下特点:

1.1 支持对资源多种属性的表达

使用服务概念刻画和封装资源,不同层次的资源属性,如接口、行为、功能、质量、语义均构成Web服务描述框架的组成元素。

1.2 面向开放的网络环境

服务组合技术将需求与满足需求的具体对象进行分离,通过服务匹配机制将需求动态地绑定到满足需求的组件服务。

1.3 力图基于组件服务之间协同关系的高层描述实现零编程的服务集成

服务组合技术强调为组件服务之间协同关系提供显式的描述手段,即建立组合服务模型,并由支撑环境解释组合服务模型从而在组件服务之上施加特定的协同行为。

按照参与组合的组件服务的确定时机不同,服务组合分为静态组合与动态组合两种模式。在静态组合模式中,组合服务的功能由哪些组件服务完成是在设计阶段静态确定的,并且在组合服务运行期间不会更改。动态组合模式则在组合服务的运行期间通过服务动态地决定参与组合的组件服务,并允许在运行期间更换组件服务。动态服务组合不但可以通过选择性的重用已有服务降低服务开发周期和成本[1],实现组织之间灵活、高效的业务交互;在自动化组合方法的支持下,动态服务组合还可以进一步增加服务的响应能力,降低组合服务的运行管理成本。

2 动态服务组合方法

根据对于组合服务的不同理解,当前的服务组合研究可以分为以下三个主要流派:

2.1 基于业务流程的服务组合方法

该方法有三个基本模型元素:活动、控制流、数据流,其中活动对应于由组件服务执行的某个操作;控制流描述活动之间的依赖关系;数据流描述活动之间的数据传递。目前多数相关国际标准支持基于业务流程的服务组合,如BPEL4WS[2]、BPML[3]等。该方法的特点是:建模时多依赖于开发者对于问题的理解,自动化程度不高;模型与运行系统的映射直观,实现相对简单,实用化程度高。

2.2 基于组件协作的服务组合方法

该方法通过描述组件服务之间的消息编排(消息交换序列)来建模组合服务。这种组合方法着眼于消息交换行为,目前已有体现这一思想的标准化的工作[4],该方法与CCS、π演算等描述并发进程间通信的形式化手段能够建立直观的映射,从而支持组合模型行为性质的分析。但是由于组合服务模型定义了组件服务的行为,因此修改组合服务模型意味着对于组件服务行为设计的变更,因此它的灵活性相对较差,不太适宜于描述动态的服务组合场景,运行系统支持较弱,实用化程度不高。

2.3 基于规划的组合方法

该方法将经典的人工智能(AI)规划思想引入服务组合技术。对于基于AI规划的服务组合而言,初始状态与目标状态是用组合服务的需求来定义的,服务组合的过程就是从可选的组件服务中寻找一组服务使得该组合服务的功能能够满足组合服务的需求定义。目前这方面的工作主要是借助AI领域的经典研究方法,如情景演算、定理证明等,它对于运行系统的关注比较少,目前这一方法还处于理论、方法的研究探索阶段。

3 总结

本文介绍了三种动态服务组合的方法,其研究重点各有不同侧重,其技术特点和成熟程度也不同,但从总体上说,由于研究历史不长,服务组合的理论体系、工程方法以及实现技术仍不成熟,组合服务建模力量基础薄弱,模型分析技术贫乏,缺乏面向全局服务质量目标的组合方案,对于高效的组合服务协调机制的研究不足,这些都是后续需要解决的研究问题。

参考文献

[1]Fabio Casati and Ming-Chien Shan,Models and Languages forDescribing and Discovering E-Services(Tutorial),the International ACMSIGMOD Conference on Management of Data,Santa Barbara,California,USA,2001.

[2]F.Curbera,Y.Goland,and J.Klein,Business Process Execution Languagefor Web Services(BPEL4WS)1.0,http://www-106.ibm.com/developerworks/library/ws-bpel/.

[3]Business Process Management Initiative,Business Process ModelingLanguage v1.0,2002,http://www.bpmi.org.

动态组合预测 篇6

近年来, 泸州市大力实施“以港兴城”发展战略, 港口建设受到高度重视, 港口基础设施建设取得重大阶段性进展, 集疏运体系不断完善, 服务腹地延伸至川滇黔广阔区域。随着长江经济带发展战略和“一带一路”发展战略的深入实施, 川滇黔经济社会快速发展, 带动港口货物吞吐量持续快速增长, 2014年全港完成货物吞吐量达3134万t, 集装箱吞吐量达32万TEU。泸州港已成为川滇黔地区实力领先的枢纽港, 在完善区域综合运输体系, 带动腹地资源开发, 支撑沿江产业布局, 促进内陆开放型经济发展中发挥了重要作用。

泸州港的经济腹地以四川省、云贵北部、甘陕青藏部分地区为主。其中直接腹地包括泸州市所辖的四县三区;间接腹地包括成都经济区、川南经济区、滇北、黔北以及陕、甘、藏、青等几个西部省区的部分地区。成都经济区是泸州港重要的间接腹地, 也是四川省经济实力最强的地区, 2013年经济总量达1.6万亿元, 经济区以成都为核心, 已形成了装备制造、电子信息、化工等主导产业, 经济外向度高, 成都市2013年进出口总额达到506亿美元, 以汽车零部件、整车为代表的高附加值货种为泸州港集装箱、商品汽车运输带来了旺盛需求。

川滇黔矿产资源十分丰富。四川省铁、钛、钒、硫铁矿、芒硝、岩盐、玻璃用石英、石棉、石墨等32种矿产资源的保有储量居全国前5位, 钒、钛磁铁矿已查明储量和远景资源总量约90亿吨, 居全国首位, 川东北和川东南地区是重要的煤炭产区。滇北、黔北的习水、仁怀、毕节、昭通等地无烟煤储量丰富, 品质优良, 铁、磷、铅锌、硅石等均属大型矿床, 具有较高开发价值, 区域内农业经济作物也较为发达。总体上, 川滇黔地区以大宗散货为主的资源外运需求十分旺盛, 为泸州港提供了稳定的货源保障。

二、组合预测基本原理

组合预测法是对同一个问题, 采用两种以上不同预测方法的预测。它既可是几种定量方法的组合, 也可是几种定性的方法的组合, 但实践中更多的则是利用定性方法与定量方法的组合。组合的主要目的是综合利用各种方法所提供的信息, 尽可能地提高预测精度。

在进行港口预测时, 目前常采用的方法有时间序列法、回归预测法、灰色预测法以及产运销平衡法等方法。本次我们采用三次指数平滑预测法和回归分析法对泸州港吞吐量进行组合预测。由于2014年部分数据还未公布, 本次预测以2013年为基础年, 预测水平年为2020年和2030年。

三、三次指数平滑预测

指数平滑法是根据历史资料的上期实际数和预测值, 用指数加权法进行预测的一种方法, 此法实质上是由加权移动平均法演变而来的。其优点是只要有上期实际数和上期预测值, 就可计算下期的预测值。这样可以节省很多数据和处理数据的时间, 减少数据的存储量, 是一种实用的中、短期预测方法。

三次指数平滑法预测出的结果更精确。, 它认为数据的重要程度按时间上的近远呈非线性递减。即近期数据影响价值大, 权数亦大;远期数据影响价值小, 权数亦小。腹地经济在“十二五”期间飞速发展, 泸州港货物吞吐量在“十二五”以来也保持了15.32%的年平均增长率, 呈现高速上升趋势。设时间序列为X1, X2, X3, ……, Xn, 记St (1) , St (2) , St (3) 分别为第t期一次指数平滑值, 二次指数平滑值和三次指数平滑值。

指数平滑值计算公式为:

St (1) =a Xt+ (1-a) St-1 (1)

St (2) =a St (1) + (1-a) St-1 (2)

St (3) =a St (2) + (1-a) St-1 (3)

平滑系数a的确定:模型中的平滑系数a取 (0~1) 之间的一个数值, 若原数列波动不大, a取小值 (0.1~0.3) , 若原数列波动较大, a宜取大值 (0.6~0.8) 。考虑到泸州港货物吞吐量在”十二五”期间持续稳步上升、波动不大, 因此平平滑滑系系数数取取值值0.3

平滑初值的确定:, 指数平滑过程见表1。

三次指数平滑预测过程表

三次指数平滑数学模型为:

Yt+T=at+btT+ctT2

其中式中:

t为目前的周期序号;

T为预测超前周期数;

Yt+T为第 (t+T) 周期的预测值。

为了更加精确地预测2020和2030年本航段内的水路货物运输量, 本文采用的方法是:从2011年开始到2013年每年作一个预测, 最后将这3个值求平均得出最终预测结果, 即预测2020年和2030年的水路货物运输量为6021万t和13210万t, 详见表2。

三次指数平滑预测结果

单位:万t

四、回归预测

回归预测法是指通过确定两种或两种以上变量间相互依赖的定量关系, 来对因变量进行预测的一种统计分析方法。在本项目中, 我们将腹地范围内的国内生产总值经过汇总计算后设为自变量x, 将泸州港的货物吞吐量设为因变量y, 具体数据见表3。

对自变量x和因变量y进行回归分析, 得出回归方程如下:

y=-9.6585+0.0873x

通过分析, 腹地经济除四川省外, 在近几年均保持15%左右的年平均增长率, 同时结合腹地各地区的”十二五”国民经济与社会发展规划提出的经济发展目标, 预测2020年自变量x的值为55000亿元。但考虑到我国经济进入新常态发展期, 转变发展方式、加快转型升级的压力日益增大, 经济增速将由两位数高速增长逐渐转向一位数中快速增长, 预测2030年自变量x的值为100000亿元。据此, 通过回归模型预测出2020年和2030年的水路货物运输量为4793.78万t和8723.86万t。

五、预测结果

组合预测法是指建立一个模型, 把两个或两个以上不同预测方法得出的不同预测值通过适当的加权平均, 最后取其加权平均值作为最终预测结果的一种预测方法。在本项目中, 我们将三次指数平滑预测法和回归预测法得到的2020年和2030年得到的预测值按照“估计误差的方差极小”作为组合预测的最优权重确定准则, 以此求出最终预测值。即, 设Y为预测对象, 三次指数平滑预测法得出的预测值为Y1, 回归预测法得出的预测值为Y2, Y1和Y2均为Y的无偏估计, 三次指数平滑预测模型和回归预测模型的相关性较弱, 那么Y1和Y2的组合预测模型为:

Y*=k Y1+ (1-k) Y2

其中系数k=, e1为回归预测模型的估计误差;e2为三次指数平滑预测模型的估计误差;cov为协方差;var为方差;Y*为组合预测的估计值。Y*是Y的无偏估计, 而且组合预测值的估计误差e0的方差var (e0) 是比组合的单一预测值的估计误差的方差var (e1) 、var (e2) 要小。按照此种方法求出的系数k为0.104, 组合预测模型为:

Y*=0.104Y1+0.896Y2

三次指数平滑预测法依据水路货物运输量自身变化规律进行预测, 在短期预测时结果可信度较高, 但由于水路货物运输量增长的历史规律特点, 将导致中长期预测结果偏高。回归预测法根据水路货物运输量和腹地国内生产总值的历史变动规律进行预测, 对预测期内腹地经济发展、集疏运条件改善等有利因素均无法反映, 导致预测结果偏低。组合预测法按照“估计误差的方差极小”的最优权重确定准则, 确定出了三次指数平滑预测结果和回归预测结果在最终预测结果中的理论最优权重, 预测结果准确度较高, 即2020年和2030年最终预测结果为4921万t和9190万t。

参考文献

[1]邹俊善.现代港口经济学[M].人民交通出版社.

[2]张欣.组合预测模型在上海内河港口吞吐量预测中的应用[M].水运工程, 2007, (04) .

[3]黄荣富, 真虹.三次指数平滑法在港口吞吐量预测中的作用[J].港口管理, 2003, (02) .

动态组合预测 篇7

负荷预测是电力系统规划的重要组成部分, 其准确与否直接关系到电力系统的安全运行和经济调度, 准确的负荷预测便于更合理地安排电网设备调度及检修计划, 短期电力负荷预测更是在电力市场运营中占据着十分重要的地位[1,2]。

目前, 国内外专家学者对负荷预测问题已经进行了广泛而深入的研究, 开发了各种各样的负荷预测技术, 但没有任何一种方法能保证在任何情况下都获得满意的预测结果[3]。

当前使用组合预测难点主要在于单项预测模型的选择和各单项模型之间权值的确定。在以往的组合预测研究及应用中, 参与组合预测的单项预测模型往往没有经过筛选, 而是人为主观决定后直接进行组合, 文献[3]结论表明最优模型组包含的单项预测模型并非越多越好。

综上所述, 针对负荷变化的特点和已有方法的不足, 本文提出了一种基于有效度遴选和虚拟预测的负荷组合预测方法。

1 单项预测模型遴选

当参加组合的预测方法由n种增加到n+1时, 并不能保证一定会降低非负权重最优组合预测误差平方和。文献[4]采用排除冗余数据的方法, 从预测有效度的角度考虑, 确定最优模型组包含的单项预测模型。

根据有效度选择单项预测模型的过程如下:

步骤1:按照有效度公式对各单项预测模型进行评价, 并按有效度大小进行排序, 例如, 假设M (z1) ≥M (z2) ≥…≥M (zm) 。

步骤2:挑选有效度最高的两个预测模型z1和z2, 以误差平方和最小准则建立组合预测模型z12并计算其有效度M (z12) 。如果M (z12) ≤M (z1) , 表明单项模型z2的加入并没有使预测有效度提高, 说明z2为有效度冗余模型, 把它从单项模型中剔除;如果M (z12) ≥M (z1) , 表明z2的加入使得预测有效度提高, 保留该组合预测模型。

步骤3:将步骤2中得到的组合预测模型作为最好的预测模型, 继续加入余下的单项模型, 并进行有效度判断, 直到所有的单项模型判定完为止。最后所得组合预测模型即最终预测模型。

本文根据上述步骤, 在模糊预测法、灰色模型法、误差反馈加权时间序列法、回归分析法、BP神经网络法和最小二乘支持向量机中, 最终选取BP神经网络、灰色模型法和误差反馈加权时间序列法组成组合预测模型。

2 基于虚拟预测的负荷组合预测方法

虚拟预测是指对历史时间点的数据进行假定的预测, 预测结果被认为是历史时间点的拟合结果, 从而可以按拟合的效果做出各个单一方法的权重的判断。将预测日之前的历史数据进行整理分析, 其可分为历史时段和虚拟预测时段。本文构建的组合预测模型借助了虚拟预测应用在电力系统负荷预测上的基本思想。

组合预测模型通过利用各单项模型进行虚拟预测得到各单项模型的预测结果, 利用评价指标形成组合预测模型中单项模型的权系数。方差倒数法是一种常用的权系数生成方法, 使用预测误差平方和反映预测模型预测精度。对预测时段前的历史若干次等时长进行虚拟预测, 在同一时刻t预测误差平方和较小, 则认为单项模型在t时刻预测效果较好, 此单项预测模型在t时刻被赋以较高权重, 如下式所示:

式中, ;Ei, t为第i个单项预测模型进行的历史预测在t时刻的误差平方和;m为单项预测模型个数;n为预测时间长度。

根据前述有效度遴选, 本文选取BP神经网络、灰色模型法和误差反馈加权时间序列法组成组合预测模型, 可以得到虚拟预测模型的完整框架。

3 仿真分析

3.1 负荷准确率评价指标

经过有效度遴选, 确定由BP神经网络、灰色模型法和误差反馈加权时间序列法组成组合预测模型。其中, BP神经网络的输入除负荷样本外还考虑了最高温度、最低温度、降雨量和日期类型, 补充了时间序列模型和灰色理论模型的不足。

根据南方电网调度负荷预测管理与考核办法, 并结合地区电网的实际需求, 分别取日最大负荷准确率、日最小负荷准确率、日24:00准确率作为不同预测模型的评价指标。

3.2 实例分析

本文所使用的历史负荷数据 (2010—2012年) 由广东某地区电网提供, 是由数据采集与监控 (SCADA) 系统获取的实测负荷量, 所有数据的时间分辨率均为5min, 即一天拥有288个数据样本。该地区用电基数比较小, 处于300~1 000MW的规模, 同时存在着较多的钢铁用户, 其主要用电设备属于冲击性负荷, 与其他负荷的随机波动叠加在一起, 会造成电网负荷发生较大波动。

该地区负荷曲线呈现“三峰两谷”的变化趋势, 由于电网对工业用电实行峰谷电价, 鼓励多用低谷电, 因此炼钢厂、轧钢厂生产主要集中在凌晨0:00—8:00, 负荷曲线的每个拐点均为高频分量幅值较大的时刻。由实验结果可见, 本文所述的组合预测方法能准确地捕捉冲击毛刺的变化规律, 预测曲线比各单项预测更接近实际值 (图1) 。

4 结语

电力系统短期负荷预测是电网正常运行的基础, 对电力部门提高经济效益有着重要意义。针对该地区大量冲击负荷接入系统, 传统预测方法的预测精度已很难满足实际要求, 本文提出一种基于有效度遴选和虚拟预测的负荷组合预测方法。实验结果表明, 与单项预测模型相比, 本文所述组合方法能有效克服单一模型的缺点, 解决选择单项模型的随机性和权重难以确定的问题, 新方法具有更高的预测精度和更好的稳定性, 在相同负荷类型地区的负荷预测中值得推广借鉴。

参考文献

[1]廖旎焕, 胡智宏, 马莹莹, 等.电力系统短期负荷预测方法综述[J].电力系统保护与控制, 2011, 39 (1) :147-152.

[2]金鑫, 罗滇生, 孙广强, 等.中长期电力负荷预测模型筛选与组合方法[J].电力系统及其自动化学报, 2012, 24 (4) :150-156.

[3]高丙坤, 李阳, 许明子.优化粒子群算法在组合供热负荷预测中的应用[J].信息与电子工程, 2011, 9 (5) :655-659.

上一篇:报道环境下一篇:当代建筑工程施工技术