组合预测法

2024-08-15

组合预测法（精选12篇）

组合预测法篇1

一、引言

充足的资金是企业日常生产经营活动的保障。如何正确预测资金需要量是企业非常关心的问题。随着经济全球一体化,市场竞争背景日趋复杂,预测难度也越来越大,只采用一种方法无法进行准确预测,而多种预测方法可以减少信息失真度,提高预测的准确度。在预测领域的研究中,最引人关注的是组合预测模型。1952年,马科维茨将数理统计方法引入资产组合选择的研究中。1954年,Schmitt成功运用组合预测方法对美国37个大城市人口进行预测,使其准确度有了提高。1969年,Bates和Granger首次对组合预测法进行系统研究,其研究成果引起了预测学界的高度重视。1989年,国际著名的预测学术期刊《Journal ofForecasting》出版了组合预测法专辑,奠定了组合预测法在预测学中的重要地位。我国学者对组合预测的研究始于20世纪70年代,并于20世纪90年代进入热潮。毛开翼、周传世对组合预测方法中的权重确定进行系统研究;部分学者对评价预测准确度的指标进行了评论。唐小我、曹章修等相继在《预测》、《管理上程学报》等刊物上发表了一系列关于组合预测的论文,促进了我国组合预测的理论研究与应用的发展。组合预测已经成为预测领域中的一个重要研究方向,引起了众多学者的研究兴趣,但预测方法在实践中的运用有待加强。本文着重探讨资金需要量的预测模型,在实际运用中,必须结合企业的实际情况选择合理的模型并进行组合或修改,才能做出科学合理的预测。

二、传统资金需要量预测方法述评

(一)传统资金需要量预测方法

(1)因素分析法。因素分析法是以相关项目实际年度的年均资金需要量作为基础,对未来年度即预测年度的资金周转速度和生产经营的需求进行分析预测的方法。

资金需要量=(基期资金平均占用额-不合理资金占用额)×(1±预测期销售增加率)×(1±预测期资金周转速度变动率)

(2)销售百分比法。销售百分比法是根据敏感性因素与销售收入的增长关系来确定未来资金的需要量。此方法假设销售额与经营性资产、负债存在稳定的比例关系。企业凭借经验,根据行业情况和企业自身历史数据,剔除不合理的资金占用,留下与销售收入有稳定百分比关系的敏感性因素。根据敏感性因素与销售收入的关系来预计资产和负债额,以确定留存收益,进而确定筹资需要量。销售百分比法公式为:

其中,A表示随销售额变化的敏感性经营性资产;B表示随销售额变化的敏感性经营性负债;S1为基期销售额;△S为销售变动额;A/S1为敏感资产与销售额的关系百分比;S2为预期销售额;P为销售净利率;E为利润留存率;B/S1为敏感负债与销售额的关系百分比。

(3)资金习性预测法。资金习性预测法是依据资金与产销量之间依存关系将资金划分为不变资金、变动资金来预测未来资金需要量的一种方法。主要用Y=a+b X表示,其中,产销量为X,资金占用量为Y,a为不变资金;b为单位产销量所需变动资金。而a和b的确定有两种方法,一种是回归直线法,一种是高低点法。回归直线法公式为:

高低点法公式为:

(二)传统资金需要量预测方法存在的问题传统资金需要量预测方法过于抽象,考虑影响因素过于简单,且不具有现阶段经济大环境实用性,从而影响预测的精准程度。

(1)因素分析法。因素分析法虽然计算简便,容易掌握,但预测的结果却不精确。此方法除了考虑不合理资金占用额、预测期销售增减率和预测期资金周转速度变动率外,未考虑到资产价格变化等因素对资金需要量的影响。

(2)销售百分比法。销售百分比法易于使用,能为企业提供短期筹资管理所需的预计财务报表,但销售百分比法亦存在许多缺陷。首先,需要敏感项目稳定等假设条件具有很多局限性。一方面,通过主观判断和历史经验确认的敏感项目可能在预测年度因为各种未考虑因素并未随销售额的变化而变化,另一方面,即使敏感项目与销售相关,不同项目不同情况的相关程度也可能不同。其次,销售百分比法计算敏感性因素与销售额时按同一重要程度计算,但没有相应体现不同项目在不同情况下的重要程度。再次,其假设条件“基期与预测期的情况要保持一致”不实际,此假设包含两个时期的敏感因素划分、敏感因素与销售额百分比及销售结构和价格水平不变这三层含义。近年来,经济的变动、通胀及国家宏观政策的调整都不能使企业各个因素达到最优状态,因此,预测期敏感因素的划分必然会与基期不同,随之不同的还有敏感因素与销售额的关系。因此,假设条件中的情况基本不会出现,使用该方法并不能精确地进行预测。

(3)资金习性预测法。资金习性预测法是通过对企业资金与销售间的关系,掌握其资金习性,把资金划分为变动资金和不变资金两部分,对准确地预测资金需要量有很大帮助。但在分析资金需要量时,其与业务量线性回归分析的线性关系有可能并不符合企业的实际情况,并且没有考虑价格变动等影响因素。

三、资金需要量组合预测中单项预测改进

基于以上分析,本文对组合预测方法进行研究前,须对各单项预测即传统预测方法进行改进,使单项预测法在更精确的基础上进行组合预测以求预测结果的精准。

(一)对业务量因素考虑的改进由于产品的业务量容易受到宏观经济政策、市场环境及行业状况等因素的影响,销售额的预测可能得到一个不准确的结果。在传统资金需要量预测方法中,除资金习性法要求有多年的销售量数据外,其他均仅借助于基期业务量来预测,大大降低了预测的准确性,因此,建议至少考虑3年的业务量来进行预测,对于多时期业务量的处理,通常可采用算术平均法、加权平均法、几何平均法以及考虑货币时间价值因素后对各年业务量进行折现求和的净现值法等。具体方法如下:

假设企业预测期可能的业务量为S1、S2…Sn,则算数平均法公式为,加权平均法公式为,几何平均法公式为现值法公式为其中,S代表业务量,n代表数据年数,P表示赋予权重,i表示折现率,(P/F,1,i)表示第一年业务量的复利现值系数。利用现值法进行折现时,应注意考虑折现率中的通货膨胀因素。

(二)对通货膨胀因素考虑的改进2008年美国金融危机以来,通货膨胀的持续攀升使企业陷入经营成本、融资成本的不断增加及经营资金日趋紧张的不利局面。国家统计局公布的数据显示,2011年5月我国CPI同比上涨5.5%,涨幅连续5个月同比加快,创34个月来新高。随着通胀压力的加大,物价水平的不断走高,更加剧资源错配和泡沫程度,并冲击中低收入群体,使经济增速放缓。对企业造成巨大影响的因素有以下方面。

(1)企业资金的需求大量增长。通胀使企业对资金的需求量迅速增加。由于通货膨胀,物价快速上涨,与基期等量的存货就会占用过多资金,企业为减少因涨价而遭受的损失,会采取超额储备来储备原材料而获得收益,在此过程中,企业的资金占用量随之增加,那么资金需要量也相应增加。在通货膨胀时期,企业普遍缺乏资金,从而相互拖欠账款,使其应收账款增加,资金供求矛盾的尖锐,也引起资金需求的增加。在严重通胀期,如果仍按会计的历史成本计价法进行计量,会产生成本虚低而利润虚高的情况。企业要维持基期的正常生产,就必须追加资金。

(2)企业资金来源匮乏。为控制通胀,政府会采取提高存款准备金率等方式紧缩银根,从而减少整个市场上的资金量。在通胀率较高时,物价上涨的幅度往往高于利率上升的幅度。且在物价急剧波动时,生产的利润会远远小于投机的利润,因此,越来越多的企业囤积存货、购买外汇,这些投机活动使得闲置资金转化为信贷资金受阻,减少了信贷资金的来源。此外,物价急剧上涨时,利率也会随之飞速上涨,从而使各种有价证券价格暴跌,物价持续上涨也迫使银行在选择贷款对象时更加谨慎,条件更加苛刻。这将加大企业在资金市场上的筹资难度,并将许多财务状况不良的公司或小企业挤出资金市场。

因此,在通货膨胀严重的情况下,对业务量进行现值法折现时使用的折现率不能再使用同期银行贷款平均利率,应对折现率进行调整,利用公式:

其中,r名(名义折现率)是调整后的折现率,r实(实际折现率)是同期银行贷款平均利率,r通为通货膨胀率。

如果企业对未来资金量的预测时基于预算年度的水平消除了通货膨胀的影响,那么这种资金量称为实际资金量。包含了通货膨胀影响的资金量为名义资金量。二者的关系为:名义资金量=实际资金量×(1+通货膨胀率)n。

四、资金需要量组合预测研究

在传统资金需要量预测法尽可能克服其自有缺点后,利用组合的方法对传统方法赋予一个权重进行组合预测。为了得到更高精度的预测结果,许多学者对组合预测的权重系数优化问题进行了深入讨论,并且取得了一定成果。

(一)资金需要量组合预测设资金需要量预测问题在时刻t的实际观察值为yt(t=1,2,…,n),对此项预测问题有m种可行的预测方法,其预测值分别为fti(t=1,2,…,n,i=1,2,…,m)。又设m种预测方法的加权系数分别为ci(i=1,2,…,m),于是现有组合预测模型可表示为:

采用此式的目的是使组合预测值比单个预测值fti的效果更好,更加接近实际观察值yt。此模型可以轻易计算出组合的预测资金需要量,此时的预测值不仅考虑了传统资金需要量预测方法的各种因素,并对通货膨胀等因素也进行了充分考虑,但还未涉及其他的某些因素。

(二)资金需要量组合预测中其他未考虑因素组合预测中对资金占用、资金周转率、销售收入增减以及通货膨胀等因素进行了综合,但对于企业生命周期等其他影响资金需要量的因素却未曾涉及。企业的成长呈现出生命周期特征,组织结构、内部控制系统及管理目标在各个阶段都可能有差异。奎因和卡梅隆把组织的生命周期划分为四个阶段:创业阶段、集合阶段、规范化阶段和精细阶段。企业在这四个阶段应选择不同的资金水平。

(1)创业阶段。这一阶段是企业的幼年时期,具有较小的规模、较少的人员和较易的关系等特点。企业的所有者或管理者对若干下属实施直接控制,作出所有决策。企业所有者或管理者的素质决定着企业的生存与发展。此时,新产品前途未卜,产品类型、特点、性能尚在不断发展中,利润基本为零,资金非常紧张,资金需求量大。

(2)集合阶段。此阶段产品销量节节攀升,销售群扩大,员工人数增加,企业的前景被看好。与此同时,扩大的组织规模使得管理问题日趋复杂。在此阶段,企业的资金流动频繁、盈余少,具有一定的资金需求,资金周转率高。

(3)规范化阶段。此阶段开始出现竞争者之间的价格竞争。虽然市场巨大,但已趋于饱和。产品价格开始下降,毛利率和利润率都有所下降,利润空间适中。此时的企业具有一定的资金积累,盈利能力处于最高状态,企业开始出现闲置资金,资金需求量下降。

(4)精细阶段。在这一阶段,企业为了整体战略将原来分权的权力重新收回进行集权管理。为降低成本,产品质量可能出现问题,产能会出现过剩。虽然此时企业盈利能力开始降低,但前期资金留存量充沛,财务状况稳定,资金需求量不大。

企业在成熟后期,可能处理不了前阶段的问题而开始衰退;也可能通过组织变革进行创新等方式,获得再次发展的机会。此时是企业发展的一个瓶颈期,有可能进入资金需要量迅速下降或缓慢上升阶段。

除企业生命周期外,还有其他笔者未考虑到的能够影响企业资金需要量的因素,如价格变动、经济环境、政治环境、文化环境的变动等。可以引入以下模型来处理:

Y为最终计算的资金需要量值;β0为前述组合预测下计算出来的资金需要量值;X1i为第一个自变量(影响因素)的第i个观测值;β1为与X1i相联系的参数;Xki为考虑经济环境、价格变动等以外的其他因素,βn为与Xki相联系的参数,误差项ui为无法观测的随机误差或随机干扰。

以上模型为下式的简化表达式:

用矩阵表示为总体模型:Y=Xβ+u

此时,就得到一个综合性较高,更富有现实使用意义的资金需要量预测模型。对于此模型中的参数β1、β2、βk及ui可利用最小二乘法进行确定。

(三)相关参数的确定由于要估计误差u的值,因此需要引入残差。假设为估计值,y为实际发生值,e为某一时点实际值与估计值之间的残差。n为各个时点,当n=0时表示预测期。

(1)误差的预测。未来预测误差其分布为N

由于σ2=D(ui)对误差的估计为:

对于给定的显著水平α,由推出的置信水平为(1-α)的预测区间为:

通过查t分布表可算出误差水平的一个预测区间,最终对误差预测进行F检验以验证预测估计的正确性。

(2)对的预测。而的估计值则根据企业对xn所赋予的意义不同使得模型具有不同形式,当为非线性回归模型时,根据常见的幂函数变换、指数函数变化、泰勒级数展开等方式对此模型进行变换,最终变换为模型Y=Xβ+u的一元线性形式。对于参数β的估计有

的预测区间为N对β的预测如误差一样仍需进行假设检验,对于β的假设检验不像误差检验那么局限,可使用t检验、F检验等,在此不进行赘述。

五、结论

本文在对传统资金需要量预测方法改进的基础上,考虑了企业生命周期等因素对资金需要量建立组合预测模型进行综合预测。虽然本文考虑通货膨胀、企业生命周期等因素,但在建立的组合预测模型中仍有未考虑到的因素,虽然有误差项u来表示无法观测的随机误差或干扰项,但找出更多的影响因素x能使预测结果更为精确。因此,本文的研究有待进一步深化。

组合预测法篇2

基于熵权的福建粮食产量组合预测模型

本文尝试将组合预测法应用于福建省的粮食产量预测,以提高预测的精度.运用平均绝对百分误差(MAPE)等5个预测效果的.评价指标对各模型进行综合比较,结合熵权法客观地为每种预测方法分配权重;通过赋予合理权重,将各模型的预测结果加权求和得到最终的预测结果,建立了福建省粮食产量组合预测模型.利用1949-福建粮食产量资料进行拟合检验,组合模型的精度明显提高.

作者：张星吴菊薪陈惠谢怡芳 ZHANG Xing WU Ju-xin CHEN Hui XIE Yi-fang 作者单位：张星,陈惠,谢怡芳,ZHANG Xing,CHEN Hui,XIE Yi-fang(福建省气象局,福州,350001)

吴菊薪,WU Ju-xin(浙江省东阳市气象局)

刊名：中国农业气象 ISTIC英文刊名：CHINESE JOURNAL OF AGROMETEOROLOGY 年，卷(期)：2008 29(2) 分类号：P4 关键词：粮食产量组合预测熵权福建省

组合预测法篇3

关键词：国内旅游；变权；二次规划；组合预测

中图分类号 F59 文献标识码 A 文章编号 1007-7731（2015）05-06-04

Abstract：This article has presented the method of multi-step variable weight combination forecasting by considering many individual models. In order to analysis and forecast the number of domestic tourists. The research result shows that the proposed combination forecast method is more reasonable and scientific than each individual model. And it is also feasible.

Key words：Domestic tourism；Variable weight；Combination forecasting；Quadratic programming

1 引言

由于我国改革开放以来国民经济在各方面的飞速增长，带动了旅游业最近十几年的快速增长[1]。旅游需求预测在旅游业发展中具有重要的作用，而单一的旅游预测模型已经不能很好的预测旅游业的发展状况，因此急需一种新的预测游客量的组合预测方法，以便更加科学合理的规划和管理旅游地的相关工作[2]。

组合预测方法首次是由J.M.Bates和C.W.J.Granger于20世纪60年代末提出，他们给出了时间序列的2个单项预测，证明了这2个预测的适当的线性组合导致了一个比这2个单项预测更好的预测结果[3]。在早期关于旅游组合预测的文献中，R.Fritz，C.Brandon和J.Xander结合时间序列模型（自回归综合移动平均方法，ARIMA）和传统的计量模型预测了佛罗里达州的航空游客[4]。吴敬芳和洪星运用灰色GM（1，1）模型和线性回归组合模型建立了我国国内旅游人数预测的组合模型[5]。梅亮、葛世伦和高尚采用BP神经网络模型、GM（1，1）模型以及指数曲线模型组合后的非负权重组合模型对江苏省入境游客源进行了预测[6]。C.K.Chan，S.F.Witt，Y.C.E.Lee和H.Song利用工程技术中的CUSUM技术确定时间更新权重后用二次规划计算出组合预测值[7]。

本文研究的基础数据主要来源于《中国统计年鉴》（1995-2010），主要以国内生产总值、人口数及构成、国内旅游情况3部分数据为基础，将它们处理后导入PASW软件中分别进行三次曲线拟合，利用MATLAB对拟合后的数据进行多次求解二项规划得出所需的权重，并求出组合预测值，再与单项预测结果进行比较，最后根据此种方法预测出未来6a的我国国内旅游人数。

2 单项预测模型

根据《中国统计年鉴》（1995-2010）中的相关信息，对1994-2009年我国国内旅游情况原始数据进行整理，在综合分析国民经济影响范围的基础上，结合专家的指导意见，建立以下3个单项的预测模型（由于采用组合预测方法，所以单项预测模型必须多于一项），分别为我国国内旅游人数与时间关系的模型、国内旅游人数与全国人口模型、国内旅游人数与GDP模型。

由于2003年我国受SARS疫情影响，国内旅游人数明显下降，不符合常态分布，所以采用插值法对2003年的数据进行修正。

4 预测

4.1 各预测模型比较根据以上分析求出组合预测值和各单项预测结果进行比较，计算出各预测方法的年平均误差的绝对值（表4）。从表4可以看出，在与各单项预测模型的比较中，除n=2时组合预测值的年平均误差绝对值16.1大于国内旅游人数与全国人口模型15.3外，多步变权重组合预测法的平均误差最小，并且年平均误差绝对值的波动也相当最小，说明组合预测模型与单项预测模型相比具有更高的精度。

再分别建立国内旅游人数和时间关系模型、国内旅游人数和全国人口模型、国内旅游人数和GDP模型，求出相应的预测结果。最后，根据已建立的模型利用上述多步变权重组合预测法预测出2010-2015年我国国内旅游人数。

2010-2015年我国国内旅游人数时间序列三次曲线模型和变权重组合预测的比较结果。2010-2015年我国国内旅游人数是逐年增加的，这与1994-2009年的统计数据所呈现的规律相符。未来6a我国国内旅游人数的年平均增长率为12.7%、年平均游客量为30.419亿人次，预测数据具有合理性。

5 结语

综上所述，本文结合了国民经济的多个方面来预测未来一段时间的我国国内旅游人数，揭示了国内旅游人数和相关要素之间的关系，比使用单项预测模型精度更高，得出的预测结果更加准确。由于旅游业的发展受到多种因素的影响，但是本文的组合预测模型只选取了国民经济中影响旅游业的很小的一部分的相关要素进行分析，忽略了其他许多相关要素，因此，将来可以结合国民经济中影响旅游业发展的各部分因素组成组合预测模型进行进一步的综合分析。

参考文献

[1]王萍.基于人工神经网络的旅游需求预测与实证研究——以青岛市为例[D].兰州：西北师范大学，2004.

[2]胡柏叶，孙静春，刘哲松.考虑节假日因素影响的上海市月入境旅游人数预测[J].西安工程大学学报，2009，23（1）：98-101.

[3]J.M.Bates，C.W.J.Granger.Combination of forecasts[J].Operational Research Quarterly，1969，20（4）：451-468.

[4]R.Fritz，C.Brandon，J.Xander.Combining time series and econometric forecast of tourism activity[J].Annals of Tourism Research，1984，11（2）：219-229.

[5]吳敬芳，洪星.GM（1，1）模型和线性回归组合模型在旅游人数预测中的应用[J].现代商业，2008（15）：117-118.

[6]梅亮，葛世伦，高尚.基于非负权重组合模型的江苏省入境旅游客源预测[J].江苏科技大学学报：自然科学版，2007，21（4）：85-90.

[7]C.K.Chan，S.F.Witt，Y.C.E.Lee，H.Song.Tourism forecast combination using the CUSUM technique[J].Tourism Management，2010，31（6）：891-897.

[8]K. K. F.Wong，H.Song，S.F.Witt，D.C.Wu.Tourism forecasting：to combine or not to combine？.Tourism Management，2007（28）：1068-1078.

[9]张军谋.甘肃省入境客流量预测模型构建研究[J].旅游学刊，2010，25（11）：33-38.

[10]韩颖，黄小原，李丽君.多步变权组合预测法及其应用——以预测我国邮政收入及从业人员为例[J].东北大学学报：自然科学版，2007（7）：1061-1064.

组合预测法篇4

1 常用方法及其组合预测模型

目前, 建设用地需求量预测方法主要包括:指数平滑法、时序回归预测模型法、时序趋势预测模型法和时序灰色系统理论GM (1, 1) 模型法[1,2,3,4,5,6,7]。因果关系预测方法主要是回归分析, 寻求需求量与一个或多个自变量之间的线性关系, 有助于发现影响和改善需求的关键因素的方法, 但是所得到的回归预测方程往往只能考虑少数几种主要影响因素, 略去许多未考虑的因素。时间序列预测是根据变量自身过去的变化规律来预测未来的变化, 但是这种方法要求时间序列具有稳定的变化趋势。灰色预测方法是一种对含有不确定因素的系统进行预测的方法, 最适用于有增长趋势的需求预测[8,9]。组合预测是通过组合多个预测模型, 把多种预测方法所得到的预测结果进行综合, 得到更加全面的有用信息, 有效地减少了单个预测模型的一些环境随机因素的影响, 从而提高了预测的准确度。理论研究表明, 组合预测的预测误差不大于参加组合预测的各个单项预测方法预测误差平方和的最小者。此外, 组合预测具有自动排除冗余方法的功能 (冗余方法的权重为零) [10], 因此组合预测在土地需求预测中大有用武之地。

在组合的形式中, 非线性广义加权平均组合预测能够有效地提高预测的准确度。广义加权平均组合预测模型及其参数估计:设建设用地总面积实际值序列为Y (t) (t=1, 2, …, n) , 对其预测有m种预测模型, 其预测值分别为undefined;j=1, 2, …, m) 。又设m种预测模型的加权向量为W= (w1, w2, …, wm) T, 且满足ETW=1, W≥0, 其中E= (1, 1, …, 1) T, 则有广义加权平均组合预测模型为:undefined。寻求最佳的P与W使组合预测模型具有最好的拟合效果。这是一个二次规划问题, 最优解可通过二次规划方法求解, 求解步骤见文献[11]。

2 苏州市建设用地需求量组合预测研究

2.1 苏州市概况

苏州市位于江苏省东南部, 东临上海、南接浙江, 西抱太湖、北依长江, 是我国的历史文化名城和重要的风景旅游城市, 是长江三角洲重要的中心城市之一。全市土地总面积为8488km2, 建设用地1892.6 km2。2008年全市实现地区生产总值6701亿元, 按可比价计算比上年增长12.5%;工业总产值22103.47亿元, 全社会固定资产投资2611.16亿元。

注:数据来源于苏州市国土资源局《苏州统计年鉴》。

2.2 自回归 (ARMA) 预测模型

由于建设用地总面积具有较为稳定的总体变化趋势, 因此针对这种时间序列数据可根据变量自身过去的变化规律来预测未来的变化。借助Eviews5.0分析软件, 运用AIC、BIC信息准则进行模型选择, 对建设用地总面积最好的ARMA模型为AR (1) , 其预测结果见表2。

注:t=2, 3, …, n。R2=0.98、F=506.27、DW=1.508

2.3 生长曲线模型

近十多年来, 中国经济发展迅速, 沿海经济发达地区用地需求急剧增长。根据国情, 很多地方开始尝试保障社会经济健康发展和保护耕地并重的建设用地需求预测方法。有人将建设用地的预测方法归纳为总量测算法和定额指标法, 《深圳市土地利用总体规划》运用了生长曲线模型预测了特区建成区规模[12]。本文采用Logistic生长曲线模型预测建设用地总面积, 其数学表达式为:Yt=L/ (1+ae-bt) 。式中, Yt为t年建设用地总面积;L为建设用地总面积上限值;a、b为待定参数。根据SPSS15.0, 本文得到的模型为:Yt=37200/ (1+1.3229e-0.1016t) , t=1, 2, …, n。据此模型得到的建设用地总面积预测值见表2。

2.4 GM (1, 1) 灰色预测

GM (1, 1) 是灰色理论预测中应用最广泛的一种。预测模型:设K个时期土地的建设用地面积数列记为y (0) ={y (0) (1) , y (0) (2) , …, y (0) (K) }, 在此基础上对原序列进行一次累加生成新的序列y (1) ={y (1) (1) , y (1) (2) , …, y (1) (K) }, 则GM (1, 1) 模型相应的微分方程:dy (1) /dt+αy (1) =u。式中, α为发展灰数, u为内生灰数。根据GM (1, 1) 理论计算方法, 通过最小二乘法求解参数α、u分别为α=-0.06607、u=1220020, 代入微分方程并解得预测方程为:y (1) (K+1) = (1848409+18466012) e-0.06607K—18466012, K=0, 1, 2, …, n。灰色GM (1, 1) 预测数据不是直接从模型中生成的数据, 而是还原后的数据, 即y (0) (K+1) =y (1) (K+1) —y (1) (K) 。经过还原后对预测结果进行检验, 检验指标c=S1/S2=3.87E-06<0.5, 模型合格, 可用于预测 (式中, S1为原始需求序列与预测需求序列残差的方差, S2为原始需求序列数据的方差) 。预测效果见表2。

2.5 多元线性回归预测模型

据王万茂等[13]的分析, 影响建设用地总面积的主要因素有总人口、人均国内生产总值、工业总产值、全社会固定资产投资。以为建设用地总面积 (Area) 为被解释变量, 总人口 (Pop) 、人均国内生产总值 (GDP/Pop) 、工业总产值 (IG) 、全社会固定资产投资 (Inv) 为解释变量, 建立多元线性回归的数学模型为:

Areat=β0+β1Pop1t+β2GDP/Popti+β31IGp3t +β41Inv4t+β5Areat-1+ut, t=1, 2, …, n

经过Eviews5.0统计分析, 得回归预测方程:

式中, R2=0.997、F=398.74、DW=2.678。经检验该模型已无序列相关与异方差性, 可用于预测, 用回归预测方程得到的预测效果见表2。

2.6 组合预测模型

根据广义加权平均组合预测模型, 将四种单项预测组合, 通过寻优得到当p=6.901时, 广义加权平均组合预测模型的预测误差平方和最小, 此时求得的权重系数W= (0.0053, 0.0358, 0, 0.9589) , 因此得到的广义加权平均组合预测模型为:undefined。我们将它与其他单项预测模型的预测效果作比较见表2。根据平均绝对百分误差指标undefined, 在前四种模型中, 因果回归模型的预测效果最好, 依次是自回归预测模型、生长曲线模型、灰色GM (1, 1) 模型。广义加权平均组合预测能够提高预测的精度。根据各模型的权重, 他具有识别各个预测模型优劣的功能。本例组合预测取得了很好的预测效果。

在实践操作中选择单项预测模型应注意尽量选取不同类型并符合其适用条件的预测模型。基于此, 可以建立预测支持系统, 集成各种常用的预测模型, 再建立不同形式的组合预测模块。在实际应用时, 通过对数据进行一定的处理后调用不同的单项预测模型, 得到单项预测结果, 再输送到组合预测模块中, 最终输出的组合预测结果将具有很高的精度。

3 讨论

排列组合细节(插板法) 篇5

四个相同的求放入三个盒子，每个盒子最少有一个，总共有多少种方法？

盒子1 盒子2

盒子3

三个盒子插两个板，有三个位置。一共有С32=3钟。但前提是每个盒子至少放一个。

如果四个相同的求放入三个盒子，盒子可空不放，总共有多少种方法？可以分为三种情况：

0 0 4 0 1 3 0 2 2 1 1 2 С3A3

1С3 1С3

一共15种。如果用插板的话就会有两个空盒子的情况。两板重合。

解法来自一道题

x+y+z+w=100求这个方程组的自然数解的组数。

可以看成100个一样的球放在四个盒子里，盒子可空。把它转化为每个盒子至少有一个的情况（x+1）+（y+1）+（z+1）+（w+1）=104 这样可以用插板法了，一共有

С103 种方法。

组合预测法篇6

关键词：港口防波堤；沉降预测；灰色模型；BP神经网络

一、绪论

防波堤为阻断波浪的冲击力、围护港池、维持水面平稳以保护港口免受坏天气影响、以便船舶安全停泊和作业而修建的水中建筑物[1]。

由于防波堤砌体重量较大可达上100吨，再加上海浪以及由于海底的淤泥和沙质地质的综合影响，那么整个港口的防波堤在安装建设的过程中以及建成过后都会发生沉降，而且在实际交付使用的时候要求防波堤的堤顶高程要高于设定的高程才能安全的有效的防止海浪和有效的保护港口内的船只。

二、灰色模型与BP神经网络模型

防波堤的沉降影响因素不仅受堤体自重、海浪、海底地质等因素的影响，而且受其他的因素的影响；如：潮汐、日月引力、固体潮等因素的影响，这些参数在实际中有些无法测量或者实际应用中的精度没有考虑这些因素。这就导致影响因素的灰色性同时因为多影响因素所以可以采用神经网络模型灰色系统理论是由华中理工大学邓聚龙教授于1982年创立并发展起来的[2]。

BP神经网络属前向网络，但它采用的是反向传播的学习方法。BP网络是对非线性可微分函数进行权值训练的多层网络，主要用于函数逼近、模式识别、分类及数据压缩等[3]。

三、GM（1，1）处理沉降数据

以其中一点如C4点的沉降数据为例进行处理预测，共11期沉降数据，以前八期的数据作为灰色模型的原始序列然后对后三期的数据进行预测验证。

1、原始序列x（0）（k）=（x（0）（1），x（0）（2），x（0）（3），…，x（0）（n））进行一次累加生成处理得到x（1）（k）=（x（1）（1），x（1）（2），x（1）（3），…，x（1）（n））。其中的累加内核公式为：

x（1）（k）=∑ki=1x（0）（i），k=1，2，3…，n（3.1）

2、计算得出均值序列即对累加生成的序列x（1）（k）进行均值生成：Z（1）（k）=12[x（1）（k-1）+x（1）（k）]，k=2，3，…，n（3.1）

3、得到灰色模型的时间响应函数：

（1）（k+1）=（x（0）（1）-ba）e-ak+ba（3.3）

3.得到最终的响应式：

（0）（k+1）=（1-ea）（x（0）（1）-ba）e-ak（3.2）

4、采用最小二乘法计算a、b的估计值，这样可以得到最优的估计值，

通过计算得到=[a，b]T的最佳估计值。

5、由累减生成方法还原原始序列：（0）（k）=（1）（k）-（1）（k+1）；上述步骤可以通过matlab程序就可以得到前八期的模拟值以及向后预测三期的预测数据。采用均方差比值D来验证精度，D=S2/S1其中：后验方差比值D就为：误差的标准差与原始序列标准差的比值。

D=S2=1n∑nk=1E（K）-2S1=1n∑nk=1x（0）（k）-2（3.7）

得到D=02417，D小于精度标准的035，模型的精度为良好。

四、采用BP神经网络处理数据

在预测之前，为了数据处理更加方便快捷，需要将原始数据进行归一化处理。确定神经网络的结构模型，输入层为三个节点，输出层有一个节点，通过公式m+n+a，m为输入层节点数，n为输出层节点数a属于[1，10]之间的数，确定隐含层的节点数这里取四。用前8期数据作为输入样本，第九期、第十期和第十一期进行预测验证。

构建神经网络预测模型的核心思想可以概括为：第1、2、3期预测第四期第2、3、4期预测第五期，依次类推前八期为训练数据，后三期为预测数据。通过程序的计算得出整体的均方误差MSE为21773；误差相当大。主要是由于后三个预测值的影响。

五、GM（1，1）与BP神经网络联合

灰色模型具有良好的兼容性可以和其他算法模型进行兼容，同时神经网络模型本身也具有灰色性，所以两者可以进行联合的处理数据[4]。同时通过以上的灰色模型和BP神经网络模型对同一组数据的处理可以看出，两个算法在模拟计算时精度较高，但是在预测时误差就特别大。

采用BP神经网络的方法对灰色模型处理的模拟的预测值的残差结果进行模拟和处理，即对残差数据进行处理，然后得到残差的处理值，根据（0）（i）=（0）（i）+（0）（i），i=1，2，…，n得出最終的模拟值和预测值。

通过matlab绘制灰色模型模拟值、BP神经网络模拟值、灰色模型与神经网络联合处理的模拟值的图形进比较：

六、结论

通过比较分析可以看出在本次沉降数据处理中，由于BP神经网络对数据量的要求较高，所以导致在模拟时有较高的精度但是在预测时精度较差，而灰色模型把原本不具备规律的数据进行处理在模拟和预测时精度较高可以应用于本次数据处理；灰色模型与BP神经网络的联合处理所得到的结果无论在模拟还是在预测方面都是与实测值最相近的，所以灰色模型和BP神经网络模型的联合模型可以良好的应用于本次防波堤的数据处理之中。

参考文献：

[1]宫云增，阚卫明.天津港北大防波堤工程半圆体沉降观测和初步分析[J].中国港湾建设，2003

[2]邓聚龙.灰理论基础[M].武汉：华中科技大学出版社，2002

[3]邓聚龙.灰色系统基本方法[M].武汉：华中理工大学出版社，1987

[4]付海兵，曾黄麟.BP神经网络的算法及改进[J].中国西部科技，2012，11（8）.23～24

[4]田秀梅.BP算法的改进及仿真研究[J].电子技术研发：64～66

[5]谢中华，李国栋等matlab从零到进阶[M].北京航空航天大学出版社，2012

组合预测法篇7

目前关于GDP的预测,大多采用单一预测方法。然而单个预测模型仅包含或体现所研究系统的局部信息,若用不同的方法对系统进行模拟,往往是各有条件、各有特点,也各有不足。若将几种预测方法线性组合形成组合预测模型,既可以综合利用各种预测方法所提供的信息,提高预测精度,又能够比较合理地描述系统的客观现实[2,3,4,5,6]。本文在建立三个单项预测模型的基础上,以误差平方和最小为最优准则构建组合预测模型,对中国GDP的发展趋势进行预测。

1 预测模型的理论基础

1.1 指数模型

改革开放以来,我国国内生产总值保持稳定持续的增长,长期保持10%以上的增长速度。可以用指数模型yt=aebteεt描述经济增长的变化,对指数模型两端取对数,得

lnyt=lna+bt+εt

化为lnyt与t之间的一元线性回归问题,通过估计参数a,b的值,可得指数曲线预测模型

undefined

1.2 ARIMA模型考虑模型

Φ(L)Δdyt=Θ(L)ut (2)

其中,Φ(L)表示平稳的自回归算子,Θ(L)表示可逆的移动平均算子。若取xt=Δdyt,则(2)式可表示为:Φ(L)xt=Θ(L)ut。说明yt经过d次差分后,可用一个平稳、可逆的ARMA过程xt表示。

随机过程yt经过d次差分后变换为一个以Φ(L)为p阶自回归算子,Θ(L)为q阶移动平均算子的平稳、可逆的随机过程,称yt为(p,d,q)阶自回归移动平均过程,记为ARIMA(p,d,q)。

ARIMA模型预测步骤:

1)模型识别。首先判断随机过程是否平稳,如果不平稳,需要对时间序列进行差分,差分的次数即为ARIMA模型中的参数d;然后在平稳时间序列基础上通过自相关函数和偏自相关函数识别ARMA模型的阶数p,q;

2)模型参数估计。采用极大似然法估计时间序列模型的参数;

3)模型检验。模型参数通过t检验;全部特征根的倒数必须在单位圆以内;模型的残差序列必须通过Q检验;

4)模型预测。

1.3 多项式趋势拟合模型

设变量yt表示时间序列,建立yt与时间趋势的多项式预测模型:

undefined

利用最小二乘法估计参数b0,b1,b2,…,bk,然后对yt的长期趋势进行预测。

1.4 组合预测模型[3,4,5,6]

对于同一预测问题,假设有n种预测方法。记yt为第t期的实际观测值,fit为第i种预测方法第t期的拟合预测值,预测误差为eit=yt-fit(i=1,2,…,n;t=1,2,…,N)。

对于组合预测方法,记wi为第i种预测方法的组合权重(i=1,2,…,n;undefined,第t期组合预测方法的预测值为undefined,预测误差为undefined,则组合预测方法的预测误差平方和为

undefined

其中,W=(w1,w2,…,wn)T为组合权重向量,En=(Eij)n×n为预测误差信息矩阵(一般假定En为正定矩阵),这里undefined。

以预测误差平方和最小为最优准则构建如下优化模型:

minJ=WTEnW

s.t.RTnW=1

其中,Rn是元素全为1的n维列向量。

用拉格朗日乘数法求解,得模型的最优组合权重向量为:undefined,组合预测误差平方和的最小值为:undefined。

2 实证分析

本文选取1990—2009年的国内生产总值数据作为研究样本,对我国的GDP进行预测分析。在单项预测模型中,首先利用1990—2005年的数据建立模型,2006—2009年的数据用于与所建模型计算的预测值作比较,在满足模型精度的基础上再用1990—2009年的全部数据建立模型对2010—2015年的GDP进行预测。利用建立的组合预测模型对2010—2015年的GDP进行组合预测。数据来源于《中国统计年鉴2010》。

2.1 指数预测模型

1)根据1990~2005年的中国GDP数据,得到参数a和b的估计值分别为undefined,则灰色预测模型为:

y1t=201 92e0.144 3t(t=年份-1989) (3)

(117.727 8)(16.567 7) R2=0.951 5,F=274.5

现利用模型(3)预测2006~2009年的GDP值,并将预测值与实际值作比较计算相对误差,计算结果如表1所示。

2)利用1990~2009年的全部GDP数据建立指数曲线预测模型,得到参数估计值分别为undefined则建立的指数预测模型为:

y1t=20 422.29e0.142 4t(t=年份-1989) (4)

(149.401 3)(25.686 56)R2=0.973 4,F=659.8

同样可以得到1990~2009年各年的GDP拟合值,如表2所示。

根据表1和表2可以看出,指数曲线预测模型的预测效果较好,可以用于预测中国的GDP发展态势。现利用模型(4)对2010~2015年的GDP进行预测,预测结果见表3。

2.2 ARIMA模型预测

1)根据1990—2005年的GDP数据,首先观察数据特征,可以看出中国GDP序列随时间不断增加,是一个非平稳序列,经过一阶差分后,变为平稳序列,此时ARIMA模型中的参数d=1。下面作出一阶差分序列的相关图与偏自相关图,判别ARMA模型的形式。

根据图1中的自相关和偏自相关结果,我们可以初步判断为ARMA(1,1)模型、AR(1)模型、MA(1)模型、AR(2)模型及MA(2)模型。利用Eviews6.0分别建立这5个模型,通过t检验和Q检验的比较分析,得出AR(2)模型最适合,故选择AR(2)模型。于是ARIMA模型的具体形式为ARIMA(2,1,0),模型如下:

Dyt=3 923.569 1+1.442 7Dyt-1-0.787 2Dyt-2+vt (5)

(5.45) (-2.1)

括号内数字表示t值,可以看出模型参数都通过了显著性t检验,全部特征值的倒数和模型残差的Q值,均通过检验。现利用模型(5)对2006—2009年的GDP值进行动态预测,结果见表1。

2)利用1990—2009年的全部GDP数据重新估计ARIMA模型。一阶差分序列的相关图与偏自相关图如图2所示。

由图2可以看出,偏自相关图呈现二阶截尾,而自相关图显示拖尾特征,故该模型也为AR(2)模型。估计结果如下:

Dyt=5028.312+1.5762Dyt-1-0.941Dyt-2+vt

(4.63) (-2.34) (6)

同样可以看出模型参数都通过了显著性t检验,且全部特征值的倒数和模型残差的Q值也通过检验。将1990—2009年的GDP动态预测值列入表2中(其中前三期的预测值为实际值)。根据表1和表2的估计结果,说明ARIMA模型的动态预测效果不太理想,利用模型(6)对2010-2015年的GDP预测值见表3所示。尽管预测效果不是很理想,但作为建立组合预测模型的单项预测模型之一,毕竟包含样本数据的信息,或许对组合预测模型有一定的贡献。

2.3 多项式拟合预测

首先分别利用1990-2005年、1990-2009年的GDP数据,作出趋势图如图3图4。

根据图3、图4的变化趋势,可以观察出我国GDP与时间大致呈三次函数关系,故建立三次多项式拟合模型。

对于1990—2005年的数据,建立模型:

undefined

(4.56) (-2.62) (3.44) R2=0.991 5,F=464.48 (7)

模型(7)中各参数的t值均显著,且通过F检验和拟合忧度检验。现利用模型(7)对2006~2009年的GDP值进行预测,结果见表1。

对于1990-2009年的全部数据,建立模型:

undefined

(6.12) (-5.45) (8.37) R2=0.9953,F=1117.92 (8)

模型(8)也分别通过t检验、F检验。1990~2009年的GDP预测值结果见表2。

通过表1和表2的对比可以看出三次多项式模型的预测效果较优,预测精度较高,能够比较客观地反映我国GDP变化趋势,故利用多项式模型拟合GDP预测值是比较合理的。现利用模型(8)对2010—2015年的GDP进行预测,预测结果见表3所示。

2.4 组合预测模型

计算最优组合权重。根据三个单项预测模型的预测误差,得到预测误差信息矩阵为:

undefined

求得最优组合权重向量:w1=0.0291,w2=0.031,w3=0.939 9,于是建立组合预测模型:

undefined

其中undefined1t,undefined2t,undefined3t分别表示指数模型预测值、ARIMA预测值和多项式预测值。

根据模型(9)计算1990—2009年的GDP预测值,得到结果与三个单项预测模型进行比较,显示出组合预测模型的最大相对误差明显小于各个单项预测,预测精度也明显高于各个单项预测,故可以用组合预测模型(9)对2010—2015年的GDP进行预测,结果见表3所示。

3 结束语

本文在利用指数曲线预测模型、ARIMA模型和多项式趋势拟合模型进行预测分析的基础上,综合三个单项预测模型的优点,以误差平方和最小为最优准则建立组合预测模型,对中国2010—2015年的GDP进行预测,精度更高,可靠性更强。

组合预测结果显示,2010年中国GDP为402 505.2亿元,到2015年达到799 191.9亿元,年均增长率为14.79%,说明我国国民经济仍将保持快速的增长。我国国内生产总值正处于快速增长阶段,需要进一步保持和改进现有的政策和措施。

参考文献

[1]由向平,孙德山,林丹凤.组合模型在我国GDP预测中的应用[J].廊坊师范学院学报,2010,10(2):87-89.

[2]戴钰.最优组合预测模型的构建及其应用研究[J].经济数学,2010,27(1):92-98.

[3]周扬,吴文祥,胡莹,等.基于组合模型的能源需求预测[J].中国人口.资源环境,2010,20(4):63-68.

[4]汪淋津,杨桂元.安徽省能源需求的组合预测[J].价值工程,2009(6):26-29.

[5]王莎莎,陈安,苏静,等.组合预测模型在中国GDP预测中的应用[J].山东大学学报,2009,44(2):56-59.

组合预测法篇8

近年来, 泸州市大力实施“以港兴城”发展战略, 港口建设受到高度重视, 港口基础设施建设取得重大阶段性进展, 集疏运体系不断完善, 服务腹地延伸至川滇黔广阔区域。随着长江经济带发展战略和“一带一路”发展战略的深入实施, 川滇黔经济社会快速发展, 带动港口货物吞吐量持续快速增长, 2014年全港完成货物吞吐量达3134万t, 集装箱吞吐量达32万TEU。泸州港已成为川滇黔地区实力领先的枢纽港, 在完善区域综合运输体系, 带动腹地资源开发, 支撑沿江产业布局, 促进内陆开放型经济发展中发挥了重要作用。

泸州港的经济腹地以四川省、云贵北部、甘陕青藏部分地区为主。其中直接腹地包括泸州市所辖的四县三区;间接腹地包括成都经济区、川南经济区、滇北、黔北以及陕、甘、藏、青等几个西部省区的部分地区。成都经济区是泸州港重要的间接腹地, 也是四川省经济实力最强的地区, 2013年经济总量达1.6万亿元, 经济区以成都为核心, 已形成了装备制造、电子信息、化工等主导产业, 经济外向度高, 成都市2013年进出口总额达到506亿美元, 以汽车零部件、整车为代表的高附加值货种为泸州港集装箱、商品汽车运输带来了旺盛需求。

川滇黔矿产资源十分丰富。四川省铁、钛、钒、硫铁矿、芒硝、岩盐、玻璃用石英、石棉、石墨等32种矿产资源的保有储量居全国前5位, 钒、钛磁铁矿已查明储量和远景资源总量约90亿吨, 居全国首位, 川东北和川东南地区是重要的煤炭产区。滇北、黔北的习水、仁怀、毕节、昭通等地无烟煤储量丰富, 品质优良, 铁、磷、铅锌、硅石等均属大型矿床, 具有较高开发价值, 区域内农业经济作物也较为发达。总体上, 川滇黔地区以大宗散货为主的资源外运需求十分旺盛, 为泸州港提供了稳定的货源保障。

二、组合预测基本原理

组合预测法是对同一个问题, 采用两种以上不同预测方法的预测。它既可是几种定量方法的组合, 也可是几种定性的方法的组合, 但实践中更多的则是利用定性方法与定量方法的组合。组合的主要目的是综合利用各种方法所提供的信息, 尽可能地提高预测精度。

在进行港口预测时, 目前常采用的方法有时间序列法、回归预测法、灰色预测法以及产运销平衡法等方法。本次我们采用三次指数平滑预测法和回归分析法对泸州港吞吐量进行组合预测。由于2014年部分数据还未公布, 本次预测以2013年为基础年, 预测水平年为2020年和2030年。

三、三次指数平滑预测

指数平滑法是根据历史资料的上期实际数和预测值, 用指数加权法进行预测的一种方法, 此法实质上是由加权移动平均法演变而来的。其优点是只要有上期实际数和上期预测值, 就可计算下期的预测值。这样可以节省很多数据和处理数据的时间, 减少数据的存储量, 是一种实用的中、短期预测方法。

三次指数平滑法预测出的结果更精确。, 它认为数据的重要程度按时间上的近远呈非线性递减。即近期数据影响价值大, 权数亦大;远期数据影响价值小, 权数亦小。腹地经济在“十二五”期间飞速发展, 泸州港货物吞吐量在“十二五”以来也保持了15.32%的年平均增长率, 呈现高速上升趋势。设时间序列为X1, X2, X3, ……, Xn, 记St (1) , St (2) , St (3) 分别为第t期一次指数平滑值, 二次指数平滑值和三次指数平滑值。

指数平滑值计算公式为:

St (1) =a Xt+ (1-a) St-1 (1)

St (2) =a St (1) + (1-a) St-1 (2)

St (3) =a St (2) + (1-a) St-1 (3)

平滑系数a的确定:模型中的平滑系数a取 (0~1) 之间的一个数值, 若原数列波动不大, a取小值 (0.1~0.3) , 若原数列波动较大, a宜取大值 (0.6~0.8) 。考虑到泸州港货物吞吐量在”十二五”期间持续稳步上升、波动不大, 因此平平滑滑系系数数取取值值0.3

平滑初值的确定:, 指数平滑过程见表1。

三次指数平滑预测过程表

三次指数平滑数学模型为:

Yt+T=at+btT+ctT2

其中式中:

t为目前的周期序号;

T为预测超前周期数;

Yt+T为第 (t+T) 周期的预测值。

为了更加精确地预测2020和2030年本航段内的水路货物运输量, 本文采用的方法是:从2011年开始到2013年每年作一个预测, 最后将这3个值求平均得出最终预测结果, 即预测2020年和2030年的水路货物运输量为6021万t和13210万t, 详见表2。

三次指数平滑预测结果

单位:万t

四、回归预测

回归预测法是指通过确定两种或两种以上变量间相互依赖的定量关系, 来对因变量进行预测的一种统计分析方法。在本项目中, 我们将腹地范围内的国内生产总值经过汇总计算后设为自变量x, 将泸州港的货物吞吐量设为因变量y, 具体数据见表3。

对自变量x和因变量y进行回归分析, 得出回归方程如下:

y=-9.6585+0.0873x

通过分析, 腹地经济除四川省外, 在近几年均保持15%左右的年平均增长率, 同时结合腹地各地区的”十二五”国民经济与社会发展规划提出的经济发展目标, 预测2020年自变量x的值为55000亿元。但考虑到我国经济进入新常态发展期, 转变发展方式、加快转型升级的压力日益增大, 经济增速将由两位数高速增长逐渐转向一位数中快速增长, 预测2030年自变量x的值为100000亿元。据此, 通过回归模型预测出2020年和2030年的水路货物运输量为4793.78万t和8723.86万t。

五、预测结果

组合预测法是指建立一个模型, 把两个或两个以上不同预测方法得出的不同预测值通过适当的加权平均, 最后取其加权平均值作为最终预测结果的一种预测方法。在本项目中, 我们将三次指数平滑预测法和回归预测法得到的2020年和2030年得到的预测值按照“估计误差的方差极小”作为组合预测的最优权重确定准则, 以此求出最终预测值。即, 设Y为预测对象, 三次指数平滑预测法得出的预测值为Y1, 回归预测法得出的预测值为Y2, Y1和Y2均为Y的无偏估计, 三次指数平滑预测模型和回归预测模型的相关性较弱, 那么Y1和Y2的组合预测模型为:

Y*=k Y1+ (1-k) Y2

其中系数k=, e1为回归预测模型的估计误差;e2为三次指数平滑预测模型的估计误差;cov为协方差;var为方差;Y*为组合预测的估计值。Y*是Y的无偏估计, 而且组合预测值的估计误差e0的方差var (e0) 是比组合的单一预测值的估计误差的方差var (e1) 、var (e2) 要小。按照此种方法求出的系数k为0.104, 组合预测模型为:

Y*=0.104Y1+0.896Y2

三次指数平滑预测法依据水路货物运输量自身变化规律进行预测, 在短期预测时结果可信度较高, 但由于水路货物运输量增长的历史规律特点, 将导致中长期预测结果偏高。回归预测法根据水路货物运输量和腹地国内生产总值的历史变动规律进行预测, 对预测期内腹地经济发展、集疏运条件改善等有利因素均无法反映, 导致预测结果偏低。组合预测法按照“估计误差的方差极小”的最优权重确定准则, 确定出了三次指数平滑预测结果和回归预测结果在最终预测结果中的理论最优权重, 预测结果准确度较高, 即2020年和2030年最终预测结果为4921万t和9190万t。

参考文献

[1]邹俊善.现代港口经济学[M].人民交通出版社.

[2]张欣.组合预测模型在上海内河港口吞吐量预测中的应用[M].水运工程, 2007, (04) .

[3]黄荣富, 真虹.三次指数平滑法在港口吞吐量预测中的作用[J].港口管理, 2003, (02) .

组合预测法篇9

负荷预测是电力系统规划的重要组成部分, 其准确与否直接关系到电力系统的安全运行和经济调度, 准确的负荷预测便于更合理地安排电网设备调度及检修计划, 短期电力负荷预测更是在电力市场运营中占据着十分重要的地位[1,2]。

目前, 国内外专家学者对负荷预测问题已经进行了广泛而深入的研究, 开发了各种各样的负荷预测技术, 但没有任何一种方法能保证在任何情况下都获得满意的预测结果[3]。

当前使用组合预测难点主要在于单项预测模型的选择和各单项模型之间权值的确定。在以往的组合预测研究及应用中, 参与组合预测的单项预测模型往往没有经过筛选, 而是人为主观决定后直接进行组合, 文献[3]结论表明最优模型组包含的单项预测模型并非越多越好。

综上所述, 针对负荷变化的特点和已有方法的不足, 本文提出了一种基于有效度遴选和虚拟预测的负荷组合预测方法。

1 单项预测模型遴选

当参加组合的预测方法由n种增加到n+1时, 并不能保证一定会降低非负权重最优组合预测误差平方和。文献[4]采用排除冗余数据的方法, 从预测有效度的角度考虑, 确定最优模型组包含的单项预测模型。

根据有效度选择单项预测模型的过程如下:

步骤1:按照有效度公式对各单项预测模型进行评价, 并按有效度大小进行排序, 例如, 假设M (z1) ≥M (z2) ≥…≥M (zm) 。

步骤2:挑选有效度最高的两个预测模型z1和z2, 以误差平方和最小准则建立组合预测模型z12并计算其有效度M (z12) 。如果M (z12) ≤M (z1) , 表明单项模型z2的加入并没有使预测有效度提高, 说明z2为有效度冗余模型, 把它从单项模型中剔除;如果M (z12) ≥M (z1) , 表明z2的加入使得预测有效度提高, 保留该组合预测模型。

步骤3:将步骤2中得到的组合预测模型作为最好的预测模型, 继续加入余下的单项模型, 并进行有效度判断, 直到所有的单项模型判定完为止。最后所得组合预测模型即最终预测模型。

本文根据上述步骤, 在模糊预测法、灰色模型法、误差反馈加权时间序列法、回归分析法、BP神经网络法和最小二乘支持向量机中, 最终选取BP神经网络、灰色模型法和误差反馈加权时间序列法组成组合预测模型。

2 基于虚拟预测的负荷组合预测方法

虚拟预测是指对历史时间点的数据进行假定的预测, 预测结果被认为是历史时间点的拟合结果, 从而可以按拟合的效果做出各个单一方法的权重的判断。将预测日之前的历史数据进行整理分析, 其可分为历史时段和虚拟预测时段。本文构建的组合预测模型借助了虚拟预测应用在电力系统负荷预测上的基本思想。

组合预测模型通过利用各单项模型进行虚拟预测得到各单项模型的预测结果, 利用评价指标形成组合预测模型中单项模型的权系数。方差倒数法是一种常用的权系数生成方法, 使用预测误差平方和反映预测模型预测精度。对预测时段前的历史若干次等时长进行虚拟预测, 在同一时刻t预测误差平方和较小, 则认为单项模型在t时刻预测效果较好, 此单项预测模型在t时刻被赋以较高权重, 如下式所示:

式中, ;Ei, t为第i个单项预测模型进行的历史预测在t时刻的误差平方和;m为单项预测模型个数;n为预测时间长度。

根据前述有效度遴选, 本文选取BP神经网络、灰色模型法和误差反馈加权时间序列法组成组合预测模型, 可以得到虚拟预测模型的完整框架。

3 仿真分析

3.1 负荷准确率评价指标

经过有效度遴选, 确定由BP神经网络、灰色模型法和误差反馈加权时间序列法组成组合预测模型。其中, BP神经网络的输入除负荷样本外还考虑了最高温度、最低温度、降雨量和日期类型, 补充了时间序列模型和灰色理论模型的不足。

根据南方电网调度负荷预测管理与考核办法, 并结合地区电网的实际需求, 分别取日最大负荷准确率、日最小负荷准确率、日24:00准确率作为不同预测模型的评价指标。

3.2 实例分析

本文所使用的历史负荷数据 (2010—2012年) 由广东某地区电网提供, 是由数据采集与监控 (SCADA) 系统获取的实测负荷量, 所有数据的时间分辨率均为5min, 即一天拥有288个数据样本。该地区用电基数比较小, 处于300~1 000MW的规模, 同时存在着较多的钢铁用户, 其主要用电设备属于冲击性负荷, 与其他负荷的随机波动叠加在一起, 会造成电网负荷发生较大波动。

该地区负荷曲线呈现“三峰两谷”的变化趋势, 由于电网对工业用电实行峰谷电价, 鼓励多用低谷电, 因此炼钢厂、轧钢厂生产主要集中在凌晨0:00—8:00, 负荷曲线的每个拐点均为高频分量幅值较大的时刻。由实验结果可见, 本文所述的组合预测方法能准确地捕捉冲击毛刺的变化规律, 预测曲线比各单项预测更接近实际值 (图1) 。

4 结语

电力系统短期负荷预测是电网正常运行的基础, 对电力部门提高经济效益有着重要意义。针对该地区大量冲击负荷接入系统, 传统预测方法的预测精度已很难满足实际要求, 本文提出一种基于有效度遴选和虚拟预测的负荷组合预测方法。实验结果表明, 与单项预测模型相比, 本文所述组合方法能有效克服单一模型的缺点, 解决选择单项模型的随机性和权重难以确定的问题, 新方法具有更高的预测精度和更好的稳定性, 在相同负荷类型地区的负荷预测中值得推广借鉴。

参考文献

[1]廖旎焕, 胡智宏, 马莹莹, 等.电力系统短期负荷预测方法综述[J].电力系统保护与控制, 2011, 39 (1) :147-152.

[2]金鑫, 罗滇生, 孙广强, 等.中长期电力负荷预测模型筛选与组合方法[J].电力系统及其自动化学报, 2012, 24 (4) :150-156.

[3]高丙坤, 李阳, 许明子.优化粒子群算法在组合供热负荷预测中的应用[J].信息与电子工程, 2011, 9 (5) :655-659.

广西物流需求预测组合模型篇10

灰色系统预测模型

灰色系统模型以灰色模块为基础,用微分拟合法建立自累加模型,主要用于单变量时间序列预测,其中GM(1,1)模型是灰色系统理论的具体应用。

数据来源:广西统计年鉴(2005)、广西统计年鉴(2007)

给定原始时间序列:

对原始数据列进行一次累加生成处理获得新的数据列:

求解微分方程得到GM(1,1)预测模型(中间推导过程略):

为生成数列预测值)

为原始数列预测值)

根据表1资料,利用matlab软件,对1996～2006年的广西货运量建立GM(1,1)滪测模型如下:

利用表1中货运量原始数据对GM(1,1)模型进行检验(推导过程略),结果如下:模型相对误差为5.26%;方差比C=0.48;小概率误差P=0.80。根据GM(1,1)检验标准可认为模型有较好预测精度,可用于广西物流需求的预测。

多元线性回归预测模型

依据中数据,运用SPSS13.0计算表中9个变量的增广相关阵,可得农业产值等八个国民经济指标与货运量相关系数都在0.90以上,说明这些指标与货运量高度线性相关,用货运量与这些指标做多元线性相关分析是合适的。

将货运量作为因变量,农业产值等8个相关指标作为自变量,利用SPSS 13.0建立多元线性回归预测模型,结果如下:

(X1为农业产值,X2为工业产值,…X7为人均总产值)

由于建筑业与其余7个变量高度两两相关,初次检验即被淘汰。

VIF值从大到小依次剔除变量:人均生产总值、批发和零售贸易餐饮业产值、社会消费品总额、工业产值、农业产值,结果如下:

其中X1为第三产业产值X2为外贸总额

该模型相对误差为2.07%,预测精度较高。预测模型反映出对广西物流需求影响最大的因素是第三产业与对外贸易,这与广西的沿海、沿边的区域经济特点相符。因此我们认为用该模型来对广西物流需求进行预测是可行的。

组合模型

灰色系统预测模型能通过不完全信息反映区域整体物流需求;回归分析预测模型在考虑区域经济特点的基础上,通过物流需求的关键影响因素反映区域物流需求。二者各具优势,通过构建组合模型,可综合其优点合理提高物流需求预测精度。组合模型构建的关键是确定单项模型的权重。确定各模型权重的方法较多,其中标准差法可以使拟合度好的预测模型被赋予较高的权重。本文采用标准差法确定灰色系统模型及回归模型权重。

标准差法:

Si单项模型的标准差

依据表1数据,计算得组合模型如下:

(Y1-多元回归预测值;Y2-灰色系统预测值)

组合预测法篇11

关键词正权重; 组合预测; GMDH; 神经网络

中图分类号文献标识码:A



1 引言

组合预测的基础是单项预测.经济预测中常用的单项预测模型一般分为时间序列模型和回归模型.时间序列模型的缺点在于不能充分利用与预测经济指标密切相关的经济因素,导致预测的数据不准确和不稳定.回归模型虽然考虑了各相关经济因素,但需要事先知道其他经济因素与预测经济指标间的函数关系,在此需要首先确定预测经济指标与哪些经济因素有关,特别是各经济因素间有时存在着很强的相关关系,这对函数关系的建立和预测的准确性很有影响,因此参照文献[1]的做法,首先通过GMDH方法对选择的经济变量进行筛选,然后再进行回归模型和神经网络模型的建立可提高模型的预测精度.

组合预测法篇12

关键词：三次指数平滑,回归分析,组合模型,物流需求量

广州是珠三角地区的中心城市,也是我国重要的物资集散地和对外通商口岸,现代物流业已经成为其产业升级的一项重要内容和新的经济增长点,在广州市经济发展中发挥着举足轻重的作用。物流需求预测是实现物流资源合理配置的重要环节,可有效地保持物流服务供给与需求之间的平衡,为政府部门制定合理化的物流产业发展规划提供决策依据[1],对广州市物流需求进行有效预测具有现实意义。

一、预测模型介绍

目前,常见的物流需求预测方法有灰色系统预测法[2]、三次指数平滑法[3]、回归分析法[4]和神经网络法等[5],由于经济发展的复杂性,采用单一的预测方法误差往往较大,因此,综合利用各种单一预测模型的预测结果得到适当的加权组合模型来进行预测更为科学,本文采用三次指数平滑法和回归分析法的组合模型对广州市物流需求量进行预测,结果表明该模型可以有效地降低单一预测模型的预测误差,提高预测精度。

1. 三次指数平滑法

三次指数平滑法是时间序列预测中的一种重要方法,它是用历史数据的指数加权组合来直接预测时间序列将来值。预测模型为: Yt + T= at+ btT + c T2,Yt + T为t +T时刻的预测值; at,bt,ct的计算公式为[6]:

St(1),St(2),St(3)表示t时刻一次,二次,三次指数平滑值。其中,α 为平滑系数,经反复试算,最终确定当平滑系数 α = 0. 3,预测误差最小。

平滑初值的确定:,指数平滑的过程如表1:

令t = 2014,则广州市社会货物运输量的预测模型为:

2. 回归分析预测法

回归分析法是通过选择合适的数学模型来确定两种或两种以上变量间相互的变化关系,可根据因变量的多少分为一元回归分析和多元回归分析。回归分析的公式为: Yt= α + β1X1+ β2X2+ … + βnXn。其中: Yt为因变量,即在时间t的预测值; X为自变量,即引起Y变化的影响因素; α,β 为回归系数。

假设因变量广州市货运量Y仅受自变量国民生产总值( GDP) X的影响,于是利用Excel处理表1 中数据得到表2 及一元线性回归方程:

数据来源:广州统计年鉴。

y=4.7531x+11992,其中相关系数R2=0.965。

3.基于三次指数平滑与回归分析的组合预测模型

组合预测模型就是把两个或两个以上的单一预测模型的预测结果进行加权,最终以得到的加权平均值作为预测结果的一种方法[7],本文的组合预测方法就是对上述三次指数平滑模型和回归分析模型进行加权评价。设Y为组合预测模型的预测值,Y1,Y2分别为三次指数平滑和回归分析预测模型的预测值,k1,k2分别为三次指数平滑和回归分析预测模型的权重,则组合模型为:

二、组合模型权重的确定

本文中的组合模型权重的确定采用均方误差法,均方误差为:

其中,n为预测数据的个数,y( t) 为预测值,x( t) 为实际值。

本文以2012—2014 年广州市货运量为测试数据,计算三次指数平滑预测模型和回归分析预测模型实际值与预测值之间的均方误差( MSE) ,并计算各自的加权系数。

单位:万吨

由表3 计算得到三次指数平滑模型的预测均方误差为: MSE1= 14679. 48,回归分析模型的均方误差为: MSE2= 6416. 43 ,三次指数平滑模型的权系数为:

回归分析模型的权系数为:

得到如下的组合预测模型:

其中y为组合预测值,y1为三次指数平滑预测值,y2为回归分析模型预测值。

三、预测结果分析

三次指数平滑模型和回归分析模型的预测误差分别达到5. 33% 和5. 42% ,而它们的组合模型预测误差是4. 20% ,要小于单一模型,组合预测模型的预测结果与实际值更加接近,更加符合近年来广州市物流需求量的发展状况与客观规律( 见表4) 。

通过组合预测,广州市2020 年的物流需求量即全社会货运量将达到154624. 50 万吨,这一结果介于三次指数平滑预测值176479. 12 万吨和回归分析预测值145078. 80 万吨之间,并且具有更高的精度( 见表5) 。

单位:万吨

四、结论和建议

利用组合预测模型对广州市“十三五”时期末的物流需求进行预测,得出以下结论: “十三五”期间将是广州市物流业重要发展期,“十三五”末的物流需求将大幅增长。物流业必然会带动广州市第一、二、三产业的快速发展,因此相关部门应积极制定配套政策,打造良好的发展环境,使广州市的物流能力与快速增长的物流需求相匹配,可通过提高物流技术、增加物流基础设施投入、发展特色物流园区等多种举措推动广州市物流业持续健康有序发展。

参考文献

[1]后锐,张毕西.基于MLP神经网络的区域物流需求预测方法及其应用[J].系统工程理论与实践,2005(12):43-47.

[2]罗永华,何忠伟.基于灰色系统理论的茂名市物流需求预测分析[J].物流科技,2010(7):19-21.

[3]谢晓燕,韦学婷,王霖.基于指数平滑法的呼、包、鄂三角区物流需求量预测[J].干旱区资源与环境,2013(1):58-62.

[4]方威,肖衡,任湘郴.基于线性回归模型的物流需求预测分析[J].生产力研究,2009(12):94-95,110.

[5]张诚,冯亚萍.人工神经网络模型的江西省物流需求预测[J].华东交通大学学报,2014(4):26-32.

[6]严小丽,何超,黄怡浪.三次指数平滑法在建筑事故预测中的应用[J].统计与决策,2015(10):72-73.

[7]董艳,贺兴时.一种组合预测模型及其应用[J].西安工程大学学报,2010(1):128-130.

【组合预测法】推荐阅读：

组合预测09-02

动态组合预测07-25

变权组合预测09-29