平滑预测

2024-08-01

平滑预测(通用7篇)

平滑预测 篇1

在经济预测的理论和实践中,广泛地运用一种名为指数平滑的统计预测方法。这种方法计算简单,适用范围广,预测结果可以控制,在实际工作中比较普遍。但是,关于它的系统理论,在一般的书刊中,很少有深入的介绍。本文拟结合实例作一些论述。

1 指数平滑法

统计中所讲的指数平滑法是以相邻前期实际值和预测值作为变量,根据预测现象的特点选择权数,按加权算术平均数的方法,预测本期现象发展水平的一种方法。其计算公式如下:

公式中,,分别代表第t期及第t+1期的预测值,xt代表第t期的实际值,a及(1-a)分别代表两个变量的权数。

a称为平滑系数,它可以根据预测现象的特点及预测要求,在0~1之问选择。

这种方法计算简单,可以根据现象的特点和预测精确度的要求,选择日值。通过不同日值进行预测。

2 指数平滑法的特点

从指数平滑法的公式来看,好像它是相邻前期实际值和预测值的加权算术平均数。但是,从实质上看,它是相邻前期各实际值(从理论上可以追溯到无限远的前期)的加权序时平均数。它的性质可以通过以下特点来表示:

1)指数平滑法各时期的变量采用的权数不一样。离预测期愈远,权数愈小,离预测期愈近,权数愈大。这一点我们可以作以下证明:

这就是说明第6期的预测值是以前各期实际值的加权平均数。从理论上说,它可以一直追溯到以前的无穷期。每期的变量都分别用不同的权数加权,它们是a、a(1-a)、a(1-a)2…。由于a大于0小于l,所以

a>a(1-a)>…>a(1-a)t。也就是说,离预测期愈远,其权数a(1-a)t中的指数t值愈大,从而权数a(1-a)t愈小,当t→∞时,a(1-a)t接近0,因此,最后一项可以省去,而将上式写成:

指数平滑法的各项权数,离预测期远近不同而大小不同。这一特点是符合实际情况的。因为,权数大小说明变量在平均数中的作用大小,也可以说成变量对平均数的影响。从预测的角度来说,现象的变化,固然离不开历史,但是,各历史时期离现实的远近不同,对现实的影响也不同。相邻前期离预测期愈近,主客观条件与预测期的差别愈小;离预测期愈远,主客观条件与预测期的差别愈大,从而相邻近期实际值对预测值的影响,肯定要大于远期实际值。可见,指数平滑法这一特点,正是考虑了不同实际值对预测值的影响,而对于各个变量在权数上采取的差异。

2)指数平滑法各时期的权数,在坐标图上表现为一条平滑的指数曲线,曲线的形状取决于a值的大小。a值愈接近l曲线愈陡,a值逐渐减少,曲线愈近平稳。下面我们通过图表来说明(见表1及图1):

将表1数据作直角坐标图。纵轴代表权数值(从0~1),横轴代表各权数(见下图1)。

图1表明,3个不同的a值,其各项权数组成3条不同的曲线。a值为0.8时,曲线最陡;a为0.2时,曲线最平稳,它主要表现为离预测值较近的时期。愈往前,离预测值远的各时期,曲线逐渐趋向于渐近线。从理论上说,都不应与横轴相交。可见,a值的选择,主要应该考虑被预测现象本身的变化特点。当预测现象变化较大时,a值应该选择大一些。如a值应该大于0.5或更多。

摘要:结合实例,对指数平滑的统计预测方法进行理论上的分析论述。

关键词:指数平滑,权数,统计预测

基于平滑指数模型的安全事故预测 篇2

1、数据整理

由于国家对安全生产状况的好坏, 有一系列的统计和控制指标确定, 其中对某市的控制指标主要为事故死亡总人数、工矿商贸、道路交通和水路交通领域等, 另外, 对事故伤亡程度也需要整理, 以了解某市安全生产水平的总体概况。

从表1.1可以看出某市每年的主要事故类型是不一样的, 这主要是因为每一年都做了上一年安全生产事故的统计, 因而每一年的事故类型就有所改变, 但这样仍然不能减少事故总量, 不能提高某市安全生产的总体水平。

2 统计分析

事故统计分析要求:收集的资料必须准确可靠;选用科学的方法对收集到的数据资料进行分类和汇总;统计图表必须清晰明了, 便于分析和比较。2008年以来, 某市事故数量有所上升, 但鲜有30人以上的特别重大事故发生, 这一方面是由于当地安全生产监督管理局的作用得到发挥, 另一方面又由于片面追求经济效益造成, 这些原因造就了某市安全事故的现状特点。

根据所收集到的某市安全事故, 可以看到事故类型主要集中在道路交通、水路交通和工矿商贸这三个方面, 其它类型事故较少, 众所周知, 某市近几年来经济得到快速发展, 12年已经迈入50000亿元大关, 因此省居民生活水平得到了大幅度提高, 车辆使用量也跟着快速增长, 而且某市临近渤海, 渔业较发达, 近年来得到政府政策的帮助, 渔业也快速发展起来, 越来越多的人投入到这个行业中来, 使得水路交通压力增大。这些原因造成了某市的安全事故具有集中到某些事故类型的特征。

自从国家的计划生育政策出台后, 我国人口得到了有效控制, 在某市相关部门的配合工作下, 某市人口增长得了很好的控制。然而某市安全事故死亡人数却没有达到相同情况, 这可能主要是某市经济追求快速发展的原因。

3 预测分析

3.1 预测结果

通过预测结果与实际数据对比可以知道, 指数平滑模型是可行的的, 而且预测结果与实际预测差距较小, 是在可接受范围内的, 因此选用此种方法是可行的。

指数平滑模型进行预测2013年死亡人数、死亡人数在1到3人事件、死亡人数在4到10人事件、死亡人数在11到30人事件, 道路交通事故发生数、水路交通事故发生数、工矿商贸事故发生数、其它类型事故发生数, 道路交通事故死亡人数、水路交通事故死亡人数、工矿商贸事故死亡人数、其它类型事故死亡人数。

3.2 相关性分析

将生产总值、道路交通事故、水路交通事故、工矿商贸事故和其它类型事故发生数进行Pearson相关分析, 生产总值与工矿商贸事故之间为正相关, 即随着社会生产总值的发展, 工矿商贸事故数也在增加, 说明近几年, 经济的大力发展, 各地新建了大量的工矿企业、商贸物资城, 而相应的管理没有跟上、甚至建筑物的质量不过关, 都造成了意外事故。

道路交通事故与水路交通事故正相关, 有同时增高的趋势, 说明近几年我国的经济发展带来人员流动的增加, 交通事故数包括道路交通事故和水路交通事故数都在增加。

4 结论

通过对统计数据的分析与预测, 可得到以下结论:

(1) 2013年安全事故死亡人数有所下降, 但下降不显著。

(2) 30人以上的特别重大事故鲜有发生, 但较大事故的发生量却不容忽视。

(3) 虽然道路交通事故不是发生最多的, 但其一旦发生都伴随着伤亡, 是2013年安全事故死亡人数预防的着重方面。

平滑预测 篇3

地下水是北方地区生活饮用水的重要来源之一。随着人类活动不断加强以及环境变化的影响, 地下水污染愈来愈严重。为了遏制地下水环境恶化的趋势, 新颁布的《环境影响评价技术导则·地下水环境》[1]。为地下水环境影响评价和地下水污染防治工作的规范化提供了技术支撑。

地下水水质预测是水环境规划、评价和管理工作的基础[2]。目前, 地下水水质预测方法一般可以分为三类:第一类是基于渗流理论和弥散理论的数值模型预测方法。该方法大多只考虑污染物在含水层中的物理过程, 或只考虑简单的化学反应过程, 通过对水文地质条件的概化, 建立相应的模型, 给定初始条件和边界条件, 采用模拟软件进行模型计算与预测[3,4]。第二类是基于水文地球化学的预测方法。这类方法通过研究地下水与含水层介质之间的水岩作用, 对地下水水质的演化进行预测[5]。第三类是基于数理统计的水质预测方法。该方法主要通过对已有资料进行统计分析, 从而建立预测模型, 预测未来短期内的变化和宏观演变趋势[6]。常用的方法有回归分析法[2]、神经网络模型[7~11]、指数平滑法[12,13]、灰色系统理论[14]、时间序列模型和频谱分析法等[15]。国内外关于地下水水质预测已有不少研究[16,17]。

指数平滑法已被广泛应用于商业、采矿业、水文学、环境科学等方面, 得到了很好的效果。本文采用Holt指数平滑模型, 以阿拉善腰坝绿洲地下水水质预测为例对各水质参数进行预测, 并将指数平滑模型预测结果与前人的灰色模型预测结果进行对比, 验证其在地下水水质预测方面的可行性与可靠性。

1 Holt指数平滑模型

指数平滑模型由于其结构简单、总体效果好等优点被广泛用应于商业、环境科学等领域[18]。Holt指数平滑模型由Holt于1957年提出[12]。它与一般指数平滑模型不同的是它对趋势数据直接进行平滑并对原时间数列进行预测[19]。Holt指数平滑模型假定所有已知数据对预测值均有影响, 近期数据对预测值的影响较大, 而远期数据对预测值的影响较小, 影响力呈几何级数减少。即有[12,20]:

式中:St和St-1分别表示利用前t期和前t-1期数据对第t期或第t-1期趋势的估计, Tt和Tt-1分别为利用前t期或前t-1期数据对趋势增量的估计, α和γ为平滑参数, 0≤α≤1, 0≤γ≤1, Xt为t时段的实际观测值, 为t+m期的预测值, m为预测外推期数。

采用Holt指数平滑模型进行预测, 最关键的是要确定模型初值和平滑参数。本文中, 选择已有时间序列资料的第一个值X1作为S0的初值, 而将T0设置为0。对于平滑参数的确定, 采用最小二乘法确定, 即:

设参数初值分别为α0, γ0, 参数真值为α, γ, 即有α=α0+Δα, γ=γ0+Δγ。根据零点定理, 欲使目标函数E达到最小, 则必有:

通过式 (5) 可以求出Δα和Δγ, 则通过迭代可以求出参数真值。即有:

式中:k为迭代次数, k=0, 1, 2, …。

2 地下水水质预测

2.1 资料来源

贺兰山西麓腰坝绿洲是一个以地下水为主要水源的井灌区, 地下水水质具有高度的时空变异性[21]。文中地下水主要水质指标引自参考文献[21]。水样取自贺兰山山前冲洪积平原单一潜水区, 该地区含水层主要由贺兰山冲洪积物组成, 从上到下均为粗颗粒沉积物, 孔隙大, 透水性强。水样于每年的开采期取自该地区三眼开采井T14、T15和T6, 然后经实验室化验, 取各个井点各预测指标的平均值, 作为该区预测的时间序列。本文对HCO3-、Cl-、SO42-和TDS四个指标进行预测, 并与灰色模型的预测结果进行对比。水质指标历年变化见表1。

2.2 水质预测

给定模型初值, 通过Excel以最小二乘理论为基础, 采用牛顿迭代法对平滑参数进行迭代求解, 并对水质进行预测。同时还计算了预测的绝对误差和相对误差, 结果见表2。表2中还列举了文献[21]采用灰色系统模型的预测结果及其绝对误差和相对误差, 以供对比。

2.3 结果分析与讨论

由表2中的预测结果可知, 采用Holt指数平滑模型对HCO3-、Cl-、SO42-和TDS进行预测, 得到了很好的预测效果, 4个指标的最大预测相对误差分别为1.820%、3.265%、6.352%和3.125%。一般预测误差低于10%则认为预测精度很高, 因此Holt指数平滑模型的预测结果已经达到较高精度。文献[21]采用的灰色模型也得到了很好的预测结果, HCO3-、Cl-、SO42-和TDS预测的最大相对误差分别为3.293%、4.999%、3.878%和4.043%, 但与本文中的预测结果相比, 总体仍稍显逊色。此外, 两种预测方法相比, Holt指数平滑模型由于受到初值设定的影响, 前几个时间段的预测精度不如灰色模型, 但随着预测时段的增加, Holt指数平滑模型的预测精度逐渐高于灰色模型预测精度。灰色模型预测精度随时段的增加呈现逐渐降低的趋势。可以推测, 在已有较长时间序列资料前提下, Holt指数平滑模型要比灰色模型预测精度高, 并且随着时间序列资料的加长, 预测精度逐渐得到提高。

将指标实测值、灰色模型预测值和Holt指数平滑模型预测值绘制成曲线, 见图1。由图1可见, 灰色模型和Holt指数平滑模型均较高精度地预测了各水质指标的变化情况, 但总体而言, Holt指数平滑模型预测精度要更高一些。随着预测时段的增加, Holt指数平滑模型预测精度逐渐高于灰色模型的预测精度。由图1还可以发现, 所预测的4个水质指标均基本呈指数模式增长, 表明地下水中这些指标的浓度逐年增大。利用Holt指数平滑模型预测了2006年HCO3-、Cl-、SO42-和TDS浓度值, 分别为198.260、77.290、114.850和508mg/L。与已有的前几年水质监测资料对比可知, 研究区地下水水质呈逐年恶化的趋势, 应查清地下水污染源及各污染源对地下水水质的影响程度, 以便采取有效措施, 遏制地下水水质进一步恶化。

3 结论

Holt指数平滑模型统一考虑了所有已有时间序列资料对预测值的影响, 提高了预测精度。与灰色模型相比, 由于受到初值的影响, 预测前期精度不如灰色模型, 随着预测时段的增加, 预测精度逐渐高于灰色模型。Holt指数平滑模型适用于已有较长时间序列资料前提下的预测。

研究区HCO3-、Cl-、SO42-和TDS浓度均呈指数形式逐年增加。通过Holt指数模型预测, 2006年HCO3-、Cl-、SO42-和TDS浓度值将分别达到198.260、77.290、114.850和508mg/L。研究区地下水水质呈逐年恶化的趋势, 应查清地下水污染源及各污染源对地下水水质的影响程度, 以便采取有效措施, 遏制地下水水质进一步恶化。

本文初步验证了Holt指数平滑模型在地下水水质预测中的适用性, 但仍存在一些问题需要解决, 如模型初值问题和模型适用范围问题。对于模型初值问题, 研究已经表明初值会对前期预测结果有一定影响, 但影响程度如何尚不清楚, 因此, 研究模型初值问题具有必要性。此外, 模型适用范围问题也是一个十分重要的研究课题。本文中各种指标基本呈指数模式逐渐增大, 对于呈其它形式变化的时间序列采用Holt指数平滑模型进行预测能否达到高精度的预测仍需进一步研究。

摘要:地下水水质预测是地下水污染防治研究工作的重要组成部分。本文介绍了Holt指数平滑模型的基本原理及平滑参数的确定方法, 在此基础上, 以阿拉善腰坝绿洲地下水水质预测为实例对地下水HCO-3、Cl-、SO2-4和TDS进行了预测, 并与灰色模型预测结果进行了对比。结果表明2006年HCO-3、Cl-、SO2-4和TDS浓度值将分别达到198.260、77.290、114.850和508mg/L。应查清地下水各种污染源及各污染源对地下水水质的影响程度, 以便采取有效措施, 遏制地下水水质进一步恶化。Holt指数平滑模型统一考虑了所有已有时间序列资料对预测值的影响, 提高了预测精度, 适用于已有较长时间序列资料前提下的预测。

平滑预测 篇4

一、引言

近年来, 物流行业作为新兴行业, 其发展逐渐受到重视并在全国范围内得到了迅速发展。山西省是中国重要的煤炭和原材料基地, 是中国著名的小杂粮生产基地, 其经济的发展对山西省甚至是全国都有着重要的意义。发展现代物流是推动山西省经济迅速发展的需要。但是山西省物流行业还处于起步阶段, 还存在许多的问题, 分析和预测物流需要量是物流产业规划及决策的重要依据。为了推动山西省经济, 以及物流行业的发展, 对山西省物流需求量进行分析和预测是十分必要的。

二、指数平滑法概述

指数平滑法是通过计算平滑平均值, 并利用一定的时间序列模型对未来进行预测的一种方法。预测的成功与否取决于平滑常数的选择, 平滑常数通常用α表示。α的大小表示在新预测值中新数据和原预测值所占的比重。α值越大, 新数据在新预测值中所占的比重就越大, 原预测值在其中所占比重就越小, 反之亦然。新预测值是根据预测误差对原预测值进行修正得到的[1]。α的大小表明了修正幅度。α值越大, 修正的幅度就越大, 反之亦然[2]。用指数平滑法计算的平滑平均值的公式为:Ft=αYt+ (1-α) Ft-1

式中Ft表示第t期的平滑平均值;Yt表示第t期的数值;Ft-1表示t-1期的平滑平均值;α为平滑常数, 其取值范围为 (0、1) [3]。

如果时间序列所展示的事物过去发展变化的趋势呈斜坡型线性上升趋势, 则应用二次指数平滑法对其进行预测, 公式即Yt+T=αt+btT。式中待定参数αt、bt的计算公式为:

其中, F[1]t, F[2]t分别为一、二次指数平滑的结果。

三、山西省物流需求量实例分析

本文选取货运量作为物流需求量的指标, 运用指数平滑法对山西省物流需求量进行分析和预测。本文根据预测平方和误差和均方差最小的原则来确定指数平滑系数[4]。在进行二次指数平滑时, 当α为0.5时符合此原则, 所以α为0.5时是最优平滑系数。以2004年~2013年山西省货运量数据为例来说明测算过程 (如表1) 。

当t=10时, α=0.5, 将第10期的一次、二次平滑值带入公式, 得α10=15.8222, b10=1.4414, 得到了本期的线性预测模型为:F10+T=15.8222+1.4414×T

取T=1时是2014年, 取T=2时是2015年, 取T=3时是2016年, 依此类推。利用此模型拟合山西省2004年~2013年货运量, 具体结果见表2。

四、需求量的预测

利用上述模型对未来几年山西省物流需求量进行预测, 预测结果见表3。

五、结语

根据二次指数平滑模型的预测结果, 可以看出山西省物流需求量呈逐年上升的趋势, 说明山西省物流行业还有很大的发展潜力。在一定程度上反映了山西省物流需求量的变化规律。另外, 由于掌握的信息不全, 可能预测结果会与未来实际的物流需求量之间有一定的偏差, 但是可以根据二次指数平滑模型预测的结果反映的物流需求量的变化规律, 为今后物流行业的发展提供决策依据。

参考文献

[1]梁坚.支持向量机在水质评价及预测中的应用研究[D].浙江工业大学, 2009.

[2]黄永福.重庆市物流需求预测方法及应用研究[D].重庆交通大学, 2009.

[3]白瑶瑶.基于二次指数平滑预测法的客车市场预测[J].客车技术与研究, 2013, (03) :54~56.

平滑预测 篇5

关键词:季节性指数平滑法,配送车

0 前言

石化物流中心主要是针对化工产品及其它附属工业产品的储存和运销服务。配送是石化物流中心的一项主要服务, 在经济合理的区域范围内, 根据用户的要求, 对物品进行拣选、加工、包装、分割、组配等作业, 并按时配送到指定的地点, 其服务对象主要为周边化工企业以及其他客户。然而由于其服务的产品主要是化工品, 而且品类较多、性质及状态各异, 各类石化产品的年周转量的差异也较大, 尤其是大多数产品具有易燃性、毒性、易被氧化, 因此对配送的安全性要求较高[1]。针对产品的特殊性, 石化物流中心除配备一般各吨位的载重汽车外, 还需配备各类专用的化工运输车辆, 以满足不同的需求。但是, 又由于石化产品存在季节性的需求波动, 因此我们的配送车保有量的确定应建立在区域需求预测的基础上, 只有这样才能在满足配送需求的情况下实现作业成本的合理化。在这里我们采用季节性指数平滑法对石化物流产品的季节性波动变化进行预测。

1 季节性指数平滑法的基本原理

季节性指数平滑法是把量测到的时间序列值分成三部分:水平因素、趋势因素、周期因素, 分别对其进行预测, 然后将各种因素的平滑结果结合起来, 再对原时间数列值作出预测。具体步骤如下[3]:

设直接量测到的时间序列周期长度为l, 己知观测值为x1, x2, …, xl。

(1) 分别计算前两个周期中每个时期的平均值V:

undefined

(2) 计算两个周期内平均每个时期的增量B:undefined

(3) 计算初始指数平滑值S:undefined

(4) 分别计算前两个周期内每一时期的季节因C'。

第一个周期内每一个时期的季节因子为:

undefined

式中:t=1, 2, …, l。当t=1时, m=1;t=2时, m=2;t=l时, m=l。

第二个周期内每一个时期的季节因子为:

undefined

式中:t=l+1, l+2, …, 2l。当t= l+1时, m=1;t= l+2时, m=2;t=2l时, m=l。

(5) 计算前两个周期中平均每个时期的季节因C't:undefined

式中:t=l+1, l+2, l+3, …, 2l。所以, 一共有l个平均季节因子。

(6) 将季节因子正态化:undefined

式中:t=l+1, l+2, l+3, …, 2l。undefined

(7) 对第三周期内每一时期进行初步预测:

式中: t=2l;m可以取上1, 2, …, lo

(8) 当获得第三个周期的第一个时期的观测值xt (xt=x2l+1) 后, 就可以利用一组确定的平滑常数α、β、γ来修正指数平滑值S, 趋势因子B, 双季节因子C。修正公式如下:undefined

重新计算预测第三周期内其余 (l-1) 个时期的数值: Fl+m= (St+mBt) Ct-l+m

(9) 以后, 每次当获得前t时期的观测值xt时, 就可以用以下公式分别计算单指数平滑值、趋势因子和季节因子:undefined

对 (l+m) 时期的预测值:Fl+m= (St+mBt) Ct-l+m

每当计算完一个周期, 得到l个季节因子以后就要按第六步的方法重新加以正态化。

2 配送车保有量的计算

2.1 石化产品的分类整合

通过季节性指数平滑法的计算, 我们可以预测各物流小区不同石化产品的物流需求量, 但是石化产品的种类繁多, 不同产品的配送要求也不尽相同, 当然有些产品因为性质相似或者危险性小等原因, 存在混合配送的可能。所以为了更好的计算配送车保有量, 我们可采取分类整合的方法, 按配送车种类的不同, 进行产品的划分。

根据季节性指数平滑法我们以一年作为一个周期, 并分为12个时期, 即每一个月为一个时期, 然后对石化物流中心的配送区域进行小区划分, 同时对每一个小区的石化产品的物流需求进行分类整合, 如表1所示。其中k表示小区编号, i表示配送车的类型, j表示产品的品类。qkij通过季节性指数平滑法进行预测,

2.2 配送车保有量的计算

我们对石化物流中心的服务区域进行小区划分, 如图1所示。Dk表示小区编号, dk表示各小区的中心到物流中心的距离。针对第t个时期第k个小区的i类配送车的需求量我们可以通过以下的计算:

配送发车总次数:undefined

往返配送时间:undefined (单位:天)

配送车数量:undefined总配送车数量:undefined

式中: 表示车辆容量, 表示满载率, 表示小区到物流中心的距离, 表示i类配送车在往返Dk小区时的行驶速度

3 结论

本文中的配送车保有量的计算主要是根据需求预测而展开的, 仅仅是为了满足需求而进行配送车配车数计算, 所以无形中忽略了其他的一些影响因素。真正合理的配送车保有量, 是对各方面因素的一种权衡, 能够切实地满足物流配送需求、保障下游化工产业的生产制造以及产成品的运销、保障在途配送运输安全、实现物流配送的成本效益同时兼顾社会效应以及第三方物流资源的合理利用。

参考文献

平滑预测 篇6

靖西天然气管道,始于陕西省榆林市靖边县杨桥畔庞家湾村东700m的靖边首站,沿公路干线途经5市13个(区)县到达西安市未央区杜家堡的西安末站,管道全长488.5km。靖西天然气管道为双气源(靖边、化子坪)、复管(一线、二线)、三座压气站(靖边、延安、富县)联合运行方式,管道全线还设有延安分输站、黄陵清管站、铜川分输站、义和分输站、泾河分输站、西安末站等十多座工艺场站。

目前,靖西输气管道主要负责向管道沿线和周边各大城市和工业企业供气,其中,工业用户包括:咸阳彩虹、中冶轧辊、天宏硅业、宝钛股份、陕重汽等;化肥用户包括兴化股份;石化用户包括咸阳新科;加气包括华气安然、金亿达、西蓝公司、通源公司、咸阳通驰、阎良区、西安市、咸阳市、宝鸡市、渭南市、泾阳县以及其他城市加气等。

历年统计数据显示,靖西管道天然气的消费群体,主要分布在陕西中部的7个地市,天然气消费量从2001年的43 584.7×104m3增加到2011年的251 191.4×104m3,年平均增长率达到19.3%,用气量逐年快速递增,变化趋势(图1)。

1 指数平滑预测的基本原理

指数平滑预测法是利用平滑平均数的计算对时间序列进行修匀的一种预测方法[1,2,3],其基本思想是:在预测过程中,通过某种方式消除历史统计序列中的随机波动。研究表明,越近期的数据反映的信息越新,对未来的影响就越大,因此通过对不同历史数据赋予不同的权重,时刻越近,数据权重越大,时刻越远,数据权重越小。因此,数据的重要程度是按时间上的远近成非线性递增的。指数平滑是对加权平均的进一步发展和完善,最初是由美国著名经济学家布朗(Robert Brown)于1959年提出来的。

指数平滑法凭借其易掌握、易操作、计算量小等优点,在各学科领域的预测研究中得到广泛应用。它的使用频率仅次于回归分析法,并已成为十分热门的组合预测中的首选方法[4,5]。

2 指数平滑预测模型

2.1 一次指数平滑

一次指数平滑以预测目标的本期实际值和本期预测值为基数,分别给予不同的权数求出指数平滑值作为确定的预测值,线性模型可表示为:

其中:St(1)和St-1(1)分别为t期和t-1期的一次平滑指数值;α(0<α

2.2 二次指数平滑

二次指数平滑是在一次指数平滑的基础上,再做一次平滑,以对时序存在的线性趋势进行修正,然后利用二次指数平滑值建立预测数学模型,模型表达式记为:

其中:St(1)、St(2)分别为t时期的一次、二次指数平滑值,α(0<α<1)为平滑系数。

当时间从t时期开始至以后具有直线变化趋势时,可建立如下二次指数平滑法的预测模型:

其中:Yt+m为第t+m期预测值;m表示自t时刻起向前预测的时间长度;at和bt为模型参数。at和bt的求解公式为:

2.3 指数平滑系数的确定

在指数平滑预测模型中都要用到平滑系数α,平滑系数α的大小对预测值影响很大,其选值是关键。选择α的总原则是:保证预测值与实际值之间的误差最小。从理论上讲,α取0~1之间任意数值均可以,为了提高预测精度运用以下方法来确定α的取值:

(1)首先由经验判断法确定α的取值范围。由文献[2]得到,α取值越大,预测值越能反映实际值的变化情况;α取值越小,预测值越接近于前期预测值,即越趋近于某一稳定值。因此在对时间序列进行分析的基础上,可依据表1来确定平滑系数α的取值范围。

(2)再由试算法确定α的取值。根据具体时间序列情况,参照经验判断法得出α的取值范围,然后在此范围内取几个α值进行试算,比较不同α值下的预测误差,选取预测误差最小的α作为最终的取值。

3 指数平滑模型预测计算及结果

通过观察图1,靖西管道天然气2001~2011年的年度负荷大致呈直线递增的变化趋势。选用布朗(Brown)单一参数线性指数平滑计算模型,即二次指数平滑法,对靖西天然气管道年度负荷量进行预测。

利用二次指数平滑法,预测具有线性趋势性的基本步骤为:

(1)为了使靖西管道天然气需求近期较快的发展趋势在预测模型中得到充分反映,α的取值应大一些,经反复测算比较后,选取α=0.8时,计算结果最为合适;

(2)根据历史数据,由(1)式进行一次指数平滑计算;

(3)再由(2)式进行二次指数平滑计算;

(4)最后由(4)、(5)式计算at和bt,并由(3)式计算t时刻之后的预测值Yt+m。计算结果如表2所示。

从表2得知,在2003~2011年天然气负荷量预测中最大相对误差为9.07%,平均相对误差为4.43%,误差均低于10%的误差要求,故可以应用该模型对靖西天然气管道的负荷进行预测。利用建立的预测模型对靖西天然气管道未来5年的天然气负荷进行预测,2012~2016年各年份的预测值依次通过变更预测的超前期数m=1,2,…,5可得到(表3)。

最后,将2001~2016年靖西管道天然气实际消费量和预测量的变化趋势绘图(图2)。

4 结论及建议

(1)通过分析靖西管道天然气用气现状,得出该管道天然气消费的主要特点是天然气消费总量增长迅速,且大致呈直线递增的趋势变化。

(2)运用指数平滑模型预测靖西管道天然气需求负荷,由2012年的28.29亿m3,增加到2016年的41.10亿m3,增长1.45倍,年均增长9.79%,预测平均相对误差4.43%。根据预测模型的相对误差判断,建立的指数平滑预测模型是合理、可行,可以应用该模型对靖西天然气管道的负荷进行预测。

(3)作者仅对靖西天然气管道的年负荷进行了预测,为了满足储气调峰设施规划设计、制订检维修计划、运行与调度的需要,仅仅进行中长期负荷预测是不够的,还需要进行短期负荷预测,如对日、小时的负荷量进行预测,这样才能更好地指导管道生产运行。

参考文献

[1]张静.基于灰色—神经网络理论的西安市天然气中长期负荷预测[D].西安:西安建筑科技大学,2006.

[2]李朝辉.指数平滑预测法的运用[J].华北矿业高等专科学校学报,1999,6(2):41-62

[3]杨昭,苗志彬,刘燕.一种新的天然气管网负荷预测方法[J].天然气工业,2003,23(4):93-96

[4]严铭卿,廉乐明,焦文玲,等.燃气负荷及其预测模型[J].煤气与热力,2003,23(5):259-266

平滑预测 篇7

本文主要是利用三次样条平滑的方法, 基于R统计软件对数据进行拟合及预测, 并根据结果给出对该种方法的评价。在具体的拟合及预测过程中, 我们发现参数的选择对结果会产生一定的影响, 比如随机干扰项e的标准差sd, 数据量n的大小, 结点数knots的多少等。另外, 对于来自不同函数的数据的拟合及预测效果也不尽相同。针对这些不同情形, 我们做了全面细致的对比分析, 找出了影响效果的重要因素, 并以图表的形式一一呈现。

2 理论及模拟方法

关于数据拟合的方法多种多样, 三次样条平滑是其中最重要和常见的一种。其原理是通过构造一系列三次样条函数来对实际数据进行拟合。三次样条函数定义为:设有一组结点, 且在每个小区间上都是三次多项式, 则称fi (t) 是结点上的三次样条函数。

记为基函数, C为样条系数矩阵, 则F=C×T。设为实际数据。利用加权最小二乘法便可以求出样条参数的估计, 即最小化目标函数, 其中W为权重。可以解得。由此可得。。

关于数据拟合的方法多种多样, 三次样条平滑是其中最重要和常见的一种。其原理是通过构造一系列三次样条函数来对实际数据进行拟合。三次样条函数定义为:设有一组结点, 且在每个小区间上都是三次多项式, 则称是结点上的三次样条函数。

记为基函数, C为样条系数矩阵, 则F=C×T。设为实际数据。利用加权最小二乘法便可以求出样条参数的估计, 即最小化目标函数, 其中W为权重。可以解得。由此可得。。

假设数据量保持不变, n=50, 我们分别选取knots=5, knots=6, knots=10, knots=30, 这四种情形。可以看出, 只有当knots=5的时候, 效果不是很好, 其他情况的拟合都非常令人满意。当然, 预测的效果只在短期内近似有效。所以, 当数据量比较适中的时候, 选择knots的数量稍大即可, 但是不能太小。

3.2 随机干扰项e的标准差对拟合及预测效果的影响

基于前面的分析, 我们假设数据量和结点数均保持不变, n=50, knots=50。并且, 仍然是利用函数y=3*sin (0.8*t) +e, 并且e服从均值为0的正态分布, 但是改变e的标准差, 观察当sd=0.1, sd=1, sd=3, sd=5的情形。发现标准差sd越小, 拟合及预测的效果越好, 反之, 标准差sd越大, 拟合及预测的效果越差。尤其是当sd=0.1的时候, 拟合效果相当好, 而sd=5的时候, 拟合的图形变为一条直线, 已经没有了实际意义, 完全不能反映出原始函数的周期性。

3.3 不同函数对拟合及预测效果的影响

数据来自于不同的函数, 对于拟合及预测效果也是有影响的。我们分别采用了指数函数和多项式函数重新对前面的方法进行模拟运算, 并且假定数据量n=50, 结点数knots=50。从模拟运行的结果可以看出, 该方法对于这两类函数的拟合及预测效果都是比较令人满意的。

4 发现

经过反复的模拟测试, 我们发现总的来说, 用三次样条平滑方法对数据进行拟合及预测的效果还是不错的, 在多数时候结果具有较强的可信度。特别是结合统计软件R的使用, 实现起来是相当容易的。不过具体说来, 各种参数如数据量的大小, 结点数的多少, 随机干扰项e的标准差等对运行结果都有一定的影响, 归纳如下:

对于正弦函数等周期函数, 可以达到很好的拟合效果, 但是预测效果较差;

数据量越大, 效果越好;

当数据量较小时, 结点数哪怕取最大, 拟合效果也不好。而当数据量很大时, 结点数太少也会影响效果。所以, 对于结点数而言, 只要不是很少 (对于我们这里涉及的情形一般大于或等于6) , 对结果的影响都不大;

标准差越小, 拟合及预测的效果就会越好, 反之, 如果标准差较大, 函数的信息几乎都被掩盖了, 这个时候所做的拟合及预测本身都已经没有了意义;

对于指数函数以及多项式函数等, 拟合效果较好, 预测的效果也可以达到很好的水平。

摘要:在证券投资分析中, 常常需要对证券价格、成交量等时间序列数据进行拟合及预测, 本文给出了基于R统计软件平台, 利用三次样条平滑得到的数据拟合及预测的原理、方法和应用举例。R统计软件的功能强大, 使用简便, 是进行证券数据分析的重要工具之一。

关键词:R统计软件,三次样条平滑,证券投资,数据拟合

参考文献

[1]何书元.应用时间序列分析[M].北京:北京大学出版社, 2009.

[2]贾俊平, 何晓群, 金勇进等.统计学[M].北京:中国人民大学出版社, 2000.

[3]郑思齐.住房需求的微观经济分析[M].北京:中国建筑工业出版社, 2007.

上一篇:尊严地活着下一篇:影响系数分析法