变权组合预测

2024-09-29

变权组合预测(精选4篇)

变权组合预测 篇1

0 引 言

陕西省兴平市位于关中平原中部,渭河北岸,属黄河流域渭河水系,境内没有河流,渭河自西向东,从市境南部流过。兴平市水资源比较紧缺,在农田灌溉、工业及乡镇企业、城镇生活以及农村人畜生活供水方面,地下水占有相当大的比例,是兴平市的主要供水水源之一。随着国民经济的发展,水资源的需求将不断增大,兴平东城区和西城区均出现了地下水严重超采的现状,目前已经出现了“兴化漏斗区”这样较大范围的地下水水位下降区[1],漏斗区面积约为30 km2。为了合理开发、综合利用、科学保护地下水, 必须对地下水动态进行全面研究分析[2],并根据预测结果, 结合实际情况, 推演地下漏斗区的发展,制定相应的防治方案与保护措施,有效地实现对水位的调控,这对于解决水资源紧缺、保证居民生活用水、促进经济社会可持续发展具有重要意义。

1 变权组合预测模型简介

1.1 基本思路

在预测问题中,由于建模机制和出发点不同,通常同一问题有不同的预测方法,将这些不同的预测方法进行适当组合,便可形成所谓组合预测方法。组合预测的研究在目前预测方法领域中最为活跃,但对变权组合预测模型的研究却进展缓慢。变权组合预测模型的应用是提高预测精度、增强预测模型实用性的有效途径。变权组合预测方法是基于多种预测方法的组合预测方法,它的关键是变权系数的确定。由于变权系数是随时间变化的函数,所以确定变权系数就显得比较困难。首先要建立样本点的组合预测优化模型,求出各单项预测方法在各样本点的最优组合权系数;其次根据这些权系数确定各预测方法中“预测时点”的组合权重[3]。

1.2 符号说明

设对于某一预测问题,有n种预测模型(或者预测方法)f1t,f2t,f3t,…,fnt,并假设:

Yt为第t(t=1,2,…,M)期的实际观测值;

Kit为第i预测方法在第t期的加权系数,且满足i=1nΚit=1;

eit=Yt-fit为第t期第i种预测方法的预测误差;

ft=i=1nkitfit为变权组合预测方法在第t期的预测值;

et=Yt-ft=i=1nΚiteit为变权组合在第t期的预测误差。

1.3 样本点组合预测优化模型

求组合预测权重系数的基本原则是使样本点处组合预测误差最小。目前常用的确定变权系数的方法有以下3 种:①以相对误差的最大值达到最小为目标确定最佳变权系数;②以绝对误差和达到最小为目标确定最佳的变权系数;③以误差平方和达到最小为目标函数.这里采用组合预测误差绝对值最小的方法[4],考虑到权重系数自身的要求,得到如下组合预测优化模型:

{minJt=|et|=|i=1nΚiteit|sti=1nΚit=1,Κit0(t=1,2,,Μ)(1)

对所选用的预测方法,采用模型(1)进行求解,可求得该预测方法在各样本点的最优权系数Kit

1.4 预测时点组合预测权系数的确定

根据上述模型,实际上仅仅求出使组合预测模型的拟合精度达到最优的变权系数,而构建组合预测模型的目的是为了预测,需要确定预测时点的组合权系数,即Ki,M+j(i=1,2,…,n;j=1,2,…)。确定预测时点组合的方法很多,常用的有如下两种方法:

其中i=1nΚt,Μ+j=1,且Kt,M+j≥0。这种方法适合于观测样本量较少,或各方法在时点序列上的权系数无明显规律的情况。

(2)利用回归法拟合权系数函数W(t),如取W(t)=b0+b1t,然后确定各预测时点的组合预测权系数。其步骤如下:

①设第i种预测方法在各拟合时点的最优组合权系数为Ki1,Ki2,…,KtM;

②以Ki1,Ki2,…,KtM为样本,用回归模型求权系数函数W(t);

③当t=M+j时,计算各预测方法的组合预测权系数函数值Wi(M+j);

④将Wi(M+j)归一化,这时将得出t=M+j时各预测方法的组合权系数 其中Κi,Μ+j=Wt(Μ+j)/i=1nWi(Μ+j)。其中i=1nΚt,Μ+j=1,且Kt,M+j≥0。

本方法适合于观测样本量较多,且各方法在拟合时点序列上的权系数具有一定规律性的情况。

2 兴平市地下水动态预测

本文以兴平化肥厂区域地下水水位下降所形成漏斗区的059号观测井为研究区,该区历年地下水水位埋深见表1,可以看出兴平市地下水埋深的变化幅度较大,离散性程度比较高。为了检验变权组合预测模型的预测效果,本文利用实测资料,建立基于指数预测法、线性回归预测法及灰色预测法的变权组合预测方法的模型,对地下水动态进行预测研究。

2.1 预测数据与模型的选择

选取2000-2011年水位埋深数据作为样本点,并根据样本数据图(图1),选取了3种预测模型,即指数模型(f1)、线性回归模型(f2)和灰色预测GM(1,1)模型(f3)[5]。各模型的拟合方程如下(t=1,2000;t=2,2002;…t=12,2011)。

f1:Y=21.188e-0.0076tf2:Y=-0.1525t+21.173f3:Y=-25959e0.0081t+2615.8

2.2 变权组合预测

各模型的预测值与实际值比较如表2。由于灰色预测是从t+1年开始,因而各模型的拟合误差(表3)均从第2年开始的。

2.3 预测结果

根据模型(1)计算出各时点的最优组合权系数。由于各方法在时点序列上的权系数无明显规律性,因而采用了1.4节中介绍的第一种方法预测时点组合预测权系数。预测时点组合预测权系数如表4,最后计算得出预测值如表5。其中指数模型、线性回归模型、灰色GM(1,1)模型、组合预测模型的误差平方和分别为0.635 2、0.636 5、0.617 7、0.576 6。

从预测结果来看,拟合值与实际值的绝对误差很小,可以表明预测值的可信度(图2)。

3 结 论

变权组合预测模型是组合预测研究的重要课题之一。因为权重是时间的函数,预测精度将会得到提高,所以变权组合预测模型的预测结果会更接近实际。本文采用基于指数模型、线性回归模型、灰色GM(1,1)模型的变权组合预测方法对兴化漏斗区的地下水位埋深进行预测,相比4种预测方法的误差平方和,可以看出利用变权重组合预测模型比任意一种单一种预测方法的预测精度都要高、实用性更要强。

通过对兴化漏斗区059号观测井地下水水位埋深的动态预测, 可以看出近几年来该区域地下水水位埋深有逐年回升的趋势, 水资源量正逐渐恢复,到2016年内,兴化漏斗区的地下水水位埋深为18.57 m,相比2011年水位回升幅度为4%。利用此预测结果可以为区域地下水资源合理开发利用、地下水和地表水联合调度等提供依据。

参考文献

[1]柳娟.兴平市水环境污染控制研究[D].陕西杨凌:西北农林科技大学,2007.

[2]于春霞,徐建新.优化GM(1,1)模型在地下水水位预测中的应用[J].安徽农业科学,2008,36(12):4810,4819.

[3]藏淑英,冯仲科.变权组合预测模型的建立及其在区域生态风险中的应用[J].北京林业大学学报,2007,29(2):203-208.

[4]赵国忻,王明涛.一种变权重组合预测方法研究[J].西北纺织工学院学报,2000,14(3):226-232.

[5]王晶,张鹏.综合灰色和ARIMA的变权组合预测模型[J].河北电力技术,2007,26(增刊):21-24.

变权组合预测 篇2

近年来,我国汽车后市场迅速崛起并呈现持续增长趋势。 作为汽车后市场的核心,汽车零配件产业在整个汽车产值中占有相当大的比重。运用合理的预测方法对汽车零配件需求进行准确预测, 一方面可帮助汽车零配件采购企业制订合理的采购计划,有效控制零配件库存;另一方面可使汽车零配件生产企业准确把握各零配件需求的需求,合理安排零配件生产,降低汽车后市场供应链的运作成本。

近年来, 已有学者开始对汽车后市场的需求预测进行研究。Ren等人(2009)[1]和Yu等人(2010)[2]采用神经网络的方法预测汽车零部件需求, 实证研究证明该方法具有很好的预测效果;王子(2009)[3]对履带起重机企业零配件年度需求和月度需求进行预测分析,以便企业制订合适的库存管理策略、降低库存量、提高流动资金的营运效率;陈云等(2010)分别运用ARMA模型和Regression-Bayesian-BPNN模型对汽车后市场进行需求预测[4-5],并且基于时间序列分解方法提出了零配件需求预测模型(CSDFSD)[6];廖伟智(2010)提出了面向服务的汽车配件需求预测模型[7]。 现有模型往往基于一种预测方法进行研究,虽然在部分预测任务中具有较好的表现, 但是模型的泛化性能相对较差,难以实现对不同零部件的预测。

组合需求预测是将各种单一预测结果进行组合得到一种组合预测结果,从而达到改善预测效果的目的[8]。 根据组合权重确定方式的不同,组合预测可分为固定权重组合预测方法和变权组合预测方法。其中,变权组合预测中权重的确定较为复杂,但其具有相对较高的精度和泛化性能,在电力预测、工程管理、金融分析等多个领域得到了成功应用。

由于汽车后市场零配件种类繁多、需求特点互不相同,仅使用一种预测方法或采用固定权重组合预测方法都难以有效提高汽车后市场零配件总体需求预测的精度和预测稳定性。本文以汽车后市场所有零配件中需求量较大且销售价值较高的 “关键”零配件作为研究对象,研究基于汽车后市场零配件需求的变权组合预测方法,在变权组合预测方法中,针对汽车后市场某些零配件需求趋势性和季节性明显,某些零配件受外在因素影响显著的特点, 选取基于趋势和季节调整的ARMA方法、 多元回归方法和BP神经网络方法作为变权组合预测模型的3 种单项方法。

2面向汽车后市场零配件需求的变权组合预测模型

2.1 变权组合预测模型的单项方法选择标准

“变权” 指组合模型使用的单项预测方法以及组合权重是随时间呈现周期性变化的,记该周期为P,即每经过P期均要重新从既定的3 种单项方法中选择符合条件的单项方法,同时重新计算组合权重。 假设某汽车零配件需求实际数据记为Yt,(t=1,2… ,N,N+1,… ,N+T),其中N+T为数据长度,变权组合预测模型的目标是预测第N+T+1 到第N+T+P期的需求数据。

组合预测选取M种(本文中M=3)单项预测方法(以下简称“单项方法”),每一种单项方法均利用相应历史数据预测后T期需求数据,单项方法m的预测值记为YFt(m),t=1,2,…,T。 组合预测模型运用各单项模型的T期预测相对误差e计算每种单项方法对应的权重W,参见公式(1):

式中,et(m)表示单项方法m的第t期预测相对误差,计算方法有多种,依情况而定;w(m)为单项方法m的权重,满足加和为1。

单项方法筛选标准和权重计算的样本数据是多期预测相对误差(此处将最后T期的相对误差记为e1,e2,… ,eT),周期性变化规则如表1 所示。

在已选定的M种(本模型中M=3)单项方法中,只有满足预测效果稳定和预测精度高的条件才能进行组合预测。单项方法m的T期绝对相对误差均值和误差方差分别记为:和 σ2(m)。设定常数和 σ2,选择m的充要条件为 σ2(m)<σ2且。

可见,本模型在预测稳定性的基础上,同时考虑了预测精度,确保预测结果保持在较低的范围内。

以3 种单项方法(A,B,C)为例,单项模型的选取可分为4 大类型、8 种情况,如表2 所示。

注:“好”代表该单项方法符合要求

2.2 变权组合预测的单项方法权重计算过程

假设组合预测模型各期预测相对误差为et,t=1, … ,T, 则最优组合预测等价于求解规划问题(2):

S为组合预测误差平方和。 该问题最优解表示为W0,计算公式为公式(3):

其中,E为M×M方阵,称为预测误差信息矩阵,如公式(4):

2.3 变权组合预测单项方法的选择

汽车后市场零配件具有如下特点: 某些零配件的趋势性和季节性较明显,某些零配件受到外在变量的影响显著。 因此选取基于趋势和季节调整的ARMA模型、多元回归模型和BP神经网络模型作为变权组合预测模型的单项预测方法。

2.3.1 基于趋势和季节调整的ARMA模型

汽车后市场企业零配件销售数据难以获得, 使得数据量较少,参数的筛选统计分析效果不明显;而且参数选取受人为因素影响较多,结果缺乏客观性,应用基于趋势和季节调整的ARMA方法进行汽车后市场零配件的时序预测存在参数难以判断的问题。 为解决上述问题,本文设计模型参数自调整算法,用可能的参数组合(可根据经验判断)进行预测,从中筛选出预测效果最好(t期预测MAPE最小)的一组作为下一预测周期模型参数。 具体步骤为:

第一步: 判断标准为根据汽车零配件需求数据折线图确定趋势因素可能情况。

第二步:判断时序长度是否大于(24+t),是则季节性参数(S)取为季节虚拟变量(S=DUM1 DUM2 … DUM12);否则取为常数C(S=C);

第三步:选取ARMA(p,q)模型可能的(p,q)组合。

第四步:遍历所有可能的参数组合,计算MAPE值,选取最小值对象的参数组合进行预测。

2.3.2 多元回归预测方法

模型建立包括相关性分析、单位根检验、协整回归、显著性检验、协整检验和预测6 个步骤。

第一步:选用灰关联度系数作为线性相关程度的指标。

第二步:对M个自变量和一个因变量做单位根检验。

第三步:利用最小二乘法进行协整回归,对协整回归中自变量统计不显著者进行逐个删除;。

第四步:检验协整回归的残差中是否存在单位根。

第五步:协整模型检验。

第六步:预测。

由于回归预测模型均运用影响因素的滞后变量, 因此对未来零配件的预测用到的是影响因素的现有需求数据, 无需对影响因素进行预测。

2.3.3 BP神经网络模型

汽车零配件需求序列TS=(x1,x2,… ,xN)′(注:本节所有假设仅在本节使用)作为神经元网络的输入,其中xi(i=1,2,… ,N)是第i期需求,所有的样本数据都被归一化为[0,1]之间的数。 不失一般性,本文讨论预测一期的情况,预测目标即神经元网络的输出为第N+1 期的需求量(多期预测类同)。 神经网络训练样本为:

本文设计的模型对输入层神经元个数、 中间层个数进行遍历,按照MAPE最小化原则选择最合适的网络结构,同时自动求出神经网络的L次(L给定,一般为10 的整数倍)重复运算均值。汽车后市场零配件月度数据网路结构自调整算法如下(季度数据类同):

第一步:遍历M。 若N>24,M取值从1 到12;否则M取值从1 到6。

第二步:遍历I。 通常情况下,I取值从1 到3M。

第三步:求L次运算预测值均值,记为某(M,I)网络的预测值。

第四步:选取MAPE最小的神经网络结构,对第N+1 期的数据进行预测,得到最终预测值YFN+1。

3实证分析

本文分别选取上海市某4S店和某汽车零配件供应商(分别记为公司X,公司Y)的月度销售额作为零配件需求预测的实证研究数据。 公司X的16 种零配件的销售数据是从2007 年1 月到2009 年3 月共27 个月的数据; 公司Y的7 种零配件的销售数据是从2008 年1 月到2009 年7 月共19 个月的数据。 主要实证结果有:3 种单项预测方法相互补充,对所考察的“关键”零配件的覆盖率分别达到81.25%和71.43%; 面向汽车后市场零配件需求的变权组合模型预测精度高且预测稳定性好, 优于各单项预测方法。

3.1 单项预测方法的计算结果

3.1.1 3 种单项预测方法计算结果汇总

用3 种单项方法对各配件进行预测, 并对3 种方法的互补性进行验证。 预测数据使用方法如表3 所示。

注:“[1‐21]→22”表示第22 个月的预测值是由第1 到21 个月的数据计算得来

注:ARMA方法、回归方法、BP神经网络方法分别用A、B、C表示

公司Y三种单项预测方法预测效果如表5 所示。

3.1.2 单项预测方法互补性检验

设定每种配件的均值阈值和方差阈值: 所有配件均值阈值最大取35%,方差阈值最大取0.1;对于3 种方法预测效果均较好的配件,阈值可取较小数值。 依据阈值选择适用的单项方法,如表6 所示。

注:“NNN”指3 种方法均不适合

ARMA方法适用的配件种类为7 种(43.75% ), 回归方法适用的配件种类为9 种(56.25%),神经网络方法适用的配件种类为4 种(25%)。 至少一种方法适合的配件种类为13 种(81.25%)。对照表1,对公司X各种配件进行分类,如表7 所示。

设定每种配件的均值阈值和方差阈值, 并依据阈值选择适用的单项方法,如表8所示。

注:“NNN”指没有方法适合;均值阈值最大取30%,方差阈值最大取0.1

ARMA方法适用的配件种类为2 个(28.57% ), 回归方法适用的配件种类为3 种(42.86%),神经网络方法适用的配件种类为2种(28.57%)。至少一种方法适合的配件种类为5种(71.43%)。对照表1,对公司Y各种配件进行分类,如表9所示:

3.2面向汽车后市场零配件需求的变权组合预测方法计算结果

将样本数据最后6期简记为“组合第1—6期”。组合预测模型的测试样本以及权重计算样本如表10所示。

注:“〖1‐3〗荥4”指“组合第4 期”单项方法权重计算样本为“组合1—3 期”

注:灰色底纹处,MAPE 在 40%以上或三期方差在 0.2 以上。

注:1“组合>i”指组合好于单项方法i;2两方法相差小于0.01 时,互不占优

综上所述, 对于公司X变权组合预测模型从整体意义和个体意义上,均要比基于趋势和季节调整的ARMA方法、多元回归方法和BP神经网络方法好。

将公司Y的6 个配件三期预测相对误差的方差和MAPE汇总如表13 所示。

注:灰色底纹处,MAPE在40%以上或三期方差在0.2 以上

将每种配件的MAPE和相对误差方法一一进行比较, 计算组合模型占优的配件所占比例,如表14 所示。

注:1“组合>i”指组合好于单项方法i;2两方法相差小于0.01 时,互不占优

对于公司Y变权最优组合预测模型从整体意义和个体意义上,均要比3 种单项预测方法模型好。

4结论

变权组合预测 篇3

1 数学模型

1. 1 双变权缓冲算子

定义1 设x =[x ( 1) , x ( 2) , …, x ( m) ]为系统行为序列, 若存在d满足xd =[x ( 1) d, x ( 2) d, …, x ( m) d], 则称d为序列算子。

定义2[10]针对系统行为序列x, 序列算子d满足如下3 个条件, 则称d为缓冲算子:

1) x ( m) d = x ( m) 。

2) x中的每个元素均参与序列算子作用的全过程。

3) 任意x ( i) d, ( i = 1, 2, …, m) , 均可由一个统一的f ( x, d) 表达。

对于系统行为序列x, 若 λ1≠ - λ2, λ 满足式 ( 1) , 则称 λ 为双变权缓冲算子:

式中i = 1, 2, …, m; λ1和 λ2为可变权重。

1. 2 OMGM ( 1, n) 数学模型

设模型初始数据为X0= [x01, x02, …, x0n], 其中x0i=[x0i ( 1) , x0i ( 2) , …, x0i ( m) ]T, 则称x01为主行为序列, x02, …, x0n为影响因素序列。

定义3[10]若有两个序列x0i和x0j满足式 ( 2) , 则称 γ ( x0i, x0j) 为它们的关联度, 即

式中: ρ 称为分辨系数, 一般取0. 5。

关联度反映序列之间的相似程度, γ ( x0i, x0j) 越大, 表明x0i和x0j变化规律越接近。

OMGM ( 1, n) 数学模型构建步骤如下, 其预测流程如图1 所示。

第一步: 数据预处理

将x01, x02, …, x0n分别按照式 ( 1) 进行变换, 可得到Y0:

式中i = 1, 2, …, n; k = 1, 2, …, m。

根据定义3, γ ( y0i, y0j) 是以 λ1i, λ2i, λ1j, λ2 j为自变量的函数。显然, 通过调节自变量, y0i和y0j的关联度能得以提升。因此, 优化可变权重, 可改善Y0中各量间的关联度。

第二步: 计算Y1和Z1

定义4[10]设y0i= [y0i ( 1 ) , y0i ( 2 ) , …, y0i ( m) ]T为非负序列, 则y1i为y0i的1 - AGO序列, 即

y0i的背景值生成序列为z1i, 即

式中: βi为背景值权重系数, 0 < βi< 1。

若Y1= [y11, y12, …, y1n]和Z1= [z11, z12, …, z1n], 设z1 ( k) =[z11 ( k) , z12 ( k) , …, z1n ( k) ]; k = 2, …, m, 则

同理, Y0=[y0 (1) , y0 (2) , …, y0 (m) ]T;Y1=[y1 (1) , y1 (2) , …, y1 (m) ]T。

第三步: 针对Y0建立MGM ( 1, n) 模型。

式中k = 2, 3, …, m。

基于最小二乘法, 对模型 ( 7) 中参数A、b进行整定:

求取模型 ( 7) 的离散时间响应函数为

对式 ( 9) 进行累减, 进一步求得MGM ( 1, n) 的预测模型:

第四步:求取OMGM (1, n) 模型。

根据式 (3) 反推可得

式中i = 2, 3, …, m。

综合式 ( 3) — ( 11) , OMGM ( 1, n) 模型的预测精度取决于可变权重和背景值权重系数。因此, 参数配置成为关键问题。

1. 3 评价指标

在多变量灰色预测时应主要关注主行为序列的预测效果。采用平均相对误差E、方均根误差S对模型进行评价。

E衡量模型的预测精度, E越小表明精度越高, 其表达式为

式中: x01 ( k) 为主行为序列的第k个数据;为主行为序列的第k个数据的预测值。

衡量模型的预测稳定度为S, S越小表明模型的预测稳定性能越好, 其表达式为

2基于多目标粒子群算法的参数配置

粒子群算法 ( Particle Swarm Optimization, PSO) 是一种迭代优化算法: 初始点为随机值, 基于速度- 位置迭代规则寻找最优解[11]; 解的优劣程度取决于目标函数的选取, 即适应度函数的构造。

为了进一步改善模型的预测精度和稳定性能, 以评价指标最小值为目标函数, 构建1 个多目标的适应度函数f ( x) , 即

式中: x为主行为序列; E为x的均相对误差; S为x的方均根误差。

本文采用标准粒子群优化算法求解模型中参数。速度- 位置迭代规则为

式中: r1和r2为[0, 1]内取值的随机数; c1和c2称为学习因子, 通常取2; ω 为惯性权重因子, 取值范围为[0. 9, 1. 2], 其表达式为

式中: t为迭代次数; tmax为最大迭代次数。

基于PSO算法配置OMGM ( 1, n) 模型中参数的流程为

1) Step1 初始化。设定群体规模N、粒子维数为3n, 随机配置粒子的初始位置和速度、迭代次数tmax、个体极值pid和全局极值pgd。

2) Step2 计算适应度函数值。根据式 ( 14 ) , 计算每个粒子的适应度函数值f ( x1) , f ( x2) , …, f ( xN) 。

3) Step3 更新pid和pgd。比较f ( x1) , f ( x2) , …f ( xN) 与f ( pid) 的值, 若比f ( pid) 小, 则将pid更新为当前粒子; 比较f ( x1) , f ( x2) , …, f ( xN) 与f ( pgd) 的值, 若比f ( pgd) 小, 则将pgd更新为当前粒子。

4) Step4 更新粒子。按照式 ( 15 ) 改变粒子的位置和速度。

5) Step5 停止条件。迭代次数是否达到最大迭代次数, 若是则输出全局最优参数[λbest, βbest], 程序结束, 否则转至步骤2。

3 算例分析

本文以文献[6]中某市1998—2004 年全社会用电量x01、工业产值x02以及农业产值x03为基础数据, 建立了OMGM ( 1, 3 ) 模型和3 种传统的MGM ( 1, n) 模型, 分别预测2005—2006 年的全社会用电量, 其预测值如表1 所示。

为验证双变权缓冲算子优化模型的有效性, 本文采用了4 种模型进行对比分析。其中, 模型1 是以x01和x02为变量的MGM ( 1, 2) 模型; 模型2 是以x01和x03为变量的MGM ( 1, 2) 模型; 模型3 是以x01~ x03为变量的MGM ( 1, 3) 模型; 模型4 是本文所提模型。

PSO算法中参数选取如下: c1= 2, c2= 2, ωmax=1. 2, ωmin= 0. 9, 群体规模N取40, 最大迭代次数取2000, 粒子维数为9。计算得到OMGM ( 1, 3) 模型的最优参数:

根据式 ( 2) , 计算各变量间的关联度如表2 所示, 其中y01~ y03分别为x01~ x03的预处理数据。

从表2 可以看出, 数据预处理后, 各变量间关联度得到了很好改善, 其中 γ ( y01, y02) 较 γ ( x01, x02) 提升了20. 588% 。

全社会用电量预测及其评价指标如表3 所示。

由于传统模型受变量间关联度的影响, 关联度低的变量会降低模型的预测精度, γ ( x01, x03) 小于γ ( x01, x02) 。从表3 可以看出, 模型2 的预测精度低于模型1。

对于模型4, 初始数据经 λ 算子预处理后, 该模型摆脱了初始数据关联度的制约, y01、y02和y03之间的关联度得到了提升, 从而提高模型的预测效果。OMGM ( 1, 3) 模型的预测精度和稳定性能均优于传统模型。

拟合值的相对误差曲线如图2 所示。

模型1 不含x03, 不参与农业产值的拟合; 模型2不参与工业产值的拟合; 模型4 充分利用了影响因素x02和x03, 其拟合结果中包含所有因素, 模型4 所对应曲线的峰值出现较早, 曲线较为平缓, 其拟合效果更好。

4 结论

1) OMGM ( 1, n) 模型在建模过程中不需要进行变量优选和舍弃次要影响因素, 充分利用了初始数据的信息。

2) 以评价指标最小值为目标, 构造了多目标适应度函数, 基于PSO算法进行参数整定保证了OMGM ( 1, n) 模型的预测精度和稳定性能。

3) 在中长期电量预测中, OMGM ( 1, n) 模型能够取得满意的电量预测精度, 在工程上具有良好的应用价值。

参考文献

[1]王允平, 黄殿勋, 熊浩清, 等.智能电网环境下采用关联分析和多变量灰色模型的用电量预测[J].电力系统保护与控制, 2012, 40 (1) :96-100.WANG Yunping, HUANG Dianxun, XIONG Haoqing, et al.Using relational analysis and multi-variable grey model for electricity demand forecasting in smart grid environment[J].Power System Protection and Control, 2012, 40 (1) :96-100.

[2]方仍存, 周建中, 张勇传, 等.基于粒子群优化的非线性灰色Bernoulli模型在中长期负荷预测中的应用[J].电网技术, 2008, 32 (12) :60-63.FANG Rengcun, ZHOU Jianzhong, ZHANG Yongchuan, et al.Application of particle swarm optimization based nonlinear grey Bernoulli model in medium-and long-term load forecasting[J].Power System Technology, 2008, 32 (12) :60-63.

[3]周德强.改进的灰色Verhulst模型在中长期负荷预测中的应用[J].电网技术, 2009, 33 (18) :124-127.ZHOU Deqiang.Application of grey Verhulst model in middle and long term load forecasting[J].Power System Technology, 2009, 33 (18) :124-127.

[4]王大鹏, 汪秉文.基于变权缓冲灰色模型的中长期负荷预测[J].电网技术, 2013, 37 (1) :167-171.WANG Dapeng, WANG Bingwen.Medium and long-term load forecasting based on variable weights buffer grey model[J].Power System Technology, 2013, 37 (1) :167-171.

[5]张健美, 周步祥, 林楠, 等.灰色Elman神经网络的电网中长期负荷预测[J].电力系统及其自动化学报, 2013, 25 (4) :145-149.ZHANG Jianmei, ZHOU Buxiang, LIN Nan, et al.Prediction of mid-long term load based on grey Elman neural networks[J].Proceeding of the CSU-EPSA, 2013, 25 (4) :145-149.

[6]王大鹏.灰色预测模型及中长期电力负荷预测应用研究[D].武汉:华中科技大学, 2013.WANG Dapeng.Research on the application of grey forecasiting model and medium and long-term power load forecasting[D].Wuhan:Huazhong University of Science and Technology, 2013.

[7]邢棉, 杨实俊, 牛东晓, 等.多元指数加权电力负荷灰色优化组合预测[J].电网技术, 2005, 29 (4) :8-11.XING Mian, YANG Shijun, NIU Dongxiao, et al.Research on grey optimization combination power load forecasting based on multivariate exponential weighting[J].Power System Technology, 2005, 29 (4) :8-11.

[8]李伟, 袁亚南, 牛东晓.基于缓冲算子和时间响应函数优化灰色模型的中长期负荷预测[J].电力系统保护与控制, 2011, 39 (10) :59-63.LI Wei, YUAN Yanan, NIU Dongxiao.Long and medium term load forecasting based on grey model optimized by buffer operator and time response function[J].Power System Protection and Control, 2011, 39 (10) :59-63.

[9]EL-FOULY T H M, EI-SAADANY E F, SALAMA M M A.Grey predictior for wind energy conversion systems output power prediction[J].Power System, 2006, 34 (21) :1450-1452.

[10]刘思峰, 谢乃明.灰色系统理论及其应用[M].北京:科学出版社, 2008:25-40.LIU Sifeng, XIE Naiming.Grey system theory and its application[M].Beijing:Science Press, 2008:25-40.

变权组合预测 篇4

互联网最早于1969年起源于美国, 可以说互联网是20世纪最伟大的发明之一。时至今日, 信息化浪潮正席卷全球, 方兴未艾。而我国正式接入互联网是在1994年, 虽然, 我国互联网的起步晚了许多, 但我国互联网事业经过了10多年的发展, 已经走过了导入期, 走上了快速发展的道路。

江苏省在互联网发展建设和应用方面在全国处于领先的位置, 是全国网络资源密集、管理水平较高的省份, 互联网在促进江苏经济发展和社会进步, 提高人民群众生活质量等方面发挥着越来越重要的作用, 做出了重要的贡献。对互联网用户数未来的发展趋势进行准确预测, 是一项十分有意义的工作。

然而, 到目前为止, 各年份《江苏统计年鉴》中能查到的“江苏省互联网用户数”数据范围是1996—2007年, 数据样本量只有12个, 且增长率很不稳定。这就使得传统的定量建模和预测方法不再适应。本文应用灰色系统的最新研究成果——变权缓冲算子, 建立江苏省互联网用户人数的灰色预测模型, 对2008至2012年间江苏省互联网用户数的发展趋势进行预测分析。

2、变权缓冲算子与GM (1, 1) 模型的基本原理

引理1设为非负的系统行为数据序列,

其中, λ为可变权重, 0<λ<1, k=1, 2, …n。

则当X为单调增长序列, 单调衰减序列或振荡序列时, D皆为弱化缓冲算子。

定义1设系统行为数据序列为, r (k) 为数据序列X中x (k) 到x (n) 的平均变化率;D为作用于X的缓冲算子, X经缓冲算子D作用后所得数据序列为则称为缓冲算子D在k点的调节度。

调节度反映了缓冲算子对原始序列的作用强度。不同的缓冲算子对序列的作用强度不同, 本文试图通过可变权重来调整缓冲算子对原始序列的作用强度, 下面通过以下定理来说明调节和可变权重之间的关系。

引理2变权弱化缓冲算子D1在各点的调节度为常数, 且等于可变权重, 即δ (k) =λ。

变权缓冲算子能够有效解决传统的缓冲算子不能实现作用强度的微调, 从而导致缓冲作用的效果过强或过弱的问题。与高阶作用算子相比, 其作用强度具有更好的可控性与灵活性, 因而能够有效地解决冲击扰动数据序列在建模预测过程中常常出现的定量预测结果与定性分析结论不符的问题。

为了有效提高灰色模型的预测精度, 本文采用具有最优背景值的GM (1, 1) 模型进行预测, 则灰色微分方程的最小二乘估计参数序列为

3、江苏省互联网用户数预测模型的建立与预测

1996—2007年江苏省互联网用户数与增长率的数据, 见表1。

数据来源于《中国统计年鉴》:1997—2008

从以上数据序列可以发现, 1996~2001年江苏省互联网网户数的增长势头很猛, 平均增长率为378.7%, 且呈现出下降的趋势。上网户数高速增长的主要原因在于1996~2001年间Internet在我国刚刚兴起, 再加上各级政府大力宣传、推广Internet。根据我们的经验, 如此高的增长率不可能一直保持下去的。因此, 直接用现有数据建模预测, 2001年预测值为296.41万户, 与实际值相比预测误差高达185%, 这样的结果是不能接受的。要进行若干年后上网户数的预测, 就要弱化序列的增长趋势。本文基于以上数据, 首先利用变权缓冲算子进行处理。由于1996~2001年平均增长率高达378.7%, 因此, 我们认为合理的调节度δ1 (k) 应该在0.5以上, 分别取δ1 (k) =λ=0.5, 0.6, 0.7三种情况, 以1996~2000年的数据建立GM (1, 1) 模型来预测2001年以后的上网户数。

(1) 取λ=0.5, XD1= (164.35, 165.15, 167.74, 178.86, 255.91, 328.5) , 建立GM (1, 1) 模型的时间响应式:

(2) 取λ=0.6, XD1= (131.53, 132.47, 135.58, 148.92, 241.38, 328.5) , 建立GM (1, 1) 模型的时间响应式:

(3) 取λ=0.7, XD1= (230.01, 230.48, 232.04, 238.71, 284.94, 328.5) , 建立GM (1, 1) 模型的时间响应式:

由表1可以看出, 取λ=0.6的变权弱化算子的效果最好, 其2002~2007年的预测结果几乎与原始数据重合, 相对预测误差均小于4%, 而λ=0.5, 0.7的变权弱化算子的相对误差都要显著高于λ=0.6的情况, 可见, 可变权重λ取为0.6相对较为合适。

按照λ=0.6弱化缓冲算子作用后建立G M (1, 1) 模型的预测结果显示 (图1) , 2008~2012年间, 江苏互联网用户人数将继续保持稳定增长态势, 并将在2012年突破1000万户。

4、结论

本文根据变权缓冲算子和最优背景GM (1, 1) 模型的方法, 对“江苏省互联网用户数”进行分析预测。结果显示, 本文所采用的预测方法和模型具有较高的精度, 且预测结果的精度不受预测周期长短影响。江苏省互联网用户数的发展将继续保持稳定增长态势, 互联网在促进江苏经济发展和社会进步, 提高人民群众生活质量等方面也将发挥着越来越重要的作用。

参考文献

[1]张荣.中国互联网发展现状分析[J].西北电力技术.2004, (06) .

[2]蔚淑君.我国互联网发展的经济思考[J].北方经济.2005, (05) .

[3]乐宁.中国互联网发展现状及问题分析——《第十九次中国互联网络发展状况统计报告》解析[J].通信世界.2007, (06)

[4]王正新, 党耀国, 刘思峰.变权缓冲算子及缓冲算子公理的补充[J].系统工程.2009, 27 (1) :113~117.

[5]王正新, 党耀国, 刘思峰.变权缓冲算子及其作用强度的研究[J].控制与决策.2009, 24 (8) :1218~1222.

上一篇:招聘效率下一篇:农业三项工程