模糊模型预测

2024-10-24

模糊模型预测(精选12篇)

模糊模型预测 篇1

1 引 言

短期负荷预测是电力系统安全经济运行的基础,已逐步发展成为电力系统自动化领域中的重要研究方向之一。由于电力系统是一个时变参数和具有动态特性的大系统,各种传统的负荷预测技术已经越来越难以满足电力部门的要求,建立高质量的负荷预测模型愈显得重要和迫切[1]。而对难于建模的模糊系统,常常借助于模糊辨识方法来解决问题。常用的模糊辨识[2]方法有:直接建模法、相关分析法、基于参考模糊集的模糊辨识方法、加权动态聚类分析法等。文献[3,4]提出了基于模糊推理的模糊插值建模方法,主要用分片线形插值函数来描述系统的非线性。为了进一步提高基于模糊插值的模糊系统辨识的适用性,对一般非线性系统,本文提出了一种基于参数可调隶属函数的模糊插值建模方法。设计了一类参数可调的隶属函数,用它作为插值函数,调整其参数,从而可改变函数的形状,使之能逼近常用的三角形、高斯型等隶属函数,于是得到一个较适用的模型框架,将其应用于短期负荷预测,获得良好的效果。

2 基于参数可调隶属函数的模糊插值建模

首先考虑系统的自由运动(即输入u(t)=0)的建模问题。设Y=[a1,b1],Y˙=[a2b2],分别为y(t)、y˙(t)的论域,即y(t)∈Y,y˙(t)Y˙,A={Ai}(1≤ip),B={Bi}(1≤ip)分别为相应论域上的模糊划分(即基元组),其中AiF(Y),BiF(Y˙)叫做基元,yi,y˙i分别是Ai,Bi的峰点,满足条件:a1≤y1≤y2≤…≤ypb1,视A,B为语言变量,由此形成一组模糊推理规则库,如下所示:

if y(t) is Ai theny˙(t) is Bi (1)

定义参数可调隶属函数:

Ai(x)=exp(-|x-xid|c)(i=12p)(2)

函数是以yi为轴的左单调递增右单调递减函数,满足凸函数的要求,可以作为插值基函数。其中c,d为可调参数。在上面假设条件下,基于式(1)的一般非线性系统的自由运动可用如下带参数的插值模型描述:

F(x)=Σi=1nAi(λiθ)yi(3)

可调参数为λi,c,d,记θT=(c,d)。

证明:

x(t)∈xi,xi+1时,由式(1)并注意插值函数的构造,有:

F(x)=Σi=1nAi(x)yi=Ai(x)yi+Ai+1(x)yi+1=exp(-|x-xid|c)yi+exp(-|x-xi+1d|c)yi+1

由于x(t)是xi,xi+1的内分点,于是有:

x(t)=xi+λixi+11+λi

λi=x(t)-xixi+1-x(t)(4)

所以

|x-xid|c=|λi(xi+1-xi)d(1+λi)|c

|x-xi+1d|c=|xi-xi+1d(1+λi)|c

Ai(x)和Ai+1(x)均化为可调参数λiθT=(c,d)的函数,于是当x(t)∈X时,有式(3)存在。

插值函数中的参数c,d影响函数的形状。当d确定,c越大,函数形状越接近矩形,灵敏度差,所以c的取值应尽量小。当c确定,d越大,灵敏性越好,所以d取值应尽量大。

3 基于粒子群的参数优化算法

这里采用粒子群优化算法[5](PSO)优化模型中的参数cd

设在一个D维的目标搜索空间中,有m个粒子组成一个群落,其中第i个粒子的位置为xi=(xi1,xi2,…,xiD),其速度vi=(vi1,vi2,…,viD)。在每次迭代中,粒子通过跟踪两个“极值”来更新自己。记第i个粒子本身搜索到的最优位置为pbesti=(pbesti1,pbesti2,…,pbestiD),整个粒子群搜索到的最优位置为gbest=(gbest1,gbest2,…,gbestD)。

vid(k+1)=wvid(k)+c1r1pbestid(k)-xid(k)

+c2r2gbestd(k)-xid(k) (5)

xid(k+1)=xid(k)+vid(k+1)

(i=1,2,…,m;d=1,2,…,D) (6)

式中:c1,c2——学习因子,c1≥0,c2≥0;r1,r2——随机数,r1,r2∈[0,1];vid∈-vmax,vmax,vmax为常数,由用户设定;w——非负常数,称为惯性权重,用来控制历史速度对当前速度的影响程度,一般在[0.1,0.9]之间取值。

将PSO作为学习算法来优化模型中的参数关键在以下两点:

(1)建立PSO粒子的维度空间与系统参数之间的映射。粒子群中每个粒子的维度分量都对应为系统的一个参数,也就是说模糊系统有多少个参数,作为学习算法的PSO中的每个粒子就应该有多少维。

(2)使用模糊系统的均方差作为PSO的适应函数,通过PSO算法强大的搜索性能使系统的均方差最小化。因此给出PSO的适应函数如下:

ΜSE=12Σi=1nys-Σi=1nAi(λiθ)yi2 (7)

式中:ys——期望输出,当x(t)∈xi,xi+1取p个等间距离散点时,则λi有计算公式:

λi=ip-i(i=012p-1)

下面给出基于粒子群算法的参数优化步骤:

步骤1:确定输入论域X。求出x(t)的最大值xmax和最小值xmin,论域X=xmin,xmax。

步骤2:计算峰点。给定插值点数n:

h=xmax-xminn-1

按下式计算等距划分的节点(即峰点)λi:

λi=xmin+(i-1)·h (i=1,2,…,n)

步骤3:初始化粒子群,包括群体规模,粒子维度,每个粒子的位置和速度。设定最大惯性权值ωmax,最小惯性权值ωmin,学习因子c1、c2,最大速度vmax,误差精度ε和最大迭代次数Tmax。

步骤4:粒子的个体极值pbesti和全局极值gbest初始化,pbesti=gbest=∞。

步骤5:计算每个粒子的适应度值。

步骤6:对每个粒子,用它当前的位置与其极值pbesti比较,如果当前的位置所对应的适应度值较好,则用当前位置替换pbesti

步骤7:每个粒子的个体极值pbesti都要与全局极值gbest比较,若有某个粒子的个体极值pbesti优于全局极值gbest,则gbestpbesti替换。

步骤8:根据式(5)、(6)更新粒子的速度和位置。

步骤9:如果满足结束条件(误差足够好或到达最大迭代次数),那么循环结束,继续执行步骤10;否则,回到步骤5。

步骤10:全局极值gbest与优化问题的最优解对应。

4 短期负荷预测仿真

电力系统是个典型的非线性系统,负荷作为电力系统的重要组成部分,也体现出非线性的特性。这种特性表现在一系列负荷历史记录中呈现一种数值上的随机变化状态和负荷变化的周期性。一般随温度及日照小时的季节变化,负荷模型逐渐发生变化,但对于短期负荷预测来说,季节相对于每天24 h是缓慢变化的,因此,当以近几日负荷为基础,构成基本负荷,对未来24 h负荷进行预测时,就不用考虑季节因素了。利用负荷历史记录,得到如图1的一周日小时负荷曲线。

从图中可以看到负荷的日期变化特点,尽管每日负荷有一定随意性,但负荷曲线在形状上有一定相似性。负荷不仅有按天的周期变化特性,还有按星期的周期变化特点。大致呈现出周末两天负荷较低,工作日负荷较高,这些都与人们的日常生活习惯紧密相连。

依据负荷历史资料建立的模型能否正确描述或较好地反映研究负荷变化过程的特征,还需要进行检验。检验标准就是:实际观测到的样本序列值yt与预测估计得到的样本值y^t之差构成残差序列:

a^t=yt-y^t(t=12Ν)

是不是白噪声的一个样本序列。

图2为实际负荷与预测负荷的残差序列自相关函数,其置信度为95%,根据规定,残差序列是白噪声样本序列,所以所要检验的随机模型是合适的。根据负荷历史记录资料,建立工作日72 h的数学模型并给定模型识别和模型参数估计,确定一个具体的预测模型。每4 h选取一个插值点并选择合适的粒子群算法参数,运行Matlab仿真程序,当达到目标函数设定值时,得到参数c=2.11,d=0.3,此时的插值模型与真实模型相应的比较曲线见图3所示。

取某日24 h的负荷预测结果分析,可以看到,绝对平均误差为2.60%,效果比较理想,而负荷峰值相对误差为5.29%,相当接近合格点(相对误差小于等于5%)的要求,不合格点数非常少。并且预测曲线在负荷波动较大的峰、谷时段的预测效果较好,其它时段拟合也较好。插值模型基本上反映了实际系统的动态特征。参数调节后得到的插值基函数(模糊论域划分),两个相邻模糊集合重叠因子是α=0.5,满足隶属函数完备性中重叠因子0.3<α<0.8的要求;而且隶属函数的形状很合理,近似接近高斯型隶属函数,从而满足了隶属函数的语义性。也就是说,无论从模型的对比曲线和误差数据,还是从调节后参数得到的模糊论域划分分析,这种调节参数的插值模型都是合理的。

5 结束语

基于参数可调隶属函数的模糊插值建模方法在插值点间利用曲线拟合,因此存在一定的截断误差,在一定程度上影响了模型的精度。但常规插值基函数一经确定,建立的模型也随之确定,如果想用其它插值基函数对系统建模时,还要重新建立系统模型,这样不仅浪费资源,也不易实现。建立一个负荷预报程序常常不是一劳永逸的工作,既使一个负荷预报员经过各种判断,决定采用某种方法建立一种模型,也必须在预报的过程中随时对已建立的模型有效地进行校正,以确保这个方法或模型能在较长的预报时间中适用。因此本文设计的一类可调插值函数应用于模糊推理建模,虽然牺牲了一定的逼近精度,但得到的“泛模型”适应度很广,而且如实地反映了系统的动态行为,近似模型对真实模型的逼近程度也很高,能够满足要求。

参考文献

[1]AMJADY N.Short-Term Hourtly Load Forecasting Using Time-Series Modeling with Peak Load Estimation Capability[J].IEEE Transactions on Power Systems,2001,16(4):798-805.

[2]何平,王鸿绪.模糊控制器的设计及应用[M].北京:科学出版社,1997:245-276.

[3]李洪兴.模糊控制系统的建模[J].中国科学:A辑,2002,32(9):72-78.

[4]李洪兴.从模糊控制的数学本质看模糊逻辑的成功[J].模糊系统与数学,1995,9(4):1-14.

[5]王辉,钱锋.群体智能优化算法[J].化工自动化及仪表,2007,34(5):7-13.

模糊模型预测 篇2

设计15种模糊气象预测方法,对棉花产量进行预测.研究结果表明,以相关系数和条件概率分别构成模糊向量和模糊矩阵,最后抉择为最佳的`(Y)=(X)B(・)(R)P数学模型.通过一个实例195年次运算,有12种模糊气象预报方法回报准确率达100%.

作 者:杨中旭 李秋芝 杜东英 侯桂明 邓国生 高东玉 王春云 陈平YANG Zhong-xu LI Qiu-zhi DU Dong-ying HOU Gui-ming DENG Guo-sheng GAO Dong-yu WANG Chun-yun CHEN Ping 作者单位:杨中旭,李秋芝,侯桂明,邓国生,高东玉,王春云,陈平,YANG Zhong-xu,LI Qiu-zhi,HOU Gui-ming,DENG Guo-sheng,GAO Dong-yu,WANG Chun-yun,CHEN Ping(山东省聊城市农科院,山东,聊城,25)

杜东英,DU Dong-ying(山东省聊城市东昌府区湖西办事处,山东,聊城,252000)

模糊模型预测 篇3

关键词 区间序列;模糊回归模型;最小二乘法;上证指数;预测

中图分类号 C812 文献标识码 A

1 引 言

随着人们对风险控制要求的提高,传统的统计方法在处理不确定数据时受到许多限制.Tanaka等[1]率先提出模糊线性回归模型,将模糊数学引入到统计学中,在此基础上国内外很多学者不断对模型进行发展和推广,Diamond[2]基于三角模糊数上的度量建立模糊线性最小二乘模型.Nather[3],Savic[4],Kao等[5]基于不同的准则对Diamond模型进行了改进和发展.近年来,李竹渝等[6-8]引入对称三角模糊数的概念,对金融区间观测数据定义了模糊金融时间序列的条件平稳性以及模糊金融收益率序列,并在此基础上构建模糊自回归模型,在模糊性指标最小且满足模糊金融收益率实际意义的背景下利用模糊线性规划方法来估计模型中的未知参数,并且利用模糊集合的择近原则对模型拟合效果进行了评价.随后李竹渝等[8]对模糊自回归模型加以改进,构建分别基于模糊金融收益率序列集中程度与波动程度变化的双线性回归模型,并且利用模糊最小二乘法来估计未知参数,基于平均平方误差与平方绝对误差考察模糊自回归与模糊双线性回归进行比较.实证证明模糊双线性回归改进了模糊自回归并且具有更好的拟合结果.徐蒙等[9]对模糊双线性回归模型进行非线性改进并给出对称二次型模型及评价标准.

在模糊回归模型中,可以考虑回归系数是模糊的,也可以考虑清晰输入、模糊输出,或者模糊输入、模糊输出.本文从清晰输入模糊输出的角度出发,在探讨收益率模型形式的基础上,围绕李竹渝[6],[7],王泰积等[10]提出的基本结构,针对徐蒙等[9]提出的对称二次型进行推广,给出一般二次回归模糊回归模型及相应的评价标准,并结合实证表明该模型具有更好的拟合结果.

2.2 模型的建立与求解

模糊模型预测 篇4

定义1实数域R上的模糊数具有隶属函数

则称 为三角模糊数。三角模糊数 被简记为 当l=m=r三角模糊数退化为普通实数。

定义2模糊三角数 期望值为

其中λ∈[0, 1], λ值的选择取决于决策者的风险态度。当λ>0.5时, 表示决策者是追求冒险的;当λ=0.5时, 表示决策者是风险中立的;当λ<0.5时, 表示决策者是厌恶风险的。

二、模糊灰色预测模型FGM (1, 1) 模型

三角模糊数序列的期望值序列为

其中 期望值序列一次累加列为 其中

上式中B为 (n-1) ×2的矩阵, 由于n-1>2, 即n>3, 且B为列满秩, 在最小二乘准则下, 解得 从而可以确定参数p和u。由于GM (1, 1) 的白化模型为 从而得到FGM (1, 1) 的白化模型为: 故FGM (1, 1) 的白化模型的响应式为:

三、图书出版量预测

采集2000年~2004年全国图书出版量x (0) 的数据如下 (单位:百种)

x (0) ={ (415, 465.5, 516) , (749, 840.5, 932) , (1063, 1193.5, 1324) , (1363, 1529.5, 1696) , (1646, 1846.5, 2047) }, 运用本文建立的FGM (1, 1) 模型对图书出版量进行预测。采用前四个三角模糊数数据进行建模, 运用MATLAB编程计算, 得到在不同的风险态度下, 各年图书出版量期望值数据的预测值及相应的预测相对误差见下表。

由上表数据可以看出, 针对不同的风险态度, 生成模型的计算数据可以较好的模拟建模数据。FGM (1, 1) 预测模型在对图书出版量的模拟性能和预测性能方面的改善是显而易见的, 故该模型是可行的、合理的。

四、结语

由于图书出版受到社会、经济、文化等多方面的影响和制约, 仅以历史数据的变化规律来进行较长期的外推趋势预测, 无法使得预测结果完全精确。为此, 要结合未来的环境条件分析图书出版量的发展趋势, 从而更全面、准确地把握图书出版的发展规律, 更好地为决策提供参考依据。

参考文献

[1]Baoding Liu, Yian-Kui Liu.Expected Value of Fuzzy Variable and Fuzzy Expected Value Models[J].IEEE TRANSACTIONS ON FUZZY SYSTEMS, 2002, 10 (4) :445~450

[2]Yun–Shiow Chen, Fuzzy ranging and quadratic fuzzy regression[J].computers and mathematics with application1999, 38:265~279

[3]邓聚龙:灰理论基础[M].武汉:华中科技大学出版社, 2003

模糊模型预测 篇5

飞机战伤评估是在了解抢修环境状况、鉴定飞机战伤程度等情况后,综合所有信息,最终确定战伤飞机如何修理,并估算修理时间,规定要完成的修理内容以及估计修理后飞机的使用能力等.评估人员利用飞机设计、修理等方面的`经验,对战伤飞机修理做出决断,其中大量涉及逻辑推理和模糊量,如抢修环境、战伤飞机操纵状态、在规定时间内损伤能否完成修理等.

作 者:贾忠湖 柳文林 侯志强 郑小洪  作者单位:海军航空工程学院 刊 名:航空维修与工程  PKU英文刊名:AVIATION MAINTENANCE & ENGINEERING 年,卷(期):2009 “”(3) 分类号: 关键词: 

模糊模型预测 篇6

关键词:人工神经网络;模糊理论;短期负荷预测;BP算法

中图分类号:TM715 文献标识码:A 文章编号:1000-8136(2009)30-0005-02

电网是电力系统的重要组成部分,提高负荷预测准确率,对电网安全、稳定、经济运行有着极其重要的意义。负荷预测误差小,则电网的开机、线路的潮流都在预计的范围内运行,电网的安全、稳定、经济运行就有了保障,还可以大大提高电力系统的经济效益。

在电力系统负荷预测的理论与实践相结合的方面,国内外许多的电力系统专家做了大量而有意义的工作。随着他们的不断探索,负荷预测从早期传统的弹性系数法、时间序列法、卡尔曼滤波分析法逐步发展到灰色模型法、专家系统法,伴随着计算机技术的发展和人工神经网络理论的不断完善,应用人工神经网络进行电力负荷预测得到了很大的发展,自从提出用人工神经网络进行电力负荷预测,充分利用了BP模型的非线性映射能力及自适应的学习能力,得到了较好的预测效果。

人工神经网络计算(ANN)是由具有非线性作用函数的神经元构成、进行大规模并行信息处理非线性模型结构,它可以模仿人脑的智能化处理,对大量非结构性、非精确性规律具有自适应功能,具有记忆功能、自主学习、知识推理和优化计算的特点,尤其是它的学习和自适应功能是常规算法和专家系统技术所不具备的。[2]因此,应用ANN对历史曲线进行拟合,能够达到十分满意的结果。并将该模型用于某地区电网的短期负荷,预测结果证明了它的有效性。

1神经网络BP模型

本文采用成熟的误差反向传播模型(ERROR BACK PROP

AGATION),简称BP模型。BP模型是一个多层前溃神经网络。BP模型由输入层、隐含层和输出层组成,其中隐含层可以是一层或是多层组成的。本论文采用单隐层的神经网络进行负荷预测,其模型网图见图1所示。这是一个三层的神经网络,其中输入层有i个节点、隐含层有j个节点、输出层有k个节点。BP算法的指导思想是:对网络权值(Vij,Wjk)的修正或阈值(θ,γ)的修正,使误差沿梯度方向下降。BP算法是一个工作信号正向传播和误差信号反向传播的过程。[1]

图1BP模型网络图

对于输入层每个神经元,其输入与输出相同。而对于隐含层或输出层的每个神经元,其神经元的输入为:

(1)

式中,i:前一層神经元;

Oi:神经元的输出;

Wij:神经元i与j的连接权值;

θj:神经元j的阈值。一般阈值θj为常数,并取(-1,+1)之间任意值。

定义误差函数Ep为各节点希望输出值与实际输出值之差的平方和:

(2)

式中,tpj:节点j的希望输出值;

Opj:节点j的实际输出值。节点j的实际输出值Opj由(1)

式的加权及阈函数决定,即:

(3)

选取S型函数为阈函数,则有:

BP模型的训练步骤如下:

(1)为所有的连接权值赋初值,并且确定阈值。

(2)输入一组训练样本。

(3)由给定的输入、阈值和连接权值,利用式(3)计算网络输出值。当输出值与期望值误差的平方和小于给定值时停止计算,否则向下顺序执行。

(4)根据输出计算值与实际值之间的偏差,由输出层反向逐层调整权值,甚至输入层,权值调整公式为:

式中,Wij(t)和θj(t)是训练过程中第t次循环结束后得到的,从节点i到节点j之间的连接权值和节点j的阈值;

ΔWij(t)和Δθj(t)是第t次循环结束后得到的相对应的调整量;a为冲量因子(0 < a < 1)。

基于梯度下降法可得出连接权值和阈值的调整量为:

ΔWij=ηδjOi ,Δθj=ηδj

当节点j为输出层的节点时:δj=Oj(1-Oj)(tpj-Oj)。

当节点j为隐含层的节点时: 。

式中,η为学习因子。

完成第四步后转回第三步。

2模糊理论的应用

从以上可以看出,BP模型算法的学习方式是梯度下降法。虽然它是神经网络(ANN)中比较成功的一个模型,但是这种算法由于迭代次数导致收敛速度太慢,而且存在局部极小点,特别是网络规模比较大时也就是神经元的数目较多时,这样的问题会比较明显,甚至会出现不收敛的情况。

这样就需要模糊理论与人工神经网络结合起来进行电力系统负荷预测。它同前者的区别是:采用普通神经网络的结构和神经元作为信息处理工具,而网络的输入量、输出量采用输入、输出信息的模糊隶属度。也就是说将输入量通过隶属度函数转化为模糊量后,再交给神经网络进行处理,以提高预测精度。[3]

电力系统短期负荷预测是对电网未来某一天到一周的负荷进行预测(本论文将对24 h进行负荷预测的研究)。负荷预测要考虑天气、节假日和季节对电力负荷的影响。因此需要建立这几个因素的隶属度函数。利用最大隶属度原则,在相同的约束条件下进行多目标优化,对函数F(x)=[f1(x),f2(x),…,fn(t)]构造相应的隶属度函数 ,且满足 ,并可用 表示第i个目标达到最优的程度, 越趋近于1,表示目标函数F(x)=[f1(x),f2(x),…,fn(t)]越趋近最优解。另外,为了降低求解规模,对1天的24点负荷每点建立1个预模型,第i点的输入输出函数为:Ljt′=fj(aj1′,… aji′)

式中,Ljt′ 是指第j个学习样本在第i点的规一化值,规一化函数为:

(4)

式中,Lji:指第j个学习样本第i点负荷的实际值;

Lji min:学习样本中第i点负荷的最小值;

Lji mix:学习样本中第i点负荷的最大值。

经过规一处理后,0< Lji′<1。fi是指第i点的输入输出函数;aj1′,…ajl′是第j个样本的影响因素值的隶属度向量,包括2个代表日类型的隶属度,3个代表最高温度的隶属度,3个代表最低温度的隶属度,3个代表平均温度的隶属度,5个代表光照的隶属度,5个代表雨量的隶属度。当学习完成后,将预测日当天影响因素的隶属度向量βj1′,…βjl′代入式(4),则可得第i点的负荷预测值。

3实例检验

本文利用人工神经网络的方法和神经网络与模糊理论相结合的方法对某地区的多个日负荷进行预测,考虑到主要成分或相关因素,保留较大的影响因素如雨天、晴天、高温天和休息天进行预测,所得结果见图2所示(圆点代表预测的负荷,三角代表实际的负荷)。

根据上面预测的一个月负荷的情况看来,可计算出负荷绝对误差的均值x =1.86,标准差σx=8.13,当x的置信限为

时,x的置信概率为 =

0.99995≈1,绘制曲线f(x),同时绘制理论正态曲线,见图3

(实线为模型预测的分布,虚线为实测的负荷分布)。

因为本文研究的是电力系统短期负荷预测,所以它必须精确(要求预测相对误差不超过4 %)。从上表中可以看到,采用普通的BP模型所得到的预测结果基本上都比4 %的;而采用组合式得到的预测结果基本上能够满足精确度的要求,而且误差普遍比用前一中方法小。因此,利用神经网络和模糊理论进行负荷预测能够满足电力系统实际的需要。

图2一个月的负荷预测图

图3负荷预测的正态分布图

4结论

利用神经网络和模糊理论的组合式负荷预测方法,它充分利用了神经网络和模糊理论各自的优点,发挥了ANN在处理非线性问题的能力,模糊理论在此基础上对神经网络所存在的问题进行了修正,使得预测结果能够更加满足实际的需要。最后的实际算例也证明了使用这种方法于实际情况的偏差系数也不大。但是应指出:①由于资料的有限性,本文仅某地区实际的一个月资料得到以上初步的结论,还有待于采用更多的资行验证;②对于具体时间进行负荷预测,如果此地区有负荷的误差资料,则可直接采用正态分布。

参考文献

1 丁坚勇、刘 云.基于负荷特征提取的神经网络短期负荷预测[J].高电压技术,2004.30(12):47~49

2 阎平凡、张长水.人工神经网络与模拟进化计算[M].北京:清华大学出版社,2000:73~74

3 程其云、孫才新、张晓星等.以神经网络与模糊逻辑互补的电力系统短期负荷预测模型及方法[J].电工技术学报,2004.19(10):53~58

4 赵宇红、唐耀庚、张韵辉.基于神经网络和模糊理论的短期负荷预测[J].高电压技术,2006.32(5):107~110

Artificial Neural Networks And Fussy Theory

Apply to Short-term Load Forecasting

Wei Wei,Wang Jin

Abstract:To the complexity that electric power system load forecasts, be improve the short-term load forecast accuracy, has adopt one kind of the model use of neural networks and fussy theory to load porecasting. The training speed being an algorithm’s turn to have overcome that tradition BP algorithm is slow, existence the part minimal point shortcoming, makes to forecast accuracy being great improvement. The example calculates the pragmatism and feasibility having indicated that algorithm.

模糊模型预测 篇7

煤层顶板的稳定性受多种因素的影响, 各因素之间的关系是动态、非线性的关系, 所涉及的领域包括工程地质、岩体力学、煤矿开采、自动检测技术等学科。由于冲击地压的发生原因和孕育条件的复杂性、多样性, 采用单一的冲击地压参数会给预测造成很大的误差, 因此, 对相关因素综合研究是煤层顶板稳定性预测的有效技术途径。对一般的工业过程建模, 应用神经元网络比较有效, 但对于对象是庞大数据的复杂的工业生产过程, 神经元网络就显得力不从心了。本文提出了基于势场拓扑的层次聚类算法和模糊C均值聚类算法融合, 以获得精确的聚类个数和隶属度;利用神经网络与模糊推理的融合, 构建模糊神经网络的合理结构;并对网络进行了优化, 以保持学习速度快且稳定。

1 影响冲击地压的因素

影响冲击地压的因素比较复杂, 主要有地质方面、开采技术、生产管理方面的因素, 如开采深度、顶板类型、顶板岩性、顶板厚度、煤层厚度、地质构造因素、开采地质条件、采煤方法等。本文考虑的影响冲击地压的主要因素如表1所示。

2 基于势场拓扑的层次聚类和模糊C均值聚类

在实际应用中, 由于数据分布的具体特征在聚类分析前是无法预知的, 且在模糊神经系统中, 模糊规则的提取是关键, 它涉及初始结构的确定[1]。然而模糊规则的获取通常由专家根据经验给出, 存在诸如规则不够客观、专家经验难以获取等问题。尤其对于多变量系统需要识别和建立规则的时间随规则数增加而以指数形式增长, 大大限制了模糊神经系统的使用范围。

本文采用基于势场拓扑的层次聚类算法 (PField-Clustering) , 主要优点在于能够得到不同粒度上的多层次聚类结构, 并发现任意形状的聚类且对噪声数据不敏感。基本思想是从发现状态空间思想出发, 引入数据势场描述数据对象间的相互作用和空间分布, 优选影响因子σ, 产生合理的势场分布, 然后将每个等势线 (面) 所包含的数据对象视为一个自然聚类, 将不同等势线 (面) 组成的嵌套结构视为类谱系图, 来实现不同层次的聚类划分, 获得数据的类别个数, 避免因任意给定聚类类别个数而带来的误差。

模糊C均值聚类 (FCM) 是用隶属度确定每个数据点属于某个聚类的程度的一种聚类算法。FCM采用模糊划分法, 利用每个给定数据点用值在[0, 1]间的隶属度来确定其属于各个组的程度, 利用层次聚类得出的类别数C, 输出C个聚类中心点向量和C×N的一个模糊划分矩阵, 该矩阵表示的是每个样本点属于每个类的隶属度。根据该矩阵, 按照模糊集合中的最大隶属原则, 就能够确定每个样本点归为哪个类, 从而得出不同影响因素对顶板稳定性的隶属度[2]。

3 基于信息融合的模糊神经网络模型

信息融合可把各个参数在空间或时间上冗余或互补的数据, 依据某种准则组合, 从而得出对现实环境更为准确、可靠的描述。它能弥补单个传感器信息不完全、部分信息不精确或不确定所造成的不足。本文将模糊技术的逻辑推理与神经网络方法结合起来, 以构成模糊神经网络, 从而提高系统的可靠性[3]。

3.1 构建模糊神经网络

本文采用如图1所示的MIMO系统的模糊神经网络结构[4]。

第一层:输入层, 该层的各个节点直接与输入向量的各分量xi连接, 起着将输入值x=[x1, x2, …, xn]T传送到下一层的作用。该层的节点数N1=n。

由聚类计算得出的最佳规则数为5, 由表1可知, 顶板岩性、开采方法、有无煤柱、炮采/综采各有

2个属性, 构造复杂程度有3个属性, 所以对于本系统来说共有16个输入节点。

第二层:在模糊系统中, 第一层的输入值都是有确定数值的清晰量, 而模糊推理过程是通过模糊语言变量进行的, 因而必须先把输入值匹配成相应语言变量语言值的隶属度, 进行模糊化操作。模糊化后该层的每个节点代表一个语言变量值, 如NB、PS等, 作用是计算各输入分量属于各语言变量值模糊集合的隶属度函数μji。其中隶属函数可以取不同的形状, 其中高斯型函数和钟型函数具有很好的光滑性, 图形没有零点且具有比较清晰的物理意义。针对煤矿顶板数据的特点, 本文所设计的模糊神经网络采用高斯型隶属度函数μji≜μAji (xi) , i=1, 2, …, n, j=1, 2, …, mi, n是输入量的维数, mi是xi的模糊分割数。隶属函数采用高斯函数表示的铃形函数, 则undefined, 其中, cij和σij分别表示隶属函数的中心和宽度。

第三层:每个节点代表1条模糊规则, 它的作用是用来匹配模糊规则的前件, 计算出每条规则的适用度。采用积-和-重心的模糊推理方法, 一般模糊规则的IF E THEN H (CF) 形式结合本文多判据输入系统的特点, 通过第二层得到前提条件的隶属度的情况下, 采用求积运算得出每条规则的适用度, 得到CF。可用式 (1) 或式 (2) 求出规则的适用度值:

undefined

式中:i1∈{1, 2, …, m1};i2∈{1, 2, …, m1};in∈{1, 2, …, mn};undefined。

该层的节点总数N3=m, 本系统N3=5。

对于给定的输入, 只有在输入点附近的那些语言变量值才有较大的隶属度值, 远离输入点的语言变量值的隶属度很小, 小于0.05时近似取为0。因此在αj中只有少量节点输出非0, 而多数节点的输出为0。

第四层:节点数与第三层相同, 即N4=N3=……=m, 它所实现的是归一化计算, 即undefined。

第五层:输出层, 实现的是清晰化计算, 即r为输出层的节点个数, 网络有r个输出:

undefined

式中:ωij相当于yi的第j个语言值隶属函数的中心值, 式 (3) 写成向量形式, 则为

undefined

式中:

假设各输入分量的模糊分割数是预先确定的, 那么需要学习的参数主要是最后一层的连接权ωij (i=1, 2, …n;j=1, 2, …, m) , 以及第二层的隶属函数的中心值cij和宽度σij (i=1, 2, …n;j=1, 2, …, mi) 。

取误差代价函数为undefined, 其中ydi表示期望输出, yi表示实际输出。上面所给出的模糊神经网络本质是一种多层前馈网络, 所以可以仿照BP网络用误差反传的方法来设计调整参数的学习算法。

本文采用的模糊神经网络结构:

第一层:输入层的节点个数为16, 每个节点分别对应样本数值。

第二层:有80个节点, 通过聚类处理后, 得出样本数据有5个类别, 所以每个输入变量都有5个模糊子集。本层的输出为正态型函数, 是每一个模糊子集的隶属度函数, 对于不同的属性, 如顶板岩性与开采深度等, 获得的节点不一定相同, 第二层的节点有许多没被激活, 即相应的节点不存在, 因此, 可以删除某些节点, 简化系统的结构, 对于已激活的规则节点, 每一个节点对应的规则条件都是唯一确定的。

第三层:有5个节点, 每一节点分别表示不同结论部分的规则。

第四层:有5个节点, 进行归一化运算。

第五层:有4个节点, 根据煤炭工业部提出的《缓倾斜煤层工作面的顶板分类方案》, 即网络的输出节点分别对应4个不同的稳定性等级, 即无冲击危险顶板、弱冲击危险顶板、中等冲击危险顶板、强冲击危险顶板。

本模糊神经网络的结构为16-80-5-5-4。

3.2 模糊神经网络权值的调整

对3个参数的调整采用BP进行调整。定义误差函数为undefined, 其中, ydi为给定的输出;yi为实际的输出。采用误差反传方法改变网络连接权, 那么, 误差信号将由第四层向第一层依次反传, 以实现学习过程。

模糊神经网络的训练中, 需要调节的3个参数:最后一层的连接权ωij、第二层隶属函数的中心值cij和宽度σij (i=1, 2, …, n;j=1, 2, …, mi) 。首先利用误差反传算法来计算undefined、undefined、undefined, 利用一阶梯度寻优算法来调节ωij、cij、σij, 而后采用自适应学习速率进行参数训练, 达到收敛快且误差较小 (过程略) 的目的。

4 仿真试验

样本数据选择是否得当, 直接影响训练时间和网络性能, 原则上各输入数据之间尽可能地互不相关或相关性小, 输入量必须选择那些对输出量影响大、且能够控制的训练数据。本文选取如表1所示的10个主要参数。

对采集到的样本数据, 先通过聚类处理。此外, 为避免数据溢出, 对输入变量中的定性变量采用归一化标准化处理法, 选取一定的阈值, 将顶板岩性、地质构造复杂程度、有无煤柱、开采方法、炮采或综采等作为定性变量来处理。对于某煤矿的96组数据对, 鉴于篇幅仅列示其中的部分样本 (见表1) 。

在仿真过程中, 模糊神经网络输入层的10个节点分别对应上述10个影响因素的值。下面给出在相同情况下, 图2、3分别为采用单一学习速率 (设学习速率为0.2) 和自适应学习速率的网络训练时间比较。

采用改进后的训练结果, 仿真结果收敛快, 且误差较小, 误差变化如图3所示。

5 结语

针对煤层冲击地压成因的特殊性, 本文提出了基于多源信息融合的模糊神经网络技术的预测模型。该模型将数据聚类与模糊神经元网络结合起来, 解决了多参数的信息融合问题, 获得了高性能的信息提取。同时, 在信息融合过程中利用已知的先验知识, 提高了实际系统的处理速度和适应性。通过仿真试验, 验证了该模型的有效性。将该理论应用于矿井煤层冲击地压的预测, 与煤矿安检系统结合, 可以更好地提高系统的融合性。

摘要:煤层冲击地压是煤矿重大灾害之一。冲击地压的发生是由多方面因素造成的, 具有模糊性、动态性, 表现为一个复杂的非线性动力学过程, 这使得冲击地压预测系统的数据处理不能按照常规的线性系统法进行处理。文章提出了多源信息融合的模糊神经元网络算法, 且基于势场拓扑层次聚类融合FCM算法的聚类思想, 将模糊集合理论引入神经元网络, 构成基于多判据信息融合的模糊神经元网络模型, 并对该网络进行了优化。通过仿真试验, 验证了该模型的有效性。

关键词:煤矿,煤层,冲击地压,预测模型,信息融合,模糊神经元网络,势场算法,层次聚类,FCM算法

参考文献

[1]高新波.模糊聚类分析及应用[M].西安:西安电子科技大学出版社, 2004:49~57.

[2]LIU Xiao-yue, SUN Ji-ping, FENG Su-min.NeuralNetwork Based on Ant Colony Clustering AlgorithmApplied to Predict the Satbility of the Roof in CoalMining:Sixth International Conference on IntelligentSystems Design and Applications[C].Jinan:2006:396~399.

[3]袁曾任.人工神经网络及其应用[M].北京:清华大学出版社, 1999.

[4]孙增圻, 张再兴.智能控制理论与技术[M].清华大学出版社, 2000:170~175.

模糊模型预测 篇8

2013 年世界卫生日主题“控制你的血压,减少心脏病突发和卒中风险”,可见高血压已成为全球瞩目的公共健康问题。高血压是一种常见的威胁人类健康的慢性疾病,位居引起死亡的十大危险因素之首。因此,有效控制血压对于提高人类的健康水平有重大现实意义。

《中国高血压防治指南》[1]指出,高血压是可以控制的疾病,有效地控制血压可以减少患者心脑血管及其他并发症的发生,进而提高患者的生存质量。Laura等人[2]通过研究发现,在老年人中使用阿替洛尔这类降压药会增加中风的风险; 赵艳平[3]通过对治疗原发性高血压的不同药物疗效进行分析,发现洛沙坦和非洛地平的联合用药降低血压变异性更为明显,患者预后更佳; 林彩美[4]利用统计分析的方法,研究抗高血压药物对治疗老年人高血压的效果,实验结果表明,卡托普利联合硝苯地平药物治疗高血压效果显著、不良反应少、易耐受,是治疗老年人高血压的安全有效用药方法。进行药物治疗是控制高血压的有效方式,通过对患者坚持服药程度和血压值进行分析。根据Thusitha等人提出的计算框架[5]从电子处方中计算出患者的MPR,进而建立二者之间的关系,利用遗传算法对所建立的模型进行评估优化,最终得出患者服药时间与血压的模型图。此模型的建立,不仅可以通过患者坚持服药程度对其血压趋势进行预测,还可以给患者提供坚持用药建议,对于高血压慢性病的控制与治疗有一定的指导意义。

1 高血压定义和状态分类

在没有使用降压药物的情况下,非同日测量3 次血压,收缩压≥140 mm Hg和( 或) 舒张压≥90 mm Hg,被诊断为高血压; 患者有既往高血压史,且目前正在服用降压药物,虽然血压低于140 /90 mm Hg,也被诊断为高血压[1]。通过对文献[6]进行研究与总结,现将使用的收缩压SBP( Systolic Blood Pressure) 及其状态定义如表1 所示。

单位: mm Hg

2 模型选择

根据山西省某医院提供的高血压数据,通过研究发现,患者的收缩压值和持续吃药时间近似符合贝塔分布曲线。由于正态分布的曲线分布特点是以均数为中心,左右两边呈现对称性并由均数处开始,分别向左右两侧呈逐渐均匀下降趋势。而相比于正态分布,贝塔分布具有多种不同的分布形状,其中包括对称的和非对称的分布,根据参数的不同呈现出完全不同的形状,体现出良好的适应性和普适性。在此,选择贝塔分布对数据进行研究分析。

2. 1 贝塔分布特点

贝塔分布的密度函数定义如下:

其中,a、b表示待确定的参数,。由式( 1) 可知,贝塔分布函数的形状由参数a和b确定,属于广义上的正态分布,分布的形状是通过调节a和b的参数值而得到的。因此,主要通过对两个参数a和b的优化来确定最终的曲线。

2. 2 MPR值的计算

此处所研究的是患者持续吃药时间与收缩压的关系,由式( 1) 可知,该分布函数的自变量范围为( 0,1) ,因此,文中将持续吃药时间转换为MPR进行研究。MPR是计算有效药物供给时间在一个评估期[5]EP内占有的比例。EP指从病人的电子处方记录中选取感兴趣的一段时期( 此处选择的是一年) ,根据Thusitha等人在文献[5]中提出的一种方法[4]来计算药物占有率,其计算如下:

3 基于模糊规则的模型

Takagi与Sugeno( 1985) 和Sugeno与Kang( 1988)[7]给出了一个产生式规则系统的模糊推理工具。他们提出了一个多维模糊推理,该模糊模型是基于规则的[8,9],其输出不是一个语言变量,而是输入变量的函数。规则库由n条规则组成,规则的形式如下:

其中,xi( i = 1,2,…,n) 和y分别是过程的状态变量和控制变量。Fji和Gi分别是模糊隶属度函数和的语言术语。每一个Ri可以被看做一个模糊蕴含式,模糊规则集形式如下:

这里使用的“and”是在模糊系统中经常使用的运算。通常使用由Sugeno提供的模糊规则[10]得到复杂过程的输出,其形式描述如下:

这样,最终的输出y可以按下式计算:

根据式( 7) ,最终的输出是由参数决定的复杂的非线性函数,参数的确定不能由传统的方法得到。为了使用遗传算法[11]确定式( 7) 的最优参数,必须建立适应度函数,表示如下:

其中,yi和分别是实际输出和期望输出,n表示输出个数,为目标函数。

4 实验过程及运行结果

4. 1 实验过程

由于研究的是SBP与MPR之间的关系,根据前面的模型得出的数据值应该符合SBP的取值范围。因此,需要对数据进行尺度变换,将模型得出的数据值模糊化为SBP值所符合的范围,即是转换为第一部分所列出的范围。数据模糊化过程中用到的三个式子如下:

其中,ui是n维向量,其值是由式( 2) 计算出的MPR值根据初始的贝塔分布函数所确定的( 初始贝塔分布的参数值说明如表2 所示) ,Maxui是ui中的最大值,ui / Maxui表示相应规则( 此处的规则是表1 中所描述的3 条规则) 的隶属度。通过式( 10) -式( 12) 将相应的精确值分别模糊化为对应的规则区间。

根据山西某医院提供的30 461 条患者高血压数据,经过数据清洗得到本实验所使用的200 条相关数据,将数据分成10组,每组20 条数据,选取其中的8 组作为训练集,另外2 组作为测试集。根据训练集180 条数据得到参数初值如表2 所示。

实验在MATLAB 7. 0 平台下进行,根据表2 的初值、范围和适应度函数式( 8) ,交叉概率Pc= 0. 8,变异概率Pm= 0. 05,利用遗传算法对训练集进行多次训练得到参数的优化结果。表3给出了不同的训练集得到的优化参数结果( 由于篇幅有限,只列举部分数据进行说明) 。

4. 2 参数对比

研究的最终目的是确定SBP与MPR的关系,每一个MPR值对应于三个属于不同范围的SBP值,也就是有三条不同的曲线。因此需要根据不同范围的SBP值所对应的隶属度对数据进行去模糊化处理,得到最终的输出结果。对最终结果好坏的评价,通常用平均误差来衡量,计算如下所示:

在对大量数据进行研究和实验的基础上,根据式( 12) 分别计算不同组的平均误差如表4 所示。

通过比较发现第4 组所确定的模型所得到的平均误差值最小,准确度最高; 进行模糊化分段线性分布计算得到最终的RMSE为5. 74473,相应的参数a4、b4、a5、b5、a6、b6 值如表5 所示。因此将第4 组对应的模型作为我们的最佳预测模型,用于对持续吃药时间和血压值的预测。

通过大量实验得到表3 - 表5 中的参数值,图1 - 图3 分别是对得到的贝塔分布函数,分段线性分布函数及贝塔分布函数和分段线性分布函数的对比进行描述。

经过实验对比,确定图1 为最终的持续吃药时间与血压关系模型图。由图1 的描述可以得到: 当患者血压水平处于90 ~ 130 mm Hg时,患者持续服药8 个月,可以使血压基本维持在较低水平; 当患者血压水平处于130 ~ 160 mm Hg时,由于患者体质不同,服用的降压药的差别可能在短期内会使患者血压有所上升,但服用半年后,这部分高血压患者的血压也可以维持在相对较低的水平; 对于血压水平处于160 ~ 230 mm Hg的高血压患者,在初期服用降压药的效果比较明显,但是需要进行长期的药物治疗,才能使血压维持在较低的水平。

5 结语

通过对持续吃药时间和血压值的分析,建立用于预测二者关系的贝塔分布模型。与线性分布模型相比,该模型能够很好地进行血压趋势分析,增强患者可持续服药程度,更好地对血压进行控制。在此研究的基础上建立药物、时间与血压的模型,进而发现三者之间的关系对于指导患者用药,对于提高患者生存质量有重大现实意义,建立相关的模型是下一步所要进行的工作。

摘要:针对评估期内药物占有率MPR(Medication Possession Ratio)和血压进行分析研究,建立用于发现二者关系的贝塔分布模型。利用模糊理论和遗传算法通过交叉验证对模型进行优化并与线性分布模型进行对比。实验结果表明,利用贝塔分布模型确定的MPR与血压值的关系能很好地对患者的用药疗效进行预测。对于大多数高血压患者,只有接受长期的药物治疗,才能使血压得到有效控制。

关键词:高血压,贝塔分布模型,遗传算法,交叉验证,模糊理论

参考文献

[1]刘力生,王文,姚崇华.中国高血压防治指南(2010年基层版)[J].中华高血压杂志,2011,18(1):11-18.

[2]Laura M Kuyper,MD Nadia A Khan,MD MSc.Atenolol vs Nonatenololβ-Blockers for the Treatment of Hypertension:A Meta-analysis[J].Canadian Journal of Cardiology,2014,30(5):S47-S53.

[3]赵艳平.不同药物治疗原发性高血压的疗效分析与预后评价[J].医药论坛杂志,2012,33(7):96-97.

[4]林彩美.卡托普利联合硝苯地平药物治疗高血压的临床疗效分析[J].中外医疗,2009,28(8):71.

[5]Thusitha Mabotuwana,Jim Warren,John Kennelly.A computational framework to identify patients with poor adherence to blood pressure lowering medication[J].International Journal of Medical Informatics,2009,78(11):745-756.

[6]陈建华.国内外的高血压诊断标准[J].中华实用中西医杂志,2010,23(4):33-34.

[7]Jose Luis Aznarte,Jesus Alcala-Fdez,Antonio Arauzo-Azofra,et al.Financial time series forecasting with a bio-inspired fuzzy model[J].Expert Systems with Applications,2012,39(16):12302-12309.

[8]张德丰.MATLAB模糊系统设计[M].北京:国防工业出版社,2009.

[9]Chen Chunhao,Hong Tzungpei,Tseng Vincent S.Fuzzy data mining for time-series data[J].Applied Soft Computing,2012,12(1):536-542.

[10]Chamani M R,Pourshahabi S,Sheikholeslam F.Fuzzy genetic algorithm approach for optimization of surge tanks[J].Scientis Iranica A,2013,20(2):278-285.

模糊模型预测 篇9

径流量预测是水文系统分析的重要内容。径流量复杂多变,且处于动态变化中,每年差异很大,基于经验的传统预测方法已无法满足客观现实需求,由定量分析的数学预测模型是未来径流量预测发展的方向。常用的径流量预测模型很多,其中运用模糊聚类的方法对径流预测,可以克服径流影响因素不稳定条件下的应用范围[1]。这正是本文工作的出发点。常见的模糊聚类模型对径流预测应用有:利用模糊聚类对不同时间分布类型的降雨序列进行分析,可研究人类活动对径流变化趋势的影响[2];在运用交叉组合预测模型中,利用模糊聚类与小波神经网络相结合的方式可对径流预测[3],也可将径流预报因子进行小波分解后代入模糊聚类的方式,构建类别变量特征值与径流预测之间的回归方程来进行预测[4];又可在模糊聚类循环迭代模型的基础上结合离散函数曲线的方法确定最佳聚类数,从而对流域年径流规律进行研究[5];面对自变量较多的数据时,利用聚类分析递阶结合偏最小二乘回归来建立线性模型,对径流量的拟合能力更强[6]。

本文在可变模糊ISODATA预测模型的基础上,引入最佳模糊集划分理论,通过构造拉格朗日约束函数确定最佳聚类数。通过对变系数模型参数滤定和年径流量数值模拟,求取满足精度要求的类别变量特征值与预测对象之间的线性回归方程,并对年径流量进行预报。并以沱沱河站年径流量为例进行预测分析,结果表明该模型较以往传统模糊ISODA-TA预测模型具有更高的预测精度。

1 预报因子最佳模糊集划分

1.1 最佳模糊集划分理论分析

径流量预测模型的对象是气温、降水、流量组成的复杂系统,因此对径流预测是多准则、多层次的综合预测问题,具有一定的不确定性和模糊性,选用模糊数学模糊聚类的方法对年径流量预测具有一定的合理性。

由于影响因素对径流变化的敏感度较高。因此,对年平均相对湿度、年降雨量、年平均气温、年日照时数和年蒸发量五项观测数据在时间尺度上进行模糊聚类,即表示样本属于各个类别的不确定性的模糊程度,建立样本对于类别的不确定性的描述,能客观地反映五项影响因素对径流量的作用[7]。在聚类模型中直接引入聚类指标的权重,建立模糊聚类循环迭代模型,在没有确定指标标准的样本分类情况下,克服模糊评价和模糊识别模型中只能应用有评价标准识别的局限。

1.2 最佳聚类数求解步骤

①待聚类的m个样本,用n个指标特征值向量对其进行聚类,则待聚类的样本可用m×n阶指标特征值矩阵表示为:

其中,aij为聚类样本j指标i的特征值,即

②由于m个聚类指标特征值量纲不同,在进行聚类时要先消除量纲的影响,对指标特征值进行规范化。在模糊聚类中通常有三类指标:

越大越优效益型指标:

中间适度型:

,其中

越小越优成本型指标:

将矩阵A规范化,得到相对隶属度矩阵:

③设样本n依据m个指标特征值按照c个类别进行聚类,其模糊聚类矩阵为:

满足约束条件:。其中,uhj为样本j隶属于类别h的相对隶属度;h=1,2,…,c,j=1,2,…,n。

④类别h的m个指标特征值为h类的聚类中心,则c个类别的聚类中心可用m×c阶聚类中心矩阵表示为:

其中,sih为类别h指标i的聚类中心规范化数;0≤sih≤1,i=1,2,…,m,h=1,2,…,c。

⑤考虑不同指标对聚类的影响不同,引入初始指标权重向量:w=(w1,w2,…,wm),满足:,0≤wi≤1。初始指标权重由历年径流实测样本与变量之间相关系数的绝对值归一化来确定:

⑥样本j与类别h之间的差异用广义指标欧式权距离表示为:

⑦样本j隶属于类别h的相对隶属度为uhj,则加权广义欧式距离:

⑧样本j与c个类别的差异综合权衡度量为:

样本与c个类别的差异综合权衡度量为:

其中,α为优化准则参数,p为距离参数。

⑨建立目标函数

构造拉格朗日函数:

满足约束条件

本文首先假设类别数是逐渐增加的,目标函数F是随着类别数的增加而逐步递减,当样本集表现出个很集中的类别时(即最佳聚类个数),目标函数F从1类到类而迅速减少,当聚类数再继续增加时,就是对原本较模糊的群再分开,此时,目标函数F继续减少,但速度非常缓慢,直至C=n(n为样本数),目标函数最小,即F=0。做一条F-C曲线。可变模糊循环迭代分别计算聚类数C从1类到n(n为样本数)。作出F-C关系曲线,若F-C曲线存在拐点,其拐点对应的类别即最佳聚类数。

2 可变模糊ISODATA模型构建

2.1 可变模糊ISODATA模型

可变模糊集理论认为模糊集之间存在相对可变,将可拓集合考虑到模糊迭代中,构造出可变模糊聚类循环迭代模型[8,9,10]。

①可变模糊聚类循环迭代模型变为如下形式:

②通过参数p与α取值的不同组合,公式(5)-(7)组成一个可变的模糊聚类循环迭代模型。设置4种预测模型,如表1所示。

相对于每一个组合可以有不同的迭代结果,通过这些结果的对比可以对模型的稳定性进行评估。

2.2 模型求解步骤

①构造F-C曲线确定最佳聚类数c及给定迭代计算精度ε1、ε2、ε3。

②设初始权重矩阵W(0)=(wi(0))、初始模糊聚类矩阵U(0)=(uh(j0))、初始模糊聚类中心矩阵S(0)=(s(0)ih)。

③将不同参数组合代入公式(7)-(9)运用梯度下降迭代算法分别计算w(l+1)i、u(l+1)hj、s(l+1)ih。

④如果满足对i,j,h≥0,满足:

则迭代结束,输出结果(w(l+1)i)(c)、(u(l+1)hj)(c)、(s(l+1)ih)(c)分别为最优指标权重矩阵W*(c)、最优模糊聚类矩阵U*(c)、最优模糊聚类中心矩阵S*(c),否则令l+1=l,转入步骤③继续迭代。其中c为最佳聚类数,分别对应相应的模型。

⑤计算级别特征值H(k):

其中,H(k)分别对应四种模型的级别特征向量。

⑥构造回归方程:

其中,δy、分别为Y、Hk的均方差

⑦实测样本数据对变系数回归方程进行参数滤定,即对四种模型进行选择。

⑧最后样本实测数据对模拟值进行精度评价。

3 沱沱河站年径流量预测实证分析

3.1 研究区概况

沱沱河被认为是长江源头,发源于青海与西藏边境唐古拉山脉主峰格拉丹东西南侧姜根迪如冰川,冰川海拔5500米。约30条冰川融水交汇后,形成了沱沱河。沱沱河全长358km,流域总面积1.7万km2,流域深居青藏高原腹地,雪线高达5800米,属于高空西风带控制区,气候干寒,多风少雨,天气多变,终年低温。沱沱河流域处于西风带内,沱沱河出唐古拉山区姜根迪如冰川发源后首先向北流,并汇聚其它冰川小溪,在上流处山地里形成一些相当深的河谷,截开祖尔肯乌拉山较低的山岗,流至囊极巴陇附近,部分地方可以达20米深。在葫芦湖附近开始转向东,这一段大约有130千米长,在沱沱河终点已形成深3m,宽20m~60m的大河。青海省沱沱河气象站位于海拔4700多米的唐古拉山麓,是世界上海拔最高的气象观测站。年均降水量283.1mm,年均径流深51.9mm,年均气温-3.2℃~-4.8℃。径流补给来源以大气降水和冰雪融水为主,径流年内分布不均匀。

3.2 数据来源

沱沱河水文站研究资料选取1978-2001年度,根据可变模糊循环迭代理论所必要的数据量,并考虑预测识别模型的需要,将前15个年度数据用于确定模型循环迭代最佳聚类数,后6个年度数据用于模型参数识别检验,最后3个年度数据用于误差精度评价。则预报因子分别为:1978-1992年度15a用于确定模型循环迭代最佳聚类数,各年降水量x1,年平均气温x2,年平均相对湿度x3,年相对日照时数x4,年蒸发量x5。y为1978-1992年15a逐年径流量,选取1993-1998年6a资料用于建立预测模型,1999-2001年3a资料用于检验预测模型精度。各指标实测数据如表2所示。

注:数据节选沱沱河站1958-2001年实地调查资料

3.3 最佳聚类数确定

根据公式(3),计算各预报因子的相关系数:ρ1=0.79,ρ2=0.87,ρ3=0.23,ρ4=0.71,ρ5=0.79。由表2可得预报因子的指标特征矩阵A=(aij)15×5,对于五个指标的权重确定,根据公式(4)结合因子相关度确定初始指标权重W(0)=(0.14,0.16,0.02,0.12,0.01),用公式(5)-(6)对四种模型初始模糊指标权重矩阵w,初始模糊聚类矩阵u,初始模糊聚类中心矩阵s进行循环迭代,收敛精度均设定为εi=0.0001,(i=1,2,3),聚类数从1类到9类,运用拉格朗日约束函数的方法,借助MATLAB计算最佳聚类数实现上述算法,进行最佳聚类数分析,得出结果如表3所示。由图1可以分析得出类别数为c=4时,其位于拐点左右,类别数4应该为最佳聚类数,故根据五个预报因子,对1978-1992年15a资料的沱沱河站预报因子在时间尺度上的划分为4个类别。

3.4 模型预测结果及分析

由公式(1),进行规范化处理,确定得相对隶属度矩阵R,根据公式(2),指标特征值归一化矩阵,得指标特征值归一化矩阵U*

运用公式(7)~(9)确定四种模型最优模糊矩阵W,最优模糊聚类矩阵U,最优模糊聚类中心矩阵S。结合公式(10)得到变系数四种模型级别特征值向量:

H1=(8.325,9.329,8.467,14.831,16.973,17.235)

H2=(15.346,18.378,36.433,28.467,35.378,39.047)

H3=(32.436,40.356,41.842,37.830,31.605,46.930)

H4=(12.213,9.024,11.324,12.486,10.346,19.401)

由级别特征值向量,运用公式(11)构造四种参数条件下类别变量特征值与年径流量之间线性回归方程,将沱沱河站1993-1998年6a的径流量实测数据与各回归方程计算数值拟合效果对比,进而对预测模型进行识别选择。并以均方误差MSE、平均相对误差绝对值MPE以及最大相对误差作为衡量模型精度的评价指标,其值越小,预测模型描述样本数据则越精确。如表4所示。

由表3可看出,四种模型的拟合效果有明显的差别,可见针对沱沱河径流量预测选择可变模糊ISODATA模型选择模型4拟合效果最好,即可变系数α=2,p=2。结合模型4(2-2)的样本特征值和级别特征值的相关系数ρ4*=0.880,满足要求。即构造符合相关性要求的回归方程:

利用上述参数滤定后的变系数模糊ISODATA模型2(2-2)以及传统模糊ISODATA模型,对沱沱河站进行年径流量预测,结果如表5所示。

分析表5可以得到以下结论:

①从整体MSE和MPE、最大相对误差、预测精度和拟合精度上看,可变模糊ISODATA模型(2-2)精度均高于模糊ISODATA模型。可见,可变模糊ISODATA模型是提高预测精度的有效方法。基于模型4(2-2)的沱沱河站年径流量预测结果更趋稳定,结果显示1999-2001年3a的年径流量预测的误差率均低于10%。依据《水文预报规范SL250-2000》评定标准[11],径流预报以实测值的20%作为许可误差,在预测可接受范围内。

②可变模糊ISODATA预测模型在确定最佳聚类数后,通过调整参数少,不易陷入局部极值等优点,可以快速预测,具有较大的计算优势。改进后的可变模糊ISODATA模型预测精度较高,难点是如何确定最佳聚类数和各类参数,本文的可变模糊ISO-DATA模型所确定的结构和参数理论上仅仅是较佳,而非最佳。

4 结束语

本文将可变模糊ISODATA模型与最佳模糊集划分理论相结合,提出了两者有机结合的预测模型。其显著特点是利用最佳模糊集划分理论,通过拉格朗日约束函数确定可变系数的模糊ISODATA模型最佳聚类数。在对变系数模型参数滤定和年径流量数值模拟后,求取符合精度要求的类别变量特征值与预测对象之间的回归方程进行预测。整个模型原理简单,有效地融合了影响年径流量变化因素,具有计算快捷和实用价值,也是对可变模糊ISODATA预测模型的进一步发展。最后以沱沱河站为例进行了验证,计算结果表明该模型预测结果较传统ISODA-TA预测模型准确率高,对短期内的年径流量预测有一定参考价值。

参考文献

[1]刘利平,陈健,张礼平.应用模糊聚类方法制作韩江洪水预测[J].水文,2006,26(1):60-62.

[2]李慧赟,等.基于模糊聚类的丰满上游流域降雨径流变化趋势分析[J].水文,2009,29(3):28-31.

[3]徐谨,等.模糊聚类分析的小波神经网络模型在径流预测中的应用[J].数学的时间与认识,2012,42(18):88-95.

[4]彭勇,王国利.小波、模糊与统计相关结合的径流预测方法研究[J].南水北调与水利科技,2011,9(4):47-50.

[5]李亚伟,等.模糊聚类在流域年径流规律研究中的应用[J].水资源与水工程学报,2005,16(1):28-30.

[6]周鑫,印凡成.基于新偏最小二乘回归法的系列水文资料分析[J].人民长江,2010,41(9):95-97.

[7]孔令燕,夏乐天.混合型模糊聚类分析在洪水分类中的应用[J].人民黄河,2011,1(1):31-34.

[8]陈守煜.可变模糊集理论的哲学基础[J].大连理工大学学报:社会科学版,2005,26(1):53-57.

[9]陈守煜.可变模糊集理论与可变模型集[J].数学的实践与认识,2008,38(18):146-153.

[10]陈守煜.可变模糊聚类迭代模型合理性分析与应用检验[J].大连理工大学学报,2009,49(6):932-936.

模糊模型预测 篇10

由于造成大气污染的因素很多,车辆排放对大气污染的影响属于多指标、多级模糊评价问题,仅仅单指标评价并不能为大气污染治理提供科学的决策支持。尽管对于多指标定量及模糊评价也涌现出很多有意义的研究,如灰色模糊聚类评价法、神经网络评价法、模糊综合评价法等,但仍然不能从实质上解决车辆排放对大气污染的模糊识别及评价问题。而且,由于采用主观方法来确定各评价指标的权重系数,人为干扰较强,因此,决策矩阵往往不能充分体现各指标对决策的贡献量大小,导致研究结果无法很好地进行实际应用。因此,本文针对车辆排放对大气污染的特点,将大连理工大学陈守煜教授与2005年创立的可变模糊集理论应用于车辆排放对大气污染的监测领域,对传统的大气质量监测评级予以合理改进。最后通过神经网络对短时间车辆排放对大气污染程度进行预测。

1 车辆排放对大气污染的监测指标体系

大气中污染物质来源广泛且种类繁多,应选择恰当的污染物监测指标以科学描述车辆排放对大气污染的程度。一方面,监测指标是指对环境污染程度较大,或是对人类健康有较大危害的污染物;另一方面,对于监测区域而言,监测指标的主要排放源为车辆尾气排放。因此,车辆排放对大气污染监测指标的选择应遵从以下原则:

1)科学性原则:监测指标的选取以国家环保政策中的相关规定为科学依据,采用科学的方法和手段,遵循生态规律。

2)可操作性原则:监测指标能够通过观察、测试、评议等方式得出确定结论或定量监测值。

3)层次性原则:监测指标体系由多层次结构组成,在反映各层次特征的同时,各要素也相互联系构成一个有机整体。

4)区域性原则:监测指标体系既能够精确描述监测目标的监测结果,又能够反映监测区域的特点。

车辆排放对大气污染的监测指标体系选取了10种车辆排放污染物作为监测指标,并根据其特性,将10种大气污染物分为一般气态污染物、二次污染物以及固体污染物三个类别,其中包括3种气体污染物、3种二次污染物和4种固体污染物。建立了能够反映车辆排放对大气污染状况的监测指标体系,如表1所示。

2 车辆排放对大气污染的模糊可变模型

1965年札德(Zadeh)提出模糊集合概念,是对康托(Cantor)普通集合论的突破,并由此发展为一门新的数学学科———模糊集合论,在数学思维上有重要科学意义。20世纪陈守煌教授提出相对隶属度、相对隶属函数概念,并以此为基础建立工程模糊集理论。研究一定时空条件组合下,系统中模糊事物、模糊现象、模糊概念的相对性与动态可变性,并用数学方法描述其相对可变性。由于其模型参数的可变,可得到多组模型对同一事物的综合评价,提高评价结果的稳定性和可靠性。根据该理论可建立车辆排放对大气污染的模糊可变模型,其步骤如下:

步骤一:大气污染物数据采集,计算车辆排放对大气污染监测指标的测度值。

根据表1选取的10个车辆排放对大气污染的监测指标,监测同一区域不同时段内的大气污染物样本,则n组分时监测得到监测值的特征向量为

式中:xij为样本j和指标i的监测值(其中i=1,2,…,10;j=1,2,…,n)。

步骤二:对车辆排放对大气污染监测指标的测度值进行公度化处理。

设定各级别指标标准值区间矩阵为(aih,bih),h为监测级别(h=1,2,3,4,5),分级标准为1级最优级,5级最劣级。通常,aih>bih表示指标监测值越大级别越优,为递减系列;aih<bih表示指标监测值越小级别越优,为递增系列。对于车辆排放对大气污染的监测指标体系而言,指标监测值越小越好,即指标皆为递增系列。因此,根据10个监测指标、5个级别的指标标准区间确定吸引域区间Dab及范围域区间Dcd,如图1所示。

图1是h取中间等级时各标准区间的示意图,Mih是一个重要参数,可根据待评对象级别h对优、劣模糊概念进行物理分析确定。对优级,即h=1、2,Mih=aih;对劣级,即h=4、5,Mih=bih;对h为奇数的中介级(不优不劣级),即h=3,。

步骤三:计算监测样本对各级别车辆排放对大气污染监测指标的相对隶属度。

根据监测对象的指标监测值xij与标准级别指标的相对差异度进行比较,当xij落在Mih的左侧,车辆排放对大气污染的相对差异函数公式为

当xij落在Mih的右侧,车辆排放对大气污染的相对差异函数公式为

根据模糊集合的余集定义得出指标相对隶属度函数的公式为

则监测值j对各级别监测指标相对隶属度的矩阵为

步骤四:界定车辆排放对大气污染监测指标的权重系数。

Shannon将熵引入信息论,对信息进行定量描述并利用熵值来反映信息无序程度。若指标值的熵值越大则表明信息中蕴含的信息量越少,在评价模型中的作用也就越小;反之,则表明信息中蕴含的信息量越多,作用越大。Entropy法的客观定权具体步骤如下:

1)构建原始数据矩阵。在车辆排放对大气污染的监测指标体系中,现有n组监测值,10个监测指标,由式(1)得到原始数据矩阵X=(xij)n×10。

2)计算无量纲矩阵。针对不同类型的监测指标的量纲不同,将其转化为无量纲指标值。由于测量排放监测指标属于成本性指标,采用下式处理

式中:xij为样本j指标i的监测值,(xij)max=max{xij,i=1,2,…,n};(xij)min=min{xij,i=1,2,…,n}。

对原始数据矩阵X进行无量纲化处理,得到车辆排放对大气污染监测值的无量纲矩阵

3)计算比重矩阵。计算各监测指标下监测值的指标值比重,得到车辆排放对大气污染监测值的指标值比重矩阵为

式中:为第j个监测指标下第i个监测值的指标值比重,且满足。

4)计算熵值。第j个车辆排放对大气污染监测指标的熵值

5)计算熵权。第j个车辆排放对大气污染监测指标的熵权

步骤五:计算各监测值对大气污染监测指标体系各级别的综合相对隶属度

利用模糊可变模型,计算各大气污染物监测值对大气污染模糊监测体系中各级别的综合相对隶属度,公式为

式中:α为模型优化准则参数,α=1时,为最小一乘方准则,α=2时,为最小二乘方准则;β为距离参数,β=1时,为海明距离,β=2时,为欧氏距离。

基于α,β的不同取值,式(11)的参数有4种组合,是一个多种变化的监测模型。由式(11)可得到归一化处理后的综合相对隶属度矩阵为U=(V(xij)h)10×5,应用级别特征值(12)可得车辆排放对大气污染的监测级别为

3 车辆排放对大气污染的神经预测模型

车辆排放是影响大气质量的重要因素,在交通结构以及交通设施状况不变的情况下,同一区域内不同时间的车辆排放量之间存在着某种非线性联系。本文基于BP神经网络建立模型来识别这种特定联系,进而预测车辆排放对大气污染的程度,其步骤如下:

步骤一:车辆排放对大气污染数据的输入信息融合。

输入信息融合是模仿神经元对不同环境刺激的敏感程度不一致的现象,引入输入信息的敏感向量(权重向量)W=[w1d,w2d,…,wsd],d=(1,2,…,m),输入车辆排放对大气污染的信息向量Xs=[x1,x2,…,xs],s=(1,2,…,n),则与对应的敏感向量乘积得到融合之后的信息为

步骤二:车辆排放对大气污染数据的输出信息转化。

当bd大于神经元兴奋阈值时(通常建议取值为0.01),神经元信息转换函数对bd转化得到输出信息yz,采用Sigmoid函数作为转化函数,则输出信息为

步骤三:车辆排放对大气污染数据的误差反向传播。

根据得到的神经元输出信息yz与实际期望信息yz*之间的差值,反向修正神经元权重系数wsd,这里采用改进的自适应动量梯度下降法作为权值修正函数

式中:wμsd为前层第s个神经元和后层第d个神经元之间第μ次修正权值,η为动量因子,g为梯度误差修正函数。

车辆排放对大气污染的BP神经网络预测模型是根据数据规模确定神经网络结构,并在明确BP神经网络的预测机制后,利用MATLAB软件中的神经网络工具箱完成车辆排放对大气污染数据的训练和预测过程。在使用工具箱时,只需确定输入层、隐含层和输出层的神经元数,训练网络算法以及各层之间的神经元信息转换函数,MATLAB会生成特定的车辆污染物排放对大气污染的BP神经网络预测模型。输入车辆排放数对大气污染的数据训练样本,制成训练网络,当神经网络的实际输出数据与目标数据的均方误差满足条件后,再输入车辆排放对大气污染预测所需数据,得出预测结果。

4 实例分析

通过实例来验证本文所建立车辆排放对大气污染的模糊可变模型,以及车辆排放对大气污染的神经预测模型的可行性。本文以南京市某区域监测点所测得的各监测值进行实例分析。

4.1 南京市某区域车辆排放对大气污染的模糊监测

借鉴国外、国内其他部门的研究成果,同时考虑所建立的指标体系能全面反映车辆排放物对大气的污染程度,参考《大气污染物综合排放标准》及《环境空气质量标准》,得到车辆排放对大气污染的模糊监测指标体系各组成部分的等级指标与污染等级,如表2所示。

μg/m3

将9个样本的各指标监测值代入监测模型,分别计算相应的车辆排放对大气污染的监测等级结果,本文以随机选取的2月12日样本监测数据为例,详细阐述其评价过程,步骤如下:

步骤一:采集2016年2月10日—2月18日该监测点连续9d监测数据进行实例分析。表3列出了监测时间内车辆排放对大气污染监测体系中各监测指标的监测值。

μg/m3

步骤二:根据车辆排放对大气污染的监测分级标准可得大气污染的现状指标特征值矩阵,参照分级标准确定吸引域Dab,根据Dab得到监测级别h的范围域为Dcd,根据Dab和Dcd确定点值矩阵为M。

1)吸引域为

2)范围域为

3)定点值矩阵为

步骤三:由吸引域和范围域判断监测值落入M点的左侧或右侧,据此选用相对差异函数模型式(2)或式(3)计算差车辆排放对大气污染的异度,再根据模糊集合的余集定义得出指标相对隶属函数式(4),计算指标对各等级标准的相对隶属度矩阵为

步骤四:根据界定车辆排放对大气污染监测指标权重系数中的步骤,计算车辆排放对大气污染监测指标的指标熵值权,车辆排放对大气污染监测值的无量纲矩阵为

利用式(9)、式(10)计算车辆排放对大气污染各监测指标的熵值和权值,得到各监测指标的权重向量为

步骤五:将车辆排放对大气污染监测指标的权重值带入式(11),计算各监测指标对级别h的综合相对隶属度矩阵为

针对车辆排放对大气污染各监测指标对不同风险级别的综合相对隶属度,归一化后得到的结果为

利用级别特征值式(12)可得到此监测值的级别特征值,如表4所示。

分析表4所得数据可知,不同模型参数组合下的级别特征值在区间[2,3]内波动,说明监测结果较稳定,因此,监测时间内监测区域的大气污染监测等级为2级,车辆排放对空气污染不高,属于良好水平。案例采用了模糊可变模型进行车辆排放对大气污染的识别与监测,通过变化模型参数,综合确定样本的监测级别。由于模糊可变模型中参数组合的改变,其模型参数可变,得到多组模型对于车辆排放对大气污染的监测结果,从而提高了结果的稳定性和可靠性。同时通过主客观组合权重的全面考虑,提高对监测样本等监测等级结果的可信度。进一步计算不同监测时段内的大气污染综合监测等级,最后得到不同监测时段、不同参数组合下的大气污染监测等级,如表5所示。

根据监测结果,除了2月13日的大气监测评价等级为三级,属于轻度污染外,其余时间区域内车辆排放对大气污染的监测等级都为二级,车辆排放对大气的污染程度属于良好范围。由于现阶段没有统一区域内的车辆排放水平等级标准,而车辆排放是重要的大气污染源之一,因此,将最终的监测结果与南京市空气质量检测部门发布的空气质量信息进行比较分析。对比表3中的空气质量等级可知,除去2月11日的监测结果与空气质量水平不同,最终监测结果与南京市空气质量检测部门发布的信息基本一致,分析可知:

1)在监测时间段内,监测区域的空气质量水平及车辆排放的监测等级都显示该区域空气质量良好。

2)从监测结果的对比来看,车辆排放对大气污染与空气质量水平既有一定的内在联系又有区别,车辆排放对大气质量影响较大,是大气污染的重要原因之一,因此,减少车辆排放是治理城市大气污染的重中之重。

3)与现阶段普遍使用的空气质量指数(Air Quality Index,简称AQI)相比,车辆排放对大气污染的监测模型将更多的污染项纳入了监测范围,提高了监测模型的全面性,且得到多组监测值,也增加了监测结果的可靠性,验证结果说明了车辆排放对大气污染监测模型的可行性。

图2为不同模型参数组合下的监测等级折线图。由图2可知,监测等级折线图较为平缓,且监测等级均在二级和三级之间,以目前的技术发展水平和规模,该监测区域内车辆排放属于中等水平,对大气污染有一定影响,特别是固体污染物(容易产生雾霾)对环境影响较大。为减少车辆排放对大气污染,提出以下建议:首先,严格执行国家质量技术标准,控制燃油标准;其次,加大车辆审核制度,严格禁止使用汽车尾气排放不合格的车辆,严惩对尾气排放听之任之,甚至拆除治理净化装置;最后,建议使用清洁能源车辆,如电动汽车等。

4.2 南京市某区域车辆排放对大气污染的神经预测模型

根据各监测点的监测数据以及南京市空气质量检测部门发布的研究报告,现阶段该区域最主要的大气污染物为PM2.5、PM10以及总悬浮颗粒物,因此,预测这些主要污染物的浓度对于空气质量的预警具有重要作用。由于汽车尾气排放到大气中污染物在大气中的浓度受天气影响十分巨大,所以本文采用BP神经网络预测模型对一定区域内空气中的污染物浓度进行预测,对样本的采集有一定要求。

本文采用的样本数据为同一区域内连续19d的监测数据,且监测期间天气变化不大,假设次日天气无剧烈变化,则可利用神经网络模块对该区域内第20d空气中的PM2.5浓度、PM10浓度以及总悬浮颗粒物进行预测。由于样本数据较少,因此采用滚动式预测。以预测大气中PM2.5浓度为例:输入向量为连续三天大气中的PM2.5浓度,目标向量为后一天大气中PM2.5浓度,即设定输入层神经元数为3,输出层神经元数为1,经试算:在样本集和各网络参数不变的情况下,隐含层神经元数为10时,神经网络预测均方误差最小。

输入前18d的PM2.5浓度滚动数据训练样本集。训练完成后,再输入前19d的PM2.5浓度滚动数据,从而对第20d大气中PM2.5浓度进行预测。同理,进行大气中PM10浓度以及总悬浮颗粒物的预测,预测结果如表6所示。

μg/m3

预测得到次日PM2.5的24h平均浓度为176μg/m3,PM10的24h平均浓度为168μg/m3,总悬浮颗粒物24h平均浓度为304μg/m3。为进一步分析预测结果,绘制相对预测误差曲线,如图3所示。

通过图3分析可知:

1)从总体方面看,PM2.5浓度、PM10浓度以及总悬浮颗粒物的BP神经网络相对预测误差平均值分别为4.08%、3.24%以及3.60%,与BP神经网络的有效预测量程15%相比,总体预测精度较高。

2)从预测波动看,PM2.5浓度、PM10浓度以及总悬浮颗粒物的BP神经网络预测的最大误差为9.91%、11.54%以及8.30%,波动方差为2.61%、2.80%以及2.04%,波动方差较小,预测过程稳定。因此,无论从预测精度还是预测稳定方面看,预测效果较好,进而表明预测次日的大气污染物浓度数据具有一定可信度,对于大气污染预警具有借鉴意义。目前从大数据的角度研究车辆尾气排放问题,是一个新方向。职能监管部门可通过BP神经网络方法对大数据进行分析,在预测短时间内大气中污染物浓度的变化,进而为新标准的有效执行提供决策依据。

5 结束语

模糊模型预测 篇11

一、问题的提出

政府绩效审计是由独立的政府审计机构和审计人员,依照我国相关法律、法规的规定,采用先进技术方法,取得证据,依照选定的标准,对政府及其各隶属部门及其他使用公共资金的单位的经济活动的经济性、效率性、效果性进行审核检查,并做出独立、客观、系统的评价,用以向有关利害关系人提供经济责任履行情况的信息,促进改善经营管理,提高经济效益,加强宏观调控的一种独立性的经济监督活动。

从政府绩效审计的涵义可以看出,政府绩效审计的核心问题是绩效评价,它是政府绩效审计结果的体现。但如何进行政府绩效测评,长期以来一直是困扰审计实务界的一个难题,也成为审计理论界探讨的一个热点问题。到目前为止,还没有一个为业界认可的很好的政府绩效审计评价方法,这使得政府绩效审计工作在我国的开展陷入了困境。为了使政府绩效审计评价结果更加客观、准确和全面,笔者尝试引入数学中的计量方法——模糊综合评价法,建立政府绩效审计模糊综合评价模型。该模型通过对审计对象的综合评价,得出科学、直观的评价结果,从而为政府绩效评价提供有效的方法。

二、政府绩效的模糊综合评价

1965年,美国控制论专家查德(L. A. Zadel)首先提出用模糊集合表示模糊事物(现象)的数学模型,建立了以模糊现象为研究对象的模糊数学,在模糊与精确之间架起了一座桥梁。所谓模糊综合评价法,是指针对评价对象的复杂性和评价指标的模糊性,采用模糊数学的理论与技术,对受多种因素影响的评价对象进行模糊综合评价,从而得到评价结果的方法。由于它能汇总各类评价人员的评价意见,较全面地反映出评价对象的优劣程度,从而使评价结果具有较强的客观性,因而在质量评价中得到了广泛的应用。笔者这里尝试把该方法引用到政府绩效测评中,以期使政府绩效审计的评价结果更加客观、准确和全面。

(一)政府绩效审计评价指标体系的建立

政府绩效审计评价指标体系是对绩效评价内容的一般性概括,是进行政府绩效模糊综合评价的必然前提。同时,建立一套科学合理的审计评价指标体系,对于客观、公正地评价政府绩效,防范审计风险,实现审计目标也具有重要的理论意义和现实意义。政府绩效评价由于受众多因素的影响而成为一个动态的过程,建立统一规范的审计评价指标体系是比较困难的。在实际建立评价指标体系的过程中,笔者在考虑评价指标设计原则的基础上,充分征询了专家们的意见,经过反复调研、论证,同时考虑政府绩效评价的特殊性,将定量评价与定性评价相结合,一方面将可以量化的影响绩效的因素通过设置指标的方式进行量化,以便于分析比较;另一方面对无法量化的影响绩效的因素,则借鉴美国的做法,建立“优先实践”原则作为衡量标准。建立政府绩效评价指标体系结构模型,如图1所示。

模糊模型预测 篇12

在我国大力兴建公路桥梁的今天,良好地维护已营运多年的旧桥是保证国家经济正常运行的重要条件。桥梁技术状况预测的方法通常有三类:以回归分析方法为基础的回归分析模型、灰色模型和以马尔可夫链(Markov)为代表的概率型模型[1,2,3]。本文就以马尔可夫链法为基础,建立桥梁结构技术状况退化预测模型。

本文按桥梁养护规范[4],以桥梁技术状况评分为基础,划分桥梁技术状况等级。然后以桥梁技术状况评分值序列规范化后的各阶自相关系数为权,用加权的马尔可夫链来预测桥梁未来的技术状况等级,再根据模糊集理论中的级别特征值计算具体的桥梁技术状况评分值。

1 基本思想

1.1 马尔可夫链[5,6,7]

设{X(t),t∈T}为一随机过程,如果对于时间t的任意n个值t1<t2<…<tn(n≥3),在X(ti)=xi,i=1,2,…,n-1的条件下,X(tn)的分布函数恰好等于在X(tn-1)=Xn-1的条件下X(tn)的分布函数,即:

则称为随机过程X(t)为马尔可夫过程。

假设随机过程{Xn,n=0,1,2,3,…,N},若Xn只依赖Xn-1而不依赖于Xn-2,Xn-3…,即:

这就是离散状态及离散参数的马尔可夫过程,称为马尔可夫链。

1.2 加权马尔可夫链预测的思想

加权马尔可夫链预测的思想[8]是把预测对象看成有相依关系的随机变量,一列相依的随机变量,其各阶自相关系数刻画了各种滞时的状态间相关关系的强弱。

1.3 模糊集理论中的级别特征值

模糊集理论中的级别特征值计算方法如下:

首先给各状态赋以相应的权重,构成权重集D={d1,d2,d3,d4,…,dm},其中,m为研究系统的状态数。权重的大小取决于各状态概率的大小,即:

其中,η为最大概率的作用系数,通常取2。级别特征值H可以通过下式进行计算:

根据上一步确定最大概率的状态i,按下式计算系统在预测时段的预测值[9]。

其中,Ti,Bi分别为状态区间值的上限与下限。

2 模糊加权马尔可夫链预测实现的基本步骤

1)定义主体状态空间及状态向量。

根据我国《公路桥涵养护规范》将桥梁技术状况分为五类,本文对应地将桥梁的状态空间分为5个状态。具体划分见表1。

2)桥梁总体状态评分序列的各阶自相关系数rk。

其中,rk为第k阶(滞时为k)自相关系数;x为第t时间点的桥梁总体状态评分值;x为桥梁总体状态评分值均值;n为序列长度。

3)对各阶自相关函数规范化,即:

将它们作为种滞时(步长)的马尔可夫链的权。

4)根据各时间点桥梁总体状态评分值和等级值,进行频率统计,得到不同步长马氏链的转移概率矩阵,它决定了状态等级转移过程的概率法则。这里其实隐含了一个近似,即假设各步转移概率与时间点无关。

5)分别以前面时间点各自的状态等级的概率作为初始分布概率,乘以相应的状态转移概率矩阵,即可预测出未来的时间点的桥梁总体状态等级的状态概率,再将同一状态的各预测概率的加权和作为桥梁总体状态等级处于该状态的预测概率,即:

其中,i为状态空间的元素,即i=1,2,3,4,那么,max{Pi,i=1,2,3,4}所对应的i即为将来的时间点桥梁总体状态的预测等级。

6)应用模糊集中理论中的级别特征值计算桥梁状况评分具体值。

3 实例分析

某桥在过去20年里,技术状况评分及各年状态划分等级见表2。本例采用1年~19年的数据,建立“模糊加权马尔可夫链模型”预测第20年的桥梁技术状况评分值,并与灰色模型GM(1,1)和灰色马尔可夫链模型GM(1,1)-Markov等的计算结果对比。

1)根据表1及表2各年的状态评分,通过简单的统计分析可得到表2中各年的状况等级。

2)根据表2中所得的状态等级,计算1年~19年的桥龄技术状况评分值的各种步长的状态转移概率如下:

一步状态转移概率矩阵:

二步状态转移概率矩阵:

三步状态转移概率矩阵:

四步状态转移概率矩阵:

五步状态转移概率矩阵:

3)按式(5)计算值得到各阶自相关系数为:r1=0.809 0,r2=0.627 0,r3=0.438 0,r4=0.310 9,r5=0.200 7;各阶权重为:w1=0.339 1,w2=0.262 9,w3=0.183 6,w4=0.130 3,w5=0.084 1。

4)根据第15年~19年的桥梁技术状况评分值及其相应的状态转移概率矩阵对第20年的桥梁技术状况进行预测,计算结果见表3。

5)由表3可知:当i=3时,p2=0.853为最大值,说明第20年的桥梁技术状态为3,即在区间为[40,60]。根据式(3)~式(5)进行计算,级别特征值为2.971,根据式(5)计算,求出第20年的技术状态评分值为47.5,而实测值为50.1,较接近实测值。同理,我们可以预测出第16年~19年的桥梁技术状况值。

6)对比分析,采用灰色模型、灰色马尔可夫模型对该桥的技术状况进行预测,计算结果与本文方法进行对比,见表4。

由表4中可以看出,采用Markov-GM(1,1)模型其预测偏差较GM(1,1)模型有明显的提高,这是因为该模型不但考虑了GM(1,1)模型预测的趋势,还考虑了数据的波动情况,兼有灰色模型和Markov链的优点,充分利用了历史数据给予的信息。但是由于灰色马尔可夫链模型的转移概率矩阵的建立与灰区间的划分是密不可分的,预测的精度会受划分区间的影响,并不是区间划分愈细就愈精确。采用模糊加权马尔可夫链模型进行预测时,由于其以各种步长的自相关系数为权,用各种步长的马尔可夫链加权和来预测桥梁技术状况,所以较普通的马尔可夫链的预测方法,它可以更充分、合理地利用信息,预测结果偏差最小,与实测值最接近。

4 结语

1)采用模糊加权马尔可夫链模型对桥梁技术状况预测是充分考虑了桥梁技术状况退化的各种不确定性因素及状态等级划分的模糊性。且该模型对桥梁技术状况拟合的离散度,较灰色模型及灰色马尔可夫模型要小。2)基于模糊加权马尔可夫链方法对桥梁技术状况的预测,其预测结果为桥梁技术状况的某一个状态是一个区间值,而不是具体数值,在可以完全满足实际工作需要的前提下,预测的范围扩大了,其可靠性会随之有所提高。3)由于以各种步长的自相关系数为权,用各种步长的马尔可夫链加权和来预测桥梁技术状况,所以较普通的马尔可夫链的预测方法,它可以更充分、合理地利用信息,可以成功地将马尔可夫链与相关分析有效地结合起来进行预测。4)随着桥梁技术状况逐年数据的增加和更新,数据的代表性也日益增强,自相关系数、状态转移矩阵、权重将会发生某些变化。因此应将桥梁技术状况每年新的实测值加入到资料分析系列,实现在线调整预测对象的自相关数、状态转移矩阵、权重,以期进一步提高预测精度。

参考文献

[1]何勇,鲍一丹.灰色马尔可夫预测模型及其应用[J].系统工程理论与实践,1992(4):59-63.

[2]Kopnov VA.Optimal degradation processes control by two-levelpolicies[J].Reliability Engineering and System Safety,1999(66):1-11.

[3]Kopnov V A,Kanajev E I.Optimal control limit for degradationprocess of a unit modeled as a Markov chain[J].ReliabilityEngineering and System Safety,1994(43):29-35.

[4]JTG H11-2004,公路桥涵养护规范[S].

[5]冯耀龙,韩文秀.权马尔可夫链在河流丰枯状况预测中的应用[J].系统工程理论与实践,1999,19(10):89-93.

[6]Sen Zekai.Critical drought analysis by second-order Markov-or-der[J].Journal of Hydrology,1990,120(1-4):183-202.

[7]周德才,孙亦鸣.计算机随机模拟原理、方法及计算程序[M].武汉:华中理工大学出版社,1998:201-220.

[8]季云峰.桥梁管理系统的研究[D].上海:同济大学,2003:57-65.

上一篇:编辑工作能力下一篇:新闻评论的逆向思维