时间序列建模(精选8篇)
时间序列建模 篇1
对时间序列{Xt}进行ARM A (p, q) 建模, 是假设序列{Xt}为平稳序列的前提下进行的, 因此对序列{Xt}进行平稳性检验和预处理是ARMA (p, q) 建模的先决条件。对时间序列平稳性检验的方法有很多, 单位根检验是比较准确的一种方法。在数理统计中没有对一个时间序列进行单位根检验就直接判断其平稳性的做法是不科学的, 况且, 利用单位根检验中的ADF检验还可以判断一个非平稳序列的趋势类型等其他信息, 在Pandit-Wu建模方法基础上, 利用这些信息, 归纳出ARMA (p, q) 建模的一种方法。下面以广西外经贸2005~2009年10月的出口数据为例分析之。使用的统计软件为EViews 5.0.
一、ADF检验简述[1]
ADF检验是统计检验中普遍应用的一种检验方法, 在对时间序列的平稳性检验时, 运用ADF检验更为准确和重要。ADF检验是通过下面三个模型完成的:
其中t为时间变量, βt为趋势项, α为常数项, εt为残差项。原假设都是H0:δ=0。检验时从模型3开始, 然后模型2, 模型1。若检验拒绝H0:δ=0, 即原序列不存在单位根, 为平稳序列, 即可停止检验。否则就要继续检验, 直到检验完模型1为止。通过ADF检验中的模型3还可以判断非平稳序列的趋势是随机性趋势还是确定性趋势。这样, 就可以对原序列进行相对应的处理方式, 使原序列平稳化。
二、ADF检验模型中滞后差分项m与ARMA (p, q) 模型中阶数p的关系
设{Xt}为一时间序列, 对{Xt}进行ADF检验, 有
若δ显著为0则可知道序列{Xt}为平稳序列, 设其生成模型为ARMA (p, q) , 则有
对比 (1) 、 (2) 式, 可证明
所以, {Xt}的生成模型ARM A (p, q) 也可以写成ARM A (m+1, q)
又由差分方程的理论可证明[2], q=p-1=m
因此, 对序列{Xt}可尝试拟合ARM A (m+1, m) 模型, 最后根据Pandit_Wu建模方法找到序列{Xt}的最优模型。
三、Pandit-Wu建模方法的改进
Pandit-Wu建模方法[3]认为:任一平稳序列总可以用一个ARM A (m, m-1) 模型来表示, 而AR (m) , M A (n) 以及ARM A (m, n) (n不等于m-1) 都是ARMA (m, m-1) 模型的特例。其建模思想是:逐渐增加模型的阶数, 拟合较高阶ARMA (m, m-1) 模型, 直到再增加模型的阶数而剩余平方和不再显著减小为止。通过上述的讨论, 在Pandit-Wu建模方法的基础上, 我们把ARMA (p, q) 建模步骤用流程图表示为: (如图1)
在上述建模思想下, 我们发现:对序列进行ADF检验, 由检验结果可判定该序列的趋势类型和平稳性, 从而选择合适的方法对原序列预处理, 使之平稳化。然后根据滞后差分项m与阶数p的关系, 可初步判断平稳化后的序列的ARMA (p, q) 模型, 再利用Pandit-Wu建模方法拟合最佳的ARMA (p, q) 模型。
四、广西外经贸数据时间序列的建模与预测
(一) 建模分析
为初步观察数据的平稳性, 作广西累计出口月金额数据序列图 (图2) 和相关函数图 (图3) 。由此可以判断:广西累计出口月金额数据序列有明显长期趋势, 因是月度数据, 很有可能存在季节趋势。可计算其季节指数, 若存在季节趋势可先剔除季节趋势, 再通过ADF检验其平稳性, 并确定长期趋势是确定性趋势还是随机性趋势, 从而选择适当方法剔除长期趋势即可得到一平稳序列的初步拟合的ARMA (m, m-1) 模型。
(二) 对原序列{Xt}进行季节趋势检验
剔除季节趋势的方法有季节差分、计算季节指数再消除季节因素等方法, 因为该原始序列的容量较少 (n=58) , 如果用季节差分消除季节因素, 势必会缺失相当多的数据。所以通过计算季节指数消除季节因素的方法剔除季节变动。用移动平均法, 得广西累计出口月金额数据的季节指数为:
根据季节指数发现, 原序列的季节趋势并不显著, 但在年头和年尾稍有变化。可剔除季节趋势, 设剔除原序列中的季节因素后的序列为{Zt}。
(三) 对序列{Zt}进行ADF检验
经尝试, 有如下结果:
模型3:
上述模型显示:括号中的数值为各参数的t统计量的值, 从模型结果中可断定序列{Zt}不存在单位根, 存在趋势项, 因此是具有确定性趋势的时间序列, 要通过除去趋势项的方法来消除确定性趋势]4]。经对Xt和时间T进行回归分析, 可建立回归方程:
由此回归方程可把序列{Zt}消除其确定性趋势, 得到的新序列设为{Yt}
(四) 对序列{Yt}进行ADF检验
经尝试, 有如下结果:
从上述结果中可断定序列{Yt}是平稳的, 且其自相关图和偏相关图 (图5) 也说明了序列{Yt}是平稳的。由m+1=p, 可初步估计序列{Yt}为ARM A (8, 7) 模型。
(五) 利用Pandit-Wu建模方法对序列{Yt}拟合ARMA (8, 7) 、ARMA (10, 9) 、ARMA (6, 5) 、ARMA (4, 3) 、ARMA (2, 1) 等模型进行对比选择
拟合相关结果如下表:
综合上表的各项因素, ARMA (8, 7) 是一个最佳的模型, 又因ARMA (8, 7) 模型中的参数φ3, φ4, φ6, θ4, θ2, θ4, θ5, θ7不显著, 可以删去 (记为ARMA (8, 7) -φ346θ42457模型) , 拟合结果见上表最后一列。结果表明删去这几项参数后的模型总体拟合效果比较理想, 因此我们最终选择ARMA (8, 7) -φ346θ42457模型来拟合平稳序列{Yt}, 模型形式如下:
(六) 模型的诊断检验。即检验模型的残差序列的纯随机性
(1) 对ARMA (8, 7) -φ346θ42457模型的残差序列进行相关性检验。由模型ARMA (8, 7) -φ346θ42457的自相关图和偏相关图 (图6) 表明模型的残差项都在置信区间内, 基本上剔除了自相关和偏相关。同时由ARMA (8, 7) -φ346θ42457模型的残差项的QLB统计量的p值都显著大于0.05 (图6) 即证明该残差项是不存在自相关性的[2]。因此用ARMA (8, 7) -φ346θ42457模型为广西外经贸出口数据建模是合适的。
(2) 对ARMA (8, 7) -φ346θ42457模型的残差项进行异方差性检验。结果见下表, 滞后项为1、6、12阶时的相伴概率P都大于显著性水平0.05, 因此接受原假设H, 认为残差项不存在异方差性。
由此可认为ARMA (8, 7) -φ346θ42457模型的残差序列为纯随机性序列。即拟合ARMA (8, 7) -φ346θ42457模型是合适的。
(七) 预测
用ARMA (8, 7) -φ346θ42457模型预测2009年第四季度最后两个月的广西出口金额。如下表:
五、建模总结
用ADF检验来判定序列的趋势类型和平稳性, 可选择合适的方法使原序列平稳化。然后根据滞后差分项m与阶数p的关系, 可初步判断平稳化后的序列的ARMA (p, q) 模型, 再利用Pandit-Wu建模方法拟合最佳的ARM A (p, q) 模型。
从2009年11月份的预测值与实际值来看, 预测准确性不是很好。但考察2009年11月的实际值, 我们发现该值远离序列的均值三倍标准差之外, 是一个离群点。因此我们认为预测值还是能很好反映序列的变化趋势的。目前对离群点的研究主要集中在离群点的定义和挖掘方法方面, 对离群点挖掘的后期分析和处理似乎还是很少, 如果能够结合实际的背景意义, 对发现的离群点进行详细的分析处理, 将会带来更大的实际应用价值]5]。
摘要:通过证明ADF检验模型中滞后差分项m与ARMA (p, q) 模型中阶数p的关系, 在Pandit-Wu建模方法基础上, 归纳出ARMA (p, q) 建模的一种方法。并以广西外经贸20052009年10月的出口数据为例。
关键词:时间序列,平稳性,ADF检验,ARMA (p, q) 模型
参考文献
[1][4]李子奈, 潘文卿计量经济学 (第二版) [M]北京:高等教育出版社2005:329, 336
[2][3]王振龙, 胡永宏应用时间序列分析[M]北京:科学出版社2007:40, 104
[5]徐翔, 刘建伟, 罗雄麟离群点挖掘研究[J]计算机应用研究2009, 1:34-39
时间序列建模 篇2
关键词 模糊聚类分析;DNA分类;数学建模
中图分类号 O242 文献标识码 A 文章编号 1673-9671-(2012)052-0202-02
1 概述
2000年6月,人类基因组计划中DNA全序列草图完成。DNA序列由A、T、C、G4种碱基按一定规律排列而成。当前生物信息学最重要的课题之一是研究由这4种碱基排列成的序列中蕴藏的规律。目前在这项研究中最普通的思想是省略序列的某些细节,突出特征,然后将其表示成适当的数学对象。这种被称为粗粒化和模型化的方法往往有助于研究其规律性和结构。现已知20个人工序列1~10属于A类,11~20属于B类,要求运用数学建模方法发掘已知类别DNA序列的特征,从而据此对未知类别的20个DNA序列进行分类。本文对T和G碱基在各DNA序列中所占的比例数据进行标准化处理,放大两类DNA序列的差异,采用模糊相似矩阵,模糊等价矩阵,λ截矩阵方法对DNA序列进行分类。
2 模糊聚类分析模型
2.1 主要研究步骤
通过观察发现,A类DNA序列中G碱基含量较多,T碱基含量较少,而B类DNA序列则刚好相反。所以可用这20条DNA序列中T和G碱基在自身序列中所占的频率作为基本研究对象,并对T、G碱基所占的比例的原始数据进行标准化,放大差异。再建立相应的模糊相似矩阵,模糊等价矩阵和λ截矩阵,找出一个最优的λ值进行DNA序列分类并使分类准确度达到最高。最后用上述方法以及λ值对另外20个未明类别的序列进行分类。
2.2 原始数据标准化
先对T和G碱基频率作标准化处理。平移—标准差变换
(i=1,2…,20;j=2,4)
其中xi是第i个DNA序列,x'ij是指碱基A,G,C,T在第i个DNA序列中出现的频率,x"ij是对x'ij进行标准化后的标准频率值,
,,(j=2,4)。
进行平移—极差变换,(j=2,4),
可得到关于碱基频率的模糊矩阵
2.3 模糊聚分析法
相关系数刻画随机变量之间的线性相关性:相关系数绝对值越大,随机变量之间的线性关系越密切;相关系数为0,称随机变量线性无关。所以利用相关系数法对碱基频率模糊矩阵的元素进行处理,利用公式:
得到一个关于xi与xj相似程度的模糊相似矩阵rij。
如果xi与xj的相似程度为rij,那么模糊矩阵R=(rij)20×20,显然R是模糊相似矩阵,为
为了从模糊相似矩阵R得到模糊等价矩阵R=(rij)n×n,从n阶模糊相似矩阵R出发,依次求平方R→R2→R4→…直到R2i×R2i=R2i(2i≤n,i≤log2n),求出R传递闭包t(R),则t(R)=R。对于已知分类的20条DNA序列,由大到小取一组λ∈[0,1],确定相应的λ截矩阵Rλ=(λij)20×20,且λ截矩阵为一个对角线为1的对称0-1矩阵。即可将其分类:若λij=1,说明第i条DNA序列与第j条DNA序列属于同一类。若λij=0,说明第i条DNA序列与第j条DNA序列不属于同一类。对于未分类的DNA序列,利用已求出的λ值,得到相应λ截矩阵,再利用已知λ值便可对未分类的DNA序列进行分类。
2.4 分类结果及其分析
应用Matlab软件对第1-20个DNA序列数据进行处理,经平移-极差变得到类别A、B中A、T、C、G碱基的标准化频率(表1)。
可得到标准化矩阵:
那么得到表示这1-20个DNA序列之间的相关程度的模糊相似矩阵:
进而求得传递闭包t(R)及模糊相似矩阵RR=t(R)。对模糊等价矩阵R进行分析,发现选取λ∈(0.8714,0.9834)会得到最高的准确
率,高达100%,识别率为90%,没有出现误判。计算时可取平均值λ=0.9764,得到λ截矩阵Rλ=(λij)20×20。对于λ截矩阵Rλ=(λij)20×20,若λij=1,说明第i条DNA序列与第j条DNA序列属于同一类;若λij=0,则说明第i条DNA序列与第j条DNA序列不属于同一类。最后得到分类结果:
A{1,2,3,5,6,7,8,9,10}
B{11,12,13,14,15,16,18,19,20}
C类(无法识别){4,17}。
采用以上方法对第1-20个DNA序列分类的准确率为100%,识别率为90%,没有出现误判。把标号为21-40的DNA序列添加到原来的数据中,采用同样的模型与已求出的λ值对其进行分类,结
果为:
A类{22,23,25,27,29,33,34,35,36,37,39}
B类{21,24,26,28,30,31,38,40}
C类{32}。
3 结论
本文运用数学建模模糊聚类分析法方法,对T和G碱基在各DNA序列中所占的比例数据进行标准化处理,放大两类DNA序列的差异,采用模糊相似矩阵,模糊等价矩阵,λ截矩阵方法对DNA序列进行分类,方法简单、实用,且分类结果准确率高达100%,识别率为90%,没有出现误判。
参考文献
[1]www.csiam.edu.cn/mcm.2000网易杯全国大学生数学建模竞赛题.
[2]顾俊华,盛春楠,韩正忠.模糊聚类分析方法在DNA序列分类中的应用[J].计算机仿真,2005,10(22):108-129.
[3]刘焕彬,库在强,廖小勇,陈文略,张忠诚.数学模型与实验[M].北京:科学出版社,2008.
[4]徐晓秋,初立元,左铭杰,谭欣欣.DNA分类方法的探讨[J].大连大学学报,2001,8.
[5]岳晓宁,徐宝树,王竞波.基于聚类分析的DNA序列分类研究[J].沈阳大学学报,2008,20(6):104-106.
作者简介
时间序列建模 篇3
建立风速时间序列模型是序贯模拟风电场风速进而模拟风电场出力的前提,是电力系统生产模拟[1]、可靠性计算[2]、调峰影响评估[3,4]、概率潮流计算[5]等问题的基础,对风电并网规划意义重大。
目前,风速时间序列模拟主要有2种方法。一种是基于回归分析模型模拟风速,如基于自回归(AR)[6]、自回归滑动平均(ARMA)[7,8]、AR-广义自回归条件异方差(GARCH)[9]、ARMA-GARCH[10]模型等。此类方法通常是将原始风速标准化处理后建立回归分析模型,通过模型模拟得到风速,再通过各点对应的均值及方差还原得到风速时间序列。由于此类方法为了反映风速日统计特性涉及逐小时各点的均值和方差,通常需要多年风速实测数据。同时,该模型采用正态化方法处理风速,一般得到的模拟风速会出现负风速,对于平均风速较低、风速方差较大的风电场,通过此类模型模拟得到风速小于零的情况过于频繁,与实际不符。另一种是基于随机微分方程模拟风速[11,12],这种方法可以灵活设定风速的边缘分布,如Weibull分布等,通过给定指数函数描述序列的自相关函数,如果风速具有显著的季节性、日特性等,指数函数拟合序列自相关函数程度较差,需要对数据进行季节性消去等处理。
本文结合东北某实际风电场风速实测数据,基于概率测度变换进行风速时间序列的建模及模拟研究。研究结果表明,基于概率测度变换构建并模拟风速时间序列是可行、有效的。
1 东北某风电场风速统计特性
本文采用东北某风电场连续4年在70m高处的实测风速数据,采样间隔为10 min。统计各月平均风速如附录A图A1所示,风速具有明显的季节特性。对各月内同一时刻平均风速进行统计,夜间平均风速普遍高于白天风速,2月份相同钟点的平均风速如附录A图A2所示。考察各月份同一时刻的风速分布,附录A图A3给出了2月份08:00时标内的风速频率分布。对各月份同一时刻内的风速数据作正态概率图和Weibull概率图,得知各月份同一时刻内风速分布同样适宜用Weibull分布描述。附录A图A4和图A5给出了2月份08:00时标内风速数据正态概率图与Weibull概率图检查结果。
2月份08:00时分别基于正态分布和Weibull分布进行参数估计后得到的风速概率密度如图1所示。
由图1可知,风速正态概率密度存在风速小于零的情况,如图中阴影部分所示。如果基于正态分布进行风速时间序列建模必将导致模拟风速出现负值,与实际不符。文献[13]对风速进行回归分析时给出了风速小于零的简单处理方法,但是未给出具体依据。通过概率测度变换衔接实际风速序列与回归分析模型时间序列,可以有效避免模拟风速时间序列出现负风速。
2 概率测度变换
自时间序列产生以来,一直存在2种观察和分析时间序列的方法。一种是直接分析数据随时间变化的结构特征,即时域分析法;另一种是把时间序列看成不同谐波的叠加,研究时间序列频域特征,通常称为谱分析法。时域分析方法通过自相关函数、差分方程等工具分析时间序列,方法比较成熟,广泛应用于各个领域,也是用于电力系统分析的、时间序列建模的主要方法。其中回归分析是主要的时域分析方法,但是回归分析建模需要被描述序列具备正态性,而风速时间序列一般不具备正态性,一般适合用Weibull分布描述。如果直接对风速时间序列应用回归分析建模,就会出现图1中描述的问题。
为了有效利用较为成熟的回归分析方法,本文通过概率测度变换衔接实际风速序列和回归分析模型序列,实现对风速时间序列建模,进而实现模拟,避免负风速的出现。具体实现步骤如下。
步骤1:输入多年实测风速时间序列。
步骤2:将多年实测风速时间序列各个样本点分别归类到相同月份相同时标的集合。每个月份对应24个时标集合,12个月共288个集合。对288个集合分别进行Weibull分布参数估计。对于两参数Weibull分布模型,将得到288对形状参数和尺度参数。本文采用极大似然法估计Weibull参数,考虑到牛顿—拉夫逊法求解对初值十分敏感,本文基于二分法进行迭代求解。
步骤3:对实际风速序列各点进行概率测度变换。由于已知各样本点对应的Weibull模型参数,可基于Weibull分布求出各样本点对应的累积分布函数值,再根据标准正态分布求出累积函数值对应的标准正态密度函数值,实现概率变换。其公式表达如下:
式中:Vt为实际风速序列样本点;k和c分别为样本点对应的形状参数和尺度参数;Φ-1为标准正态分布函数的逆函数;Vt*为间接风速序列样本值。
步骤4:根据间接风速样本序列,基于回归分析建立间接风速时间序列模型。
步骤5:基于所建模型模拟间接风速。
步骤6:对间接风速进行概率测度变换,变换方法为步骤3的逆过程,其公式表达如下:
式中:V*mt为风速模拟时间序列样本点;Vmt为间接风速模拟时间序列样本点;Φ为标准正态分布函数。
步骤7:得到模拟的风速时间序列。
基于测度变换风速时间序列建模和模拟流程如图2所示。
3 单一风速时间序列建模及模拟
对东北实际风电场数据进行概率变换后得到的间接风速样本序列如图3所示。
本文基于ARMA模型对单一间接风速样本序列建模。采用Pandit-Wu建模方法,采用赤池信息量准则(AIC)对模型进行适用性检验。AIC评价指标定义[14]为:
式中:p为模型的阶数;T为样本数据长度;l为对数似然比;σa2为残差的方差。
基于东北间接风速样本序列得到ARMA(5,4)为适用模型,具体参数为:
式中:yt为间接模拟风速在t时刻序列上的值;at为一个均值为0、方差为σa2的正态白噪声过程,即αt∈N(0,σa2),σa=0.436 162。
根据式(5)间接风速模型模拟间接风速,并进行概率变换得到模拟风速时间序列,如图4所示。
图5对比了实际样本风速时间序列与模拟风速时间序列自相关函数与偏相关函数。由图5可知,2个序列有较好的一致性,也说明了应用概率测度变换的合理性。
4 风电场间风速相关性考虑方法
由于采用的模型不同,风电场间风速相关性考虑方法也不相同,文献[15]基于ARMA模型考查风电风速的相关性,通过设置适当的随机数种子使风速序列间达到合适的相关性水平,但是寻找合适的随机种子较为困难。文献[16]基于ARMA模型,利用时移技术模拟风速序列相关性,较为适合处理处于相同风况的风电场风速相关性。文献[12]利用随机微分方程模拟风速,用布朗运行的相关性刻画随机微分方程变量(即风速的相关性),由于不同风速序列边缘分布参数不同,描述各个序列的自相关指数参数也会不同,导致模拟得到风速相关性与样本序列相关性存在固有误差。文献[6]基于向量自回归(VAR)建模方法,描述了英国风电场间的空间相关性,把系统中每一个内生变量作为系统中所有内生变量滞后值的函数来构造模型,模型能够较好地描述变量间的动态联系。
本文选择VAR模型对多个风电场间接风速样本建模,用以建立间接风速的动态联系。通过下文算例考查经过概率测度变换后基于VAR模型考虑风电场间风速相关性的适用性。
本节算例选择第1节所述风电场及距离该风电场150km的另一风电场实测风速数据,对2个风电场原始样本风速序列进行参数估计及测度变换,得到间接风速样本序列,根据间接风速样本序列建立VAR模型,同样采用AIC检验模型的适用性。将式(4)中残差的方差σa2修正为(∑εtTεt)/T,其中εt为残差向量,则得到VAR适用模型为:
式中:yat和ybt分别为2个风电场间接模拟风速序列t时刻的值;εat和εbt分别为正态白噪声过程,标准差分别为0.435 9和0.446 2。
序列εa和εb满足的协方差矩阵为:
根据式(6)VAR模型模拟间接风速,并根据风电场各自风速边缘分布分别进行测度变换得到风速模拟序列。分别对比各风电场风速原始样本序列和模拟序列的自相关函数及偏相关函数,对比结果见附录A图A6、图A7、图A8和图A9。结果表明,风速模拟序列与原始序列的自相关函数与偏相关函数基本一致性,进一步说明了测度变换的可行性。本文基于Pearson相关系数,考查样本序列测度变换前后及基于VAR模型得到的风速多年模拟序列变换前后的2个风电场风速的相关性。结果如表1所示。
由表1结果可知,经过测度变换后,原始风速样本序列的相关系数变化较大,在间接风速样本序列与模拟序列相关性较为一致的情况下,由间接风速模拟序列经测度变换得到的风速模拟序列与原始风速样本序列的相关性保持了较好的一致性。这说明,将概率测度变换与VAR模型相结合适用于多风电场风速建模及模拟,适合描述风电场间风速的相关性。图6给出了一段截取的2个风电场的模拟风速曲线。
5 结语
本文结合东北某实际风电场的风速数据,基于概率测度变换考查了风电时间序列的建模方法。给出了实际风电场ARMA详细的模型及参数,实现了对单一风电场风速的模拟;通过VAR模型考查了风电场间风速相关性实现方法,给出了距离150km实际2个风电场的模型及参数,验证了基于概率测度变换是可行、有效的。基于本文模型进行风电场风速模拟主要有如下2个优点。
1)通过概率变换可有效避免出现负风速问题。
2)本文针对多年月内同一时刻的风速进行统计、参数估计与建模,避免了逐小时进行风速统计建模需要大样本的问题。采用本文的统计方式在不影响反映风速日统计特性及季节特性的同时,可以有效缩减所需的实测样本数据。
附录见本刊网络版(http://aeps.sgepri.sgcc.com.cn/aeps/ch/index.aspx)。
摘要:结合中国东北某实际风电场多年测风数据,分析风电场风速的统计特性,得出多年月内同一时刻风速同样服从Weibull分布。通过概率测度变换衔接实际风速序列与回归分析模型时间序列,基于自回归滑动平均(ARMA)模型,建立单一风电场风速时间序列模型;基于向量自回归(VAR)模型,给出了不同风电场间风速相关性考虑方法,分别给出了模拟风速时间序列的模型及参数。通过对比得知,实际风电场风速数据与模拟得到的风速时间序列具有较好的一致性,基于概率测度变换构建模拟风速时间序列是可行、有效的。
时间序列建模 篇4
关键词:捷联惯组,测试数据,二次修正插值法,时间序列,惯组误差系数
捷联惯组具有稳定期指标,但目前很难保证每个稳定期都对捷联惯组进行测试,因此稳定性数据较乱。同时,由于测试次数较少,更增加了描述其时间特性的难度。在这种情况下,通过一次插值来构建其误差系数的时间序列,误差必然会很大,而且插值点也将很不均匀。从文献[1]的正态性检验结果可以看出,捷联惯组标定结果的正态性并不好,带有很大的随机性。为此,本文提出了二次修正插值法,通过两次使用样条函数插值法来构建捷联惯组测试数据的时间序列,为捷联惯组测试结果的时间序列建模分析创造条件。
所谓时间序列,也叫时间数列或动态数列,它是将某种统计指标的数值按时间先后顺序排列起来所形成的数据序列。时间序列预测就是通过分析时间序列,并根据其反映出来的发展过程、发展方向以及发展趋势,进行类推或延伸,从而预测下一段时间或以后若干年内可能达到的水平[2]。
1 二次修正插值法
捷联惯组的测试应该严格按照稳定期要求进行测试,但由于惯组数量较多,测试时间也较长,这个要求一般不能得到满足,因而不能保证测试结果的等间隔性。同时,由于惯组测试次数较少,样本容量也无法满足模拟训练所需要的样本量要求。因此,需要利用二次修正插值法[3]来实现测试数据的等间隔化和样本容量的扩充。
1.1 第一次修正插值
第一次插值的目的是实现测试数据的等间隔化,即以原始测试数据为基础,以稳定期为间隔,采用三次样条函数插值法,对惯组稳定性测试数据进行第一次插值。在插值的过程中,以历次测试结果作为插值的基本点,对于在稳定期内有多次测试的,一般取其测试结果的平均值作为插值的基本点;然后,以稳定期为基本时间单位选择插值点进行插值。在对插值点进行准确性检验时,要以基本点为依据,以稳定期内的指标为标准,进行检验和修正,从而获得以稳定期为基本时间单位的时间序列,称为基本时间序列。
1.2 第二次修正插值
通过第一次插值后,获得了捷联惯组历次测试数据的基本时间序列,但是其样本容量还是相对较小。要用一个容量很小的样本进行建模,很难准确预测捷联惯组误差系数的变化趋势,因此,需要进行第二次修正插值。
第二次插值的目的是为了扩大样本容量,解决小样本建模容量不足的问题,即以第一次插值所得等间隔序列的元素作为基本点,并在任意两个相邻的基本点之间进行等点数插值,其插值的方法依然是采用三次样条函数插值法。同时,插值点的个数可根据建模所需样本容量来选取,一般最小间隔取为月的整数倍。在插值结束后同样需要对插值点进行准确性检验,其方法与第一次的一样,以保证所有的插值结果都必须满足稳定性要求。
2 时间序列的平稳性检验
时间序列的平稳性是建模的重要前提,是用于检验构建的时间序列是否具有不随时间的推移而变化的统计特性。在实际工作中最常用逆序检验法[4],其基本原理是:
设样本序列x1,x2,…,xN足够长,并把样本序列分成k个相等的子序列,即N=kM。其中,M是一个较大的正整数;k也为正整数。
逆序检验法就是检验各子序列均值的差异性,把各子序列均值(或方差)μi(i=1,2,…,k)构成一个序列μ1,μ2,…,μk。当出现μj(j=i+1,i+2,…,k)>μi时则称之为μi的一个逆序,与μi相对应的逆序个数Ai称为μi的逆序数。那么序列x1,x2,…xN的逆序数的总和可以表达为:
由于{xk}是随机过程的一个样本,所以均值μi也应该是随机的。当{xk}是平稳序列时,μ1后面的l-1个随机数μi大于和小于μ1的概率是相等的,故μ1的逆序数A1的理论平均值E(A1)=(l-1)/2;同理,E(A2)=(l-2)/2,…,E(Ak)=(l-k)/2(k=1,2,…,l-1),从而逆序总数的理论平均值:
逆序总数的理论方差为:
构造统计量:
该统计量渐进服从N(0,1)分布,在显著性水平α=0.05的情况下,若满足|U|<1.96,则可以认为该序列为平稳序列,否则认为该序列是非平稳的。
由此得到x1,x2,…,xN平稳性检验的步骤如下:
(1)将x1,x2,…,xN分成k段,每段N/k个数据,并相应计算各段均值(或方差),得到序列μ1,μ2,…,μk;
(2)计算A及U;
(3)由给定置信水平,查标准正态分布得za/2;
(4)若|U|<za/2,则以置信度1-α认为该残差数据序列具有平稳性,否则认为是不平稳的。
3 时间序列建模
由文献[5]可知,时间是影响捷联惯组稳定性的主要因素,随着时间的推移部分捷联惯组参数的稳定性会发生比较明显的变化,因此研究捷联惯组参数的时间特性是非常必要的。
3.1 ARMA时间序列建模
平稳序列ARMA(n,m)模型是指自回归移动平均模型,其表达式为:
式(5)中:
在许多实际问题中,所考虑的时间序列{xk}往往不是平稳的,不能用ARMA模型来表示。但是如果将{xk}进行有限次差分后,得到的时间序列{x′k}将是平稳的,{x′k}可以用ARMA模型来描述。
ARIMA(n,d,m)模型是指基于平稳化的自回归移动平均模型,它经过d阶差分,消除趋势项,使非平稳序列平稳化,其模型为:
因此,建立ARIMA(n,d,m)是建立在ARMA(n,m)模型基础之上的。在建模前要进行数据平稳化检验,如果随机序列是平稳的,取d=0。ARIMA(n,d,m)模型简化为ARMA(n,m)模型。
3.2 ARMA时间序列参数估计
ARMA(n,m)模型可以表示为:
对自回归模型参数Φi和滑动平均模型参数θj可以采用长自回归模型法。其思路是:基于观测序列建立起来的模型AR(n)、MA(m)、ARMA(n,m)都是等价系统的数学模型,具有相同的传递函数。因此,可以先估计出AR模型,然后利用传递函数的等价性,估计出ARMA的参数自回归模型参数Φi和滑动回归模型参数θj。
随机序列{xk}可以用模型AR(p)表示,也可以用ARMA(n,m)表示,AR(p)描述的等价系统传递函数为:
式(8)中:B为后移算子,Ii是逆函数,其取值等于AR(p)模型的参数Φi(i=1,2,…,p)。用ARMA(n,m)描述的等价系统传递函数为:
由于不同形式的传递函数描述的系统是等价的,所以上述两式应该相等。把两式展开,得到等式:
(1-I1B-I2B2-…-IpBp)(1-θ1B-θ2B2-…
-θmBm)=1-Φ1B-Φ2B2-…-ΦnBn。
对于B的相同阶次的系数应该相等,由此得到:
用最后一个方程,当k取n+1,n+2,…,n+m的时候,可以用以下矩阵求出θj(j=1,2,…,m):
在求出θj(j=1,2,…,m)以后,利用式(5)可以求出Φi(i=1,2,…,n)。关于Φi(i=1,2,…,n)的线性方程为:
求解上述线性方程,便得到Φi(i=1,2,…,n)的值,长自回归模型法在估计Φi和θj的过程中都是解线性方程组。它将ARMA(n,m)模型参数估计的非线性问题转化为线性问题来解决,大大简化了求解。
4 应用举例
现以某捷联惯组的误差系数K1x为例来构建捷联惯组测试数据的时间序列,该捷联惯组在3年内共进行了10次稳定性测试,测试数据如表1中序号1、7、10、13、16、22、28、31、34、37所示。
4.1 时间序列构建
在基本点的基础上用三次样条函数法进行第一次插值,插值结果如表1中序号4、19、25所示,共得到3个插值点,这3个点与基本点一共13个点,就构成了基本时间序列。
在基本时间序列的基础上用同样的方法进行第二次插值,在每相邻的两个基本点之间插入2个插值点,得到一个样本容量为37的二次插值时间序列,如表1所示。
基本点、插值点对应的曲线图如图1所示:
4.2 数据平稳性检验
a) 将上述时间序列分为6组,每组6个数据,得方差序列为:[3.050 761×10-8 4.286 550×10-9 2.574 614×10-9 1.018 866×10-9 6.514 175×10-9 1.124 191×10-9];
b) 根据逆序数的定义,统计可知逆序数总和A=4,进一步计算可得逆序总数的理论平均值及理论方差分别为7.5和7.08,代入到统计量U中得U≈1.13;
c) 由于在给定置信水平α=0.05的条件下|U| ≈1.13<1.96满足平稳性条件,因此,该时间序列是平稳的。
4.3 时间序列建模预测
下面对平稳的时间序列进行建模预测。由于陀螺漂移模型的阶次不易过高,一般不超过2到3阶[6]。同时,由于ARMA模型可近似地认为是一个线性系统,其传递函数一般是有理分式,即随机ARMA模型的自回归阶数必须要大于或等于滑动平均阶数[7],因此,得预测估计误差FPE判定数据如表2所示:
通过对上述数据进行综合评定,将ARMA模型的阶次定为(3,0),并通过计算可求得Φi及θi,如表3所示:
因此,K1x的ARMA模型为:
xk=2.499 321xk-1-2.188 490xk-2+0.679 671xk-3。
对前36次的测试数据进行建模并进行预测,得第37次的预测值为4.501 592×102,而实际测试得到的数据为4.501 625×102,计算其相对误差为6.05×10-6<1.20×10-4,满足稳定性要求。
ARMA时间序列建模预测结果如图2所示:
5 结论
文中研究了捷联惯组稳定性建模分析方法,提出了二次修正插值法,为捷联惯组误差系数的时间序列建模提供了途径,特别是对捷联惯组测试数据在小样本条件下如何建模问题进行了深入地探讨和研究。同时,在时间序列平稳性检验合格的基础上进行了ARMA时间序列建模。通过建模预测分析了其误差系数稳定性变化,并进行了检验,具有工程应用价值。
参考文献
[1]肖正林,徐军辉,钱培贤.惯性组合误差射前标定方法研究.弹箭与制导学报,2004;24(4):362—366
[2]张美英,何杰.时间序列预测模型研究简介.江西科学,2009;10,27(5):697—701
[3]徐军辉,肖正林,钱培贤.捷联惯组历次测试数据时间序列建模与预报.弹箭与制导学报,2005;25(2):620—623
[4]周刚.平稳性检验方法研究.北京:国防大学,2004
[5]徐军辉.捷联惯性测量数据分析方法研究.西安:第二炮兵工程学院,2003
[6]李平.提高星敏感器测角精度的研究.哈尔滨:哈尔滨工程大学,2006
时间序列建模 篇5
开关磁阻电机(SRM)以其特有的工作可靠、转矩惯量比大、脉动小、效率高和成本较低等优点,成功地应用于日常生活的各个领域。但由于SRM电机定、转子采用的是双凸极结构,其电流及磁链随时间呈单向性脉冲变化,相绕组磁链是转子位置角和绕组相电流的函数,磁路高度饱和,使得其磁链特性和转矩特性均为转子位置角和绕组电流的高度非线性函数,很难精确分析和计算电机磁特性,而提高其调速系统性能的关键是要建立SRM准确的非线性模型。
针对上述种种问题,国内外学者对SRM模型进行了大量的研究,如局部线性法、利用查表法和模糊逻辑法及有限元分析建模法。采用局部线性方法建模比较简单但是精度较差;利用查表法和模糊逻辑法建立了电流模型,也是假设在磁路不饱和的基础上的;有限元分析法精度高、适应性好,同时它有计算量大和繁琐费时的缺点。虽然上述方法在一定程度上能优化系统的部分性能,但不能较好地适应负载及环境变化。神经网络具有良好的非线性映射能力、并行处理信息以及自学习、适应的能力,因此越来越多的研究者把研究方向转向神经网络技术,如模糊神经网络和BP神经网络等,显示出一定的优越性。但神经网络存在局部极小点,不能全局寻优;过学习问题及结构和类型的选择严重依赖于经验等固有的缺陷,严重降低了其应用和发展的效果。支持向量机是一种基于统计学习理论的机器学习方法,采用结构风险最小化准则,较好地解决小样本、非线性和局部最小值问题,具有良好的泛化能力;本文利用混沌动力系统的相空间延迟坐标重构理论与支持向量机相结合,建立了基于混沌时间序列支持向量机预测模型,并利用最小二乘方法进行训练,通过仿真实验测试数据与预测数据比较,表明了基于混沌时间序列支持向量机用于SRM建模的可行性和高效性。
1 SRM的建模分析
开关磁阻电机运行遵循“磁阻最小原理”,并且饱和效应、边缘效应较为显著,绕组电感与磁链都是电流和转子位置角的非线性函数。根据电路基本定律,开关磁阻电机第k相的电压平衡方程式为:
其中:Uk为加入k相的电压;Rk为k相的电阻;ik为k相的电流;ψk为电机定子k相的磁链,可用电感和相电流的乘积来表示:
其中θ为转子位置角;L(ik,θ)为在位置θ时电机相绕组电感。
根据力学定律可得开关磁阻电机的电磁转矩Te和负载转矩TL作用下的转子机械运动方程为:
其中:J为转动惯量;Q为摩擦系数。从上面的过程可以看出磁链特性(式(2))对于整个开关磁阻电机系统建模是很重要的。
假设初始t=0时k相磁链值表示为ψk(0),式(1)可得出瞬时的磁链:
如果知道各相绕组在工作状态的电阻值,通过测量任意时刻相绕组的两端电压和电流,并按式(4)进行积分,就可以计算出任意瞬时的磁链值k,即可获得任意时刻的采样数据。
2 支持向量机的基本原理
假定训练数据X={(x1,y1),(x2,y2),!(xl,yl)},Rn×R,其xi为输人向量,yi是xi相对应的输出值,l为样本数,其基本思想就是通过一个非线性映射函数Φ中将样本点xi映射到高维特征空间F,并使之转化为高维空间的线性问题:
ω表示超平面的权重向量;b为阈值;<·>表示向量内积。
根据Vapnik的VC维理论和结构风险最小化原则,式(5)中的f(x)应使目标函数J最小。
其中,惩罚系数C>0,用于调整置信范围和经验误差间的均衡。L(f(xi),yi)为惩罚函数,
因此就将寻找(5)式的参数问题转化为求解(7)式的优化问题。为了解决这样一个优化问题,引人拉格朗日函数,利用对偶理论,计算得到优化问题的对偶式:
其中约束条件为:
求解后得到拉格朗日算子ai,ai*,其中只有ai≠ai*对应的数据点定义靠近约束边界的样本向量,并由(5)得到回归函数:
在选择核函数之后,对支持向量机进行训练,可以得到时刻支持向量机的进一步预测模型:
其中,m为嵌入维数;τ为延迟时间间隔,因此,可以得到第r步基于混沌序列支持向量机的预测模型为:
式中r为预测的步长。
3 混沌时间序列支持向量机的开关磁阻电动机模型与仿真分析
利用混沌时间序列支持向量机的开关磁阻电机模型结构如图1所示:输入参数为绕组相电流和i转子位置角θ,输出为磁链ψ。利用SVM来逼近磁链ψ与相电流i和转子位置角θ之间的非线性关系,获取每隔5°的转子位置角θ处的随机电流i作用下的磁链ψ,将其作为测试样本。
只要选择满足条件的适当的核函数来代替内积,就可以将原始空间不可分的数据在高维空间可分。径向基核函数是一个比较通用的核函数,能够实现非线性映射、数值误差小,通过参数选择,它可以适用于各种分布的样本,因此本文选用径向基核函数为SVM的核函数。径向基核核有校正因子γ和宽度系数σ两个参数需要确定。本文采用先粗选后细选的方法来提高参数选择的速度与精确度:首先选取分布均匀的离散点作为参数初始点,在保证误差较小的条件下,比较各个离散点绝对误差、均方根误差和收敛速度,对参数进行粗选,初步确定最优参数对的范围。评价模型估计效果的性能指标定义如下(为预估值,y为样本值):
再根据初步确定的范围,选择参数中心点及步长;以中心点为基点,在步长上选取若干个方向点,以最大绝对误差和均方根误差最小为选择条件,选取新的中心点;逐次选优,若达到给定的学习精确度和收敛速度,选优过程结束,否则返回最初点改变步长继续训练。利用本模型对测试样本进行预测,图2便为利用训练好的混沌时间序列支持向量机模型仿真得到的特性曲线,可以看出其与实际采样数据磁化曲线基本重合,有很好的拟合能力。
为比较各种建模方法的优缺点,本文列出了三种建模方法的性能指标进行对比,如表1所示:
从表中可以看到本文的方法在样本容量由小到大的变化中测试误差波动不大,算法快速,不会出现‘过学习’现象,因此以混沌时间序列支持向量机很好的克服了神经网络的缺点具有更好的泛化能力。
本文为验证建模方法的有效性,建立了SRM调速系统的实验平台。平台包括实验样机机组和控制系统。SRM调速系统的仿真条件为:供电电压220 V,裂相式功率电路,开通角为-2.5°,关断角为22.5°,电压控制方式为PWM,适当调节负载使电压PWM波的占空比为100%。在转速为1500r/min时,实验电流波形与仿真电流波形比较如图3所示。
由图3可知仿真电流和实验电流电流峰值分别为7.5 A和7.6 A,波形误差小,波形吻合较好,说明本文建模方法的正确性和有效性。
4 结束语
本文利用混沌时间序列支持向量机在非线性建模和预测的快速收敛和高度精确的特点,提出了一种开关磁阻电动机模型,仿真结果表明,比传统的神经网络建模方法有很大的提高,本模型具有鲁棒性好、模型精度高和收敛速度快的优点;并且仿真电流波形与实验电流波形拟合较好,波形误差小,说明了本文建模方法的正确性和有效性。
摘要:本文在对开关磁阻电机非线性磁特性分析的基础上,提出了一种基于混沌时间序列支持向量机的开关磁阻电机建模新方法,运用支持向量机的回归理论通过对磁路得到的样本数据集进行学习,在运用混沌时间序列的支持向量机模型中,引人了径向基核函数,简化了非线性问题的求解过程。仿真实验表明,所构建的开关磁阻电机模型是可行的,模型能够反映电机的磁特性,有较高的精确度和预测能力。
关键词:开关磁阻电机,径向基函数,建模
参考文献
[1]林剑艺,程春田.支持向量机在中长期径流预报中的应用[J].水利学报,2006,37(6):681-686.
[2]LiongS Y,Sivapragasm C.Flood stage forecasting withSVM[J].Journal of the American Water Association,2002,38(l):173-186.
[3]Elmas C,et el.Modeling of a nonlinear switched reluctancedrive based on artificial neural networks[J].PowerElectronics and Variable Speed Drives,1994,ConferencePubli cation No.399,(c)IEE:7-12.
[4]Ray W F,Erfan F.A new method of flux of inductance measurement for switched reluctance motors[J].PowerElectronics and Variable Speed Drives,1994,ConferencePublication No.399,(c)IEE:137-140.
[5]廖杰,王文圣,李跃清,等.支持向盘机及其在径流预测中的应用[J].四川大学学报(工程科学版),2006,38(6):24-29.
[6]李国庆,陈守湿.基于模糊模式识别的支持向量机的回归预测方法[J].水科学进展,2005,16(5):741-746.
[7]Cameron D E,Lang JH,Umans S D.The Origin and Reduction of AcousticNoise inDoublySalientVariable-reluctanceMotors[J].IEEE Trans.on IA,1992,28(2):1250-1255.
[8]Wu C Y,Pollock C.Time Domain Analysis of Vibrationand Acous-tic Noise in the Switched Reluctance Drive[C].6th Int.Con.f on Electr.Machines and Drives(London,U.K.),1993:558-563.
时间序列建模 篇6
建筑物的沉降变形是一种普遍现象,这种变形超过规定的限度,就会影响建筑物的正常使用,甚至危及其安全。因此,对沉降变形进行定期监测,并根据已测数据寻求其变化规律和做出相应的预报是非常必要的。
沉降变形是一个复杂的过程,它主要受到沉降区域地质构造、边坡体及滑动面的力学性质、区域的水文气象条件(包括地下水、雨水等)等因素的影响,而这些因素的相互作用经常是非线性的,线性作用只是非线性作用的在一定条件下的近似。由于沉降变形过程的复杂性,单一的非线性模型往往很难准确的描述沉降变形规律,非线性模型和其他模型的有机结合和综合运用将是正确分析和解决问题的有效途径。例如,非线性回归模型能较好的描述沉降变形的总体非线性趋势,但无法描述总体变形趋势上一些小的、周期性的波动;时间序列分析很难描述过程的总体非线性趋势,但对小的、周期性波动描述却很有效[1]。本文将讨论这两种模型在实测沉降观测数据分析中的综合应用。
1 时间序列分析模型的确定与预报[2,3]
1.1 模型类型
时间序列分析是一种动态建模方法,每一时刻的沉降值可以认为是沉降状态的过去状态与外部其他因素共同作用的结果,各时刻的变形值互相依赖,带有惯性,记录了各种因素综合影响。引入时间序列分析模型,能较好的描述沉降变形规律,克服静态模型的不足。
设{Xt}t=,1,2,3∧是零均值的时间序列,则:
式(1)称为序列{Xt}的自回归滑动平均模型,记为qp ARMA(p,q)其中p、q为正整数,分别称为模型的自回归和滑动平均阶数,分别称为自回归和滑动平均模型系数,εt是白噪声序列,满足(2)式:
式(2)说明,白噪声序列是零均值序列,且两两互不相关。
式(1)中,如果q=0,有:
式(3)称为p阶自回归模型,记为AR(p);式(1)中,如果p=0,有:
式(4)称为q阶滑动平均模型MA(q)。可以看出,AR模型和MA模型是ARMA模型的特例。
1.2 模型识别与阶数的确定
应用时间序列分析处理沉降观测数据,就是根据样本X1,X2,^对序列{X t}的模型进行估计,即模型识别;同时,需要确定模型的阶数。AR模型和MA模型的识别一般是通过考察样本的自相关函数γk和偏相关函数ϕkk实现的。可以证明,样本的偏相关函数对AR模型具有截尾性,对MA模型具有拖尾性;自相关函数对AR模型具有拖尾性,对MA模型具有截尾性[2]。即:
(1)若样本自相关函数γk在k>q后截尾(趋近零),则可判断为MA(q)模型;
(2)若样本偏相关函数ϕkk在k>p后截尾(趋近零),则可判断为AR(p)模型;
(3)若γk、ϕkk均不截尾,可考虑ARMA模型。ARMA模型阶数的判定较复杂,可以通过AIC准则(或BIC准则)识别。
现就样本自相关函数、偏相关函数计算方法作简要介绍。样本自相关函数γk按式(5)计算:
样本偏相关函数ϕkk计算较复杂,首先,由样本值X1,X2,∧,Xn,计算样本自相关函数γ0,γ1,γ2,∧,γk,则{X t}的自相关函数(或协方差函数)满足尤尔-沃克方程,即:
式(6)的矩阵形式为:
为了求偏相关函数ϕkk,其中ϕk1,ϕk2,∧,可以通过解尤尔-沃克方程得到,但当k较大时,计算量较大。偏相关函数通常可以利用下面的递推公式得到:
1.3时间序列模型预报
序列{Xt}在时刻t qp ARMA),(模型的预报见(9)式:
式(9)中,各项意义同上文所述。AR(p)模型和MA(q)模型是ARMA(p,q)模型的特例,预报模型可以参考式(3)和式(4)。
2 非线性回归模型及其在沉降分析中的应用
某居民楼附近建设大型变电站,需要深挖基坑,对该居民楼进行沉降观测,2006年7月30日至9月21日的54期沉降观测数据曲线见图1,根据实测数据曲线形状,选择指数函数模型来描述沉降过程的趋势,模型如下:
式(10)中,Ht为期数t时刻实测高程值,a、b为待估参数,t为时间变量。
按式(10)模型估计,a=69.86033,b=-0.00004291522。得到的回归模型如(11)式所示:
式(11)的回归曲线见图1,回归模型基本上描述了沉降过程的总体趋势,但是,总体趋势基础上一些小的波动没有体现出来,所以,采用时间序列分析与非线性回归作进一步分析是非常必要的。
3 时间序列分析和非线性回归的综合建模与预报
3.1 时序分析建模
由前面的讨论知道,建立的非线性回归模型只反映了沉降过程的总体趋势和主要影响,还有一部分波动没有反映出来,所以,可以用时间序列分析方法对回归残差进一步分析。式(11)可以看成沉降过程的趋势项,消除趋势项后的序列,即回归拟合残差序列,可以写成:
针对残差序列{Xt}建立哪种模型,本文采用考察样本自相关函数γk和偏相关函数ϕkk的方法判断。样本个数N=54,取2倍中误差作为判断阈值,经计算,样本自相关函数拖尾;考虑到偏相关函数的计算精度,一般k≤N/4,计算结果见表1。由表1可得,偏相关函数在第4步以后截尾,所以,可以判断样本时序模型为AR()4。
残差序列{Xt}自回归AR(4)模型如下:
式(13)中,各项意义同上文所述。经计算得到β1=.06002,β2=-.00273,β3=.04152,β4=-0.3677。将上述四个系数代入式(13)得到:
3.2 综合建模与预报
式(11)和式(14)联合起来,就得到非线性回归与时间序列分析的综合模型:
采用式(15),得到综合模型拟合数据曲线(见图2),而且,综合模型各期的拟合残差均小于1mm(详见表2),拟合数据曲线和残差进一步说明本文建立的综合模型能较好的反映该沉降过程。
按照上文所述的综合模型建模方法,对本次沉降观测的后5期数据进行预报,即首先1步预报第50期数据,再利用预报得到的第50期数据2步预报51期数据,以此类推得到5步预报的第54期数据。将各步预报数据与实测数据进行比较,得到预报误差(见表3)。可以得出,综合模型的预报精度较高,但随着预报步长的加大,预报误差将增大。所以,运用本文方法预报必须动态建模,不宜进行长期预报。
4 结束语
结合沉降变形的一般规律,本文阐述了采用时间序列分析和非线性回归对沉降过程进行综合建模与预报的全过程。通过对实测沉降数据进行处理,结果表明:采用时间序列分析和非线性回归对沉降过程进行综合建模与预报是可行的,能较好地描述沉降过程的动态变化规律和状态特征。
参考文献
[1]节斌.综合运用非线性回归和时间序列分析研究边坡变形[J].测绘科学,2003,(3):52~54.
[2]同济大学应用数学系.随机过程简明教程[M].上海:同济大学出版社.
[3]同济大学计算数学教研室.数值分析基础[M].上海:同济大学出版社,1998.
[4]雷渐宏.时间序列分析与回归分析之异同[J].中国统计,1997,(3):39~40.
[5]郭禄光,樊功瑜.最小二乘法与测量平差[M].上海:同济大学出版社,1988.
[6]许国辉等.时间序列分析方法的研究[J].广州大学学报,2003,(6):556~558.
高土石坝短序列监测资料建模研究 篇7
土石坝工程施工简便、对地质要求比较低、造价便宜,因此是水利水电工程中极为重要的一种坝型。20世纪90年代以来,随着我国坝工技术的发展,水利水电工程建设突飞猛进,土石坝坝高不断的突破,现已经开始向300 m级高坝进军。伴随着高坝数量的不断增多,对大坝后期,尤其是大坝刚建成的几年的性态了解至关重要,这不仅可以为我们设计和建设做很好的经验反馈,而且对于大坝的安全运行也非常必要。
对于刚建成的高土石坝,一方面迫切需要知道大坝的安全性态,以便作出正确的安全评价;一方面又面临观测资料少且规律往往呈现无序性的问题,这就是人们常说的短序列资料问题。对于这种资料传统的单一建模方法,往往效果不理想,甚至严重背离实际工作性态,这就需要对这部分资料进行充分研究,在信息不多的情况下充分发现其规律。本文结合具体的高土石坝工程的短序列观测资料,研究其规律,再结合相关文献,对其分类,并根据不同类型采用不同的建模方法。
1 建模方法
大坝安全监测数学建模是试图寻找外在信息(效应量)和内在信息(因变量)之间数学关系。目前,广泛采用的模型主要有:数学模型(统计模型、确定性模型及混合模型)和神经网络模型两种。每种方法都有其优缺点和适用范围,在众多的数学模型中,笔者结合现今的认可度和使用度,选用了以下3种模型:逐步回归模型、灰色GM(1、N)模型,BP神经网络模型,这3种模型分别从概率统计原理、灰色原理、人工神经网络原理去探究安全监测问题,并且在其各自领域具有代表性。下面对各方法进行简要介绍。
1.1 逐步回归模型
回归分析一般研究变量之间存在非确定性统计关系的问题。逐步回归的基本原理是最小二乘法,在高土石坝建模时的步骤如下:
(1)根据监测量(效应量)确定具体的与之相关的环境量。
环境量的选取一般先根据坝工原理初步确定,本次计算模型的环境量都参照文献[1] 中推导的模型来选取,如大坝的变形模型为:
式中:δ(t)为变形监测量;δh(t)为水压分量;δT(t)为温度分量;δθ(t)为时效分量。
(2)代入逐步回归模块,建立方程。
逐步回归中,可以剔除相关性不显著的变量。
1.2 灰色GM(1、N)模型
灰色系统认为事物之间存在能量吸收、储存、释放过程,它通过对数剧的再生成,削弱数据的随机性,增强规律性。这样便可以对变化过程做较长时间的描述,进而建立微分方程形式的模型。高土石坝的建模步骤如下:
(1)根据监测量(效应量)确定具体的与之相关的环境量,并进行数据初始化。
环境量的选取同统计回归模型,灰色模型中还要对数据做初始化,使其消除量纲,笔者选用的方法为:
设Xi=(Xi(1),Xi(2),…,Xi(n))为一组监测数据,用X
(2)累加生成1-AGO数据X
(3)建立白化方程。环境量X2(2~N)与监测量X1之间建立的微分方程即GM(1,N)模型:
求解微分方程,记参数列为(a,b)T,并根据最小二乘法,系数(a,b)T=(BTB)-1BTY其中:
1.3 BP神经网络模型
人工神经网络是对人脑若干基本特征通过数学方法进行的抽象合模拟,是一种模仿人脑结构极其功能的非线性信息处理系统,因而它对变量之间关系比较混沌的资料有时效果明显。BP神经网络在高土石坝的建模步骤大致如下。
(1)根据监测量(效应量)确定具体的与之相关的环境量,并进行数据处理。
(2)确定神经元网络结构和参数,见图1。
Cybenko曾经证明,当各节点都采用对数函数时,一个隐含层就足以实现任意判决分类问题,两个隐含层则足以表示输入图形的任意函数,所以本次所有BP模型都采用一层隐含层。隐含层的节点数选取一直是神经网络中比较关键又难以解决的问题,隐含层需要多少个隐单元与网络用途有关,但并不唯一,本次计算证明4个隐含层多大部分建模已经足够。学习效率用自调整模型算法。
(3)代入数据用神经元模块进行计算。
2 短序列资料分类
2.1 各模型的优缺点
逐步回归模型、灰色GM(1,N)模型、BP神经网络模型在高坝短序列资料的建模上都具有各自的优缺点,如果能够事先对资料进行适当的分类,知道其适合哪种模型,这样就可以使建模更加准确,避免盲目性。
逐步回归建模的优点是:它的理论简单、成熟,是目前最常用的模型,如果变量之间存在某种较为确定统计回归关系,建模效果一般较理想;缺点是:对于相对平稳或波动较大的数据或变量之间关系不明确的数据回归相关系数较低。灰色GM(1,N)模型的优点:它对数据的多少无过分要求,也不需要具有典型的分布,对比较平稳的数据效果也较好,尤其对数据经处理后能形成某种指数关系的数据效果较好;缺点是:数据变化较大的情况预测精度偏低。BP神经网络模型的优点是:具有非线性、自适应性、自组织、自学习的能力,能较好的解决具有不确定性、严重非线性及时变滞后的的复杂系统的建模,因而在高坝短序列建模时有很强的适用性;缺点是:收敛速度较慢,甚至难以收敛,不能明确提供各因子的影响大小。
2.2 分类标准、采用模型
综合上述模型的优缺点,结合具体高土石坝短序列资料建模研究,笔者把短序列资料分为3类:①呈现某种规律的短序列资料,这种资料采用逐步回归建模计算;②经处理可以呈现某种规律的短序列资料,这种资料采用灰色GM(1,N)计算;③无法寻找具体规律的短序列资料,这种资料采用BP神经网络模型。所谓资料是否呈现某种规律,主要看它的变化是否和环境量之间存在某种相对应的关联关系,很显然,如果两组数据发展趋势越接近,则关联关系越大。直观分析虽可以做一定初步的判断,但需要给出一种计算方法来衡量关联程度的大小,本次引入关联度为判别的标准。
其中:X0(k)为效应量;Xi(k)为各环境量;k表示时刻;ξi(k)为环境量对效应量在k时刻的关联系数;ρ∈(0,+∞)为分辨系数,一般取0.5,ρ越大分辩率越大;
当环境量与效应量的关联度较高时(笔者采用当存在一组以上效应量与环境量之间关联度在0.8就认为关联度较高,但关联度与ρ的选取和具体工程都有关系,所以不好给出统一标准),则认为是第一种数据,采用逐步回归计算,当关联度较小,则把数据进行1-AGO处理,再判断关联度,当关联度较高时认为第二种,否则为第三种数据。
3 实例分析
冶勒水电站位于四川省西部南桠河上游,挡水结构为沥青混凝土心墙堆石坝,最大坝高125.5 m,最大断面见图2。冶勒大坝共有500多个观测点,包括变形、渗漏、应变、水位、温度等,观测资料比较多且复杂。冶勒大坝于2000年3月开始施工, 2005年1月1日首次蓄水,现阶段正是大坝安全运行关键时刻,正确根据观测资料认识大坝的性态至关重要。但因为建成不久,而且许多观测点起测较晚,因此观测资料较少,都是典型的短序列资料。下面结合具体资料进行短序列资料分析。
3.1 第一类短序列资料
TP27是下游2 594.5 m马道垂直位移观测点,观测仪器于2005年12月开始进行监测,位移随着时间和水位呈明显的增大趋势,经计算和水位、温度、日期的关联系数分别为:0.817、0.869、0.943,有明显的相关性,按分类属于第一种短序列资料。图3为采用3种方法的计算结果,R2为复相关系数。
从结果可以看出逐步回归和BP模型效果都较好,这时采用理论成熟,耗时较少的逐步回归是合理的。
3.2 第二类短序列资料
IN2为沥青混凝土心墙的上下游方向水平段位移的固定测斜仪中的监测点,于2006年1月开始监测,监测资料到目前呈小范围的波动状态,与水位、温度、日期的关联系数分别为:0.53、0.50、0.53,关联程度不明显,经1-AGO处理后观测数据指数趋势明显,与水位、温度、日期的关联系数分别为0.53、0.962、0.972,关联程度呈现相关,应该属于第二种短序列资料,图4是采用3种方法的计算结果。
从结果可以看出采用灰色GM模型是合理的。
3.3 第三类短序列资料
GC21为地下水位长期观测孔,主要监测左岸绕渗,数据于2006年4月开始观测,数据波动不大,但无法和环境量建立相关关系,与水位、温度、日期关联度分别为:0.63、0.06、0.06,经1-AGO处理后效果也不明显,与水位、温度、日期关联度分别为0.68、0.22、0.22,属于第三种短序列资料。图5是采用3种模型的计算结果。
从结果可以看出对于这种短序列资料选用BP神经网络模型效果最好。
4 结 语
(1)对逐步回归、灰色GM(1、N),BP神经网络3种模型原理进行研究比较,给出了各模型的优缺点,并结合各模型的优缺点,引入关联度,将短序列资料进行了合理分类,给出了各分类宜采用的数学模型,使在以后建模时,可以事先确定使用什么模型,节约了试模时间,又可以达到满意的效果。
(2)本文在分辨系数取0.5的情况下,关联度采用0.8作为判断标准,在对冶勒沥青混凝土心墙坝500多个测点进行分析时,基本合理。结合其他工程的计算发现标准可适当波动,分辩系数ρ建议取0.5~0.8之间,关联度建议取0.7~0.8之间。
摘要:通过对逐步回归模型、灰色GM(1、N)模型,BP神经网络模型3种典型建模方法原理的研究比较,再结合对大量具体高土石坝短序列资料建模效果的比较,提出了高土石坝短序列资料的分类,并引进了关联度作为分类标准,给出了不同类型适宜采用的模型,最后通过对冶勒沥青混凝土心墙坝短序列资料的具体计算,证明了分类合理,值得推广。
关键词:高土石坝,短序列,监测模型
参考文献
[1]吴中如.水工建筑物安全监控理论及其应用[M].北京:高等教育出版社,2003.
[2]刘思峰,党耀国,方志耕.灰色系统理论及其应用[M].北京:科学出版社,2004.
[3]薛晓翔,陈建康,徐成,等.中低混凝土重力坝位移监测模型因子探讨[J].四川水利发电,2006,(3).
[4]赵斌,吴中如,张爱玲.BP模型在大坝安全监测预报中的应用[J].大坝安全与土工测试,1999,(6).
[5]徐梦华,李珍照,李民.大坝监测数学模型若干问题的研究[J].武汉水利电力大学学报,1999,(3).
[6]王柏乐,刘瑛珍,吴鹤鹤.中国土石坝工程建设新进展[J].水力发电,2005,(1).
时间序列建模 篇8
智能电网调度控制系统在“大运行”体系建设中发挥了重要的作用,为各级调控中心之间的系统协同及调控中心内部全业务的一体化运作提供了很好的技术支撑[1,2,3,4]。基于智能电网调控系统基础平台,采用基于电网通用模型描述规范(CIM/E)的模型拼接技术,实现了各级调控中心之间的模型、图形源端维护和全局共享,在调控中心内部,也基本实现了在线业务之间的模型、图形共享。但智能电网调度控制系统的模型运维在实际运行中也发现了如下一些不足。
1)智能电网调度控制系统的模型主要满足调度生产运行的需要,调控中心其他应用的模型,如保护整定模型、运行方式模型等,并没有真正融合进来,造成各应用系统的重复建模及不一致。
2)智能电网调度控制系统的实时态、规划态、测试态等是逻辑上的态,基于规划态和测试态进行系统维护时,经常会影响到实时运行系统,造成系统运行不稳定。
3)模型数据的管理体系还不健全。调控机构还没有建立贯穿电网规划设计、工程建设、新设备调试到投产运行的全过程模型数据维护管理体系,需要完善未来到当前、在线与离线协调运作的模型维护流程。
4)智能电网调度控制系统的前置验证(子站与调度主站的传动试验)经常因为误操作而干扰实时系统的正常运行(子站与调度主站的传动试验)。
总之,大电网协调控制对各级调控机构和各专业在业务协同和数据共享方面提出了更高的需求,智能电网调度控制系统在完善在线应用的基础上,还需要进一步融合系统运行专业的离线方式计算和继电保护专业的整定计算等离线类应用,进一步完善模型数据“源端维护、全网共享”机制,提升调控业务协同运作能力。
文献[1,3]重点介绍了基于CIM/E的模型信息一体化管理,提出了应用多模型、在线和离线模型、上下级调度系统之间公共模型的一体化管理,对本文有非常重要的借鉴作用。文献[4-5]侧重调控中心之间一体化建模的具体方案和关键技术。本文基于智能电网调度控制系统,提出了基于时间维度的调控全业务统一建模方案,包括时间维度的调控全业务模型维护、时间断面的业务模型抽取、模型/图形/通信数据索引表等信息的协同验证、基于基建任务的模型在线同步等关键技术的解决方案。该方案能够解决智能电网调度控制系统在实际运行中的不足,实现多时态、多应用模型/图形的统一维护和管理,为调控中心内部各专业系统一体化协同提供了统一的模型支撑。
1 总体方案
基于智能电网调度控制系统基础平台,搭建如图1所示独立的时间维度的调控全业务统一建模系统(简称建模系统),避免了系统维护和测试对在线运行系统的干扰。建模系统的主要功能包括时间维度的调控全业务模型维护、时间断面的业务模型抽取、模型协同验证、基于基建任务的模型在线同步、离线业务模型的发布及多维度模型信息版本管理等功能。
建立时间标签的电网公共模型和业务模型一体的数据结构体系[1,2],在此基础上开发时间维度的调控全业务模型/图形统一维护工具,形成不同时间断面的全业务模型和图形(各业务的历史、实时和未来模型)。所有的模型统一存储在模型数据库中,历史模型版本以CIM/E文件存储。
各业务系统根据需要从模型数据库中抽取任一时间断面的电网模型。时间断面的业务模型抽取除了根据时间标签和业务标签进行抽取外,还可以同时定制个性化的业务模型信息,如抽取的模型中不包含刀闸和地刀等。对于在线系统的业务模型,时间断面的模型和通信索引表抽取后,装载到实时数据库,进行模型/图形/通信索引表的协同验证,验证通过后,根据基建任务的具体要求,形成同步任务包,同步到在线运行系统。对于离线系统,时间断面模型抽取并通过验证后,以CIM/E文件的方式发布给各业务系统。多维度模型信息版本管理在模型发布或同步后,自动以CIM/E文件、电网图形描述规范(CIM/G)文件的方式按时间标签和业务标签生成模型版本信息。
时间维度的调控全业务模型/图形编辑工具完成模型/图形等信息的基本维护工作,形成时间维度的调控全业务模型数据库,各应用根据需要抽取电网模型并且生成对应的图形和通信索引表。不同应用对模型的具体需求不同,对模型验证的方式也不同,如数据采集与监控(SCADA)系统,需要进行模型/图形/通信索引表的协同验证,对于状态估计等应用而言,还需要进行模型的拓扑、参数等验证,对于保护定值的整定计算,除了上述验证外,还需要进行二次设备模型的完整性等信息验证。为了模型验证的需要,建模系统需要部署数据采集服务、SCADA及状态估计等应用。模型/图形的在线同步是基于同步任务,模型/图形发布的模型是基于CIM/E文件[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16]。
时间维度的调控全业务模型维护、时间断面的业务模型抽取、模型协同验证、基于基建任务的模型在线同步、多维度模型信息版本管理及离线业务模型发布等是本方案的核心技术,其中,多维度模型信息版本管理和离线业务模型发布在其他文献中多有论述,本文不再详细论述,重点对时间维度的调控全业务模型维护、时间断面的业务模型抽取、模型协同验证及基于基建任务的模型在线同步4个环节进行论述。
2 关键技术
2.1 时间维度的调控全业务模型维护
电网公共模型是实时监控、数据采集等各类电网调度业务中通用的模型,是各调控业务所需要的电网模型的公共部分,该模型既包含电网设备模型(电气设备类及其基本参数属性),也包含拓扑结构模型(设备进一步抽象为节点、支路和电气岛),业务模型则包括电网公共模型和业务特有模型[1]。从调控中心各业务的电网模型中抽取出公共模型,建立电网公共模型与业务特有模型的关联关系,如图2所示,在业务特有模型的所有表中都包含字段“PID”,该字段指向公共模型中的设备标识(ID)。这种关联主要用于实现多应用模型的统一维护和管理。
扩展公共模型中的设备属性,即每个设备类扩展计划投运时间、计划退运时间、实际投运时间和实际退运时间4个属性,配合基于CIM/E文件的模型版本管理,实现多时态模型的统一维护和管理。从而形成了时间维度的调控全业务统一模型基础架构。
图3是模型/图形统一维护示意图,在电网模型架构中描述了电网公共模型、业务特有模型及它们的关联关系。
业务特有模型维护配置信息中明确了公共模型中的每一类设备需要同时生成的业务特有模型信息,因此,在维护公共模型的时候,利用业务特有模型维护配置信息自动生成业务特有模型的基本信息。业务特有模型配置信息主要包括应用名,与公共模型设备对应的业务特有模型中的类名、命名规则、关联关系,以及其他需要自动生成的属性及属性值生成规则等。监控业务的模型信息主要由传统的SCADA模型和保护装置模型及其保护信号组成。
在进行公共模型维护的时候,根据配置信息只生成对应的保护装置,如创建一条母线(BusbarSection)时,根据配置信息会生成2条母差保护装置信息。在厂站具备调试条件后,保护装置以下的模型信息(包括保护信号),从变电站侧通过召唤的方式收集过来,利用名字匹配等技术手段,完成保护信息建模,从而形成了完整的监控业务模型。对于业务的业务特有模型和公共模型没有关联的部分,无法通过配置文件生成,建模系统提供可视化的维护工具由专业人员维护。
维护公共模型时,必须依据规划或基建任务维护设备的计划投运时间和计划退运时间。计划投运时间和计划退运时间主要用于管理未来模型,在未来时间断面模型抽取时也会使用。当设备真正投运后,计划投运时间和计划退运时间自动失效,设备的实际投运时间和退运时间开始生效。
图形编辑器是调度自动化系统常用的电网模型/图形统一维护工具,上述电网模型的维护方法通常是在图形编辑器上进行。模型的拓扑关系依靠图形编辑器自动生成。图形编辑器虽然解决了时间维度调控全业务模型的统一维护问题,但图形编辑器只负责基本的建模(模型的拓扑、设备命名等),因此,对于公共模型和业务特有模型的参数维护问题,还需要建立一个单独的参数维护流程。
模型的4个时间属性解决了涉及电网设备投运或退运的模型变化管理,而对于不涉及电网设备投退运的模型变化管理(如设备属性修改、拓扑的变化等),则需要通过CIM/E模型版本管理的方式解决。设备属性的修改分为已投运设备属性的修改和未投运设备属性的修改。
对于已投运设备属性和拓扑连接关系的修改,建模系统基于实时模型每天生成一个模型版本,包括CIM/E的全模型文件以及模型修改信息,其中,模型修改信息是通过当天的模型文件和前一天的模型文件进行差异比较而自动生成。当设备的属性被修改时,模型版本的差异比较能够发现其改变,从而记录属性修改前后的信息。当模型没有投退运设备,只是拓扑连接关系发生了变化时,模型版本的差异比较通过设备的拓扑连接点号的变化判断其拓扑连接是否发生了改变,从而记录设备的拓扑连接的变化。模型的修改信息以记录的形式存放在表中,如果模型的修改信息为0,当天的版本则不保存。保存的全模型文件用于历史断面模型的管理,模型修改信息则是为将来查询模型的历史变化提供方便。
对于未投运设备的修改,由于设备本身存在计划投运时间和计划退运时间,而设备的一些信息确实还存在变数(在调试当中),因此对设备属性或拓扑的修改不做专门的管理。
系统提供基于CIM/E文件的模型编辑工具。如果某些应用(如动态安全稳定分析、检修计划等)为了测试、验证或其他目的,需要对设备的属性、拓扑或运行方式等做人为的修改,则按照如下方式进行:(1)基于某个时间断面从模型库中抽取一个时间断面模型(CIM/E文件);(2)利用模型编辑工具对模型进行修改;(3)修改后的模型形成自己的版本,系统提供应用模型版本管理工具。通过4个时间标签和基于CIM/E文件的模型版本管理和编辑工具,能够实现多时态模型统一管理。
计划投运时间和计划退运时间只对公共模型的设备,其他业务模型的计划投运时间和计划退运时间依赖于与其关联的公用模型。图4是时间断面模型示意图。假设T1<T2<T3,T1大于当前时间Tc,设备的计划退运时间都远大于T3,任意选择一个时间Ti。当Tc≤Ti<T1时,对应的是图4中最右侧的实时模型;当T1≤Ti<T2时,对应的是图4中时间T1的断面模型;当T2≤Ti<T3时,对应的是图4中时间T2的断面模型;当T3≤Ti时,对应的是图4中时间T3的断面模型。
2.2 时间断面的业务模型抽取
时间断面的业务模型是在某一指定时间(包括历史时间和未来时间)内实时模型和计划投运模型的集合。假设Ts为指定的某一时间,设备的计划投运时间用Ty表示,设备的计划退运时间用Tt表示,设备的实际退运时间用Ty′表示。则Ts时刻的断面模型抽取步骤如下。
步骤1:判断Ts与当前时间的大小。
步骤2:如果Ts大于当前时间(未来模型),则时间断面的业务模型等同于业务的实时模型(Ts<Tt′)加上业务的未来模型(Tt<Ts≤Ty),即业务的实时模型加上计划投运时间和计划退运时间满足条件Tt<Ts≤Ty的未来模型。从模型数据库中,根据时间标签和业务标签抽取出实时模型和符合条件的未来模型。
步骤3:如果Ts等于当前时间(实时模型),则时间断面的业务模型等同于业务的实时模型(Ts<Tt′),根据业务标签从模型数据库中抽取出实时模型。
步骤4:如果Ts小于当前时间,则根据时间搜索对应的CIM/E模型文件,如果没有与该时间相匹配的模型文件,则往后面匹配时间最近的模型文件。
步骤5:在步骤4的基础上,根据业务模型的配置信息,进一步生成个性化的模型。
步骤6:获取对应的图形文件(CIM/G文件),根据模型的抽取规则,过滤出图形中的设备及其关联的图元,自动生成拓扑关系,生成时间断面的图形。
时间维度的调控全业务模型维护及时间断面的业务模型抽取解决了调控全业务(如综合稳定分析模型、运行方式模型等)模型统一维护和共享问题,避免了各业务的重复建模和参数维护不一致的问题;同时,为建立贯穿电网规划设计、工程建设、新设备调试到投产运行的全过程模型数据维护管理体系奠定了基础,完善了未来到当前、在线与离线协调运作的模型维护机制。
2.3 模型协同验证
模型协同验证包括模型验证、模型/图形/通信索引表协同验证及业务模型的特殊验证,本文主要研究模型/图形/通信索引表的协同验证,其他验证可以参见文献[12]。模型协同验证包括两部分:从前置到SCADA的验证;从厂站端到主站的验证(传动试验)。本文主要研究从前置到SCADA的验证。
从待验证的通信索引表中选择量测点,模拟前置通过消息总线发送模拟数据,SCADA服务接收模拟数据处理后写入实时模型库,图形浏览器通过服务总线从实时数据库中获取模拟数据进行浏览检查。在整个过程中,如果通信索引表、模型和图形中任何一个环节不一致,都会导致数据显示错误。为了便于验证,前置模拟验证除了手工操作验证外,还可以设置一些验证策略,如前置模拟程序发送遥测量的点号,系统自动检查通信索引表中的点号和设备关键字的对应关系,从而验证模型、图形和通信索引表的一致性。
模型的协同验证主要是为确保模型/图形/通信索引表的一致性提供了技术手段,能够避免模型维护时一些人为的错误。
2.4 模型在线同步
本文的模型在线同步是基于基建任务的模型/图形/通信索引表等信息的在线同步(简称基于任务的在线同步)。基于任务的在线同步分为两个大的过程:同步任务的创建和维护;任务的同步和回退。
对于同步任务的创建和维护,根据基建任务创建同步任务,选择一个时间断面的模型、图形及通信索引表添加到同步任务,利用图形编辑器和模型维护工具对同步任务中的模型/图形等信息进行维护,所有维护的信息自动标记为待同步的内容,也可以选择一个时间断面的模型,选择全部或部分模型标记为待同步。同步任务根据选定的模型,自动匹配出对应的图形和通信索引表等信息,添加到同步任务。选择的模型中如果涉及厂站的出线,则对端的厂站部分设备也会自动加入到同步任务。同步任务的内容选取一般是通过图形浏览器选定某一时间的断面图形,在浏览器上选定要同步的模型信息,可以是整个厂站,也可以是站内的某个电压等级,也可以是某个间隔中的设备。
根据具体的业务要求,手动选择一个同步任务,同步到在线系统。如果需要回退,则选定已经完成的同步任务,可以回退到上一版本。同步任务完成后,完成同步的设备属性“实际投运状态”修改为当前时间,同步任务的状态修改为已同步。把当前在线系统的模型生成一个版本保存。
同步任务自动记录该任务的描述信息,包括任务创建人、任务创建时间、需要同步的模型信息描述、同步任务的修改信息等。同步任务本身可以浏览和统计,同步任务中的模型/图形等信息可以通过同步任务进行浏览、修改和校验。
基于任务的在线同步,能够实现维护和投运的任务化,为模型的回退、追溯及模型维护的量化统计等提供了技术手段。
3 工程实例
国网福建电力调度控制中心基于智能电网调度控制系统,2013年3月开始建设时间维度的调控全业务统一建模系统,于2014年1月正式实施,取得了较好的效果。下面简单介绍系统实施方案。
该建模系统对调度、监控、新能源(水调、风调)、保护、计划、方式等各专业的应用模型做了彻底的整合,实现了时间维度的调控全业务模型的统一维护和管理。系统部署如图5所示。
在建模系统平台上,主要部署3组服务器。模型维护服务器:模型/图形统一维护工具在此部署,包括模型维护、模型验证、模型在线同步、发布及版本管理。应用服务器:主要部署SCADA、状态估计、潮流计算等应用系统,用于模型/图形/通信索引的协同验证。数据采集服务:接收在线系统的实时数据,用于模型/图形/通信索引的协同验证和主站与子站的传动试验。因为涉及安全的考虑,遥控不在该系统上验证。
该方案通过系统维护和在线运行系统完全隔离,解决了因系统维护造成运行系统不稳定的问题;通过多时态多应用模型统一建模机制,解决了调控中心内部业务模型统一维护的问题,建立了贯穿电网规划设计、工程建设、新设备调试到投产运行的全过程模型数据维护管理体系;通过维护系统的模型协同验证,解决了智能电网调度控制系统的前置验证经常因为误操作而干扰在线运行系统的问题;提高了调控中心内部各专业之间一体化协同的效率,避免了各专业之间信息不一致的问题,提高了事故处理效率。
4 结语
基于智能电网调度控制系统,通过研究时间维度的调控全业务模型维护、时间断面的业务模型抽取、模型/图形/通信数据索引表等信息的协同验证、基于基建任务的模型在线同步、离线业务模型发布、多维度模型信息版本管理等技术,研发了时间维度的调控全业务统一建模系统。实践证明,该建模系统很好地解决了智能电网调度控制系统在模型维护方面存在的不足,实现了多时态、多应用模型/图形的统一维护和管理,为调控中心内部各专业系统一体化协同提供了统一的模型数据支撑。该系统实现了智能电网调度控制系统运行和维护彻底分离,增强了在线系统的稳定性和可靠性。