残差模型

2024-05-31

残差模型(精选7篇)

残差模型 篇1

一、引言

近年来, 我国财政收入以每年超千亿元的速度增长。财政收入是政府部门的公共收入, 是国民收入分配中用于保证政府行使其公共职能、实施公共政策及提供公共服务的资金, 其主要有资源配置、收入再分配和宏观经济调控三大职能。财政收入也是财政支出的前提和保证。在一般情况下, 收入的数量决定着财政支出的规模, 只有预先了解财政收入才能合理安排支出。因此, 研究国家财政收入继而对未来收入进行预测就显得尤为重要。

灰色系统是指介于白色系统和黑色系统之间的数据系统。其研究的对象是部分信息已知、部分信息未知的小样本、贫信息和不确定系统。灰色系统预测方法具有预测精度高、所需原始信息少、计算过程简单等优点, 因此得到了广泛的应用。

灰色系统预测通常采用GM (1, 1) 模型, 由于该模型仅适用于具有较强指数规律的序列, 只能描述单调变化的过程, 而反映不出摆动的情况, 若对一些数据有摆动的情况仍采用GM (1, 1) 模型预测则误差相对较大。为此, 本文提出了GM (1, 1) 残差模型, 通过对该模型进行验证和分析, 结果表明该模型不仅适用于我国财政收入预测, 而且还具有较高的预测精度。

二、GM (1, 1) 模型及GM (1, 1) 残差模型

(一) GM (1, 1) 模型

设x (0) ={x (0) (1) , x (0) (2) , …, x (0) (k) }为系统输出的非负原始数列。

其中:x (0) (k) >0, k=1, 2, …, n。

Z (1) 为X (1) 的紧邻均值生成序列;Z (1) = (z (1) (2) , …, z (1) (n) ) 。其中:

X (0) (k) +az (1) (k) =b为GM (1, 1) 的基本形式。-a为发展灰数, b为灰色作用量。

求解微分方程, 即可得到时间相应序列为:

(二) 修正残差的灰色预测模型

按照 (4) 式可得到一组预测数列为:

1.记 , …, n为残差序列。x赞 (0) (k)

2.对e (0) (k) 取部分子数列, 重新排序后有:

对e (0) (k') 的建模要求如下:

(1) 数列中的数均为正, 直接建立GM (1, 1) 模型;

(2) 数列中的数均为负, 不考虑符号, 建立GM (1, 1) 模型, 求出结果再加上符号;

(3) 数列中的数有正有负时, 要先做非负处理:即都加上最小负数2倍的绝对值, 而后建立GM (1, 1) 模型, 求出反馈值后再减去最小负数2倍的绝对值即可。

3.对e (0) (k') 建立GM (1, 1) 模型, 其时间响应函数的离散形式为:

4.以 作为 的修正模型可得:

其中, δ (k-i) =1, 当k≥i时;

δ (k-i) =0, 当k

三、中国财政收入的预测:两种模型比较

(一) GM (1, 1) 模型的模拟分析

经灰色预测软件运算, 得:

时间相应函数为:

预测值为:

具体预测结果为表1的第3、4、5列, 平均相对误差为3.977 6%, 表明预测结果并不理想。

(二) GM (1, 1) 残差模型的模拟分析

通过表1第4列可得, e (0) (k) 分别为 (-681.15, -1 014.86,

对残差序列进行正化处理以后, 按照GM (1, 1) 模型进行拟合运算, 得:

时间相应函数为:

预测值为:

灰色残差的预测模型为:

其中, δ (k-i) =1, 当k≥2时;

δ (k-i) =0, 当k<2时。

灰色残差模型的预测平均相对误差仅为0.762 7%, 预测精度是GM (1, 1) 模型的5.22倍。可见预测精度大幅度提高, 具体预测结果见表1第6、7、8列。

四、财政收入的五步预测

利用上述模型对2010~2014年的中国财政收入进行五步预测, 并利用2010年和2011年财政收入的实际值进行比对。预测结果表2所示。经查, 2010年我国财政收入为83 080亿元, 预测值为84 038.486亿元, 预测相对误差为+1.15%;2011年我国财政收入为103 740亿元, 预测值为101 673.285亿元, 预测相对误差为-1.99%。

由此可见, 灰色残差模型对我国财政收入的预测精度很高, 可以作为一种有效的工具进行预测。

五、结语

综上所述, 影响我国财政收入的因素众多, 普通灰色模型预测精度偏低, 需引入修正模型或参数, 应用灰色残差修正模型对基本灰色模型预测结果进行修正。

通过预测结果对比分析, 普通GM (1, 1) 模型是有偏差的灰指数模型, 在我国财政收入预测的过程中, 存在着模型精度低的问题。

应用灰色残差修正模型对我国财政收入进行预测, 通过与基本GM (1, 1) 模型进行对比分析, 其预测精度有了明显的提高, 更能满足我国财政收入预测的实际要求。但要注意的是, 利用较少数据的灰色预测模型只适合于短期预测。

在实际应用中, 应不断地把新信息样本添加到建模的时间序列中去, 建立残差修正的动态灰色预测模型, 更好地提高预测的精度。

参考文献

[1].刘思峰, 党耀国, 方志耕.灰色系统理论及其应用.北京:科学出版社, 2004

[2].何海, 陈绵云.GM (1, 1) 模型预测公式的缺陷及改进.武汉理工大学学报, 2004;26

[3].俞锋.GM (1, 1) 残差模型在民航客运量预测中的应用.西华大学学报 (自然科学版) , 2006;6

残差模型 篇2

文献[3]提出了动态灰色模型,文献[5]提出了灰色系统理论和马尔柯夫链相结合的网络流量预测方法,本文在文献[4]和[5]基础上提出了一种改进的残差灰色预测模型对网络流量进行预测。

1 残差模型的建立及改进

根据灰色系统理论[6,7,8],考虑如下的原始数据:

对X(0)(k)做一次累加生成(1—AGO),得生成数列:

其中:

则生成数列X(1)(k)有如下白化微分方程:

式(1)是一阶一元变量的微分方程,故记为GM(1,1)。响应函数为:

对式(2)进行一次累加生成数列X(1)(k),则有:

这就是GM(1,1)模型,其中:

GM(l,l)模型是当原始数据X(0)(k)={x(0)(1),…,x(0)(n),x(0)(n+1)}确定后,参数a和b的值就确定了,预测值x(0)(n+1),x(0)(n+2)也就确定了。由于网络环境的复杂性、变化性和随机性,随着时间的推移,原始数据的预测比重逐步下降,为了降低误差和提高精确度,我们在保持数据总量不变的前提下,采用加入一个新数据和减少一个原始数据的方法来改进模型,建立的动态灰色模型DGM(l,l)(dy-namical grey model),如下:

新数据

新的1—AGO

然后由此新数据建立新的GM(1,1)模型

我们根据式3依次就出x赞(0)(k+1),最后可得模型的残差:

其中

根据残差序列E我们可以建立残差灰色模型如下:

在结合文献[4]和[5]的基础上,建立如下改进的动态残差灰色模型:

灰色预测理论中,预测序列必须要为非负序列,然后在对网络流量进行灰色建模后产生的残差序列E不能满足非负这一条件。在文献[4]中通过马尔柯夫链来确定残差序列的预测值,本文将采用指数-对数函数变化对残差序列处理,得到预测残差值。具体流程如图1。

2 网络流量的模型建立

本文实验数据来源于某运营商IP城域网骨干网采集的流量数据样本,每隔5分钟取一条实时流量信息,共1556条网络总出口流量容量的记录,采取随机抽样,抽取10条连续流量数据作为实验数据,对数据进行建模,分析其有效性。本文DGM(1,1)模型的原始数据总量为5,使用Matlab进行仿真实验。

原始序列为:X={x(0)(1),x(0)(2)…,x(0)(20)},限于篇幅这里不给出具体数值。

利用建立GM(1,1)模型计算得:

残差序列为:E={ε(0)(1),ε(0)(2),…,ε(0)(5)},残差序列的绝对值:

残差序列的符号函数L(k):经过数值验算,本文令c=0.95,即原残差序列转化为E'={Cε(0)(1),Cε(0)(2),…Cε(0)(5)},对数据E'先归一化后做BX数据处理建模计算得:

将所得预测序列进行对数化取其符号并赋值给相应的符号函数L(k)。

所以改进后的模型为:

DGM(1,1)就是将数据序列中最老的数据剔去,用新的数据去填充,变为X''={x(0)(2),x(0)(3)…,x(0)(6)},然后按上列步骤重新建模。

由表1可知道,在几个参数中,改进的动态灰色残差模型的预测性能最好,图2为最后的模拟仿真图。仿真实验证明改进的残差灰色模型适合于中短期预测,而动态残差灰色模型可以提高其多步预测的精度。

3 结束语

本文结合灰色系统和动态系统的优势,通过指数-对数变化对残差序列进行处理,建立一种网络流量预测的改进的动态残差灰色模型。首先将处理后的流量时间序列建立灰色预测模型,得到流量的拟合值和残差,以流量的残差序列为基础,对其残差序列的绝对值为原始序列建立模型得到残差预测值的绝对数值,用指数-对数的方法建立GM模型,最后求得其相应项的符号函数。用实际网络对该模型进行验证,实验证明,该方法比前面所提到的灰色预测模型有了明显的提高。

如同灰理论本身还有很多需要完善的地方一样,本人所谈论的动态残差灰色模型在理论上和实践上仍存在许多有待于继续学习和探讨的问题。

摘要:网络流量是衡量网络运行负荷和状态的重要参数,也是网络规划,流量管理等方面起着重要作用的重要参数。在流量管理中,流量模型用于评价接入控制机制和预测网络性能。灰色预测模型作为灰色系统理论的重要内容之一,被广泛的应用于各种领域。该文提出一种的对不全为正数的残差序列的处理方法,并应用此方法进行建模对实际网络流量进行预测,结果表明了该方法是有效可行的。

关键词:网络流量,灰色预测模型,残差序列,预测

参考文献

[1]Si-FengLiu,JeffreyForrest.Advances in Grey Systems Theory and Its Applications[C].Proeeedingsof2007 IEEE Intemational Confer-enceon Grey Systems and intelligent Services,Nanjin,2007:l-6.

[2]思峰,郭天榜,党扭国.灰色系统理论及其应用汇[M].北京:科学出版社,1999.

[3]Liu Sifeng.Emergence and development and forward trends of grey systems theory[C].Limeriek,Ireland:Proeeedings of the 32nd interna-tional Conference on Computers and Industrial Engineering,2003:526-531.

[4]曹建华,刘渊,戴悦.基础残差改进的灰色模型网络流量预测[J].计算机工程与设计,2007,21(28):5133-5134.

[5]姚奇富,李翠凤,马华林.灰色系统理论和马尔柯夫链相结合的网络流量预测方法[J].浙江大学学报:理学报,2007,34(4):396-400.

[6]LUO You-xin,PEN Zhu,ZHANG Long-ting.Grey GM(l,1)model with function transfer method for the wear trend prediction and its ap-plication[J].Internal J of Plant Eng and Management,2001,21(4):220-232.

[7]LUO You-xin,CAI An-hui,ZHANG Long-ting.Grey problems ofmechanical transmission system in a reliability study[J].Internal J ofPlant Eng and Management,2001,21(2):104-110.

残差模型 篇3

只有保证电能供需的平衡, 才能有效地保证电网安全稳定运行, 而电力负荷预测是保证电力供需平衡的重要前提, 因此, 合理的电力负荷预测是保证电网安全稳定运行的重要技术。当前电力负荷预测方法主要有传统的回归模型[1]、时间序列模型[2,3]和智能的人工神经网络模型[4,5]、小波分析模型[6]、模糊逻辑模型[7,8]、支持向量机预测模型[9,10]等。

电力负荷影响因素较多且难以分析各种因素对负荷特性的影响程度。各种电力负荷预测方法都存在各自的优缺点, 其中, 人工神经网络以其自适应、自学习、高容错能力等优点, 在电力负荷预测建模中得到广泛应用并取得了很好的效果, 但该方法存在易陷入局部极小、收敛速度慢等缺点, 限制了其进一步应用。传统的时间系列法运算量较小、运算速度较快, 但预测误差较大且不具备自适应学习能力。传统的灰色系统理论主要解决少数据、小样本、信息不完全和经验缺乏的不确定性问题[11,12], 但存在着预测精度不高, 误差趋势增大等缺点。

在时间系列预测模型中, 运用了很多误差改进方法, 如灰色马尔可夫模型[13], 该模型在灰色GM (1, 1) 模型预测的基础上, 利用残差进行二次灰色预测并建立状态转移概率矩阵确定残差符号, 得到最后的预测结果。该模型假设残差值都是按照固定的状态转移矩阵延展, 缺少动态性。

基于以上分析, 本文在灰色GM (1, 1) 模型预测的基础上, 提出傅里叶变换残差修正模型。傅里叶变换是一系列不同频率正弦波的无限叠加, 可提取出频率成分。将残差作为一个能量有限的时间系列, 运用傅里叶变换强大的降噪音能力, 提取出残差中反映负荷本质的信息。因此, 理论上运用傅里叶变换对残差进行改进具有可行性。算例结果表明, 灰色傅里叶变换预测精度相比单一的灰色预测和灰色马尔可夫预测有所提高。

1 GM (1, 1) 模型[14,15]

由于负荷数据是多种因素共同影响的结果, 因此, 有必要对历史数据进行预处理, 过滤掉历史数列中异常值的干扰, 本文采用滑动平均法减弱异常值的影响。

设原始数列x′ (0) =[x′ (0) (1) , x′ (0) (2) , …, x′ (0) (n) ], 滑动平均值计算公式为:

该数据既增加了当年数据的权重, 又避免了数值过度波动。对于两端点的数据, 计算公式为:

GM (1, 1) 模型是最常用的一种灰色模型, 它由一个只包含单变量的一阶微分方程构成, 是电力负荷预测的有效模型。经过预处理后的数据为:

进行一次累加生成处理, 得到:

由于序列x (1) (k) 具有指数增长规律, 而一阶微分方程的解恰是指数增长形式, 因此可以认为序列x (1) 满足下列一阶线性微分方程模型。

为求a与u的值, 把式 (1) 离散化得到, 取不同的k值得到:

简记为Yn=BA, 且有:

利用矩阵求导公式可得:

根据求得的值, 得到的灰色预测模型为:

其中, k=0, 1, 2, …。

2 傅里叶变换残差修正模型

设f (x) 是一个能量有限的模拟信号, 则其傅里叶变换即为f (x) 的频谱。因此将随机序列x的n个观测数据视为一能量有限的时间序列, 对其作傅里叶变换得到观测数据的频谱, 频谱的中心是低频段, 外围是高频段, 一般认为低频段是反映系统本质的信息, 高频段反映的是系统数据的噪声。采集到的电力负荷时间序列数据一般都含有很大的噪声, 作傅里叶变换可将其滤除, 选择反映电力负荷本质的信息[16]。

鉴于傅里叶变换强大的降噪功能, 运用傅里叶变换对灰色GM (1, 1) 的预测残差进行修正, 能够滤除电力负荷时间序列数据中的噪声, 从而提高了预测精度。下面介绍具体建模过程。

构建残差时间序列。由数据的就近原则, 最近的数据反映电力负荷的本质, 所以构建的残差时间序列如下:

傅里叶变换残差表示为:

其中, k=2, 3, …, n;T=n-1。

把η (1) =0代入式 (11) , 得到:

将电力负荷实际值代入式 (12) — (14) 求得an、bn、a0, 进而求得傅里叶变换残差序列η。

因此得到傅里叶变换残差改进的电力负荷预测值为:

其中, Xk为最终预测值, 为一般灰色GM (1, 1) 预测值, 为随机误差。

3 实证分析

本文选取某市从1997年到2004年8年的电力负荷值建立模型, 该历史数据如表1所示。

利用上述8年的历史数据建立模型, 并以接下来4年的历史数据与预测值作比较, 验证所建改进预测模型的有效性。

首先建立一般的GM (1, 1) 模型, 利用滑动平均法对历史负荷数据进行预处理, 得到处理后的负荷值为x (0) =[118.4603, 124.2508, 134.2988, 145.4745, 157.355 3, 168.613 3, 177.976 3, 184.449 0]MW, 进行一次累加得到x (1) =[118.4603, 242.7110, 377.0098, 522.484 3, 679.839 5, 848.452 8, 1 026.429 0, 1 210.878 0]MW。

用MATLAB编程计算得, 代入式 (9) 得到电力负荷预测值为。根据式 (10) 得到残差系列为η=[0, -2.665 2, -1.270 4, 0.662 2, 2.669 8, 3.381 2, 1.478 7, -4.082 0]MW。

把代入式 (12) — (14) , 得到an=3.254×10-3, bn=0, a0=1.968×10-9。

由式 (11) 对i反复取值运算, 使预测值更接近真实值, 进而求得傅里叶变换残差。

最终得到2005年残差修正的电力负荷预测值为。由2005年的真实值和预测值, 得到η (10) =196.35-197.429=-1.079 (MW) , 求得。同理求得, 进而得到X11=230.755 MW, X12=250.013 MW。

傅里叶变换GM (1, 1) 模型计算得到的结果与一般GM (1, 1) 、马尔可夫GM (1, 1) 模型计算得到的结果进行比较与分析, 如表2所示。

由表2可知, 傅里叶变换残差修正模型的预测值比一般GM (1, 1) 模型和马尔可夫GM (1, 1) 模型更接近于真实值, 预测精度较高。

4 结论

a.在对样本值进行预处理时, 运用滑动平均法滤除异常值的干扰, 处理后的样本值对负荷的预测更科学、合理。

b.提出的基于傅里叶变换残差修正的电力负荷预测模型, 克服了马尔可夫残差修正缺乏动态性的缺陷。

残差模型 篇4

1 不同分辨率格网DEM的建立

1.1 数据源及其分析

采用一个工业场地平整项目的测量数据作为本文研究的数据基础,该数据是采用全站仪碎部点测量的方法获取的,根据地形特征共采集126个碎部点,精度满足需要。该项目区南北跨度约225m,东西跨度约280m。运用GIS软件绘制了项目区等值线和测量已知点的分布图,如图1所示,“+”为测量点位置示意。从图1看出该项目区为一丘陵地区,中间高,四周低,且碎部点分布均匀(这对插值计算结果的可靠性提供了有力保障)。所以,在该区域进行DEM插值以及建立插值精度评价模型实验是有代表性的,结论可供大部分工程测量工作借鉴。

1.2 所采用的几种插值方法以及多分辨率DEM的建立

所谓DEM插值方法就是利用已知测量点并运用一定的数学方法计算指定位置的高程值的方法。经过长时间的研究和积累,人们已经得到了很多的插值方法,并且可以根据实际选择合适的插值方法以满足工程的需要。本文结合工程实践拟采用三种最常用的插值方法进行实验研究,这三种插值方法分别是反距离加权插值法、克里金插值法和最近邻点插值法。

反距离加权插值法实际上是一种加权移动平均方法,设平面上分布一系列离散点P(x,y,z),己知其位置坐标P(x,y)和属性值zi(i=1,2,…,n),根据周围离散点的属性值,通过距离加权插值求P点属性值。克里金插值法又称最优插值法,它是以区域化变量理论为基础,以变差函数为主要工具,在保证估计值满足无偏性条件和最小方差条件的前提下求得估计值的,其实就是一种特定的滑动加权平均法。最近邻点插值法是一种快速插值法,在GIS中得到广泛的应用,实际上,最近邻点插值的一个隐含的假设条件是任一网格点P(x,y)的属性值都使用距它最近的位置点的属性值,用每一个网格节点的最近邻点值作为待定的节点值。

本文是在对不同分辨率DEM的插值精度分析的基础上通过回归分析得到精度评价模型的,所以建立一系列分辨率不相同的DEM是分析工作的前提。利用上述三种插值方法按照不同分辨率分别建立了DEM。根据实验数据的实际分布特点,结合本文实验方法,特设实验分辨率从大到小依次为1、2、3、4、5、6和7m,运用GIS软件按照实验要求根据分辨率要求进行插值运算建立了符合要求的多分辨DEM。

2 插值残差计算原理及多分辨率DEM的插值残差的计算

2.1 插值残差计算原理

插值残差是评价格网DEM插值效果的一个重要指标。众所周知,格网DEM是由测量所得散点的三维坐标数据通过插值操作得来的,残差就是已知散点的高程和插值后在该散点位置得到的高程值的差,可以用式(1)表示为:

式中: Hres为残差;Hdat为插值已知点高程值;Hgrd为格网DEM表面高程值。图2是残差计算原理示意图。

图2中Hgrd可以通过式(2)近似计算而得:

式中Hi分别为已知点所在格网的四个格网点的高程值。

2.2 多分辨率DEM的插值残差的计算

根据上述残差计算原理分别计算三种插值方法的残差标准差列于表1中,不同分辨率和残差标准差关系用图3来表示。

从表1中数据可以看出,克里金插值法效果较其他两种插值法效果要好些。

3 多分辨率DEM精度评估模型建立

从图3中看出,随分辨率减小DEM的误差是增大的,大致趋势是成反比。如何根据以上分析的数据获取任意分辨率DEM的误差呢,就要根据实验数据得到误差评估模型,然后根据模型确定计算任意分辨率DEM的误差大小,以指导工程实践和科学研究工作。根据表1中所列残差标准差分布情况,本次实验拟建立线性函数、二次函数和负指数函数三种精度评估模型,此三种模型其实都是一元函数模型,即如y=f(x)形式,式中y即精度指标。x即分辨率指标,当然根据函数模型的不同,还有一些对应的参数,这些参数通过回归分析得到。

本次试验是采用著名的数值分析软件——MATLAB软件进行的,根据数学知识建立数学模型如下:

式中:βi是参数;r为回归方程的残差,是评价回归模型数据拟合效果的重要指标。根据表1中所列数据分别按照三种回归模型要求建立回归分析数据,限于篇幅,仅将线性回归模型在反距离加权插值时的建立过程描述一下。下面是MATLAB命令:

即参数β0和β1分别为-0.1396和0.1248,根据r(回归分析残差)计算出标准差为0.0301。

另外,根据表1中的数据运用MATLAB软件分别求出线性、二次和指数函数的回归模型方程,归纳入表2。

为了评价哪种回归模型最优,运用MATLAB软件还求出了对应三个回归方程残差的标准差,如表3所示。

从表3看出,本文使用的三种回归分析模型的误差标准差中,负指数函数法为最小,根据回归分析的评价方法得知,即负指数函数法在三种评价模型中为最优,即本次实验采用负指数函数模型作为最终DEM精度的评估模型。

4 结语

在工程实践当中,有建立不同分辨率DEM的需求,本文结合实例运用回归分析的方法得到了不同分辨率的DEM的精度评价模型。首先根据工作实际选取三种目前最常用的插值方法,根据实验数据确定了建立不同分辨率DEM的单元大小指标;然后又确定了插值精度的评价方法——残差法,还选择了几种回归分析模型;最后根据不同插值方法和不同分辨率分别计算插值残差,运用MATLAB得出残差值和分辨率指标进行回归分析得到三种回归分析模型的函数式,并在三种模型中选定了最优评价模型——负指数函数模型。限于篇幅,本文仅考虑了线性函数、二次函数和负指数函数三种精度评估模型,没有涉及其它类型的模型,另外,本文所采用的实验数据仅包含丘陵地形,没有涵盖所有地形类型特点,所以本文所得到的最优评价模型并不是严格意义上的最优评价模型,对于多种类型的回归模型以及多种类型的地形实验数据有待进一步数值分析,从而得到真正的“最优评价模型”。总而言之,按照本文方法考虑多种综合因素最优精度评价模型还是能够找到的。

摘要:根据某工程已知的测量点数据,按照不同分辨率利用不同的插值方法生成一系列的格网结构的数字高程模型(DEM)。然后对每个数字高程模型的精度用残差计算的方法进行评价,并用回归分析的方法得到精度评估模型,有一定的应用价值。

关键词:DEM,分辨率,残差,精度评价模型

参考文献

[1]陈勇,陶锐.DEM在丘陵地区土地整理项目中的应用研究[J].测绘科学,2008,(1).

[2]汤国安,龚健雅,陈正江,成燕辉,王占宏.数字高程模型地形描述精度量化模拟研究[J].测绘学报,2001,(4).

[3]胡鹏,吴艳兰,胡海.数字高程模型精度评定的基本理论[J].地球信息科学,2003,(3).

[4]王妍,刘洪斌,宁茂歧.栅格DEM的水平分辨率对地形信息的影响分析[J].测绘与空间地理信息,2005,(6).

[5]汤国安,刘学军,房亮,罗明良.DEM及数字地形分析中尺度问题研究综述[A].中国地理信息系统协会第九届年会论文集[C],2005.

[6]和万荣,罗志青.不同空间分辨率DEM数据提取图斑坡度值精度研究[A].中国地理信息系统协会第四次会员代表大会暨第十一届年会论文集[C],2007.

残差模型 篇5

关键词:GNSS,周跳探测,几何关系模型,观测值残差

周跳探测是高精度GNSS定位的关键问题之一。针对该问题,国内外很多专家学者都对其进行过深入的研究,Blewitt于1990年针对双频观测数据提出了TurboEdit方法,综合运用宽巷组合与电离层残差组合来探测与修复周跳[1]。蔡诗响等人对多项式拟合法进项改进,用其处理非差以及星间单差数据,能够实现单频周跳的准确探测[2]。Collin首先将小波变换方法应用于周跳的探测[3]。而在国内,黄丁发等人最早将小波变换用于周跳探测[4]。之后,蔡昌盛等人采用db6小波对码相组合观测值、双差观测值以及电离层残差组合观测值进行模拟周跳分析,并提出了一种基于小波变换的周跳探测方法[5]。刘伟平等人于2009年利用卡尔曼滤波对高采样率单频数据进行模拟周跳实验,结果较好,但对于采样间隔较大的数据没有做分析[6]。之后,李猛等人也利用卡尔曼滤波处理载波相位观测值,并结合最优固定区间预测的方法来确定周跳和野值[7]。欧吉坤提出了粗差的拟准检定法[8],韩保民等人将该方法应用于GPS周跳探测中[9],之后,孔巧丽等人又将该方法应用于星载GPS非差相位观测值的周跳探测与修复中[10];Schwrz与Cannon等人首先提出采用多普勒观测值来探测周跳[11],陈小明对该方法进行了改进,采用多项式拟合的方法来探测周跳[12]。以上方法各有利弊,由于残差法能够发现小周跳,本文着重研究基于几何关系模型观测值残差的周跳探测算法。

1 基于几何关系模型的观测值残差法

1.1 残差关系

使用最小二乘平差时,平差所得到的残差V是个重要的统计量[13]。残差与误差有严格的对应关系式,残差的概率分布可以由误差的概率分布得到。可以认为残差就是相应的误差的估值,残差v的反映的是一组误差的联合影响。以间接平差为例。

其平差函数模型为

式(1)中:Δ为误差向量,L为观测值向量,A为设计矩阵,X为待估参数向量,Q为观测值的先验方差-协方差阵,P为其权阵。

相应的误差方程为:

式(2)中:V为观测值残差向量,为待估参数X的估值。

最小二乘准则为VTPV=min,在该准则下,其解为

式(3)中,知道参数估值的协因数阵

将式(2)带入式(3)得

在此,令R=QvvP,则V=-RL,且

考虑到式(1)可得

于是有

根据式(8)可以得出如下结论

(1)观测值残差会反映观测值的误差;

(2)任一观测值的残差vi均包含了所有观测值误差的影响。

1.2 静态数据残差法算法

将周跳作为一项误差,其影响会体现在观测值估值的残差中。基于该点,现运用基于几何关系模型的方法来构造周跳检测量,并利用带有载波相位的组合量作为观测值残差序列来探测并修复周跳。静态数据相邻历元载波相位观测值几何关系模型为

式(9)中:δjatm(ti)=δρjion(ti)+δρjtrop(ti)为ti历元大气影响项,主要包括电离层延迟以及对流层延迟;Δti=δtR(ti)-δtS(ti-Δti)为钟差影响项,包括接收机钟差以及卫星钟差。

大部分情况下,相邻历元间大气影响项相差微小(相对周跳探测而言),假定其保持不变,即

在历元间做差可得

式(12)中

此时,根据第一历元伪距单点定位,计算出接收机坐标并将其作为已知值。再利用广播星历计算出两历元卫星坐标,便可以得到两历元卫地距。于是式(11)中便只有钟差与历元间模糊度参数差(即周跳)两个未知参数。

当该历元存在s颗卫星时,可组成s个观测方程,其中未知参数2个。当卫星数大于2时,便可以很容易解算出周跳。后文算例中采用的方法是假定两历元模糊度参数不变,即不存在周跳。此时,辅以下文提供的调权策略,观测值估值的残差几乎完全对应周跳。

算法流程为:

1.3 调权策略

在利用最小二乘法进行参数估计时,常常会涉及到权阵的设计与调整问题。在运用观测值残差法探测周跳时便涉及权阵调整的问题,采用巴尔达的抗差估计迭代权法[13]。

巴尔达的抗差估计迭代权法核心思想为:以残差vi代替误差Δi建立权函数,设定一定的阈值。若是发现大于阈值的残差,则赋予其小权。使其在最小二乘平差中的影响变小,从而削弱误差对平差结果的影响。

后文中在运用该方法时,一次只检验一个周跳,然后调权。理论上分析,当观测值间不相关,且只存在少量粗差时,其影响主要反映在对应观测值残差上,此时,使用巴尔达的迭代权法比较合理。具体运用流程如图2所示。

2 算例分析

所用数据采集于2012年7月14日(年积日第196 d),使用的是NovAtel DL-V3接收机和普通小圆盘天线。

以1 s采样间隔为例,对G21、G27以及G05三颗卫星在四个历元处分别添加相应的周跳值,分析不同卫星观测值。表1给出了具体各历元添加的周跳值。其中G15号卫星未添加任何周跳,主要作为比对卫星与其他添加周跳的卫星做对比。分析均采用1 s采样间隔数据。

2.1 未添加调权策略

图3展示了在未添加调权策略的情况下,人为添加周跳后,不同卫星观测值残差序列。

对比分析上图,再参考表1中人为添加的周跳值,可以发现:

(1)观测值残差跳跃点与周跳值没有准确对应。如G21卫星残差图中,在第900历元以及第2700历元,图中表明的周跳值与真实认为添加的周跳值不符。这一现象普遍存在与其他卫星上;

(2)未发生在后跳的卫星亦会出现残差值的错误跳跃。如G15卫星残差图中,可以很明显看到,该卫星在未添加任何周跳的情况下,仍然在四个历元随其他卫星发生残差的跳跃。同样,对于G05号卫星,只在第2 700历元人为添加了+1周的周跳,然而其观测值残差序列却出现了4个跳跃,最高跳跃达到0.5周。这将严重影响最终周跳探测结果;

(3)发生周跳卫星对同历元其他卫星的影响随该历元最大周跳的变大而有所增加。可以看到,对比第900历元与第2 700历元,后者的最大周跳为6周,前者只有4周。其他未发生周跳卫星的残差跳跃,第2 700历元要大于第900历元。

上面三种现象,究其根本原因,是因为误差会在所有观测值残差中有所反映,这种现象在发生5周以上的周跳时表现得非常明显。最然,误差对观测值残差的影响主要反映在发生误差的观测值残差中,但当发生在周跳数值不是很小时,该周跳对其他卫星观测值残差的影响便不容忽视。此时,合理选择调权策略,运用调权的方法削弱发生周跳卫星对其他卫星观测值残差的影响就显得非常重要。

2.2 添加调权策略

图4展现的是调权后,1 s采样间隔不同卫星观测值残差序列。可以看到,采用前文介绍的抗差估计迭代权法后,观测值残差跳跃与周跳一一对应,并且跳跃值与周跳值一一对应,能够很好地探测并修复周跳,体现了基于几何关系模型的观测值残差法在探测与修复静态数据周跳时的优势。

3 结论

残差模型 篇6

混凝土的早期性能在很大程度上决定了混凝土的各种中、长期性能,并且混凝土的早期强度的发展规律在很大程度上影响着混凝土的后期强度发展规律。根据灰色系统[1]理论的思想,可以把混凝土的强度发展看作是一个系统,该系统中既有已知信息(已测得的混凝土的早期强度),又有未知信息(混凝土的后期强度),借助于灰色预测系统[2]理论的思想,就能够根据现有的信息(混凝土的早期强度)建立后期的预测模型,进而对混凝土的后期强度进行预测。

1灰色系统基本原理

1982年,中国学者邓聚龙教授创立的灰色系统理论,是一种研究少数据、贫信息不确定问题的新方法。灰色系统理论以“部分信息己知、部分信息未知”的“小样本”、“贫信息”不确定系统为研究对象。主要通过对部分已知信息的生成、开发,提取有价值的信息、实现对系统运行行为、演化规律的正确描述和有效监控。灰色系统模型[3,4]对实验观测数据没有什么特别的要求和限制,因此应用领域十分宽广。

GM(1,2)模型[5,6,7]。

一般建模是用数据建立差分方程,灰色建模则是用原始数据列作生成后建立微分方程。

x1,x2都是n维向量,即

xi(0) = (xi(0)(1),xi(0)(2),…,xi(0)(n));

i = 1,2。

xi(0)作一次累加生成:

xi(1)(k)=t=1kxi(0)(t);k = 1,2,…,n

根据大量的实验研究可知,混凝土强度与龄期的对数基本成正比,因此,假定累加生成后的混凝土强度与龄期模型为:

xi(1)=a×ln(x2(1))+b

记上述方程的参数列为a^,则a^=(a,b)Τ。把已知数列xi代入上述方程,按最小二乘法可解出参数a^,就可得通解。

按最小二乘法可解出参数a^,其计算式为:

a^=(BΤB)-1BΤyΝ

yN=(x1(0) (1),x1(0) (2),…,x1(0)(n))T。

得GM(1,2)灰色预测方程为:

x^1(1)=a×ln(x2(1))+b;其中,

x1(1) (0)=x1(1) (1)。

将按模型计算的模拟值x1(1)按下式还原成x1(0),

x^1(0)(k+1)=x^1(1)(k+1)-x^1(1)(k)

模拟值与实际值的差叫残差。

e(k)=x^1(0)(k)-x1(0)(k);k=1,2,…,n

当残差满足精度要求时,模型可用于系统预测。

GM(1,2)残差模型:

当按原始数据x1,x2建立的GM(1,2)模型检验不合格时,可以用残差e建立GM(1,2)模型,对原模型进行修正。残差模型可以根据实际情况选择不同的模型,比如线性函数、幂函数模型等。

2混凝土靶强度灰色预测模型

2.1养护试验

为了获取混凝土靶在不同龄期的强度数据,我们进行了混凝土靶的养护试验。本养护实验共用了两个养护箱,其中养护箱是由北京中路达实验仪器有限公司所生产的水泥混凝土YH—40B型标准养护箱,养护温度设定有10 ℃、20 ℃,养护湿度均为95%。表1和表2给出了具体的试块(50 mm×50 mm×50 mm)实验测定的强度值。

2.2模型建立及分析

本文利用以上实验得到的固定温度10 ℃和20 ℃下,不同的龄期数据建立了三种预测模型,利用VB语言编程计算,得到如下结果:

2.2.1 用前14 d的强度预测15 d至28 d的强度

10 ℃数据: 应用前14 d的强度建立GM(1,2)预测模型:

Μ=7.543ln(t)+2.4775(1)

模型精度为97.63%。预测15天至28天的强度,预测误差的平均值为9.33%。由于预测误差平均值较大,再应用误差建立GM(1,2)残差模型:

Μ=0.1061t+0.3925(2)

然后对上面建立的模型进行修正,数据见表3。

通过表3可以看出,模型修正后预测15 d至28 d的强度要比修正前的有更好的预测效果,预测误差的平均值仅为1.88%。这样经过残差模型的修正,大大提高了此模型的拟合精度和预测精度,使预测模型的预测效果更好、更实用。

20 ℃数据: 应用前14 d的强度建立GM(1,2)预测模型:

Μ=9.9069lnt+5.0955(3)

模型精度为94.7%,预测15 d至28 d的强度,预测误差的平均值为4.37%。应用上面建立的GM(1,2)残差模型:

Μ=0.1061t+0.3925(4)

对模型进行修正,修正后预测15 d至28 d的强度,预测误差的平均值为2.99%。数据见表4。

2.2.2 用前28 d的强度预测29 d至56 d的强度

10 ℃数据: 应用前28 d的强度建立GM(1,2)预测模型:

Μ=8.4569ln(t)+1.4242(5)

模型精度为93.35%。预测29 d至56 d的强度,预测误差的平均值为10.44%。应用误差建立GM(1,2)残差模型:

Μ=0.0109t+1.275(6)

然后对上面建立的模型进行修正,修正后预测29 d至56 d的强度,预测误差的平均值为5.71%。数据见表5。

20 ℃数据: 应用前28 d的强度建立GM(1,2)预测模型:

Μ=10.439ln(t)+4.4988(7)

模型精度为94.1%,预测29 d至56 d的强度,预测误差的平均值为9.16%。应用误差建立GM(1,2)残差模型:

Μ=-0.0805t-0.1923(8)

对模型进行修正,修正后预测29 d至56 d的强度,预测误差的平均值为2.23%。数据见表6。

2.2.3 用前56 d的强度预测随后的强度

10 ℃数据: 应用前56天的强度建立GM(1,2)预测模型:

Μ=9.4607ln(t)-0.0357(9)

模型精度为93.5%,预测随后的强度,预测误差的平均值为3.07%。应用误差建立GM(1,2)残差模型:

Μ=-0.0191t+0.5281(10)

然后对上面建立的模型进行修正,修正后预测随后的强度,预测误差的平均值为0.53%。数据见表7。

20 ℃数据:应用前56 d的强度建立GM(1,2)预测模型:

Μ=9.4589ln(t)+6.0297(11)

模型精度为95.12%,预测随后的强度,预测误差的平均值为9.56%。应用误差建立GM(1,2)残差模型:

Μ=-0.0106t-3.0519(12)

对模型进行修正,修正后预测随后的强度,预测误差的平均值为1.88%。数据见表8。

通过以上在各个固定温度时,残差模型前后的预测数据比较中,我们不难发现经过GM(1,2)残差预测模型的修正能使预测平均绝对百分误差有很大程度的降低,精度非常高。这也为混凝土靶成熟度的预测打下了良好基础。

3结论

本文建立的混凝土靶强度的GM(1,2)残差预测模型能够反映实际混凝土靶强度的发展规律,通过残差模型的修正能使模型的拟合精度和预测精度有很大的提高,使预测误差的平均值保持在比较理想的范围内。此模型可以用于模拟混凝土靶强度的发展规律,具有较好的理论和实用价值。

摘要:混凝土靶的早期强度的发展规律在很大程度上影响着混凝土靶的后期强度发展规律。灰色系统理论对于小样本具有较好的预测效果。建立了混凝土靶强度的GM(1,2)残差预测模型。结果表明,该模型在预测混凝土靶强度方面达到了很好的效果,有较好的理论和实用价值。

关键词:混凝土强度,灰色系统,预测

参考文献

[1]邓聚龙.灰色系统.北京:国防工业出版社,1985;18—21

[2]张军.灰色预测模型的改进及其应用.中国优秀硕士学位论文全文数据库,2008;12:1—54

[3]尹子民,罗丽兮.灰色模型GM(1,n)的变量选择及拟合度分析.系统工程理论与实践,1999;11:81—120

[4]彭琨琨,肖新平.广义灰色多变量GM(1,n)模型的算法研究.第19届灰色系统全国会议论文集,2010;244—249

[5]王振禄,何满喜.关于GM(1,1)与GM(1,2)的拟合精度的注记.内蒙古师大学报(自然科学汉文版),1993;01:17—21

[6]郭颖,李昌海.基于GM(1,2)模型的多步自调节灰色预测控制算法.西安石油大学学报,2009;24(3):104—107

残差模型 篇7

在衡量波动的非对称性方面,主要有Nelson提出的EGARCH模型,Glosten等提出的GJR模型,Engle提出的AGARCH模型等。Hagurd、GonzalezRivera、Anderson等、Lee,Degennaro、Lubrano、Lanne和Saikkonen等先后扩展了这类模型,在方差方程中引入平滑转移函数,提出了各种STGARCH模型来衡量波动性。STGARCH模型在2个状态之间,还允许中间状态的平滑移动,TARCH模型实际 上是STGARCH模型的特定形式[1]。

在衡量波动的尖峰厚尾性方面,对金融时间序列波动结构特征的的建模效果很大程度上取决于其残差服从何种分布。“有效市场假说”下假设金融资产收益服从正态或高斯分布已无法合理描述、解释金融资产条件收益率经常呈现出现的尖峰厚尾现象。对此很多学者把学生t分布、广义误差分布( GED) 和Skewed - t分布引入到GARCH族模型的研究中,并取得了非常好的研究效果。而国外学者更是提出了一些具有前沿性的Elliptical分布、双曲线分布等来刻画金融资产条件收益率的尖峰厚尾现象,在国内这些分布的应用还不广泛。

在衡量波动的长记忆性方面,Engle和等提出用IGARCH模型来刻画波动的这一特性。该模型的条件方差有一个单位根,这意味者任何对条件方差的影响都将永久持续下去,而无条件方差无穷大,这显然与事 实不符。Bollerslev等[2]提出了FIGARCH模型,其滞后随机误差项以双曲速度衰减,有效刻画了波动的长记忆性而被广泛应用。FIGARCH模型的局限性在于,其信息冲击曲线是对称的,不能反映波动的非对称性。之后他们又进一步提FIEGARCH模型以同时反映波动的长记忆性和对正负信息反应的非对称性。

国内学者也对股市波动的长记忆性从多个角度进行了大量的实证研究,取得了一定的成果。汤果等[3]采用FIGARCH模型对我国股市与纽约股市的长记忆性进行了研究,发现我国股市与纽约股市的区别,弥补了我国FIGARCH研究的空 白。王春峰[4]用传统的R/S分析法对中国股市进行研究,发现中国股市具有显著的长期记忆性。张卫国建立了双长记忆特征的ARFIMA-FIGARCH模型,结果表明深市收益率序列的长记忆性不显著,但波动序列具有显著的长记忆特征。胡平等[5]利用FIEGARCH模型和FIGARCH模型实证分析了上交所的铝、铜、燃料油和天胶四种期货品种波动率的长记忆性和杠杆效应,发现所有期货品种的价格波动率均存在显著的长期记忆性,但其假设残差服从正态分布,无法更好的的刻画金融时间序列常有的尖峰厚尾性。

在总结前述研究成果基础上,发现利用FIEGARCH模型对黄金市场的非对称性和长记忆性进行研究的文献尚不多见。所以本文把FIEGARCH模型应用在黄金市场,并假设残差服从t分布和GED分布,对我国黄金市场的波动进行刻画,而在国内还没有采用FIEGARCH模型对黄金波动进行研究的文献。

1 研究方法与计量模型

FIEGARCH模型由Bollerslev等提出,其主要思想在于把分形差分思想引入了EGARCH模型,可以用来更好 地描述波 动的长记 忆性和杠 杆效应。EGARCH模型用分形差分思想可以表示为

其中: 参数γ1描述正负效应系数体现方差波动项对正负信息的不对称性反应。参数γ2描述放大效应。

当γ1< 0时,在波动大小相同时,利坏消息带来的的波动增幅大于利好消息带来的波动增幅; 当γ1> 0时,在波动大小相同时,利坏消息带来的的波动增幅小于利好消息带来的波动增幅; 当γ1= 0时,在波动大小相同时,利坏消息带来的的波动增幅等于利好消息带来的波动增幅。

通过分形差分自回归多项式[1 - B ( L) ] =Φ( L) ( 1 - L) d来描述长 期记忆性,就得到了FIEGARCH模型的表达式:

FIEGARCH模型的条件方差用指数形式表示,保证了σ2t总是正值,在对模型进行参数估计时,不需要对模型参数进行非负约束。同时,随着zt取值的正负变化,σ2t也会有不同程度的变化,从而更好的体现价格波动[6,7]。

大量的金融实证研究表明,金融市场的价格收益序列具有尖峰厚尾的特征,收益方差序列具有相关性、聚集性和异方差性。而高斯GARCH过程无法解释收益序列通常遇到的尖峰厚尾现象[8]。因此,对于中国黄金市场收益序列的分析客观上要求采用非正态分布进行分析。除t分布外,广义误差分布( GED) 是一种更为灵活的分布形式,通过对参数的调整变化可以拟合不同的情形,包括正态分布,其密度函数形式如下

其中: λ为尾部厚度参数,当ν < 2时,GED分布为厚尾分布; 当ν > 2时,GED分布呈现瘦尾性; 当ν = 2时,GED分布退化为正态分布。

所以本文假设残差服从t分布和GED分布,建立FIEGARCH模型,对我我国黄金市场的波动进行刻画分析。

2 数据选取与分析

2. 1 数据选取与统计特征分析

本文的数据来自于上海黄金交易所的主要交易品种Au99. 99。黄金Au99. 99品种是现货市场的交易品种,但它同时具有T + D等特殊交易机制,使其类似于黄金期货,具有套期保值的特点,所以具有的风险也比较大。所以黄金Au99. 99品种具有一定的代表性。回顾近十年的黄金价格走势,2007年全球金融危机的出现可以说是最近几年价格快速上涨的转折点,所以为了更好的研究近些年我国黄金市场的风险状况,选取2007年1月4日至2014年3月5日,共1 737个Au99. 99品种日交易收盘价数据。其价格走势,如图1所示。

本文对数 据的实证 分析主要 利用Matlab,Eviews软件完成。从图1中可以清晰地看到,从2007年开始黄金价格开始快速的上涨。但是从2011年下半年开始,价格开始大幅度的回落,在整个期间黄金价格波动剧烈,变动幅度较大。

设第t日的收益率为rt,则rt= 100 * ( ln ptln pt - 1) ,pt为AU99. 99品种的日收盘价。则其日收益率序列的基本统计,如表1所示。

Au99. 99黄金品种收益率均值0. 029 159 > 0,中位数0. 061 078 > 0,说明样本为正收益。由于标准差1. 208 614明显大于均值0. 029 159,说明在观察的时间段内日收益率有很大的变化。在正态分布假设下,S( 偏度) = 0,K( 峰度) = 3,而表中数据表明样本的偏度和峰度均显著异于正态分布,且J - B统计量较大,说明了收益分布序列的尖峰厚尾性。其收益率序列,如图2所示。

从图2中可以看到,波动在一些较长的时间内非常小,在其他一些较长的时间内非常大,表明黄金收益率数据存在明显的波动聚集特性。

2. 2 序列平稳性检验

平稳性检验是分析时间序列的重要指标之一。因为使用GARCH模型的一个前提条件是扰动项为平稳过程。可采用ADF检验对数据平稳性进行检验。用Eviews进行ADF检验,如表2所示。

从表2可知,收益率序列的ADF值为 - 42. 69891,且检验的P值为0,所以不存在单位根,这表明样本收益率序列是平稳的。

2. 3 序列自相关性性检验与 ARCH 效应检验

如果时间序列数据在残差之间存在相关性,这将会使变量不能有效的反馈信息。一般采用LQ方法检验自相关性和偏相关性。检验结果,如图3所示。

由于自相关检验中随 机区间的 计算公式为,其中T为样本量。所以从以上序列相关图中可以判断,我国Au99. 99黄金品种收益率序列滞后2期、4期、9期的自相关系数和偏相关系数超出了随机区间的范围[- 0. 047,0. 047],所以拒绝零假设: 随机过程是独立同分布的白噪声过程。通过Eviews软件对AR( 4) 过程的检验和不断试验,均值方程设置为AR( 4) 过程合理。

对此过程拟合出的残差序列作ARCH Test检验,如表3所示

由上表可以判断说明方程残差中ARCH效应是显著的。

下面对残差平方做自相关检验,如图4所示。

图4中序列的自相关系数均较大,在滞后12阶时仍为0. 182,尚未很快趋近于0,其Q统计量也都比较大,相应的概率值均为0. 000,说明残差平方序列存在着明显的自相关,拟合异方差性需要高阶的ARCH模型,也就是说 用GARCH模型来拟 合Au99. 99黄金品种收益率序列效果会更好。

2. 4 收益率序列的杠杆性分析

就大多数金融资产而言,普遍存在的一种现象是: 同等强度的负面消息比正面消息引发的市场波动更大,而新信息导致的价格变动与波动之间呈负相关关系,这种关系被称为杠杆效应。这种金融资产中的杠杆效应,实际反映出的是资产价格的后续波动与外部信息冲击之间的一种非对称性关系。通常而言,负面信息引起的波动更大,这在一定程度上也反映出投资者的风险厌恶特性。

对于杠杆性的分析,现有文献主要采用的模型有EGARCH模型、GJR模型与杠杆SV模型等。本文根据以上自相关性分析,采用AR - EGARCH模型和AR - GJR模型对我国Au99. 99黄金品种收益率序列可能存在的杠杆性进行初步的分析和判断。

EGARCH模型:

残差服从t分布下的方差方程:

残差服从GED分布下的方差方程:

GJR模型:

残差服从t分布下的方差方程:

残差服从GED分布下的方差方程:

从以上各 模型参数 估计结果 可知,我国Au99. 99黄金收益率序列在EGARCH模型和GJR模型下均表现出对信息的不对称反应,及存在杠杆效应。在EGARCH模型中,表征杠杆系数的值都大于0,表明好消息对波动的影响比坏消息大。在GJR模型中表征杠杆系数的值都小于0,同样说明好消息对波动的影响比坏消息大。郑秀田[9]采用EGARCH模型对上海黄金交易所最具有代表性的品种Au99. 95的每日收盘价格数据研究同样表明正的冲击比负的冲击更容易增加黄金市场的波动。

所以可以判断,与发达国家金融市场通常表现出的非对称效应———利坏消息对波动的影响比利好消息大相比,在我国黄金市场,杠杆效应表现为好消息对波动的影响比坏消息大。

2. 5 数据长记忆性性检验

如果一个时间序列具有自相似性,即可被称为具有长期依赖或长期记忆的特征,意味着近期的价格变化将影响远期的价格波动。Hurst提出了一种新的统计量———赫斯特指数( Hurst Exponent) ,对长期记忆性进行测量,运用R/S分析( Resealed RangeAnalysis,即重新标度极差分析) 法来分析分形时间序列。重标极 差 ( R/S ) 分析方法 由Mandebrot( 1974) 将其运用到经济理论上,设时间序列{ xt} ,t = 1,2,…,T,取n个序列观察值的均值为

这里只为说明R/S的具体含义,在实证分析中,可以让n从小到大取值一直到N/2,将总时间序列长度N分成A个长度相同的n,分别计算每个时间序列段的R/S值,然后对A个R/S值求平均,就得到了( R/S( j)n序列。在R/S分析法中,赫斯特指数( 即H值) 是非常重要的统计量。H值与( R/S( j)n序列以及时间间隔长度n之间的具体关系是: ( R/S( j)n= ( an)H,对等式两边取对数,即得ln ( R/S) =Hln n + Hln a,式中a为常数。于是,对 ( R / S( j)n序列进行处理,把lnn作为独立变量,ln ( R/S) 作为因变量,应用上式做线性回归,得出自变量的系数即为赫斯特指数H。当H = 0. 5时,原序列是标准的随机游走过程; 当H < 0. 5时,原序列具有反持久性,具有短期记忆性; 而H > 0. 5时,时间序列为长期记忆性[10]。

利用Matlab软件对R/S分析法进行检验,ln( R/S) 关于ln ( n) 的轨迹图,如图5所示。线性回归方程为ln ( R /S) = 0. 544 6ln ( n) - 0. 088 5. 所以上海Au99. 99黄金品种的Hurst指数为0. 544 6,从而可以认为收益的波动率呈现长记忆性特征。

3 计量模型估计

由以上分析可知,我国Au99. 99黄金品种收益率序列存在尖峰厚尾,杠杆性和长记忆性等特征,而FIEGARCH模型综合考虑了时间序列的杠杆性和长记忆性等特点,所以可对我国Au99. 99黄金品种收益率序列建立AR( 4) - FIEGARCH( p,d,q)模型。对于一般的金融时间序列来说,GARCH( p,q) 类模型均设置p,q = 1即可。本文为了找到刻画我国黄金市场效果最好的AR( 4) - FIEGARCH( p,d,q) 模型,分别设置以下4个不同模型,并分别进行了参数估计,并根据Akaike,Schwarz,Shibata,Hannan - Quinn4个信息准 则进行AR - FIEGARCH模型的定阶。其中信息准则值越小,表示模型拟合的越好。各模型参数估计值如下[11],如表4所示。

通过观察比较,AR( 4) - FIEGARCH( 1,d,0) GED模型的4个信息准则值相比于其他3个模型均较小,所以基于GED分布的AR( 4) - FIEGARCH( 1,d,0) 模型拟合效果最好,且其各参数估计值均比较显著。所以选择对我国Au99. 99黄金品种收益率序列建立AR( 4) - FIEGARCH( 1,d,0) - GED模型。

由AR( 4) - FIEGARCH( 1,d,0) - GED模型参数估计值可知:

分形差分系数d > 0. 5,表明Au99. 99黄金品种具有长记忆性特征,与重标极差( R/S) 分析方法分析结论相同。

GED分布自由度为1. 149227 < 2,说明我国黄金市场收益序列呈现明显尖峰厚尾性。

各模型信息准则值,如表5所示。

EGARCH( Theta1) 用来度量非对称性效应,其值不为0,表明我国Au99. 99黄金品种市场存在杠杆效应,但其值较小,度量杠杆性作用较弱,说明FIEGARCH模型度量我国黄金市场杠杆性存在不足。由于EGARCH( Theta1) 的系数为负,表明在波动大小相同时,利坏消息带来的的波动增幅大于利好消息带来的波动增幅,这与前述采用EGARCH模型和GJR模型得到的结论相反。究其原因,认为有以下几点可能造成这种结论差异。第一: 我国黄金市场与欧美黄金市场相比,存在市场化不足,信息有效性不强,交易活跃度不高的状况。在我国民众的心里黄金是保值增值,抵抗通货膨胀的最有利商品,而且很多普通大众认为黄金永远不会贬值,黄金就是财富的象征,这些认识严重忽略了黄金作为一种金融商品所特有的投资风险属性。现在全球黄金市场持续低迷,但国内却有很多民众会大肆购买黄金。与欧美黄金市场的成熟和市场化相比,把许多在国外金融市场应用研究效果较好的计量模型应用在我国黄金市场难免会出现结论上的差异。第二: 数据是否存在结构突变的可能。在此我们先对我国Au99. 99黄金品种收益率序列做回归,然后用Chow Breakpoint Test检验其是否存在突变点。结果显示我国Au99. 99黄金品种不存在结构突变。第三: 有可能因为长记忆性因子的引入造成了这种差异。具体造成这种差异的原因还有待继续的研究和探索。但不可否认的是我国黄金市场存在杠杆效应。

此模型估计方差与实际收益率,如图6所示,从图6可以看出,AR( 4) - FIEGARCH( 1,d,0) - GED模型整体上较为准确的刻画了黄金市场收益序列波动状况。

4 研究结论

本文主要建立了残差服从t分布和GED分布的AR - FIEGARCH模型,并利用此模型对我国黄金市场收益序列进行了拟合估计,并分析了我国黄金市场的波动特征。主要有以下结论:

( 1) GED分布自由度估计结果小于2,说明我国黄金市场收益序列呈现明显尖峰厚尾性,与J - B统计量结论一致。

( 2) FIEGARCH模型分形差分系数估计值为0. 5左右,表明Au99. 99黄金品种具有长记忆性特征,与Hurst指数分析结果一致。

( 3) 虽然EGARCH模型和GJR模型对Au99. 99黄金品种拟合分析表明其存在杠杆性———好消息对波动的影响比坏消息大,但FIEGARCH模型估计结果只表明了其存在较弱的杠杆特性,且方式为利坏消息带来的的波动增幅大于利好消息带来的波动增幅。由于对FIEGARCH模型估计采用的是BFGS迭代法,造成这种结果的差异可能与数据的质量,估计方法还有我国黄金市场本身特性有关。具体杠杆效应表现为何种形式还有待更为准确的计量方法和模型。

以上结论说明我国黄金市场的有效性不强,市场价格对信息的反应存在非对称性。波动的长记忆性暗示市场中发生的事件和消息对期黄金市场的影响不会马上消失,而可能对市场产生长远的影响。例如2008年美国次贷危机发生,为了实现保值,避免通货膨胀、股市下跌带来的巨额损失,投资者纷纷涌入黄金市场。黄金价格也从此时开始快速上涨,直到2013年由于美国经济复苏美元走强、欧债危机等因素致使黄金价格下跌。波动的长记忆性也表明,黄金市场的波动在一定程度上是可以预测的,这可为投资者确定投资策略,规避风险服务。另外,在建立黄金投资组合中,必须考虑黄金价格收益波动的长记忆性,以建立更加符合实际的统计模型。对监管者而言,出台相关政策时,要考虑到价格波动的长期记忆性和对信息反应的非对称性影响。

总之,本文采用FIEGARCH模型对我国黄金市场波动特征刻画,得到的结论较为理想。

参考文献

[1]邹平.基于STFIGARCH模型的中国股市波动与权证定价研究[D].上海:上海理工大学,2012:1-5.

[2]BOLLERSLEV T,MIKKELSEN H O.Modeling and pricing long memory in stock market volatility[J].Journal of Econometrics,1996,73(1):151-184.

[3]汤果,何晓群,顾岚.FIGARCH模型对股市收益长记忆性的实证分析[J].统计研究,1999(7):39-42.

[4]王春峰,张庆翠,李刚.中国股票市场收益的长期记忆性研究[J].系统工程,2003,21(1):22-27.

[5]胡平,崔海蓉,吴有华,等.我国期货市场波动率长记忆性的实证研究[J].西安电子科技大学学报,2009,19(6):10-14.

[6]赵岩.欧元外汇市场分形特征研究[D].大连:大连理工大学,2008:30-35.

[7]BAILLIE R T,BOLLERSLEV T,MIKKELSEN H.Fractionally integrated generalized autoregressive conditional heteroskedasticity[J].Journal of Econometrics,1996,74:3-30.

[8]黄炎龙.基于Skewed-t分布的FIGARCH模型与VaR的度量[J].应用概率统计,2012,28(2):189-190.

[9]郑秀田.我国黄金市场的波动特征与风险度量研究[D].杭洲:浙江工商大学,2008:31-37.

[10]余顺治.基于R/S方法的我国股市分形特征研究[D].武汉:华中科技大学,2009:12-15.

上一篇:降损措施下一篇:装饰建材