多步预测

2024-07-05

多步预测(精选5篇)

多步预测 篇1

0 引 言

控制箱是多技术、多功能的自动控制系统,涉及到角-线变换、PID调节、数字滤波等数据处理方法,建立控制箱的数学模型(传递函数),难度难以估计。当今对控制箱的复杂故障诊断只是停留在人工判读的基础上,而将控制箱作为一个黑箱,利用其输出的控制指令,研究其工作特性和状态,已成为解决研究控制箱故障的一个有效途径。

控制箱发出的控制指令基于时间序列,鉴于其固定的测试弹道数据,可以提供参考依据,建立基于支持向量机的预测模型;研究实际弹道数据的输出,能够计算出未来时刻的预测弹道输出;同时,也能够为控制箱的故障诊断提供参考。

支持向量机是在统计学习理论基础上发展起来的一种新的机器学习方法[1],它基于结构风险最小化原则,表现出了很强的泛化能力,可以很好地克服局部极小点、维数灾难以及过拟合等传统算法所不可避免的问题。支持向量机在模式识别、故障诊断、函数逼近、回归估计和信号处理等领域都得到了广泛应用。

1 预测模型的建立和预测途径

本文选取径向基核函数:

Κ(x,xi)=exp{-|x-xi|2σ2}

作为特征参量预测模型的核函数。

在建立预测模型的过程中,还有两个模型参数有待确定,它们分别是调整参数γ和核参数σ2。γ越小,模型的复杂性越低;γ越大,模型对训练样本的拟合程度越好。σ2的增大会使拟合曲线更光滑[2,3]。因此,模型的性能在很大程度上取决于这两个参数的选择。通过程序寻优回归误差最小的原则来确定这两个参数的值。

利用回归误差作为评判标准,衡量回归曲线与真实曲线的贴近度,定义贴近度为M:

Μ=i=1Ν[Κ˜y(i)-Κy(i)]2Ν-2

由于每个平方和都有一个自由度的数据与其联系,总的离差平方和自由度是回归平方和自由度与残余平方和自由度之和。在回归问题中,V=N-1,由于在回归中自变量的个数是1,所以自由度是N-2。利用trainlssvm对样本进行训练,建立LS-SVM模型,其调用格式为:model=trainlssvm(model)。

在建立的预测模型的基础上,预测函数predict的主要功能是用一个训练好的LS-SVM模型对输入样本进行多步预测,其调用格式为:Yp=predict(model,Xt,nb)。

2 预测模型参数优化

在参数选择方法上,采用分段寻优和回归误差最小的方法。gam和sig2分别分为两段和三段,结果如表1所示。

在进行回归模型仿真的过程中,发现sig2越小,gam越大,回归得到的误差越小,回归效果越好。为满足回归的精度,这里选择sig2=0.01,gam=100。从回归曲线图可以发现,俯仰通道指令曲线是不断衰减的非周期振荡形式,这就需要回归模型具有很好的泛化能力,并且在小样本的情况下,不能出现过学习的情况。

3 训练与测试样本的确定

从采集的历史数据中,等时间间隔地选取126个时间点的数据,并从中提取时间序列。部分训练样本如表2所示。

调用windowize函数对表中的前116个数据进行重构,嵌入维数为5,生成训练样本,后面10个数据作为测试样本,用来检验模型的预测性能。

4 利用训练好的模型对特征向量进行多步预测

利用训练好的预测模型对样本进行10步预测,预测结果如表3所示。

从预测结果中可以看出,该模型对俯仰通道指令系数值的多步预测具有较好的性能。偏航通道指令系数用同样的方法建立预测模型。

为验证支持向量机的预测结果精度,同样选择BP神经网络进行俯仰通道的指令系数的多步预测。隐层神经元的个数对预测结果精度的影响如表4所示。

在使用BP神经网络时,设定训练迭代次数250次、误差目标为0.000 1进行训练,在隐层神经元个数分别取4,5,6,7,8,9时,发现当隐层神经元个数为7个时,训练达到误差目标并且在取不同神经元个数时,预测值与实际值的误差最小,故选择7个神经元作为隐层神经元的个数,其预测结果如表5所示。

通过对俯仰通道预测结果的精度比较可以发现,支持向量机的预测精度要优于BP神经网络的预测精度。

5 结 论

支持向量机避免了“维数灾难”,克服了神经网络中的“过学习问题”。通过比较支持向量机在分类和回归能力方面与神经网络仿真的结果表明,支持向量机在分类和回归等方面,不但具有较强的逼近能力和泛化能力,而且算法简单,具有较好的“鲁棒性”。

参考文献

[1]于德介,陈淼峰,程军圣,等.一种基于支持向量机预测器模型的转子系统故障诊断方法[J].中国机械工程,2006,17(7):696-699.

[2]郭辉,刘贺平,王玲.最小二乘支持向量机参数选择方法及其应用研究[J].系统仿真学报,2006,18(7):2033-2036,2051.

[3]陈帅,朱建宁,潘俊.最小二乘支持向量机的参数优化及其应用[J].华东理工大学学报:自然科学版,2007,34(2):278-282.

[4]周俊杰,王德功,常硕.浅析基于模型的航空电子装备故障预测[J].装备制造技术,2010(5):34-35,43.

[5]LIN Pao-tsun,SU Shun-feng,LEE Tsu-tian.Support vec-tor regression performance analysis and systematic parame-ter selection[C]//Proceedings of International Joint Con-ference on Neural Networks.[S.l.]:IEEE,2005,2:887-882.

[6]曹立军,马吉胜,秦俊奇,等.基于正反向混合推理的故障仿真预测模型[J].系统仿真学报,2006,18(3):742-746.

[7]卿立勇.基于飞行数据的飞机故障预测与故障诊断系统研究[D].南京:南京航空航天大学,2007.

[8]吴金广,史金龙.基于灰色预测模型的传感器的故障诊断方法[J].电气自动化,2005,27(4):74-76.

[9]李卓.高速公路机电设备故障预测及维修决策系统研究[D].西安:长安大学,2009.

[10]汪文峰,杨建军.装备故障率预测模型[J].装备环境工程,2007,10(5):75-77.

[11]李丹丹,路辉,郎荣玲.基于主成分分析和支持向量机的飞参阶段划分研究[J].现代电子技术,2010,33(8):134-137.

文章编修 多步变为一步走 篇2

重复性编辑一键搞定

对于文字编辑过程中遇到的重复性步骤,用EmEditor宏可以将多步才能完成的任务变为用一个按钮点击完成。就让我们以上面提到的全文英文单词变首字母大写为例来说明。

首先用EmEditor打开这篇含有不规范拼写的英文单词的文章,例如windows一词未按首字母大写来拼写。选中不规范拼写的英文单词windows,执行“宏→开始/停止宏”(或直接按Ctrl+Shift+R组合键),开始宏的录制过程。之后,编辑窗口的鼠标光标马上变成一个录像机样式的图标,表示宏的录制已经开始。这时我们右击鼠标,依次选择右键菜单中的“转换选定内容→每单词首字母大写”命令。接下来再次执行“宏→开始/停止宏”命令停止宏的录制。这时“宏”菜单下的“另存为”选项变得可选,选择该项并将刚才录制的宏保存为一个宏文件(这里我们保存为“首字母大写”)(图1、图2、图3)。

经过如上操作后,在EmEditor窗口中的“宏”菜单下,可以看到多了一个“首字母大写.jsee”的宏文件项目,如果宏工具栏开启,在工具栏上也可以看到一个“首字母大写”的宏按钮(图4)。

此后,如果用该系统下安装的EmEditor来编辑文件,只要遇到需要将首字母变为大写的单词时,不论该单词是什么内容,只需点击单词,然后再点击工具栏上的“首字母大写”宏按钮,光标处的单词马上会变成首字母大写的形式,这要比通过右键菜单经过两层选择转换要方便得多。

日记签署还能再简单

对于在日记文档中插入时间和日期的重复性工作,我们也可以实现自动化输入。通过Windows记事本中的简化操作功能,可以实现通过快捷键一键插入日期,或通过简单代码自动插入日期、时间落款信息。

具体方法是,在用系统记事本程序写日记的过程中,只需要直接按F5功能键(或者选择“编辑→时间/日期”命令),即可在光标处插入当前时间和日期,这样就不用再手动输入时间日期了(图5)。

多步预测 篇3

股票价格指数预测的准确性为投资者所关注,也是决策部门对市场有效监管的依据。为此,自19世纪股票市场建立以来,准确预测股票市场中包括股票价格指数和股票价格的运行态势成为国内外学者研究的热点。近10年来,针对非线性系统建模的人工神经网络(ANN)和支持向量机(SVMs)等计算智能方法被广泛的应用于股票价格指数预测[1,2,3]。

然而,股票价格指数是大量因素影响的综合结果,波动规律异常复杂,即使是ANN和SVMs这样强大的非线性预测工具都难以达到理想的预测效果。为此,大量学者开始对混合预测法进行探索。Leigh等结合ANN和模式识别技术对纽交所综合指数进行预测[4]。Armano等提出基于遗传算法和神经网络的混合预测模型[5]。 朱林等将粗集理论与神经网络相结合建立股指预测模型[6]。 上述研究结果表明, 混合模型在预测精度方面要明显高于单一预测模型。这其中,值得注意的是Cao[7]提出一种基于SOM和SVMs的混合建模思路,即首先运用SOM对时间序列的输入模式进行聚类,然后基于划分后的数据集分别建立SVMs预测模型。依据该建模思路,Hsu等[8]构建基于SOM和SVMs的混合模型对股票价格指数进行建模与预测。但是,文献[8]侧重于短期预测,未涉及股票价格指数多步预测问题。

构建多步预测模型来预测股票价格指数走势是一项具有挑战性的工作。准确预测股票价格指数的中长期运行趋势,对政府宏观经济管理而言,可有效维持股票市场的平稳运行,进而保障实体经济的健康有序增长;对投资者而言,能为优化投资组合等决策提供参考,从而能有效降低投资风险, 促进理性投资。然而, 对股票价格指数多步预测问题的研究较少,这正是本文的研究重点。

围绕多步预测问题的时间序列建模策略中,主要有迭代策略和直接策略[9,10]。对于两种建模策略的预测效果,文献[11]和文献[12]指出直接策略优于迭代策略,但是文献[13]和文献[14]却得出相反的结论。而在股票价格指数多步预测问题上,尚缺乏上述两种建模策略的比较研究。

本文从时间序列建模与预测的角度,提出基于SOM和SVMs的股票价格指数多步预测方法,技术思路和文献[8]相似, 但本文的主要贡献在于: ①对股票价格指数进行多步预测研究,建模难度增加的同时也更具现实意义;②比较多步预测建模的两种常用策略,即迭代策略和直接策略,实验性地给出效果评价;③有别于文献[8]采用的简单网格搜索算法,本文采用粒子群优化算法(PSO)解决支持向量机建模参数动态寻优问题,以提高预测精度。④选取沪深300指数历史数据, 通过大量实验, 测试了基于SOM和SVMs的多步预测方法的性能。

2 股票价格指数多步预测

股票价格指数序列{φ1,…,φT},其中φt为第t个交易日的股票价格收盘指数,多步预测是指对未来H个交易日的收盘股指{φT+1,…,φT+H}进行预测,其中H>1为预测步长。

2.1 迭代策略

迭代策略首先构建一个单步预测模型,然后该模型被迭代的使用以进行多步预测,该方法的特点是前期的估计值作为输入值参与后期值的估计。

φt+1=f(φt,φt-1,,φt-d+1)+ω(1)

其中, d为嵌入维度,ω为随机误差。

单步预测模型训练结束后,H个待预测值由下式得出:

φ^t+h={f^(φt,φt-1,,φt-d+1),h=1f^(φ^t+h-1,,φ^t+1,φt,,φt-d+h),h{2,,d}f^(φ^t+h-1,,φ^t+h-d),h{d+1,,Η}(2)

迭代策略的主要缺点是易出现误差积累。由式(2)可知,估计值作为模型输入参与预测,随着预测步长的增加,预测误差将呈显著增加,尤其当h∈{d+1,…,H}时,模型的输入全为估计值,预测准确度将大大降低。但是,迭代策略只需训练一个单步预测模型,建模过程简单,建模时间短。

2.2 直接策略

直接策略构建H个不同的预测模型以完成预测步长为H的多步预测。

φt+h=fh(φt,φt-1,,φt-d+1)+ωh,h{1,,Η}(3)

其中,d为嵌入维度,ωh为随机误差。

模型训练结束后,H个待预测值由下式得出:

φ^t+h=f^h(φt,φt-1,,φt-d+1),h{1,,Η}(4)

由式(4)可知,前期的预测值不再作为输入值参与下期的建模,从而解决了误差积累的问题,但是建模工作量大幅增加。

3 模型设计

3.1自组织映射神经网络

自组织映射网络(Self Organizing Map,SOM)以无监督的方式进行网络训练,能自适应的对股票价格指数序列的输入模式进行聚类,得到若干模式相对单一的数据集。

SOM神经网络学习算法的具体步骤如下:

步骤1: 初始化权矢量Wj,并设置初始学习率v(0)及总迭代次数Nmax.

步骤2: 从股票价格指数序列输入空间中随机选择训练样本Χi=[xi1,xi2,…,xiL]Τ.

步骤3: 计算训练样本Χi与权矢量的Euclidean距离,并通过Euclidean距离最小标准确定获胜的输出层神经元v.

dij=Xi-Wj=p=1L(xip-wpi)2(5)

步骤4: 更新获胜神经元v及其领域Nv内的激活神经元的权重矢量。

ωpj(n+1)=ωpj(n)+v(n)|¯xip-wpj¯|,jΝv(6)

步骤5: 更新学习率v(n),并重复步骤2至步骤5直到n=Nmax.

在SOM训练过程中,输出神经元的权向量逐渐向获胜神经元靠近,相似度较高的神经元聚集在一起,在网格中形成一个个聚类的数据云,从而权向量可看作是以它为获胜神经元的所有样本的聚类中心。

在数据实验中,由于SOM自身特点及股指数据的影响,数据云重叠以致难于分辨,影响聚类效果。因此,本文采用U矩阵观察SOM聚类结果,以确定最佳聚类数。

3.2支持向量机

通过SOM对股票价格指数序列的输入模式进行聚类,得到模式较为单一的若干数据集,然后基于该数据划分,运用支持向量回归算法(SVMs的一种重要应用形式)构建预测模型,进而得到股票价格指数的预测值。

支持向量回归算法的基本思想是:通过用内积函数定义的非线性变换将输入空间变换到高维空间,使样本线性可分,再在高维空间作线性回归。即对于给定的非线性训练集,可以通过非线性函数Φ(x)将训练集数据x映射到一个高维线性特征空间,将在输入空间中的非线性函数估计问题转化为高维特征空间中的线性函数估计问题。估计函数f(x)可表示为:

f(x)=wΦ(x)+b(7)

其中,w的维数为特征空间维数。寻找结构风险最小化函数的f(x),使下式最小

Rreg=12wΤw+CRempε(w)(8)

式中,Rreg表示结构化风险,Rempε(w)=1ni=1nL(yi,f(xi,α))反映了训练误差即经验风险;wTw=‖w‖2反映了模型的复杂度;C决定着经验风险和正则化部分之间的平衡,称为惩罚因子,通过引入松弛变量ξiξ*i,式(8)转化为求解如下问题:

minw,b,ξ12w2+Ci=1l(ξi+ξi*)s.t.{yi-wΦ(xi)-bε+ξiwΦ(xi)+b-yiε+ξi*ξi0,ξi*0,i=1,2,,l(9)

该问题实际上成为二次规划问题,通过构造Lagrange函数对wbξiξ*i求最小化,得到回归决策函数

f(x)=i=1n(αi-αi*)(xix)+b(10)

由于在高维空间的内积运算相当复杂,根据泛函理论,一种满足Mercer条件的核函数对应某一变换空间中的内积,即

Κ(xi,xj)=Φ(xi)Φ(xj)(11)

通过这种核函数技术,可以将低维空间的非线性运算转化为高维空间的线性运算,从而得到支持向量机回归方程的估计式:

f(x)=xiSV(αi-αi*)Κ(xi,x)+b(12)

本文以高斯径向基函数作为核函数,即K(xi,xj)=exp(-0.5‖xi-xj‖2/σ2),σ>0,并运用PSO对惩罚因子C、核参数σ和不敏感系数ε进行寻优。算法思想是:每一个粒子代表SVMs的一组参数,即Cσε,粒子所对应的适应度是该组参数下模型的预测精度。本文设定PSO算法的种群规模为20,最大迭代次数为100,两个学习因子均为2,惯性权重为0.6。此外,为了增强SVMs预测模型的泛化能力,避免出现过拟合现象,在参数寻优过程中同时应用10折交叉验证法。

3.3 SOM-SVMs多步预测模型

本文提出基于SOM和SVMs的股票价格指数多步预测方法(简称为SOM-SVMs),即首先运用SOM对股票价格指数序列的输入模式进行聚类,得到若干模式相对单一的数据集,然后依据两种多步预测策略(迭代策略和直接策略),基于划分后的数据集分别构建SVMs多步预测模型,以捕捉若干个隐藏在股票价格指数序列中的非线性输入输出模式。

①采用迭代策略的SOM-SVMs多步预测模型建模步骤如下:

步骤1: 对股指序列划分训练集与测试集,设训练集和测试集样本数分别为NM.

步骤2: 对训练集进行相空间重构,得到数据集:D={(Xt,yt)∈(Rd×R)}N-1t=d.其中,Xt={φt-d+1,…,φt}, yt=φt+1, d是嵌入维度。

步骤3: 运用SOM对数据集D的输入模式{Xt}N-1t=d进行聚类,设最优聚类数为G.

步骤4: 对归属于类别g∈{1,…,G}的所有样本对{{φt-d+1,…,φt},φt+1}g构建单步预测模型SVMg.共训练出G个SVM模型。

步骤5: 设预测步长为H. 对于测试集样本对{{φt-d+1,…,φt},φt+1}N+M-1t=N+d,提前1步预测:首先判断输入模式{φt-d+1,…,φt}所属的类别,若该类别为g∈{1,…,G},则{φt-d+1,…,φt}作为模型SVMg的输入,得出预测值φ^t+1.提前2步预测:首先把φ^t+1加入到输入模式中,判断输入模式{φt-d+2,…,φt,φ^t+1}所属的类别,若该类别为g∈{1,…,G},则{φt-d+2,…,φt,φ^t+1}作为模型SVMg的输入,得出预测值φ^t+2.同理,依次得到预测值{φ^t+1,…,φ^t+H}。

②采用直接策略的SOM-SVMs多步预测模型建模步骤如下:

步骤1: 对股指序列划分训练集与测试集,设训练集和测试集样本数分别为NM;

步骤2: 对训练集进行相空间重构,得到数据集:D={(Xt,Yt)∈(Rd×R)}N-Ht=d.其中,Xt={φt,…,φt-d+1}, Yt={φt+1,…,φt+H}, d是嵌入维度。

步骤3: 运用SOM对数据集D的输入模式{Xt}N-Ht=d进行聚类,设最优聚类数为G.

步骤4: 设预测步长为H,构建1步提前预测模型:对归属于类别g∈{1,…,G}的所有样本对{{φt-d+1,…,φt},φt+1}g构建1步提前预测模型SVM1g.构建2步提前预测模型:对归属于类别g∈{1,…,G}的所有样本对{{φt-d+1,…,φt},φt+2}g构建2步提前预测模型SVM2g.同理,构建H步提前预测模型:对归属于类别g∈{1,…,G}的所有样本对{{φt-d+1,…,φt},φt+H}g构建H步提前预测模型SVMHg.共训练出H·G个SVM模型。

步骤5: 对于测试集样本对{{φt-d+1,…,φt},{φt+1,…,φt+H}}N+M-Ht=N+d,1步提前预测:首先判断输入模式{φt-d+1,…,φt}所属的类别,若该类别为g∈{1,…,G},则把{φt-d+1,…,φt}作为模型SVM1g的输入,得出预测值φ^t+1.2步提前预测:把{φt-d+1,…,φt}作为模型SVM2g的输入,得出预测值φ^t+2.同理,依次得到预测值{φ^t+1,…,φ^t+H}。

4 数据实验

4.1实验数据及评价标准

为验证SOM-SVMs多步预测模型的有效性,本文以我国股票市场中的沪深300指数为实验数据源。沪深300指数是由上海和深圳证券市场中选取300只A股作为样本编制而成的成分股指数,样本覆盖了沪深市场六成左右的市值,具有两好的市场代表性,并是我国证券市场上市的第一个股指期货产品的标的物。本文选取从2009年1月5日至2011年12月30日共729个交易日的数据作为研究对象。如图1所示,该时间段经历了股市上涨和下跌的全过程,从而能够在充分市场情况下对沪深300指数的中长期走势进行预测,使本文研究更具说服力。数据来源于RESSET金融研究数据库(http://www.resset.cn/)。股指序列以2∶1的比例划分为训练集和测试集, 其中2009年1月5日至2011年1月4日的日收盘指数作为训练集,共486个数据点;2011年1月5日至2011年12月30日的日收盘指数作为测试集,共243个数据点。

本文采用正则均方误差(NMSE)和百分比误差(MAPE)作为衡量预测结果好坏的评价指标, NMSE反映了预测股指与实际股指的平均误差,而MAPE作反映了它们的相对误差。NMSEMAPE越小,表示预测股指越接近实际股指,效果越好。NMSEMAPE的一般表达式如下:

ΝΜSE=1δ2ni=1n(ai-pi)2(13)ΜAΡE=1ni=1n|ai-pi|ai×100(14)δ2=1n-1i=1n(ai-a¯)2(15)

其中,ai表示实际值,a¯表示实际平均值,pi表示预测值。

但是,NMSEMAPE只能说明模型预测值的准确度,不能从统计意义上表明模型的优劣。因此,本文使用Diebold和Mariano检验[15]评估各模型的预测能力是否有显著差异,以找出最优预测模型。

对时间序列预测模型的输入变量进行有效的筛选,能显著提高预测精度、减少建模复杂度。输入选择方法主要分过滤法(Filter method)和装箱法(Wrapper method)。过滤法作为一种数据预处理方法,独立于所采用的建模技术;而装箱法以建模技术对各输入变量子集的预测误差作为评价指标,从而确定最优输入变量子集。相对于过滤法,采用装箱法的预测精度更高,但更为耗时。本文提出的SOM-SVMs多步预测模型较为复杂,因此采用过滤法进行输入选择,并以互信息[9]作为输入选择标准,设最大嵌入维度为20。

本实验在Matlab7.0和R2.14.2中进行,其中SVMs核心部分基于Chang[16]设计的Libsvms2.86,SOM核心部分基于Matlab神经网络工具箱提供的代码,输入选择部分基于R的程序包entropy[17]。SVMs、SOM的应用、粒子群优化算法和多步预测策略的实现等均在Matlab中自主开发。

4.2实验结果

为了验证SOM-SVMs模型对股票价格指数多步预测的有效性,本文以单一SVMs模型作为对比方法,并分别采用迭代策略和直接策略对沪深300指数进行15步提前预测(即预测未来15个交易日的沪深300收盘指数)。

首先运用SOM对沪深300指数的输入模式进行聚类。SOM训练结束后,U矩阵分析结果见图2,从图上颜色深浅的区域可以看出:颜色较深的格子将图划分为三部分:右上角、左下角及剩下的部分。由此可知,SOM神经网络的最优聚类数目为3。经过SOM聚类分析,沪深300指数的输入模式被划分为三个数据集。然后对各数据集分别进行输入选择,结果如表1所示(对于各提前步数,Χ、Ο、Δ分别表示数据集1、数据集2、数据集3中相应的历史数据是否选为预测模型的输入变量)。依据迭代策略和直接策略,对三个数据集分别构建SVMs多步预测模型。SOM-SVMs模型和单一SVMs模型对沪深300指数15步提前预测的误差见表2,运行时间见表3。

注: *表示在5%的显著性水平下拒绝零假设。

实验结果表明:①无论采用何种多步预测策略,SOM-SVMs模型的预测精度均高于单一SVMs模型。这说明在多步预测场景下,首先运用SOM对股指序列的输入模式进行聚类,再对各数据集分别构建SVMs模型的建模思路是有效的;②相对于单一SVMs模型,SOM-SVMs的建模时间更短,该结论与Huang[18]的研究结果一致。③预测误差指标均随着提前步数的增加而增大,其中迭代策略的误差指标随着提前步数的增加快速恶化,导致这种现象的原因主要是误差积累问题;④相对于迭代策略,采用直接策略的多步预测误差较小,该结论与Atiya[11]的研究结果一致;⑤在本文中,直接策略需构建15个不同的预测模型对沪深300指数进行15步提前预测,而迭代策略只需构建一个预测模型,因此相对于迭代策略,采用直接策略的建模时间大大增加。由此可知,研究人员在决定采用何种策略进行多步预测建模时,需从效率和效益上进行权衡。

进一步, 本文采用Diebold和Mariano检验评估SVMs模型和SOM-SVMs模型的预测能力是否有显著 差异, 以找出统计意义上的最优预测模型。Diebold和Mariano检验结果如表4所示。由表4可知:在5%的显著性水平下,无论采用何种策略,SOM-SVMs模型的预测表现均优于SVMs模型。

5 结论

本文通过对沪深300指数的多步预测和分析,得出以下结论:①SOM-SVMs多步预测模型的预测精度和建模时间均优于单一SVMs模型,这说明SOM能够对原股票价格指数序列的输入模式按其内在特征进行聚类,而基于该数据划分,SVMs能够更好更快的模拟出股指的非线性复杂特征,从而提高预测精度、减少建模时间。②在股票价格指数多步预测的应用场景上,直接策略的预测精度优于迭代策略,但建模时间大大增加。

综上所述,本文提出的基于SOM和SVMs的沪深300 指数多步预测模型具有很高的预测性能,因此该模型对于预测股票市场整体动态演变有着很高的价值。值得注意的是,本文的研究侧重于股票价格指数的多步预测,对于当前国家宏观调控而言,该模型的预测可以很好地把握未来一段时间内金融市场的动态演变情况,对宏观经济运行机制具有一定的监测功能;对于投资者而言,该模型对判断股指中长期波动态势,具有很高的参考价值。

金融市场中极值指标的多步估计 篇4

极值统计专门研究很少发生, 然而一旦发生却有巨大影响的随机事件。目前, 极值统计的应用已经深入到许多领域, 如水文、 气象、 地震、 工程、 保险、 金融及网络通讯等, 用极值方法来研究极端数据已经显得尤为重要。

当样本容量很大时, 最大值的规范化序列收敛于广义极值分布, 依照其形状参数的不同, 可将其分为Gumbel、Fréchet、Weibull三种分布类型。可见形状参数, 即极值指标的估计非常重要[1]。常用的估计极值指标的方法有很多, 如Pickands、Hill、Moment、UH、PWM、ML等[2], 这些估计各有优劣。Pickands估计形式简单, 具有平移尺度不变性, 但不稳定, 难以应用。Hill估计统计性质较好, 在实际应用中表现的较为稳定, 但只适用于极值指标大于零的情形。Hill估计、矩估计和UH估计只具有平移不变性, 不具有平移不变性。概率权矩估计具有平移尺度不变性, 但它只对于小于1/2的极值指标具有渐近正态性。相比较而言, 极大似然估计在这六种估计中最好, 但其缺点是没有显示表示式, 同时计算量较大。为此提出一种新的估计, 这种估计不但与精确值很接近, 计算简便, 还具有平移尺度不变性。由于估计是通过多步迭代完成的, 将其称为多步估计。

本文第2节给出几种常见的估计并比较其优劣, 进而提出一种新的估计方法, 第3节用几组模拟数据来说明这种估计的优点, 第4节用实例说明它在实际中的应用, 最后总结全文。

2 极值指标的估计

X1, X2, …是独立同分布的随机变量序列, 分布函数为F (x) 。 若F (x) 属于极值分布的最大值吸引场, 则存在常数列an>0和bn, 满足

limnFn (anx+bn) =Gξ (x) =exp{- (1+ξx) -1/ξ}, 1+ξx>0

其中ξ∈R称为极值指标, 通常被表示为FMDA (Gξ) , 这与下面的条件等价:

limtx*Ft (xσ (t) ) =Ηξ (x) =1- (1+ξx) -1/ξ

其中, Ft (x) 是超出量函数, 定义为Ft (x) =Ρ (X-tx|X>t) =F (t+x) -F (t) 1-F (t) σ (t) >0x*F (x) 的右端点, Hξ是广义帕累托分布 (GPD) 的分布函数。

Xn, 1≤…≤Xn, nX1, X2, …, Xn的次序统计量, 利用GPD的1234分位数的经验估计, 可以得到极值指标ξ的Pickands估计为[3]

ξ^Ρ=1log2logXn, n-[k/4]-Xn, n-[k/2]Xn, n-[k/2]-Xn, n-k (1)

ξ>0时, ξ的Hill估计为[4]

ξ^Η=1ki=0k-1logXn, n-i-logXn, n-k (2)

但Hill估计只适用于ξ>0的情形。 对于一般的ξ∈R, 可以采用矩估计[5]和UH估计[6], 其形式分别为

ξ^Μ=ξ^Η+1-12 (1-ξ^2ΗΜn (2) ) -1 (3) ξ^UΗ=1ki=0k-1logUΗn, n-i-logUΗn, n-k (4)

其中, Μn (2) =1ki=0k-1 (logXn, n-i-logXn, n-k) 2UΗn, n-i=Xn, n-iξ^Η.

但是Hill估计、矩估计和UH估计都只具有平移不变性, 而不具有尺度不变性, Pickands估计虽然既具有平移不变性, 又具有尺度不变性, 但它又不如另外三个估计效果好[7]。为此, 可以利用概率权矩 (PWM) 估计[8], 其形式为

ξ^ΡWΜ=Ρn-4RnΡn-2Rn (5)

其中

Ρn=1ki=0k-1Xn, n-i-Xn, n-kRn=1ki=0k-1ik (Xn, n-i-Xn, n-k)

这个估计具有平移尺度不变性, 但是它只对于ξ<1具有一致性, 只对于ξ<12具有渐近正态性。为此考虑最常用的极大似然估计[9], 记极值指标ξ和尺度参数σ的极大似然估计分别为ξ^ΜLσ^ΜL, 则它们需要满足下列方程组

{i=1k1ξ2log (1+ξσ (Xn, n-i+1-Xn, n-k) ) - (1ξ+1) (1/σ) (Xn, n-i+1-Xn, n-k) 1+ (ξ/σ) (Xn, n-i+1-Xn, n-k) =0i=1k (1ξ+1) (ξ/σ) (Xn, n-i+1-Xn, n-k) 1+ (ξ/σ) (Xn, n-i+1-Xn, n-k) =k (6)

很明显, 极大似然估计具有平移尺度不变性。 同时, 它在ξ>-12时是很好的估计, 但这个估计没有显示表达式。通过解似然方程组虽然可以得到解, 但并不能保证解的存在性, [10]陈述了其存在性, 但并未给出证明, [11]讨论了方程组的数值解法。 处理这个问题的另一种方法是找到似然方程 (6) 的近似解。 当ξ=0时[10],

ξ^*=1-12 (1- (mn (1) ) 2mn (2) ) -1mn (j) =1ki=1k (Xn, n-i+1-Xn, n-k) j, j=1, 2 (7)

在这种情况下ξ^*是平移尺度不变的估计, 非常接近极大似然估计, 可是这只是ξ=0时的特殊情况。 对于一般的ξ∈R, 采用两步估计[12]

ξ^SΤEΡ=2ξ^ (1) +12WΜn (2) (WΜn (1) ) 2-1 (8)

其中, ξ^ (1) 是利用区组最大值法得到的极值指标的一种估计,

WΜn (j) =i=1kwi (j) (Xn, n-i+1-Xn, n-k) j, j=1, 2wi (1) =1ξ^ (1) +1 ( (ik) ξ^ (1) +1- (i-1k) ξ^ (1) +1) wi (2) =12ξ^ (1) +1 ( (ik) 2ξ^ (1) +1- (i-1k) 2ξ^ (1) +1)

显然, 如果第一步估计ξ^ (1) 是平移尺度不变的, 那么, 两步估计ξ^SΤEΡ也是平移尺度不变的, 所以可以选择Pickands估计ξ^Ρ作为第一步估计。 尽管Pickands估计不太好, 但将其代入 (8) 得到的第二步估计会足够接近极大似然估计。 以此类推, 将第二步估计继续代入 (8) , 可以得到ξ的三步估计, 这个估计也是平移尺度不变的, 而且这个估计更接近于极大似然估计。 为此, 提出极值指标的多步估计, 形式为

{ξ^ (1) =ξ^Ρ=1log2logXn, n-[k/4]-Xn, n-[k/2]Xn, n-[k/2]-Xn, n-kξ^ (m) =2ξ^ (m-1) +12WΜm, n (2) (WΜm, n (1) ) 2-1, m=2, 3, (9)

其中

WΜm, n (j) =i=1kwm, i (j) (Xn, n-i+1-Xn, n-k) j, j=1, 2wm, i (1) =1ξ^ (m-1) +1 ( (ik) ξ^ (m-1) +1- (i-1k) ξ^ (m-1) +1) wm, i (2) =12ξ^ (m-1) +1 ( (ik) 2ξ^ (m-1) +1- (i-1k) 2ξ^ (m-1) +1)

3 模拟研究

分别模拟三种常见的分布:正态分布、柯西分布和贝塔分布, 各得到10000个数据, 利用上面提到的方法, 分别做出k从11到1000的极值指标ξ的曲线图, 如图1所示。 图中实线、虚线、点线分别表示极值指标的Pickands估计、两步估计和极大似然估计。 从图中可以看出, 当k比较大时, 两步估计非常接近于极大似然估计。 事实上, 如果按照 (9) 计算极值指标的三步估计, 它会比两步估计更接近于极大似然估计。

而这三种分布分别属于Gumbel (ξ=0) 、Fréchet (ξ>0) 和Weibull (ξ<0) 分布的吸引场, 极值指标分别为0、1和-0.5, 图中的曲线在k>400时非常接近这三个极值指标, 这再一次说明, 多步估计可以很好的代替极大似然估计。

4 实证分析

考虑上证综指从2000年1月4日到2009年12月31日除去节假日后共2580天的每日收盘指数, 数据来自http://finance.cn.yahoo.com/q/hp?s=000001.SS, 如图2所示。 为了对收盘指数进行统计分析, 定义每日的对数回报率ldc (t) 为:

ldc (t) =logp (t) -logp (t-1)

其中p (t) 为第t天时的收盘指数, 容易计算出上证综指的每日对数回报率, 如图3所示。

基于上证综指的每日对数回报率数据, 用前面的方法, 利用式 (9) 计算出的极值指标的估计如图4所示。在图4中, 实线表示Pickands估计, 虚线表示两步估计, 点线表示三步估计, 虚点线表示极大似然估计, 可以看出, 三步估计已经和极大似然估计非常接近, 几乎可以代替极大似然估计。 而且在k=400右侧, 估计基本上已经稳定于值0.06, 这就说明可以认为这组数据的极值指标的估计为ξ^0.06

5 结束语

本文总结了常用的估计极值指标的方法, 并比较了它们的优缺点, 在这些估计中, 极大似然估计是最好的, 既具有平移尺度不变性, 精度又比较高, 然而其缺点就是其计算量较大。针对于这些缺点, 提出一种新的多步估计, 经过模拟数据和实际数据的验证, 得到这种估计具有误差小、简单易算且满足平移尺度不变性这三大优点, 是一种可以代替极大似然估计的比较好的估计。

参考文献

[1]史道济.实用极值统计方法[M].天津:天津科学技术出版社, 2006.

[2]Jan B, et al.Statistics of Extremes[Z].2004.

[3]Pickands J.Statistical inference using extreme order statistics[J].Ann.Stat., 1975, 3:119~131.

[4]Hill B M.A simple general approach to inference about the tail of a distribution[J].Ann.Stat., 1975, 3:1163~1174.

[5]Dekkers A L M, Einmahl J H J, De Haan L.A moment estimator for the index of an extremevalue distribution[J].Ann.Stat., 1989, 17:1833~1855.

[6]Beirlant J, et al.Tail index estimation, pareto quantile plots and regression diagnostics[J].J.Am.Stat.Assoc., 1996, 91:1659~1667.

[7]De Haan L, Peng L.Comparison of tail index estimators[J].Stat.Neerl., 1998, 52 (1) :60~70.

[8]Hosking J, Wallis J.Parameter and quantile estimation for the generalized pareto distribution[J].Technometrics, 1987, 29:339~349.

[9]Smith R L.Estimating tails of probability distribu-tions[J].Ann.Stat., 1987, f15:1174~1207.

[10]Drees H, Ferreira A, De Haan L.On maximum likelihood estimation of the extreme value index[J].Ann.Appl.Probab., 2004, 14:1179~1201.

[11]Grimshaw S D.Computing maximum likelihood estimates for the generalized pareto distribution[J].Technometrics, 1993, 35:185~191.

经营净现金流量多步式调节探讨 篇5

一、多步式调节经营现金流量

(一)单步式调节

单步式调节是用净利润加上所有调节项目金额直接得出经营活动现金流量。具体调节项目包括:(1)资产减值准备;(2)固定资产折旧、油气资产折耗、生产性生物资产折旧;(3)无形资产摊销;(4)长期待摊费用摊销;(5)处置固定资产、无形资产和其他长期资产的损失;(6)固定资产报废损失;(7)公允价值变动损失;(8)财务费用;(9)投资损失;(10)递延所得税资产减少;(11)递延所得税负债增加;(12)存货的减少;(13)经营性应收项目的减少;(14)经营性应付项目的增加;(15)其他。

单步式调节,将净利润调节为经营活动现金流量,实际上就是通过上述15个调节项目同时调节范围、调节口径。调节范围是从利润中剔除不属于经营活动的收益,计算经营活动收益;调节口径是将利润计算所依据的权责发生制调节为现金流量计算所依据的收付实现制,将经营活动收益调节为经营活动净现金流量,即经营活动产生的现金流量净额。但是,单步式调节虽然包含了调节范围、调节口径的内容,但两者的内容交错混合在一起的。以中视传媒股份有限公司2008年年报为例,单步式调节如表1所示。

金额单位:元

单步式调节的数据对照关系如表2所示。

(二)多步式调节

多步骤调节是借助经营活动收益、经营活动现金收益等中间指标,将净利润逐步调节为经营活动产生的现金流量净额。按照先调范围、再调口径的步骤可以将单步骤调节的15个项目分为以下3类:(1)非经营活动收益这类项目不属于经营活动损益,属于投资活动或筹资活动损益,应当从净利润中剔除,从而得出经营活动收益。具体项目包括:处置固定资产、无形资产和其他长期资产的损益;固定资产报废损失;公允价值变动损益;投资损益;以上几项属于投资活动损益的项目。财务费用项,属于筹资活动损益的项目。其他项,若利润中包括债务重组和非货币资产交换而带来的营业外收支,也应剔除。(2)非付现费用。这类项目是已计入利润但不支付现金的费用,应将其加回,从而得到经营活动现金收益。具体项目包括:资产减值准备;固定资产折旧;无形资产摊销;长期待摊费用摊销;以上几项为已计入利润但不支付现金的费用,应将其加回。递延所得税资产,比较递延所得税资产项目期初余额与期末余额的差额,如果是递延所得税资产减少,表明在当期应交所得税的基础上增加了所得税费用,但并未增加现金支付的所得税,应调节增加现金;反之,如果是递延所得税资产增加,则应调节减少现金。递延所得税负债,比较递延所得税资产负债期初余额与期末余额的差额,如果是递延所得税负债增加,表明在当其应交所得税的基础上增加了所得税费用,但是并未增加现金支付的所得税,应调节增加现金;反之,如果是递延所得税负债减少,则应调节减少现金。(3)营运资金变动。这类项目变动影响营运资金的变动,从而影响现金的变动,应当根据其变化方向调节现金流量。从而得到经营活动现金流量。存货、经营性应收项目属于经营性非现金流动资产,经营性非现金资产增加、营运资金增加,现金则减少;经营性非现金资产减少、营运资金减少,现金则增加。经营性应付项目属于经营性流动负债,经营性流动负债增加、营运资金减少,现金则增加;经营性流动负债减少、营运资金增加,现金则减少。具体项目包括:存货;经营性应收项目,经营性营收项目包括应收票据、应收账款、预付账款、其他应收款等;经营性应付项目,经营性应付项目包括应付票据、应付账款、预收账款、其他应付款、应付职工薪酬、应交税费等。

金额单位:元

多步骤调节的基本模式如下:

第一步:将净利润调节为经营活动收益。公式为:

净利润-非经营活动收益=经营活动收益

第二步:将经营活动收益调节为经营活动现金收益。公式为:

经营活动收益+非付现费用=经营活动现金收益

第三步:将经营活动现金收益调节为经营活动现金流量净额。公式为:

经营活动现金收益-营运资金增加=经营活动现金流量净额

以中视传媒股份有限公司2008年年报为例,多步式调节如表3所示。多步式调节的数据对照关系如表4所示。

(三)扩展

若按照以下设定的支付顺序考虑,可以进一步分析公司的经营活动现金流量的质量。假定经营活动取得的净现金流量的支付顺序依次为:利息支出、股利支出、投资活动净支出、偿还债务,可以分别得出付息后现金流量;付息、派利后现金流量;付息、派利、投资活动后现金流量;以及本期现金净增加额。从本期现金增加净额当中剔除筹资活动现金流量,即为实体现金流量,亦称自由现金流量。实体现金流量也等于经营活动现金流量减去投资活动现金流量。实体现金流量对于公司价值判断而言,是一个十分重要的关键指标。仍以中视传媒股份有限公司2008年年报数据为例说明如表5。

金额单位:元

金额单位:元

基于上述分析,建议将现金流量表补充资料中将净利润调节为经营活动现金流量的格式改为如表6所示。

二、析出指标

(一)多步式调节析出的指标

多步式调节析出指标如下:(1)经营活动收益。它是在对应经营、投资、筹资三类活动将净利润分类的基础上,用净利润扣除投资活动和筹资活动损益后的余额。将它与净利润比较计算经营收益指数,从而透过经营活动收益占净利润的比重来了解公司的收益质量。经营收益指数越大,表明收益质量越好。(2)经营现金收益,亦称营运资金投资前现金收益。它是经营活动取得的现金收益,用经营活动收益加回资产减值准备、折旧等非付现费用计算。如果经营现金收益为负,说明公司创造现金的能力太弱,对营运资金的扩充没有贡献,更无力付息、派利、投资和偿债,利润质量很差。

金额单位:元

(二)扩展部分析出的指标

经营活动现金流量,即经营活动产生的净现金流量,是现金流量表分析的重要指标,可用于评价公司的动态偿债能力和财务弹性。基于经营活动现金流量的扩展指标对于评价公司经营活动现金流量的质量、判断公司价值具有不可替代的重要意义。假定经营活动现金流量为正以下指标可以从不同侧面反映企业财务状况。(1)付息后现金流量。它是经营活动现金流量减去利息支出后的余额。一旦该指标为零、甚至为负,则表明公司经营活动现金流量仅能维持支付借款利息甚至不足以支付借款利息。(2)付息、派利后现金流量。它是付息后现金流量减去支付的股利后的余额。该指标的大小,表明公司经营活动现金流量可用于满足投资活动需要的多寡,如果该指标很小,公司的投资需求就不得不靠外部融资来满足。(3)付息、派利、投资后现金流量。它是付息、派利后现金流量减去投资活动现金流量净额后的余额。如果该指标为正,表明公司正常运作无需外部筹资;如果该指标为负,则表明公司满足投资需求必须从外部筹集的资金额度,该金额越大,公司的财务风险越大。(4)实体现金流量。它是公司经营活动现金流量减去投资活动现金流量后的余额,也可用本期现金增加净额减去筹资活动现金流量计算。公司长期的实体现金流量的预测值是判断公司价值的重要依据。

参考文献

[1]程隆云:《财务报表分析》,经济科学出版社2007年版。

上一篇:中美事业单位下一篇:劳动力流动理论