回归检验(精选4篇)
回归检验 篇1
股利政策是股份公司关于是否发放股利、发放多少以及何时发放的方针和政策。它有狭义和广义之分。从狭义方面来说的股利政策就是指探讨保留盈余和普通股股利支付的比例关系问题, 即股利发放比率的确定。而广义的股利政策则包括:股利宣布日的确定、股利发放比例的确定、股利发放时的资金筹集等问题。
西方国家对于上市公司股利政策的研究历史较长, 最先是和证券估价分析联系在一起, 还没形成一个专门的研究领域。对股利政策的真正研究开始于20世纪60年代。1961年美国芝加哥大学两位财务学家米勒和莫迪格利安尼发表了《股利政策、增长和股票估价》一文, 股利政策一时成为众多学者的研究热点。
一、国外关于股利政策的实证研究
国外关于股利政策研究的实证检验, 比较有代表性的研究成果有:
法玛 (Fama, 1974) 研究了股利与投资、筹资之间的关系, 他的研究结果表明现金股利与投资政策是独立的, 从而支持了MM股利政策的无关理论。希金斯 (Higgins, 1972) 则通过研究认为现金股利是利润和投资的函数, 不同时期的股利差异归因于利润和投资需求的不同, 他的研究结果不支持股利无关理论。
布莱克和思科尔斯 (Black and Scholes, 1974) 利用扩展的资本资产定价模型研究股利支付率和股价之间的关系。他们选择1926至1966年的数据, 按照风险系数的高低将样本分为25个不同的组合, 检验结果发现股利政策不影响股票价格。
詹森和琼斯 (Jensen and Johnson, 1995) 选择1974年至1989年共268个股利减发超过20%幅度的公司作为样本, 研究了宣告前后三年21项公司的财务特征的变化, 结果发现公司盈利在现金股利减发前下降, 但在宣告后却又增加的情形。
二、我国关于股利政策的研究情况
我国的股利政策研究起步较晚, 20世纪90年代初期, 我国建立了资本市场, 20世纪90年代中后期逐步开始股利探索。翻译借鉴西方成熟而完备的股利理论与实证, 研究方法结合我国资本市场实际情况的股利研究是我国在这一领域研究的一大特色。
1999年, 吕长江和王克敏采用因子分析法在对可能影响上市公司股利分配的38个变量进行主成分分析的基础上构造了8个与现金股利有统计显著性的因子, 进一步采用逐步回归分析法研究因子与股利支付水平之间的关系显示, 国有股和法人股控股比例越大, 内部人控制度越强, 公司的股利支付水平越低;国有股及法人股比例越低, 公司越倾向于将利润留存于未来发展, 易采用股票股利代替现金股利的支付政策。
2001年, 赵春光、张雯丽、叶龙选取1999年底前上市的210家公司为样本研究股利政策的, 结果表明股权集中度越高可能越不分配股票股利。原红旗2001年在对上海、深圳证券交易所1994~1997年除金融概念股外的公司的股利分配方案分年度进行横截面分析, 结论表明上市公司的控股股东存在通过现金股利从上市公司转移现金的行为, 以股票股利留存于公司内部的资金存在浪费现象。
三、关于股利政策的一个实证检验
本文拟采用多元线性回归模型, 对影响上市公司现金股利发放的主要因素进行一个多元回归的实证分析。
对上市公司现金股利分配的影响因素是非常多的, 本文主要选取了五个主要的股利指标, 它们分别是股票的每股收益、净资产收益率、每股净资产、每股经营现金流、主营收入增长率, 本文选取了2008年在上海证券交易所上市交易的交易代码为600000到600050的公司作为样本, 以每股现金股利为因变量Y, 以每股收益 (X1) 、净资产收益率 (X2) 、每股净资产 (X3) 、每股经营现金流 (X4) 、主营收入增长率X5) 为自变量, 采用SPSS软件中的多元线形回归分析方法对其进行分析研究, 用最小二乘法进行估计, 利用R2来检验模型的拟合优度, 利用F值来检验模型的显著性, 利用值来检验解释变量的显著性。
SPSS输出结果如下:
a.预测变量: (常量) , 每股收益。b.因变量:现金股利
通过分析SPSS输出的表格数据, 我们发现只有一个解释变量 (即每股收益) 具有显著性, 其它四个解释变量没有通过检验而被剔除。
出现上述情况, 我认为主要有两个原因:第一, 我国上市公司现金股利发放具有随意性, 我们可以从很多上市公司的年报中看到, 即使上市公司当年盈利良好, 也会经常出现不发放股利的情况, 这与国外上市公司有很大差距, 这也使国内股票市场投机性气氛强烈。第二, 多元回归用到的数据来自大智慧软件, 而它关于上市公司的数据更新太慢, 最新数据寻找困难, 从而影响分析结果。
四、在股利政策实证研究中发现的问题
1. 证券市场的发展程度偏底
我国证券市场的起步相对于发达国家较晚, 所以在制度机制、法律规范、参与者素质等方面还比较落后, 市场噪音较大, 尚未达到半强式状态, 处于不断发展的阶段, 这是导致证券市场信息披露、股利政策等方面问题的根本原因。证券市场的成熟和完善, 需要市场参与者逐步加强完善我国证券市场环境的意识, 主动按市场规则活动。
2. 上市公司的股利支付机制随意
与西方发达国家的证券市场中上市公司已形成股利支付的制度机制不同, 我国上市公司在股利支付机制方面存在较大随意性。
首先, 有关股利分配的法律法规的着眼点没有放在向投资者支付股利上, 没有详细的可操作性规定, 所以上市公司对于是否发放股利, 发放多少股利, 以什么方式发放等问题几乎可以随意决定。其次, 大多数上市公司并不重视对股东的投资回报, 倾向于不分配红利, 部分有红利分配的也不足以支持其股价, 股利政策缺乏持续性。很多公司热衷于分配股票股利, 这说明我国上市公司主要将股市作为筹资渠道, 没有形成股利支付的制度机制, 没有明晰的股利政策目标, 其行为体现出对股利信号作用的不充分认识, 因而在股利政策的制定和实施上缺乏长远打算, 带有很大的盲目性和随意性。
3. 投资者的投资理念不够成熟
我国股市中的大多数投资者在投资理念方面存在问题, 投机心态过重, 而不是出于投资目的。他们只关心股票价格差价引起的投机收益, 而无心顾及公司是否发放红利给自己带来投资收益。此外, 广大中小投资者普遍缺乏证券交易、财务和经济方面的专业知识, 不善于利用股利来分析公司未来经营业绩和盈利趋势。有时甚至当公司分红派现时, 反而被认为公司前景不佳, 找不到新的投资项目和利润增长点, 因而股票遭到抛售。投资者的这种错误理解, 可能导致上市公司有大量利润时, 也不考虑向投资者分配, 而是进行新的投资。这就导致了投资和被投资双方都不重视股利政策, 形成不分配股利的恶性局面, 从而堵塞股利的信号传递通道, 阻止股利信号模型的运用。
五、总结
国外对股利政策的研究通常都以MM理论为研究线索, 通过放松其严格的假设条件来研究现实世界的股利问题。进入20世纪70年代后, 财务学者将不对称信息理论研究成果应用于财务理论, 这些理论对现实世界公司的财务决策给予了重新的解释, 突破了传统只重视外部可见因素的研究而忽略了对可分配收益有决定权的个人动机研究, 人们开始认识到不对称信息决定了契约的不完美, 这将导致作为决策主体的个人动机在财务决策中起到不可低估的作用, 同时与动机相关的公司内部治理结构和外部治理环境也成为了研究的重点。
国内的研究则主要体现为:应用国外股利理论来解释我国的特殊情况, 很少系统地从公司的内部治理机制和外部治理环境出发, 来研究我国上市公司利益主体的股利支付动机。因此, 在我国, 从公司的治理机制出发, 研究我国上市公司的股利政策将会是一个新的亮点。
参考文献
[1]刘星, 李豫湘.影响我国股份公司股利决策的影响因素[J].管理工程学报.
[2]吕长江, 王克敏.上市公司股利政策的实证分析[J].经济研究.
[3]魏刚.中国上市公司股利分配的实证研究[J].经济研究.
[4]李常青.股利政策理论与实证研究[M].北京:中国人民大学出版社.
[5]刘淑莲, 胡燕鸿.中国上市公司现金分红实证研究[J].会计研究.
[6]杨淑娥, 王勇, 白革萍.我国股利分配政策影响因素的实证分析[J].会计研究.
回归检验 篇2
在回归模型y = f ( x) + ui的经典假定中, 随机误差项ui无自相关, 即Cov ( ui, uj) = 0 ( i≠j) , 如果该假设不能满足, 就称ui和uj存在自相关, 即不同观测点上的误差项彼此相关. 此时, 如果依然用最小二乘法去估计参数, 会低估参数估计值的方差, 因此, 必须消除自相关的影响.
ut的一阶自回归形式为: ut= ρut - 1+ υt, 其中, ρ < 1, υt满足经典假定.
假设检验包括4个步骤: 第一步, 提出假设; 第二步, 构造适当的检验统计量, 并根据样本计算统计量的具体数值;第三步, 规定显著性水 平, 建立检验 规则; 第四步, 作出判断.
引理多元线性回归模型总体回归函数的一般形式为: Yt= β1+ β2X2t+ … + βkXkt+ ut.
多元线性回归模型的样本回归函数为:
其中: et是Yt与其估计Y^t之间的残差.
若记: Y = [y1, y2, …, y n]T, U = [u1, u2, …, u n]T,
B = [β1, β2, …, β k]T,
则总体回归模型的矩阵形式为: Y = XB + U, 样本回归函数的矩阵形式为: Y = X^B+ e.
多元模型中回归系数的检验采用t—检验, t统计量公式为
其中: βj是回归系数估计值, n是βj的标准差估计值, , ψjj是 ( X'X) - 1的第j个对角线元素.
二、线性自回归模型的假设检验
已知时间序列 {X t}: X1, X2, …, Xn, 建立线性自回归模型:
由引理, 回归系数的显著性检验中t统计量为:βj是回归系数的估计值, 是βj的标准差估计值ψjj是 ( X'X) - 1的第j个对角线元素.
三、幂函数自回归模型的假设检验
已知时间序列 {X t}, 建立幂函 数自回归 模型Xt=αXβt - 1expμt ( μt= ρμt - 1+ υt) , 则
用 ( 1) - ρ× ( 2) , 得
由引理, 回归系数的显著性检验中t统计量为:ψjj是 ( X'X) - 1的第j个对角线元素.
四、指数函数自回归模型的假设检验
已知时间序列 {X t}, 建立指数函数自回归模型Xt=αβXt - 1expμt ( μt= ρμt - 1+ υt) , 则
用 ( 1) - ρ× ( 2) , 得
回归检验 篇3
开放型基金指的是基金可以无限地向投资者追加发行股份,并且随时准备赎回发行在外的基金股份,其显著特点就是可随时直接向基金管理公司购买或赎回。这也就使开放型基金有一种天然的 “优胜劣汰”机制。显然,基金的营利性是投资者进行基金赎回的一个重要考虑因素,那么基金净赎回率同基金单位净值增长率之间呈现出怎样的关系?
对此,我们进行了统计研究: 分别考察2005—2007年资本市场非常活跃时我国证券市场上所有开放式基金上年累计单位净值增长率与当年累计单位净值增长率对净赎回率是否会产生不同的影响。
结果如表1、表2所示。
首先,按照上年累计单位净值增长率与当年累计净值增长率值的由小到大进行排序,进而计算出净值增长率最小的20名( 前20名) 与最大的20名( 后20名) 的平均净赎回率,再来比较两组基金净赎回率的大小,表示在 “前—后”这一行中。从表1中的结果我们看出从2005— 2007年三年内上年累计单位净值增值率排在后20名的基金净赎回率均要大于前20名, “前—后”得到的数据均为负值,其中以2006年的差值最大,为2. 891; 表2中除2007年外,2006年和2005年按当年累计单位净值增长率排名在前20名的基金净赎回率都要大于后20名的净赎回率, “前—后”这一项的数值分别是1. 042和0. 014。可见,上年累计单位净值增长率与当年累计净值增长率对投资者的基金赎回行为确实有着不同的影响。
通过以上的数据分析,我们认为基金历史业绩表现越好,基金持有人越愿意赎回该基金; 基金当前业绩越好, 持有人越不愿意赎回该基金。基金持有人在已经获利时更加愿意赎回基金( 表现出明显的风险厌恶性) ,在亏损状态时而不愿意赎回基金( 表现出明显的风险偏好性) 。这种现象也被称为 “赎回困惑”,显然基金投资者的这种投资行为是非理性的,并且对我国基金业的发展也非常不利。 这种非理性行为是一种羊群行为,是从众心理带来的结果。
2理性回归: 对于股票市场的实证分析
在经过了2008年以前的狂热阶段,金融危机过后, 投资者狂热的情绪也渐渐消退,投资理性也逐渐回归。下面我们运用CCK模型对2011—2013年的深市进行简单的实证研究。
2. 1 CCK模型描述
CCK模型假设市场上有N种股票,股票i在t日的收益率是Ri,t,市场组合在t日的平均收益率为Rm,t,那么市场在交易日t的横截面绝对偏离度( Cross - sectional Absolute Deviation,CSAD) 为
使用CSAD来度量市场的分散程度。
根据资本资产定价模型( CAPM) ,股票i的期望收益率Et( Ri) 等于无风险利率加上系统风险溢价( risk pre- mium) ,即有:
对式( 2) 进行变形、取绝对值并加总求和后可以得到式( 3) :
由式( 1) 和式( 3) 综合可得式( 4) :
对式( 4) 分别求一阶导数和二阶导数后可以得到:
显然,由于一阶导数大于零,二阶导数等于零,所以横截面绝对偏离度( CSAD) 和市场收益率应为线性递增关系。当市场存在羊群效应时,CSAD和市场收益率Rm的绝对值之间会表现为一种非线性的递减增长,在羊群效应严重时甚至变为Rm的减函数。为描述这种特性,我们在CSAD和Rm之间线性关系的基础上增加一个平方指数函数Rm2,由于E ( CSADi) 和Et( Rm) 是不可测的,我们用可测的CSADt和Rm,t分别代替它们。于是就可以得到回归方程:
因此,检验证券收益率分散度与市场收益之间是否保持线性关系,等价于检验二次多项式回归中二次项系数在统计意义上是否显著为零。如果二次项系数显著不为零, 则当二次项系数为负时,我们说市场存在羊群效应。如果二次项系数不显著为0或为正时,则说明此时市场无羊群效应或者羊群效应较弱。
2. 2深圳股票市场羊群效应的检验
2. 2. 1数据选取
在我们的CCK模型中,我们以深证成分指数的28个样本股的日收盘价为研究对象,样本区间为2011年1月4日至2013年1月4日。
深圳股票市场是一个典型的高成长性股市,深圳市场在2009年以前确实存在明显的羊群效应; 而且深证成分指数都是大盘股,每只股票对市场的贡献度差异性不大, 其市值占市场很大的比重,具有很好的代表性。
我们将利用对数收益率对市场的羊群效应进行研究, 对数收益率如下:
其中,Pt表示第t时刻的股票价格。
单位根检验:
( 1) 市场组合的收益率。图1、图2分别给出了市场收益率的单位根检验及序列的分布图。
( 2) 分散度指标CSADt。根据式( 1) 计算出深证成分指数收益率序列的分散度指标CSADt,图3、图4是CSADt的描述和单位根检验,图5、图6是EXP ( R2m,t) 的描述和单位根检验。
由此可以看出,无论是指数收益率序列Rm,t,还是EXP ( R2m,t) 序列或者分散度CSADt,这五种方法均一致性拒绝具有单位根的假设,所以指数收益率序列EXP ( R2m,t) 序列以及分散度序列CSADt是都是平稳序列。
2. 2. 2回归分析
利用模型( 5) 反复筛选,且为了进一步分析股市上涨和下跌时羊群效应的程度,我们将市场分割为股市上升和股市下跌两种情形,即利用如下模型来估计CSADt。
t值均通过了检验。
然而,︱ Rm,t︱的t值没通过检验。由上面两个回归结果可以看出,EXP ( R2m,t) 的系数并没有显著为负,即羊群效应是较弱的,股票市场的投资者也趋于理性。
考虑到投资者可能根据过去的市场收益率来做出投资决策,我们将滞后一阶的解释变量纳入考虑,但回归的结果仍显示为不明显的羊群效应。因此,我们可以初步认为, 在2011—2013年,股票市场中的羊群效应并不明显,投资者狂热的情绪有所消退,投资理性得到了一定的回归。
3结论
从我们的简单统计分析可以得知,以开放型基金为例,在2005—2007年间,投资者跟风操作的行为非常明显; 然而在2011—2013年间,在CCK模型的分析下,股票市场中的羊群效应并不明显,投资者狂热的情绪有所消退,投资理性得到了一定的回归。但是,在CCK模型的实证中,我们所选择的股票市场的数据样本量较少以及模型本身滞后阶数并不完全确定,有可能导致实验结果出现一定的偏差。我们期待在此基础上进一步进行优化,得到更确切、更可靠的结果。但是,在2008年金融危机过后, 投资者的理性得到了一定的回归是正确的。
那么,投资者应该如何尽量避免 “羊群效应”呢? 投资者应该结合自身的投资目标、风险承受度等因素,设定获利点和止损点,进行有效投资。同时,投资者自身应该控制好自己投资时的情绪,应该在充分考虑到长短期收益后适度转换或调整投资组合。另外,从更为宏观的角度考虑,应该通过进一步规范我国的资本市场,加快利率市场化的步伐,提高我国证券市场的成熟程度,发展理性化投资者与投资机构,以减少羊群效应,才能保持我国股票市场的平稳运行。只有这样,才能真正使得整个市场的投资回归理性。
摘要:中国的资本市场,尤其是股票和基金市场在2008年以前,经历了巅峰的时刻。在资本市场一派繁荣的同时,投资者的狂热也暴露无遗,“羊群效应”现象非常显著。然而,2008年金融危机过后,投资者狂热的情绪也渐渐消退,投资理性也逐渐回归。本文运用了简单的统计方法和CCK模型分别对于2005—2007年开放式基金市场和2011—2013年股票市场进行了分析,得出了在“后危机时代”,投资者投资理性回归的结论。
回归检验 篇4
负荷预测的核心问题是预测的技术方法,或者说是预测时所用的数学模型。目前国内外主要的预测方法包括主成分分析法(PCA)[1]、向量自回归(VAR)分析法[2]、协整检验[3]和格兰杰因果检验[4,5]、参数回归分析法[6]、支持向量机分析法[7]等。文献[8,9]提出组合主成分分析法与BP神经网络分析法,根据主成分贡献率对空间进行约简,提取线性无关的输入变量,以此达到压缩变量维数的目的,然后利用考虑模型输入变量相互关系的递推合成BP神经网络进行预测。但是这种方法在对原始数据的处理上没有考虑不同滞后几期对预测结果的影响,也就是说当相关因素发生变化时,对发电量的影响要滞后1个月、2个月甚至几年才能体现。而国内外的负荷预测研究中,很少有人将滞后期考虑在内。因此在进行预测分析时将滞后期考虑在内是十分必要的。
本文针对这一问题,将格兰杰因果检验与主成分相结合,根据格兰杰检验结果对原始数据进行滞后处理,然后再进行预测分析,最后通过实例分析证实了该方法的有效性。
1 带滞后期回归的基本原理
本文首先进行原理分析,然后进行实证分析,其研究流程如图1所示。
1.1 原始数据的处理
对原始数据进行处理,处理过程如下[4,10]:
首先对原始数据x进行二次平滑,平滑公式为:
对第二次平滑序列进行线性预测得出新的预测序列yi+6,然后通过该序列计算季节指数βi+6:
由于存在季节波动,必须对其进行调整,调整公式如下:
根据调整后的季节指数计算波动值ki+6:
最后计算得残值序列Ri+6:
1.2 单位根检验
在单位根(ADF)检验中,一般有2个滞后差分项的等式为[2]:
式中:εt为白色噪声误差项;yt为时间序列;Δyt为时间序列的一阶差分项;β1、β2、β3、β4、β5为常数项;T为时间趋势项;yt-1、yt-2为滞后差分项。
在EViews软件中,ADF检验有3种情况:1)回归方程中包含1个常数项;2)回归方程中包含1个线性时间趋势;3)回归方程中包含多个滞后差分项[2]。
在这3种情况中,ADF检验都是对回归方程中yt-1的系数进行平稳性检验,然后显示ADF检验结果,其结果应包含ADF统计量(检验滞后变量系数)和判断平稳性的临界值。如果yt-1的检验系数小于零,则拒绝yt包含单位根的原假设,从而接受序列yt平稳的备择假设。也就是说如果ADF统计量小于或等于临界值,那么序列yt是平稳的。如果ADF统计量比临界值大,那么序列yt是非平稳的。
1.3 格兰杰因果检验
格兰杰因果检验核心思想是若时间序列yt通过采用xt的历史数据可以提高预测效果,则说明存在从xt到yt的因果关系,否则不存在。传统的格兰杰因果检验的原假设是不存在从xt到yt的因果关系[4,5]。检验关系式如下:
式中:P1、P2为变量的滞后长度。
式(7)的原假设是不存在从xt到yt的因果关系,若β1j是联合显著的,则拒绝原假设。同样,式(8)的原假设是不存在从yt到xt的因果关系,若β2j是联合显著的,则拒绝原假设,表明存在从yt到xt的因果关系。
1.4 主成分分析
主成分分析是指在维持原序列信息基本不变的前提下,利用原序列的1个或多个线性组合来替代原序列并挖掘原序列之间数学关系的一种计量分析方法[8,9]。其数学模型为[8]:
假设有n个观察对象,每个观察对象观测P项指标:x1,x2,…,xP,那么,原始数据的矩阵形式为:
式中:xnp为第n个观察对象的第P个指标的观测值。
如果用x1,x2,…,xp来表p个指标,则x1,x2,…,xp的线性组合可以用1组新的变量Z1,Z2,…,Zp来表示:
如果系数aij满足,i=1,2,…,p而且系数aij的确定使Z与Zj(i≠j)独立,并让Z1在x1,x2,,xp的一切线性组合中的方差最大,让Z2与Z1独立…且在x1,x2,…,xp的一切线性组合中的方差最大,同理,让Zp与Z1,Z2,…,Zp都独立且在x1,x2,…,xp的一切线性组合中的方差最大,那么就认为Z1,Z2,…,Zp是原变量的第一、第二及至第p主成分。
主成分的求解可以通过以下3个步骤来处理[9]。
(1)观测得出样本矩阵
式中:i为样本数;j为变量数。
将原始数据标准化后得:
(2)观测对象的相关系数矩阵
用雅克比方法计算特征方程,求出与相关系数矩阵R对应的p个非负的特征值,并一一对应特征值:λ1>λ2>…>λp,≥0,则相应的λi的特征向量A(i)为:
并满足:
(3)第m个主成分的累积方差
累积方差α最接近于1的第m个因子为第m主成分,据此选择前面m个因子作为第一主成分、第二主成分及至第m主成分。通过这样的变换,解释因子由p个减少为m个,达到了筛选因子的目的。
2 实例分析
实证的具体过程如图2所示。
影响电力负荷预测的因素有很多,主要有电力消费结构、经济发展水平及经济结构的调整、收入水平及消费观念等。本文选用全行业用电量和城乡居民生活用电量表示电力消费结构,用社会消费品零售总额和出口商品总额代表经济发展水平,用全国居民消费价格指数代表收入水平及消费观念。
采用2004年1月到2012年12月共108个月的中国发电量及其相关的5个因素作为分析数据,预测2012年1月到12月的发电量。图3为发电量与各相关因素关系图,图3中Y表示发电量,X1表示全行业用电量,X2表示城乡居民生活用电量,X3表示社会消费品零售总额,X4表示出口商品总额,X5表示全国居民消费价格指数。
首先对其进行相关性分析(表1),从表1中可以看出Y与X1,X2,X3,X4有很大的相关性,相关系数均大于0.9,而与X5相关性较弱,相关系数为0.235 5;X1,X2,X3,X4,X5之间的相关性也很大,如果直接进行多元线性回归必然会产生多重共线性。
在进行主成分分析之前,进行格兰杰因果检验,计算出各序列的残值序列。
进行因果检验的前提是对时间序列进行ADF平稳性检验,表2给出了对残值进行平稳性检验的结果。从表2中可以看出,6个时间序列在无趋势项和截距项时都是平稳的。为保证检验的可靠性,另外用菲利普斯-配荣检验法(Plhillips-Perron Test,PP)对6个时间序列在无趋势项和截距项时的平稳性进行验证(表3),从表3可以看出6个时间序列在无趋势项和截距项时都是平稳的。因此可以直接对残值序列进行格兰杰因果检验。
不同的滞后期对序列的因果关系检验结果影响很大,由于我们研究的是月度数据,根据经验,月度数据平稳性检验滞后12期即可[4],但是为保证结果可靠性,总共做了滞后24期的格兰杰因果关系检验。而最多在滞后12期时各时间变量对发电量的影响均显著,另外,由于本文是考察各时间序列对发电量的影响,因此表4只列出了滞后12期的检验结果和各时间变量对发电量的格兰杰检验P值。检验的原假设是自变量不是因变量的原因,这里,自变量是各个序列,因变量是发电量。从表4中可以看出,在滞后期为12时全行业用电量是发电量的格兰杰原因,在滞后期为6时城乡居民用电量是发电量的格兰杰原因,在滞后期为1时社会消费品零售总额、出口商品总额、全国居民消费价格指数是发电量的格兰杰原因。
根据滞后期不同,采用各个序列不同滞后期的原始数据进行主成分分析,发电量采用2005年1月到2012年12月的数据,而全行业用电量采用2004年1月到2011年12月的数据,城乡居民生活用电量采用2004年7月到2012年6月的数据,社会消费品零售总额、出口商品总额和全国居民消费价格指数采用2004年12月到2012年11月的数据,分析结果如表5所示。
从表5可以看出应该选择第1主成分和第2主成分作为回归因子,因为第1主成分占总方差的73.17%,第2主成分占总方差的19.46%,前2个成分占总方差的92.63%,因此选择第1、2主成分作为回归因子。这一点从图4中可直观地看出。
选择第1、2主成分后,根据表6选择第1,2主成分的线性组合系数来进行回归分析,根据组合系数得出新的序列Z1、Z2,序列计算方法如下:
由此,将Z1,Z2作为自变量,发电量Y作为因变量进行多元回归分析,得到回归方程。
至此,得出预测方程亦即回归方程。为保证预测结果的可比较性,另外采用不作滞后处理的主成分回归和VAR方法进行预测,预测结果如表7所示。
根据表7所得数据计算月发电量预测准确率,计算公式为[11]:
其中,
式中:LFi、LRi分别为负荷的预测值和实际值;Ei为单点负荷的相对预测误差。
使用本文方法预测的月发电量预测准确率为91.93%,而用不做处理的向量自回归方法和主成分回归方法所预测的月发电量预测准确率分别为91.08%、85.61%。相对而言,本文的改进主成分分析法具有更高的预测精度。
3 结论
本文结合格兰杰因果检验和主成分回归分析法对电力负荷进行了预测,利用不同滞后期对因果检验不同这一特点,对原始数据进行处理,采用主成分回归分析,避免了因多元变量特征变异程度差异而引起的信息丢失,准确反映了原始数据所包含的信息,提高了预测精度。
很多电力负荷预测的实质是相同的,当选择的因素足够多时各种方法的精度相差无几。在这种情况下直接采用线性回归法是最简单成熟的方法。利用滞后期进行主成分分析不仅可以避免多重共线性,而且可以根据滞后期的不同进行提前预测,文中算例结果表明这是一种较理想的预测方法。
参考文献
[1]王晓林.统计学[M].北京:经济科学出版社,2001.
[2]张晓峒.Eviews使用指南与案例[M].北京:机械工业出版社.2006.
[3]牛东晓,嵇灵,劳永昶,等.中国电力消费与经济增长关系的实证研究[J].统计与决策,2013,2(374):140-142.
[4]ANDREA V.Granger Non-causality Tests Between(non)Renewable Energy Consumption and Output in Italy Since1861:The Relevance of Structural Breaks[J].Energy Policy,2012,(45):226-236.
[5]GALIP A,ERDAL K.Electricity Consumption and Economic Growth:Evidence from Turkey[J].Energy Economics,2005,(27):849-856.
[6]杨丽徙,张永锋,许向伟,等.半参数回归分析法在电力负荷预测中的应用[J].郑州大学学报,2010,3(31):29-32.
[7]张亚军,刘志刚,霍柏超,等.基于支持向量机的电力负荷组合预测模型叨.电力需求侧管理,2007,9(2):14-17.
[8]王志征,余岳峰,姚国平.主成分分析法在电力负荷预测中的应用[J].电力需求侧管理,2003,3(5):21-24.
[9]吕佳.基于主成分分析的短期负荷预测模型[J].重庆师范大学学报,2007,3(24):33-36.
[10]李钷,李敏,刘涤尘.基于改进回归法的电力负荷预测[J].电网技术,2006,1(30):99-104.