多元回归预测

2024-10-15

多元回归预测(精选12篇)

多元回归预测 篇1

1 建模流程

第一步, 利用SPSS对已知的商品住宅价格、工资收入以及GDP的十年数据进行相关性分析, 得出数据间的相关系数, 根据这些相关系数的大小来判断数据间是否有强联系, 为下面进行预测模型的建立的合理性提供依据。

第二步, 本文运用多元线性回归算法进行数据预估。首先把与商品住宅有强联系的数据类作为自变量, 把商品住宅价格作为因变量, 分别对强联系的数据类和商品住宅价格进行曲线多项式拟合, 大致确定商品住宅与其强联系数据类之间的影响关系, 通过分析它们之间的关系进行多元回归数学模型的建立。

第三步, 通过历史数据对模型进行检验, 并评价预测模型。

2 多元线性回归算法

回归分析 (Regression) 是一种应用广泛的统计分析方法, 在金融、经济、医学等领域都已成功应用。他应用于分析数据间的统计关系, 侧重观察变量之间的数量变化规律, 并通过回归方程的形式描述和反映这种关系。回归分析一般解决以下问题:确定自变量与若干因变量之间关系的定量表达式, 即回归方程式, 并且确定它们关系的密切程度;运用控制可控变量的数值, 借助于所求出的方程式来预测或控制自变量的取值;运行因素分析, 从影响变量变化的因变量中, 寻找出哪些因素对因变量产生了影响[5]。

2.1 相关性判别

相关分析用于描述两个变量之间关系密切程度, 它反映的是当控制了其中一个变量的取值后, 另一个变量的变异的程度。根据所得数据, 本文应用Pearson相关系数来对数据见联系强度进行判断。

Pearson相关系数计算公式为:

其中, n为样本个数, xi和yi为要分析相关性的两变量, r即为两变量的相关系数。当0≤|r|≤0.3时两变量为弱相关, 当0.3<|r|≤0.5时为低度相关, 当0.5<|r|≤0.8时为显著相关, 当0.8<|r|≤0.1时为高度相关。

2.2 线性回归模型

回归算法的基本步骤:首先把与所要预测的因变量相关度最高的自变量引入到线性方程中去, 再把相关性次高的自变量带入方程, 在带入次高变量后, 如果模型中的变量的F检验小于0.10, 则后带入的变量将不会被模型所接纳。如此不断带入自变量进行循环, 不断排除模型不需要的变量, 直到所有变量都已经被筛选过, 就得出最优回归模型。模型形式为:

其中, F作为多元线性回归显著性检验统计量, 其定义公式为:

p为多元线性回归方程中的解释变量的个数。F服从 (p, n-p-1) 个自由度的F分布。

3 实际模型实验

3.1 相关性分析

首先分析GDP、市民收入与商品住宅价格之间的相关性。目的是观察GDP、市民收入与商品住宅之间相关性强度。

通过相关性分析得出商品住宅价格与GDP以及市民收入的相关系数分别为03.976、0.996, 皆为高度相关, 所以GDP与市民收入为影响商品住宅价格的主要影响因子。

3.2 模型建立

下面开始建立模型。根据已知数据, 用Matlab分别做出GDP、市民收入与商品住宅价格的关系拟合图, 并求得拟合曲线方程。

经过以上曲线拟合我们得出:商品住宅价格与GDP为二次函数关系, 与市民收入为一次函数关系。通过房价与GDP、市民收入之间的函数关系, 我们开始建立多元回归模型方程如下。

设商品住宅价格y与GDP为x1、市民收入x2满足如下关系:

输入数据, 利用SPSS计算出回归模型方程中的参数β0、β1、β2、β3得出方程为:

3.3 模型检测与评估

根据已知武汉商品住宅数据对模型进行检测, 检测结果如下表:

通过上表可以看出检验结果误差较小, 最大误差值为286.6150, 最小误差值为6.6280, 平均误差值为142.1266。所求得模型可以应用于实际预测之中去。

4 小结

本文所得多元线性回归模型基本能够在误差要求范围内预测3年内商品住宅价格。模型稳定性较好。对房地产市场有影响的因子很多, 本文只寻找出两种相关性较高的因子, 但房地产市场会受到一些突发性事件影响世界经济危机、国家政策调控等, 而次模型还不具备对突发性影响的应对机制, 这有待进一步研究。

摘要:随着我国住房制度的商品化改革, 我国住宅产业蓬勃发展, 逐渐成为影响国计民生的重要产业之一。本文的主要目的是挖掘武汉商品住宅价格变化数据、市民工资收入和GDP数据间的关系, 对商品住宅价格的影响因子进行全面的剖析, 运用相关性算法得出各影响因子所占权重, 通过多元线性回归模型来预测商品住宅价格走势。

关键词:商品住宅价格,多元线性回归,预测模型

参考文献

[1]张红, 李文诞.北京商品住宅价格变动实证分析[J].中国房地产金融, 2001 (3) .

[2]周京奎.房地产价格波动与投机行为[J].当代经济科学, 2005 (7) .

[3]Geoffrey Meen, Mark Andrew.Modeling Regional House Prices:A Review of the Literature by The Centre for Spatial and Real Estate Economics[D].Department of Economics, The University of Reading, 1998.

[4]Stuart A Gabriel, Joe P.Mattey'William L.Wascher.House Price Differentialsand Dynamics Evidence from the Los Angeles and San Francisco Metropolitan Areas[J].Real Estate Economic, 2000.

[5]刘大海, 李宁, 晁阳.SPSS15.0统计分析从入门到精通[M].清华大学出版社, 2008:151-211.

多元回归预测 篇2

01.8852-1.1024-3.08272.14772.

2152

模型计算值相对误差%模型计算值

1.111.19741.27981.36791.46211.5628(预测值)

01.8538-0.77345-2.85251.87111.09

1.111.19701.28401.37101.45801.5450(预测值)

出的两个例子,用灰色理论的GM(1,1)模型对数据的预测精度较一元线性回归都要稍高一些,这主要是由于灰色理论的GM(1,1)模型所得到的白化方程是一种指数形式的表达式,对数据变化的适应性更好一些。

4结束语

灰色系统理论把客观对象视为一个灰色的物质系统,在研究系统的变化规律时,通过抓住系统的表征信息,利用灰数生成,灰色建模的信息加工手段,研究系统内部因素间的变化规律,利用得到的灰色模型,来预测

[4-6]

系统未来的发展,灰色预测在很多领域都有应用。

上面的两个例子表明,对基本符合线性关系的数据,采用灰色理论的GM(1,1)模型较一元线性回归的预测精度要高。用灰色理论的GM(1,1)模型进行建模时,并不直接采用已知的数据,而是通过对已知数据的再加工、即对灰数生成的数据进行处理来挖掘数据之间的内在联系,型,。(模型可以仅需。对本文所举的情况下应用的特例,从例子的结果看出:灰色建模和灰色预测在一些特定的情况下,是一种较一元线性回归预测精度更好的实用预测方法。参考文献:

[1]罗佑新.灰色系统理论及其在机械工程中的应用

[M].长沙:国防科技大学出版社,.

[2]陈家鼎,刘婉如,汪仁官.概率统计讲义[M].北京:

高等教育出版社,1983.

[3]王羽,麻文炎,侯磊.发动机缸壁的耐磨寿命及可

靠性的研究[J].汽车技术,2000,23(8):24226.

图2某产品压力与转速的关系预测模型

[4]张雅君,刘全胜.城市需水量灰色预测的探讨[J].

(3)结果分析

从上面两个例子可以看出,由于例子的数据分布关系基本接近线性关系,所以不论是一元线性回归还是灰色理论的GM(1,1)模型所得到的方程,都能很好地反映数据之间的变化关系,按方程得到的计算值与实际值之间的误差都不大。从相对误差大小比较的角度,对给

中国给水排水,,18(3):28230.

[5]王有良,唐跃刚.曲线拟合与GM(1,1)模型沉降预测及相

关性分析[J].测绘科学,2008,33(3):13215.

[6]李延吉.基于灰色GM(1,1)模型预测固废气化焚烧污染

物排放[J].华东电力,2008,36(4):10212.

ComparingforGreyForecastandForecastofOneElementLinearRegression

LIUXiao2xu

(SchoolofMechanicalEngineering,SichuanUniversityofScience&Engineering,Zigong643000,China)

Abstract:Basedontheintroducingthebasicmethodsofgreyforecastandforecastofoneelementlinearregression,twoexamplesareusedtocomparetheaccuracyofforecastvaluefortwomethods.TheresultsshowthatthemodelGM(1,1)ofgreyforecastisbetterthanoneelementlinearregressioninaccuracyofforecastvaluefortwogivenexamples.

多元线性回归分析实例分析 篇3

关键词:MINITAB软件 多元线性回归 显著性 实例分析

中图分类号:O212 文献标识码:A 文章编号:1672-3791(2014)10(b)-0022-02

回归分析是数据分析中使用很多的一种方法。回归分析是定量的给出变量间的变化规律,它不仅提供变量间的回归方程,而且可以判断所建立回归方程的有效性。在方程有效性的前提下,可以用方程做预测和控制,并了解预测和控制的精度。多元回归分析预测法,是指通过对两个或两个以上的自变量与一个因变量的相关分析,建立预测模型进行预测的方法。当自变量与因变量之间存在线性关系时,称为多元线性回归分析。

MINITAB软件是现代质量管理统计的领导者,全球六西格玛实施的共同语言,它以无可比拟的强大功能和简易的可视化操作获得了广大质量学者和统计专家的青睐。MINITAB软件是为质量改善、教育和研究应用领域提供统计软件和服务,是质量管理和六西格玛实施软件工具,更是持续质量改进的良好工具软件。

1 多元线性回归分析的一般模型

多元线性回归分析的一般模型为:设是个自变量(解释变量),是因变量,多元线性回归模型的理论假设是

其中,是个未知参数,称为回归常数,称为回归系数,为随机误差。

2 MINITAB软件建立模型

下面通过一个实例来详细讲解,如何运用MINITAB软件进行多元线性回归。现抽取20个家庭调查资料的部分变量,数据见表1,试对父母身高与儿子身高进行回归分析。

使用MINITAB软件,输入表1中数据,选择指令“统计>回归>回归”,在出现界面输入相应的变量名;打开“图形”窗,选择“四合一”及在“残差与变量”中填入各自变量名称;打开“存储”窗,选择“残差”、“标准化残差”及“拟合值”,点击“确定”后,得到输出结果。

MINITAB输出结果:

回归方程:

儿子身高=-23.7+0.303父亲身高+0.880母亲身高+0.0593锻炼次数

S=1.11974 R-sq=96.33% R-sq(调整)=95.65%

回归方程拟合出来以后,我们要解决以下几个问题:(1)给出方程显著性检验,从总体上判定回归方程有效与否。(2)给出方程总效果好坏的度量。(3)在回归方程效果显著时,对各个回归系数进行显著性检验,将效应不显著的自变量删除,以优化模型,这点在多元回归中尤为重要。(4)残差诊断,检验数据是否符合回归的基本假定,检验整个回归模型与数据拟合的是否很好,可否进一步改进回归方程来优化现有模型。

3 MINITAB输出结果分析

如何判断整个回归方程是否有意义?就要进行回归方程显著性检验,也就是要检验下列问题:H0:模型无意义,H1模型有意义。本例(表3)ANOVA表中P =0<0.05,所以拒绝H0:模型无意义,接受H1模型有意义。说明在显著性水平a=0.05下,线性回归方程总效果是显著的。

如果实际观测值与拟合出来的回归线很接近,就说明回归线与数据拟合的很好,就可以说回归方程的总效果很好。(表2)我们通常用Rsq、Rsq(adj)、S作为回归方程总效果的度量,以此来比较几种回归方程效果的好坏。Rsq是回归平方和占离差平方和的比率,其数值越接近1代表模型拟合的越好。当然Rsq并不是回归模型拟合效果的最好度量指标,因为当多一个自变量加入模型时,不管这个自变量是否显著,回归平方和就会增大,Rsq也会增大,这样就看不出新增加的自变量是否有意义,这点在多元回归中更为明显。因此我们用Rsq(adj)去修正Rsq,以考虑总项数给模型带来的影响。Rsq(adj)≤Rsq两者数值越接近越好,另一个指标是残差标准差,它是从观察值与拟合回归线的平均偏离程度来度量的,也是回归模型中标准差σ的估计值。对于几个不同的回归方程的效果加以比较时,S是个最重要的指标,那个S最小,哪个回归方程就最小。

从本例输出结果看Rsq96.33%,Rsq(adj)=95.65%来看,两者很接近,S=1.11974比较小,模型还可以。

回归方程显著时,做回归系数显著性检验,一般假设H0:β=0,H1:β≠0,若P<0.05,则回归系数不为零,说明系数对应的自变量是显著的。当只有一个自变量时,回归方程显著性检验与回归系数检验是等价的,但是当自变量不止一个时,回归总效果显著不能排除某几个变量是无意义的。我们进行回归方程系数检验的目的,就是要找出是否有“滥竽充数”的自变量,把这些多余的自变量从方程中删除掉,以修正现有模型。

从本例输出结果看到三个自变量P值都小于0.05,故三个都为显著因子。

模型中,X1系数0.303表示:如果父亲比同一代人的平均身高多1cm,那么他的儿子将比儿子那一代人的平均身高多出0.303 cm;X2的系数解释也是如此;X3的系数表示参加体育锻炼的次数和身高之间存在正相关;常数项一般没有与它相对应的实际意义上的解释。

参考文献

[1]张海燕.基于多元线性回归模型的四川农村居民收入增长分析[J].统计观察,2010(13):88-90.

[2]孙雪飞.回归分析在房地产销售中的应用[J].科技咨询导报,2007(26):168-169.

多元回归预测 篇4

近年来,随着电力系统规模的不断扩大,电力运行过程中安全事故时有发生[1],人身事故也是屡禁不止。以南方某电网公司为例,2003~2012年共发生74起人身伤亡事故。为保障从业人员人身安全,国内外学者对人身安全理论进行了广泛的研究。文献[2,3,4,5]指出事故的原因分为直接原因和间接原因。文献[6,7]提出了安全心理学的概念。文献[8]提出安全行为科学,通过对不安全行为的分析,揭示了不安全行为产生的原因。文献[9]又介绍了在核电站紧急任务时,基于现有性能影响因素分类方法,性能影响因素的选择在人身可靠性分析过程中的使用。

但这些方法大都是定性分析,还没有达到定量分析的高度,难以定量评估电网运行的风险、作业的风险等。文献[10]迈出了从定性分析到定量分析的重要一步,它指出定性和定量数据不能被分离研究。文献[11]提出量化评估是根据人的失误在事故风险中所扮演的角色和贡献来评定的,其评估过程使用了量化的概率风险评估,并且考虑了风险评估的范围和可靠性。文献[12]提出改进PES法评估供电局作业风险;文献[13]运用调查统计方法研究电力企业生产事故人因差错及其心理因素;文献[14]针对电力企业生产中的人因失误及其影响因素进行了广泛地实地调查,并对问卷数据进行了统计分析,进一步认识了电力企业生产中人因失误的基本特点;文献[15]用专家调查分析法辨识供电企业作业过程中存在的风险,用作业条件危险性评价法即LEC风险评估法对作业安全风险辨识库中的所有风险作出评价,建立可量化的评估标准。但文献[12,13,14,15]中方法需用专家或评估人员经验,具有一定主观性。

多元线性回归方法用来衡量多个因素对响应变量的影响,被成功地应用到负荷预测[16]、负荷模型扩展[17]等多个领域。本文对造成人身安全事故的原因进行综合分析,将多元线性回归法引入到供电作业人身安全危害量化预测,并通过实例分析验证本文方法的有效性和准确性。该方法循环利用最近供电作业人身事故历史数据进行预测,及时跟踪供电企业生产力水平和工作人员状况,最大限度保证线性回归模型优化参数符合供电企业的实际情况。

1 5M法人身安全影响因素辨识

电力安全生产是由相互作用和相互依赖的若干组成部分结合而成的具有特定功能的有机整体。电力生产结构的系统性,决定了事故引发因素的系统性[13,18]。因此,要想预防事故、消除事故,必须从引发事故的系统结构出发,进行综合性的研究和分析。借鉴安全行为学、心理学和事故致因理论,本文按照5M法分析供电作业过程中影响人身安全的各种因素,即影响人身安全风险的因素包括:人员(Man)、设备(Machine)、工具(Material)、方法(Management)和环境(Medium)共5个方面因素,各有n1=9,n2=3,n3=2,n4=11,n5=3个子因素,共有Na=n1+n2+n3+n4+n5=28个影响子因素,如表1所示。这28个影响子因素共同构成一个Na维随机向量,标记为X1,X2,…,XNa。

事故现象的发生与其原因存在着必然的因果关系,因果关系表现为继承性[5]。造成事故的直接原因称为一次原因,是在时间上最接近事故发生的原因,它包括各种人因与物因;造成事故直接原因的原因称为二次原因,包括从业人员技术、生理和心理状况以及受教育程度;造成间接原因的更深远原因称为基础原因,即管理和社会历史层面产生的原因。表1中供电作业过程中影响人身安全风险的五方面因素可以进行相应分类:人员因素中X1~X8属于二次原因;设备和环境因素是物因,属于一次原因;人员因素中X9、工具因素和方法因素属于基础原因。在特殊情况下,一些因素归类可能发生变化。例如,当无法选择时,X15~X17就可归类到一次原因。一次原因中的人因是事物的表象,其表现千差万别,不可能期望直接跟踪管理作业人员的每个行为。但可以通过一次原因辨识二次原因和基础原因各个因素之间的相关性。

2 供电作业风险致因因素间的相关性分析

如果一种人身危害影响因素依赖于另一种因素,进行人身危害后果多元线性回归计算就会出现“多重共线性”现象。下面通过计算不同影响因素Xj和Xk(j≠k)之间的协方差Cov(Xj,Xk)和相关系数ρ(Xj,Xk)判断两者之间相关程度,如式(1)和式(2)所示:

式中,E(Xj)和E(Xk)分别是Xj和Xk的期望,D(Xj)和D(Xk)分别是Xj和Xk的方差。

采用南方某电网公司2003~2013年64次供电作业人身事故数据中的前59个数据统计计算各影响因素之间的相关系数。为方便比较回归系数,每个因素的59个历史数据按照平均值和标准方差进行标准化,标准化公式如下:

式中,X'i标准化后的值,为影响因素Xi的均值。

由于相关生产事故通报中没有提供部分影响因素信息,故仅能统计28个影响因素中的21个影响因素之间的相关性。按照4.1节方法删除离群数据后,计算这21个影响因素之间的相关性,结果如表2所示,表中第1列、第1行中数字为变量X的下标。

由于数据的限制,本节根据以下方法判断可能相互独立的随机变量。根据相关系数的性质有:若两随机变量独立,则两者相关系数为0;若|ρ(Xj,Xk)|<0.02,认为相关系数接近0,那么,Xj和Xk可能相互独立。由表2可知,共有11对因素间可能是相互独立的,即(1,8)、(1,28)、(2,25)、(8,15)、(8,21)、(9,23)、(12,20)、(12,23)、(18,20)、(21,23)和(24,28)。

如果|ρ(Xj,Xk)|>0.7说明因素j和k之间强相关。由表2可知,技能X1和人员年龄X2之间相关性达0.6;工器具配置X13和个人防护用品配置X14相关系数达0.72;作业性质X18和作业指导依据X23相关系数达0.71,说明这3对因素间具有较强的相关性。

人身安全影响因素相关性计算完后,在强相关性的两个因素之间仅保留一个对人身安全风险评估影响更为显著的因素。仍然采用前述64次供电作业人身事故数据中的前59个数据统计计算人身危害后果Y和上述21个影响因素之间的相关性,结果见表3。

由表3可知,与工器具配置X13相比,个人防护用品配置X14与Y的相关系数绝对值更大,对供电作业人身事故的影响更大,保留该因素;与作业性质X18相比,作业指导依据X23与Y的相关系数绝对值更大,对供电作业人身事故的影响更大,保留该因素。剩余19个因素与人身危害后果具有一定线性相关性。

3 多元线性回归法预测人身事故危害

3.1 多元线性回归模型

此处采用多元线性回归模型[19],建立人身危害后果Y与人身危害因素X之间的随机函数关系Y=f(X)。本文根据人身事故危害情况给出相应单人人身危害后果Y分值如下:死亡为100分、重伤为50分、轻伤为15分、无人身事故为0分。

NF次历史事故人身危害后果Y组成列向量Y,NF次事故人身危害因素X1,…,XNa用列向量表示X1,…,XNa。多元线性回归的原理如下:

Y的随机性包含在随机向量ε里。假设ε的NF个分量都满足正态性、独立性和方差齐性,期均值为0、方差为σ2。回归系数β的最小二乘估计可用下式表示:

确定了就可以得到样本回归方程:

σ2的无偏估计为:

对于当前作业对应的自变量添上数字1后构成Na+1维行向量,代入回归方程可得到响应变量的预测点估计值:

对应水平为1-α的置信区间的两个端点则为:

NF次历史事故数据中可能存在离群数据。当第i个人身危害后果真实值yi与回归值之间标准误差绝对值时,该数据被认为是离群数据[19],将其删除后重新回归计算。

由于5M法比较全面地考虑了供电作业人身危害因素,因素间存在一定的相关性,回归模型中回归变量的筛选方法采用后向剔除法[17]:首先将5M全部人身安全影响因素都引入函数;然后逐个剔除对因变量作用不显著的变量,本文算例中剔除对应回归系数为零的变量。

人身危害后果Y与人身危害因素X之间的线性显著性用F检验[19]。零假设为H0:β1=β2=…=βp=0。采用的统计量F服从F分布如式(10)。式中,回归平方和SSR和残差平方和SSE定义分别见式(11)和(12)。

对于给定的显著性水平α,若F≥F1-α(Na,NF-Na-1),拒绝假设H0,认为线性回归效果显著,可被采用;否则接受H0,认为线性回归效果不显著。

3.2 人身事故危害分级

根据文献[20]中规定的各级人身安全事故,对危害严重程度分为6级,如表4所示给出每级事故的危害分值区间。设一次供电作业中操作总人数为Nm,按照式(8)估计出该供电作业中某操作人员i的人身危害后果点估计值后,那么就可以按照式(13)确定一次供电作业的全部人身危害后果分值Y。根据预测出的Y值所在的危害分值区间就可以确定出该次作业人身事故危害级别。

4 算例分析

和相关性分析时一致,利用南方某电网公司2003~2013年64次供电作业人身事故数据中的前59个数据进行多元线性回归计算。除去第2节分析过的强相关因素X13和X18,剩余Na=19个影响因素进行多元线性回归计算。各线性回归系数均不为零,计算结果如表5所示。

根据回归系数大小可以权衡各因素对人身伤亡的影响程度,即确定了哪些因素是更重要的。回归系数绝对值大表示调整对应因素会对人身安全产生较大影响。由表5可见,技能、作业时长、工作情绪、负责人安全控制因数等因素对人身安全的影响较大。文[13]中给出了电力生产系统人因事故事故树,该事故树基本事件的结构重要度I排序为:人为触发因素I=管理因素I>机械设备因素I=物质因素I=生产环境因素I。对照表5可见,按照线性回归定量计算出的结果与文[13]结构重要度分析结果主体一致,但也有一定差异性。原因是结构重要度分析是假定各基本事件发生概率都相等的情况下分析各基本事件对顶上事件发生所产生的影响程度[21],是一种定性分析。这也说明了线性回归定量计算的优越性。

59个供电作业人身事故数据中有5个离群数据,将其删除后NF=54。若显著性水平。计算统计量F=2.02>F1-0.05(19,34),故拒绝假设H0,认为线性回归效果显著。

利用所建立的回归方程预测南方电网2003~2013年64次供电作业人身事故数据中的后5次作业,预测结果如表6所示。作业III和V中操作人数分别为8、2人,作业中各人对应的人身安全影响因素取值相同。按照预测出的作业人身危害值,作业I、II、IV会发生等效为1人死亡的人身事故,事故等级为“一般事故”;作业III会发生等效为7人死亡的人身事故,事故等级为“较大事故”;作业V会发生等效为2人死亡的人身事故,事故等级为“一般事故”。表6还列出了单人人身危害预测值97.5%置信区间。表6中实际值是该5次历史供电作业中实际发生的全部人身事故对应的人身危害后果值,实际上作业I、II、IV中各死亡1人,作业III中死亡4人、受重伤4人,作业V中死亡2人。可见,5次预测值比较接近实际值,本文所提的供电作业人身事故危害多元线性回归法可以较为准确地预测人身事故危害程度。

5 结束语

本文采用5M法确定供电作业中人身安全风险影响因素;然后,计算各个因素间的相关性,筛选出独立性较强的因素,并剔除对危害结果影响较小的因素。进一步,利用多元线性回归对供电作业单人人身危害值进行预测,预测作业中全部人身危害后果。最后,将该预测方法应用于实际供电作业中,验证其有效性和准确性。本文方法循环利用供电作业人身事故历史数据进行预测,保证预测的客观性。该方法可以及时地在作业前预测人身事故危害结果,为作业前供电作业人身安全风险评估与控制奠定了理论基础。

摘要:为了定量评估电网作业和运行的风险,提出了一种基于5M因素分析法和多元线性回归的供电作业人身事故危害预测方法。借鉴安全行为学、安全心理学和事故致因理论,首先将供电作业中影响人身安全的因素分成5个大类,即人、设备、材料、方法和环境。然后分析所有因素间的相关性,将相关性较强的影响因素中对人身事故危害程度弱的一方剔除,并采用南方某电网公司人身伤亡事故数据为例进行分析,删除了两个人身安全影响因素:工器具配置和作业性质。继而,采用多元线性回归法建立供电作业人身事故危害值与各人身安全影响因素间的关系,对供电作业人身事故危害值进行预测。最后,以南方该电网公司20032013年发生的64起供电作业事故验证所提方法的有效性和准确性。

华业行预测全国楼市逐步回归理性 篇5

现象:楼市告别两位数高增长,短期下跌难以避免,不会出现断崖式崩溃

7月28日,中国社会科学院财经战略研究院、中国社会科学院城市与竞争力研究中心发布的2014年《中国住房发展(中期)报告》显示,我国大中城市房价呈现由全线上涨到普遍微跌的主动调整态势,中国楼市告别两位数的高速增长期,正逐步回归理性。

日前,国家统计局发布的6月份70个大中城市房价数据显示,与5月相比,70个大中城市中,新建商品房价格下降的城市有55个,较上月大幅增加20个,城市数量达到2011年1月份以来最多。此外,二手住宅价格环比上涨的城市也降至7个,较上月大幅减少12个,其数量为自2012年2月以来最少。

“从价格下降的城市数量来看,70个大中城市中止涨及下降城市达到九成,大中城市房价已由全线上涨转向普遍微跌的局面。从价格下降的幅度来看,当前房价同比、环比变化情况已与2011年底楼市调整时期水平基本相当。”华业行机构市场研究部负责人说。

除了价格,成交量也在萎缩,库存仍在增加。上半年,我国商品住房销售面积为42487万平方米,同比下降了7.8%,销售额也同比下降9.2%。而待售面积则增至35917平方米,同比增加了25%。住宅施工面积也同比增长8.3%。

值得注意的是,楼市调整还只是开头。“从一二线城市看,2013年市场的疯狂上涨诱发大量新房集中上市,为消化结构性过剩与阶段性高供给,普通商品房价格将进入为期2—3年的调整期。尽管长期拐点尚未出现,但短期下跌难以避免。”中国社会科学院财经战略研究院博士邹琳华说。

华业行地产首席分析师分析,2014年,楼市变化的速度超过市场之前的预期。“从年初出现个别城市价格调整,到3—4月出现华东区域的调整,再到6月环比房价指数全面下调。市场已经出现加速调整。”他特别指出,一线城市也出现了下调,这意味着楼市调整从点到块,再到面,全面降温已经开始。

中国社会科学院城市与竞争力研究中心主任倪鹏飞分析,此次楼市调整是在宏观经济步入新常态下的调整,也是存量住房户均超过1套且住房保障有实质性进展下的调整,更是中央经济治理理念发生重大变化、在市场分化中的调整,这势必影响楼市的发展趋势及相关调控对策。

“尽管根据我国居民改善住房条件的动力,及人口流向拐点尚未出现的情况下,我国住房市场不会断崖式崩溃。”倪鹏飞说,“种种迹象表明楼市暴利时代已经终结。未来10年,中国房地产市场将进入低速增长阶段。”

原因:信贷政策收紧致需求有限,库存量短期迅速增加,保障房分流刚需并影响预期

在中国社会科学院财经战略研究院博士后杨慧看来,住房供求状况的调整是导致上半年各类城市主要指标下行的共同原因。

“住房需求受信贷政策收紧及预期观望的影响,增长有限;住房供给则受前期大量施工竣工面积住房陆续入市,以及销售低迷导致库存增加的双重作用,短期内不断增加。”杨慧分析,一线城市和热点二线城市主要指标下行,主要是由于三方面的原因。首先是去年的高基数,其次是信贷收紧导致大量刚需难以转变为实际需求,最后自住性住房及共有产权住房等保障性住房政策的建立完善,分流了大量商品住房市场的刚需并严重影响购房者进入观望期。其他二线城市和热点三线城市的楼市回调则主要是由于刚性需求在去年迅猛释放后难以为继,以及在限购限贷等楼市调控政策下,投资投机性需求被持续抑制。大量三、四线城市楼市萎靡主要是住房需求不足以消化高库存导致的供求失衡。

作为历史上首次出现的非政策因素导致的市场自发调整,本轮楼市调整不仅可能周期更长,还会对宏观经济造成一定程度的影响。倪鹏飞分析,宏观经济增长会受到房地产投资增

速放缓的影响,今年行业对GDP的贡献将降低0.7个百分点,对地方财政收入的影响也不容小觑。

更需要关注的是潜在的房地产金融风险。尽管房地产金融风险被业内多次提及,且商业银行也选择收缩房地产信贷,特别是个贷规模,但是从上半年住房信贷数据看,房地产开发贷款规模在银行信贷总规模的占比不降反升,保持着近十年来的少有的高水平。而且上半年,房地产贷款在房地产企业资金来源中的占比也是自2011年以来最高的。

“房地产信贷多项占比指标居高不下,投射出商业银行对房地产的依赖度有增加的趋势。银行40%的钱仍流向房地产业,银行业与房地产业多年来形成的利益捆绑关系更加固化、强化,商业银行‘去房地产化’的过程似乎还很遥远。”中国社会科学院财经战略研究院博士高广春说。

倪鹏飞认为,与美国不同,我国住房信贷首付比例较高,楼市风险主要存在于开发贷款环节。“我国房地产企业开发规模过大,战线又过长,资金成本又高,有可能出现资金链断裂的风险。像上半年住宅施工面积近44亿平方米,这其中很大原因就是资金跟不上导致不能如期交房,甚至会出现烂尾。那么这些在建住房就潜在了约15万亿元的信贷风险。”展望:顺应趋势引导市场理性回归,市场自发调整有利于稀释泡沫,地方政府不宜过多干预

对于有些地方限购松绑问题,华业行机构市场研究部负责人表示,松绑的效果可能有限,像沈阳等非热门城市,目前的库存量去化速度超过20个月,人口流入增量也在放缓,导致楼市上涨乏力。“除非中央政府放弃调结构努力,再次大规模降准降息,否则市场的趋势很难改变。”

倪鹏飞也认为,今年的楼市调整有利于消化2010年以来的过度库存,有利于稀释楼市泡沫。“市场的问题要交给市场解决,对于这次市场自发的调整,地方政府不宜过多干预。更不要刚开始调整就急于救市,要顺应趋势引导市场理性回归。”

华业行数据研究院负责预测,在下半年中央“微刺激”保障宏观经济稳中有进的大背景下,一线城市松绑限购的可能性不大,而其他二线城市和热点城市调整将延续全年。楼市调控则将继续关注中长期制度建设,“分类调控、区间调控、双向调控”成为楼市调控的思路。

“住房市场健康稳定发展需要一整套综合指标。住房价格不应成为市场稳定的唯一指标。”倪鹏飞说,今后楼市调控应侧重区间调控,综合房价、库存、投资等多元指标。“如果房价跌幅不超过30%,库存没有超过6至10个月,投资也没有大幅下滑,那么政府不要急于干预,还应采取中性的金融与财政政策。”

根据2014年《中国住房发展(中期)报告》,2015至2030年中国城市住房需求的总体走势将呈现“上升—平稳—下降”的“倒U型”特征。

多元回归预测 篇6

由中国电子商会(CECC)、中国电子技术标准化研究所(CESI)共同主办的“2011年(第七届)中国平板电视市场发展高层论坛”,近日在北京成功举办。本次论坛汇聚了彩电主管部门领导、业界专家、彩电产业链上下游企业高层,通过主题演讲、论坛高层对话等多种形式,结合现场微博互动交流,对全年彩电市场的焦点问题进行全面的分析与讨论。论坛上中国电子商会发布《2011年中国平板电视城市消费者需求状况及2012年预测报告》。报告预计:2012年中国平板电视市场消费环比增量将首次出现下滑;2012年平板电视的主要增长区域将锁定在三、四级市场;消费需求将回归彩电的本质特性——画质和声音效果;3D频道开播将加速3D智能电视规模放量增长。本次论坛结合更为新颖活跃微博互动、高端对话、产品游戏竞技等形式,调动现场气氛。论坛通过综合中国电子技术标准化研究所检测认证结果及中国电子商会权威调研数据,揭晓“2011-2012年中国平板电视十大精品”。

对于平板电视的画面清晰度和色彩表现上,技术上已经开始追求高的动态清晰度和对自然色彩的逼真还原。在这两方面,等离子电视仍然具备一定优势,长虹、松下等离子3D电视表现尤为出色。同时,在液晶电视领域,夏普也革命性的提出了四色技术,以及煌彩技术,都是为了更加逼真还原自然色。

中国电子商会副秘书长陆刃波表示,画面清晰度、色彩以及声音效果作为平板彩电最基本的特质,将主导彩电产品竞争,企业在各种功能噱头的浮华过后,终将回归彩电最根本性能的角逐。

多元回归预测 篇7

随着经济全球化和区域经济一体化发展, 物流作为具有广阔前景和增值功能的新兴服务业, 己成为拉动第三产业发展的稳定因素, 得到全世界的高度重视[1]。

区域物流是指区域内和区域间的物资流动, 是区域经济的重要组成部分, 在优化区域资源配置、促进区域产业结构升级和促进区域经济可持续发展等方面作用突出, 被喻为区域经济增长的“加速器”。区域物流与区域经济之间的关系已被国内外大量学者所证实[2]。区域物流需求预测有利于区域物流规划、资源合理配置, 也为政府制定物流产业发展政策提供了科学的决策依据。准确预测区域物流需求, 具有十分现实的意义。区域物流是在城市、城镇、农村等区域空间形态结构中, 通过物流基础设施所实现的物流有机集成, 具有经济地理空间的意义[3]。区域物流需求受到区域经济、产业结构和资源分布等多种因子影响, 是一种单因变量、多自变量系统, 具有高度的非线性、时变性, 样本数据有限, 难以用解析方法或确切的数学模型进行描述[4]。

本文将以茶陵县客货运周转量为预测对象, 运用多元线性回归方法建立茶陵县客货运周转量的未来预测模型。实证结果表明, 运用多元线性回归模型进行区域物流需求量预测, 获得较高的预测精度, 同时预测结果具有较高的实际应用价值, 将有效的支持茶陵县物流园区的规划。

2 基于多元线性回归的区域物流需求量预测模型的构建

2. 1 样本数据的收集

由于研究县域内物流需求的数据量大且复杂, 既包括总的客运量和货运量的需求量, 也包括影响其变化的各种因素的历年数据, 如历年国内生产总值、区域消费品零售总额等。为了能够保证回归模型的顺利建立, 必须对繁杂的数据进行分析和处理。

2. 2 影响区域物流需求量的的因素

物流量的需求的变化受到多方面因素的影响, 在研究过程中, 为了从众多因素中选择起决定作用的影响因素作为预测因子, 舍弃关系不大的因素, 需进行因素选择。在选择过程中从定性和定量两个角度进行考虑。定性方法一般基于常识和经验, 专家打分法是一种典型方法。定量选择是通过公式计算而进行的筛选, 通常计算相关系数, 选择出影响程度比较大的因子。

综合定量分析和定性分析的原则, 本文主要选择区域消费品零售总额、国内生产总值、人口、工农业总产值、相邻地区工农业总产值的平均值、固定资产投资额等六个因素作为研究县域物流需求量的影响因素。

2. 3 多元线性回归模型建立

在构建多元线性回归的物流量需求预测模型时, 根据前文提到的定性和定量的方法选取区域消费品零售总额、国内生产总值、人口、工农业总产值、相邻地区工农业总产值的平均值、固定资产投资等六个因素作为变量。设区域内客货运周转量 ( 即区域物流量) Y与影响因素X1, …, X6之间存在相关关系, 随机变量与一般变量X1, X2…X6的线性回顾模型为:Y = β0+ β1x1+ β2x2+ … + β6x6+ ε, 其中, βi ( i = 0, 1, 2, …, 6) 是未知参数, 称为回归系数, Y为被解释变量 ( 因变量) , ε ~ N ( 0, σ2) 是随机误差。

3 基于多元线性回归分析的区域物流需求预测的实例分析

本文是在株洲茶陵县湘赣物流园区规划的背景下, 按照前文提供的研究方法, 研究茶陵县物流需求量, 根据提供的方法, 计算出的结果, 和实际的物流量对比, 进行误差率分析。由于研究使用的数据为2001 - 2012 年, 数据的来源主要是茶陵县统计局统计公告公布的实时数据以及湖南省统计年鉴, 主要包括区域消费品零售总额、国内生产总值、人口、工农业总产值、相邻地区工农业总产值的平均值以及固定资产投资额等数据, 见表1。

根据表1 中的经济指标数据, 能够得出影响物流需求的量的因素 ( 区域消费品零售总额、国内生产总值、人口、工农业总产值、相邻地区工农业总产值的平均值以及固定资产投资额) , 根据其指标的关系设定线性回归模型为: Y = β0+ β1X1+ β2X2+ … + β6X6+ ε, 其中Y: 区域内物流量, X1: 区域消费品零售总额, X2: 国内生产总值, X3: 人口, X4: 工农业总产值, X5: 相邻地区工农业总产值的平均值, X6: 固定资产投资额, ε~ N ( 0, σ2) 是随机误差。

3. 1 估计参数

利用Eviews估计模型的参数, 通过Eviews软件分析, 即出现回归结果, 如图1。

根据图1 中的数据, 模型估计的结果为:

3. 2 模型检验

1拟合优度: 由表1 中数据可以得到: R2= 0. 999711, 修正的可决系数为2= 0. 999364, 这说明模型对样本的拟合很好。

2 F检验: 针对H0: β1= β2= β3= β4= β5= β6= 0, 给定显著性水平 α = 0. 05, 在F分布表中查出自由度为k - 1 = 5 和n- k = 12 的临界值F∞ ( 5, 12) = 3. 00。由表3. 1 中得到F =2883. 277, 由于F = 2883. 277 > F∞ ( 5, 12) = 3. 00, 应拒绝原假设, H0∶ β1= β2β = β3= β4= β5= β6= 0 说明回归方程显著, 即固定资产投资额、国内生产总值 ( 包括第一产业、第二产业、第三产业) 以及区域消费品零售总额等变量联合起来对“物流需求”有显著影响。

3多重共线性检验: 若某个回归系数的t检验通不过, 一种可能是因为这个系数相对应的自变量对的因变量影响不够显著, 第二种可能是因为他们之间存在共线的关系。要解决这个问题, 要么删除影响不够显著的自变量, 或者设法降低他们的共线的影响。

多重共线性是指在多元线性回归方程中, 自变量之间有较强的线性关系, 这种关系若超过了因变量与自变量的线性关系, 则回归模型的稳定性受到破坏, 回归系数估计不准确。需要指出的是, 在多元回归模型中, 多重共线性的难以避免的, 只要多重共线性不太严重就行了[6]。自变量间的相关系数表明, X1、X2、X4、X6之间存在较大的相关性, 具有较大的共线可能, 如图2 所示。

4 t检验: 分别针对: H0∶ βj= 0 ( k = 1, 2, 3, 4, 5, 6) , 给定显著性水平 α = 0. 05, 查t分布表得自由度为n - k = 12 临界值t∞ /2 ( n - k) = 2. 1788。由表2 中数据可得, 与 β1、β2、β3、β4、β5、β6对应的t统计量分别为2. 087022、11. 01164、0. 720268、- 9. 744312、- 0. 962875、1. 083215, 其绝对值只有 β2、β4大于t∞ /2 ( n - k) = 2. 1788, 这说明分别都应当拒绝: H0: β1= 0 ( j =24) , 也就是说, 当在其它解释变量不变的情况下, 解释变量国内生产总值 ( X2) , 工农业总产值 ( X4) 对被解释变量“物流需求量”Y有显著的影响。

检验结果表明, X1 ( 区域消费品零售总额) , X3 ( 人口) , X5 ( 相邻地区工农业总产值的平均值) , X6 ( 固定资产投资额) 这些因素对于Y的影响具有很大的偶然性, 所以将这4 个因素剔除。得出新的线性模型为:

从回归结果可以看出该模型的相关系数以及D. W. = 1.039403, F = 2266. 260 值, P值以及t检验值都符合经济意义检验、统计学检验、经济计量学检验及预测检验。

3. 3 预测结果分析

由多元线性回归模型得到未来的物流需求量结果如表2所示。

(单位:亿吨公里)

由预测的结果和实际的值相比较, 得出的预测值和实际值误差率不超过0. 1, 说明预测的结果和实际值之间的误差在可接受的范围内, 说明预测的结果有很显著的实际参考价值。

4 结论

进行区域物流的规划和决策必须以准确的区域物流需求预测为前提, 在一定程度上, 区域内物流需求预测的结果是否准确决定最终规划的成败, 因此, 区域物流需求预测的准确性和科学性显得特别重要。该研究通过使用Eviews, 介绍了多元线性回归在区域内物流需求量预测中的应用, 证实了研究中的所设指标更加科学、更加全面, 建立了线性规划模型, 对模型进行精确的检验, 指标和因变量之间的拟合程度达到了99% , 可以认为需求量的变化完全可以由该研究中的最终指标进行解释和预测。

摘要:区域物流需求预测是区域物流规划、物流资源合理配置过程的重要环节而区域经济是产生区域物流需求的决定性因素, 因此, 利用区域经济指标来预测区域物流需求具有较强的可行性, 同时能够促使区域物流产业与区域经济之间的协调发展。文中对茶陵县2001年至2012年的GDP、区域消费品零售总额、固定资产投资额等指标进行分析, 构建多元线性回归模型, 应用Eviews软件对茶陵县全部客货周转量进行预测, 通过预测值与实际值的比较, 说明线性回归模型的准确性、有效性, 预测区域内未来的物流需求量。

关键词:物流需求量预测,多元线性回归模型,Eviews软件

参考文献

[1]李莉, 张建华, 周海燕.物流产业发展与国民经济整体水平提升的相关性分析[J].中国机械工程, 2003, 5:884-857.

[2]张建升.区域物流发展差异及其影响因素研究[J].北京交通大学学报, 2011, 10, 3:48-53.

[3]徐青青, 缪立新.区域物流发展及研究综述[J].物流技术, 2006, 12, 4:1-3.

[4]唐伟鸿, 李文锋.基于时间序列的支持向量机在物流预测中的应用[J].物流科技, 2005, 28, 113:8-11.

[5]方庚明.基于多元线性回归的公路客运量发展预测模型[J].工程与建设, 2011, 2:164-166.

多元回归预测 篇8

在切削加工过程中, 影响工件表面粗糙度的因素很多, 刀具的几何参数、工件材料性质、切削用量、切削方式、切削液等因素对粗糙度有显著影响。但从目前的实证和试验研究中得出结论, 影响最大的因素还是切削用量。在实际加工过程中, 选择合理的切削用量对工件质量、刀具耐用度等都有显著影响。

合理的切削用量对工件表面粗糙度有很重要的影响, 在实际切削过程中, 需要通过可靠的数学模型来建立粗糙度和切削用量之间的关系, 以便使切削参数达到优化, 减少在切削过程中的调试次数。基于以上的分析本文采用试验和多元回归分析法来确定数学模型, 通过数学模型对粗糙度进行预测和控制。

1 试验准备

试验目的:通过切削加工试验研究, 测量不同切削参数组合所得的表面粗糙度, 以反映切削用量对表面粗糙度的影响规律。

试验前提:机床和刀具已确定情况下;在稳态条件下;在材料均匀一致条件下

试验方案:正交多元试验设计

加工方式:外圆车削、无切削液

1) 车床

试验车床为国产C5112单柱立式车床, 机床最大加工直径1250mm, 主轴最大转速200r/min, 总功率18kw。

2) 工件材料

试验选用牌号:ZCUAl10Fe3的铸造铜合金, 此材料具有高的力学性能, 耐磨性和耐腐蚀性能好, 可以焊接, 不易钎焊, 大型铸件自700℃空冷可以防止变脆。ZCu Al10Fe3铸造铜合金用于要求强度高、耐磨、耐蚀的重要铸件, 如轴套、螺母、蜗轮以及250℃以下工作的管配件[1]。

3) 刀具

试验采用牌号为YT15的硬质合金刀具, 其硬度 (HRA) ≥91, 切削速度比高速钢高4-7倍, 寿命长5-8倍, 常用于加工碳钢和合金钢。本试验设置的刀具参数为前角5°, 后角20°, 主偏角-3°, 副偏角15°。

2 正交多元试验设计

正交多元试验是一种研究多因素多水平的试验设计方法, 包括确定试验目的和试验指标, 选择因素和水平, 并且根据正交表对因素与水平进行排列组合, 其目的是减少试验次数, 寻求试验因素恰当的水平组合, 实现系统优化。本文选取粗糙度为试验指标, 以切削速度、进给量和切削深度为影响因素, 因此采用L9 (34) 正交表进行正交多项回归试验, 表1是粗糙度的正交试验设计方案。

3 多元回归预测模型的建立

切削过程中的三要素主要包括切削速度 (v) 、进给量 (f) 和切削深度 (ap) , 切削三要素对工件的表面粗糙度有显著影响, 在机床稳定、原材料均匀一致和刀具几何参数确定的情况下, 实际粗糙度和切削用量之间有一定的关系式[2]:

RZ-表面粗糙度;

c-决定于加工材料、切削条件的修正系数;

v-切削速度

f-进给量

ap-切削深度

b1, b2, b3-回归系数

由于公式 (1) [3]是非线性函数, 可通过两边同取对数, 将非线性函数转化为线性函数, 两边同取对数得:

令y=lg Rz, b0=lgc, x1=lgv, x2=lgf, x3=lgap, 则其对应的线性回归方程为:

这是一个多元线性方程, 即x1, x2, x3与y之间存在着一定的线性关系。

在生产调试阶段, 工人根据粗糙度试验设计方案以及被加工工件的材料性质、机床情况和个人经验, 调整了工艺参数, 并记录了相应工艺参数下的工件表面粗糙度数据, 其数据记录如表2所示:

依据表2对所有的参数同取对数, 将其转化为线性函数, 同取对数后结果如表3

对过程参数记录2, 使用Minitab软件做回归分析, 回归分析结果如表4

本文采用F检验法对回归方程作显著性检验, 查F分布表, 当α=0.01, F (3, 5) =12.06, 因17.72>12.06, 说明回归方程在显著性水平0.01上显著有效。进一步依据表5对回归系数作显著性检验, 检验结果如下:

从表5可以得出当α=0.01, 切削速度的F比值F0.90 (2, 2) =9.0, 当α=0.05, 进给量的F比值F0.95 (2, 2) =19.0, 所以进给量和切削速度分别在显著性水平0.05和0.01上显著有效, 且进给量对粗糙度的显著性更加显著。

依据表4, 所求出的线性回归方程系数为:b0=2.91, b1=-0.875, b2=1.20, b3=-0.097, 将系数带入公式1, 所得到的表面粗糙度与切削用量的关系式为:

4 结论

1) 从公式2可以看出, 进给量与粗糙度是正相关关系, 即随着进给量的增大, 粗糙度也会相应增大。切削速度与粗糙度具有负相关关系, 即切削速度增大, 工件表面粗糙度会相应降低。

2) 切削速度和进给量对工件表面粗糙度的影响显著, 并且进给量对粗糙度的影响大于切削速度对表面粗糙度的影响, 而切削深度对粗糙度的影响很小, 几乎可以忽略不计, 所以在相同条件下, 改变进给量对改善表面粗糙度要优于改变转速, 这对实际生产中切削用量的优化具有重要的指导意义。

3) 依据数据所得出的表面粗糙度与切削用量的关系式显著有效, 在生产过程中可依据公式2先设定进给量, 再通过公示计算出切削速度。从而减少调试次数, 提高生产效率。

摘要:工件表面粗糙度是指工件加工表面具有的微小间距和微小峰谷不平度, 它是衡量产品表面质量的一个关键因素。影响表面粗糙度的因素很多, 但其中最重要的影响因素是切削用量。本文以表面粗糙度为试验指标, 以切削用量为影响因素, 通过试验和多元回归分析法确定表面粗糙度的数学模型。

关键词:粗糙度,切削用量,多元回归分析法

参考文献

[1]http://www.baike.com/wiki/ZCuAl10Fe3.

[2]袁哲俊.金属切削实验[M].北京:机械工业出版社, 1988.

多元回归预测 篇9

相比于全社会交通运输的总量而言,在全国份额中,铁路旅客发送量和旅客周转量所占份额却呈现出持续下降的趋势;呈现持续增长趋势的因素包括,公路的旅客发送量与旅客周转量的绝对量和相对量。公路与铁路的旅客周转量与旅客发送量一同成为全国客运市场的主体,同时此两者间具有此消彼长的影响。

铁路旅客发送量的平均运距在300km以下占比51.6%,表明中短途旅客成为铁路旅客发送量的主要组成部分。近年来,铁路旅客发送量一方面受铁路运能不足的限制,另一方面公路运输对铁路中短途客运形成激烈的竞争,大中城市间及周边地区的中短途客流受高速公路网快速发展的影响十分明显。所以,加速城际铁路的建设,铁路在中短途客运市场中的竞争力才能得到大幅提高。

对于旅客周转量的分析、预测,有助于铁路运输部门的规划、决策的制定,对节省部门开支、控制成本、提高铁路运输效率都有极大意义,同时也对进一步改善我国居民出行现状有积极影响。

1 影响因素分析与预测方法选择

1.1 影响因素分析

分析铁路客运周转量的影响因素是做好预测工作的基础。根据客运系统的自身特点及相关文献总结,影响铁路旅客周转量主要有四个方面:国家经济运行情况、人民生活情况、人口总数及分布以及铁路运营情况。

(1)国家经济运行情况

国家经济运行情况直接影响居民出游。选择国内生产总值、人均国内生产总值两个直接反应国家经济运行情况的指标,同时选取城镇居民消费水平、农村居民消费水平两个反应居民消费水平的指标来衡量国家经济运行情况对铁路客运周转量所产生的影响。

(2)人民生活情况

人民生活的实际情况也决定了居民出游的数量以及相应的出行方式。选择城镇人均可支配收入、农村人均可支配收入两项指标。

(3)人口总数及分布

人口数量的变化一定程度对铁路客运周转量产生影响,不仅是人口总数,还包括人口的分布,城镇居民以及农村居民在选择出游次数、方式上都有一定的差异。选取城镇人口数、农村人口数以反映两者比例不同对铁路客运周转量影响程度。此外,普通高校在校学生总数也是铁路出行的主力军,普通高校在校学生包括研究生(硕士研究生、博士研究生)在校学生以及普通本科生、专科生在校学生。同时,国内旅游的人数也对铁路客运周转量产生一定影响。在人口总数与分布上共选取四个指标:城镇人口数、农村人口数、普通高校在校学生数、国内旅游人数。

(4)铁路运营情况

铁路部门的运营情况,例如运力、覆盖范围、车次多少等也对居民选择铁路出行产生一定影响,选取铁路营业里程、铁路机车拥有量、铁路客车拥有量三个指标反映铁路部门的运营情况。

1.2 预测方法选择

经分析并综合考虑多种影响因素,选取多元线性回归预测模型,此模型根据统计检验能够找出显著影响因素,通过结合二次指数平滑预测法,从而建立最优预测模型。

2 铁路旅客周转量多元线性回归一二次指数平滑预测模型

2.1 模型的建立

(1)符号说明(见表1)

(2)多元线性回归模型

根据影响因素分析,建立多元线性回归模型:

(3)多元线性回归-二次指数平滑预测模型

通过二次指数平滑预测,根据1998年~2002年各项自变量的真实值,预测2013年~2015年的值,将值传入式(1),得到2013年~2015年铁路旅客周转量预测值。

(4)多元线性回归模型求解

根据t检验结果,从t值最小的开始剔除,对模型进行改进,得到自变量t值均大于2.16,R2=0.99688,即样本回归方程的解释能力强,模型的拟合优度达到较高水平。得到拟合方程为:

2.2 多元线性回归模型检验

(1)参数显著性检验

由检验结果可以得出,各自变量的t检验值的绝对值均大于1,因此均大于在显著水平为0.05时的t分布临界值,拒绝原假设,表明国内各项变量对铁路旅客周转量的变动具有一定的显著影响。

(2)拟合优度检验

预测值与真实值如表2所示。

拟合方程的R2=0.99688,表明样本回归方程的解释能力为99.69%,各变量对外汇储备规模变动的解释能力很好,即模型的拟合优度较高。

(3)异方差检验

根据图1残差图可知,残差没有明显系统性变化,因此不存在异方差。

2.3 二次指数平滑预测模型求解

利用eviews软件,对各自变量2013年~2015年作出预测,结果如表3。

3 结论

3.1 预测结果

根据模型,预测出2012年、2013年、2014年、2015年的铁路旅客周转量分别为11382.19亿人公里、11546.93亿人公里、11636.27亿人公里、12149.19亿人公里。2012年铁路旅客周转量观测值为9812.33亿人公里,预测误差为15.99%。

3.2 参数分析

自变量人均国内生产总值、城镇人口数、国内旅游人数与铁路旅客周转量的变动是正相关关系,即其变动方向是同向的。人均国内生产总值反应了国家经济发展状况,是衡量各国人民生活水平的一个重要标准。人民生活水平决定了出行的可能性、频率、距离以及出行方式。生活水平越高,则出行的次数越多,选择铁路作为出行手段的次数也相应增加。城镇人口数的增加将导致出行需求的增加,同时选择铁路为出行工具的人数也相应增加。

随着人们生活水平不断提高,选择旅游的人越来越多,主要的交通方式中,铁路依然是人们有限选择的出行方式。尽管航空运输的价格下降以及私家车拥有率的提高会一定程度对人们选择铁路为出行手段产生负面影响,但总的来说,伴随国内旅游人数的增加,铁路旅客周转量也是增加的态势,但正面影响的程度并不算大。

自变量城镇居民消费水平、农村人口数与铁路旅客周转量变动之间呈负相关关系。城镇居民消费水平不断提升反应了城镇居民的生活质量不断提高。随着消费水平的提升,铁路本身所具有的低价优势丧失一定的吸引力,城镇居民可能选择航空这种相对快捷的方式或是汽车通过高速公路实现出行目的。我国近年来航空业的不断发展以及高速公路里程的不断攀升对铁路客运有着极大的冲击。

近年来,可以通过数据看到,伴随城市化进程的不断推进,农村人口数一直呈现下降的趋势。另一方面说明农村居民进入城市,收入不断提升的同时,出行的需求也增加了,这无疑使得铁路旅客周转量也相应增加。

参考文献

[1]王相平.铁路旅客运输量影响因素的灰色关联分析[J].铁路计算机应用,2013.22(10):13-16

[2]刘殿胜.铁路客运量分析探讨[J].中国铁路,2008(9):7-9

[3]客运段[EB/OL].百度百科.http://baike.baidu.com/view/3270748.htm,2012-09-04

[4]郑金子,苗建瑞,张君平.蚁群算法在铁路乘务运用计划编制中的应用研究[J].铁路计算机应用,2010,19(10):36-40

[5]文永军.旅行商问题的两种智能算法[D].西安:西安电子科技大学,2010

[6]王援媛,周成晨,倪少权.基于蚁群算法的客运专线乘务交路计划编制方法研究[J].铁路计算机应用,2009,18(7):11-14

[7]郎茂祥,傅选义,朱广宇.预测理论与方法[M].北京:清华大学出版社,2011:83

多元回归预测 篇10

随着城市化建设的推进, 城市人口和规模日益增大, 而城市污水的排放对城市周边河流与环境的影响将直接关系到城市的可持续发展潜力。如何有效科学准确地评价城市的污水排放情况, 对于城市的管网规划及道路、功能区的建设具有较强的指导意义。

1. 灰色关联分析

1.1 灰色关联分析的步骤:

(1) 确定比较数列和参考数列;

(2) 求关联系数及关联度

设为Y1 (k) ={y1 (1) , y1 (2) , …y1 (n) }参考数列 (又称母数列)

Xi (k) ={Xi (1) , Xi (2) , …Xi (n) } (i=1, 2, …, m) 为比较数列 (又称字数列)

有如下定义:Y1 (k) 与Xi (k) 的关联系数定义为

于是据此可求出Xi (k) 与对应X0 (k) 的关联系数:ξi={ξi (k) |k=1, 2, …, n}

(3) 关联度按大小排序

表明Xi与Y1最接近, 或对Y1的影响最大, X2次之, ……

2. 多元回归预测模型

设所研究的对象Y受到多个因素X1, X2, …..Xm的影响, 假定各个影响因素与Y的关系是线性的。则建立多元线性回归方程:

为影响因素的第i组观测值 (取x1的观测值恒等于1) ,

β=[β0, β1, ….βm]T为待估系数向量。

为了估计回归系数β0, β1, …., βm, 我们对变量进行了n次观察, 得到n组观察数据 (Yi, Xi1, Xi2, …, Xim) , i=1, …n, 一般要求n>m。于是回归关系可写为

其中ε1, ε2, …., εm独立同分布, 都满足E (ε) =0, Var (ε) =σ2

我们要采用矩阵形式来表示上式。令

一般情况下我们假定X列满秩, 即rk (X) =m+1。关于误差的假定与 (2.4) 对应为

(2.7) , (2.8) 与 (2.9) 合在一起称为多元线性模型。

下面求模型参数的向量的最小二乘估计 (Least Square Estimate, LSE) 。残差平方和S (β) 为

最小二乘法则即要求使使

运用矩阵微商得:

它称为正规方程式。若X列满秩, 则为方阵, 其逆矩阵存在, 左乘 (2.11) 两边得的最小二乘解

3. 灰色—回归组合模型应用

根据调查, 影响景德镇市污水的排放量主要有以下几个因素: (1) 景德镇市人口状况; (2) 工业产值: (3) 管网的普及率。

3.1 灰色关联分析

比较数列为景德镇市人口数, 为工业产值, 为景德镇市管网普及率。

把数据分别代入数列为:

由于上述列都不在同一个数量级上, 我们可以将这些数列进行数值变换即初值化, 初值化后的数列为:

根据式 (4.1) 可求得Δ03 (5) =||y (5) -x3 (5) =1.286最大, Δ0i (min) =0

(2) 灰关联差异信息空间ΔGR

(3) 灰关联系数r (y (k) , xi (k) 表达式

(4) 灰关联序列r (y, X1) >r (y, X2) >r (y, X3)

3.2 多元线性回归模型的建立

(1) 与景德镇市人口建立的回归方程

以景德镇市2000年—2004年的人口统计数据作为基础数据, 建立一元一次方程;Y=β0+β1X

根据计算得到方程为:y=0.0633x-7.941

其中y——污水排放量, x——景德镇市人口

(2) 与工业产值建立的回归方程

同样以2000年—2004年的工业产值统计数据做基础数据建立方程为:Y=β0+β1X

根据就算得到方程为:y=0.0023x+0.925

(3) 与城市人口和工业产值建立的方程

回归方程模型:Y=β0+β1X1+β2X2。根据式^β= (XTX) -1XTY计算得到。计算可由计量经济学里的Eviews得到。

因此建立的回归方程为:Y=0.0163X1+0.0008X2-4.5011

3.3 自变量的灰预测

(1) 对人口数的预测

通过Excel软件将年份作为自变量, 城市人口作为因变量得到线性拟合方程为:Y=1.633X-3122.196

(2) 对工业产值的预测

通过Excel软件将年份作为自变量, 工业产值作为因变量得到线性拟合方程:Y=1.0017X3-6000.3X2+1.0×107X-8×109

B、数据结果分析

将人口数与工业产值的预测值代人Y=0.0163X1+0.0008X2-4.5011, 预测景德镇市2005年-2007年的污水排放量, 其中2005, 2006是用来检验预测精度的。

由上表可以看出相对误差只有1.69%, 4.44%, 说明预测结果较为理想。

可以根据以上方法对景德镇市作污水排放量的预测。

四、结论

由以上的分析和预测结果, 我们可以利用GM (1, 1) 模型和灰色关联分析对景德镇市的水质进行分析和预测, 对于未来设计建设生态友好型的绿色水利工程, 提供系统的基础数据和可靠的理论依据。

摘要:针对景德镇市污水排放情况, 运用多元线性回归模型和灰色关联分析模型对其多年污水排放情况进行了现状分析及趋势预测。结果表明:运用灰色关联分析模型, 能更科学准确地评价景德镇市水质污染情况以及影响较为明显的因子。

关键词:多元线性回归模型,灰色关联分析模型,污水排放预测

参考文献

[1]庞皓, 李南成.计量经济学.西南财经大学出版社, 2002:

[2]马文敏, 唐莲.灰色系统理论在城市需水量预测中的应用.西北资源与水工程, 2001, 12 (1) , 14-16;

[3]袁嘉祖.灰色系统理论及应用[M]科学出版社1991;

[4]邓聚龙.灰色系统论基本方法[M].武汉:华中理工大学出版社1987

[5]王建根, 胡万宝.非线性直接灰色模型[J].系统工程, 1995.13 (6) :55-57

[6]高廷耀等编.水污染控制工程.高等教育出版社.2002

基于回归分析预测生产用电量 篇11

回归分析是统计学中重要的一种数据统计分析思想。它是研究变量之间相互关系的具体形式,为估算和预测提供一个重要的方法。首先对具有相关关系的变量之间的数量联系进行测定,确定一个相关的数学表达式,再根据这个数学方程式可以从已知量来推测未知量。

1 问题的提出

表1为某选厂处理量及用电量情况统计表,根据表1中几组关于选厂处理量x及用电量y的关系数据,确定出两者的关系。

表1 某选厂处理量及用电量情况统计表

2 问题的分析

选厂的用电量是受很多的因素所决定的,我们在这里进行分析,假设主要影响因素为处理量,从而减少在计算以及统计上的困难,但是这也在很大的程度上减少了结果的实际意义。

针对以上所给的两个变量之间的关系,作出回归分析及借助重要的电子数学软件,从而来确定这两个变量之间的关系,并计算出两者之间的回归方程,再对方程的可信度进行检验。

3 问题的解决

3.1 建立模型

运用回归分析统计方法,根据表1中数据初步作出处理量x及用电量y之间的数据散点图,如图1,并在散点图中找出关于二者之间的初步关系W。

图1 用电量与处理量关系散点图

从散点图中可以看出,这11个点分布在一条直线l的附近,从而可以初步认为y和x的关系基本上是线性的,而这些点与直线的偏离是由其他一切随机因素影响而成的,因此可以假设表1中的数据有以下的关系式W:

yi=β1x+β0+ε

(1)

其中β1x+β0表示y随x的变化而线性变化的部分,ε是一切随机因素影响的总和,有时也称随机误差,它是不可观测其值得随机变量,并假定其数学期望E(ε)=0,方差Var(ε)=δ2。

并且ε服从正态分布N(0,δ2)。X可以是随机变量也可以是一般变量,而在以下的讨论中,都假定处理量X是一个随机变量,但其值是可以观测的,其数学期望是处理量X的线性函数:

E(y)=β1x+β0

(2)

这既是用电量Y与处理量X的相关关系式。

对表1的几组数据观测值,由公式(1)可得

yt=βixt+β0+εt,i=1,2,…,11

(3)

各εt是相互独立:E(εt)=0,方差Var(εt)=δ2,i=1,2,3,…,11,并且将式(3)称为一元线性回归模型。

3.2 模型求解

建立一元线性模型(3)后的首要任务就是根据所给数据求出β1、β0,从而确定两个变量之间的关系W。如图1所示,坐标平面上与所列点“接近”的直线可以有很多条,那么究竟哪一条称得上“适当”呢?从不同的角度出发,可以有很多种考虑。在回归分析中,为人们普遍采用的准则是,在每个xi对应的指标实测值yi与由(2)式确定的指标理论值的离差平方和

(4)

为最小的条件下,确定待定系数β1、β0,这就是最小二乘准则。

由上面的分析可知,选择一条适当直线的依据是最小二乘准则,这样便把寻找适当直线的问题转化为使Q(β1、β0)达到最小条件下求出β1和β0的问题。

因为Q(β1、β0)是β1和β0的非负二元函数,所以最小值无疑是存在的。由微分学中的极值原理可知,待定系数β1和β0就是所谓正规方程组的解:

(5)

需要说明的是,方程组(5)的解对于不同的样本是不同的。所以,实际上由于确定的β1和β0是给定样本下的估计值。这种在最小二乘准则下产生的估计称为最小二乘估计。

解正规方程组(5)得:

(6)

即处理量x及用电量y之间的线性关系方程式为:

y=42.74x+5.19

(7)

β1=42.74,说明处理量x每增加1万吨时,用电量就增加42.74万度,这表明处理量x及用电量y具有正的线性相关关系。

将这个回归方程的图像与散点图进行比较,并进行分析,画出二者的关系如图2。

图2 用电量与处理量线性回归图

可以从图2中看出表1中的11个数据都比较稳定的落在直线的附近,从而可以初步的认为模型(3)所确立而得到的回归方程是有意义的,但是还是要通过科学的检验方法来检验它的可信度。

3.3 模型检验

建立经验回归方程的目的在于揭示两个相关变量x与y之间的内在关系,然而对于任意样本的观测值(xi,yi)(i=1,2,…n)作出的散点图,即使一眼可以看出x与y之间根本不存在线性关系,也可以通过式(6)求出回归方程yt=βixt+β0,但此时的回归方程是毫无意义的,所以必须有一种方法去检验回归方程的可信度,在统计中称为回归显著性检验。在此我们采用相关系数r检验法来检验模型(3)的可信度。

(8)

将(8)式分解整理后,得

其中r就是相关系数,计算公式为:

将表1中数据代入,得到r=0.93;

很显然

0〉|r︱=0.93〈1

即为处理量x及用电量y之间存在着一定的线性关系且为高度正相关,因此,以上得出的关于处理量x及用电量Y的回归方程式y=42.74x+5.19是可信的并且可信度较高。

4 模型拟合效果

以上数据结果事实证明,处理量x及用电量y的回归方程式是可信的,接下来我们判断回归模型的拟合效果。

表2 处理量X及用电量Y的原始数据以及相应的残差数据

以纵坐标为残差,横坐标为月份,作出残差图来分析残差特性,如图3。

由图3可知,7月、10月、1月、4月的残差点比较大,需要确认在收集这几个数据时是否出现了人为的错误,如果数据收集有错误,就予以纠正,然后重新利用线性回归模型拟合数据;如果数据收集没有错误,则看看这几个月在生产过程中是否有特殊情况出现,寻找其他原因。

图3 用电时间(月)与用电量残差分析图

那么,如何刻画模型拟合的精度呢?

引入指数:

代入表2中数据得

R2=0.86

在含有一个解释变量的线性模型中,R2恰好等于相关系数r的平方,上面我们已经计算r=0.93,因此r2=0.932=0.86与R2相等。

R2取值越大,则残差平方和越小,即模型的拟合效果越好,说明我们建立的模型与实际吻合程度很高,同时也说明了我们用电量有86%是受处理量的变化影响的。

5 结语

本文主要针对实际问题运用了统计学中的回归分析的知识去解决,对于处理量X及用电量Y的关系能较为准确的作出表达式,这对实际有很大的应用;在生产过程中,采用一元线性回归方程不仅对用电量、其他生产材料消耗起到了估计和预测作用,而且也为我们提供了比较可靠的科学依据。尽管估计和预测的数据不是百分之百的准确,但对指导生产起到了积极的参考作用。

多元回归预测 篇12

多元线性回归模型是由一组独立解释变量值预测一个或多个被解释变量的一种统计工具。它也用于评估解释变量对被解释变量的影响。例如, 产出往往受各种投入要素———资本、劳动、技术等的影响;销售额往往受价格和公司对广告费的投入的影响, 等等。多元线性回归模型的应用非常广泛, 本文将此模型应用于大学生月起薪的预测, 得到了较好的结果, 对大学生就业指导工作, 有一定的参考价值。

1多元线性回归模型[1]

1.1模型

假设讨论的多元线性回归模型为k元, 即解释变量为k个, 多元线性回归模型的一般表达式为:Y=+ε其中:

假设:1) εiN (0, σ2) , i=1, 2, …, n即所有的随机误差项服从正态分布, 此为正态分布假设。

2) Cov (εi, εj) =0, ∀ij, i, j=1, 2, …, n:即不同随机误差项之间是不相关的, 此为不相关假设。

3) 所有的解释变量是确定性的, 因而是非随机的, 它和随机误差项ε不相关。

如果我们随机抽取了一个容量为n的样本, 其观测值为 (yi, x1i, x2i, …, xki) , 其中, i=1, 2, …, n, 则有:yi = β0 + β1 x1i + β2 x2i + … + βkxki + εi; i = 1, 2, …, n

1.2多元线性回归模型的预测功能

1.2.1 点预测

假设有观测值X0= (1, x01, x02, x03, …, x0k) , 那么得到被解释变量的一个点估计:y^0=x0β^

1.2.2 区间预测

(1) 总体均值经E (y0|X0) 的区间预测

如果取显著性水平为α, 则根据t分布和区间估计理论得到总体均值E (y0|X0) 的区间估计为:

(2) 总体个别值y0的区间预测

在显著性水平为α下, 根据t分布和区间估计理论得到总体个别值y0的区间估计为:y^0-tα/2 (n-k-1) s1+X0 (XX) -1X0y0y^0+tα/2 (n-k-1) s1+X0 (XX) -1X0

2大学生月起薪调查

毕业生就业的月起薪问题, 一直是毕业生、学校等各相关部门比较关心的问题。本文对青岛科技大学、青岛理工大学、青岛大学财务管理专业的部分同学做了调查, 目的是研究毕业生月起薪与求职费用、学校提供的信息程度、求职次数以及是否参加过就业讲座四个因素间的相关关系。为了避开其它因素对月起薪的影响, 在实际中挑选了一些其它条件比较接近的同学做调查。例如, 调查的同学都是一些成绩中等, 已经通过英语四级, 非学生党员的应届本科毕业生。他们都已经找到工作, 并且工作地点都在青岛。调查结果如表1。

小注:①求职费用X1:求职简历的制作, 招聘会门票, 通讯费用, 人情、礼品费用, 等。②信息程度X2:学校提供的信息程度是否充足。X2={0, 1, ③求职次数X3:参加过的面试次数。④是否参加过就业指导

3多元线性回归分析

设回归方程的具体形式为:Y=β0+β1X1+β2X2+β3X3+β4X4+ε, 其中βj表示解释变量对月起薪的边际影响。下面利用EXCEL软件对调查数据做多元回归分析[2]。

3.1相关性分析

在进行回归分析之前, 先做相关分析根据相关系数或相关指数的大小对变量进行筛选, 剔除不相关或者相关性小的变量, 然后再进行回归分析, 建立回归模型, 进行预测。所得的相关分析结果如表2。

从表2给出的相关系数可以看出, 求职月起薪、求职费用与信息程度有较强的相关性, 而求职次数、是否参加过就业指导与前三列的相关性并不是很大, 求职费用与信息程度的相关性也很小。剔除两个相关性很小的变量:求职次数与是否参加过就业指导后, 回归模型修正为:Y=β0+β1X1+β2X2+ε

3.2回归分析结果

3.3模型的检验

3.3.1 R2检验

表3中给出的R2=0.89761R¯2=0.888301都比较接近1, 说明X1、X2与Y的相关程度较高。

3.3.2 多元线性回归方程线性检验 (F检验)

表3中给出的F检验值为96.432 03远远大于F0.05 (2, 25-2-1) =2.56, 说明X1、X2与Y之间的回归效果非常显著。

3.3.3 参数显著性检验 (t检验)

表3给出了回归系数β^0β^1β^2的估计值及其标准误差、t检验值和回归系数估计区间的上下限等。由于各回归系数的t检验值分别为t0 =6.081 728, t1=10.929 04, t2=7.177 136都大于t0.05/2 (25-2-1) =2.073 9, 故拒绝原假设β0=0, β1=0和β2=0。可以断言求职费用和信息程度对月起薪有显著性影响。

3.3.4 DW检验

表2在相关性分析图中显示的解释性变量:求职费用和信息程度之间的相关性是很小的, 当所研究的数据是横断面数据时, 由于数据是同一时期的, 不存在相关性, 因此无须做J.Dwrbin和G.S.Watsm (DW) 检验。事实上, DW检验的结果为DW=2.44, 查表知, 两个变量是不相关的。

综合上述计算结果和检验结果, 可得如下的回归模型:

4 预测

建立线性回归模型的一个目的就是实现统计预测功能。现在利用该回归模型, 根据某个毕业生的求职费用和信息程度对他的月起薪进行点预测和区间预测。

现在假定有一个毕业生他的求职费用是1 300元, 他认为学校提供的求职信息是足够的, 即预测毕业生的解释变量矩阵为:X0=[1,2,3] , 则该毕业生的月起薪预测值为:

因标准误差S=136.264 5, 样本个数n=25, 解释变量的个数k=2, 则在显著性水平α=0.05下, 该毕业生起薪的预测区间为:

y^0-+tα2 (n-k-1) S=1544.138±

t0.025 (22) 136.264 5=1 544.138±282.599。

所以, 当求职费用为1 300元, 学校提供足够的就业信息时, 在显著性水平α=0.05的情况下毕业生月起薪在1 261.539 ~ 1 826.737元之间。

摘要:基于多元线性回归模型研究了求职费用、信息程度、求职次数、是否参加过就业指导对大学生月起薪的影响, 发现月起薪与求职费用、信息程度有较强的线性相关性, 得出了大学生月起薪与求职费用、信息程度的回归模型。利用此模型可以做月起薪的点预测和区间预测。

关键词:多元线性回归,月起薪,EXCEL,预测

参考文献

[1]方开泰.实用多元统计分析.上海:华东师范大学出版社, 1989

[2]郝艳芳, 李振宏, 李辉.Excel2003统计与分析.北京:人民邮电出版社, 2006:308~324

上一篇:新型高强支护技术下一篇:Ni镀层