线性回归分析

2024-10-11

线性回归分析(精选12篇)

线性回归分析 篇1

一、一元线性回归

回归分析的基本思想和方法以及“回归 (Regression) ”名称是由英国统计学家F.Galton (1822—1911年) 和他的作为现代统计学的奠基者之一的学生K.Pearson (1856—1936年) 提出的, 他们在研究父母身高与其子女身高的遗传问题时, 观察了1078对夫妇, 以每对夫妇的平均身高作为解释变量X, 取他们的一个成年儿子的身高作为被解释变量Y, 将结果在平面直角坐标系上绘成散点图, 发现趋势近乎一条直线。计算出的回归直线方程为Y^=33.73+0.516X。这种趋势及回归方程表明父母身高X每增加一个单位时, 其成年儿子的身高Y也平均增加0.516个单位。

一元线性回归简单地说, 是涉及一个自变量的回归分析, 主要功能是处理两个变量 (因变量与自变量) 之间的线性关系, 建立线性数学模型并进行评价预测。

二、一元线性回归的数学模型

各种经济变量之间的关系, 可以划分为两种类型。一种是变量之间有唯一确定的关系, 即函数关系。例如, X1, X2, (43) , Xn与Y之间的函数关系可以用隐函数形式表示为

其中, 最简单的形式为一元线性函数关系。例如, 当某种商品单价P固定不变, 这种商品的销售收入Y与销售商品数量X之间的关系为一元线性关系, 即Y=PX

经济变量之间的另一种关系, 为不完全确定的相关关系。例如, 家庭消费支出Y与家庭收入X之间的关系, 就是不完全确定的。虽然每个家庭的收入X必然会影响并且制约着这个家庭的消费支出Y, 但是消费支出Y还是要受到其他多种因数的影响。例如, 家庭人口、消费习惯、银行存款利息率、商品价格水平变化趋势等等。即使对于同一个家庭在每个月收入相同的条件下, 每月的消费支出也不会完全相同。这类变量之间不完全确定的关系可以表示为

三、关于普通最小二乘法——一元线性回归的求解

解得:

于是得到了符合最小二乘原则的参数估计量。

四、最小二乘估计β0和β1的性质

五、一元线性回归模型的应用

例:表1的资料是2003全国及各地区的供水情况, 给出了供水管道长度 (公里) 和全国供水总量 (万立方米) , 本文试着用一元回归分析方法, 根据供水管长度变化, 来分析全国供水总量的变化情况。分析结果如下:

1、下表反映的是一元线性回归模型拟合情况, 相关系数R为0.998, 决定系数为0.995, 而调整决定系数为0.995。可见, 模型拟合效果很理想。

2、左表为一元回归的方差分析表。

从表中可以看出离差平方和为2E+013, 残差平方和为1E+011, 而回归平方和为2.085E+013。回归方程的显著性检验中, 统计量为6130.953, 相应的置信水平为0.000, 远比常用的置信水平0.05要小, 因此可以认为方程是极显著的。

3、右表是回归方程系数以及对回归方程系数检验的结果, 系数显著性检验采用t检验。

回归方程的系数同时给出了标准化和未标准化的结果, 方程标准化后就没有2参数项了。未标准化回归方程的常数项为1486.858, 自变量系数为14.188。对回归方程系数的检验结果, 常数项检验对应的置信水平为0.893, 远比常用的0.05要大, 常数项不显著, 可以考虑去除常数项的回归方程;自变量系数检验对应的置信水平为0.000, 远比常用的置信水平0.05要小, 因此认为该系数是显著的, 不等于0。

4、图4为标准化残差的直方图, 用来显示残差的分布情况。

5、图5为正态分布图, 该图用以观察标准化残差的分布是否符合正态分布, 如果是, 则途中散点应该近似为一条直线, 且于对角线近似重叠。

总结:一元线性回归只引入一个自变量和因变量, 所以分析起来也比较简单。需要注意的是用来分析的自变量和因变量必须呈线性关系, 否则可能会导致错误的结果。在应用SPSS统计软件对一元回归分析的结果探讨时, 需要注意回归方程系数的检验, 分析回归方程中是否需要保留常数项。

摘要:一元线性回归模型是最简单的计量经济学模型。在模型中只有一个解释变量, 其参数估计方法也是最简单的。通过最简单模型的参数估计, 可以较清楚地参数估计方法的原理。同时对于理解各类研究中的参数取样也具有及其重要的意义。

关键词:一元线性回归,普通最小二乘法,一元线性回归,模型

参考文献

[1]李子奈:《计量经济学》, 高等教育出版社, 2000年。

[2]章文波、陈红艳:《实用数据统计分析及SPSS12.0应用》, 人民邮电出版社, 2006年2月。

[3]赵国庆:《计量经济学》, 中国人民大学出版社, 2001年。

[4]张建同:《以Excel和SPSS为工具的管理统计》, 清华大学出版社, 2005年9月。

线性回归分析 篇2

在Zeller平衡损失思想的`启发下,对线性回归模型提出了一种新的参数估计标准,得到了回归系数的广义平衡LS估计,并且在新的标准下提出并讨论了参数受线性约束和有界约束时的平衡LS估计和广义平衡LS估计.

作 者:柏超 罗汉 BAI Chao LUO Han 作者单位:柏超,BAI Chao(中南林业科技大学理学院,湖南,长沙,410004)

罗汉,LUO Han(湖南大学数学与计量经济学院,湖南,长沙,410082)

线性回归在分析化学中的应用 篇3

关键词:线性回归分析化学应用

1 概述

线性回归法在煤质化验中应用十分广泛,例如煤中砷、氯、锗、硅等元素的测定都用到了一元线性回归分析法。当我们研究客观现象时,发现某些变量之间存在一定的关系。这种关系可以分为两类:一类是变量之间存在着确定性关系,即数学上的函数关系,只要自变量x的取值确定了,因变量y的取值就唯一地确定了;另一类关系为非确定性关系,即相关关系。函数关系与相关关系的差别在于:函数关系是由x决定y的值,相关关系是由x取值决定y值的概率分布。我们用ei来表示某一个点与拟合直线的垂直偏差,基于适合度要求的最小二乘标准要求我们将这些垂直偏差的平方和最小化。

2 一元线性回归

2.1 一元线性回归方程的建立 一元线性回归方程是回归分析中最重要且最简单的情况。

对于具有n个实验点(xi,yi)(i=1,2,…,n)的校正曲线为:

yi=a+bxi+ei(1)

式中ei为残差。

在分析校正时,可取不同的xi值测量yi,用最小二乘法估计a与b值,其目的在于使残差平方和达到最小。

2.2 一元线性回归方程的显著性检验 用最小二乘法拟合回归方程与回归线只表明各实验点与所拟合的回归方程和回归线的变差平方和最小,并没有证明所拟合回归方程与回归线肯定有意义。至于所拟合回归方程是否有意义,尚需进行统计检验。回归方程的显著性检验,可使用F检验法和相关系数检验法,其中相关系数检验法更常用。

r=1时,x与y完全线性相关,所有的yi值都在回归线上。

r=0时,b=0,即根据最小二乘法确定的回归直线平行于x轴,这说明y的变化与x无关,这时x与y没有线性关系。

0<|r|<1这是绝大多数的情形,x与y之间存在着一定线性关系。当r>0时,b>0,直线的斜率是正的,y值随着x增加而增加,此时称x与y为正相关。当r<0时,b <0,直线的斜率是负的,y值随着x增加而减小,此时称x与y为负相关。

以相关系数判断线性关系的好与不好时,还应考虑测量的次数和置信水平。r出现的概率遵从统计分布规律,根据对r出现概率的研究,数学家已经编制出了检验相关系数的临界值表。

3 二元回归分析

3.1 二元回归方程的建立 在分析测试实际工作中,在许多情况下,影响分析信号强度(吸光度、谱线强度、极谱电流等)的因素不止一个,要找到分析信号强度(因变量y)与影响它的因素(自变量x)之间的关系,就要用到多元回归。其中,二元回归分析是多元回归分析中一种最简单的情况。

设两个自变量分别为x1和x2,因变量为y,则二元线性回归方程可表示为:

y=a+b1x1+b2x2

3.2 二元回归方程的显著性检验 与一元线性回归相似,需要对所建立的二元线性回归方程进行显著性检验,要用一个称之为全相关系数的量R来表征它们之间的相关程度。

R=■

式中i=1,2,…,m,m为自变量的数目。全相关系数R取值在0≤R≤1,R越接近于1,说明相关的程度越好。相关系数临界值可以由相关系数表中查出,判断方法同一元线性回归方程相似。

4 利用计算机技术在分析化学中进行回归分析

回归分析是用于实验数据处理的一个非常重要的数学工具,在分析化学领域得到了广泛的应用。然而对于分析化学实验中的大量数据进行回归分析,计算工作是较为繁复的。为此,可通过计算机编程的方法减少计算量。目前很多统计软件被开发出来用于回归分析,使得回归分析的应用更加方便快捷。

常用的统计软件有SAS(Statistical Analysis System),SPSS(Statistical Package for the Social Science) 和Excel等,其中Excel比专业统计软件更易学、易用,是一种较好的统计软件,在数据处理中得到了广泛的应用。

Excel提供了众多的回归分析手段,如分析工具库、规划求解、图表功能和内置函数都能用于回归分析。

用Excel计算,可免去繁复的计算,具体步骤如下:①在Excel表格中输入实验数据。②用上述数据绘制散点图。③通过添加趋势线计算回归方程。

5 结束语

在分析化学的数据处理中,回归分析尤其是线性回归分析有着举足轻重的地位,在环境监测、生物、食品、钢铁冶炼等多个领域都有着广泛应用,计算机的引入更是使得回归分析更加快捷方便,减少了大量的繁复的计算。线性回归定将在分析化学各个领域发挥更大的作用。

参考文献:

[1]王学仁,温忠粦编译.应用回归分析[M].重庆大学出版社,1989.

[2]邓勃.分析测试数据的统计处理方法[M].北京.清华大学出版社,1995.105-151.

[3]梁潇.一种计算机处理分析化学实验数据的方法[J].化工高等教育,2003,4:67-68.

多元线性回归分析及其应用 篇4

回归分析是一种传统的应用性较强的科学方法,是现代应用统计学的一个重要的分支,在各个科学领域都得到了广泛的应用。它不仅能够把隐藏在大规模原始数据群体中的重要信息提炼出来,把握住数据群体的主要特征,从而得到变量间相关关系的数学表达式,利用概率统计知识对此关系进行分析,以判别其有效性,还可以利用关系式,由一个或多个变量值去预测和控制另一个因变量的取值,从而知道这种预测和控制达到的程度,并进行因素分析。

2 多元线性回归数学模型

设可预测的随机变量为y,它受到p个非随机因素x1,x2,…xp-1,xp,和不可预测的随机因素ε的影响。多元线性回归数学模型为

其中为回归系数

对y和x1,x2,…xp-1,xp,分别进行n次独立观测,取得n组数据(样本)

则有

其中ε1,ε2,…εn相互独立,且服从N(0,σ2)分布。

则式(2)用矩阵形式表示为

3 模型参数β的最小二乘法估计与误差方差σ2的估计

β的最小二乘法估计即选择β使误差项的平方和为最小值,这时β的值作为β的点估计.

为了求β,由(4)式将S(β)对β求导,并令其为零,得

4 模型检验

多元线性回归数学模型建立后,是否与实际数据有较好的拟合度,其模型线性关系的显著性如何等,还需通过数理统计进行检验。常用的统计检验有R检验和F检验。

4.1 R检验

R是复相关系数,用于测定回归模型的拟合优度,R越大,说明Y与x1,x2,…xp-1的线性关系越显著,为yi的平均值,R取值范围为0<│R│≤1。

4.2 F检验

m为自变量个数,n为数据个数。

F服从F(m,n-m-1)分布,取显著性水平为α,如果F>Fa(m,n-m-1),表明回归模型显著,可从用于预测。反之,回归模型不能用于预测。

5 应用实例

某医院为了解病人对医院工作的满意程度Y和病人的年龄X1,病情的严重程度X2和病人的忧虑程度X3之间的关系,随机调查了该医院的10位病人,得数据如表1所示。

使用MATLAB语言编程并计算得下面结果:

从结果可以得出,回归模型为

取α=0.05对方程和回归系数进行检验,查F分布表可得F0.0 5(3.6)=4.76,F0.0 5(1.6)=5.99

本例中的方程检验值F=23.7098>4.76,说明模型的回归效果高度显著。

F1=9.0886>5.99,说明x1显著。

F2=0.4105<5.99,说明x2很不显著。

F3=2.5260<5.99,说明x3不显著。

R为0.9603接近1,表明线性相关性较强。

在实际中,由于Y的影响因素还有很多,使Y与X关系更为复杂,而且记录数据的准确性,可靠性,异常数据等问题,将影响Y的预测分析。

摘要:本文研究了多元线性回归理论及应用,探讨了多元线性回归模型中未知参数的估计及其参数的检验问题,以实例进行了验证。

关键词:多元线性回归分析,回归模型,检验问题

参考文献

[1]梅长林,范金城.数据分析方法.高等教育出版社.2006,2.

线性回归分析 篇5

用MATLAB回归非线性模型参数

非线性模型参数回归难度大,需要一定的数学基础,用MATLAB回归分析工具箱可直接进行非线性回归,计算简单准确,并能给出直观的拟合曲线图.

作 者:彭勇 牛俊峰 活泼 Peng Yong Niu Junfeng Huo Po 作者单位:浙江科技学院生化学院,杭州,310012刊 名:化学通报(印刷版) ISTIC PKU英文刊名:CHEMISTRY年,卷(期):70(11)分类号:O6关键词:MATLAB 回归分析 非线性模型

线性回归分析 篇6

关键词:城市化;拟合;回归分析;“纳瑟姆”曲线

近年由于住宅价格的涨落异常,住宅价格成为讨论的热点,多数学者以住宅价格组成分析了上涨原因,但在探讨城市化进程对住宅价格影响时均采用定性描述的方法,本文根据全国及地区历年城市化的统计数据,将城市化进程对住宅价格的影响采用定量分析的方法,借助统计分析软件SPSS 14分别建立函数模型。

一、我国城市化发展现状

1.1我国城市化发展历程

我国是人口大国,也是农业大国,一直以来农业人口占据绝对比例。改革开放以来,在政府倡导加快中国城市化进程的宏观政策下,我国城市化水平每年以1%~2%的速率匀速发展,2007年我国的城市化水平已经达到了44.94%,即我国每年城市人口增长约1 100万。我国的城市化起步比西方国家晚,经过近年的迅猛发展城市化水平与世界平均水平相接近,对比西方国家的发展经历,可以发现我国仅用短短三十年走过了西方国家上百年的城市化发展历程,但必须看到我国城市化发展并不均衡,建设部副部长仇保兴就曾表示:“中国城市人口高度密集,在农村流动人口中,有60%走向东南沿海,30%流向中部,西部只有10%”。

1.2我国城市化类型

根据经济发展水平可将城市化发展分了四类:(1)同步城市化,即城市化发展与经济增长以大致相同的速度增长,两曲线基本平行上升;(2)滞后城市化,即城市化水平落后于经济发展水平;(3)过度城市化,即城市化的速度超过了经济发展的速度。在国际上,一些拉美国家的城市化发展被公认为过度城市化,从这些拉美国家的发展历程可以看出,非农业人口在城市中低级第三产业中工作对加速经济发展的贡献并不明显,所以,在城镇人口从事低级服务行业所占的比重越大,则潜伏的过度城市化危机就越大”。。对中国经济而言,工业化发展是中国经济发展的源泉,工业化水平的提高将很大程度上影响经济的增长,所以对于我国经济增长与城市化的关系,本文采用工业化程度这一指标来体现经济发展程度。

二、城市化进程对住宅价格影响的相关性分析

在分析近年我国住宅价格持续走高的根源时,多数学者将源头定位于土地价格,这在价格组成来说是合理的,但更应该看到是什么原因使土地的供应量不足?又是什么原因致使城市商品住宅供不应求呢?

城市规模的扩大、城市人口的增加,商品住宅的开发面积满足不了市场需求,城市土地供应量虽然逐年增长,但相比城市每年约1100万人口增长量来说,远不能满足购房者的需求,在住房销售市场中形成供不应求的状况,致使住宅价格持续上涨,这都要归功于城市化进程。可见城市化进程对引起住宅价格上涨的各方面因素均有带动作用,城市化进程是怎样影响住宅价格?根据历年的数据,采用SPSSl4统计分析软件分析城市化进程对住宅价格的影响,建立函数模型。

2.1全国商品住宅销售价格相关性及回归分析

2.2区域住宅价格相关性及回归分析

全国的统计数据有较强的一般性,在相关性分析中会产生偏差,对分布情况错误估计,下面以江西省为例,对以上相关性分析做进一步验证。

对江西城市化进程与住宅价格的拟合度分析中仍然以城市化进程为自变量x,住宅价格为应变量y,同样选用十一种函数进行拟合,见表2 7,可看出三次函数拟合度为0.958,比其余函数拟合度都大,函数表达式为1,=6.8×103一5.8×104x2+1.4×105x3,F=80.418,回归系数和回归方程的显著性检验通过,说明也属于三次函数分布。

2.3总结

1979年美国城市地理学家Ray.M.Northam发现并提出的“纳瑟姆”曲线表明:发达国家的城市化大体都经历类似正弦波曲线上升的过程,上升过程中包括两个拐点,第一个拐点为当城市化进程超过30%时,代表进入高速城市化发展时期,经济发展迅猛的阶段,此时这个国家进入工业社会;当城市化进程30%以下时,属于缓慢发展阶段,这个国家尚处于农业社会;第二个拐点为城市化进程继续提高到70%以后,代表再次城市化进程和经济增长进入平稳发展的成熟阶段,此时这个国家基本实现现代化,进入后工业时代。

我国城市化进程在1995年达到30%,进入第一个城市化进程拐点,即进入经济高速发展期,2007年城市化进程达到46.9%,说明我国城市化发展远未到第二个拐点70%,城市化进程仍然处于高速发展阶段,但由于我国房地产市场起步较晚,大多数学者认为1998年开始进入稳定的发展阶段,所以选取1998 2007年全国和地区统计数据为样本进行分析。通过以上分析,可认为在第二个拐点到来之前,在我国城市化进程与国民经济以正常速度发展的前提下,城市化进程对住宅价格的影响仍将会服从三次函数分布。三.结论

从我国经济发展历程来看,1998 2007年是我国经济发展较稳定的时期,以全国和地区数据为样本进行分析,最终均服从三次函数分布,说明在城市化进程达到第二个拐点70%以前,当我国城市化进程保持目前的发展速度且经济平稳增长时,城市化进程与住宅价格之间的关系仍然属于三次函数分布,此分布特征可为消费者购房及房地产开发商楼盘定价提供理论参考。

参考文献:

[1]崔巍.从多角度分析房地产市场走势[J].城市管理,2006,(1),48 50.

[2]叶嘉安.我国城市化进程怎样免患大城市病[J].大众科技报,2005,(8).

我国能源消耗量多元线性回归分析 篇7

1 多元线性回归的理论基础

多元线性回归模型的一般形式:

设因变量y与自变量x1, x2, …, xp的线性回归模型为

在式1中, β0, β1, β2, …, βp是p+1个未知参数, β0为回归常数, β1, β2, …, βp为回归系数, y为被解释变量也既是因变量。

多元回归方程的实现就是根据已知变量, 运用最小二乘估计, 获得回归系数的过程, 就是寻找回归系数的估计值, 并使其估计值的离差平方和达到极小[1]。

多元线性回归方程的确定需要对统计指标进行一系列的检验, 只有各个统计指标通过了检验, 才能确定最终的回归方程, 同时也是拟合度最优方程。其中包括:

1) 复相关系数。用R表示, 是自变量与因变量之间线性关系密切程度的指标, 取值范围在, 其值越接近1, 表示线性关系越强。

2) 可决系数或判定系数。用R2表示, 是对回归方程拟合程度的综合衡量, 取值范围也在0~1之间, 其值越大, 说明方程的拟合程度越好。但还应该注意, 拟合效果与预测效果并不一样, 而且无论自变量与因变量是否有显著相关性, 其个数越多, 可决系数越大。因此除了根据可决系数判定方程的拟合优度之外, 还应使用其它检测标准。如对修正可决系数进行检验等。

3) F检验。此检验是用方差分析方法来检验回归模型在一定显著性水平下整体上是否合理。在SPSS软件的输出结果中, 如果F>F1-a (k, n-k-1) , 就认为回归整体显著, 同时也可以根据输出结果中的显著性概率即p值来判别。

4) t检验。也即是偏回归系数与常数项的检验, 通过此检验可以判定各个模型的回归系数与常数项是否显著, 进而判定自变量进入方程的合理性。一般情况下, 在SPSS输出结果中通过显著性概率即可判定各个系数的t值的合理性。根据设置的显著性水平的不同, 一般如果p值小于0.01或0.05, 则可认为其回归系数或常数项具有显著性。

5) 多重共线性诊断。各自变量之间是否存在多重共线性, 可以通过VIF、容忍度、特征值以及条件指数来衡量。当VIF小于10, 容忍度接近于1, 若干特征值较大且接近于1, 条件指数小于15等情况下可以认为自变量间不存在多重共线性问题。

6) 异常值诊断。异常值是指标准差过大的观测量, 在SPSS软件中, 默认的判断标准是标准化残差的绝对值大于3, 在这种情况下就可以认为其存在异常值。

2 自变量与因变量的设定

能源既是经济的一部分, 又是经济运行的基础。能源供应保证了其他行业的需要, 支持了GDP增长, 比起自身对GDP的贡献更为显著。因为没有能源产业的发展, 就不可能保障其他行业的发展需求, 也就阻滞了国民经济的发展。能源对国家安全、社会运行、生态环境、人们生活和文明均有重大的影响, 是当代社会与经济生活中的核心问题。能源以直接或间接的方式推动或制约了经济的发展。

从人类历史的发展历程来看, 能源对于人类社会发展具有举足轻重的作用, 具体表现在: (1) 能源推动生产力的发展; (2) 能源推动经济规模的扩大; (3) 能源是提高人民物质生活的物质基础。经济增长对能源的需求和能源对经济增长的促进作用, 通常是在能源供给不能满足需求时表现得最为强烈[2]。例如, 1973年第一次石油危机期间, 美国能源短缺严重, 国内生产总值因此减少了930亿美元, 而其他发达国家的情况也大体如此。据有关资料分析, 由于能源短缺造成的国民生产总值的损失, 大约是能源本身价值的20-60倍。[3]因此认为, 能源的消耗与国内生产总值有高度相关, 同时与人口的数量有关, 对于中国的实际, 特选取需要消耗大量能源的工业作为一项变量, 检验其是否与我国能源消耗有高度相关的关系。

本研究的目的是为了建立我国未来能源消耗量的回归模型, 因此因变量y指当年的能源消耗量并以标准煤为单位 (万吨) ;选取的自变量分别为:x1为当年国内生产总值 (GDP:亿元) ;x2为当年的人口总量 (万人) ;x3为当年工业总产值 (亿元) 。选取了1992~2006年我国能源消耗量、国内生产总值、人口数量以及工业总产值的变量统计信息见表1:

数据来源:能源消费总量以及工业总产值来自《中国统计年鉴 (2007) 》, GDP总量来自《中国统计摘要 (2005) 》, 人口数量来自《中国人口统计年鉴 (2005) 》。

3 回归结果及回归检验

在进行SPSS软件操作过程中, 选取线性回归命令后, 对线性回归对话框进行设定如下, 把“能源消费总量”选入因变量空格中, 把GDP、人口和工业总产值选入自变量空格中, 然后选取逐步回归分析法;在“统计量”选项中选取“估计值”“模式适合度”“置信区间”“共线性诊断”以及“全部异常值诊断”;在“统计图”选项中选取输出“残差正态概率图”;在“保存”选项中选取输出预测区间, 并选取95%的可信区间;在“选项”对话框中选取默认选项[3]。输出结果如下:

a.Dependent Variable:能源消费总量/万吨标准煤

在表2中一共显示了四个步骤, 可以看出三个自变量先后进入逐步回归过程, 只有工业总产值被剔除。其被剔除的原因可能与GDP的进入有关, 也许是因为工业总产值与GDP之间有严重的多重共线性问题, 有待于根据下面的统计指标进行确认。

a.Predictors: (Constant) , 工业总产值/亿元

b.Predictors: (Constant) , 工业总产值/亿元, 人口/万人

c.Predictors: (Constant) , 工业总产值/亿元, 人口/万人GDP/亿元

d.Predictors: (Constant) , 人口/万人, GDP/亿元

e.Dependent Variable:能源消费总量/万吨标准煤

由表3可以看出, 四个模型的复相关系数以及可决系数都大于0.9, 说明自变量与因变量之间的线性关系很强并且拟合的效果也很好;从其修正可决系数来看, 每次变量的进入与剔除都会引起其的增加, 可以判定拟合效果与预测效果都很好。同时第四个模型的DW检验值为1.726, 查DW检验上下界表 (k=3, n=15) 得dL=0.95, dU=1.54, 而dU=1.54<1.726<4-dU=2.46, 因此误差项之间无序列相关关系。

a.Predictors: (Constant) , 工业总产值/亿元

b.Predictors: (Constant) , 工业总产值/亿元, 人口/万人

c.Predictors: (Constant) , 工业总产值/亿元, 人口/万人, GDP/亿元

d.Predictors: (Constant) , 人口/万人, GDP/亿元

e.Dependent Variable:能源消费总量/万吨标准煤

由表4方差分析表可以看出, 四个模型中P值=0.000, 都通过了显著性检验, 其中最大F值是第四个模型的F值=671.626, 说明在第四个模型的x1、x2对y有高度的线性关系, 同时拟合效果也是最好的。

在表5方程系数表中, 给出了各个模型的回归系数值, 它们的t值检验的显著性系数除了模型三中“工业总产值”不显著外, 其它都通过了显著性检验, 说明其它各个自变量都与因变量有线性关系。并且在模型三中各个变量的方差膨胀因子都远远大于10, 这种情况下就可以认定其存在多重共线性, 因此在第四个模型中把“工业总产值”的变量删除之后, P值=0.000首先通过了显著性检验, 同时方差膨胀因子也都小于10, 消除了多重共线性问题。

a.Dependent Variable:能源消费总量/万吨标准煤

a.Dependent Variable:能源消费总量/万吨标准煤

由于在SPSS设置阶段选取了输出所有观测量的异常值诊断, 因此在表6中“标准化残差”显示了15个观测量的标准化残差值, 并且每个值的绝对值都小于3, 因此可以断定数据中不存在异常值。同时可以通过标准化残差图 (图1) 来断定, 图中绝大多数散点贴近对角线, 可以认为标准化残差是服从正态分布的[4]。

4 研究结论及政策建议

4.1 研究结论

通过以上的检验和分析, 可以建立一个二元线性回归模型:

其中代表每年所消耗的能源 (万吨标准煤) , x1代表当年的国内生产总值 (亿元) , x2代表当年的全国人口数量 (万人) 。

由回归模型可以看出, 在其它条件不变的情况下, 国内生产总值每增加1亿元, 就要相应地消耗1.294万吨标准煤, 而国内生产总值每增加1个标准差, 能源消耗就要增加1.706个标准差;同理, 在其它条件不变的情况下, 人口总量每增加1万人, 就要少消耗6.934万吨标准煤, 而人口总量每增加1个标准差, 能源消耗就要减少0.782个标准差。

造成人口增加而能源消耗量减少的原因, 有多方面的因素:人口的增加幅度近年来得到了有效控制, 而同时科技的进步, 其它能源的开发利用以及政府对能源高效利用的重视等原因产生了这种结果。因此, 我们还应加强新能源开发力度, 能源高效利用的措施制定, 以及人口的控制[5]。

工业总产值未能通过检验, 因而被剔除, 其原因在于:通过统计指标来看 (第一、三个模型) , 工业总产值第一个进入回归模型, 与能源消耗高度相关, 并且工业总产值与GDP的方差膨胀因子都过大, 它们之间存在多重共线性问题[6]。从实际来看, 工业的发展需要消耗的能源比重很大, 同时我国的经济结构不合理, 特别是第三产业还处于发展阶段, 因此, 我国必须加大力度调整产业结构, 大力发展那些耗能比较少, 而附加值比较高的产业。对于重工业的发展, 要控制总量, 通过技术进步, 采取高新技术进行改造, 以改变产业结构;同时对第三产业, 实行激励性政策, 鼓励第三产业的发展, 调整第三产业在所有产业中的比重, 在创造经济价值的同时减少能源的消耗。充分考虑我国的国情, 走科技含量较高能源消耗率低的新型产业化道路是我国产业发展的必然选择。

4.2 政策建议

基于上述的研究结论, 我们可以得出如下政策性建议:在未来的能源利用中, 我国应根据国民生产总值等经济指标的预测值做好对能源的战略规划, 并积极进行科技创新, 开发新能源, 制定节约措施, 在保证人们日常生活的情况下, 实现国内经济的又好又快发展。

参考文献

[1]何晓群.现代统计分析方法与应用[M].中国人民大学出版社,

[3]卢纹岱.SPSS for Windows统计分析[M].电子工业出版社, 2007.

[2]王皓良.我国工业企业能源消耗研究[D].江苏大学硕士学位论文, 2009.2007.

[4]高祥宝, 董寒青.数据分析与SPSS应用[M].清华大学出版社, 2007.

[5]何宏.我国能源消费同经济增长变动关系实证研究[M].厦门大学出版社, 2006.

线性回归分析 篇8

哈尔滨第一工具厂十二分厂是包括有锻造、热轧、热冲、锻件退火以及中频炉炼高速钢的综合性加工分厂。分厂耗燃油量居全厂第一位, 用电量也名列前茅, 是工厂重点耗能大户之一。分厂燃油全部用来锻件加热、热轧件以及热冲件, 电力主要消耗在锻轧件退火以及重熔炼钢上。为了揭示能耗量与产量之间的关系, 我们以数理统计的方法收集、整理了近三年来生产中的实际数据, 并应用线性回归方法从这些分散不规则的数据中定量找出有规律的关系——回归直线。应用这条回归直线就可以定量预测能源消耗量与产量这两个变量之间所依存的关系。

1 回归线及回归方程的建立

1.1 数据的收集

从2006年到2008年按月份发生数收集90组产量与耗能量的数据。

1.2 绘制相关图

1.2.1 建立三个坐标系

纵坐标 (Y) :分别表示耗油量、耗电量。

横坐标 (X) :分别表示锻、轧、冲件重量;退火件重量;重熔炼钢产量。

1.2.2 描点

将收集的90组数据, 描点于坐标系中, 见图1、图2、图3。

1.2.3 绘制中位线

中位线按中值法绘制, 即在相关图中分别画两条与横坐标及纵坐标平行的中位线X¯Y¯, 使X¯线上下与 线左右的点子数基本相等。

1.2.4 统计各区点数

中位线X¯Y¯将相关图分成四个区域、右上角为Ⅰ区, 按逆时针方向依次记为Ⅱ区、Ⅲ区、Ⅳ区, 统计各区中的点数, 分别用n1、n2、n3、n4代表相应区域点数, 各区域点数见表4。

1.2.5 求回归直线

X右部作两条分别平行于X轴、Y轴的X2和Y2直线, 把右部点子分成左右、上下数量相等的两部分, 并交于一点, 同样, 在X左边亦作XY直线, 可用Y=aX+b来表示。下面是分厂三种生产状态下的回归直线。

1X1=121X2=163Y1=30Y2=37a=Y2-Y1X2-X1=37-30163-121=0.17b=X2Y1-X1Y2X2-X1=163×30-121×37163-121=9.8Y=0.17X+9.8

2X1=152X2=216Y1=68Y2=94a=Y2-Y1X2-X1=94-68216-152=0.40b=X2Y1-X1Y2X2-X1=216×68-152×94816-152=6.25Y=0.40X+6.25

3X1=37X2=63Y1=64Y2=98a=Y2-Y1X2-X1=98-6463-37=1.3b=X2Y1-X1Y2X2-Y1=63×64-37×9863-37=15.6Y=1.3X+15.6

2 回归方程的相关程度

数理统计学规定, 回归方程与实际相关程度如何, 以相关系数r来确定, 相关系数r=1时表明方程与实际完全相关, 1>r>0.8时为高度相关;r=0.5~0.8为显著相关;r=0.3~0.5为低度相关。相关系数的数学求法非常繁杂, 本文以作图法与计算结合来求。

2.1 计算法求r

用简化近似法求rr=sin (n1+n3n-12) π

式中n——分布图上总点子数π=180°;

n1、n3——Ⅰ、Ⅲ象限点子数 (见表4) ;

r1=0.81, r2=0.98, r3=0.98;

相关系数都在0.8<r<1之间, 故判断为高度相关。

2.2 作图法

具体数字见前图和表4, 查散布图符号检查表, 当n=30时, 判断错误风险率在1%情况下, nα=7。而三个图中的n2+n4都小于nα, 所以二者相关可靠, 又因为n1+n3都大于n2+n4, 所以为下相关。

结论:作图法和计算法都说明三种生产状态是正相关并可靠度为99%。

3 回归直线方程的应用

从上述分析看出所求得的锻、轧、冲件产量与耗油量;退火件产量与耗电量;炼钢产量与耗电量之间的三条直线方程与近三年来的生产实际情况高度相关, 其可信度达99%。通过这三条直线我们可以定量判定某一产量下的合理能源消耗量, 根据某一时间所发生产量及消耗量有关的位置居线上线下;从而达到宏观分析预测, 检查、控制能源消耗的目的。

在进行回归分析时要注意的问题是随着能源管理工作的加强, 节能材料的应用及节能设备的改造都会给方程带来变化因素, 这些变动因素有待实际应用中进一步分析、校正。

摘要:为了揭示能耗量与产量之间的关系, 通过数理统计的方法收集、整理了三年来生产中的实际数据, 用线性回归方法从这些分散不规则的数据中定量找出有规律的关系——回归直线, 应用这条回归直线就可以定量预测能源消耗量与产量这两个变量之间所依存的关系。

关键词:产量,能耗,回归直线

参考文献

线性回归分析 篇9

线性回归分析法, 是以相关原理为基础的因果关系的一种重要类型。它是分析因变量与自变量之间的相关关系, 用回归方程表示, 根据自变量的数值变化, 去预测因变量数值变化的一类方法。

二、模型的介绍

多元线性回归模型。

客观经济现象的变化并不只受到一个因素的影响, 往往是若干因素综合作用、影响其发展变化。如果对被解释变量Y有显著影响的解释变量有 ( k - 1) 个, 分别为X2, X3, …, Xk, 同时Y不仅仅是X2, X3, …, Xk的线性函数, 而且是参数的线性函数, 那么多元线性回归的数学模型可以表示为:

多元线性回归模型通常要满足六个假设条件:

假设1:误差项的期望为零, 无偏性假设, 即

E ( ut) = 0 ( t = 1, 2, …, n)

假设2: 误差项之间相互独立, 无序列相关假设, 即

Cov ( ut, us) = 0 或E ( utus) = 0 ( t, s = 1, 2, …, n, t≠s)

假设3: 误差项ut的方差与t无关, 同方差假设, 即

假设4: 任何一个解释变量X与任何一个误差项U不相关, 即

通常假定X为非随机变量。这个假设自动成立。

假设5:ut为服从正态分布的实随机变量, 即ut~N (0, σ2u)

假设6:任何解释变量之间不存在严格的线性相关, 即不存在多重共线性。

为了使多元线性回归分析和计算更方便、更简洁, 使用矩阵形式表示。定义:

这八个矩阵中, 除了X矩阵为n × k矩阵外, 其余的全为列矩阵。

通过定义, 可以得到用矩阵形式表示的总体回归模型为:

即: Y = Xβ + U

应用最小二乘估计可以得到参数的估计:

三、多元线性回归的预测

预测是建立在多元回归模型Y = Xβ + U在预测期或预测范围内仍然成立的基础上的。无论对于时间序列数据模型, 还是对于横断面数据模型, 预测的基本前提都是有样本得到的统计规律不发生太大变化, 原有回归模型的假设条件仍然成立。假设在预测期或在预测范围内。关系式:

成立。其中, Y0是要预测的数值, X0是给定的解释变量矩阵

四、案例分析

案例: 分析广州人均消费支出的影响因素。

1. 有关消费理论的介绍

现实生活中, 影响消费的因素很多, 西方消费经济学者认为, 收入是影响消费者消费的主要因素, 消费是需求的函数。消费经济学有关收入与消费的关系即消费函数理论有:

( 1) 凯恩斯的绝对收入理论: 凯恩斯认为消费主要取决于消费者的可支配收入, 随着收入的增加, 消费也会增加。他假定, 人们的现期消费取决于他们现期收入的绝对量。

( 2) 杜森贝利的相对收入消费理论: 认为消费固然会随着收入的增加而增加, 另一个方面指消费者的消费行为要受到周围人的消费水平所影响, 也就是所谓的“示范效应”, 就低收入家庭而言, 收入虽然低, 但为了顾及面子, 不得不打肿脸充胖子。

( 3) 弗朗科·莫迪利安的消费理论: 这种理论强调, 人们会在更长的时间范围内计划他们的生活消费开支, 以达到他们在整个生命周期内消费的最佳配置。如果社会上年轻人和老年人的比例增大, 则消费倾向会提高, 如果社会上中年人比例较大, 则消费倾向会下降。

( 4) 弗里德曼的永久收入消费理论: 他认为消费者的消费支出主要不是由他的现期收入来决定, 而是由他的永久收入来决定的。

2. 变量的选择

根据凯恩斯的绝对收入理论, 选择了人均消费支出来代表消费, 人均可支配收入来代表居民收入水平。根据杜森贝利消费理论, 消费行为受消费习惯影响, 故, 选择人均前期消费支出代表消费习惯。而关于该理论的“示范效应”, 在广州人心中, 质优价廉无疑是消费的最好标尺, 务实的消费已经成为广州人的消费态度。所以, 在本文的研究中, 忽略了这个因素的影响。就弗朗科·莫迪利安的消费理论和弗里德曼的消费理论而言, 两者有着共同的地方, 就是, 消费不只是同现期收入相联系, 而是以一生或永久的收入作为消费依据, 故本文不进行变量引入。另外, 也引进了各年利率、商品零售价格水平两个变量。其中, 利率是以一年期定期利率为代表, 本文采用了利率加权的方法, 对利率数据进行了整理。

3. 模型的建立

对1995—2014 年各年《广州统计年鉴》的消费数据和1995—2014 年《中国统计年鉴》的利率 ( 加权平均) 数据进行多元线性回归, 用Y表示消费支出, X1表示前期消费, X2表示人均可支配收入, X3表示城市商品零售价格指数, X4表示利率水平, 得到以下结果:

模型总体拟合度很高, R2= 0. 997。但是, 利率在显著水平为5% 的情况下, 显著性是0. 19, 且它的系数是60. 06, 从经济意义上讲, 利率的上调将会缩小消费的支出, 故而剔除这个变量。重新回归得到:

Y=-268.96+0.135X1+0.657X2+8.297X3 (1.238) (8.529) (1.715)

经过验证, 只有人均可支配收入一项能通过验证, 说明模型存在严重的线性相关, 通过自变量的pearson相关系数分析, 发现前期消费支出与人均可支配收入有着高度的相关性, 对当期人均可支配收入和前期消费两个变量做回归, 可以看出, 模型拟合度很高, 说明前期消费支出在很大程度上可以由人均消费来解释, 从经济意义上讲, 影响消费支出的最主要的因素是人均可支配收入。故, 删去前期消费支出这个变量, 保留人均可支配收入这个变量, 重新进行回归, 发现, 城市商品零售价格指数还是没有通过验证。

因为, 在1996 年左右, 中国经济受到亚洲金融危机的影响, 物价上涨是很正常的事情, 属于突兀数据, 所以, 对城市商品零售价格指数这个变量进行剔除, 剩下人均收入, 再进行回归, 可以得到:

模型的拟合程度仍然很高, 但是根据经验, 一般情况下, 高收入家庭的消费结构比较不稳定, 方差也就比较大, 为此, 分别针对这两个问题对模型进行广义差分法修正得到最终模型。

4. 最终模型

模型总体线性高度显著, 变量也高度显著, 拟合程度很高, R2= 0. 994 说明有99. 4% 的消费变动能由居民人均收入变动来解释, 模型解释能力很强。

5. 模型结论和建议

经过实证分析, 得出广州市人均消费水平主要受人均可支配收入的影响。人均可支配收入的增加能有效地带动人均消费水平的增加。

价格指数对消费的影响, 尽管在本模型中不能体现出来, 但, 价格的变化还是会影响居民的消费。

前一期消费对当期消费也存在正相关, 但由于它与收入存在高度正相关, 所以在最终的模型里这一变量被剔除了。

而利率的变动对消费的影响基本上不存在了, 利率的变动很难确定居民的消费变动方向, 因此, 政府如果从货币政策入手去调控消费, 收效将不会很大。

综合上述因素, 最有效拉动内需的方法是提高市民的收入。为了促进我国居民收入总量的增长, 我们需要在经济政策上有所调整。

参考文献

[1]赵国庆.计量经济学[M].北京:中国人民大学出版社.

[2]魏宗舒, 等.概率论与数理统计教程[M].北京:高等教育出版社.

[3]于秀林, 任雪松.多元统计学[M].北京:中国统计出版社.

多元线性回归在成绩分析中的应用 篇10

一﹑资料与方法

1.1 资料来源。

我校2009级经济管理学院物流、营销2个专业辽宁考区学生, 共计56人。以其高考成绩 (包括英语、数学、语文、理综合成绩) 及大学第一学期考试课 (包括大学英语、高等数学、现代基础医学概论、中医基础) 成绩为研究对象。

1.2 方法。

以4科高考成绩为自变量, 分别以大学第一学期考试课成绩为因变量, 利用SPSS17.0统计软件, 采用逐步回归方法进行多元线性回归分析。

二﹑结果

2.1 高考成绩对大学英语成绩的影响 (见表1)

注:F=3334.108, P=0.000<0.05, 因变量:大学英语, 通过原点的线性回归

如表1所示, 大学英语与高考英语成绩之间的线性伴随变化有统计学意义 (F=3334.108, P=0.000<0.05, t高考英语=57.742, P=0.000<0.05) 。回归方程为:大学英语=0.625*高考英语, 说明高考英语成绩每增加1分, 估计大学英语成绩平均升高0.625分。

2.2 高考成绩对高等数学成绩的影响 (见表2)

注:Model 2:F=7.570, P=0.001<0.05, 因变量:高等数学

如表2所示, 高等数学与高考数学、理综合成绩之间的线性伴随变化有统计学意义 (F=7.570, P=0.001<0.05, t理综合=-3.117, P=0.003<0.05, t高考数学=2.076, P=0.043<0.05) 。回归方程为:高等数学=100.052-0.250*理综合+0.269*高考数学, 说明在高考数学成绩未变化的情况下, 理综合成绩每增加1分, 估计高等数学成绩平均下降0.250分;同理, 在理综合成绩未变化的情况下, 高考数学成绩每增加1分, 估计高等数学成绩平均升高0.269分。

2.3 高考成绩对现代基础医学概论成绩的影响 (见表3)

注:F=10.008, P=0.003<0.05, 因变量:现代基础医学概论

如表3所示, 现代基础医学概论与理综合成绩之间的线性伴随变化有统计学意义 (F=10.008, P=0.003<0.05, t理综合=-3.164, P=0.003<0.05) 。回归方程为:现代基础医学概论=120.285-0.244*理综合, 说明理综合成绩每增加1分, 估计现代基础医学概论成绩平均下降0.244分。

2.4 高考成绩对中医基础成绩的影响 (见表4)

注:F=15.739, P=0.000<0.05, 因变量:中医基础

如表4所示, 中医基础与理综合成绩之间的线性伴随变化有统计学意义 (F=15.739, P=0.000<0.05, t理综合=-3.967, P=0.000<0.05) 。回归方程为:中医基础=123.310-0.219*理综合, 说明理综合成绩每增加1分, 估计中医基础成绩平均下降0.219分。

三﹑讨论

大学第一学期考试课成绩受多种因素影响, 本文仅从高考成绩这一方面进行研究。通过多元线性回归分析可以得出:大学英语与高考英语成绩之间的线性伴随变化有统计学意义;高等数学与高考数学、理综合成绩之间的线性伴随变化有统计学意义, 即大学英语和高等数学成绩分别受高考英语和高考数学成绩影响。教师在这两门学科教学过程中可根据学生的高考成绩进行有针对性的分层教学, 即要让基础好的学生取得高分, 又要保证整个学生群体的及格率。而现代基础医学概论、中医基础成绩与理综合成绩之间的线性伴随变化虽然有统计学意义, 但偏回归系数为负值, 这说明理科成绩较好的学生在大学第一学期还不太适应中医专业课的学习, 教师在授课过程中, 应结合理科生的思维特点通过案例教学、PBL教学等教学方法在充分调动学生学习积极性的前提下, 培养学生的学习兴趣, 帮助学生建立和完善适合自己的学习方法, 进而为接续的学习课程打下坚实基础。

摘要:目的 研究高考成绩是否对大学第一学期考试课成绩产生影响。方法 对经济管理学院2009级物流、营销2个专业学生的高考成绩与大学第一学期考试课成绩进行多元线性回归分析, 从而定量地确定它们之间的相互依存关系。结果 大学英语与高考英语成绩之间的线性伴随变化有统计学意义;高等数学与高考数学、理综合成绩之间的线性伴随变化有统计学意义;现代基础医学概论与理综合成绩之间的线性伴随变化有统计学意义;中医基础与理综合成绩之间的线性伴随变化有统计学意义。结论 多元线性回归分析定量的揭示了高考成绩对大学第一学期考试课成绩的影响, 为教师开展有效教学, 保证教学质量提供了一定的指导依据。

关键词:多元线性回归,大学英语,高等数学,现代基础医学概论,中医基础,成绩

参考文献

[1]赵耐青.临床医学研究设计和数据分析[M].上海:复旦大学出版社, 2005:152-173.

线性回归分析 篇11

关键词:BP神经网络 一元线性回归 社会固定资产投资额

一、引言

固定资产投资是社会扩大再生产的主要手段,是实现国民经济持续、快速、健康发展的原动力,是拉动我国经济飞速增长的主要因素。固定投资对我国的社会主义现代化建设具有重要意义。根据经济增长理论,固定投资的增长会带动经济的增长,还会创造更多的就业岗位。

固定资产投资可分为国内预算、国家贷款投资、外商投资和自筹及其他资金来源四个部分。对这四部分进行预测,获得较为准确的固定资产投资数据,对于政策制定者、商业投资者和求职就业者,都有十分重要的现实意义.

(一)BP神经网络模型

构建BP神经网络,需要三个步骤:生成神经网络、权值初始化以及网络仿真。

(二)BP神经网络预测

四、比较与结论

一元线性回归预测优点是计算相对简单。缺点:需要较多的观测值,缺乏权值分配过程,对于非线性关系样本缺乏解释能力。BP神经网络预测具有任意逼近非线性函数的特性,优点不需要知道输入输出变量间的关系,只需采用Matlab神经网络工具箱,通过对输入输出数据的训练,获得输入输出之间的映射关系即可得到预测值。

(作者单位:上海理工大学管理学院)

参考文献:

[1]吴海军. ARIMA模型在北京市全社会固定资产投资预测中的应用[J].经济研究导刊,2007(2):131-133.

[2]孟露露. 固定资产投资与经济增长关系的回归分析[J]. 中小企业管理与科技,2009(2):89-90.

[3]徐志勇、秦伟良、李奇松. 江苏省全社会固定资产投资预测[J]. 安徽农业科学,2007(35):1551-1553.

[4]李晓超等编辑. 中国统计年鉴-2008. 北京: 中国统计出版,2008

[5]董长虹. Matlab神经网络与应用(第2版本)[M]. 北京:国防工业出版社,2007:64-67.

[6]刘莉、贺聪. 基于时间序列的BP神经网络的滑坡预测预报及其在Matlab中的实现[J]. 中国水运,2006(12):72-74.

[7]朱顺泉. 基于Matlab的BP神经网络在现金流量分析中的应用[J]. 中国管理信息化,2008(3):39-40.

线性回归分析 篇12

一、经济与就业关系的模型

(一) 索洛模型

宏观经济学通常借助于生产函数来研究经济增长。宏观生产函数可表示为Yt=Atf (LtKt) , 式中Yt, Lt, Kt顺次为t时期的总产出、投入的劳动量和投入的资本量, At代表t时期的技术状况。根据生产函数可进一步得到一个描述投入要素增长率、产出增长率与技术进步增长率之间关系的分解式, 即索洛模型:GY=GA+琢GL+茁GK (式中GY为产出的增长率, GA为技术进步的增长率, GL, GK分别为劳动和资本的增长率;和为参数, 它们分别是劳动和资本的产出弹性) 。从索洛模型可以看出, 经济增长是技术进步、资本积累和劳动力增加等因素长期作用的结果;经济增长与就业增长是正相关的, 经济增长将推动就业的相应增长;技术进步率、资本投入增长率及劳动与资本的产出弹性均与就业增长率呈负相关。

(二) 线性回归分析模型

回归分析是研究变量之间相关 (非确定性) 关系的一种数学工具。而一元线性回归分析则对研究两个数据分布大体上呈直线趋势的变量相关关系更为有效。运用一元线性回归分析模型预测社会经济与就业关系时, 必须选用合适的统计方法估计模型参数, 并对模型及其参数进行统计检验。

首先, 建立线性回归模型:其中yt=b0+b1xi+滋i, b0、b1是未知参数, 滋i为剩余残差项或随机扰动项。

再用最小二乘法进行参数的估计, 要求满足以下条件:

最后, 对各参数变量进行t检验与可决系数检验。

二、我国经济增长与就业关系的数据处理与实证研究

(一) 经济增长与就业增长数据分析

根据《中国经济统计年鉴》 (2009) 数据计算表明 (见图1) , 1978-2008年我国经济增长与就业增长关系发展呈现四个阶段。第一阶段 (1978-1989) 我国GDP增长率对就业具有明显的拉动作用, 两者基本上呈现正相关的态势。例如1985年GDP增长率为25.01%, 就业增长率也达到较高点3.48%;1989年增长率达到考察期的较低点13.27%, 就业增长率也降为同期的最低点1.83%。第二阶段 (1990-1995) 我国经济增长与就业增长之间关联性不大, 就业增长受到经济增长的影响很微弱。这期间, 我国GDP增长率的平均值为23.26%、比上一阶段高出8个百分点, 而就业增长率的均值仅为3.67%、只比上一阶段高出0.71个百分点。第三阶段 (1996-2000) 我国GDP增长回落, 就业增长变化不大。第四阶段 (2001-2008) 我国GDP增长率出现回升迹象, 平均增长率达到15.83%, 而就业增长率平均值为0.91%, 低于上期0.25个百分点。我国经济增长对就业增长的拉动作用受到许多因素制约, 不同时期差异很大。

(横坐标:年;纵坐标:%)

GDPR代表GDP增长率, YR代表就业人数增长率。

(二) 经济增长的就业弹性分析

图2为我国GDP就业弹性三项移动平均趋势, 其中z代表GDP就业弹性 (1990年就业增长率异常, 采用前后两年的均值) 。从图2可以看出, 我国经济增长率的波动并未引起就业增长的相应变动, 就业变动对经济增长率变动的反应迟缓;20世纪90年代以来我国的就业弹性系数呈下降趋势。这表明自20世纪90年代以来, 中国经济增长在一定程度上是排挤就业的。

三、经济增长与就业关系的计量结果分析

通过经济增长率与就业增长率的计算分析, 笔者对中国经济增长的低就业效应有了一个初步的判断。

(一) 经济增长与就业增长相关关系的分析

根据1978-2008年间GDP的增长率与就业增长率, 所得到的相关系数仅为0.024495, 显示两者之间相关性极差。但根据同期GDP与就业人数所得到的相关系数为0.603293, 显示两者之间相关性较强。这说明了两个问题, 其一, 经济增长是决定就业总量增加的基本条件;其二, 受就业弹性的影响, 经济增长率与就业增长率之间存在非一致性。特别地, 在就业弹性下降的情况下以及其他因素的影响, 高经济增长率可能伴随着低就业增长率。我国经济增长的就业效应不足就是这一特例的表现。由于经济增长率与就业增长率指标的波动较大, 两者回归关系不显著, 这里用我国各年的GDP对就业人数分期作线性回归分析。

根据表1回归分析结果显示, 四个时期我国GDP对就业人数的回归检验都是显著的, 拟合效果比较满意, 这同样说明我国经济增长是就业的决定性因素。比较1990-1995年和1996-2000年两个时期回归结果, 发现后一时期的结构参数值要大于前一时期, 这意味着在被限定的单变量回归方程中, 1996-2000年期间, 我国GDP每增长l亿元所能带动的就业人数增加 (0.151792万人) 要大大高于1990-1995年的平均水平 (0.076959万人) ;且后一时期的值高于前一时期, 这说明我国GDP对就业量变化的解释力在1996-2000年期间相对提高, 在这种情况下, 维持较高的经济增长率对于扩大就业更加有现实意义。

(二) 我国宏观生产模型检验及意义分析

为了考察我国经济增长过程与要素投入的关系, 这里运用新古典生产函数的对数形式:其中, Y、K、L分别表示图民经济总产出、资本要素投入和劳动要素投入, 分别是对应解释变量资本、劳动的参数, A为除要素投入之外的综合因素。现以国内生产总值 (GDP, 亿元) 表示总产出, 以全社会固定资产投资额 (亿元) 表示资本投入, 以年末就业人数 (万人) 表示劳动投入, 得到1995-2008年时间段的回归分析结果。 (见表2)

输出结果显示, 样本拟合优度很高, 表明样本的拟合优度理想;且能通过F检验, 变量 (对数值) 之间总体线性关系显著成立。以2000年分界的前后两个时期中, 的样本估计值由1.799816下降到0.667145, 表明资本投入对于中国经济增长的贡献变小;以2000年分界的前后两个时期中, 的样本估计值由-8.189848上升为1.674737, 表明劳动投入对于中国经济增长的贡献变大。

四、结束语

经济增长是就业增长的前提条件, 是解决失业问题的根本出路。而就业量的增加将提高劳动者收入, 从而促进经济的增长。要实现经济增长和扩大就业的良性互动, 还要采取相应的宏观经济政策。

对于欠发达地区, 应选择劳动密集型经济。并且要提升劳动密集型经济的技术水平和集约程度, 实现劳动密集型经济从粗放型向集约型的转变。

应重点发展商业零售、交通运输、信息咨询、社区服务、物业管理等就业增长弹性大、吸纳劳动力多的劳动密集型第三产业。

大力发展劳动密集型出口加工业, 不断提高劳动密集型产品的技术含量和附加值。按外资的就业弹性和职位绝对增加量等指标来引导外资的地区流向。

努力改善劳动力市场的运转效率, 为劳动力供需双方提供及时有效的信息服务。

加快农村城镇化建设, 发展农业产业化, 鼓励农民从传统的粮食生产转向就业弹性较高的经济作物的种植, 减轻和延缓农村剩余劳动力的流动速度。

参考文献

[1]赖小琼.论经济增长与就业增长.[J].厦门大学学报, 2001, (3)

[2]李俊锋, 王代敬, 宋小军.经济增长与就业增长的关系研究两者相关性的重新判定.[J].中国软科学, 2005 (1)

[3]肖灵机, 徐文华, 熊桂生.我国经济增长与就业增长非一致性的制度解释及制度安排.[J].当代财经, 2005, (6)

[4]李晓嘉, 刘鹏.我国经济增长与就业增长关系的实证研究.[J].山西财经大学学报, 2005 (10)

[5]陈桢.经济增长与就业增长关系的实证研究.[J].经济学家, 2008 (2)

上一篇:投标施工组织设计下一篇:相互联系