GMDH模型

2024-08-03

GMDH模型(精选4篇)

GMDH模型 篇1

0 引言

由于青海的经济系统内多个因素之间相互作用和相互影响, 因而当运用经济理论从众多影响因素中揭示出对经济对象有重要影响的因素时, 不容易找到一个客观公正的标准。自组织数据挖掘方法为这一问题提供了有效的解决途径。

实践证明GMDH模型能预测短期经济的发展趋势, 能够较为科学地确定和预测经济运行中的转折点, 对宏观经济决策部门及时、准确地把握青海经济运行态势起到了关键的作用。因此基于GMDH模型的经济做预测, 数据非常重要, 本文就是将统计数据导入到数据库后, 建立预测模型, 模型的预测结果较准确, 显示了GDMH模型预测经济的优越性。

1 预测模型与实现原理简介

数据分组处理方法GMDH是由乌克兰科学院Ivakhnenko A G院士于1967 年首次提出的。

1. 1 GMDH算法思想

GMDH算法是建立在“进化—遗传—变异—选择”的进化论原理基础上的, 重复这样一个遗传、变异、选择和进化的过程, 使中间待选模型的复杂度不断增加, 直至得到最优复杂度模型。

1. 2 GMDH自回归模型

GMDH自回归模型主要包含两个任务: 1) 从数据样本中挖掘 ( 估计) 系统变量之间未知的相关性; 2) 利用前一步中估计的相关性来解决问题, 对系统变量进行预测。

自组织建模算法的主要步骤 (如图1所示) :

1将观测样本数据分成训练集和检测集;

2在每阶段按不同的变量和增长的复杂度产生待选模型;

3对于参数模型, 在训练集上估计未知参数;

4 在每阶段利用检测集的数据选出一些最好的模型;

5 当重复步骤2 - 4时, 随着进程的发展, 模型的复杂度也增长。否则, 选择最终的最优复杂度模型。

因此自组织区别于一般回归模型的最大的优点是它将数据分为训练集和测试集, 在训练集上使用内准则进行参数估计得到中间待选模型, 而在测试集上使用外准则进行中间候选模型的选择, 这个过程不断重复直到外准则值不能再改善才停止, 这样的停止法则可以保证在一定噪声水平下得到数据拟合精度和预测能力之间实现最优平衡的最优复杂度模型, 不会出现一般的回归方法中常出现的过拟合而牺牲了预测能力的现象。而GMDH自回归模型是将自组织数据挖掘中的GMDH算法与传统自回归模型相结合而产生的一种预测方法。与传统的自回归分析方法相比, GMDH自回归模型在小样本区间上能较好地进行系统的拟合预测工作。

1. 3 GMDH改进算法

令x1, x2, …, xm为系统的m个可测变量, 第一层将这m个变量进行两两组合, 是关于xi, xj的局部模型方程, M1是第一层产生的所有局部模型的个数, m个变量共有Cm2个局部模型。a0j, a1j, a2j, j = 1, 2, …, M1是在训练集上估计出的参数系数。通过外准则在M1个局部变量中选择F1个模型作为第二层的输入。第二层将产生个形如局部模型。同理, 假设有F2个模型选出作为第三层, 则将会有个局部模型产生。重复上述过程, 直到拟合次数到达用户所指定的界限, 则拟合结束。

改进的方法在于合理地运用外推准则。可以对每次拟合后的结果依据外推准则进行优化, 即第一次拟合后, 选取其中误差较少的若干项 ( 这样就避免了庞大的计算量, 在一定程度上也不会失去准确性) 作为第二次的输入, 同理, 将第二次拟合的结果再次进行筛选……当拟合到一定程度, 根据外准则选出最优复杂度模型作为最终的模型方程 ( 模型实例如图2 所示) 。

研究使用的外推准则有两个:

一是误差平方和最小。求出局部模型方程之后, 根据测试集估计输出值, 再根据实际值, 计算误差。

二是每一层模型方程所包含的变量个数少于给定的值。第二层拟合时每个局部模型包含两个原始变量, 第三层拟合时每个局部模型可能包含3 个或者4 个原始变量, 随着拟合次数的递增, 局部模型中包含的原始变量的个数也在不断增加, 当原始变量的个数趋近于整个数据集的时候所得到的模型将没有意义, 不能说明GDP与哪些经济数据有关系, 在拟合的过程中应该控制原始变量的增长。在本实验中前三层拟合由于原始变量较少不予控制, 第四层拟合是每个局部模型包含的原始变量少于6 个, 第五层少于7 个, …, 第8 层及以后少于10 个的情况。

2 运用GMDH算法的拟合实例分析

我们运用上述方法对青海省的经济做出了分析, 并取得了良好的效果。

样本数据: 青海省1989 年- 2009 年的经济指标数据, 所选指标如表1 所示。

2. 1 建立预测模型

5次多层迭代的最终模型的误差平方和如下所示:

最小值:7.92625935489976E-13

最小值:0.000319967345048541

最小值:5.32295670013267E-05

最小值:0.00236432673186722

最小值:0.00535586972844482

可知第一次多层迭代的误差最小, 对其进行回溯求得模型方程为:

模型包含的原始变量的位置为:

6, 14, 29, 41, 58, 66, 67, 70

映射之后原始变量的名称为:

人均生产总值、自然增长率、肉类产量、出口额、民用车辆拥有量、农村居民人均食品消费支出、农村居民人均居住面积、普通高校在校人数。

2. 2 结果分析

根据上述例子所选出的自变量得到的模型方程表明出口额对于GDP的增长的影响因素最大, 而GDP的增长与人口增长率成反比。

本项目在一定程度上实现了对青海省GDP的增长模型的探究, 找出了与GDP相关的一些因素。因为建模过程中仅仅是针对当期数据进行建模, 有一定的滞后性, 但其本身对经济的预测还是有一定的准确性。就其本身建模, 由于GMDH算法对训练集和测试按分组的不同导致每次建模的结果都不同, 也就是GDP的影响因素不一致。

经济的预测对于宏观调控具有很高的价值, 对于GMDH算法如何更准确地对经济进行预测还有待我们继续对GMDH算法进行改进以更好地预测未来经济趋势, 以利于我们的政府部门做出更适合未来的规划。

3 结语

本文在传统GMDH模型的经济预测方法的基础上改进了部分方法。实例中引进72 个指标对青海省的经济进行短期预测, 根据时间的推移, 模型是动态变化的。GMDH模型对经济发展前景作出科学准确地预测, 使青海省有关部门能根据预测结果和对实际情况的分析作出正确地决策, 为制定经济政策、编制发展规划及检查政策、规划执行情况提供科学依据。

摘要:将青海省1989年到2009年的GDP统计数据作为预测时的原始数据, 建立GMDH (Group Method of Data Handling) 自回归预测模型。由于要处理数据量十分庞大, 而传统的GMDH算法每次拟合都会造成数据量的急剧增加, 因此提出更加有效的GMDH改进算法。根据改进的GMDH预测模型的预测结果及对比表明, 基于改进的GMDH自回归经济预测模型的拟合效果和预测结果, 在经济正常增长或出现较大波动时都具有较高的可靠性与准确性。

关键词:预测建模,改进的GMDH,GDP预测

参考文献

[1]贺昌政.自组织数据挖掘与经济预测[M].北京:科学出版社, 2005.

[2]何跃, 马海霞.基于GMDH的宏观经济景气预测模型及应用[J].统计与决策, 2007 (6) :52-54.

[3]张宾, 贺昌政.GMDH算法的终止法则研究[J].吉林大学学报:信息科学版, 2005 (3) :257-262.

[4]腾格尔, 何跃.基于GMDH组合的中国GDP预测模型研究[J].统计与决策, 2010 (7) :17-19.

[5]朱帮助, 魏一鸣.基于GMDH一PSO一LSSVM的国际碳市场价格预测[J].系统工程理论与实践, 2011 (12) :2264-2271.

[6]张秋菊, 朱帮助.一种改进的GMDH算法[J].郑州大学学报:理学版, 2010 (1) :9-13.

[7]何跃, 杨剑, 徐玖平.基于GMDH的组合预测模型应用研究[J].计算机应用, 2007 (2) :456-458.

[8]Liu Guangzhong.Application of Analog Complexing Algorithm to Financial Forecasting[J].运筹学学报, 2002, 6 (3) .

[9]贺昌政.自组织组合预测方法及其应用[J].数量经济技术经济研究, 2002 (2) :84-87.

[10]Mueller J A, Lemke Frank.Self-organizing Data Mining[M].Ham burg, Libri, 2000.

[11]Ivakhnenko A G, Kozubovski S F, Yu V Kostenko.Objective System Analysis of Macroeconomic Systems[J].Syst.Anal.Model.Simul.I, 1990, 3:200-201.

GMDH模型 篇2

经过长期的发展, 宏观经济预测研究在建立与使用定量预测模型和定性预测模型等诸多方面取得了长足的进步。由乌克兰科学院A.G.Ivakhnenko首次提出的GMDH算法, 兼具定性定量的研究特点, 较好的剔除了个人主观因素对指标的干扰, 结合Know ledg e Miner软件能够建立较优的经济预测模型,

成都市的经济总量占全省的32%, 人均年GDP名列中国西部省会第一, 采用成都市的指标作为对象具有很强的说服力。

二、GMDH自回归模型介绍

数据分组处理方法 (简称GMDH) 是一种基于遗传进化的演化方法, 它依据给定的准则从一系列候选模型集合中挑选较优模型。GMDH算法通过遗传变异和筛选, 产生很多具有不断增长复杂度的候选模型, 直至模型在观测样本数据上产生过拟合为止。该方法需要一定量的初始模型, 这些初始模型 (或称神经元) 可以通过微分或差分方程组, 或者是它们的解来描述。

GMDH自回归模型基于黑箱方法, 从输入输出数据的样本来分析系统, 并通过基本函数网络来描述复杂函数, 因此很适合对周期性比较强的数据进行预测, 预测效果较好。

三、模型构建与比较分析

假设:X 1—GDP, X 2—财政收入, X 3—财政支出, X 4—社会消费品零售总额, X 5—城市居民就业人口

为了增强可比性, 均采用数据长度29, 其中检验集为1978年~2000年23年的原始数据, 相关模型输入变量个数34, 训练集为2001年~2006年的数据, 最大时滞均为6, 由Knowledg e M iner软件分别建立预测模型对比结果如表。数据来源于成都市2007年统计年鉴。

可见, 以GDP (X 1) 为因变量的预测模型筛选出输入变量财政收入 (X 2) , 社会消费品零售总额 (X 4) , 城市居民就业人口 (X 5) , 说明, 财政收入、社会消费品零售总额、城市居民就业人口在某种程度上影响着GDP, 而社会消费品零售总额、城市居民就业人口因为存在一定的线性关系导致X 4、X 5的系数为负。对于财政收入来说, 受到社会消费品零售总额和财政支出的影响, 同时, 从财政支出的预测模型来看财政收入, 社会消费品零售总额又是财政支出的影响因素, 本次指标体系的城市居民就业人口指标没有受到其它指标的影响。

结合成都市宏观经济的经济现状, 特别是针对成都市GDP来说, GDP的计算包括了财政收入, 社会消费品零售总额, 而城市居民就业人口通过影响职工的工资收入同样影响着GDP的数据, 可见通过Knowledg e Miner可辨别指标之间某些内在联系, 实际可行。

对比两种建模结果的PE S S (预测误差的平方和) , 有, X 1 (GDP) , X 2 (财政收入) , X 3 (财政支出) , X 4 (社会消费品零售总额) 四个指标都或多或少的受到其他指标的影响, 而X 5 (城市居民就业人口) 模型的内生变量不包含其他任何指标, 针对相同的指标所建立的预测模型, 对比可看出X 1 (GDP) , X 2 (财政收入) , X 3 (财政支出) , X 4 (社会消费品零售总额) 四个指标的单指标自回归模型的PE SS值明显劣于相关自回归模型, 而对于不包含其他指标的X 5 (城市居民就业人口) 则正好相反, 由此可推出, 使用knowledg eminer进行经济预测时, 先分析各指标间的相关性, 再选择相应的自组织数据挖掘算法效果更佳。

四、结术语

采用定性和定量分析相结合的方法对成都市宏观经济主要指标建立预测模型后, 本人发现使用knowledg eminer在进行经济预测建模时, 首先进行相关自回归建模, 后再使用单指标自回归模型, 能够有效的提高预测的准确度。

参考文献

GMDH模型 篇3

关键词:GMDH网络,模糊逻辑,反馈,短期风速预测

0 引言

近年来,世界范围内掀起了一股智能电网的研究热潮,作为智能电网的重要组成部分,风力发电被认为是最有希望大规模应用的可再生能源技术,国内外对风力发电的研究越来越深入,相继制订出了很多风电并网导则。然而,由于风电的随机性较强,盲目的大规模上网必将导致系统稳定性、电能质量等一系列问题,严重影响电力系统的正常运行。为了优化风电调度、同时便于风电竞价上网,除了采用各种电力电子设备和储能设备进行软并网以外,提高风速预测精度被认为是最为经济有效的方法之一。

目前的风速预测方法主要有时间序列法(ARIMA)[1,2]、卡尔曼滤波法[3]、人工神经网络法(ANN)[4,5,6]、模糊逻辑法(FL)[7,8],以及最新出现的支持向量机(SVM)[9]预测法。另外,很多学者提出了各种混合模型用于预测研究,文献[10]将时间序列法与神经网络相结合,提出了一种滚动式权值调整方法;文献[11]将时间序列法与卡尔曼滤波算法相结合,通过时间序列法建立模型进而推导出卡尔曼状态和预测方程;文献[12]将人工神经网络与空间相关性法相结合用于爱琴海中南部岛屿的风速预测;文献[13]将禁忌搜索法引入人工神经网络。这些方法都在一定程度上取得了较好的效果。本文将采用改进的模糊GMDH网络对浙江沿海某风电场风速进行预测。

GMDH网络也称为多项式网络,可通过多层神经元的取舍和权值调整拟合复杂的非线性规律,由于网络结构能够在训练中不断调整,该方法常用于各种预测;而模糊网络能够有效地反映系统的不确定信息。本文将二者的优点结合起来,采用带反馈的模糊GMDH网络对风速时间序列进行研究。

1 GMDH网络预测

1.1 GMDH网络结构

GMDH(Group Method of Data Handing)网络最早由前苏联科学家Ivakhnenko提出,该网络基于多层神经网络的自组织思想,通过各层网络神经元之间不断二元组合来拟合非线性系统的K-G多项式:

首先,系统各输入单元通过交叉组合产生一层活动神经元,从这些产生的神经元中选择与预测目标值最为接近的部分神经元作为下次网络的输入元,如此强强结合,不断竞争选择产生新层,直到所有新产生的神经元都没有上代更优秀时,进化过程结束。图1为一个训练好的典型GMDH网络。

从图中可以看出,任一神经元都以上层网络中的两个神经元输出作为其输入,首先从系统输入变量[x1,x2,x3,x4]开始,对每一对输入量[xi,xj]按式(2)进行非线性拟合:

其中:wk为各层权系数;xk为输入向量;y为神经元输出。显然,四个系统输入两两组合将产生六个新的神经元,根据RRMSE准则,选择其中拟合效果较好的四个替代系统输入元作为下层网络输入,删除拟合效果不好的部分(黑色神经元),不断重复这一过程,得到如图1的典型GMDH网络,反向回推即可得到复杂的K-G多项式,具体构建过程如图2所示。

1.2 网络权值调整

采用Widrow-Hoff学习规则

对GMDH网络权系数wk进行调整,其中λ为学习速率,取值一般在(0.1,1)之间,yˆ为某时刻的实际输出。将数据分为训练样本、测试样本和预测样本,以历史风速值作为网络输入,下一时刻风速值作为网络输出,将训练数据作用于网络,第一层神经元的均方差之和不再减小时,停止训练;再将测试样本作用于网络,以相对均方误差的均值作为阈值,大于阈值的神经元被删除[14],不再参与第二层网络的生成。

2 改进的模糊GMDH网络预测

2.1 模糊逻辑

模糊逻辑可以通过IF-THEN语言规则,以接近人类思维的方式获取系统的不确定信息,这些语言规则能够不断地修改更正从而拟合系统的内在规律性。以下Gauss函数被选择为隶属函数:

其中:xi为输入变量;cij和σij分别为第i个输入元第j个隶属函数的中心和宽度;r为输入变量总数;u为每个变量对应隶属函数的数量。

T-范数层采用乘积算子,每个节点代表一个模糊规则的IF部分,该层节点数即为模糊规则数,第j个节点的输出为:

输出层采用上述TSK模型,得到最后的输出为:

2.2 带反馈的模糊GMDH网络

在传统GMDH网络基础上将中间层神经元模糊化,同时引入反馈环,就形成了带反馈的模糊GMDH网络(NF-GMDH-FL)[15],如图3所示,该网络只有三层,模糊神经元及输出层的参数通过不断循环迭代得到。第一次循环训练中,将预测点前一时刻的实际值作为反馈输入;第二次及其之后的循环训练中,则以上次网络循环的网络输出作为反馈输入,该反馈的引入能够反映网络预测误差趋势的相关信息,使得网络参数向着减少误差的方向进行调整,不断提高预测精度。

2.3 网络训练

对于输出层,采用上述Widrow-Hoff学习规则进行权值调整。对于模糊层,为提高初始阶段收敛速度,本文在传统的最大梯度法基础上采用了如式(7)指数型能量函数[6]作为目标误差函数。

其中:,β>1为参数,根据TSK模型式(6),参数aji可按式(8)修正。

其中:η1为学习率;

根据隶属度式(5),参数cji和σji可按式(9)和式(10)修正:

采用NF-GMDH-FL进行预测时,需将样本分为训练样本和预测样本,训练样本用作参数调整和测试,相对均方根误差RRMSE为:

其中:ŷi和yi分别为第i个实测值和预测值;n为预测点个数。当RRMSE变小时,记录下各个权值,变大时不做改变,达到设定迭代次数时停止训练。

3 算例分析

3.1 原始数据分析

本文以浙江沿海某风电场2007年9月1日至2007年11月29日的风速数据对上述方法进行仿真研究。该风电场的风速变化存在明显的非线性,该时段内最大最小风速分别为48.4 m/s、0.4 m/s。以下分别进行半小时和1小时风速预测,半小时预测中,以9月1日至21日风速(共1 008组)作为训练数据,对9月22日至25日共192个风速点进行预测;1小时预测中,以9月1日至11月25日风速(共2 064组)作为训练数据,对11月26日至29日共96个风速点进行预测。

3.2 GMDH网络输入变量选择

为了运用上述改进的GMDH网络对风电场风速建模,首先需要选择合适的历史数据点作为输入变量,可利用ARIMA模型对原始数据进行分析,选择相关性最大的历史点,ARIMA(p,d,q)模型可表示为:

式中:at为正态白噪声;B为移位算子。以半小时预测为例,前1 008个点的风速序列x0和前20个自相关函数值如图4所示,可见,自相关系数不能快速衰减到零,第20位的自相关系数仍达到0.811 6,原始风速序列非平稳,需进行平稳化处理。

经过对原始风速序列x0进行二阶差分变换,得到差分后序列x2及其前20个自相关系数如图5所示,由图可知,经过二阶差分后数据不断振荡,自相关系数能够较快衰减到零,说明序列已经平稳。

根据以上分析可将模型识别为ARIMA(p,2,q),进一步对p=0,1,2,3;q=0,1,2,3的多组可能的阶数进行参数估计和模型检验,考虑到平稳性和可逆性条件,运用SPSS统计软件,根据AIC准则将模型确定为ARIMA(2,2,1)。

由于风速与气象因素相关性较大,因此,将温度也作为输入变量,提高预测精度。整个时段的温度变化趋势如图6所示,可以看到温度随时间存在明显的线性和周期变化趋势。

综上,GMDH网络的输入量可确定为最近4个历史值、温度值、最近一个残差值及预测值(反馈输入),将下一时刻的风速作为其输出。

3.3 训练和预测结果

将输入历史风速数据模糊化,经过多次试验,将最佳模糊规则数选为3,初始隶属函数如图7所示,当风速大于和小于均值时,每一个隶属函数都采用了不同的方差,相应地,在进行网络权值训练时,需要分别加以调整。

将风速数据按照式(12)进行归一化处理。

式中:x0为实际负荷数据值;x0max为历史负荷数据的最大值;x0min为历史负荷数据的最小值;xnorm为经过归一化处理的负荷数据。经过归一化处理,能够有效地避免网络训练中出现过拟合。

训练过程中,参数β取1.8,λ取0.01,η1、η2、η3取0.001,进行200次迭代,相对均方差能保持基本稳定。分别以E和J作为误差目标函数时,RRMSE的变化趋势如图8所示,可见,后者能够在初始阶段明显地提高网络收敛速度。RRMSE最小值出现在第95次迭代处,记录此时的网络参数,对后4天风速进行预测。

为了验证方法的有效性,分别采用BP神经网络以及传统GMDH网络进行预测,不断进行实验得到最佳的网络结构和训练参数,对相同时间段进行预测,三种方法以及实测风速曲线如图9所示。可见改进的模糊GMDH网络能够明显提高预测精度。

为方便理解起见,假设某日的半小时风速预测结果为y1,y2,,y48,则按照式(11)便可以求出该日预测结果的相对均方差RRMSE,此时,n=48。表1列出了该风电场2007年9月22日至25日风速预测RRMSE的详细比较结果。从表中可以看出,BP算法对后4天风速预测的相对均方误差为11.40%,采用GMDH算法提高了大约2.6%左右,采用本文提出的改进模糊GMDH算法,预测结果进一步提高了2%,可达到6.82%。

对于1小时预测,网络的建模、训练和预测过程与半小时预测相同,只是样本数据量不同,为节约篇幅,只给出预测曲线和误差比较,如图10和表2所示。

从图10中可看出,改进GMDH网络的预测精度相对较高,在11月29日的风速低谷突变时段,改进网络的预测效果明显好于其他两种方法,说明该网络能够较好地处理风速的强波动性,有效提高了预测的精度。对比表1和表2可以看出,在半小时预测中,GMDH预测误差小于BP网络;而在1小时预测中,GMDH预测误差却大于BP网络。这可能是由于随着预测时段和系统复杂度的增加,传统GMDH网络在构建过程中删除了对预测效果影响较大的神经元,导致预测效果没有BP网络平稳,泛化能力下降较快,而改进的GMDH网络则克服了该缺陷,通过增加反馈输入和模糊化处理提高了网络本身的复杂度,预测精度较为稳定准确。

由于风电的并网调度需要预测风电出力,本文对此做了进一步研究,该风电场的切入、切出以及额定风速分别为3 m/s、25 m/s和16 m/s。根据风速预测数据和风电机组概率特性曲线,得到风电出力的预测结果,三种方法的预测误差结果也同时列于表1和表2中,可见,改进GMDH网络的预测精度更高,但风电预测误差总是大于相应的风速预测误差,这是由于风速和风电之间存在着非线性的对应关系,使得风电的规律性比风速更差,因而预测精度相对较低。

4 结论

(1)本文在传统GMDH网络基础上引入模糊逻辑和反馈环,将数据信息和语义信息相结合,该混合算法用于浙江沿海某风电场风速预测,通过与传统GMDH网络及BP神经网络进行比较,表明通过较小的改进能够明显提高风速预测的精度。

(2)通过引入指数型能量函数作为目标函数,在网络训练之初,误差E较大,误差下降速度较快,且容易跳出局部最优;当训练一定次数之后,误差减小,此时误差下降速度也变小,收敛过程平稳。试验证明,该方法能够有效地提高收敛速度。

GMDH模型 篇4

关键词:钢铁工业,GMDH,发展策略

四川钢铁工业是我省国民经济发展的重要基础原材料工业。经过建国以来的发展,四川已成为全国生产钢铁的大省,但不是强省。2005年,我省钢铁行业生产能力为1320万吨,实际钢产量1094万吨。而在2005年四川对钢铁的需求达到1300万吨,发展步伐与东部其他地区相比却相对较缓,特别是上海,在宝钢的引领下钢铁工业取得了很大的发展。影响钢铁工业发展的因素非常多,是否能找到影响四川钢铁工业发展的主要因素就显得非常重要了,这关系到能否找到适合四川钢铁工业发展的合适策略。

本文将运用G M D H方法在定量分析的基础上,对四川钢铁工业发展的策略进行思考。

一、GMDH算法原理

G M D H也叫做数据分组处理技术。若系统有m个输入变量x1x2……,xm;输出为Y。G M D H的目的就是要建立起输入与输出关系的模型。该模型一般为复杂非线性模型。

一种最简单建立模型的方法就是f的形式已知,系数待定,我们可以通过非线性参数估计去确定模型。但是f的形式往往是复杂未知的。解决的方法之一就是用volterra级数展开的多项式去逼近f:

这样的多项式随着次数和变量个数的增加,其项数也急剧增加,因而很难确定。然而这个方法很好的解决了这一问题,它允许参加计算的变量个数多,而且多项式也不复杂。其原理就是为了得到最终的完全实现式(2.1),可先分层考虑一系列的“部分实现”。所谓部分实现就是由任意两个输入变量构成的二元二次完全多项式函数。该函数可用输入输出的数据确定。

通过最小二乘法使均方误差最小来确定系数…, 5。第一层共有m (m-1) /2个部分实现, 即:

, 在第一层用输入输出数据得到各个部分实现, 将留下的好的部分实现 (通过某种外补充准则) 作为下一层部分实现的输入, 作为第二层的部分实现。

这样每层都通过一定的外补充原则保留部分好的实现,舍去一部分坏的实现,一层层的进行下去,直到找到近似程度满意的部分实现为止,而最后这个部分实现就是所求的完全实现。

二、运用GMDH方法建立钢铁行业竞争力模型

1、输入指标的确定

影响产业竞争力的因素很多,而且对于具体不同的产业,其影响因素也会有比较大的不同。GMDH方法建模的一个特点就是:可以在建模过程中部分地消除建模者的参与,而赋予计算机选择的充分自由。建模者要完成的仅仅是提供原始数据、外准则及运算的顺序。所以,我们就可以根据钢铁行业的特点选取比较多的备筛选经济指标作为自组织建模输入指标。最后根据建立的模型建立我们的关于四川钢铁行业的产业竞争力评价指标体系。

这里我们选取产业竞争力综合评价指标体系,这个产业竞争力综合评价指标体系由4个一级指标组成,分别是:生产竞争力、市场竞争力、技术竞争力、资本竞争力,我们再加上一个确实存在的、但是学者们几乎没有研究过的一组指标——国有经济布局和结构指标,一共5个一级指标作为我们的自组织建模输入指标。而这些一级指标又各自展开,共形成17个二级指标。分别是:工业总产值、工业增加值、增加值率、成本费用利润率、全员劳动生产率、市场占有率、产品销售率、新产品产值、新产品产值率、固定资产原值、固定资产净值、固定资产新度系数、总资产贡献率、资本保值增值率、流动资产周转率、国有及国有控股企业比重、国有及国有控股大型企比重。记为x1、x2….x17。

2、输出指标的确定

工业经济效益综合指数是综合衡量工业经济效益各个方面在数量上总体水平的一种特殊相对数,是反映工业经济运行质量的总量指标。而某个产业的竞争力的强弱在很大程度取决于工业经济运行质量的好坏。所以在进行影响四川省钢铁产业竞争力自组织建模的时候,以工业经济效益综合指数作为模型的输出是合适的,同时也是合理的。

它是以各单项工业经济效益指标报告期实用数值分别除以该项指标的全国标准值并乘以各自权数,加总后除以总权数求得。新指标体系由7项指标组成,工业经济效益综合指数以7个单项工业经济效益指标报告期实际数值分别除以该指标的全国标准值并乘以各自权数,加总后除以总权数求得。总资产贡献率、成本费用利润率、资本保值增值率、资产负债率、流动资产周转、工业全员劳动生产率、产品销售率。

3、模型的建立

选取四川省1996年-2005年和上海市1996年-2005年共20年的钢铁行业的工业统计数据, 通过计算得到17个输入指标的20组值:而直接通过计算得到的指标值的量纲不是都相同, 在这里还要进行归一化处理。同样, 选取1996年-2005年四川和

同样,选取1996年-2005年四川和上海每一年相应的钢铁行业经济效益综合指数。我们把这20组(四川10组、上海》10组)钢铁行业经济效益综合指数作为我们建立钢铁行业竞争力自组织模型的输出

运用G M D H软件(k n o w l e d g e miner),计算机筛选出最优复杂度模型:

分析这个模型,全员劳动生产率的系数最大,为0.812535,说明这个因素对钢铁行业竞争力的影响是最大的,目前世界工业的发展已经从劳动力密集型向技术密集型转变。

然后就是国有及国有控股中大型企业的比重这个影响因素,它的系数达到了0.465456,当前四川乃至中国钢铁行业都存在产业集中度偏低而导致的竞争力不强的问题,所以大型企业的比重越大,那么产业集中度也自然的会提高,竞争力也会随之加强。

国有及国有控股企业的比重这个影响因素的系数是0.183657,说明此因素对钢铁行业的产业竞争力也具有比较大的影响。钢铁行业是个比较特殊的行业,其设备及其资金的投入要求非常大,特别是钢铁产业发展政策》的出台,又进一步加大了对钢铁企业资金投入的要求。而资本雄厚正好是国有经济的优势,所以这一影响因素在当前形势下的钢铁工业行业的竞争力提升将有着越来越重要的分量。

总资产贡献率在模型中的系数为0.138683,其对钢铁行业产业竞争力的影响也不小。而工业总产值、增加值率、固定资产净值这3个影响因素的系数不是很大,但对钢铁行业产业竞争力的影响也不能忽视。

在这个模型中我们可以发现,国有及国有控股企业的比重以及国有及国有控股中大型企业的比重这两个影响因素对钢铁行业的产业竞争力有着非常大的影响。这在前人的研究中,很少有从这个视角进行思考的。

4、四川钢铁工业发展策略的思考

基于上面的分析,四川省钢铁工业今后的发展策略可以从以下方面进行思考:

第一,四川钢铁行业国有经济应该加大投资或者控股,继续增大在整个行业中的比重。

第二,四川钢铁行业国有及国有控股企业应该加快内部重组或者对其他一些钢铁企业的并购,进一步增大行业内国有及国有控股大型企业的比重,提高四川钢铁产业集中度。

第三,发挥龙头带动力,提高产业集中度。考虑把国有企业攀钢集团发展成为在全国乃至世界都有竞争力的超大型企业,以此进一步带动四川钢铁产业的发展。

第四,优化四川省钢铁产业特别是其国有经济的空间布局。四川省自身的地理位置导致了交通的不便,我们只能通过自身的布局来弥补,把企业迁往城区外铁路、水运方便或者靠近省内产矿区的区域。

第五,四川省钢铁产业特别是其国有经济暂时不要在产量上扩张,主要以区域内矿石的可持续供应能力确定产量。

第六,进一步调整四川钢铁产业特别是国有企业的产品结构,集中力量培育企业的优质产品,发展需求大、在国内外市场上有竞争力的高附加值产品品种及关键的特殊钢品种。

第七,进行四川钢铁产业的工艺技术装备结构调整。

第八,整合四川省钢铁产业上下游企业。

参考文献

[1]、周博.解读工业经济效益综合指数[J].北京统计, 2003-08

[2]、田书华.产业集中度低中国钢铁业的顽疾[J].中国投资, 2005, (6)

【GMDH模型】推荐阅读:

模型组织07-14

提升模型07-15

稳态模型07-17

演示模型07-17

机翼模型07-18

接头模型07-18

农户模型07-19

模型细化10-13

指派模型10-14

查询模型10-15

上一篇:建筑工程的测绘途径下一篇:上市公司经营业绩