比较建模论文(精选6篇)
比较建模论文 篇1
摘要:本文研究了多变量回归、灰色系统理论、神经网络和遗传算法预测建模原理和步骤, 以河南农业大学文法学院图书室图书借阅量预测模型构建为例, 对四种建模方法的建模过程进行了优化和简化分析。用部分图书的年借阅量作为样本数据, 预测了2013年这两种图书的借阅量, 并与记录值进行了比较, 表明遗传算法更适合于图书室小样本借阅量的预测。
关键词:变量回归,灰色理论,神经网络,遗传算法
0前言
在信息社会, 纸质图书的流通频率对构建学习型社会非常重要, 一定周期内的不同类型的图书借阅量反映了该社会公民的整体素养。借阅趋势分析是图书管理员的日常工作之一, 通过对借阅规律分析, 管理员能够掌握师生的借阅兴趣和研究状况, 各类图书和期刊的采购数量和质量, 达到更好的为师生服务的目的。建立恰当的数学模型能够预测未来一定时间段内图书的借阅规律, 常见的借阅规律预测模型建模方法有以下几种:多变量回归分析法、神经网络、灰色系统理论和遗传算法等[1]。在上述方法中, 多变量回归分析方法是基础, 其它几种方法都是基于该方法演变而来, 是最通用的方法[2]。神经网络算法也是数学建模中常用算法, 该算法有很强的非线性拟合能力, 可映射任意复杂的非线性关系, 学习规则简单, 鲁棒性、记忆能力、能力和自学习能力强大, 但该算法没能力来解释自己的推理过程和推理依据, 训练模型的数据量庞大, 计算过程容易造成信息的丢失;与神经网络建模方法相比, 灰色系统理论建模过程清晰简单, 模型稳定性比较好, 但预测精度有待提高。遗传算法属于全局搜索算法, 采用仿生学原理模拟自然进化过程择优搜索, 该方法适用范围广, 在一定域内总能找到目标解, 但模型容易“早熟”, 难以到达最优解, 属于随机算法[3,4]。本文对上述四种建模方法的建模过程进行分析, 对数学模型的优缺点进行评价, 为图书管理员和图书管理科研工作者提供一定的参考。
1 多变量回归建模预测图书借阅量
1.1 建模原理
回归分析是一种分析变量之间关系的数理统计方法。对于待分析的数据和变量, 虽然变量之间没有确定的数学关系, 但可以找出最能代表它们之间关系的数学表达式:数学模型。在图书借阅规律研究方面, 有两方面的应用, 一是根据师生以往和现在的借阅状况, 预测图书将来的借阅状况;二是对影响借阅状况的原因进行分析, 找出哪些是重要因素, 哪些是次要因素, 这些因素之间又有什么关系等等。
1.2 建模过程
使用多变量回归分析方法得到的图书预测模型通常表示为时间变量的多项式, 并利用最小二乘原理求得多项式的系数, 主要求解步骤如下:
(1) 根据待借阅预测的图书数量, 预测模型通常可表示为下列多项式:
其中:
式中:y为各种图书的预测借阅量;m为n×n维模型系数矩阵;x为模型计算参数;c为n维待求常数向量。
(2) 将各种图书历年的借阅数据代入方程式 (1) 中, 计算出系数矩阵和常数项。
(3) 将系数带入方程 (1) , 计算借阅预测值。
(4) 计算拟合残差, 评估预测结果的可靠性。
2 神经网络建模预测图书借阅量
2.1 神经网络建模原理
神经网络建模的基本原理是:各种图书历年的借阅样本数据通过模型的中间层作用于输出层, 经过非线形变换, 产生输出的模拟值, 模型训练的数据包括输入矩阵和期望矩阵。模型输出值和期望值之间的偏差量, 通过调整输入层与隐层之间的加权值、隐层与输出层之间的加权值及阈值, 使误差沿梯度方向下降, 经过反复学习训练, 确定与最小误差相对应的网络参数 (加权值和阈值) , 训练即告停止。此时经过训练的神经网络即能对类似样本的输入数据, 自行处理输出误差最小的经过非线形转换的信息。神经网络模型结果如图1所示。
2.2 神经网络建模过程
(1) 模型初始化。给各节点间赋予一个初始权值, 一般可以设为 (-1, 1) , 设定节点间误差函数e和计算精度ε, 规定最大学习次数M。
(2) 输入样本数据, 计算各隐层神经节点的输入和输出数据值。
(3) 利用模型的输出期望和实际输出, 计算误差函数对模型节点的偏导数δm (k) ;计算隐层和输出层对神经节点的偏导数δn (k) 。
(4) 利用神经节点的计算值修正节点间的连接权值。
(5) 计算综合精度, 并判断预测值是否符合要求。
3 灰色系统理论模型预测图书借阅量
3.1 灰色系统建模原理
灰色系统模型预测, 是指对系统行为特征的发展变化进行预测, 对既含有白信息又含有灰色信息的系统进行预测。很多情况下, 样本数据中所显示的信息具有随机性, 但随机的信息中也包含了时序的特征, 灰色模型预测就是利用这种规律来进行预测。当前使用比较多的灰色预测模型是一阶微分的GM (1, 1) 模型。它是基于随机的原始时序, 经累加后所形成的新的时序, 该时序的规律用一阶线性微分方程的解来逼近。
3.2 预测模型建模过程
(1) 样本数据处理和GM (1, 1) 方程的构建
(2) GM (1, 1) 方程系数计算。利用公式计算出中间值y (1) (i) , 然后利用最小二乘原理计算出系数a和b, 计算公式为:
式中:C为中间值矩阵, Z为原始样本矩阵。
(3) 预测方程精度评估。精度评估主要是对模型方程的预测值和样本数据进行比较, 计算预测残差和数据间的相对误差。
(4) 预测实现。
4 遗传算法预测图书借阅量
4.1 遗传算法建模原理
遗传算法是本质上是一种寻优方法, 该方法借鉴生命学上的生物优胜劣汰原则, 不断的择优搜索系统解。该方法直接对待优化的系统进行求解, 不需要对系统进行连续性限定和对系统求偏导数, 因此在应用上更加灵活, 并且有较强的全局搜索能力。能对所有的样本数据进行优化处理, 并且自适应的调整搜索的方向, 在样本数据的渐次迭代中找到最优预测解, 而且得到的这个解象生物界的生命体进化那样, 有更强的适应性。
4.2 遗传算法用于图书预测建模过程
建模的过程参看流程图2。
5 实例分析和预测结果比较
5.1 借阅样本数据
表1显示的是河南农业大学文法学院图书室2005~2012年间两种图书的借阅量。
5.2 不同建模方法预测结果比较
(1) 表2显示的是2013年的两种图书预测结果
(2) 表3显示的两种图书的灰色模型预测结果
(3) 表4显示的两种图书的神经网络模型预测结果
(4) 表5显示的两种图书的遗传模型预测结果
5.3 预测结果分析比较
从预测结果可以看出, 遗传算法模型的预测结果比较精确, 绝对误差和相对误差都比较小, 灰色系统理论模型的预测结果相对比较弱, 神经网络模型和回归模型的预测结果介于二者之间。灰色系统理论是对数据进行逐次累加, 找到数据间的线性规律, 当原始数据间跳跃比较大时, 这种叠加出的规律线性度并不明显, 所以预测结果比较弱。遗传算法在每一步计算时, 都要进行智能择优搜索, 而且对数据间的跳跃不敏感, 所以在对这类数据进行处理和预测时, 结果相对精确。神经网络模型的精度和中间层的数量有很大的关系, 对原始样本数据量的要求也比较大, 在不满足上述条件时, 预测精度比较弱, 而回归分析对数据的间的线性度要求比较高。
6 结语
本文分析了多变量回归、灰色系统理论、神经网络和遗传算法在河南农业大学文法学院图书室图书借阅量预测模型构建方面的问题, 对四种建模方法的建模过程和建模结果进行了分析。用部分图书的年借阅量作为样本数据, 预测了2013年这两种图书的借阅量, 并与记录值进行了比较。比较得出了遗传算法更适合于图书室借阅量预测的重要结论。
参考文献
[1]刘思峰, 等.灰色系统理论及其应用[M].3版.科学出版社, 2007.
[2]陈英, 王秀山.基于灰色系统理论的农业院校院系纸质图书借阅管理研究[J].科技视界, 2003 (3) :114-116.
[3]陈英.小型图书室用的智能型多功能入侵报警系统设计[J].科技信息, 2013
[4]赵海涛.数控机床热误差实时补偿关键技术研究[D].上海交通大学图书馆, 2006.
软件可靠性建模思想的比较研究 篇2
随着科学技术的飞速发展,随着社会信息化程度的不断提高,计算机在社会中扮演着越来越重的角色,同时社会对计算机软件的需求也就越来越大,各行各业的日常运行也都越来越依赖于软件系统,这就意味着软件系统的失效给社会带来的影响也会越来越大。这也就促使了社会越来越注重软件质量的提高。众所周知,为了保证软件的质量,对软件进行穷尽测试是不现实的。那么,如何有效地评价软件的质量,在客户和开发商之间找到一个可以接受的平衡点,就成了广大的科研人员和软件开发工作者共同关注的焦点。
2 软件可靠性的概念
可靠性表示人们可以指望系统完成所期望功能的这样一些特质,它包含很多因素,如成熟性、容错性及易恢复性等。1983年美国IEEE计算机协会对“软件可靠性”正式做出如下定义:
1)在规定条件下,在规定时间内,软件不引起系统失效的概率,该概率是系统输入和系统使用的函数,也是软件中存在的错误的函数;系统输入将确定是否会遇到已存在的错误(如果错误存在的话);
2)在规定的时间周期内,在所述条件下程序执行所要求的功能的能力。
软件可靠性源于传统工业的硬件可靠性,由于软件的抽象性和高度的复杂性软件可靠性与传统的硬件可靠性有着本质上的区别。
如何快速有效的评价一个软件系统的质量好坏,是我们研究软件可靠性工程的核心。其最根本的问题就是如何建立起一个合理的、可用的软件可靠性模型以及正确的、有效的评估方法,从而保障软件的质量。从上个世纪60年代至今,国内外已经有很多的杰出的科学家们,在这个问题上取得了大量的进展,研究出了上百种软件可靠性模型。但是,到目前为止还没有研究出一个“万能”的软件可靠性模型来应用于所有的软件系统的质量评估。各种模型各有其优缺点和适用范围。
3 几种模型的主要思想
在实际的软件可靠性评估过程当中,由于软件的抽象性、复杂性和实际操作环境的不同,使得要完全精确的得出一个具体的数字是不现实的。因此,针对于不同的环境和不同情况,以及便于对问题的处理,到目前为止,绝大多数的软件可靠性模型都是建立在一定的假设条件上的,即各种模型都是一定意义上理想化的模型,不可能完全精确的反应软件的可靠性,他们反应的都是在一个可以接受的范围内的一个软件的可靠度。这也决定了各种不同模型的特点和适用范围。
3.1 J-M模型
马尔科夫过程模型是一类典型的随机过程类的软件可靠性模型,这类模型一般都是假定错误的出现率在软件无改动的区间内是常数,并且随着错误数目的减少而下降,J-M模型是最具代表性的马尔科夫模型。
基本假设:
1)程序中的固有错误数No是一个未知的常数。
2)程序中各个错误是相互独立的,每个错误导致系统发生失效的可能性大致相同,各次失效间隔时间(即错误发生间隔时间相同)也相互独立。
3)测试中检测到的错误都被排除,每次排错只排除一个错误,排除时间可以忽略不计,在排错过程中不引入新的错误。
4)程序的失效率在每个失效间隔时间内是常数,其数值正比于程序中残留的错误数,在第i个测试区间,其失效率函数为:
式中:i=1,2,…,N;
准———比例常数;
Xi———第i次失效间隔中以i-1次失效为起点的时间变量。
5)程序测试环境与预期的使用环境相同。
3.2 G-O非齐次泊松过程模型(NHPP)
G-O非齐次泊松过程模型也是一类典型的随机过程模型,其建模思想是用非齐次泊松过程开刻画软件的故障过程。
基本假设:
1)软件是在与预期的操作环境相似的条件下运行。
2)在任何时间序列|t0
3)每个错误的严重性和被检测到的可能性大致相同。
4)在t时刻检测出的累积错误数[N(t),t≥0]是一个独立增量的过程,N(t)服从期望函数M(t)的Poisson分布,在(t,t+Δt)时间区间中发现的错误数的期望值正比于t时刻剩余错误的期望值。
5)累计错误数的期望函数m(t)是一个单调有界增函数,并满足:
式中:a———最终可能被检出的失效总数的期望值。
6)错误被检测时失效是独立的。
3.3 Musa执行时间模型
Musa执行时间模型由Musa1975年提出,此模型是应用最为广泛的可靠性模型,它是最先将软件部件在计算机上的实际执行时间用于建模过程的模型之一。该模型以CPU时间为基础描述程序的可靠性特征,建立了CPU时间与日历时间的联系,并且该模型表明了程序的可靠性特征和测试过程中资源消耗的关系。
基本假设:
1)程序是在与预期操作相似的环境中运行。
2)错误的检测是相互独立的。
3)所有的软件失效都能够观察到。
4)各次失效间隔时间分段服从指数分布,即在任何一个测试区间中失效率为常数,进入下一个区间失效率改为另一个常数。
5)失效率正比于程序中残留的错误数。
6)测试中错误改正率正比于错误发生率。
7)错误识别人员,错误改正人员和计算机时间这三项资源的数量在测试过程中是固定的。
8)程序的MTBF从增加到时,资源的消耗增加量可以近似的表示为:
式中:Δγk-----指第k项资源的消耗量;
Δτ------执行时间增量,用CPU时间表示;
Δm------失效次数增量;
θk------第k次资源消耗的时间系数;
9)在测试过程中,错误识别人员可以充分使用的计算机时间是常数。
10)测试过程中错误改正人员的使用要受错误排队长度的影响,错误排队长度可由假定错误改正过程中服从Poisson过程得出,所以错误排队长度也是一个随机变量。
在这十项假设当中,前六项是研究软件可靠性特征所必须的假设,后面四项假设仅在研究软件可靠性特征与资源消耗的关系时用到。
3.4 时间序列分析模型
时间序列是指按时间顺序排列的随时间变化的数值的集合,这些数值通常是等时间间隔的测得的数据。在实际的生活中,时间序列普遍的存在,如股票的每日价格,产品销售的记录,地区的降雨量等等。在金融,经济,工程,天气预等领域时间序列建模分析的思想已经得到了广泛的应用,并且都能得到比较好的效果。
在软件可靠性建模研究当中,科研人员也正在研究应用时间序列的分析思想来进行建模,虽然研究的时间还比较短,但是也取得了一些很好的成果。
时间序列分析方法是软件可靠性建模当中的非随机过程分析方法之一,该方法是将失效数据作为时间相关序列,根据现在和过去的时序值来预测未来的时间相关的数据,同时能给出这些预测值的准确度。该方法主要考虑故障发生过程的动态特性,不需要对故障过程进行任何先决条件的假设就可以进行数据的分析,广义上来说,适用的范围相对于以上的几种模型来说要大。有效的避免了当模型的假设条件与实际的工程实践情况不一致时,导致的软件可靠性评估的无意义。
正是由于时间序列分析方法在基于传统的分析方法上,对于假设条件的要求逐步的弱化,因此,该方法引起了很多科研人员的关注,对于经典的时间序列模型在软件可靠性建模上的应用也取得了很多阶段性的成果,但是总体上来说,该类方法目前还处在尝试阶段,没有前几种方法研究的透彻。该方法的缺点也很明显,数学依赖太强,需要反复的修改模型,在选择最后模型的时候过程比较复杂。
4 各模型的比较分析
不论是在简单的短期预测中还是在较长时间段的预测中,各种模型所表现出来的可靠性度量的准确性差异很大,目前还无法给出一个普遍适应的模型,我们在评价软件可靠性模型的时候需要充分的考虑到它们与各种系统软件和实际操作环境之间的关系。
1)预报的有效性:预报的有效性是模型从软件系统现在和过去的故障行为(即失效数据)来预报其将来的故障行为的能力,即模型是否能够准确的反映出软件的可靠性,这是最重要的。
2)模型的能力:这取决于软件工程师、软件管理人员以及用户的具体要求,他们对软件可靠性评价结果的精确度的一个令人满意的要求。特别地,对于不同的用户,可能对于软件可靠性各项指标的可靠度要求并不一样,不同的模型也侧重于不同的可靠性指标。
3)假设条件的品质:模型的基本假设条件应该尽量的和实际的工程实践环境相一致。这样的模型才能更加真实的反应出软件的可靠性,得到的结果才有意义。
4)模型的适用性:模型的适用性就是模型对于不同规模、结构和功能的软件产品的适用程度。可以从软件的规模、结构;运行剖面;开发环境;测试策略;软件的完善程度等五个方面进行评价。
5)模型的易用性:应该充分的考虑到模型在实际应用中的易用性,这就需要模型具备以下三个特点:
(1)最重要的是在模型收集所需要的数据时应尽可能简单且代价较低;
(2)模型的概念简单明了,在实际应用中易于理解;
(3)模型中的参数应易于理解且估值过程简单。
5 结束语
软件可靠性工程研究已经成为了软件工程学科领域的一个重要的研究方向,其受重视程度也越来越高。基于计算机软件在各行各业中都发挥着至关重要的作用,一旦软件失效,或者出现故障,那么随之带来的损失将会及其的惨重,有时候甚至能够危害到人类的生命。
而尽管软件的可靠性问题非常重要,全世界的科研人员也都积极努力的在研究,并且也取得了许多阶段性甚至革命性的成果,但是至今仍然没有得到一个普遍的行之有效的方法来解决该问题。对于目前研究出来的数百种模型来看,不同的模型有不同的特点,适用范围以及它的侧重点。软件工程师在考虑对自己的软件系统进行可靠性评估时,应该充分的综合各方面的因素以及自己主要要求的指标来选择合适的模型。
参考文献
[1]姚珍.基于失效数据的软件可靠性评估及分析工具的实现[D].成都:电子科技大学,2007.
[2]马飒飒,王光平,赵守伟.基于时间序列的软件可靠性预测模型研究[J].计算机工程与设计,2007,28(11):2520-2523.
[3]孙勇.软件可靠性模型应用研究[D].南京:东南大学,2004.
[4]白晓波.实用软件可靠性模型探讨[J].计算机与网络,2005,7(10):149-150.
[5]邹丰忠,刘海青,王林.软件可靠性综合模型[J].武汉大学学报:工学版,2003,36(1):86-88.
三维地质建模的几种插值方法比较 篇3
三维地质建模的关键技术之一是建立三维地质模型。三维地质建模主要包含两类模型的建立:一种模型是地质体物性参数模型, 另外一种模型是地质体构造模型。
物性参数模型建模的思路有两种:直接法、数学建模方法。
当采样值在地质体内密集、规则分布时, 可以直接建立采样值到应用模型的映射关系, 把对采样值的处理转化为对物性参数的处理。实际上这种情况并不多见。
当采样值呈散乱分布, 并且数据量有限时, 则需要采用数学建模方法, 即根据采样插值, 拟合出连续的数据分布函数。在石油勘探开发领域, 由于得到的已知数据点一般呈散乱分布, 因此所采用的建模方法一般采用数学建模方法。
2 方法对比
目前常用的方法是将B-rep表达法推广到地质体模型建模中, 其所建立的模型一般称为三维地质体矢量模型。采用三维矢量模型法建立构造模型的过程是:点——>面——>体, 即:离散点——>地质面——>地质体。其中根据已有的离散点数据建立地质曲面的目的是获得地质面的几何形态描述, 而根据多个地质曲面建立地质体的目的是建立各个地质面之间、地质面与地质体之间的拓扑关系, 从而提供计算、显示以及空间分析和查询功能。因此, 由离散点重构地质面、由地质面重构地质体是地质体构造模型建模的两个关键步骤。
由以上分析可以很清楚的看出由已知散乱点插值未知点、由散乱点重构地质面是三维地质模型描述的关键问题所在。
常用的散乱数据插值方法有离散光滑插值法 (D S I) 、与距离成反比的加权法:S h e p a r d法、径向基函数插值法 (Multiquadric法) 、非线性插值法、径向基网络 (RBF网络) 学习算法、层次B样条插值法等。
前五种插值方法中, 插值曲面几乎都要通过求解联立方程组来得到, 而方程式的数目至少等于散乱点的数目。为了求解的可能性, 散乱点的数目必然受限制。因此前五种算法只能应用于几百个点的小规模散乱数据的插值。对于散乱点数目达到数千个甚至数万个的插值问题, 比较成功的方法是层次B样条插值。
上述算法可以分为全局算法和局部算法。在全局算法中, 插值函数取决于全部数据点的函数值, 当增加、删除或改变一个点的位置或者函数值时, 插值函数必须重新计算[2]。Shepard法、Multiquadric法和径向基网络法均属于这一类。对于Multiquadric法而言, 由于其依赖于权系数的选择, 在权系数选择不当时会形成病态矩阵, 导致计算求解时的困难。在局部插值算法中, 一个点的函数只影响该点附近的一个子区域。因而在增加、删除或改变一个点时, 只需要进行局部的计算。其余三种方法属于局部插值。对于离散光滑插值而言, 其优点在于可以与数据分离, 引入的是约束而不是数据本身, 其缺点在于由于在计算前要进行三角剖分, 这样会影响计算速度。对于MQS法而言, 其消除了Shepard法的一些缺陷, 因而得到了广泛的应用, 但是为了求得系数Qk需要多次求解线性方程组, 导致计算量增大影响求解速度。对于层次B样条法而言, 在面对边界不规则区域的插值问题时, 该方法的实现困难比较大。
3 结论及建议
可以看出, Shepard法的效果最差, 因此这一方法已基本不再使用。径向基网络法的效果比Shepard法效果要好一些, 计算速度也要稍快一些。Multiquadric法和紧支撑径向基函数法实现起来相对比较容易, 其插值效果也相当。必须注意的是:Multiquadric法对权系数的选取要求比较苛刻, 并且容易形成病态矩阵, 影响求解, 而紧支撑径向基函数法在不同维数的情况下要用不同的权函数, 在扩展时比较麻烦。离散光滑插值法的效果和层次B样条的效果最好, 在不同维数下计算扩展起来也比较方便。由于三角剖分和寻找相邻点的缘故, 离散光滑插值法的计算速度比层次B样条法要慢, 因此要在大规模的插值计算中使用离散光滑插值, 需要对三角剖分方法和数据结构等问题进行合理的设计。
三维地质建模中的模型描述的第一步工作等同于数据场可视化中的散乱点重建问题。而散乱点插值有许多种现成的方法, 那么是否这些方法都可以用到三地质建模中呢?很显然答案是否定的, 因为地质现象有其自身的特点, 插值时要考虑地质的现象里的制约条件及内在的规律, 选择合适的方法才能形成模型。比如沉积岩区建模中所使用的插值方法与变质岩和火成岩区的插值方法就不能相同。因为沉积岩区的上下层地质情况一般来讲是渐变的, 利用层间相似的规律, 对于上下层均有数据而中间缺少数据的情况, 可以使用内推或外插的方法来得到周围的点的值。对于变质岩区和火成岩区等层面复杂区域, 钻探的资料似乎并不能很好的反映地下情况, 插值的策略就不能墨守陈规。必须注意的是:对于个别层位或区域内独有的地质现象, 可能由于插值变成了几个层位或一片区域内都有的现象, 如:当只有某一层出现尖灭时, 就有可能由于插值的原因, 使得上下层都出现尖灭, 因此要在插值时引入人工干预或根据相应的规律进行自动的取舍, 也即插值过程应当是交互的。
由于主要目的是讨论插值问题, 所以对三角剖分问题就未加讨论, 实际上离散光滑插值与三角剖分有着密切的联系, 三角剖分的速度、查询算法及数据结构制约着插值速度。本文由于未能对三角剖分和数据结构进行合理的设计, 致使在对大规模散乱点进行插值时, 离散光滑插值法未能发挥应有的作用。
参考文献
[1]孟小红等.地质模型计算机辅助设计原理与应用;2001年, 地质出版社[1]孟小红等.地质模型计算机辅助设计原理与应用;2001年, 地质出版社
比较建模论文 篇4
关键词:结构方程建模,协方差结构的分析方法(LISREL),偏最小二乘法(PLS),应用条件
结构方程建模(Structural Equation Modeling,SEM)已渐流行,并成为十分重要的数据分析工具。SEM具有两种建模方法:一种是以协方差结构为基础的建模方法,又称LISREL(LInear Structural RELationship)建模方法;另一种是以偏最小二乘法为基础的路径建模方法,常被称为PLS(Partial Least Square)建模方法。目前,有关LISREL建模方法的研究已经较为普遍,但是关于PLS建模方法的研究却比较缺乏。例如,霍映宝介绍了ACSI模型的PLS建模算法,张新安、田澎在研究上海市客户满意度指数模型时引进了PLS建模方法的基本原理。但是,这些研究都是基于反映型模型,缺少对含有构成型模型的PLS建模方法的论述[1]。本文将针对LISREL建模方法和PLS建模方法,特别是PLS建模方法作详尽分析,在PLS建模方法分析中特别引入了含有构成型模型的研究。本文将分三部分展开,前两部分分别探讨SEM的两种建模方法—LISREL方法和PLS建模方法的原理;第三部分对两种建模方法进行比较研究,并给出各自的应用条件。
1 LISREL建模方法
LISREL具有两层含义:一是线性结构方程模型,它是协方差结构分析的典型代表,二是SEM分析软件。
1.1 基于LISREL的结构方程模型的参数估计
基于LISREL的结构方程模型包括显变量和潜变量两种变量;测量模型和结构模型两种模型。
测量模型的方程为:
x=Λxξ+εx (1)
y=Λyη+εy (2)
结构模型的方程为:
η=Bη+Γξ+ζ (3)
其中:x=(x1,x2Λxq)'为ξ的显变量构成的向量,y=(y1,y2Λyp)'为η的显变量构成的向量;Λx是x在ξ上的q*n阶因子载荷矩阵,Λy是y在η上的p*m阶因子载荷矩阵;ξ=(ξ1,ξ2,Λξn)',η=(η1,η2Ληm)',ξ、η分别表示外生潜变量和内生潜变量;εx为q*1阶测量误差向量,εy为p*1阶测量误差向量。B为m*m阶系数矩阵,表示内生潜变量η之间的影响;Γ为m*n阶系数矩阵,表示外生潜变量ξ对内生潜变量η的影响;ζ为m*1阶残差向量。
结构方程模型的基本假设为:
E=(εy)=E(εx)=E(ζ)=COV(η,εy)=COV(ξ,εx)=COV(εy,εx)=COV(ζ,ξ)=COV(ζ,εy)=COV(ζ,εx)=0
记:Θεy=COV(εy),Θεx=COV(εx),Ф=COV(ξ),Ψ=COV(ζ)
因此,显变量(y',x')的协方差矩阵∑(θ)可表示为:
undefined
其中:∑yy(θ),∑xx(θ)分别为y,x的协方差矩阵;∑yx(θ)为y与x的协方差矩阵,∑xy(θ)为x与y的协方差矩阵,undefined。
在结构方程模型中,LISREL方法的目标是估计参数使得模型隐含的协方差矩阵∑(θ)与样本协方差矩阵S之间的“差距”最小。常用的参数估计方法包括非加权最小二乘法、极大似然法、广义最小二乘法等。
1.2 基于LISREL的结构方程模型的检验与修正
根据有关理论构建的模型是否合理,尚待进行检验,对模型的检验与修正是LISREL方法的优势所在。模型检验可从三个方面进行:一是用各种拟合指数对模型进行整体评价,主要指标有x2检验、拟合优度指数(GFI)、调整自由度的拟合优度指数(AGFI)、近似误差均方根(RMSEA)、赋范拟合指数(NFI)、比较拟合指数(CFI)等;二是主要用“t”检验值对模型进行变量的显著性检验;三是根据测定系数评价方程对数据的解释能力。如果模型拟合效果不佳,需要修正模型,常用的修正办法是增加或减少自由参数个数。从纯技术的角度来说,对于具有最大修正指数的那个参数,可将其设定为自由参数,从而增加了自由参数个数;对于不显著的参数,通常将它们的值固定为0,从而减少了自由参数个数;在增加或减少自由参数个数的基础上,重新拟合模型,用相同的数据检验修正后的模型并判断模型是否需要进一步修正。
2 PLS建模方法
PLS建模方法的产生源于Herman Wold对LISREL方法提出的质疑,Wold认为现实生活中数据分布并非已知,或者并非来自正态分布,LISREL的精度受到影响,Wold提出了PLS建模方法。
PLS建模方法主要包括:潜变量值的估计和显变量解释相对应的潜变量的贡献度的确定(即显变量权重的确定);结构方程的参数估计。
2.1 基于PLS建模方法的结构方程模型的参数估计
基于PLS建模方法的结构方程模型也同样包括显变量和潜变量两种变量,测量模型和结构模型两种模型,方程同公式(1)(2)和(3)。与LISREL方法不同的是,基于LISREL的测量模型都是反映型模型(反映型模型表现为从潜变量指向显变量的连接);而基于PLS建模方法的测量模型除了反映型模型,还有构成型模型(构成型模型表现为从显变量指向潜变量的连接)。反映型模型的方程同公式(1)和(2),构成型测量模型的方程如下:
η=πηy+δη (4)
ξ=πξx+δξ (5)
其中:ξ、η、x、y的含义同LISREL方法下其各自的含义;πξ、πη分别是η*q阶系数矩阵;δξ、δη分别为n*1阶、m*1阶残差向量。
为了研究的方便性,在PLS建模中,把潜变量记为ξj,其对应的标准化潜变量外部估计值记为yj,内部估计值记为zj,对应的显变量为xjh,xjh的标准化值记为x*jh,k为迭代的标记,表示迭代次数(k=0,1,2…)。
任意给定外部权重undefined的初始值,具体的计算过程如下:
(1)外部近似:生成标准化潜变量的外部估计值。
每个潜变量可以看成是其显变量的线性组合,因此,标准化潜变量外部估计值可以写成:
undefined
其中:yundefined为第k次迭代后标准化潜变量的外部估计值,undefined为第k次迭代显变量的外部权重。
(2)内部近似:生成潜变量的内部估计值。
zj可以定义为:
undefined
其中:ejik+1为第k次迭代后的内部权重,它表示在结构方程模型中有箭头联系的两个潜变量ξj和ξi之间的关系,内部权重的确定可以采用质心法、路径加权法和因子加权法中的任意一种,如在因子加权法中,内部权重eij等于yj和yi之间的相关系数即eij(k+1) ,zj(k+1)为第k次迭代后潜变量ξj的内部估计值。
(3)外部权重估计:即确定显变量的权重。
根据公式(8)或公式(9)重新估计外部权重undefined。在确定显变量的权重时,反映型模型和构成型模型是不同的。
反映型模型显变量权重的确定:将外部权重undefined看作是xjh对内部估计zj(k+1)建立的一元线性回归模型中zj(k+1)的回归系数,由于zj(k+1)是标准化的数据,即var(zj(k+1))=1,所以undefined等于xjh与zj(k+1)的协方差,即:
undefined
构成型模型显变量权重的确定:由外部权重undefined构成的向量undefined看作是内部估计zj(k+1)对与ξj相对应的标准化显变量x*jh的多元回归系数向量,即:
undefined
其中:x*j是列向量,其中元素表示与潜变量ξj相对应的标准化的显变量x*jh。
(4)迭代完成的判断条件和最终权重的确定。
当一轮估计(包括外部近似、内部近似和权重估计)完成后,需要判断是否停止迭代,如果尚未达到停止迭代的条件,则将根据公式(8)、(9)得到的显变量权重值代入到公式(6)中,进行下一轮的迭代。常用的停止迭代条件为undefined是最终权重。
(5)计算潜变量的估计值。
通过最终权重,计算潜变量的最终估计值undefined,即undefined
其中:undefined是潜变量ζj第k+1次迭代后的最终估计值[3]。
(6)结构方程的参数估计。
利用上面得到的潜变量的估计值,进行普通最小二乘回归,对结构方程中的参数进行估计。
2.2 基于PLS建模方法的结构方程模型的检验
一个基于PLS建模方法的结构方程模型是否合理的判断标准为:参数估计是否具有有效性、测量方程和结构方程的预测能力的强弱。在对模型进行评价时,首先评价测量方程的预测效果,如果测量方程的预测效果不佳,那么结构方程的评价也将随之失去意义。具体方法如表1所示。
共同度是用来评价测量模型中的潜变量对显变量的预测能力,包括同一个潜变量下对应的各显变量是否表示大致相同的内容(称为潜变量的收敛有效性),不同的潜变量是否度量了不同的内容(称为潜变量的判别有效性)。可决系数R2是用来评价结构方程的预测能力[3]。
3 LISREL与PLS建模方法的比较
作为结构方程建模的两类方法,LISREL建模方法与PLS建模方法具有不同的特点,综合起来,LISREL建模方法与PLS建模方法在建模原理、分布假设、建模目标等几个方面存在较大不同。
(1)建模原理不同。
LISREL建模方法是以协方差结构为基础,使得理论模型隐含的协方差矩阵与样本协方差矩阵之间的“差距”最小,即“拟合函数”最小,不同的拟合函数对应不同的参数估计方法;而PIS建模方法是以方差为基础,按照上述确定外部权重和潜变量估计值的方法进行循环迭代,使得在限制条件下所有参数的估计达到收敛状态且所有预测关系中的残差方差最小。
(2)分布假设不同。
LISREL建模方法需要足够的先验理论,用于验证性研究,要求观测值服从多元正态分布且相互独立;而PLS建模方法不要求具备足够的先验理论,用于解释性和验证性研究,对观测值的分布没有严格的要求,仅仅要求满足“预测条件”,即满足一般线性回归分析的要求[4]。
(3)建模目标不同。
LISREL建模方法是以追求最优的参数,保证参数估计的准确性为目标,以验证模型内部各变量之间的关系是否通过检验,进而判断变量之间的理论关系能否被接受;而PLS建模方法是以预测的准确性为目标,形成潜变量与显变量之间的最佳线性预测关系,通过测量方程(1)(2)、结构方程(3)与因果预测方程y=Λy*(Bη+Γξ)+εy+Λyζ(即用所有潜变量来解释显变量)进行预测,使预测关系中的残差方差达到最小。
(4)模型识别不同。
LISREL建模方法中,测量模型(1)和(2)中共包含(p+q)个显变量,能够得到(p+q)*(p+q+1)/2个不同的方差和协方差,如果理论模型成立,能够得到(p+q)*(p+q+1)/2个不同的方程,如果模型中参数的个数大于(p+q)*(p+q+1)/2,则得不到唯一的参数估计值,因此LISREL建模方法存在识别问题。鉴于此,LISREL建模方法要求构建的理论模型可以被识别,从而保证能够得到唯一的参数估计值,为了使得模型可识别,在进行分析时,经常需要人为限制某些参数;而 PLS建模方法通过多次外部近似、内部近似和权重估计,最终得到了潜变量的估计值,再利用潜变量的估计值,进行普通最小二乘回归,对结构方程中的参数进行估计,因此不存在识别问题。
(5)模型复杂程度不同。
由于LISREL建模方法需要进行模型识别,因此对于特别复杂的模型,例如,模型包括了多个潜变量,同时潜变量对应的显变量个数较多的话,由于需要解释更多的协方差和方差,模型往往被拒绝;而PLS建模方法下,随着显变量个数的增加,参数估计值倾向于稳定,并收敛于参数的真值。Chin认为PLS建模方法可以解决具有100个潜变量和1 000个显变量的复杂模型,而LISREL方法只能解决少于100个显变量的复杂程度较小的模型。
(6)测量模型的形态不同。
LISREL建模方法下,测量模型只能采用反映型;而PLS建模方法既可以考虑反映型,又可以考虑构成型的测量模型。反映型和构成型测量模型的区别主要包括:第一,对显变量和潜变量的因果关系的假设不同。构成型模型假设显变量是原因,影响潜变量;反映型模型假设潜变量为原因,影响显变量,显变量是潜变量在某一方面的具体表现。第二,对潜变量所对应的显变量之间的相关关系假设和要求不同。构成型模型假设潜变量对应的显变量之间不具有必然的相关关系,因此,要求显变量之间的相关性不能超过某一限度,以避免对模型参数估计造成偏差;反映型模型中潜变量对应的显变量之间则具有内在的联系,因此对显变量之间的相关性不进行限制。
(7)潜变量取值不同。
LISREL建模方法下仅仅能够求出参数的估计值,并没有给出明确的潜变量取值,因此潜变量的取值是模糊的;而PLS建模方法通过上述外部近似、内部近似和权重估计,进行多次迭代后,不论是反映型模型还是构成型模型,得到了最终权重,进而通过显变量和最终权重可以确定潜变量的估计值。
(8)样本容量要求不同。
LISREL建模方法和PLS建模方法各自需要的样本量,研究人员具有不同的结论。Gefen、Straub和Boudreau认为,LISREL方法至少需要100—150个样本,而对于复杂模型,PLS建模方法的样本容量至少是显变量个数的10倍。Chin认为,PLS建模方法的推荐样本数为30—100,而LISREL建模方法最小的理想样本数为200—800。但不论这两种方法各自到底需要多少样本,有一点是肯定的:LISREL方法需要的样本数量多于PLS建模方法[5]。LISREL方法需要较大的样本量才能取得较为满意的结果,而PLS建模方法在较少的样本条件下即可得到相对理想的结果。
总之,LISREL建模方法与PLS建模方法存在不少差异,这种差异主要是源于两种方法的建模原理与建模目标的不同。LISREL建模方法注重模型参数估计的准确性,它以突破了传统的建模方法和发展了参数的估计理论而获得殊荣;而PLS建模方法则是以预测能力的最大化而著称[6]。
本文认为,LISREL建模方法在下列情况下是较为理想的选择:(1)模型结构的合理性是最重要的,需要检验模型对不同总体是否均可适用;(2)具备足够的先验理论和行为规律知识并以检验模型和开发新的模型为目标;(3)注重因子载荷或路径系数,并需要做进一步的统计推断。PLS建模方法在下列情况下是较为合理的选择:(1)缺乏足够的先验理论,预测的准确性是第一位的;(2)模型的主要目标是获得潜变量的得分以及预测的准确性,而不是较高的拟合优度;(3) 变量相对较多,而样本量相对较少。
参考文献
[1]廖颖林.顾客满意度指数测评方法及其应用研究[M].上海:上海财经大学出版社,2008:92-93
[2]侯杰泰,温忠麟,成子娟.结构方程模型及其应用[M].北京:教育科学出版社,2004:228-229
[3]郝冉.PLS路径建模在2007北京市诚信调查中的应用研究[D].北京:首都经济贸易大学,2008:17-19
[4]梁燕.顾客满意度模型参数估计方法的选择[J].统计与决策,2007(9):15-15
[5]CLAES FORNELL.A national customer satisfaction barometer:Theswedish experience[J].Journal of Marketing,1992(1):56-56
比较建模论文 篇5
21世纪初启动的各国与各地区数学课程改革都将学生数学建模思想的形成以及数学建模能力的培养作为数学教育的重要目标之一。例如颁布于2003年底的德国数学教育标准明确提出, 数学建模能力是学生应该发展的六大数学能力之一, 也就是说学生要学会用数学方法去理解现实相关的情景, 提出解决方案, 并认清和判断现实中的数学问题。!"中国上海地区的数学课程标准则规定将数学模型的内容作为高中学生指定选修内容之一, 让学生通过数学模型主题的学习, 不断增强自身的数学应用意识和应用能力, 并且会用数学的眼光看待周围世界, 懂得从数学的角度去思考问题。
本实验研究的重点在于比较分析学生面对某个日常情景 (如削菠萝问题) 时, 能否以及如何以数学建模思想进行思考、识别问题并解决问题, 以了解学生数学建模能力的具体表现和他们拥有的数学建模能力水平。
二、研究的理论依据
关于数学建模能力的研究成为近十年来数学教育的研究热点。为有效检验和评价数学建模能力, 研究者们对建模能力的内涵进行界定, 例如建模能力被定义为“能够在给出的现实世界中识别问题、变量或者提出假设, 然后将它们翻译成数学问题加以解决, 紧接着联系现实问题解释和检验数学问题解答的有效性。”#"我们的实验则主要参照布鲁母 (Blum) 的建模流程框架 (如图1所示) , 这个框架描述了如下7个步骤:
1.理解现实问题情境;
2.简化或结构化现实情景, 形成现实模型;
3.将被结构化的现实模型翻译为数学问题, 形成数学模型;
4.用数学方法解决所提出的数学问题, 获得数学解答;
5.根据具体的现实情景解读并检验数学解答, 获得现实结果;
6.检验现实结果的有效性;
7.反馈给现实情景。
学生在数学建模过程中将先后经历这几个不同的步骤, 每经历一个步骤, 对学生来说, 就是一个认知障碍的突破。学生在过程中行进得越远, 离目标或者问题解决就越近。我们结合具体的实验问题 (削菠萝) , 将学生的数学建模能力分为几个水平。
三、研究的方法与过程
(一) 实验设计
1. 实验问题及水平分类
本实验给学生描述了这样一个现实情景 (削菠萝) :四月刚好是菠萝的季节, 为使我们能品尝到新鲜的菠萝, 水果店都有专人帮助我们削菠萝皮, 这是一个艺术性的刨削过程, 削完后, 菠萝上留下的是一条条螺线。请你从数学角度来思考, 人们为什么这样削菠萝?并从数学角度论证你的观点。
学生被要求将自己的思考过程以及问题解决过程书写在作业单上。
结合这个问题, 我们将学生数学建模能力分为如下6个水平:
水平0:学生无法理解具体的情景, 不能识别出任何问题。
水平1:学生认清给出的现实情景, 尝试将这情景结构化, 以便找出数学模型, 但是无法找到与数学相关的线索。 (例如学生描述到, 以这种方式削菠萝使损失的肉最少, 学生在作业纸上画出菠萝黑子的交错排列。)
水平2:学生提出一个合理的假设, 并且能够找出一个数学模型, 但是不知道如何转化为数学问题 (数学文字题) 。 (例如学生找出圆柱体模型;4个菠萝黑子被连成一个四边形等。)
水平3:学生不仅能找到某个现实模型, 而且能够将其转化为数学问题, 并尝试解决那个数学问题。但是最终不能找到满意的答案;或者不能准确地解决这数学问题。 (例如学生有一个较好的想法, 即将相邻的点连成一个正方形, 但是不知道如何说明菠萝上斜着连接两个籽的斜线是最短的。)
水平4:学生能够从现实情景中找出数学模型, 并且在数学世界中解决问题, 但是忽略了与现实情景的联系。 (例如学生完成了一系列步骤, 如计算、证明等, 但是没有再回到菠萝问题上, 检验那些结果。)
水平5:学生经历完整的数学建模过程, 并且结合现实情景, 检验数学问题解答的合理性。 (例如学生计算出螺线式地削菠萝能缩短百分之几的路程。)
2. 被试学生
我们于2007年9~12月之间, 分别在中国上海地区和德国巴登符腾堡州抽取一千多名9至11年级的学生, 让他们解决这个菠萝问题。被试学生的分布情况如表1:
(二) 实验的实施
我们首先给学生放映90秒钟长的一段视频, 展示削菠萝的整个过程, 视频最后呈现要解决的问题:
请你从数学角度论证, 为什么他们这样削菠萝?
然后发给学生一张作业单, 上面用文字描述了削菠萝的情景。再给学生播放这段视频, 以便让他们有机会从数学角度观赏那个过程。然后学生用25~35分钟时间独立思考、分析并解决这个问题。
(三) 实验数据的分析方法
依据上述数学建模能力水平的指标体系, 我们对学生的解答过程进行细心评价、分类, 然后给出相应的分数, 例如符合能力水平1的就得1分, 符合能力水平5的得5分。接着利用统计分析工具 (如Excel) 对数据进行统计分析。通过实验分析我们主要回答如下一些问题:
中国和德国学生分别到达哪个数学建模能力水平?数学建模能力是否因年级不同而有差异?数学建模过程中是否存在性别差异?中德学生的数学建模能力水平是否存在差异?存在怎样的差异等?
四、实验结果及其分析
(一) 中德学生平均能力水平的比较
首先, 中国与德国学生在数学建模能力方面的平均水平非常接近, 三个年级的平均能力水平只有1.75与1.81。其中9年级中德学生达到的数学建模能力平均水平为1.41与1.59, 10年级中德学生的平均水平皆为1.67, 而11年级中德学生的平均水平也相同, 为2.18。 (如图2)
但是从各个不同的能力水平看, 两国学生的成绩存在着一定的差异 (如图3) , 尤其是中国学生达到水平2的人数占所有中国被试的31.66%, 而德国学生达到水平2的人数仅占所有德国被试的16.18%;但是中国学生达到水平3的人数仅占所有中国被试的13.61%, 而德国学生达到水平3的人数占所有德国被试的20.83%。
(二) 中德学生能力水平的性别差异比较
在所有三个年级, 中国女生的表现总是优于中国男生, 例如从表2可见, 中国9年级男女学生达到的平均水平分别为1.18与1.63, 表现出显著差异 (p<.01) ;在德国到11年级时, 男生成绩略高于女生成绩, 他们达到的平均能力水平分别为2.21与2.09。
另外在德国只有11年级的男生才能达到数学建模能力的第5水平, 占所有德国男生的5.86%, 而德国女生达到水平5的比例几乎为零。达到第5水平的中国学生也几乎为11年级学生, 但是达到该水平的男女生人数比例接近。
(三) 中德学生数学建模能力水平发展的比较
实验结果表明, 学生的数学建模能力随着年级的升高也不断发展, 特别到11年级, 学生的数学建模能力有一个飞跃发展。我们可以观察到, 在11年级德国男生和中国女生能力上的飞跃发展呈现显著性差异 (p<.005) 。而中国男生每上一个年级, 其能力水平均有显著的增长 (显著差异p<.005) , 德国女生的能力水平的增长不太显著, 因为在9年级德国女生已经表现出较高的能力水平 (平均水平为1.78) 。
中德学生之间的建模能力水平差异还表现在达到水平2的人数比例上。对中国学生而言, 水平3似乎是一个较大的认知障碍, 在达到水平2的中国学生中只有42%的学生能够进入水平3或者更高水平。而在德国, 达到水平2的学生中则有66%的能继续进入水平3或更高水平。
根据上述能力水平分类指标, 数学建模能力水平3意旨, 学生能够用自己找到的数学模型, 在数学世界中进行计算。这说明中国上海的学生虽然有能力找到数学模型, 但是与德国学生比较, 他们不擅长进一步在数学世界中进行严谨的计算或者证明。
而水平4对中德学生都是一个较大的认知障碍, 能越过这个障碍, 从水平3进入水平4或更高水平的人数比例相对较低 (见图3) , 达到水平3的中国学生中只有41.3%的学生拥有水平4或者更高水平的能力, 而达到了水平3的德国学生中只有48.2%的学生拥有水平4或者更高水平的建模能力。
根据上述能力水平的分类指标, 数学建模能力水平4则表示, 学生会结合现实情景检验计算结果。因此中德学生从水平3向水平4发展过程中碰到较大认知障碍表明, 学生缺乏数学建模过程的完整体验, 往往将学习活动中止于数学世界中, 不重视数学结果与现实情景的结合, 也就是说, 缺乏论证和解释数学结果的能力。
五、思考与讨论
(一) 中学生数学建模能力薄弱
由实验分析结果可见, 中德学生的数学建模能力水平普遍较低, 9年级至11年级的学生的平均水平仅仅在于能够简化现实情景, 提炼出一个现实模型, 但是缺乏将现实模型翻译为数学模型 (或者数学问题) 的能力, 因此无法进一步经历数学建模的其他要素, 学生现有的数学建模意识以及思想还比较薄弱。
(二) 数学基本技能滑坡
这次实验结果有些令人惊讶和担忧。因为上海学生在数学建模过程中碰到的较大障碍是, 学生不能严谨地进行数学的计算和证明。另外从学生的作业单上, 我们也感到学生在对待数学的证明与计算时, 缺乏严谨、细致的学习态度。相比较而言, 一旦德国学生将现实模型翻译为数学问题后, 他们在数学计算或证明时则更加认真和细致, 这与2000年PISA测试结果公布以来德国进行的一系列数学教育改革有密切关系。他们改革的核心是提高数学课堂教学质量, 加强学生基础知识与基本技能的训练, 提高学生数学自主学习的能力, 培养学生对数学的热爱等。我们需要深思, 如何保持我们的教育优势, 让学生在扎实的基础之上全面发展。
(三) 把握开展数学建模教学的最佳时机
实验结果表明, 11年级的学生在数学建模能力上有飞跃式的发展。数学建模能力是数学综合能力的体现, 它需要学生有识别问题、提炼数学信息、构建数学问题、解决数学问题以及分析与检验解答过程等能力。因此数学建模的学习是一个较长期的累积性学习过程。为了让学生在高中阶段在数学建模能力上有较大的发展, 我们应该从初中阶段围绕数学核心概念, 为学生设计相应的数学建模问题情景, 让学生亲自经历如函数模型、数列模型或者统计模型等的学习与构建, 逐渐培养其数学建模的思想与能力。
摘要:近期参照的数学建模能力水平分析框架, 对中国上海以及德国巴州的一千余名9~11年级学生进行实验研究。结果表明, 中德学生的数学建模能力的平均水平非常接近, 但是从各个不同的能力水平看, 两国学生的成绩存在着一定的差异;另外发现学生的数学建模能力随着年级的升高也不断发展。透过结果发现, 中学生数学建模能力薄弱, 上海学生的基本技能有滑坡倾向;另外需把握开展数学建模教学的最佳时机。
注释
1徐斌艳.关于德国数学教育标准中的数学能力模型[J].课程·教材·教法, 2007 (, 9) :84~87.
2Blum, W., Galbraith, P.L., Henn, H-W.&Niss, M. (2007) .Modelling and applications in mathematics education[M].The14th ICMI Study.Springer.12.
比较建模论文 篇6
市场中存在一种产品, 其特点就是该产品摆放在货架上的数量越多, 其需求就越旺盛。这一点和普通的价格竞争性产品不同, 其表现是需求随着定价的提高而逐步萎缩。这种外部需求依赖展示库存的产品, 可相对应地称之为库存竞争性产品。
从营销学和消费者行为科学的角度看, 库存竞争性产品的需求缘于其货架展示库存所带来的两种效应:选择效应和广告效应。大量的展示库存给消费者提供了对所购产品更多的选择权;并且货架规模越大, 往往给消费者以这种产品的市场份额高, 质优价廉的心理暗示, 产生购买的愿望或冲动, 刺激需求的上升 (Wang Y., 2002) 。
从供应链协调角度看, 以集中决策时的供应链系统为协调目标, 由于货架展示空间的稀缺性, 分散决策下的供应链最优展示库存量与集中决策时是否保持一致, 成为供应链是否协调的重要依据 (Cachon P.C., 2002) 。
许多文献将依赖于库存展示量的需求类型放在供应链系统中进行了深入的研究 (文献[6,7,8,9,10,11,12]) 。Y.Wang和Y.Gerchak在这方面有比较系统的研究成果 (文献[10,11,12]) , 正是在文献[12]中Y.Wang明确提出对货架展示库存的研究重点, 但其需求模型是确定性的。本文将在以往研究的基础之上, 首先建立依赖展示库存的外部随机需求模型, 然后将其融入RMI+ (带有寄售库存的零售商库存管理, Retailer Managed Inventory with consignment) 和VMI (供应商管理库存, Vendor Managed Ivnventroy) 两种库存模型中, 从供应链合同的角度比较分析二者的供应链协调方面的优劣。文献[5]是供应链合同方面的综合性研究成果, 重点对随机需求下单期二级供应链中的各种批发、折扣和补贴合同进行了系统的总结性梳理和研究。
RMI+其实就是传统供应链的库存管理方式, 而寄售库存在零售大卖场中尤其常见, 在需求依赖货架展示量的供应链系统中, 把寄售的因素考虑进来是一个接近现实的模型描述。
有关VMI的研究文献也是最近几年才逐步多了起来 (文献[2,3,4]) 。在以往研究成果的基础上, 本文也把VMI看作是对传统供应链管理方式的一种改进, 从而在类似的供应链环境中与传统的RMI+方式加以比较和分析。
2 随机需求模型
关于价格竞争性产品的需求模型, 在各类管理学和经济学的文献中被大量应用, 其中Petruzzi和Dada (1999) 对此有最为完备和精彩的总结和扩展。仿照此, 建立如下库存竞争性产品的一般需求模型:
D (I, ξ) =μ (I) +α (I) ξ (1)
其中, μ (I) >0和α (I) >0为关于货架展示数量I的确定性函数, 同样都是关于I的递增凹函数, 而ξ为一定义于区间[0, ∞) 的随机变量, φ (·) 和Φ (·) 分别为其密度函数和累积分布函数, 且有φ (·) >0, 即Φ (·) 是严格递增的随机分布函数。
如果令μ (I) =0, 可以得到关于I的乘法需求模型 (multiplicative demand model) :D (I, ξ) =α (I) ξ, 如果令α (I) =1, 从而得到关于I的加法需求模型 (additive demand model) :D (I, ξ) =μ (I) +ξ。显然, 由于需求函数中随机扰动部分ξ与确定性的程度上, 对本文所展开的关于供应链特定问题的讨论并没有本质上的影响。因此与文献[10]类似, 本文将采用随机乘法需求模型:
D (I, ξ) =α (I) ξ (2)
对于α (I) , 进一步明确如下性质:
(1) α (I) 是正的关于I的非减函数, 即有:α (I) >0, α′ (I) ≥0;
(2) α (I) 是凹函数, 即有:α″ (I) ≤0;
而对于库存展示量I, 考虑到商业实践的现实情形, 零售商并非只单一经营产品C, I受到其他产品的展示空间以及整个分销中心大小的限制, 存在这样的约束条件:
3 建模分析
3.1 RMI+下的供应链系统
不容忽视的是, 由于零售商必须考虑为展示这些产品提供相应的货架空间, 由此产生建立货架空间的相应成本, 其中主要包括投入成本, 以及放弃展示其他产品的沉没成本等, 统一用R (I) 来表示。显然
供应商以单位成本c生产或获取I单位的库存竞争性产品, 并以单位批发价 (w (w>c>0) , 按寄售方式摆放到零售商提供的货架空间上, 零售商则以单位价格p (p>w>0) 出售产品, 以满足随机产生的需求D (I, ξ) 。至库存期末, 没有售出的产品产生单位持有成本h, 在寄售条件下, 持有成本由供应商承担。而没有满足的需求则全部延迟交货 (backorder) , 即不存在销售损失, 产生延迟交货单位成本b。一般来讲延迟交货成本应由供应链双方共同承担, 即有b=bS+bR, 以强调供应商对零售商努力程度的关注和激励。在本模型中, 我们则对此进行简化, 由零售商单独承担所有延迟交货成本。此外有定义:
∀x∈R, (x) +=max (x, 0) 。
那么, 在需求模式D (I, ξ) 为供应链双方共同知识, 初始库存为0, 供应商和零售商的期望收益分别为:
E (∏S (I) = (w-c) E (min (I, D) ) -hE (I-D) + (3)
E (∏R (I) ) = (p-w) E (min (I, D) ) -bE (D-I) +-R (I) (4)
其中E (I-D) +、E (D-I) +和E (min (I, D) ) 分别为期望库存冗余、期望库存短缺和期望销售量:
则供应商的问题是:
零售商的问题是:
问题的解决, 将建立在如下引理和假设条件之上:
引理1 库存竞争性产品的期望销售函数G (I) 为其定义域内正的严格递增凹函数, 即有G (I) >0, G′ (I) >0, G″ (I) <0;
证明 在α (I) >0和φ (·) >0的严格约束下, 由 (7) 可知期望销售函数G (I) >0, 而
证毕
同时, 参照文献[10]的有关思路, 存在如下前提假设:
假如:对所有I≥0, 存在:
(1) Λ (I) = (p+h-c) G″ (I) -bS″ (I) -R″ (I) <0;
(2) Λ (I) +h (G′ (I) ) -3 (G (I) G′ (I) G (I) +G″ (I) (G′ (I) ) 2-2 (G″ (I) ) 2G (I) ) <0;
根据引理1, 对于条件1, 当S″ (I) ≥0时, 该条件对所有参数都成立;当S″ (I) <0时, 条件1可转化为:
同样, 对于条件2, 当G (I) ≤0时, 该条件对所有参数都成立;当G (I) >0时, 条件2可转化为:
由引理1, 根据 (8) 式可知, E″ (∏S (I) ) = (w+h-c) G″ (I) <0, 供应商的期望收益函数是关于I的严格凹函数, 因此令
E′ (∏S (I) ) = (w+h-c) G′ (I) -h=0
可得到其最优供货量下的最优批发价格:
将上式结果代入 (9) 式得到:
引理2 在供应商决定最优批发价格的前提下, (11) 的零售商期望收益函数是关于I的严格凹函数。
证明 零售商期望收益函数关于I的一阶条件为:
E′ (∏R (I) ) =h (G′ (I) ) -2G″ (I) G (I) + (p+h-c) G′ (I) -bS′ (I) -R′ (I) -h (12)
二阶条件:
E″ (∏R (I) ) =h (G′ (I) ) -3 (G (I) G′ (I) G (I) +G″ (I) (G′ (I) ) 2-2 (G″ (I) ) 2G (I) ) + (p+h-c) G″ (I) -bS″ (I) -R″ (I) =Λ (I) +h (G′ (I) ) -3 (G (I) G′ (I) G (I) +G″ (I) (G′ (I) ) 2-2 (G″ (I) ) 2G (I) ) <0
假设条件2确保上述不等式成立。
证毕
由引理2, 可令 (12) 式等于0, 从而唯一求得最优订货量I*R=arg max (E∏R (I) ) , 不仅使得零售商的收益最大化, 而且据此由 (10) 式得到w* (I*R) , 同时也使供应商的收益达到最优。 (w* (I*R) , I*R) 应为一纳什均衡点, 作为合同条款被双方接受, 最终达成合作目标。
3.2 集中式供应链系统
假设整条供应链由单个主体所有并控制, 合并 (3) 中的问题 (8) 和 (9) , 可得集中化决策时的优化问题:
一阶条件:
E′ (∏C (I) ) = (p+h-c) G′ (I) -bS′ (I) -R′ (I) -h (14)
二阶条件:
E″ (∏C (I) ) = (p+h-c) G″ (I) -bS″ (I) -R″ (I) (15)
由假设条件1, 集中式供应链在整体期望收益函数的二阶条件E″ (∏C (I) ) <0, 具有严格凹性, 最优展示库存量I*C=arg max (E∏C (I) ) 可由下式求得:
(p+h-c) G′ (I) -bS′ (I) -R′ (I) -h=0
比较 (12) 和 (14) 两式, 因 (12) 中h (G′ (I) ) -2G″ (I) G (I) <0, 则E′ (∏R (I) ) <E′ (∏C (I) ) , 而E″ (∏R (I) ) <0, E″ (∏C (I) ) <0, 可知E′ (∏R (I) ) 和E′ (∏C (I) ) 都严格递减, 显然有I*R<I*C, 即分散决策条件下, 零售商将选择低于集中决策时的最优展示库存量, 供应链无法得到协调。
综合以上分析有如下结论:
结论1 传统RMI+环境下, 经营库存竞争性产品的二级分散式供应链所采用的批发合同 (w* (I*R) , I*R) 不是一个供应链协调合同, 分散式系统的整体最优期望收益要比集中式系统少。
3.3 VMI下的供应链系统
考虑VMI管理模式, 不仅因为VMI是对传统供应链库存管理方式的一种改进, 还因为其在零售行业的广泛应用, 零售批发行业中的蔬菜水果市场中的产品都属于库存竞争性产品, 而对生鲜产品采用VMI管理模式也由来已久。
但首先要解决的问题就是供应链各方, 尤其是供应商参与VMI模式的可行性评估。因为VMI的实施将更多的管理成本和市场风险转移给了上游的供应商, 如果仍然采用批发合同 (w, I) , 则供应商的期望收益函数为:
E (∏
零售商的期望收益函数:
E (∏
与 (3) 中的问题 (8) 和 (9) 相比, 供应商承担了所有的供应链管理成本, 按照原先的RMI+下的批发合同 (w* (I*R) , I*R) , 供应商期望收益绝对减少, 而零售商的期望收益是绝对增加的, 显然这样的合同无法继续履行。
但和RMI+相比, VMI的实施导致两个本质的变化, 除了 (16) (17) 两式所表述的收益结构的变化外, 伴随着库存控制权的转移, 供应商拥有了更大的决策权力, 如果坚持实施 (w, I) 批发合同, 供应商有权并且也一定会调整相应的批发价格w和展示库存量I。假定展示库存量仍保持RMI+模式下的最优值I*R, (现实中也是如此, 一旦库存展示空间确定, 对其进行更改或变动, 期望增加或减少库存持有量是有一定的困难的。) 那么, 供应商一定会提高批发价格w, 使得如下的参与约束条件成立, 否则, VMI模型实施失败:
(wVMI-w (I*R) ) G (I*R) -bS (I*R) -R (I*R) ≥0 (18)
显然此条件保证了实施VMI后, 供应商得到不低于RMI+模式下的期望收益。由 (18) 式可进一步得到:
上式规定了供应商调整批发价格的上下限, 比较 (16) 与 (13) , 当wVMI→p时, E (∏
以下分析VMI模式下优化问题的求解过程, 并同时说明即使零售商的期望收益大于0, 由于VMI模式的安排, 供应商获得更多的决策管理权, 供应链得到比RMI+下更好的协调效果。
显然, VMI下的优化问题都是围绕供应商的期望收益函数展开的:
供应商首先确定一个接近p的批发价格wVMI, 只要p-wVMI>0, 零售商都会接受;这样一来, 问题 (20) 的优化结果只建立在唯一的变量I之上, 依据假设条件1, (20) 中的期望收益函数为关于I的严格凹数, 对I求导并令其为0, 即可求得期望收益最大时的最优的展示库存量I*VMI:
E′ (∏
由于约束条件 (19) 的存在, 比较 (12) (14) (21) 三式, 可得:E′ (∏R (I) ) <E′ (∏
VMI下批发合同 (w, I) 的纳什均衡解是在现实中的极端例子, 但可以说明VMI模式在协调供应链方面所具有的优势。在商业实践中, 可以参照仅靠出租卖场而收取相对微薄租金的零售商和其供应商之间类似VMI的供应链合同安排。但显然, 更合理也更现实的VMI下的供应链合同应该是一份收益分配合同, 在此合同之下供应商和零售商的期望收益函数分别是:
E (∏
E (∏
其中0≤ε≤1。可以认为这个收益分配合同 (ε, I) 只是简单而直观地对价格p进行了“切割”分配。ε代表了:①供应链各方的谈判能力;②供应链一方对另一方的补贴率或转移支付率。现实中实施VMI的供应链处于领导地位的往往是零售商, 比如沃尔玛, 那到ε可以看作是强势的零售商对被要求实施VMI的供应商的一种转移支付, 补偿其管理库存的成本支出。对 (20) (21) 两式, 只要转移支付足够高, 供应链同样能达到协调。极端情形是当ε趋近于1, 收益分配合同 (ε, I) 与上述的批发合同 (w, I) 趋于均衡状态时保持一致, 从这一点看, 二者在协调供应链方面具有同样的优势, 没有本质的区别。
综合以上分析有如下结论:
结论2 VMI环境下, 经营库存竞争性产品的二级分散式供应链, 如仍实施批发合同 (w, I) , 应存在唯一纳什均衡点wVMI=p, 供应链达到完美协调。但供应商获得整个供应链的收益, 零售商的收益为0;只要供应商选择了足够接近但不等于外部价格p的批发价格, 使得零售商的收益不为0, 仍能达到比在RMI+下更好的协调效果。
4 数值算例
现在通过具体的函数表达式和数值假设, 并借助数学软件Matlab6.0来验证上述一般性的理论分析过程。假设随机项ξ服从参数为1的指数分布, 即ξ~Ex (1) , η=E (ξ) =1, 而需求函数确定项
例如, 按照推导分析过程, 假设产品的市场价格、批发价格、延迟交货成本、持有成本和制造成本分别为p=160, b=20, h=20, c=50, 求得供应链在集中决策下的最优展示库存量为I*C=23.1946, 在RMI+模式下, I*R=20.6286, 如实施VMI模式, 仍履行批发合同 (w, I) , 则批发价格wVMI的变动范围为131.6368≤wVMI≤160, 当wVMI=155时, I*VMI=22.2703, 存在I*R<I*VMI<I*C, 与分析结果一致。
图1是上述条件下的各期望收益函数曲线, 可以看出各曲线并不具有全局凹性, 在0点附近有一极小值, 图2的各期望收益函数的一阶导函数曲线也说明了这一点, 它们并非严格的递减函数。但假设条件1和2保证了在I的某一邻域内就存在使得期望收益最大化的最优展示库存, 在上述算例演示中这一结果还是唯一的。
当产品的市场价格、批发价格、延迟交货成本、持有成本和制造成本分别为p=320, b=36, h=36, c=70, VMI下的批发价格wVMI=315时, 而需求函数有所不同, 则有如表2的计算结果, 显然VMI环境下的供应链系统更接近集中式系统的库存展示状态, 比RMI+下的系统更协调。
5 结束语
本文的研究结果表明, 批发合同在传统供应链管理中虽然是最直观和最常见的供应链合同, 但却无法协调供应链而使其各方及整体的收益达到最优。但在VMI的库存管理模式下, 无论采用批发合同还是本质区别的收益分配合同, 都能够较好地协调供应链, 或达到优于传统供应链管理模式的协调效果。
显然, 对于库存竞争性产品而言, 连续的补货策略是非常必要的, 唯如此才能一直保持最优的展示库存量, 从而达到最佳的需求水平和相应的收益水平。笔者未来将对相关的补货策略做进一步的研究, 从而更深层次地揭示不确定需求条件下的该类特殊产品的库存管理特点。
摘要:考虑只有一个供应商和一个零售商的二级供应链, 在单个库存期内经营库竞争性产品, 其需求依赖产品的货架展示库存。首先建立依赖展示库存的外部随机需求模型, 然后将其融入RMI+和RMI+两种库存模型中, 从供应链合同的角度比较分析二者在供应链协调方面的优劣, 结果证明在两种库存管理模式下, 均存在批发合同下关于展示库存量的纳什均衡解, 但只有VMI下的批发合同能够使供应链达到协调。最后通过数值算例说明分析结果。
关键词:RMI+,VMI,库存竞争性产品,供应链协调
参考文献
[1].Petruzzi, N.C., M.Dada.Pricing and the newsven-dor problem:A review with extensions[J].Operations Re-search, 1999, 47 (2) :183~194
[2].Dong, Y., Kefeng Xu.A supply chain model of ven-dor managed inventory[J].Transportation Research Part E, 2002, 38:75~95
[3].Mishra, B.K, .S.Raghunathan.Retailer-vs.Vendor-Managed Inventory and Brand COmpetition[J].ManagementScience, 2004, 50 (4) :445~457
[4].Cetinkaya, S., CY.Lee.Stock replenishment andshipment scheduling for vendormanged inventory systems[J].Management Science, 2000, 46 (2) :217~232
[5].Canchon P.C.Supply chain coordination with contracts[R].Working Paper.The Wharton School of Business, Univer-sity of Pennsylvania, Philadelphia, 2002
[6].Baker R.C., T.L.Urban.A deterministic inventorysystem with an inventory-level-dependent rate[J].Journalof the Operational Research Society, 1988, 39 (9) :823~831
[7].Datta T.K., A.K.Pal.A note an inventory modelwith inventory-level-dependent rate[J].Journal of the Opera-tional Research Society, 1990, 41 (10) :971~975
[8].Urban T.L.An inventory model with an inventory-lev-el-dependent rate and relaxed terminal conditions[J].Journalof the Operational Research Society, 1992, 43 (7) :721~724
[9].Pal S, .A.Goswami, K.SKChaudhuri.Deterministicinventory model for deteriorating items with stock-dependent de-mand rate[J].Internation Journal of Production Economics, 1993, 32:219~299
[10].Gerchak Y., Y.Wang.Periodic-review inventorymodels with inventory-Level-dependent demand[J].Naval Re-search Logistics, 1994, 41:99~116
[11].WangY., Y.Gerchak.Supply chain coordinationwhen demand is shelf-space dependent[J].Manufacturing&Service management, 2001, 3 (1) :82~87