循环动态博弈论文

2024-10-17

循环动态博弈论文（通用6篇）

循环动态博弈论文篇1

1 引言

全国人大常委会副委员长华建敏指出, 我国富煤、少油、缺气的能源条件, 决定了未来较长时期内, 煤炭在我国能源结构中仍将居于主体地位。随着国家经济结构的进一步调整, 煤矿安全乃至各行业领域的安全生产工作面临新的机遇和挑战, 安全生产监管监察任务也将更为艰巨繁重。从1999年国务院办公厅印发的《煤矿安全监察管理体制改革实施方案》, 到2000年国家煤矿安全监察局正式成立, 标志着垂直管理的煤矿安全国家监察体制在我国诞生。在实行政企分开的基础上, 按照精简、统一、效能的原则建立的垂直管理监察体制为促进煤矿安全生产形势的持续稳定好转提供了重要制度保障[1]。1999-2009年, 全国煤炭总产量由1999年的10.4亿吨增长到2009年的29.5亿吨, 增长近2倍;煤矿事故死亡总人数由“十五”高峰期2002年的6 995人减少到2009年的2 630人, 下降了62.4%;一次死亡10人以上重特大事故起数由2000年的75起减少到2009年的20起, 下降了73.3%。全国煤炭生产百万吨死亡率由2000年的5.71下降到2009年的0.892, 下降了84.4%, 历史性地降到了1以下。2000-2009年事故死亡人数及百万吨死亡率见图1。

国家安全生产监督管理总局局长骆琳指出, 安全生产形势依然严峻, 事故总量仍然过大, 重特大事故尚未得到有效遏制, 安全生产基础仍然薄弱, 非法违法行为、违规违章现象屡禁不止。需要抓紧解决安全生产领域的各类问题, 安全生产不容松懈。纵观以往对煤矿监管博弈的研究文献, 其中, 文献[1]分析了垂直管理的煤矿生产安全监管体制中地方政府责任小获益大在安全监管过程中存在的弊端。文献[2]具体分析了煤矿安全投入与安全事故发生量之间的关系, 建立安全投入的博弈模型并进行分析。文献[3]从外部监督博弈和内部监督博弈两方面进行分析, 着重增加对监管者的“努力”行为的激励, 来改进监督的效果。文献[4]对中央政府、地方政府、煤矿企业、矿工等四方主体分别建立博弈模型, 分析各主体之间的博弈对煤矿安全政策最终结果的影响。以往文献中煤矿监管博弈通常都是在不同博弈主体如何选择上徘徊, 建立博弈模型分析问题, 但还没有文献主要针对安全监管过程中存在的不同特点进行分析。因此, 本文在分析监管博弈过程的基础上, 将该过程划分为3个阶段建立循环动态博弈模型, 即第一阶段检查阶段博弈模型、第二阶段监督阶段博弈模型和第三阶段事故发生阶段博弈模型, 并对这3个阶段用最基本的成本和经济效益等因素进行计算分析, 建立煤矿企业和监察部门选择不同策略的概率关系式, 分析各个策略选择形成的原因。

2 博弈模型建立及分析

2.1 第一阶段———检查博弈模型建立与分析

假设在第一阶段博弈模型中, 煤矿企业安全投入合格的成本为C1, 概率为Pa, 其安全生产所获得的收益为L1;煤矿企业如果安全投入不合格的成本为C2, 概率为 (1-Pa) , 此时生产所获得的收益为L2 (包括违法违规生产收益) 。监察部门的检查可能采取的措施是检查和不检查, 其概率分别为Pb和 (1-Pb) , 其中在进行检查时也会采用严格检查和敷衍检查两种方式, 其中严格检查的成本为C3, 敷衍检查的成本为C4 (通常C4

根据表1的得益矩阵, 可以从如下几个方面对博弈模型进行分析:

2.1.1 从监察部门的期望收益角度考虑

监察部门严格检查的期望收益:M1=PaPbPc (-C3) + (1-Pa) PbPc (F1-C3) = (1-Pa) PbPcF1-PbPcC3;

监察部门敷衍检查的期望收益:M2=PaPb (1-Pc) (-C4) + (1-Pa) Pb (1-Pc) (-C4) =-Pb (1-Pc) C4。

由于国家对煤矿企业安全生产越来越重视, 地方监察部门在对煤矿企业监察过程中, 往往不存在不检查的情况, 即“不检查”这个策略选择已经弱化掉了, 而只剩下严格检查和敷衍检查这两种情况, 因此, 在监察部门进行严格检查和敷衍检查的预期收益无差异的情况下 (令M1=M2) , 可以计算出煤矿企业在安全投入不合格的概率:

(1) 式表明, 煤矿企业安全投入不合格的概率与监察部门采取的两种策略概率、成本和检查出不合格的罚金额度有关, 而与检查概率Pb无关。

(1) 当给定检查频率Pc和所处罚金F1时, 安全不合格概率由两种方式的检查成本的大小决定 (前提假定C4

因为, 当C4的值非常接近C3的值时, (1) 式可以演变成:;当C4的值远小于C3的值时, 含有C4的项可以忽略不计, 则 (1) 式可以演变成:。因此, 无论C4和C3取值关系如何, 安全投入不合格的概率几乎都取决于C3的大小。因此降低严格检查的成本, 将有效降低煤矿企业选择安全投入不合格的概率。

(2) 当给定检查成本和严格检查概率Pc时, (1) 式中安全投入不合格概率的大小与罚金F1呈反比关系。因此, 监察部门加大惩罚力度, 煤矿企业选择安全投入不合格的概率就会降低。

(3) 当给定检查成本和罚金时, (1) 式演变成:

;安全投入不合格概率与严格检查概率Pc呈反比关系, 因此, 增加严格检查概率Pc的值, 也会有效降低煤矿企业选择安全投入不合格的概率。

2.1.2 从煤炭企业的期望收益角度考虑

煤矿企业安全投入合格的期望收益:N1=PbPc (L1-C1) +Pb (1-Pc) (L1-C1) ;

煤矿企业安全投入不合格的期望收益:N2=PbPc (L2-F1-C2) +Pb (1-Pc) (L2-C2) 。

同样, 监察部门采取的策略不检查的部分被忽略掉。当煤矿企业安全投入合格与安全投入不合格的期望收益相等 (令N1=N2) 时, 可计算出监察部门严格检查的概率Pc:

由 (2) 式可以看出, (L1-C1) 表示煤矿企业在安全投入合格的情况下所得的净收益, (L2-C2) 表示煤矿企业在安全投入不合格的情况下所得的净收益, 而两者的差值就是煤矿企业采取不合格安全投入的违规违法所得。因此, 当罚金F1已知的情况下, 非法所得越大, 相应的监察部门的严格检查概率也应随之增大, 否则出现安全事故的可能性就越大;同理, 相应增加罚金F1的金额, 煤矿企业选择安全投入不合格的可能性减小, 监察部门严格检查的概率也会降低。

2.2 第二阶段———监督博弈模型建立与分析

对于检查阶段博弈模型中煤矿企业选择安全投入合格的策略时, 不论监察部门选择何种策略, 都不进入监督阶段博弈而是继续循环进行检查阶段博弈。当煤矿企业选择安全投入不合格策略, 监察部门选择敷衍检查策略时, 虽然煤矿企业存在较大的安全隐患, 但是由于监察部门自身的问题而使安全隐患得以存在, 这种情况也随之再次进入检查阶段博弈。而当煤矿企业选择安全投入不合格策略, 而监察部门选择严格检查策略时, 会出现该煤矿企业被罚罚金且责令其整改的局面, 这种策略选择使得博弈双方进入第二阶段监督博弈阶段。煤矿企业同样会有两种选择策略:安全隐患消除和安全隐患不消除。而监察部门对煤矿企业整改过程的监督也会有两种选择策略:监督和不监督。

设定煤矿企业消除安全隐患使得安全投入达到合格状态需要成本为 (C1-C2) , 不消除安全隐患的成本为0, 整改期间由于停产造成的损失为L3, 采取这两种策略的概率分别为Pd和 (1-Pd) 。监察部门在对煤矿企业整改期间进行监督的成本为C5, 不监督的成本为0, 采取这两种策略的概率分别为Pe和 (1-Pe) 。监察部门选择监督策略时, 煤矿企业并没有按要求达到合格状态, 则再对其处以罚金F2, 再循环进入监督博弈阶段。下面建立监督博弈模型的得益矩阵, 如表2所示。

2.2.1 从监察部门的期望收益角度考虑

监察部门监督的期望收益:M3=Pd (-C5) + (1-Pd) (F2-C5) =F2-C5-PdF2;

监察部门不监督的期望收益:M4=0。

当监察部门在选择两种策略时的期望收益相等 (令M3=M4) 时, 得到Pd的关系式:

由 (3) 式可以看出, 监察部门减少监督成本C5或增加罚金F2的金额将有效地使煤矿企业选择不消除安全隐患策略的概率减小。

2.2.2 从煤炭企业的期望收益角度考虑

煤炭企业选择消除安全隐患的期望收益为:N3=Pe[-L3- (C1-C2) ]+ (1-Pe) [-L3- (C1-C2) ]=-L3- (C1-C2) ;

煤炭企业选择不消除安全隐患的期望收益为:N4=Pe (-F2-L3) + (1-Pe) (-L3) =-PeF2+L3。

当煤炭企业选择两种策略的期望效益相同 (令N3=N4) 时, 得到Pe的关系式:

由 (4) 式可以看出, Pe的大小与第一阶段煤炭企业安全投入欠账的大小呈正比关系, 而与罚金F2呈反比关系, 因为采取了发现安全投入不合格就勒令停产整改的措施, 使得整改期间效益L3与监督力度无关。这也就验证了 (3) 式的解释, 如果煤炭企业安全投入欠账多, 监察部门就应该加大对其整改时的监督力度, 而增加罚金F2的金额也会对选择不消除安全隐患的煤炭企业有一定震慑作用, 促使其选择投资消除安全隐患的策略, 从而达到安全生产的目的。

2.3 第三阶段———事故发生阶段分析

煤炭企业和监察部门在一定时期内重复执行检查阶段和监督阶段的博弈模型。煤炭企业发生事故之后, 就进入了第三阶段:事故发生阶段。在事故发生阶段, 由于企业对事故负有主要责任、巨大的赔偿金额、造成的经济损失和对社会造成的影响, 使得煤炭企业一定会选择瞒报的策略, 试图蒙混过关, 因此, 要减少事故发生的概率, 必须从源头抓起, 将安全生产过程严格控制在前两个阶段之中。

经过上述两个阶段的博弈分析, 可知煤炭企业在选择安全投入不合格策略时, 监察部门在第一阶段博弈中可能选择敷衍检查策略, 这样安全隐患一直存在, 其发生事故的概率为 (1-Pa) (1-Pc) 。同理, 当监察部门在第一阶段博弈中选择严格检查策略, 而在第二阶段博弈中选择了不监督策略, 也会使得安全隐患存在, 从而导致事故发生, 其概率为: (1-Pa) Pc (1-Pd) (1-Pe) 。对于监察部门来说, 提高Pc和Pe的概率就能有效地减少事故的发生, 同时也能使煤炭企业选择安全投入不合格的概率 (1-Pa) 和不消除安全隐患的概率 (1-Pd) 相应减小。因此, 充分分析检查和监督过程的特点, 将安全隐患遏制在前两个阶段, 将是降低安全事故发生概率的重点。

3 结论

我国安全生产工作虽然取得了很大进展, 但相关矛盾、问题和隐患依然突出, 形势不容乐观。如何提高煤矿的安全生产水平, 减少安全事故的发生已经成为当务之急。本文通过对国家监察部门监察执法和煤炭企业生产过程的分析, 将煤矿安全监察过程分为3个阶段, 分别为检查阶段、监督阶段和事故发生阶段, 并对这3个阶段建立博弈模型, 计算出博弈双方的得益矩阵, 从双方选择不同策略的概率关系式入手, 找出影响其策略选择的因素, 并根据这些因素进行分析, 得出减少事故发生的概率应该首先以监察部门的严格执法为基础, 从提高罚金和减少检查及监督成本入手, 提升煤矿安全生产水平的结论。

摘要：本文通过分析煤矿安全监察过程的不同特点, 将其分为3个阶段:检查阶段、监督阶段和事故发生阶段。运用博弈论的观点对不同阶段的安全生产和监察过程建立安全监察循环动态博弈模型, 分析煤矿企业安全监察过程中存在的问题。通过期望效益函数建立煤炭企业和监察部门选择策略的概率关系式, 探讨煤矿企业安全生产监察中存在的弊端和改进措施。

关键词：煤矿安全,安全生产,循环动态博弈

参考文献

[1]李豪峰, 高鹤.我国煤矿生产安全监管的博弈分析[J].煤炭经济研究, 2004 (7) :72-75.

[2]陈宁, 林汉川.我国煤矿企业安全投入的博弈分析[J].太原理工大学学报:社会科学版, 2006, 24 (2) .

[3]禹金云, 罗一新.基于煤矿安全生产监督研究的博弈分析[J].中国安全科学学报, 2007, 17 (3) :67-70.

[4]东北财经大学产业组织与企业组织研究中心课题组.中国煤矿事故频发的博弈解释[J].财经问题研究, 2007 (7) :28-34.

循环动态博弈论文篇2

发展循环经济已成为当前建设资源节约型和环境友好型社会的基本方略。从微观层面上看,无论是循环经济的“减量化”、“再利用”或是“再循环”,都离不开先进的处置和转化技术,因而循环经济各项指标的实现有赖于技术创新的支撑[1]。但是,不能简单地将技术创新视为循环经济的充分条件,因为循环经济的本质是技术创新范式的革命[2],这意味着技术创新自身的定向转变,即与传统创新理论所界定的技术创新活动不同,基于循环经济的技术创新应当兼具经济和生态功能,追求的是经济、社会、自然环境系统之间的协调,这是循环经济发展对技术创新的特殊要求[3]。

循环经济技术创新的特殊性不仅决定了其创新过程的特殊性,同时也决定了创新主体所处创新环境的不同表现。从主流创新理论的“技术创新关系观”角度看,企业从创新设想、研发、设计、试制、生产直至商业化的全过程,也是创新企业与包括政府部门、社会研发机构、相关企业、用户(市场)建立联系和持续相互作用关系的过程[4],技术创新关系的实质是由创新引发的利益或效用的相互作用。作为持续与外界进行要素交流的开放系统,创新主体从创新动机生成与目标选择直至创新战略目标的实现,均离不开与创新外部关联主体的良性互动。但是,企业技术创新的外部关联主体既可以是创新所依赖的环境条件,也可能因为利益或诉求不相耦合而成为约束和障碍。近年来的技术经济实践表明,与传统技术创新相比,循环经济技术创新的发展面临着来之市场需求、公众选择、产业合作乃至地方政府发展理念的种种制约。另一方面,在由传统经济发展模式向循环经济发展模式转变的过渡阶段,企业循环经济技术创新实践比任何时候更需要社会公众、市场环境、产业内部、乃至政府部门等全体参与者的密切合作,当然,这就需要深入分析创新企业与重要利益相关者之间的创新博弈,以了解这一过程中技术创新关系的具体表现,为探索建立循环经济技术创新促进机制的提供必要认识基础。

根据技术创新利益相关性程度,本文重点考察创新企业与同业竞争企业、上(下)游企业、消费者和政府部门之间围绕循环经济技术创新展开的经济博弈(见图1)。为简化表述,以下分别将传统技术创新及其产品简称为传统创新、传统产品,将基于循环经济的技术创新及其产品简称为循环创新、循环产品。

1 企业与企业在技术创新的博弈

1.1 生产相同产品企业在技术创新模式选择上的博弈

为实现循环创新,采取循环创新的企业要投入额外的成本,因此并不是所有企业都愿意首先尝试循环创新的,这就导致了同业竞争企业在谁先作出循环创新模式的表率会进行博弈。假设社会上有两家企业,企业甲和乙,他们生产同类产品,模型见表1:

注解:Y1、y1代表企业进行循环创新所获得的报酬;X1、x1代表企业进行循环创新所付出的额外成本;Y2、y2代表传统创新下企业生产所获得收益。

1.1.1 完全信息市场下的静态博弈研究

假设市场属于完全信息市场,我们将在完全信息情况下的博弈归为静态博弈,从模型中看出,若Y1-X1>Y2且y1-x1>y2时,甲、乙两企业都会进行循环创新,此时该模型中的静态均衡为(Y1-X1,)。然而在现实生活中往往很难达到这种状态,因为在没有外力激励的情况下,企业进行循环创新是要比传统创新付出更高成本的。我们设定Y1-X1>Y2、<y2或Y1-X1<Y2、>y2,在此假设基础上,企业甲(或乙)会在利润最大化的驱动下选择循环创新,而另外一家企业将会继承原来的传统创新模式,此时模型的纳什均衡有(Y1-X1,)或(Y2,)。而若Y1-X1<Y2、<y2时,此时甲、乙企业将会都继承原有的传统创新,其纳什均衡为(Y2,)。因此要促使甲、乙企业双方都实施循环创新,必须寻找唯一的纳什均衡(Y1-X1,),根据模型可知,实现这一均衡的前提为Y1-X1>Y2且y1-x1>y2,即在循环创新模式下,企业创造了比以往传统创新更大的利润,这也与企业是“经济人”,追求利润最大化的假设相匹配。

1.1.2 完全信息市场下的动态博弈研究

接下来研究动态博弈,即一方先决策,另一方根据前一方的选择结果选择最利于自己收益的决策。假如Y1-X1>Y2(或y1-x1>y2)时,企业甲(或乙)会选择循环创新,而若y1-x1>y2(或Y1-X1>Y2)企业乙(或甲)也会相应的选择循环创新,这个时候会有纳什均衡解(Y1-X1,),甲、乙双方均选择循环创新,即(循环创新,循环创新)为纳什均衡解;而如果y1-x1<y2(或Y1-X1<Y2),企业乙(或甲)将会继续继承传统创新模式,短期的均衡结果是(循环创新,传统创新)。现假设采取循环创新模式的企业在该类产品市场上是扮演“领导者”的角色,相对于其他企业来说该企业在市场上占有较多的市场份额,且具有该市场相应的主导权,在此种优势条件下,该领导企业完全有可能在政府的帮助下引导其他企业也转向循环创新中,此时均衡就有可能落在(Y1-X1,)点上,即(循环创新,循环创新),在此种均衡下,非领导企业由于y1-x1<y2,收益虽受到了损失,但它们在领导企业的影响下却不得不采取循环创新模式。再假设“领导”企业采取的是传统创新模式,则完全有可能在市场机制这个看不见的手的影响下,影响起初采取循环创新的企业转型,使原采取循环创新的企业在利益受损的情况下失去促进动力,也转向传统创新,这样均衡点就从原来的(循环创新,传统创新)转到了(传统创新,传统创新)。

因此要想实现循环创新,重点要关注同业竞争中生产同类产品的企业的“领导者”,设置相关的促进措施使“领导”企业采取循环创新模式,通过其号召力、影响力使整个行业步入到循环创新的发展道路中来。

1.2 上下游企业在技术创新模式选择上的博弈

要实现循环经济,就要做到再循环,也就是要将原来被认为是废弃物的材料转变为原材料继续投入到生产过程中,变废为宝。

假设市场上存在两个企业,它们处于上下游的关系,且存在副产品的交易,即上游企业在技术创新过程中所产生的尾料,可以成为下游企业进行技术创新的原材料。因此上游企业在是否供应尾料、副产品和下游企业在是否采纳上游企业的尾料、副产品作为原料上存在着一定的博弈。关系模型如表2。

在上述模型中,若Y2-X13>Y1-X11时,下游企业在采纳上游企业的尾料或副产品进行循环创新获得的预期利益小于传统创新所得收益,因此下游企业不会采纳上游企业所提供的尾料或副产品作为他们的原材料,在这种情况下,若X12>X14,纳什均衡的解为(Y2-X13,),即上游企业不供应尾料或副产品,下游企业也不采纳上游企业的尾料、副产品作为他们的原材料;若X12<X14,纳什均衡解为(Y2-X13,),即上游企业愿意提供循环创新所要求的尾料和副产品,但下游企业不愿接受上游企业的尾料和副产品进行循环创新。当且仅当Y2-X13<Y1-X11,>-X14时,模型会在(Y1-X11,)点达到纳什均衡,上下游企业才会在(供应,采纳)这点上进行合作。依模型可知,上下游企业在进行循环创新处理资源的过程中,只有同时满足上游企业提供给下游企业尾料或副产品所获得的收益大于上游企业提供给下游企业废尾料或副产品所投出的成本与上游企业自行处理尾料或副产品所投成本的差价,以及下游企业利用、采纳上游企业生产流转后的尾料或副产品来进行循环创新所能达到的预期收益超过其采用原有的材料进行传统创新所得收益这两个条件时,上下游企业才会进行互惠合作,实现循环创新过程中资源的循环利用。

注解:Y1代表下游企业采用上游企业所供应的废弃物或副产品进行创新即循环创新所获得的收益;X11代表下游企业采用上游企业所供应的废弃物或副产品创新即循环创新所付出的成本,这也是上游企业所能够获得的利益;X12代表上游企业为下游企业进行循环创新所供应废弃物或副产品时投入的成本;Y2代表下游企业不利用上游企业的废弃物或副产品进行创新即进行传统创新所得利益;X13代表下游企业不利用上游企业的废弃物或副产品创新即进行传统创新所付出的成本;X14代表上游企业自行处理废弃物或副产品所投入的成本。

2 企业与消费者间在产品购买决策中的博弈

消费者购买循环产品的基础是拥有循环产品的相关信息以及拥有环境、生态的保护意识。追求效用最大化的消费者是否选择循环产品和追求利润最大化的企业是否生产循环产品会进行博弈的,模型如表3:

注:U1代表消费者购买循环产品所得效用;U2代表消费者购买传统产品所得效用;X代表企业进行循环产品的生产而付出的成本;P1代表消费者购买循环产品时企业获得的收益;P2代表消费者购买传统产品时企业获得的利益;α代表消费者购买传统产品时企业承担的风险,例如政府对企业的惩罚及企业信誉、形象的受损等。

若U1>U2且P1-X>P2-α时,即消费者购买循环产品所获得的效用大于购买传统产品时的效用,企业进行循环创新生产所获得的利润大于传统创新生产的利润时,该模型的均衡解为(购买,循环产品)。而当P1-X<P2-α时,企业不会选择循环产品的生产;另外若U1<U2,消费者也不会购买循环产品。

现在我们考虑混合策略的均衡,假设传统产品由于自身技术的落后在社会上流通将会给消费者带来一定的损失,例如自身质量的恶化导致消费者所处环境的破坏进而对消费者的身体健康造成影响。在这种情况下,消费者必须为此无条件地买单,此时消费者的此项利益损失为q;另外假设企业开展循环产品生产的概率为a,消费者购买循环产品的概率为b。模型如表4:

在博弈起初,消费者购买产品的得益为E(消费者)1:

E(消费者)1=a×U1+(1-a)(U2-q)=aU1-aU2+aq-q+U2 (1)

消费者不购买产品的得益为E(消费者)2:

E(消费者)2=a×0+(1-a)(-q)=aq-q (2)

消费者的整体得益为E(消费者)=b×E(消费者)1+(1-b)E(消费者)2=

b×(aU1-aU2+aq-q+U2)+(1-b)(aq-q)=abU1-abU2+bU2+aq-q (3)

企业开展循环产品的生产的收益为E(企业)1:

E(企业)1=b×(P1-X)+(1-b)×(-X)=bP1-X (4)

企业开展传统产品生产的得益为E(企业)2:

E(企业)2=b×(P2-α)+(1-b)×(-α)=bP2-α (5)

企业的平均得益为E(企业):

E(企业)=aE(企业)1+(1-a)E(企业)2

=a(bP1-X)+(1-a)(bP2-α)=ab(P1-P2)+a(α-X)-α+bP2 (6)

1) 消费者购买循环产品的复制动态方程。

创建消费者购买循环产品的复制动态方程F(b)

$F (b) = \frac{d b}{d t} = b [E$ (消费者)1-E(消费者)]

=b(1-b)(aU1-aU2+U2) (7)

点,当时,b=0是其平衡点。

2)企业开展循环产品生产的复制动态方程。

创建企业进行循环产品生产的复制动态方程:

$F (a) = \frac{d a}{d t} = a [E$ (企业)1-E(企业)]=a(1-a)[b(P1-P2)+(α-X)] (9)

若b= $\frac{X - α}{Ρ_{1} - Ρ_{2}}$ 时有F(a)=0,此刻所有水平都是稳定的。而若b $\neq \frac{X - α}{Ρ_{1} - Ρ_{2}}$ 时,假设F(a)=0,得到a为0或1时为两个稳定解。

对F(a)求其导函数得:

$\frac{d F (a)}{d a} = (1 - 2 a) [b (Ρ_{1} - Ρ_{2}) + (α - X)] (10)$

同理,进化稳定策略要求 $\frac{d F (a)}{d a}$ <0

假设企业开展循环产品生产的远期收益P1要高于开展传统产品生产所获收益P2;当X-α<0时,恒有b> $\frac{X - α}{Ρ_{1} - Ρ_{2}}$ ,在这种情况下a=1是进化稳定解。当X-α>0时,分情况讨论:

在X-α<P1-P2即 $0 < \frac{X - α}{Ρ_{1} - Ρ_{2}} < 1$ 的条件关系下,如果b> $\frac{X - α}{Ρ_{1} - Ρ_{2}}$ ,则a=1是稳定解。

在X-α>P1-P2,即 $\frac{X - α}{Ρ_{1} - Ρ_{2}} > 1$ 的条件关系下,此时b恒小于 $\frac{X - α}{Ρ_{1} - Ρ_{2}}$ ,此刻a=0是稳定解。

图3给出了企业在三种情况下的开展循环产品生产的动态趋势:

3) 消费者与企业的复制动态:创建消费者与企业的博弈轨迹矩阵如图4:

分析该博弈矩阵,可以得到以下几种状态:

当均衡点落I区域时,该博弈均衡点在(0,0)收敛,即企业开展循环产品生产,消费者却不购买循环产品。

当均衡点落在II区域时,此博弈在(0,1)点收敛,即企业开展传统产品生产,而消费者却情愿购买循环产品。

当均衡点落在了III区域时,此博弈在(1,1)点收敛,即企业开展循环产品的生产,消费者也愿意购买循环产品。

当均衡点落在IV区域时,此博弈在(1,0)点收敛,即企业开展循环产品的生产,而消费者却无购买循环产品动力。根据图4可知,(a,b)=(0,0),(0,1),(1,1),(1,0)都是鞍点,无进化博弈策略。

3 企业与政府在技术创新中的博弈

企业是否施行循环创新,政府会采取某种态度,这是因为当企业进行传统创新时势必会对环境、生态等造成一定程度的破坏,此时政府会受到外界舆论的压力。因此我们假设政府对企业的技术创新行为持有两种态度,一种是管控,另一种是不管控,任由企业进行何种形式的技术创新。这样企业与政府间在技术创新的选择上就存在如下博弈模型,见表5:

注:Y1代表企业进行循环创新时给政府带来的收益;Y2代表企业进行传统创新时,政府参与管控处罚不合要求的企业所得的罚金;-Y3代表企业开展传统创新破坏了环境、生态进而给政府带来的利益损失(如社会舆论的压力、上级政府的处罚等);X1代表政府参与管制所付出的成本;X2代表企业进行循环创新所支付的额外成本;R1代表企业循环创新所获得的利润;R2代表企业进行传统创新所获得的利润。

在通常情况下,Y1>Y2,即企业进行循环创新给政府带来的收益往往大于政府对传统创新中的不合要求的企业所处的罚金,这是因为企业进行循环创新不仅保护了环境、生态,能让政府免受社会舆论的压力和上级政府的处罚,而且在现实生活中政府在对不合要求的传统创新企业的处罚效率往往是比较低下的。

在模型中当R1-X2>R2时,即企业开展循环创新获得的收益大于企业传创新的收益,此时,企业进行循环创新存在巨大动力,博弈的纳什均衡为(不管控,循环创新)。

当R1-X2<R2,有两种情况:

1)R1-X2<R2-Y2<R2,不管政府是否选择管控企业技术创新行为,企业都会选择传统创新模式,作为理性的政府在企业选择传统创新的情形下会相应选择管控企业创新行为,此时均衡点落在(管控,传统创新),企业宁可受到政府的处罚也不愿从事循环创新,这也是我国目前普遍存在的现象。

2)当R2-Y2<R1-X2<R2时,此时不存在纯策略的纳什均衡解,现研究混合策略的均衡,假设政府以a(0≦a≦1)概率参与管控,以1-a的概率不管控企业技术创新行为,企业以b(0≦b≦1)的概率选择循环创新,以1-b的概率选择传统创新。现研究企业期望效用函数U:

U=b[a(R1-X2)+(1-a)(R1-X2)]+(1-b)[a(R2-Y2)+(1-a) R2] (11)

$\frac{\partial U}{\partial b} = R_{1} - R_{2} + a Y_{2} - X_{2}$ , (12)

令 $\frac{\partial U}{\partial b}$ =0得到a= $\frac{R_{2} - (R_{1} - X_{2})}{Y_{2}} (13)$

当a< $\frac{R_{2} - (R_{1} - X_{2})}{Y_{2}}$ 时,理性企业会选择传统创新;当a> $\frac{R_{2} - (R_{1} - X_{2})}{Y_{2}}$ 时,理性企业选择循环创新;当a= $\frac{R_{2} - (R_{1} - X_{2})}{Y_{2}}$ 时,企业对选择何种形式的技术创新持无所谓的态度。

根据模型可得,政府虽然可通过管控加大对传统技术创新的惩处力度,即Y2越大,能在一定程度上增大理性企业选择循环创新的可能性,但是从根本上来说,政府的管控不一定能使企业选择循环创新,要想企业切实做到循环创新其关键条件是企业选择循环创新所获得的预期收益大于企业传统创新所获得的收益。

4 结论与建议

具有“理性人”特征的企业通过与包括相关企业、消费者、政府之间的经济博弈,作为创新决策的重要依据。企业是否有足够的意愿施行循环创新,关键是企业实施循环创新时所获得的收益是否大于进行传统创新时所得收益。然而在多数情况下,循环创新成本、创新风险和效益的不确定性均高于传统创新,因此需要在建立健全包括产业生态技术标准、环境产权制度和生态监控体系的基础上,以政府为主导,加速推进循环创新促进机制的建设,帮助企业努力降低循环创新的成本,增进循环创新的收益预期,以促进企业从事循环创新的意愿与能力的提升。具体来说,首先,可以充分发挥行业中的“领导者”企业的作用,通过技术、资金、政府采购、人才方面的大力扶持,激励“领导者”企业率先跻身于循环创新探索,以引导整个产业实施循环创新,进而推进整个产业技术创新的定向转变和产业优化升级。其次,在设法降低企业的循环创新生产成本的同时,还可以通过严格检查认证、加大企业经济活动生态效应的监控和环境污染惩处力度,以推高企业进行传统创新的成本,压缩传统创新基础上的获利空间,逐步抵消传统产品的价格竞争优势,削弱其长期以来的市场主导地位,最终形成对企业转换创新模式的倒逼机制。当然,从长远来看,解决循环创新在博弈中面临的困境,最根本的还是要形成循环创新的生产—消费、供给—需求之间的良性互动,以消费刺激生产、以需求拉动供给。在生产—消费市场上,作为“经济人”的消费者在购买决策时会比较不同方案下的效用预期,只有当循环产品的边际效用高于传统产品的边际效用时,才能促使消费者从根本上改变对创新产品的消极倾向。为此,在目前循环产品的生产成本总体相对较高情况下,可以通过对此类产品提供价格补贴,并配合企业做好相关产品的宣传工作,引导消费者转变消费模式,以助于培育和逐步壮大循环产品的市场规模。

摘要：循环经济的本质是技术创新范式的革命。与传统技术创新相比,循环经济技术创新的发展面临着来之市场需求、公众选择、产业合作乃至地方政府发展理念的种种制约。通过对企业与诸关联主体之间围绕循环经济技术创新行为的博弈分析,揭示了企业实施循环经济技术创新行为的必要条件,为政府建立相应促进机制提供借鉴。

关键词：博弈,循环经济,技术创新

参考文献

[1]刘巧绒,杨冬民.基于循环经济的技术创新实施机制研究[J].科技管理研究,2010(5):30-32.

[2]曹利军.循环经济系统分析:结构模式、运行机制与技术创新[J].生产力研究,2008(20):11-14.

[3]刘光岭,李伟.循环经济条件下的技术创新研究[J].经济纵横,2008(5):46-48.

[4]陈劲,张方华.社会资本与技术创新[M].杭州:浙江大学出版社,2002.

[5]张维迎.博弈论与信息经济学[M].上海:上海人民出版社.2004.

[6]李铭俊.循环经济与技术创新[M].上海:复旦大学出版社,2009.

[7]毛如柏,冯之浚.论循环经济[M].北京:经济科学出版杜,2003.

循环动态博弈论文篇3

以物质不断循环利用为基础的循环经济发展模式, 要求把经济活动组成一个“资源利用—产品生产—资源再生”的封闭流程和“低开采—高利用—低排放”的循环模式。作为一个封闭的循环经济系统, 要想在企业、园区、区域和区际四个层面上统筹经济与生态的和谐, 要既充分考虑自然生态系统承载能力, 又追求实现经济总量的增加, 并且具备和谐的生态功能。依靠契约关系联结在一起的循环经济共生网络系统中各节点企业会从自身利益出发, 要么采取合作行为以谋得自身利益最大化, 要么采取投机行为。合作行为对于循环经济内部的稳定与共生网络的拓展是有利的, 而投机行为的存在则对循环经济系统的稳定运作构成了潜在威胁, 因而有必要采取相应的治理措施对循环经济系统进行维护和协调。

2 假设的提出

循环经济共生网络中有合作与投机行为可以是在两个企业之间, 也可以是在多个企业之间发生, 企业与大学或研究机构之间也有可能发生类似的情况, 在此我们将关系简化为两个企业之间。

假设: (1) 进行废弃物的交换或资源共享的是甲企业与乙企业, 总体合作投入为I, 预期的期望收益为R, 投入份额中甲公司为α, 乙公司为β, 且α+β=1。 (2) 采取合作行为的概率:甲企业为p, 乙企业为q;采取不合作行为的概率:甲企业为1-p;乙企业为1-q。 (3) 相互信任是企业采取合作行为的基础, 通过共生关系获得的利益按其投入比例分配, 合作效应系数为k, 其收益大小与k呈正相关;相互不信任则不合作, 不存在共生成果, 没有共生收益, 则双方都不会支付;一方合作一方不合作, 则可认为合作方的投入全部被不合作方获得, 那么将导致未来合作不再发生。 (4) 两个企业的合作受到正反馈激励, 激励力的大小用δ (δ>0) 表示, 合作理性的大小随着合作次数的增加而递增。

3 模型构建

基于前述假设, 两个企业在第n次合作时的支付矩阵构成如图1所示。

状态1:两个企业均合作, 甲企业的支付矩阵为甲企业按投入比例所得到的收入份额

状态2:当甲合作, 乙不合作时, 甲的支付矩阵为

状态3:当甲不合作, 乙合作时, 乙投入的损失为甲的支付矩阵, 即R3A=q (1-p) βI (3)

状态4:当双方均不合作时, 甲的支付为R4A=0 (4)

由此可将支付矩阵图1简化为支付矩阵图2。

从甲企业的角度考察支付函数, 此时它对自己的行为具有完全信息, 而对乙企业有不完全信息。甲企业选择合作还是不合作的关键, 在于衡量合作时 (p=1) 的期望支付与背叛时 (p=0) 的期望收益之差△R甲。则

代入式 (1) ~式 (4) 得△R甲=qI[αk (1+δ) n-1-1]

(1) 若给定n和δ, 假设k较大, 那么α较小;反之k较小, 则α较大。这样我们可以得到合作的第一个条件:当存在较大的共生合作效用时, 在建立共生关系过程中, 甲企业即使主动性较小, 合作行为也有可能发生;当存在较小的共生合作效应时, 在建立共生关系过程中, 只有甲企业有较大主动性时, 合作行为才有可能发生。

(2) 若给定k, 假设存在较大的n和δ, 那么α较小;反之n和δ较小, 则α较大。这样我们可以得到合作的第二个条件:随着合作次数增加, 信任关系建立以后, 在建立共生关系过程中, 甲企业即使主动性较小, 合作行为也会发生;但当合作机会较少, 双方尚未建立信任关系以前, 只有当建立共生关系过程中, 甲企业主动性较大时, 合作行为才会发生。

从上述分析我们知道, 理论上博弈企业的博弈双方的博弈行为的理性选择方式会随着策略环境的变化而有所不同, 只有在相同的策略环境中才会选择相同的选择方式。类似地, 如同甲企业的选择条件一样, 同理可得出乙企业选择的条件为:。以上α、β的取值即为博弈双方甲和乙同时选择合作的条件。

由图3知, 在α+β=1直线上, 区间[X, Y]是博弈双方同时选择的合作区间, [X, Y]区间的大小与k, δ, n有关, k, δ, n越大, H0则越小, 则区间[X, Y]也将越大, 相应地, 合作机会就越大。同时X、Y都沿α+β=1向对方延伸, 由图解可知, 当且仅当α=β=1/2, 也就是在博弈双方投入对等、风险对等和共生收益对等时, 博弈双方进行长期或重复合作的意愿才最有可能发生。这样我们就得出博弈双方合作的第三个条件, 即循环经济共生系统企业之间的合作在对等投入的状况下最为有利。

由上式知, △R随着q的增加而增加。这样我们就可以得出合作均衡的第四个合作:博弈一方的合作意愿随着博弈方合作行为概率的增加而增加。

4 循环经济共生网络博弈各方合作投机行为的分析

在分析了循环经济共生网络中两个企业之间的合作与投机行为之后, 进一步从整体的角度来考查博弈各方的合作与投机行为。

循环经济共生网络中各博弈方产生投机行为的主要因素各不相同, 所采取手段和方式也各不相同, 从而造成不尽相同的网络影响。所以说, 循环经济网络中博弈各方合作过程中, 不同的博弈方由于逆向选择造成对共生网络不同的影响结果。具体分析如下:

第一, 循环经济共生网络内博弈各方不存在逆向选调。

如果循环经济系统共生网络由n个博弈方企业构成该, 网络中第i个博弈方的贡献为ri (叟0) , 总贡献量为R=Σri, 网络中企业的贡献体现在为维持网络的稳定性和安全性所进行的人、财、物活动以及一系列相关活动等。用v (R) 表示网络的价值, 网络价值体现为网络成员由于共有的知识、经验、稳定的运营环境及组织声誉等而获得的利益, 是被各博弈方所共享的成果, 且v (R) 满足v (0) =0, v′>0, v″>0。

为做贡献企业i付出的成本是ci (Ri) , ci (Ri) 满足ci (0) =0, ci′>0, ci″>0。

则企业i的效用函数为:Ui (R, ri) =v (R) -ci (ri)

由F.O.C条件可得:v′ (R) =ci′ (ri)

该式表明, 对博弈方i, 在那什均衡条件下, 当边际贡献与边际成本相等时, 效用最大。

再联系帕累托最优, 社会福利函数为:

由F.O.C条件可得:v′ (G) =Σci′ (gi)

通过以上的分析可知, 循环经济系统中博弈各方在帕累托最优条件下总贡献大于在那什均衡条件下总贡献。所以说, 在对系统的贡献过程中, 由于系统各成员价值的非排他性, 任一博弈方都认为其他博弈方会提供纳什均衡贡献, 因此“搭便车”现象就难免会产生, 这样就造成系统整体贡献不充分, 结果是价值减少, 组织网络共生效率降低。

同时由于博弈各方悖逆选择情况的存在, 再加上博弈各方行为的外部性, 对组织的效率产生更进一步的影响。若变更假设为:博弈方i对系统的贡献为ri。博弈各方对系统的总贡献是R=Σri。

由于系统中各博弈方共享系统价值v (R) 。且当坌R燮0, v (R) =0时, 意味着系统中的某一博弈方对系统整体不存在价值, 只有当坌R叟0, v′ (R) >0, v″ (R) >0时, 博弈各方的理性的不合作可能会使它获得最大利益, 但系统整体最优不表示个体的最优决策, 况且在多数状况下, 博弈个体最优选择与系统整体最优选择相背。所以, 一般来说, 如果系统博弈各方的个体偏好与系统的整体偏好相反。博弈方i从贡献ri获得的效用为ui (ri) , ui′<0, 且ui′>ui0, ui0为大于0的常数, 也就是说从博弈方自身利益的角度, 更为有利的举动是“搭便车”或悖逆选择。设博弈方i在系统中付出的成本为ci (ri) , 且满足

ci (0) =0, 坌ri<0, ci′ (ri) <0, ci″ (ri) <0;坌ri>0, ci′ (ri) >0, ci″ (ri) >0

这说明, 在循环经济系统运作过程中, 除了“搭便车”, 博弈方为做出贡献是要付出成本的, 且成本随着贡献的增加而增加。且存在:

(2) 对任意给定的gi= (g1, g2, …, gi-1, gi-2, …, gn) , ∃gi2>0使得c′ (ri2) >v′ (R) 。由于自然禀赋所限, 各博弈方对系统的贡献是相对有限的。则博弈方i的效用为Ui (R, ri) =v (R) +ui (ri) -ci (ri)

由F.O.C条件可得v (R) +ui (ri) -ci (ri) =0

以上各变量及分析的结果如图4所示。

由图可知:存在ri*与ri**两个均衡点满足两种状态的最优值, 不难看出, 其中 (r1**, r2**, …, rn**) 为单阶段博弈中, 所有博弈方在非合作行为下的博弈均衡解。理论上, 在单阶段博弈中, 要使每个博弈方的效用更大, 博弈各方将采取合作行为 (r1*, r2*, …, rn*) , 但由于信用问题及博弈方短期行为的存在, 在循环经济系统运作过程中, 仅仅由于系统的自发调节, 将无法使博弈各方采取合作行为, 由此博弈各方将会陷入“囚徒困境”;尤其是在网络系统成员数目多, 且短期投机会获得更大收益的情况下, 更难维持合作行为。所以, 系统单阶段博弈运行的均衡解不可能是 (r1*, r2*, …, rn*) 。但在多次或者是无限次重复博弈下, 由于存在“以牙还牙”, 则存在系统重复博弈的均衡解 (r1*, r2*, …, rn*) 。

5 循环经济共生网络合作与投机行为的分析结论

通过以上模型的分析可知, 循环经济共生系统中博弈各方的行为选择, 存在一个博弈主体的动态策略的相互作用过程, 本文将就如何促进博弈方之间的合作行为以及如何减少博弈各方之间的投机行为分别进行阐述。

5.1 促进企业间的合作行为

本文将对促进博弈各方之间的合作行为从以下五个方面着进行阐述。首先, 提高合作效应系数。博弈各方要想提高合作意愿, 必须提高合作效应系数。由我们可以通过合作方式的改进、合作结构的重整、合作过程中沟通工作的重视、合作过程管理工作的加强、诚信机制的建立、违约成本的提高来提高合作效应系数。其次, 加大激励因子。通过对合作成果建立公平的分配机制、对合作信息建立畅通的沟通渠道、对合作制度与法律环境的良好培育等措施来加大激励因子, 提高合作意愿。再次, 吸引更多的合作企业。随着博弈各方了解和信任的增加, 策略的不确定性会逐渐减少, 一种稳定的、长期的合作关系将随之建立, 而这种合作信任关系将吸引更多的参与者。第四, 改善博弈各方采取合作行为的概率。潜在的合作收益的大小, 博弈各方资产的互补性的强弱、产业关联度的大小、系统内的集聚优势、系统内的文化传递机制、诚信水平直接决定了博弈各方是否采取合作行为的选择。最后, 优化α, β关系比例。我们认为合作关系越平等, 前景就越光明。理论上当且仅当α=β=1/2时, 对局的两个博弈方甲、乙之间采取合作行为的可能性最大, 以此类推当有n个博弈方存在时, 就是说只有当我们创造出一个使博弈各方等量投入、等量承担风险和等量获得收益的情况下才能使合作状况更加稳定、持久。

5.2 减少企业间的投机行为

循环经济共生系统的特性决定, 只有在一定的契约制度下, 才能使投机行为减少, 为减少博弈各方合作过程的投机行为, 首先, 公共物品的特性要求要有政府机关通过政策制定或者是经济手段的介入来减少企业间的投机行为。其次, 在一个短期模型或者是一次性博弈中, 完全通过自发调节的循环经济系统无法有效维持一个可自我执行的协议, 而一种监督机制或者是惩罚机制的引入, 将有效地改善系统中各节点的策略活动的选择, 从而使短期行为或者是一次性博弈转变为多次的重复博弈过程。最后, 循环经济系统贡献的公共产品的另一特点是他的外部性, 虽然说他的外部性可正可负, 但是如果节点或者整个系统的活动具有正的外部性时, 网络系统内或者是系统外的其他企业都可以从中获取利益, 从而网络系统价值降低, 尤其是如果单纯从系统内单个节点自身的理性选择来看, 将不利于系统整体的发展, 由此会降低系统整体的效率。由于循环经济系统这种外部性, 使得系统内部节点之间有了契约制度安排的必要性。

总之, 只有通过一定的契约形式对循环经济系统进行综合治理, 才能减少系统各节点企业的投机行为的发生, 也才能维护系统整体的良性运行和健康发展。

参考文献

[1]王兆华.生态工业园中工业共生网络运作模式研究[J].中国软科学, 2005 (2) :80-85.

[2]贾建国, 杨育等.化工产业循环经济发展的一体化模式研究[J].中国科技论坛, 2011 (11) :34-40.

[3]王瑛.中低技术产业集群中企业产学研合作行为研究[J].中国科技论坛, 2011 (9) :56-61+73.

[4]高建新.基于集聚优势的区域自主创新体系建设[J].经济导刊, 2011 (2) :50-51.

[5]张艳.生态工业园共生系统的构建与稳定性研究[D].华中科技大学, 2006.

循环动态博弈论文篇4

循环经济也称作物质闭环流动经济, 本质上是一种生态保护型经济, 它要求运用生态学规律来指导人类社会的经济活动。循环经济要求把经济活动组织成一个“资源—产品—再生资源”的反馈式流程, 其特征是低开采、高利用、低排放。所有的物质和能源要能在这个不断进行的经济循环中得到合理和持久的利用, 以把经济活动对自然环境的影响降低到尽可能小的程度。循环经济是对传统线性经济模式的变革, 挑战传统经济学的“经济人”假说, 力求社会安全持续发展;挑战传统经济学的资源配置模式, 谋求资源的安全耗用;挑战传统经济的“效用”和“效率”理论, 寻求生态安全。

采用循环经济发展模式是大势所趋, 符合可持续发展这一最终目的, 但还是不可避免的与现行经济运行体制产生冲突。企业是发展循环经济的微观主体, 国家是循环经济政策的制定者, 地方政府是连接中央政府和企业的纽带, 贯彻执行具体政策。面对循环经济, 中央政府、地方政府所关注的利益是不同的, 因而会有不同的应对策略, 构成了三方博弈。由于地方政府的特殊作用, 本文建立了双层次互动进化博弈模型来分析企业发展循环经济所涉及的三方博弈策略。

二、企业发展循环经济双层次互动进化博弈模型构建

双层次互动博弈最早是由罗伯特·帕特南于1988年在《外交和国内政治:双层次博弈的逻辑》一文中提出的国际谈判中国内与国际因素互动的一种理论。进化博弈理论是结合经典博弈理论及生态理论的研究成果, 以有限理性的参与人为研究对象, 利用动态分析方法把影响参与人行为的各种因素纳入其模型中, 并以系统论的观点来考察群体行为的演化趋势。本文结合双层次互动博弈理论与进化博弈理论建立了双层次互动进化博弈模型对我国企业发展循环经济进行分析, 将中央政府、地方政府和企业三个博弈主体都纳入到模型中, 克服了经典博弈理论一般只能对其中两个博弈主体进行分析的局限。同时进化博弈理论以有限理性的参与人为研究对象可以使模型更符合实际。双层次是指宏观层次和微观层次, 宏观层次的博弈是中央政府与地方政府的博弈, 微观层次的博弈是指地方政府与企业的博弈。中央政府与企业缺乏直接的沟通和交流, 是以地方政府作为联系纽带的。所以, 用双层次互动进化博弈能更好的解释企业发展循环经济的实际。

1. 模型基本假设。

(1) 成本———收益理论、效用理论在本模型中适用。

(2) 假设在博弈战略中, 中央政府、地方政府和企业都是具有有限理性的。有限理性通过惯性依赖、近视眼策略和试错法等博弈手法体现出来。此外还假设三个博弈主体在博弈战略的选择中都追求自身收益的最大化和效用的提高。

(3) 各博弈主体具有固定的步法和信息交换序列的模式, 各博弈主体的行为策略具有连续性和时效性, 博弈的进化适合正和博弈的增益性假设。

(4) 中央政府在博弈中采取的博弈策略遵循效益最大化和风险最小化原则。中央政府作为循环经济政策的制定者, 其在博弈分析的战略选择中, 要充分考虑发展循环经济带来的经济增长, 对资源环境的影响, 国家的稳定程度, 以及地方政府、企业对循环经济政策的满意程度。其效用可以表示为U (x1) =U (a, b, c, d) , x1为中央政府的博弈战略;a为经济增长程度;b为对资源环境的影响程度;c为国家稳定程度;d为地方政府和企业的满意程度。

(5) 地方政府在博弈中的地位很特殊, 是连接宏观和微观两个博弈层次的纽带。地方政府在博弈战略的选择中既要追求地方财政收入和政绩的最大化, 又要使国家和企业对具体实施政策满意。其效用函数可以表示为U (x2) =U (e, f, g, h) , x2为地方政府的博弈战略;e为地方财政收入;f为政绩;g为中央政府的满意程度;h为企业的满意程度。

(6) 企业作为发展循环经济的微观主体, 在博弈战略的选择中追求企业自身经济效益最大化, 实施循环经济成本的最小化, 同时能够享受政策的支持。其效用函数可以表示为U (x3) =U (i, j, k) , x3为企业的博弈战略;i为企业自身经济效益;j为循环经济成本;k为政策支持。

2. 模型构建。

模型分为宏观和微观博弈两个层次, 通过地方政府把两个层次的博弈连接起来, 使之成为一个互动的博弈整体。

(1) 宏观层次的互动博弈。

假设x1、x2、分别为中央政府和地方政府的博弈策略, X1、X2分别为中央政府和地方政府的策略集, 且x1∈X1、x2∈X2, 其博弈函数为f (x1, x2) 。f1 (x1, x2) 为中央政府的收益函数, f2 (x1, x2) 为地方政府的收益函数。根据前面的假设, 中央政府和地方政府都是追求其收益最大化的, P (x1) 、P (x2) 分别为中央政府和地方政府的策略选择收益。即:

对地方政府而言, 地方政府是中央政府的下级单位, 因此地方政府是在中央政府的博弈策略已知的情况下选择博弈策略, x2 (x1) 为在中央政府博弈策略已知的情况下地方政府选择的最优博弈策略。对中央政府而言, 中央政府制定循环经济政策也是一个逐渐摸索的过程, 中央政府一方面要借鉴国外发展循环经济的经验, 另一方面要在国内进行试点, 通过地方政府的工作汇报对循环经济政策不断进行调整。所以中央政府在选择博弈策略时, 也是充分考虑地方政府的反馈信息, x1 (x2) 表示在中央政府所选择的博弈策略中包含了x2的映射信息。即:

宏观层次的互动博弈是一个信息不断更新的连续博弈过程, 中央政府和地方政府在博弈中的策略选择收益可最终表示如下:

由 (3) 式可知, 中央政府和地方政府就构成了一个互动的博弈模型。

中央政府在宏观层次的博弈中, 除了要追求其收益最大化, 还会充分考虑发展循环经济对其效用的影响。当其预期效用U1 (x1) =U1 (a, b, c, d) ≥U0 (a, b, c, d) 时, 中央政府就会出台循环经济政策, 其中U0 (a, b, c, d) 为中央政府当前的效用水平。

地方政府在博弈中的策略选择也同样追求预期效用的提高。当其预期效用U1 (x2) =U1 (e, f, g, h) ≥U0 (e, f, g, h) 时, 地方政府会认真贯彻中央制定的循环经济政策, 并且在具体实施过程中表现出更高的积极性, 其中U0 (e, f, g, h) 为地方政府当前的效用水平。

(2) 微观层次的互动博弈。

如果企业通过发展循环经济获得了明显的经济效益, 并且其预期效用U1 (x3) =U1 (i, j, k) ≥U0 (i, j, k) 时, 企业会积极拥护和响应国家循环经济政策, 同时企业所得到的预期效用要满足在微观层次与地方政府的博弈过程中地方政府设定的政策约束:U1 (x3) =ASx3≤A (Si+1-Si) 。其中ASx3为企业通过发展循环经济获得的预期效用;S为企业的循环经济发展水平;Si+1-Si为地方政府规定的循环经济政策变更范围。这样企业在发展循环经济中的预期效用可以表示为:

从微观层次的博弈来看, Si+1-Si是地方政府与企业在博弈中地方政府所给定的政策变动范围。但是这一范围是在地方政府与中央政府在宏观层次博弈中所达成的博弈结果允许的限度之内。

(3) 宏微观结合互动博弈。

在宏观层次所达成的阶段博弈均衡结果往往是提纲式的, 这种提纲式的均衡结果可能给地方政府以更大的操作空间, 使地方政府以中央政府的政策为指导, 结合本地区的实际情况制定循环经济的具体实施战略, 但也可能使地方政府很难界定中央政府给定的循环经济政策的界限和范围, 容易使他们在实际的循环经济政策执行中过多考虑的是自身的政绩和地方财政收入的最大化, 而中央政府也很难界定地方政府的实施是否超出了其设定的范围。

从地方政府在微观博弈层次的作用来看, 地方政府在发展循环经济中一方面受中央政府在宏观层次博弈结果中的策略选择的约束, 另一方面也会考虑本地区企业实际情况而指定循环经济实施细则, 其策略选择可以表示为:

地方政府与企业在微观层次的博弈结果会通过地方政府反馈到宏观层次中去, 这样地方政府就把整个宏观层次和微观层次的博弈连接起来了。中央政府除了听取地方政府的汇报外, 还会通过考察、走访等方式来了解企业对循环经济政策的反映和评价。考虑到以上因素, 宏观层次的博弈可以重新表述:

(4) 双层次互动进化博弈模型

如果我们假定存在某一策略, 使得:

则策略就是一个进化稳定策略 (ESS) 。如果此时策略是各博弈主体都选择的策略, 那么称此时系统达到了一个进化稳定均衡。

三、模型分析

本模型通过宏观层次和微观层次的博弈的互动性, 以博弈函数的形式把中央政府、地方政府和企业的博弈行为联系起来。正是宏观层次中央政府与地方政府的重复博弈和微观层次地方政府和企业的重复博弈, 而使得双层次互动博弈模型为一个动态的模型。然后, 又把进化博弈的思想引入本模型, 找到进化安定策略和进化安定均衡。企业发展循环经济是中央政府、地方政府和企业三者之间的博弈, 所建立的双层次进化博弈模型可以反映三个博弈主体的策略选择, 他们在选择使自身收益最大化的策略时都会受到另外两个主体策略选择的约束。当某一策略同时满足三方所追求的收益最大化和效用的提高时, 就达到了进化稳定均衡。进化稳定均衡的过程实际是一个宏观层次的“选择”和微观层次的“突变”的重复博弈的过程。并且, 这种进化稳定均衡不是绝对均衡, 是不断达到而又不断打破的过程。

当企业循环经济达到进化稳定均衡时, 只能说明此时的进化稳定策略在这段时期内是占优的, 但并不能保证其永远是占优的。随着循环经济的发展, 新的问题会逐渐显露出来, 此时企业要求中央政策调整的呼声也会越来越高。中央政府会根据地方政府的反馈以及自己的调查了解对政策进行调整, 而地方政府作为中央政府制定的循环经济政策的执行者, 也会根据企业的呼声进行相应的调整。循环经济政策正是在宏观层次的“选择”和微观层次的“突变”的互动中体现出来的。中央政府会根据循环经济发展较好的试点地区的经验制定相应政策在全国范围内推广, 地方政府、企业都按照这个政策执行时, 此时就会达到进化稳定均衡。而微观层次的突变则是指当这种达到进化稳定均衡的政策不能满足企业、地方政府对国家政策的需求时, 他们会结合自身的实际情况提出新的发展方案。好的方案和经验通过反馈并得到中央政府的采纳, 并最终在全国范围内推广, 使整个博弈再次达到进化稳定均衡。

四、结论及建议

本文结合对该模型的分析和我国企业发展循环经济的状况给出以下建议:

1. 对中央政府而言, 要建立健全循环经济的政策体系。

(1) 财税政策。中央政府应该对发展循环经济的企业给予财政补贴、降低税收, 相反对高能耗、高污染的传统企业要加税率和税种, 这样有利于企业转型和企业循环经济的发展。 (2) 金融政策。通过金融机构为优先发展循环经济的企业提供信贷资金的支持, 并在利率比方面给予优惠。 (3) 投资政策。中央政府可以作为投资主体从财政收入中划出专项资金进行循环经济项目投资, 这对企业发展循环经济是一个很好的导向作用, 也是国家宏观调控的重要手段之一。 (4) 消费政策。对循环经济产品采用绿色标识, 引导消费结构, 提倡绿色消费, 以提高公民绿色消费的意识, 同时可以提高循环型企业产品的竞争力。 (5) 产业政策。中央政府应对循环型企业的产业结构、产业技术、产业组织和产业布局变化进行定向调控和支持, 并鼓励发挥产业集群效应, 大力发展生态工业园, 延长产业链。

2. 对地方政府而言, 要彻底转变单纯追求GDP的政策目标。

省级政府应切实转变观念, 把发展循环经济, 推进全面、协调、可持续发展作为重要宗旨。从国家全局角度看, 有必要研究制定区域可持续发展指数, 作为对地方经济社会发展绩效评价的重要参数。各省应在普遍开展循环经济区域试点的基础上, 探索发展循环经济的经验。根据中央政策并结合本地发展现状, 制定具体的实施方案。除了财税杠杆外, 还可以灵活地实行奖罚政策, 对发展循环经济的企业进行奖励, 对高污染、高能耗的企业进行惩罚。

3. 对企业而言, 首先, 要重视资源节约和环境保护, 推进清洁生产, 优化企业行为。

企业在其生产过程中, 不仅要考虑要追求自身利润最大化, 还要兼顾资源环境等众多利益相关者的综合效益, 而且要主动地采取清洁生产和环境无害化技术和工艺, 不断提高清洁生产意识, 减少环境污染, 提高资源的利用率, 增加社会效益。其次要加大技术投入, 提高企业发展循环经济的技术水平。科学技术是发展循环经济的重要支撑。循环经济的技术载体就是环境无害化技术或环境友好技术。企业发展循环经济必须依靠技术创新, 重点组织开发有重大推广意义的资源节约和替代技术、能量梯级利用技术、循环经济发展中延长产业链和相关产业链接技术、“零”排放技术、有毒有害原材料替代技术、可回收利用材料和回收处理技术, 特别是降低再利用成本的技术等。制定和发布相关技术政策, 加快新技术、新工艺、新设备的推广应用, 突破循环经济发展的技术瓶颈, 组织实施循环经济重大技术示范, 以此为主体构建循环经济技术支撑体系。最后, 要强化企业社会责任。企业社会责任契合我国以人为本、构建和谐社会的基本国策。企业主动承担社会责任, 会赢得商誉和其它良好的社会效应, 对企业可持续发展有重大意义。

参考文献

[1].曲格平.发展循环经济是21世纪的大趋势[J].中国城市经济, 2002 (1)

[2].肖广进, 赵莹.循环经济理论的挑战及其立法的博弈分析[J].统计与决策, 2009 (7)

[3].王宏.政府采购制度变迁的双层次互动进化博弈模型[J].上海管理科学, 2006 (4)

[4].周峰, 徐翔.农村税费改革:基于双层次互动进化博弈模型的分析[J].南京农业大学学报 (社会科学版) , 2005, 5 (1)

[5].靳涛.双层次互动进化博弈制度变迁模型——对中国经济制度渐进式变迁的解释[J].经济评论, 2003 (3)

[6].青木昌彦, 奥野正宽:《经济体制的比较制度分析》[M].北京, 中国发展出版社, 1999, 274～275.

[7].王晶.基于循环经济的企业运行机制、模式及评价研究[D].华中科技大学, 2007

循环动态博弈论文篇5

1 循环经济绿色建材产业链的内涵

循环经济是在充分考虑了生态效益、经济效益、社会效益的前提下, 以资源和能源的有效利用、环境的友好相处为前提, 积极倡导人们在生产领域、流通领域、消费领域中进行减量化 ( Reduce) 、再利用 ( Reuse) 、资源化 ( Recycle) 活动的一种经济模式。循环经济产业链并不是完全颠覆了传统的经济产业链, 而是在此基础上充分考虑了国家快速发展过程中面临的资源、能源危机和与日俱增的环境压力, 以资源的集约利用为目的而进行的产业链的搭接、延伸, 使产业链丰富, 作用更加重大。

根据孔鹏志等[1]对循环经济产业链的定义, 将绿色建材产业链定义为: 在建材产业中, 以资源的循环再生利用为手段, 以价值增值为导向, 以环境友好为目标所形成的上下关联的链式企业组织形式。基于循环经济理念的绿色建材产业链同时具有结构属性和价值属性, 其结构属性表现为: 将原本单向开放的线性产业链条变换为循环闭合的产业链环, 通过对废弃建材的资源化处置, 使废弃物转化为再生资源逆向回流; 其价值属性表现为: 通过对废旧建筑垃圾的回收利用创造出新的经济收益, 实现了价值的回流, 不在将建材使用、处理过程中造成的环境代价置之不理, 而是将其纳入该产业链中, 不在仅仅考虑其经济价值, 而是上升到了社会环境价值层面。

2 循环经济绿色建材产业链与传统建材产业链的比较分析

传统的建材产业链是单向线性的产业链条如图1 ( 见下页) 所示, 原材料进入资源市场, 经过生产加工后投放到产品市场, 然后经过销售到达使用者手中, 最后转变为建筑废弃物垃圾, 是典型的“原材料———生产———使用”的开放式线性链条形式, 没有考虑废弃物回收利用, 带来诸多环境问题。再对图2 ( 见下页) 进行比较分析, 建筑原材料不仅包含传统原材料还包括对建筑废弃物回收利用进行资源化处理后的再生原材料, 该产业链转变成了“原材料———生产———使用———再生利用”的闭式链环, 使整个产业链更加丰富化, 这样引导绿色建材产业的发展, 符合我国经济转型时期提出的可持续发展的理念。

3 建筑废弃物处置企业与建材生产企业博弈分析

可以总结出无论传统产业链还是绿色建材产业链涉及主体代表都有政府、企业和客户, 实际上客户对物质和环境的消费并不必然的推动物质减量化发展, 因此客户对基于循环经济理念的绿色建材产业链的发展起不到实质性的作用。同样, 企业只有在经济利益最大化的前提下才会考虑代际间资源的合理利用。相反, 政府作为集体利益的维护者, 应充分发挥其理性作用, 维护资源的可持续利用, 在充分考虑环境效益、经济效益、社会效益的同时, 激励或者惩罚企业, 从而实现资源材料的再生利用, 促进绿色建材产业链环 ( 如图2) 的形成。

3. 1 博弈分析的基本假设

为了更好地分析利益主体的博弈关系, 提出如下假设:

( 1) 绿色建材产业链中的企业具有有限理性特征, 不能完全对外部信息进行掌握, 决策时会存在失误, 出于自身利益最大化的角度, 可能使企业最优决策远离最优方案。

( 2) 企业所具有的理性层次属于慢速学习类型, 而不是快速学习类型。这是因为大多数企业开展绿色建材创新的意识仍然较差。

( 3) 由于企业各自独立进行生产决策, 因此我们将其博弈关系定义为同时决策、反复进行的静态博弈。

3. 2 静态博弈分析

绿色建材产业链与传统建材产业链的区别在于建筑废弃物的循环再生利用, 故本文重点分析此环节上垃圾回收利用企业与建材生产企业的博弈关系。上下游企业的合作是构建绿色建材闭口产业链, 实现建筑废物再生循环利用的关键。建筑废弃物处置企业的合作行为表现为将施工过程中和建筑物报废拆除中产生的废弃物经过一定的工艺处理为建材生产企业所需的原材料, 提供给建材生产企业使用。但由于建筑废弃物处置企业加工处理废弃物的过程需要消耗资源, 也可能需要新增设备和技术投资, 设单位投资成本为b。因此, 建筑废弃物处置企业的另一个选择是不合作, 即采用粗放的方式填埋、焚烧垃圾, 支付成本c。而建材生产企业的合作行为表现为购买经由废弃物处置企业提供的原材料, 它需要支付采购成本a, 否则视为不合作, 将从原有途径获得原材料, 投入为d, 具体见下表1。

根据建筑废弃物处置企业与建材生产企业的不同策略选择时支付的相对大小, 表1 中的博弈会有不同的均衡, 但惟有 ( 合作, 合作) 这一纳什均衡才能维持绿色建材闭口产业链的正常运转, 从而实现废弃物的循环再生利用。因此, 我们只关心实现 ( 合作, 合作) 均衡需满足的条件。由表1 看出, 实现均衡条件为: a - b > - c, 其经济意义为建筑废弃物处置企业的收益a需要大于其增量成本 ( b - c) , 同时a < d, 即建材生产企业从废弃物处置企业处的采购成本a需低于原有途径的采购成本。满足上述两点, 需要建筑废弃物处置企业将其增量成本控制在及其小的范围内, 使再生利用的原材料价格低于建材生产企业的原材料价格。

3. 3复制动态进化博弈分析

设选择合作策略的企业所占比例为: x ( 0 ≤ x ≤1) , 则选择不合作策略的企业所占的比例为1 - x。企业间的复制动态进化模型及推导过程如下:

对于建筑废弃物处置企业来说, 选择合作与不合作策略的期望收益分别为:

平均期望收益为:

选择合作策略的建筑废弃物处置企业的比例的复制动态方程为:

经静态博弈分析知道, 为实现绿色建材产业链循环经济的目标, 达成合作的前提是a > b - c, 故建筑废弃物处置企业的复制动态微分方程相位变化如图3。

图3 说明, 某一初始时刻的合作型建筑废弃物处置企业的比例为, 合作型企业在建筑废弃物处置企业群体中达到一定规模, 由于进行废弃物再生利用的效益明显, 其示范效应和效仿效应逐步加强, 该类合作型企业逐渐增加, 最终以的概率收敛于x = 1. 。x = 1 时, , 这些条件构成了微分方程的“稳定特性”, 纳什均衡 ( 合作, 合作) 的策略得以验证, 因此, 动态复制的结果是建筑垃圾废弃物处置企业均会演进为合作型企业。

当x在, 合作型建筑垃圾处置企业的数量会出现逐渐减少的情况, 并最终稳定在x = 0, 即选择合作策略的企业会最终消失。这些建筑废弃物处置企业合作策略的消失主要原因是选择合作策略的企业比例不充分, 很难在企业群体中起到示范和被效仿的作用, 由于企业群体间存在信息不对称, 无法清楚了解对方的成本状况, 所以会认为对建筑废弃物进行再生利用是不经济的, 这种观念阻碍了其他建筑废弃物处置企业对合作策略的选择。

同理, 对于建材生产企业来说, 选择合作与不合作策略的期望收益分别为:

平均期望收益为:

选择合作策略的建材生产企业的比例的复制动态方程为:

经之前的静态博弈可知, d > a, 故建材生产企业的复制动态微分方程相位变化如图4。

对于建材生产企业而言, 只要a

从上述分析得知, 该复制动态结果为所有建材生产企业均将演进为合作型企业, 这是因为只要建材企业的供应链是有利可图的, 它就会采用由建筑废弃物处置企业提供的原材料, 而在企业群体中, 只要有选择合作策略的企业出现, 其采购行为容易被其他企业观测, 故示范和效仿效应立即产生, 建材生产企业最终全都转化为合作型企业, 但是这演进过程基于建筑废弃物处置企业的定价。

4政府行为对进化博弈的影响

基于企业的“慢速学习”理性特征的假设, 运用进化博弈复制动态模型进行分析, 得出了建筑废弃物处置企业和建材生产企业的演化路径, 可以看出企业将自发逐渐转化为合作型企业, 但是这主要取决于建筑废弃物处置企业的增量成本及原材料定价, 再无政府干预下, 较难达成上述的演进路径, 故引入政府补助、环境污染惩罚, 考察其对企业动态演化路径的影响。

4. 1引入政府补助的影响

引入政府补助, 假设政府对建筑废弃物处置企业的补助为s, 给予采用由建筑废弃物处置企业提供原材料的建材生产企业的补助为t, 则表1 的支付矩阵将发生变化, 见表2。

相应的, 合作型建筑废弃物处置企业的复制动态微分方程将发生改变:

根据b - c - s ≤0, b - c - s > 0 两种情况, 对应两种不同的建筑废弃物处置企业复制动态相位图。由图5 ( 1) 可得, 当b - c - s ≤0 时, 表示政府的补助已经超过了建筑废弃物处置企业的增量成本, 只要出现合作型策略企业的示范, 该企业集群就将收敛于x =1, 即所有建筑废弃物处置企业在政府高额补助下, 最终都将进行建筑废弃物的再生循环利用。由图5 ( 2) 可得, 当时b - c - s > 0, 虽然仍有的可能性使建筑废弃物处置企业收敛于非合作企业, 但是这个概率小于没有政府补助的可能概率。[5]

可以看出, 政府补助促进了建筑废弃物处置企业向合作型群体的转化, 当合作型企业比例x落入区间内, 企业会以一个更大的概率向合作型企业演进。同时, 在b-c-s>0的条件下, 仍有部分建筑废弃物处置企业尚未觉察其经济效益, 不愿意进行建筑废弃物再生循环利用。

同理, 对合作型建材生产企业有:

此时分两种情况, t≥a - d和t < a - d, 如图6 所示。当t ≥ a - d, 政府对建材生产企业的补助已经大于其采购所增加的成本, 基于自身利益最大化的考虑, 所有建材生产企业都会最终演进为合作型企业。当, 即政府的补助还不足以完成弥补建材生产企业的增量成本, 由图6 ( 2) 可以看到, 企业会以t a-d的概率演进为合作型企业, 但仍有部分企业拒绝合作。

综上可以看出, 在引入政府补助后, 建筑废弃物处置企业和建材生产企业都更加倾向演进为合作型企业, 且补助额度的高低影响了企业的增量成本和原材料定价, 对企业的演进过程起到了关键作用。

4. 2引入环境污染惩罚的影响

采用环境污染惩罚措施, 与政府补助的效应是相同的, 采取的方式确是相反的, 政府补助是对采用循环再生的企业进行经济支持, 而环境污染惩罚则是对污染环境的企业进行经济制裁, 对采用粗放式处置建筑废弃物的企业给予罚款m, 此时支付矩阵如表3所示。

由于建材生产企业的支付矩阵没有变化, 故在此只讨论建筑废弃物处置企业, 合作型建筑废弃物处置企业的复制动态微分方程变为:

从图7看出, 当合作型企业进入区间, 将已概率向合作型企业演进, 这一概率大于引入环境污染惩罚前的概率, 说明环境污染惩罚措施确实对建筑废弃物处a置企业向合作型企业转化起到了促进作用。

5 结论

本文依据循环经济理念, 结合循环经济产业链的概念解释了闭环绿色建材产业链内涵, 并将其与传统建材产业链进行比较分析得出基于循环经济理念的绿色建材产业链是绿色建材产业化发展的必然模式。通过对建筑废弃物再生利用主体的进化博弈分析得出, 企业主体的合作行为取决于进行建筑物再生利用的增量成本, 依靠企业主体的自发行为较难实现合作均衡, 故引入政府主体行为, 发现在政府补助和环境污染惩罚措施下, 企业主体向合作均衡演化的概率增大, 故政府主体在建筑废弃物再生循环利用中起到了关键作用, 是绿色建材闭环产业链影响机制的主要组成部分, 应充分发挥好其调控作用, 制定恰当的优惠政策和相关支持, 使建材产业向循环经济的目标发展。

参考文献

[1]孔鹏志, 杨忠直.基于Stackelberg博弈的循环经济闭环产业链研究[J].中国人口·资源与环境, 2011, 21 (9) :132-136

[2]于斌斌.基于进化博弈模型的产业集群产业链与创新链对接研究[J].科学学与科学技术管理.2011, 32 (11) :45-48

[4]胡绍强.产业链上下游企业非合作博弃分[D].复旦大学, 2008

[5]陈瑾瑜, 王朝全.博弈论在构建生态产业链中的应用分析[J].生态经济, 2007 (10) :87-90

[6]芮隽, 汪霄.既有大型公建节能改造中的进化博弈论分析[J].生态经济, 2010 (5) :150-152

[7]罗梦醒, 刘艳涛, 刘军.绿色建材现状及发展趋势[J].中国建材科技, 2009 (4) :80-83

[8]屠立辉, 瞿富强, 李慧慧.基于进化博弈模型的我国成品住房推进工作研究[J].工程管理学报, 2011 (25) :2-6

[9]刘轶芳.循环经济投入产出模型研究[D].北京:中国科学院研究生院, 2008

[10]包菊芳.基于循环经济的产业价值链重构研究[J].技术经济, 2007, 26 (4) :14-17

[11]KAMPSTRA R P, ASHAYERI J, GATTORNA J L.Realities of supply chain collaboration[J].The International Journal of Logistics Management, 2006, 17 (3) :312-330

循环动态博弈论文篇6

一、文献评述

相较于国外学者们对于审计博弈内容研究上的精细和深入以及方法上的成熟和多样, 我国学者对审计博弈研究起步晚、发展快, 对于审计模型的构建也不只是局限于简单的静态策略博弈模型, 而开始研究更加复杂的动态博弈模型。薄澜、姚海星通过构建关于上市公司管理者财务舞弊与注册会计师外部审计的不完全信息动态博弈模型, 分析了公司管理者和审计师的最优策略以及博弈模型多期重复进行的可能结果, 提出减少财务舞弊发生的措施和建议。刘国常、韩春生从博弈论的角度对审计合谋的市场选择及其治理策略进行探讨。张涛、吴联生通过构建股东、管理层和审计师三方参与的两委托人——单代理人博弈模型, 研究了固定审计费用下不同审计师变更方式对审计质量的影响。庄立、王玉蓉构建和比较了传统审计模式和现代风险导向审计模式下注册会计师、客户以及政府监管三方关系人的博弈模型。卢宁文, 通过不完全信息动博弈模型的构建分析了审计师行为的选择。武恒光通过管理层和审计师的舞弊博弈模型进行审计证据、审计风险及不规则关系研究。国内学者研究较多的是管理者与审计师之间的博弈, 本文通过不完全信息动态博弈模型的构建分析被审计单位、审计单位以及社会监管部门三者之间相互影响的决策过程。

二、审计三方关系人博弈模型的基本假设

本文所说的财务舞弊是指, 被审计单位人为地没有在财务报告上真实、公允地反映企业真实的财务状况和经营状况, 故意欺骗财务报告信息使用者。在本文构建的不完全信息动态博弈模型中, 假设审计单位的专业胜任能力是没有问题的并且实施审计的复杂程度也是无差别的, 即不存在被审计单位财务舞弊而审计单位不能发现错弊的情况, 只存在审计单位与被审计单位合谋而不报告错弊的情况。社会监管部门在对某个企业实施严格监管的情况下能发现该企业的虚假错弊, 在不实施严格监管的情况下则发现不了。审计三方关系人之间的信息是不对称的:被审计单位不了解审计单位是否愿意参与合谋, 社会监管部门并不知道被审计单位和审计单位是否存在合谋现象, 审计单位也不清楚社会监管部门是否会进行严格监管。按照进行博弈的顺序, 其他基本假设如下所述:

假设1:首先由自然来选择被审计单位的类型——诚实或者不诚实, 其中选择诚实的概率为 (1-ρ) , 选择不诚实的概率为ρ。诚实的被审计单位一定不会进行财务舞弊, 不诚实的被审计单位以一定的概率θ进行财务舞弊, 并且如果被审计单位实施了财务舞弊, 其一定会向审计单位发出合谋的意思表示。被审计单位实施财务舞弊并且与审计单位合谋成功, 未被报告舞弊的额外造假收益为I;被审计单位实施财务舞弊, 被报告舞弊的后果是不仅失去了额外造假收益I, 还会承担P的惩罚, 其中的P指经济处罚以及行政处罚和名誉受损的量化。

假设2:审计单位不存在胜任能力和审计质量的问题, 其以一定的概率与舞弊被审计单位进行合谋。相对于不合谋, 审计单位同意合谋后的额外收益为R, 若被监管部门发现, 审计单位不仅会被没收额外收益R, 而且还会遭受到行政处罚以及审计单位名誉上的损失, 量化为L。

假设3:社会监管部门以概率实施严格监管, 实施严格监管的额外成本为C, 监管机构实施严格监管查处了财务舞弊与审计合谋给社会带来了正能量, 对整个社会的财务体系都起到了一定的警示作用, 量化收益为B。监管部门监管不力, 变现纵容财务舞弊, 给社会带来了一定的损失D。

三、外部审计三方关系人博弈模型的构建

在上市公司外部审计中, 被审计单位、审计单位、社会监管部门三方关系人之间的博弈顺序依次展开。首先, 自然选择被审计单位的类型是{诚实, 不诚实}, 概率分别为 (1-ρ) 和ρ。然后是, 被审计单位进行行为策略的选择{舞弊, 不舞弊}, 其中诚实的被审计单位一定不会造假, 不诚实的审计单位以一定的概率θ进行财务舞弊。接着是, 审计单位的行为策略{合谋, 不合谋}, 被审计单位在没有进行财务舞弊的情况下, 审计单位的行为一定是不合谋, 被审计单位在实施财务舞弊的情况下向审计单位发出合谋邀请, 审计单位以α的概率同意合谋, 以 (1-α) 的概率拒绝合谋, 报告错弊。最后是监管部门的行为选择{严格, 不严格}, 监管部门并不知情被审计单位和审计单位的行为, 以的概率实施严格监管。

如图1所示, 图中博弈树上面的节点代表的是博弈参与人, 博弈树的路径代表参与人选择的行为策略, 最终收益括号内的数字由左至右分别为被审计单位、审计单位、监管部门。根据外部审计的不完全信息动态博弈模型, 博弈的结果有以下八种类型。

(1) 自然以 (1-ρ) 的概率选择了诚实的被审计单位, 诚实的被审计单位只有一种行为策略——不舞弊, 审计单位不存在合谋的情况, 监管部门以的概率实施严格监管, 被审计单位、审计单位、监管部门三者的收益为 (0, 0, -C) 。

(2) 自然以的概率选择了诚实的被审计单位, 诚实的被审计单位只有一种行为策略——不舞弊, 审计单位不存在合谋的情况, 监管部门以 (1-β) 的概率不实施严格监管, 被审计单位、审计单位、监管部门三者的收益为 (0, 0, 0) 。

(3) 自然以ρ的概率选择了不诚实的被审计单位, 不诚实的被审计单位以 (1-θ) 的概率选择不舞弊, 在被审计单位不舞弊的前提下, 审计单位只有一种策略选择——不合谋, 监管部门以β的概率实施严格监管, 被审计单位、审计单位、监管部门三者的收益为 (0, 0, -C) 。

(4) 自然以ρ的概率选择了不诚实的被审计单位, 不诚实的被审计单位以 (1-θ) 的概率选择不舞弊, 在被审计单位不舞弊的前提下, 审计单位只有一种策略选择——不合谋, 监管部门以 (1-β) 的概率不实施严格监管, 被审计单位、审计单位、监管部门三者的收益为 (0, 0, 0) 。

(5) 自然以ρ的概率选择了不诚实的被审计单位, 不诚实的被审计单位以θ的概率选择舞弊, 被审计单位以 (1-α) 的概率拒绝合谋选择披露被审计单位的财务舞弊, 监管部门以β的概率实施严格监管, 被审计单位、审计单位、监管部门三者的收益为 (-P, 0, -C) 。

(6) 自然以ρ的概率选择了不诚实的被审计单位, 不诚实的被审计单位以 (1-α) 的概率选择舞弊, 被审计单位以的概率拒绝合谋选择披露被审计单位的财务舞弊, 监管部门以 (1-β) 的概率不实施严格监管, 被审计单位、审计单位、监管部门三者的收益为 (-P, 0, 0) 。

(7) 自然以ρ的概率选择了不诚实的被审计单位, 不诚实的被审计单位以θ的概率选择舞弊, 被审计单位以的概率选择合谋选择而不披露被审计单位的财务舞弊, 监管部门以β的概率实施严格监管, 被审计单位、审计单位、监管部门三者的收益为 (-P, -L, B, -C) 。

(8) 自然以ρ的概率选择了不诚实的被审计单位, 不诚实的被审计单位以θ的概率选择舞弊, 被审计单位以 (1-β) 的概率选择合谋选择而不披露被审计单位的财务舞弊, 监管部门以的概率不实施严格监管, 被审计单位、审计单位、监管部门三者的收益为 (I, R, -D) 。

五、博弈模型分析与政策建议

根据审计三方关系人的博弈模型, 被审计单位、审计单位、监管部门的均衡结果是一组策略组 (θ*, α*, β*) 。在求解过程中将自然的选择概率ρ看成是一个常数, 根据博弈结果得出三方关系人博弈的期望收益分别为:

被审计单位期望收益为:

审计单位的期望收益为:

监管部门的期望收益为

运用最优化的一阶条件, 分别对 (1) (2) (3) 式求偏导, 并令偏导等于零, 即令

具体整理得到如下式子:

求解 (4) 得到三方博弈的均衡解为:

分析三方博弈的均衡解:

(1) 当时, 审计单位和监管部门最有策略的确定还依赖于彼此的行为选择。在时, 即被审计单位选择合谋的概率大于时, 监管部门的最优策略是严格监管;反之, 监管部门的最优策略是不严格监管。同样地, 在时, 审计单位的最优策略是参与合谋;反之审计单位的最有策略是不参加合谋。

当时, 即被审计单位选择舞弊的概率小于时, 监管部门的最优策略为不严格监管, 则审计单位的最优策略为合谋。

(2) 当时, 即审计单位同意合谋的概率小于时, 被审计单位的最优策略是不采取舞弊措施, 监管部门的最优策略是不执行严格监管措施。

当时, 即审计单位同意合谋的概率大于时, 监管部门和被审计单位最优策略的确定依赖于彼此策略的选择概率。在时, 即被审计单位选择舞弊的概率大于时, 监管部门的最优策略的选择严格监管;反之, 监管部门的最优策略是不严格监管。同样地, 在时, 即监管部门执行严格监管的概率小于时, 被审计单位的最优策略是进行财务舞弊;反之, 被审计单位的最有策略是不舞弊。

(3) 当时, 即监管部门执行严格监管的概率小于时, 被审计单位的最优策略是进行财务舞弊, 审计单位的最优策略是参与合谋。

当时, 即监管部门执行严格监管的概率大于时, 被审计单位的最优策略是不进行财务舞弊, 审计单位的最优策略是不参与合谋。

从以上模型分析中可知, 单独从被审计单位或者审计单位行为选择的概率上来判断, 还不足以完全得出另外两个博弈主体的最优策略行为。但是, 监管部门行为概率一旦确定, 即可以直接得出被审计单位和审计单位的最优行为选择。由此可见, 监管部门的行为策略在整个博弈过程中, 起到重要作用, 监管部门执行严格监管的力度越大, 对违规的处罚力度越大, 审计单位进行合谋、被审计单位进行财务舞弊的可能性就越小。结合三个均衡解的角度进行分析, 应该采取相关措施使得的值尽量小, 使和的值尽量大。就此提出以下几点建议:

(1) 从监管部门入手。一方面, 加强监管部门的监管力度, 严格执行监管。从博弈分析可知, 当监管部门执行严格兼顾的概率时, 被审计单位的最优策略是不进行财务舞弊, 审计单位的最优策略是不参与合谋, 由此可见, 监管部门执行严格监管的概率越大, 执法力度越大, 被审计单位和审计单位的行为越是趋向于诚实守法。另一方面, 不断提高监管部门的监管效率, 提高监管技术, 降低监管成本。严格监管的实施能够对被审计单位和审计单位起到震慑的作用, 被审计单位和审计单位从博弈的角度也会选择诚实的行为, 但是严格监管增加了监管部门的时间成本、人力成本以及经济成本等在一定程度上限制了严格监管模式的普及, 所以必须通过一定的技术手段来提高监管的效率, 降低监管成本, 在审计监管中普及严格监管模式。

(2) 从审计单位入手, 加强对审计单位审计人员的职业道德教育, 提高审计人员的整体道德素质。一方面, 通过行业协会等途径, 对坚持正义敢于披露财务舞弊行为的审计人员加大表彰力度, 对正面典型进行宣传;另一方面, 对违规行为进行严厉处罚, 加大审计单位的违规成本。

(3) 从被审计单位入手, 不断规范资本市场的信息质量要求, 通过技术手段提高对信息真实性的监控质量。加大对财务舞弊公司的处罚力度, 提高舞弊成本。通过社会影响以及责任机制, 对上市公司及其管理人员进行正确的引导。

参考文献

[1] .薄澜, 姚海星.上市公司财务舞弊与外部审计的博弈分析——基于不完全信息动态博弈模型.审计与经济研究, 2013 (3) .

[2] .刘国常, 韩春生.上市公司审计合谋的博弈分析和治理策略.审计与经济研究, 2005 (3) .

[3] .张涛, 吴联生.审计师变更与审计质量:一个理论分析.审计研究, 2010 (2)

[4] .庄立, 王玉蓉.现代风险导向审计下审计三方关系人的博弈关系.审计与经济研究, 2007 (11) .

[5] .卢宁文.审计质量形成机理的博弈均衡分析.审计与经济研究, 2012 (9) .

[6] .武恒光.审计证据、审计风险及不规则关系研究——基于一个舞弊博弈模型的分析.审计与经济研究, 2010 (4)

【循环动态博弈论文】推荐阅读：

动态循环09-03

三方动态博弈07-29