三方动态博弈(通用7篇)
三方动态博弈 篇1
上市公司的经营者通过财务报告向公司股东、潜在股东、债权人、潜在债权人、社会公众等提供上市公司的经营财务信息, 真实的会计信息是资本市场运作的有效保证。在现行的制度安排之下, 外部审计为会计信息的真实性提供了高质量保证。但是财务造假新闻依然不时爆出, 并且相关会计事务所均有牵涉。发现财务报告错弊取决于注册会计师的专业胜任能力, 而报告错弊则取决于注册会计师的审计独立性。在审计与被审计之间, 始终存在着被审计单位、审计单位以及社会监管部门的三方博弈:被审计单位为了谋取个人或集体的利益存在进行财务舞弊的动机, 审计单位有出于利益诱因而与被审计单位合谋的可能性, 社会监管部门出于成本的考虑在严格监管与非严格监管之间摇摆不定, 而这三者之间任何一方决策的变动都会对整个行为结果产生一定的影响, 并且三方之间彼此不知道对方的行为策略, 该博弈使用于不完全信息动态博弈。通过研究审计三方之间相互博弈的过程, 提出提高会计信息质量的政策建议。
一、文献评述
相较于国外学者们对于审计博弈内容研究上的精细和深入以及方法上的成熟和多样, 我国学者对审计博弈研究起步晚、发展快, 对于审计模型的构建也不只是局限于简单的静态策略博弈模型, 而开始研究更加复杂的动态博弈模型。薄澜、姚海星通过构建关于上市公司管理者财务舞弊与注册会计师外部审计的不完全信息动态博弈模型, 分析了公司管理者和审计师的最优策略以及博弈模型多期重复进行的可能结果, 提出减少财务舞弊发生的措施和建议。刘国常、韩春生从博弈论的角度对审计合谋的市场选择及其治理策略进行探讨。张涛、吴联生通过构建股东、管理层和审计师三方参与的两委托人——单代理人博弈模型, 研究了固定审计费用下不同审计师变更方式对审计质量的影响。庄立、王玉蓉构建和比较了传统审计模式和现代风险导向审计模式下注册会计师、客户以及政府监管三方关系人的博弈模型。卢宁文, 通过不完全信息动博弈模型的构建分析了审计师行为的选择。武恒光通过管理层和审计师的舞弊博弈模型进行审计证据、审计风险及不规则关系研究。国内学者研究较多的是管理者与审计师之间的博弈, 本文通过不完全信息动态博弈模型的构建分析被审计单位、审计单位以及社会监管部门三者之间相互影响的决策过程。
二、审计三方关系人博弈模型的基本假设
本文所说的财务舞弊是指, 被审计单位人为地没有在财务报告上真实、公允地反映企业真实的财务状况和经营状况, 故意欺骗财务报告信息使用者。在本文构建的不完全信息动态博弈模型中, 假设审计单位的专业胜任能力是没有问题的并且实施审计的复杂程度也是无差别的, 即不存在被审计单位财务舞弊而审计单位不能发现错弊的情况, 只存在审计单位与被审计单位合谋而不报告错弊的情况。社会监管部门在对某个企业实施严格监管的情况下能发现该企业的虚假错弊, 在不实施严格监管的情况下则发现不了。审计三方关系人之间的信息是不对称的:被审计单位不了解审计单位是否愿意参与合谋, 社会监管部门并不知道被审计单位和审计单位是否存在合谋现象, 审计单位也不清楚社会监管部门是否会进行严格监管。按照进行博弈的顺序, 其他基本假设如下所述:
假设1:首先由自然来选择被审计单位的类型——诚实或者不诚实, 其中选择诚实的概率为 (1-ρ) , 选择不诚实的概率为ρ。诚实的被审计单位一定不会进行财务舞弊, 不诚实的被审计单位以一定的概率θ进行财务舞弊, 并且如果被审计单位实施了财务舞弊, 其一定会向审计单位发出合谋的意思表示。被审计单位实施财务舞弊并且与审计单位合谋成功, 未被报告舞弊的额外造假收益为I;被审计单位实施财务舞弊, 被报告舞弊的后果是不仅失去了额外造假收益I, 还会承担P的惩罚, 其中的P指经济处罚以及行政处罚和名誉受损的量化。
假设2:审计单位不存在胜任能力和审计质量的问题, 其以一定的概率与舞弊被审计单位进行合谋。相对于不合谋, 审计单位同意合谋后的额外收益为R, 若被监管部门发现, 审计单位不仅会被没收额外收益R, 而且还会遭受到行政处罚以及审计单位名誉上的损失, 量化为L。
假设3:社会监管部门以概率实施严格监管, 实施严格监管的额外成本为C, 监管机构实施严格监管查处了财务舞弊与审计合谋给社会带来了正能量, 对整个社会的财务体系都起到了一定的警示作用, 量化收益为B。监管部门监管不力, 变现纵容财务舞弊, 给社会带来了一定的损失D。
三、外部审计三方关系人博弈模型的构建
在上市公司外部审计中, 被审计单位、审计单位、社会监管部门三方关系人之间的博弈顺序依次展开。首先, 自然选择被审计单位的类型是{诚实, 不诚实}, 概率分别为 (1-ρ) 和ρ。然后是, 被审计单位进行行为策略的选择{舞弊, 不舞弊}, 其中诚实的被审计单位一定不会造假, 不诚实的审计单位以一定的概率θ进行财务舞弊。接着是, 审计单位的行为策略{合谋, 不合谋}, 被审计单位在没有进行财务舞弊的情况下, 审计单位的行为一定是不合谋, 被审计单位在实施财务舞弊的情况下向审计单位发出合谋邀请, 审计单位以α的概率同意合谋, 以 (1-α) 的概率拒绝合谋, 报告错弊。最后是监管部门的行为选择{严格, 不严格}, 监管部门并不知情被审计单位和审计单位的行为, 以的概率实施严格监管。
如图1所示, 图中博弈树上面的节点代表的是博弈参与人, 博弈树的路径代表参与人选择的行为策略, 最终收益括号内的数字由左至右分别为被审计单位、审计单位、监管部门。根据外部审计的不完全信息动态博弈模型, 博弈的结果有以下八种类型。
(1) 自然以 (1-ρ) 的概率选择了诚实的被审计单位, 诚实的被审计单位只有一种行为策略——不舞弊, 审计单位不存在合谋的情况, 监管部门以的概率实施严格监管, 被审计单位、审计单位、监管部门三者的收益为 (0, 0, -C) 。
(2) 自然以的概率选择了诚实的被审计单位, 诚实的被审计单位只有一种行为策略——不舞弊, 审计单位不存在合谋的情况, 监管部门以 (1-β) 的概率不实施严格监管, 被审计单位、审计单位、监管部门三者的收益为 (0, 0, 0) 。
(3) 自然以ρ的概率选择了不诚实的被审计单位, 不诚实的被审计单位以 (1-θ) 的概率选择不舞弊, 在被审计单位不舞弊的前提下, 审计单位只有一种策略选择——不合谋, 监管部门以β的概率实施严格监管, 被审计单位、审计单位、监管部门三者的收益为 (0, 0, -C) 。
(4) 自然以ρ的概率选择了不诚实的被审计单位, 不诚实的被审计单位以 (1-θ) 的概率选择不舞弊, 在被审计单位不舞弊的前提下, 审计单位只有一种策略选择——不合谋, 监管部门以 (1-β) 的概率不实施严格监管, 被审计单位、审计单位、监管部门三者的收益为 (0, 0, 0) 。
(5) 自然以ρ的概率选择了不诚实的被审计单位, 不诚实的被审计单位以θ的概率选择舞弊, 被审计单位以 (1-α) 的概率拒绝合谋选择披露被审计单位的财务舞弊, 监管部门以β的概率实施严格监管, 被审计单位、审计单位、监管部门三者的收益为 (-P, 0, -C) 。
(6) 自然以ρ的概率选择了不诚实的被审计单位, 不诚实的被审计单位以 (1-α) 的概率选择舞弊, 被审计单位以的概率拒绝合谋选择披露被审计单位的财务舞弊, 监管部门以 (1-β) 的概率不实施严格监管, 被审计单位、审计单位、监管部门三者的收益为 (-P, 0, 0) 。
(7) 自然以ρ的概率选择了不诚实的被审计单位, 不诚实的被审计单位以θ的概率选择舞弊, 被审计单位以的概率选择合谋选择而不披露被审计单位的财务舞弊, 监管部门以β的概率实施严格监管, 被审计单位、审计单位、监管部门三者的收益为 (-P, -L, B, -C) 。
(8) 自然以ρ的概率选择了不诚实的被审计单位, 不诚实的被审计单位以θ的概率选择舞弊, 被审计单位以 (1-β) 的概率选择合谋选择而不披露被审计单位的财务舞弊, 监管部门以的概率不实施严格监管, 被审计单位、审计单位、监管部门三者的收益为 (I, R, -D) 。
五、博弈模型分析与政策建议
根据审计三方关系人的博弈模型, 被审计单位、审计单位、监管部门的均衡结果是一组策略组 (θ*, α*, β*) 。在求解过程中将自然的选择概率ρ看成是一个常数, 根据博弈结果得出三方关系人博弈的期望收益分别为:
被审计单位期望收益为:
审计单位的期望收益为:
监管部门的期望收益为
运用最优化的一阶条件, 分别对 (1) (2) (3) 式求偏导, 并令偏导等于零, 即令
具体整理得到如下式子:
求解 (4) 得到三方博弈的均衡解为:
分析三方博弈的均衡解:
(1) 当时, 审计单位和监管部门最有策略的确定还依赖于彼此的行为选择。在时, 即被审计单位选择合谋的概率大于时, 监管部门的最优策略是严格监管;反之, 监管部门的最优策略是不严格监管。同样地, 在时, 审计单位的最优策略是参与合谋;反之审计单位的最有策略是不参加合谋。
当时, 即被审计单位选择舞弊的概率小于时, 监管部门的最优策略为不严格监管, 则审计单位的最优策略为合谋。
(2) 当时, 即审计单位同意合谋的概率小于时, 被审计单位的最优策略是不采取舞弊措施, 监管部门的最优策略是不执行严格监管措施。
当时, 即审计单位同意合谋的概率大于时, 监管部门和被审计单位最优策略的确定依赖于彼此策略的选择概率。在时, 即被审计单位选择舞弊的概率大于时, 监管部门的最优策略的选择严格监管;反之, 监管部门的最优策略是不严格监管。同样地, 在时, 即监管部门执行严格监管的概率小于时, 被审计单位的最优策略是进行财务舞弊;反之, 被审计单位的最有策略是不舞弊。
(3) 当时, 即监管部门执行严格监管的概率小于时, 被审计单位的最优策略是进行财务舞弊, 审计单位的最优策略是参与合谋。
当时, 即监管部门执行严格监管的概率大于时, 被审计单位的最优策略是不进行财务舞弊, 审计单位的最优策略是不参与合谋。
从以上模型分析中可知, 单独从被审计单位或者审计单位行为选择的概率上来判断, 还不足以完全得出另外两个博弈主体的最优策略行为。但是, 监管部门行为概率一旦确定, 即可以直接得出被审计单位和审计单位的最优行为选择。由此可见, 监管部门的行为策略在整个博弈过程中, 起到重要作用, 监管部门执行严格监管的力度越大, 对违规的处罚力度越大, 审计单位进行合谋、被审计单位进行财务舞弊的可能性就越小。结合三个均衡解的角度进行分析, 应该采取相关措施使得的值尽量小, 使和的值尽量大。就此提出以下几点建议:
(1) 从监管部门入手。一方面, 加强监管部门的监管力度, 严格执行监管。从博弈分析可知, 当监管部门执行严格兼顾的概率时, 被审计单位的最优策略是不进行财务舞弊, 审计单位的最优策略是不参与合谋, 由此可见, 监管部门执行严格监管的概率越大, 执法力度越大, 被审计单位和审计单位的行为越是趋向于诚实守法。另一方面, 不断提高监管部门的监管效率, 提高监管技术, 降低监管成本。严格监管的实施能够对被审计单位和审计单位起到震慑的作用, 被审计单位和审计单位从博弈的角度也会选择诚实的行为, 但是严格监管增加了监管部门的时间成本、人力成本以及经济成本等在一定程度上限制了严格监管模式的普及, 所以必须通过一定的技术手段来提高监管的效率, 降低监管成本, 在审计监管中普及严格监管模式。
(2) 从审计单位入手, 加强对审计单位审计人员的职业道德教育, 提高审计人员的整体道德素质。一方面, 通过行业协会等途径, 对坚持正义敢于披露财务舞弊行为的审计人员加大表彰力度, 对正面典型进行宣传;另一方面, 对违规行为进行严厉处罚, 加大审计单位的违规成本。
(3) 从被审计单位入手, 不断规范资本市场的信息质量要求, 通过技术手段提高对信息真实性的监控质量。加大对财务舞弊公司的处罚力度, 提高舞弊成本。通过社会影响以及责任机制, 对上市公司及其管理人员进行正确的引导。
参考文献
[1] .薄澜, 姚海星.上市公司财务舞弊与外部审计的博弈分析——基于不完全信息动态博弈模型.审计与经济研究, 2013 (3) .
[2] .刘国常, 韩春生.上市公司审计合谋的博弈分析和治理策略.审计与经济研究, 2005 (3) .
[3] .张涛, 吴联生.审计师变更与审计质量:一个理论分析.审计研究, 2010 (2)
[4] .庄立, 王玉蓉.现代风险导向审计下审计三方关系人的博弈关系.审计与经济研究, 2007 (11) .
[5] .卢宁文.审计质量形成机理的博弈均衡分析.审计与经济研究, 2012 (9) .
[6] .武恒光.审计证据、审计风险及不规则关系研究——基于一个舞弊博弈模型的分析.审计与经济研究, 2010 (4)
[7] .张维迎.博弈论与信息经济学.上海人民出版社, 2005.
三方动态博弈 篇2
在全球金融危机的背景下,企业利益与社会利益矛盾的凸显和社会期望的提升,使企业社会责任问题在中国变得日益紧迫。对于企业,人们非常希望它们能够承担起应当承担的责任 ,以符合社会期望的方式追求商业成功 ,维护人的尊严和社会正义。然而,由于信息不对称,缺乏一定的监督机制,企业在承担社会责任方面整体表现与人们的期盼形成了强烈反差[1]。目前,我国企业社会责任状况不容乐观。国内企业以及在华经营的跨国公司对利益相关者的社会责任严重缺失,导致了严重的劳资冲突、环境污染和社会信任危机,并成为阻碍我国经济发展的重要因素。国内企业的社会责任缺失常常被归因于企业正处于发展阶段、规模小、实力不足等因素;而在华经营的跨国公司的社会责任缺失则说明,我国促进企业承担社会责任的机制还不健全[2]。因此,如何把为数众多的理论转化为实际,培育促进我国企业承担社会责任的机制,从而切实有效改善我国企业社会责任状况,成为当前企业社会责任研究的核心问题[3]。在此背景下,本文从政府、企业、社会三个主体出发,运用动态博弈模型来分析社会责任问题,对企业社会责任问题的深层次问题进行剖析,得出一些结论并提出相应的对策。
动态博弈是指博弈参与各方的行为不是同时发生,一部分人先行动,一部分人则后行动,后行动者可以观察到先行动者的行为选择,动态博弈按照博弈方掌握的信息的完整性分为完全信息动态博弈和不完全信息动态博弈。
完全信息动态博弈参与者的一次行动即为一个博弈阶段,动态博弈中往往不是一两次博弈过程即结束,而是中间有多次博弈过程,多个博弈行动选择,因此也就存在多个阶段博弈,动态博弈中前一阶段的最优选择可能在下一阶段并不为最优,因此其求解较为困难,其表示方式多以扩展式表示。通常涉及到三个博弈方时则采取博弈树模型,如果有更多的博弈主体则需要引入函数和文字进行表述[4]。
动态博弈分析求解一般采用逆向归纳方法,由于动态博弈往往是多阶段博弈过程,因此,从最后一个博弈阶段分析,其参与者的收益最大,即为其最优选择,其后依次类推,倒数第二个参与者也将选择最大收益,依此类推到动态博弈的第一阶段,得出的最优期望收益即为博弈参与方各自最优选择,也即博弈的均衡解,逆向归纳法是动态博弈的基本分析方法[5]。
2 企业社会责任问题三方动态博弈模型
2.1 问题的假设
①假设博弈参与方,企业、社会和政府均为经济人;
②社会主要指消费者维权组织或者NGO,主要起到监督企业履行社会责任的作用;
③假设汽车企业履行社会责任则其成本为W,而汽车企业如果不履行社会成本,需要给予政府贿赂金支出αW, 一般情况下, 进行政府贿赂的成本应低于承担社会责任的成本, 因此汽车企业不履行社会责任的收益为(1-α)W(其中0<α<1)。
④假设政府在监督企业履行中,接受贿金被发现则面临β1W处罚,汽车企业也要处罚β(1-α)W,而在监督过程政府如果不作为将被处罚βW(其中β>1)。
⑤社会监督成本为C,政府如果履行干预职责可以得到收益W.
⑥政府收取贿金面临βW的罚款(β>1),此时汽车企业面临βW的罚款[6]。
2.3 均衡解分析
通过博弈树和收益矩阵可以求解出动态博弈均衡解,以下分别对均衡解进行分析:
(1)汽车企业的期望收益均解
上述函数要达到最大值,需要对其求导数,一阶导数为0,函数值达到最大:
化简可得:
(2)政府的期望收益均解
上述函数要达到最大值,需要对其求导数,一阶导数为0,函数值达到最大:
化简可得:
(3)社会的期望收益均解
上述函数要达到最大值,需要对其求导数,一阶导数为0,函数值达到最大:
化简可得:
综合上述分析,可以得出社会、政府和企业的均解最大期望收益为:
通过求解企业、政府和社会三者动态博弈均衡解可以得出:
①从
3 结论
通过以上分析,可以看出可以从以下方面入手,促进汽车企业履行社会责任:
(1)增加社会监督,大力培育社会监督力量
根据动态博弈均衡分析, 要充分发挥企业社会责任履行的社会监督作用, 这就需要大力培育社会监督力量,建立相关权利组织。本文认为,大力发展消费者协会和NGO,这类社会组织有助于企业、政府和社会三者之间进行协调,同时赋予这类组织监督权利,避免企业在履行社会责任过程中和政府串通,由于我国市场经济建立的时间较短,人们的市场意识不强,因此此类组织在我国影响力较小,消费者在企业未履行社会责任时,往往抱着息事宁人、多一事不如少一事的想法,也未能借助外部组织维护自身的合法权益,这些决定了政府需要大力发展和扶持社会监督组织,通过社会监督力量来引导和规范企业社会责任的履行。
(2)企业社会责任的分配要合理
上述分析说明企业履行社会成本的概率和其承担社会成本所付出的成本大小密切相关,如果成本太大,企业更倾向于不履行社会责任,倾向于行贿等行为,避免承担社会责任,因此,如果企业社会责任分配不合理,使得企业承担了过重的社会责任,如对企业征收过高的赋税,将使其企业实力下降,也极大地打消了其履行社会责任的积极性,因此政府和社会应依照汽车企业的不同特点,制定适宜的社会责任承担标准,合理分配企业社会责任。
(3)加大对政府干预的监督力度
政府作为宏观经济的调控者,在汽车企业履行社会责任中具有重要的作用,也正是由于政府在干预企业是否履行社会责任中存在作为和不作为两种行为选择,因此考虑引入社会监督,通过加大监督政府干预的力度,使得政府不得不强化对企业的干预,党的十七大报告中也指出要充分发挥社会主义民主政治的作用,强化社会舆论监督,加大政府干预的监督力量有助于政府在干预企业履行社会责任中的作用,也可以有效避免腐败等行为。
(4)加大企业社会责任宣传教育力度
通过上述分析可以看出,如果企业有履行社会责任的意识,那么社会监督的压力将小一些,其监督成本也低一些,因此从意识上强化企业履行社会责任是促进企业履行社会责任的重要手段,如政府通过宣传教育企业履行社会责任,并加大宣传号召力,如鼓励企业节能减排,并给予相应政策优惠,依次激发企业履行社会责任的积极性,使得企业认识到,履行社会责任有助于其提升企业声誉,长期来讲有利于企业可持续竞争力的提升,这样一来也可以减小政府和社会监督的力度,企业自觉履行社会责任,实现企业、政府、社会三者共赢的目的。
参考文献
[1]曹凤月.企业社会责任研究中的几个重要问题[J].中国劳动关系学院学报,2006,(6).
[2]卢代富.企业社会责任的经济学与法学分析[M].法律出版社,2002:96.
[3]袁庆华.企业社会责任问题研究[D].西安:西安建筑科技大学,2008.
[4]张维迎.博弈论与信息经济学[M].上海:上海人民出版社,1996:80~100.
[5]Krishna.Aggressive tax planning:Differentiatingthose playing the game frame those who don’t[J].Economic;Psychology,2004,25(5):307~329.
三方动态博弈 篇3
房地产业作为我国国民经济的重要支柱产业之一,对我国社会经济发展作用巨大。近年来,随着我国经济的持续发展,房地产市场上供需失衡日益显现。由于经济增长对房地产业的依赖程度较高,若房地产业出现较大起伏,可能会导致相关产业甚至整个国民经济出现较大的波动。
房价问题不仅关系国计民生,而且涉及社会和谐发展,因此房价历来是社会各界和学者们关注的焦点。史永东、陈日清(2006)分析了房地产市场中羊群行为的形成机制、羊群行为如何导致房地产泡沫生成、以及经济状况恶化时泡沫破裂后居民破产的可能性[1];牟玲玲、李佩等(2010)在信息不对称条件下分析了市场各主体的相互作用关系,并求出博弈模型的序贯均衡解[2];杨玉静、樊新安(2009)从心理契约角度引入进化博弈模型,建立了购销行为的复制动态方程[3]。
但以上的一些研究多建立在完全信息的基础之上,且以分析单一价格下双博弈方的博弈为主,并未涉及双房价三方动态博弈。实际上房地产市场为典型的信息不对称市场,通常房地产商比购房者拥有更多的房市房价信息。本文从完全但不完美信息角度出发,构建了高低双房价下包括政府、房地产商、购房者三方在内的动态博弈扩展形,给出了纯策略和混合策略两个算例的完美贝叶斯均衡解,并结合扩展形运用贝叶斯法则和逆向归纳法分析了三方的收益情况和策略选择。
2基本假设
①设在某一时期T内,某房地产市场购销博弈由政府(G)、房地产商(D)和购房者(F)三个风险中立的博弈方构成,博弈中不存在讨价还价,且无退还保证。在第T期内,三方均不清楚房地产市场(M)的真实经济状态,但在第T期之前的经济状态分布是三方的理性的共同知识(Common Knowledge of Rationality,CKR)。
②G在此博弈中占据主导地位,其出台的诸如鼓励或抑制等相关政策对M有直接影响,并对各类D有同等约束力,因此不考虑D之间的竞争。同时抽象掉各类房屋质的差异性,即假定所有同一价格下的房子都是同质的,高价和低价是D的营销策略,也是F判断M运行前景好坏和购买与否的依据。
③由于信息传递不畅或保密等因素的影响,后行动的F自身能力所限,对先做出行动的D不够了解,但清楚各方的收益,即F具有完全但不完美信息(complete but imperfect infor-mation)。因不存在讨价还价,故处在多节点信息集(multiple-node information set)上的他只能根据D发出的“高价”或“低价”的信号,判定M运行前景的好坏,决定购买与否。
④这里M运行前景的好坏实际上是三方的一种心理预期,带有一定的投机色彩,这对三方策略的选择也十分重要。作为CKR的第T期之前的M运行状况,会使D在第T期调整定价策略,也会影响F的购房选择,G当然也会针对第T期之前的博弈结果出台相关调整政策。以下为分析之便,称“市场前景看好的房子”为“好房子”(Peach),“市场前景不好的房子”为“差房子”(Lemon)。
3模型构建
根据以上假定,构建如下模型。
①在第T期开始时,G根据第T期之前的M运行情况,在本期出台鼓励(R)或抑制(S)房价的政策。在两种不同的政策下,其所获净收益分别以U1、U2表示,有U1>U2>0。
②接着,D在看到G出台R或S后,判定本期M运行前景的好(g)或坏(b),制定高价(k)或低价(l)的营销策略。D的收益以净收入表示,即收益减去成本。
A:若G出台政策R,则D判定M运行前景是g或b的条件概率分别为α和1-α,即P(g)=P(g|R)=α,P(b)=P(b|R)=1-α,并以一定的条件概率分布制定出k或l,且有
P(k|g)=β,P(l|g)=1-β,P(k|b)=γ,P(l|b)=1-γ
再假定D在判定M运行前景为坏的情况下,为使房子以“高价”出手,需要花费一定的成本C(C>0)进行伪装或加大宣传,以便吸引或者迷惑F。假定D在判定M运行前景无论好或坏的情况下,均制定“高价”为Pk,“低价”为Pl,且有Pk>Pt>0。
B:为分析方便,这里假定:若G出台政策S,则D判定M运行前景一定为“坏”,即p(g|S)=0,p(b|S)=1,这种情况下,理性的D会选择“不卖”。而对于F来讲,G出台政策S,在D选择“不卖”的信号下,他同样也会判定M运行前景为“坏”,基于房子作为消费品和保值品的双重考虑,他会选择“不买”(即使想买,D也不会卖,并且“购买”并非理性的选择)。即G出台政策S后,D选择“不卖”,F选择“不买”,博弈结束,此时三方的收益为(U2,0,0)。由于没有交易成功,为此G需支付一定的成本救市,并在下一时期对政策做相应的调整。
③F在D行动后,根据D发出的Pk、Pl的信号,对M运行前景的好坏进行判断,即对房子或为Peach或为Lemon进行判断,并以相等概率作出“购买”(FY)或“不买”(FN)的选择,即他选择FY或FN的概率都是0.5。F的收益以消费者剩余表示,即价值减去价格。对他而言,判定房子为Peach或Lemon的价值分别为V和W,显然V>W>0。为简化分析,进一步假设如下不等式成立:
V-Pk>W-Pt>0>W-Pk.
这意味着用Pk买到Peach比用Pl买到Lemon要合算,而用Pl买到Lemon还不至于亏本,但若用Pk买到Lemon则是要吃亏的。对于F来说,确实有可能存在一种理想的情况,即用Pl买到Peach,这时他的收益比用Pk买到Peach的收益更大,即V-Pl>V-Pk。这种小概率的事件当然只是理想的情况,这里不妨设出现这种情况只是偶然的好运气,即在正常情况下,是以Pk买到Peach或者Pl买到Lemon。
根据以上分析,建立该双房价三方动态博弈模型的扩展形如下:
关于图1的说明:模型的扩展形中,每一个节点上最后一行的三个数字分别表示G、D、F三者的收益情况,实箭线表示各方行动的先后顺序,虚线表示F处在多节点信息集,置于方框之中的M表示一个中转状态,即M虽不参与决策但对三方的判断和选择都有影响。G和D先后行动,F在看到D发出的的Pk、Pl信号后,就房子为Peach或Lemon进行判断,由此对应了不同前景的四个节点之选择,构成了“多节点信息集”,这种“多节点信息集”也说明F所掌握的信息是不完美的。
4模型分析
4.1 理论分析
根据纳什均衡的存在性定理可知,对应完全但不完美信息博弈的纳什均衡是完美贝叶斯均衡(Perfect Bayesian Equilibrium,PBE),一个纯策略或混合策略PBE都应该满足以下四个条件[4,5,6,7] :
①各博弈方对于达到的信息集上的每个节点都有一个可能性的“判断”(Belief),该“判断”即博弈达到该信息集中各个节点可能性的概率分布,对于单节点信息集判断其达到概率为1;
②给定各博弈方的“判断”,每个博弈方的策略在所有信息集h开始的后续博弈上都是最优的,或者说所有博弈方都是“序贯理性”(sequentially rational)的;
③在均衡路径(equilibrium path)上的信息集处,“判断”是由贝叶斯法则和各博弈方的策略决定的;
④在非均衡路径(off-equilibrium path)上的信息集处,“判断”是由贝叶斯法则和各博弈方在此处可能有的均衡策略决定的。
从图1反映的双房价三方动态博弈模型一般情况来看,由于D在判定M运行前景好、坏两种情况下都有选Pk、Pl两种可能性,因此F并不能简单地根据价格的高低判断出Peach 或者Lemon。也就是说F要作出“判断”必须根据对方的策略(取决于收益和己方策略等)、前T期的经验(平均来说,市场上Peach和Lemon所占的比例)以及利用贝叶斯法则。
经分析不难发现,若C→0,即D在判定M运行前景“坏”时几乎不需要花费多少的代价,就能以Lemon冒充Peach而不被F发现,则所有的D都会选择要Pk,因为选择Pk是相对于Pl的严格上策(或称条件占优策略,conditional dominance)。因此要想使制定的房价透露出(至少部分)Peach 或Lemon方面的信息,就必须假设C≠0,这也意味着F应当具有一定的鉴别力,并不是很容易上当受骗的。
设P(g|k),P(b|k),P(g|l),P(b|l)分别表示F判断D“以Pk卖出Peach ”、“以Pk卖出Lemon”、“以Pl卖出Peach”、“以Pl卖出Lemon”四种情况下的条件概率,那么根据贝叶斯法则有:
undefined
undefined
undefined(式1-4)
4.2 算例一:纯策略
先来分析一种理想的情况,即令
undefined
将其带入式1-1~1-4,可以得到
P(g|k)=1,P(b|k)=0,P(g|l)=0,P(b|l)=1。
那么C>Pk-Pl当时,该双房价三方动态博弈模型的纯策略PBE的策略组合有两个,即{R,(Peach)高价,(Peach)购买}和{R,(Lemon)低价,(Lemon)购买},收益分别为(U1,(Peach)Pk,(Peach)V-Pk)和(U1,(Lemon)Pl,(Lemon)W-Pl)。三方相应的判断如下:
①在第T期内,M出台政策R,即鼓励房市发展;
② D看到政策R后,在判定M前景为好的情况下对Peach定为Pk,在判定M前景为坏的情况下对Lemon定为;
③ F在判定房子为Peach时选择接受Pk买下Peach,在判定房子为Lemon时选择接受Pl买下Lemon。F的判断是P(g|k)=1,P(b|k)=0,P(g|l)=0,P(b|l)=1。其中的四个条件概率依次对应F判断D“以Pk卖出Peach ”、“以Pk卖出Lemon”、“以Pl卖出Peach”、“以Pl卖出Lemon”四种情况。
下面,用逆向归纳法(Backward Induction)来论证上述策略组合{R,(Peach)高价,(Peach)购买}、{R,(Lemon)低价,(Lemon)购买}和判断确实构成纯策略PBE。
根据逆向归纳法,先分析F的选择。对于F来说,给定自己的上述判断,若D定价Pk,那么F选择购买(FY)和不买(FN)的期望分收益别是:
EkFY=P(g|k)(V-Pk)+P(b|k)(W-Pk)=V-Pk>0,EkFN=0.
若D定价Pl,那么F选择购买(FY)和不买(FN)的期望收益分别是:
ElFY=P(g|l)(V-Pl)+P(b|l)(W-Pl)=W-Pl>0,ElFN=0.
两种情况下F选择FN的期望收益都是0,所以对F来说,FY是相对于FN的条件占优策略。
再来分析一下D的选择。给定D的判断和策略,当M前景好时,对Peach定Pk是上策,因为Pk>Pl,当然选择要Pk;当M前景坏时,由于Pl>0>Pk-C,所以对Lemon定Pl才是合理的。因此,D在判定M前景好的情况下选择对Peach定Pk、前景坏时选择对Lemon定Pl确实是他唯一的符合序贯理性的策略。
再看G的选择,出台政策R的收益为EU1R=U1P(g)+U1P(b)=U1。若出台政策S,市场上交易不宜成功,其收益EU2S=U2。而U1>U2>0,显然EU1R>EU2S,此时S是相对于R的条件劣策略(conditionally dominated),故理性的G会选择出台政策R而非S。
接着回头分析F的判断,当G出台政策R时,D会在M前景好的情况下选择对Peach定Pk而在前景坏时选择对Lemon定Pl,这与F的判断一致,即F的判断是合乎理性的。
这样上述策略组合{R,(Peach)高价,(Peach)购买}、{R,(Lemon)低价,(Lemon)购买}和判断就通过了PBE的Ⅰ~Ⅳ四个要求的检验,因此两个策略组合都构成纯策略PBE,当然策略组合{R,(Peach)高价,(Peach)购买}也严格占优于策略组合{R,(Lemon)低价,(Lemon)购买},即理想的情形下{R,(Peach)高价,(Peach)购买}会比{R,(Lemon)低价,(Lemon)购买}更有效率。
不幸的是,上述理想的市场均衡在实际中并不是非常普遍,因为在其他条件下,尤其是当C的水平比较不利的情况下,常常会导致较差的市场均衡的出现。上述一种极端的情况是,当C=0时,即在M前景为坏的情况下,D会选择以Lemon冒充Peach而完全不需要成本。在这种情况下,所有理性的D都会选择以Pk出售房子,此时的Pk和Pl已经完全不能透露出Peach和Lemon的任何信息,而此时若再加上EkFy=P(g|k)(V-Pk)+P(b|k)(W-Pk)<0,即F选择FY的期望收益为负,则F的必然选择是FN。这时D的房子就会卖不出去,这样市场上的交易就不会成功,高房价的D最后会选择退出市场,即使是Peach也不会有人去买。这种情况就非常类似于“柠檬原理”(Lemon Principle),即在不完美信息的情况下,Lemon会赶走Peach,最终Lemon将占据整个市场,使市场丧失效率甚至处于“瘫痪”。
4.3 算例二:混合策略
再分析混合策略的情形,假设D在判定M前景好坏的情况下,以一定的概率分布制定Pk和Pl的混合策略,其概率分布如下:
将其带入式1-1~1-4,可以得到undefined。
接着再令V-Pl>V-Pk>W-Pl>W-Pk≥0(这里W-Pk≥0表示若F以Pk买到Lemon收益几乎为零)和0
①G出台政策R,即鼓励房市发展;
②D看到G出台政策R后,以下表中的概率分布选择定价策略:
③F根据D的定价信息,判定在M为好的情况下对Peach以Pk购买,在M为坏的情况下对Lemon以Pl购买。F的判断是undefined。其中的四个条件概率依次对应F判断D“以Pk卖出Peach ”、“以Pk卖出Lemon”、“以Pl卖出Peach”、“以Pl卖出Lemon”四种情况。
同理运用逆向归纳法不难证明:该混合策略组合和判断也构成PBE。但对于混合策略的情形,限制条件比较严格,毕竟PBE本身对各博弈方的理性就有很高的要求。D和F对于彼此的收益情况是很敏感的,这种敏感效应进而会影响G出台的政策。
以上只给出了两个简单的算例,若改变相关的参数和概率分布,各方的收益情况和策略选择、博弈的结果与均衡都会发生改变。总之,D给出的定价信息对于F判断房子为Peach或Lemon具有重大影响,从而影响其购买与否。
5结论与建议
综上所述,得出以下结论:
第一,由于不完美信息的影响,房地产商给出的定价信息,是购房者判定市场前景好坏及购买与否的重要依据。若房地产商判定市场前景为好或坏时,再以一定的概率分布制定高价和低价,则会增加购房者判断市场前景好坏及辨别Peach和Lemon的难度。
第二,供需双方对于彼此的收益的情况比较敏感,这种敏感效应进而会影响政府出台的政策,因此政府掌握出台政策的力度非常关键。
由此,也给出一些建议:
第一,为尽量减少购房的不理性因素和不完美信息的影响,购房者应当多方面搜集信息,提高鉴别能力,理性地投资以降低风险。
第二,房地产商一方面要对政府出台的相关政策有一个比较准确全面的判断,另一方面应当合理投资和制定房价,房价应当理性的回归,尽量减少泡沫的产生。
第三,政府是调控房价和维持房市健康稳定发展的关键。调控房价、抑制泡沫,换个角度说就是调控供需,如何抑制高房价就是如何使供需达到平衡,这也无非就是增加供给和减少需求,例如改革土地招标制度[8] 、增加廉租房和小户型商品房等的供应、完善金融信贷制度和机制、降低通货膨胀率等等,但实际操作远远没有这么简单。政府出台的政策一方面需要严格执行,另一方面也要加强监管、完善法制,并及时的反馈和调整,从而减少泡沫使房地产市场更加健康平稳地发展。
参考文献
[1]史永东,陈日清.信息不对称、羊群行为与房地产市场中的居民破产[J].财经问题研究,2006,(12):39—46.
[2]牟玲玲,李佩,陈立文.信息不对称条件下房地产市场博弈序贯均衡分析[J].系统工程,2010,(9):76—80.
[3]杨玉静,樊新安.基于心理契约的房地产购销进化博弈行为分析[J].价值工程,2007,(7):100—102.
[4]谢识予.经济博弈论(第三版)[M].上海:复旦大学出版社,2009,8.
[5]张维迎.博弈论与信息经济学[M].上海:上海三联书店,上海人民出版社,2004,11.
[6]赫伯特.金迪斯(Herbert Gintis)著,董志强译.理性的边界:博弈论与各门行为科学的统一[M].上海:格致出版社,上海三联书店,上海人民出版社,2011,4.
[7]乔尔.沃森(Joel Watson)著,费方域,赖丹馨等译.策略:博弈论导论[M].上海:上海人民出版社,上海三联书店,2011,5.
国有企业三方博弈分析 篇4
国有企业中的利益相关者主要有国家、企业、职工、债权人、供应商、消费者、竞争对手等等,但国家、企业和职工的利益是最为关键的。国家的利益最重要,国有企业必须认真贯彻执行国家的方针政策,依法经营、照章纳税,确保国有资本的保值增值,这是国有企业必须承担的责任和义务;企业的利益最关键,企业能否实现持续发展,直接关系到国家利益和职工利益能否实现,只有企业发展了,经济效益提高了,才能完成国家赋予的任务,才能保证职工的根本利益;职工的利益最根本,在我国,国有企业,职工不是一般意义上的雇员,他们是企业的主人,也是国家利益、企业利益和自身利益的创造者和受益者,因此必须把职工的根本利益作为出发点和落脚点。只有实现好、维护好职工的根本利益,才能激励职工实现好、维护好、发展好国家利益和企业利益。
一、国家(政府)与企业之间的博弈分析
在政府与企业的博弈中,作为博弈双方,政府与企业分别代表了政策制定者与政策被实施对象。在双方的博弈中,政府为达到其整个社会效益最大化目标而制定出相应的影响企业的宏、微观经济政策。在这一过程中,作为自主经营者,企业会通过各种途径来观察政府行为,获取相关信息,并进而采取自身的行动。这样,政府与企业两者间的相互对弈就会构成一个完全的信息赛局。假定只有一个政府和企业,而政府对企业的发展,只有“鼓励”和“限制”两种形式;而企业发展又存在两种可能的模式,即“有发展前景”和“无发展前景”。(表1、表2分别给出了有发展前景企业和无发展前景企业博弈矩阵)。
一般而言,对有发展前景的企业,政府大多会采取鼓励支持态度,而对无发展前景的企业则采取限制态度,也就是其最佳选择为:M1=1, M2=0。
依据模型分析可知,N=0时, 企业所获报酬为:
而N=1时,企业所获报酬为:
显然, 若1.5+0.5P>1+2P, 即P<1/3, 则N=0 (企业采取策略为消极对抗) ;
若1.5+0.5P=1+2P, 即P=1/3, 则N[0, 1] (企业采取策略为纯战略选择) ;
若1.5+0.5P<1+2P,即P>1/3,则N=1(企业采取策略为积极利用)。
由此可见,该博弈存在着三组精炼贝叶斯纳什均衡点,分别是:
(1) N=0, M1=1, M2=0(若P<1/3)
(2) N∈[0, 1],M1=1, M2=0(若P=1/3)
(3) N=1, M1=1, M2=0(若P>1/3)
同理可以分析其他情况。依据上述分析,我们可得:
1. 政府在出台影响企业发展的各项政策时,应首先分析其发展前景,对于有发展前景的企业,最好的策略组合是给予优惠政策和技术支持,促进其发展,甚至可以采取行政手段予以帮助;而对于无发展前景的企业,则要加以限制约束。
2. 作为理性经济人的企业,面对政府出台的有关政策,当确信企业属于有发展前景的概率大于33%时,其最优反应应为努力配合,这样企业、政府(国家)都得到最大报酬;当企业确信属于无发展前景的概率大于67%时,其最优反应则是尽量逃避、消极对抗政府出台的限制其发展的有关政策;而当企业既不属于有发展前景,又不属于无发展前景时,国家的支持或限制政策对其影响不大,企业可以根据自身情况选择积极利用还是消极对抗,企业从中获得的报酬是一样的。
3. 在政府与企业的博弈中,政府始终处于主动地位,而且其博弈举措往往能对企业造成巨大影响。因此,政府在出台相关政策时应慎重,力争做到科学性、合理性、前瞻性。
4. 政府应注意保持政策的连贯性,并使各项政策能紧跟世界经济步伐,企业也要根据政府的相关政策进行配合,作为博弈中相对弱势一方,企业要坚持策略的灵活性,并在合理范围内力争使政府的相关政策向有利于自己的方向进行调整。
(表中所作赋值,只是为了便于说明问题。针对具体的企业应通过综合评价进行赋值)
二、企业与职工之间的博弈分析
由于中国的国有企业是国家计划经济的产物,所以国有企业的职工同企业本身存在着“隐性契约”。无论其如何变化(签定、重新签定或解除),都应该是一个谈判过程。这个博弈可以用经典的二人合作博弈框架下进行:
博弈双方记为N={1, 2},双方博弈所得到的收益必须至少能保证“隐性契约”涵盖的原有权益能够实现,否则实施威胁策略。博弈双方分别具有可度量化的策略集合S1和S2;双方合作博弈记为t= (S1, S2;E, M) ;E, M分别表示职工与企业的支付矩阵;设x={x1, x2, …,xm},y={y1, y2, …yn},x、y分别是双方的混合策略,aij和bij分别表示博弈双方采取策略x和y的所得收益(i, j分别对应xi和yj中i、j,其中i∈{1, 2, …,m}, j∈{1, 2, …n}),记为:e= (aij) m×n, m= (bij) m×n (e取自员工(代表职工)和管理者(代表企业)的英文第一个字母) 。如果博弈双方合作,将他们可以实现的那些效用所有(e, m)记为集合B。假定职工与企业都有自己的得益底线,表示为e0与m0。如果B中存在的点(e1, m1)满足e1≥e0且m1≥m0,那么显然双方都可以得到满意。双方最低限度以上支付形成一个合作解。博弈双方在混合策略下的获得收益的期望值分别为E (x, y)、M (x, y),可以由期望效用函数表示:
假定博弈双方都完全了解博弈的结构以及对方的效用函数,谈判中双方都可以采取威胁手段,这些威胁都是现实的威胁,比如职工能够让企业相信,如果职工达不到基本目的,比如不能实现e1≥e0,则e将实施威胁行动t1, t1行动的实施将可以使企业得不到想要的收益。假设双方都是理性个体,则双方均不能无视对方的威胁,只要达不到基本目标,威胁就一定进行。由此,谈判过程如下:
第一步:博弈双方选定自己的混合策略,在双方报出的考虑了隐性契约的要价相容时,博弈以此为基点进行;当不相容时,实施威胁策略ti。
第二步:博弈双方通报各自的威胁,进而独立决定自己的报价。如果B中存在的点(e1, m1)满足e1≥e0或m1≥m0,则以此进行的博弈无论如何都是帕累托改进,企业可以趋于和谐。
第三步:如果博弈双方的报价不相容、不能同时得到满足,则实施威胁策略t2,在威胁策略之下,博弈双方的支付是λi (t1, t2),由此在各自考虑对方威胁的前提下,博弈继续进行,否则博弈中止,企业造成动荡。
相应引入纳什公理性结论:
定理1:每一博弈都存在唯一威胁点(e0, m0),它是B中的某个点。
定理2:若(e2, m2)都在B内,且e2≥e1≥e0、m2≥m1≥m0,则(e2, m2)=(e1, m1),即除解本身以外,B中不存在弱优于解的点。也就是说,参与人应该以最优的效率进行合作,(e1, m1)即所说的帕累托改进解。
定理3:对博弈双方可用策略集的限制,但不会增加博弈对他们的得益。用符号表示就是,若S’⊆S,则v (S’)≤v (S)。
定理4:存在某种方法将两个局中人的选择限定为单策略, 但不会A增加博弈对局中人的得益。用符号表示就是, ∀s1、s2 (s1⊆S1, s2⊆S2) , 存在v1 (s1, s2, B) ≤v1 (S1, S2, B) 。
定理3和定理4说明,当局中人双方都存有威胁手段时,某一方实施威胁后的得益并不会大于帕累最优解。
假设博弈双方都可以实施威胁策略。如果博弈双方都知道对方拥有威胁能力。那么双方便会进行谈判以求得合作解,如果合作解不能达成,则各自实施的威胁策略t1和t2,并各自接受由此形成的结果。如果形成的结果(e1, m1)∈B,则(e1, m1)为谈判的结果;如果形成的结果(e1, m1)埸B,则得益记为{λ1 (t1, t2),λ2 (t1, t2)}。为此,若谈判双方实施威胁策略t1和t2,以实施威胁策略, 各自所提出的得益要求(e0, m0)={λ1 (t1, t2),λ2 (t1, t2)}为始点,按照谈判程序求解威胁谈判解。
根据经典的纳什讨价还价博弈模型,在博弈双方实施威胁策略时,由纳什二人合作博弈定理3和博弈定理4可知,至少存在一个威胁策略解。
由此可见,企业和谐过程是一个在相关利益主体之间利益分配的过程,其成功与否决定于作为最主要的利益相关者职工和企业的权益得到体现,如果“隐性契约”能够得到尊重,博弈双方得到既得利益,则会有一个帕累托解的集合,企业就会趋于和谐。进而表明企业和谐的帕累托改进的必要条件是:
1. 构建企业和谐必须是相关利益各方参与,即企业的和谐必须在相关利益主体之间进行的博弈过程,利益各方可以自由地表达自己的利益要求。
2. 利益相关方能否使得自己的利益得到保障取决于自己是否有能力对博弈实施威胁战略,只要双方有能力实施威胁战略,就一定能够实现唯一的最优解。由于双方都是理性人,其共同目的是实现企业又好又快发展,如果职工或企业某方更具强势,则这一方在博弈中的所得权益越大。
3. 上述博弈能否顺利进行到底,还依赖于经典的纳什谈判过程中的一个重要的前提假设,这就是存在一个完善的机制,使得参与人坚持他们已作出的威胁和要价,并且一旦达成协议,交易必须执行,这也就是存在一个仲裁人,他将保证承诺和结果的有效性,使得威胁策略能够有效进行。
由此可以推出,构建企业和谐必须是利益各方都能够参与,而要保证各方的利益,则要求博弈者具有一定的初始权利,这样企业才能趋于和谐,并达到一个稳定的平衡。
三、国家、企业和职工的三方博弈分析
如上所述,博弈就是一种谈判机制,谈判能否取得成果,关键看各方利益能否达到均衡,能不能找到各方利益的均衡点,这是由各方谈判力决定的。如果存在任何一方谈判力较弱,在博弈中自身利益无法得到保证,那么博弈就不会正常进行下去,甚至会出现对抗的局面。为了避免这种情况的出现,就需要参与博弈的某一方(通常是强势一方)从整体利益考虑,让出一部分自身利益,对弱势一方进行补偿,引导各方实现利益均衡。为此,本文提出“引导博弈”的概念。在国有企业构建和谐过程中,政府属于强势一方,它是国有企业能否和谐的最为关键的一方。因此,政府在各利益相关者博弈过程中所起的特殊作用就是如何引导各方进行博弈,确保各方利益均衡,进而实现整体利益的最大化。现借用图1加以说明:
如果图1用三角形的边长a、b、c来表示国企各利益主体的利益期望,数值越大表示该利益主体的利益期望越高。用三角形的面积来表示国有企业的和谐度。三角形的面积越大表示企业越和谐,和谐的持久性越强,越能顺利发展,反之则相反。
由三角形的基本性质可知,如果a>b+c,或b>a+c或b>a+c,则上面的三角形将不存在,这种情况表示企业发展过程中,如果某一方的利益过大,导致其他方利益远远低于其期望值,则企业不可能持续发展。如果a=b=c=1,则三角形的周长不变时面积最大,表示此种情况各利益主体的利益均衡,企业趋于和谐,并持久性最好。
在国有企业发展过程中,国家(政府)作为强势一方,如何通过“引导博弈”,平衡各利益主体的期望值,使期望值三角形的面积达到最大,是实现企业和谐的必要前提。同时对利益相关者而言,企业兴则俱兴,企业损则俱损。只有先将企业整体利益这个“蛋糕”做大,利益相关者才能更好地在公司这个载体上实现个体利益。
摘要:文章探寻了国内外和谐思想的发展过程及我国和谐理论的核心内涵, 分析了新形势下, 我国国有企业存在的矛盾及问题。通过引入博弈理论, 深入研究了影响我国国有企业改革及和谐企业建设的关键性因素, 指出国家、企业和职工三方利益的均衡是国有企业改革成功与否以及建设和谐企业的根本所在。提出了国有企业建设和谐企业应重点解决的一些问题。
我国污染管制中三方博弈问题研究 篇5
近年来, 我国各地不断出现企业排放有毒物质的事件, 并产生了社会危害, 最近的就有“康菲中国”溢油事故。环境管制的效率问题已引起理论界和公众们的关注, 有学者基于博弈论的方法研究环境管制体制。王齐等[4,5]在政府和企业根本对立的前提下建立博弈模型分析研究, 发现当政府对企业排污处罚较轻时, 企业会倾向于选择多排污, 认为政府应以高额度的罚金管制污染者。上述研究的假设条件是基于政府与企业对立的立场, 没有考虑到合谋的情况。学者们通过考察合谋行为的形成条件, 认为在监督者的监督强度与企业的排污量之间存在此消彼涨的关系[6], 建议中央政府可在降低监管成本、提高监管效率等政策因素上加以改进[7]。黄文平从经济学的角度出发, 分析了不同污染类型下的地方政府在环境管制政策上的合作态度所导致的社会福利的差别、在管制进程中不同利益主体之间在管制冲突时讨价还价及其影响因素, 为提高我国环境管制的效率, 保障环境质量以及维护社会稳定等方面提供参考。
上述研究表明学者们已对我国的污染管制展开了较为广泛的研究, 为研究提供了很好的思路和启发, 但是不足之处在于博弈模型中对博弈双方行为的分析, 往往忽略了污染管制机制自上而下的利益冲突, 没有全面考虑企业、政府、监管机构之间的决策影响。改革开放以来, 我国的工业经济迅猛发展是以破坏环境为代价的, 环境管制的进展及问题, 是政府、监管机构与排污企业三方利益博弈的直接结果。将政府、管制机构同时加入污染管制博弈的分析, 具有十分重要的现实意义, 而且有利于环境管制博弈问题研究的深入和拓展。基于此, 构建模型综合考虑企业间的博弈行为和管制机构与排污企业的非合作立场并求其纳均衡解, 在博弈机制下对我国的污染管制展开进一步的研究。
1 各行为主体的利益问题分析
我国自改革开放以来, 一直走着一条粗放式经济增长的路子, 忽略了对环境污染的管制, 造成生态环境的严重破坏。“十一五”提出节能减排的目标, 虽然在环境保护上取得一定成效, 但我国的环境管制体系仍然存在漏洞。现实情况要复杂得多, 政府官员、管制机构的监管人员和排污企业的管理者都有着各自的偏好和追求。下面将结合实例具体分析我国污染管制体系中各行为主体的利益偏好问题。
1.1 政府官员片面追求政绩
政府官员特指地方政府官员, 他们是一个有晋升偏好的利益集团, 希望能通过公共项目来体现其政绩, 进而得到更多的权力。作为地方政府, 一方面需要有充足的财政收入完成本辖区内的经济与社会管理任务, 另一方面又要在仕途上获得晋升和政治支持的最大化。当中央政府采取调控政策时, 若地方政府和中央政府目标一致, 地方政府会支持中央政府的行为;若二者利益不一致, 地方政府就会在执行政策时采取消极行为, 并利用双方的信息不对称性来掩盖这一行为, 此时就会产生政策博弈。假设在政府G的管辖范围, 存在一制造企业C, C企业对该地区的经济增长和就业等均具有一定的推动作用, 但却是高污染高耗能企业;在排污治理方面, 政府若进行严格管制惩处, 可能就会导致企业C的低产甚至倒闭, 而政府官员为了增加地方政府财政收入, 权衡各方利益, 就会滥用职权、徇私舞弊, 与企业C结成利益同盟, 损害公众的利益。
1.2 监管人员的“管制俘获”问题
监管人员作为一个理性人, 同样也存在着创租行为, 容易被被监管人员俘获。现实中, 企业经营者面对监管时, 会产生贿赂的动机, 监管人员追求自身利益, 就会发生“管制俘获”现象, 从而弱化政府政策的管制效果。一种情况是, 在管制机构掌握企业的真实排污量的证据之前, 企业经营者主动对监管人员进行贿赂, 监管人员被其俘获, 从而少报谎报企业的排污水平;而更为严重的情况是, 监管人员在取得企业的真实排污量后, 却以此威胁企业管理者, 主动索要贿赂, 双方达成合谋协议后, 监管人员就会隐瞒企业的真实排污量。这种合谋行为具有很强的隐蔽性, 需要政府予以重视, 提高监管人员的监督力度。
1.3 高污染企业的恶意排污行为
对于高污染企业来说, 污染治理是一笔巨额投资, 这样的成本上升将使企业陷入亏损甚至倒闭。企业最高管理者只为寻求更多的经济效益而忽视了环境保护工作, 想当然得把保护环境的责任推给政府, 不愿意治理污染。因此企业会经由各种非法途径故意规避监管, 如通过控制排污阀门, 私自改造污水管道等非法手段, 肆意排放未经处理或未经完全处理的污水。另一方面, 恶意拖欠、拒缴排污费的现象在高污染企业中也较为普遍, 环境保护部在对上市公司进行环保核查时曾发现, 某企业拖欠的排污费居然高达亿元。企业的这些不良行为对我国排污管制工作造成恶劣影响, 应该加大执法力度, 依法严惩。
2 污染管制中各行为主体的博弈分析
首先建立企业间的完全信息静态博弈模型, 分析政府采取干预措施对企业决策的影响;然后基于理性“经济人”这一前提, 对政府、管制机构与排污企业三方之间的相互影响进行分析;试图寻找污染管制中存在的问题, 并为环境管制的改革提供参考。
2.1 污染管制体制下排污企业的策略选择
首先对作为博弈双方的两企业做出假定, 建立博弈模型, 假设市场上有1, 2两家生产同样商品的企业, 企业1的产量为q1, 企业2的产量为q2, 市场总产量Q=q1+q2, 市场出清价格p=a-Q, 是市场总产量的函数。再设两企业的生产都无固定成本, 其成本分别为C1=cq1, C2=cq2, 而如果企业进行环境保护, 则其成本变为C1=ceq1, C2=ceq2 (ce≫c) , 最后假设两企业同时决定各自产量。其策略组合有 (乱排乱放, 乱排乱放) , (环保减排, 环保减排) , (乱排乱放, 环保减排) , (环保减排, 乱排乱放) , 两企业均以收益最大化为目标。以 (乱排乱放, 乱排乱放) 策略为例, 可求得, 实现收益最大的产量为, 将结果代入π1π2, 得两企业在都不采取环境保护措施下的收益为。在污染管制条件下, 需增加假设条件, 假设政府实施了排污收费制度, 规定企业的排污量, 并且要求如果企业排污超标, 则上缴排污费M。据此, 设计排污企业的收益矩阵, 如表1所示。
利用完全信息下的静态均衡求解的方法, 发现在国家不采取相应措施的前提下 (即不存在M) , 仅仅依靠市场机制, 可以找出唯一纳什均衡解为 (乱排乱放, 乱排乱放) 。企业不可能采取环境保护的生产方式进行生产, 也就说明市场机制在阻止企业排污上是失灵的。这就为实施污染管制提供必要性, 进行环境保护需要依靠政府采取一定的强制手段, 当满足时, 该静态博弈的唯一纳什均衡解为 (环保减排, 环保减排) , 由此可知, 采取一定的环境管制手段提高企业的生产成本, 刺激企业进行技术创新, 采取相应环保措施。从而减少工业废水废气的排放。
上述结果是在管制机构严格监管, 企业依法缴费的假设条件下得出的, 是一种理想化状态, 现实社会却并非如此。政府在设计的环境治理措施时, 依据的前提是政府与其代理人——管制机构的目标和利益是一致的, 通常能够实现管制目标。但是现实中, 管制机构是具有有限理性的“经济人”, 存在部门利益, 会疏于管理, 因此设计良好的管制措施却可能无法实现管制目标。
2.2 不同行为主体之间的非合作博弈分析
从博弈论的角度来讲, 管制机构与排污企业在博弈过程中是相互依赖的局中人, 双方存在着非合作博弈。实际情况也是如此, 以某些高排污的劳动密集型企业为例, 若管制机构予以严格监管, 企业迫于排污超标罚款的压力可能会出现倒闭的可能, 而政府不仅需要支付监管的成本费用, 也面临着企业倒闭, 失业人数上升的压力。迫于形势, 管制机构可能会选择少监管的策略, 但过于疏忽, 又会造成无可挽回的后果, 这其中就发生了激烈的博弈。
以管制机构 (参与人Ⅰ) 和排污企业 (参与人Ⅱ) 构成监管博弈的2个参与人, 建立博弈模型, 模型假设: (1) 参与人Ⅰ对参与人Ⅱ进行监管的成本为C, 参与人Ⅰ有两种策略:监管与不监管;参与人Ⅱ有2种策略:排污达标与排污超标; (2) 当排污达标时, 参与人Ⅱ的收益为πe, 缴纳的排污费用为Te;当排污超标时, 参与人Ⅱ的收益为π, 缴纳的排污费用为T, 且参与人Ⅰ将对参与人进Ⅱ行罚款F (根据实际情况可知:πe<π, 即参与人Ⅱ排污超标时超额收益更多) ; (3) 所有的符号变量均大于0, 两者同时选择策略。根据假设建立的博弈模型收益矩阵形式, 如表2所示。
在该模型中, 当C
根据上述矩阵, 求该模型的混合策略纳什均衡, 参与人Ⅰ政府的期望收益为
参与人Ⅱ排污企业的期望收益为
2.3 结论与分析
为了保证环境管制的有效进行, 实现环保质量的提高, 建立上述博弈模型, 分析地方政府、管制机构与排污企业的策略选择, 以期为环境管制的改革提供参考。
通过博弈结果分析发现: (1) 当政府规定企业上缴排污费满足时, 企业会倾向于自觉环保减排, ce反映企业进行环保的成本, 这说明政府应该提高对高污染企业的收费标准, 刺激企业自觉治理污染;若收费标准偏低, 使得, 反而带来反效果, 企业为增加利益会加重污染。 (2) 在环境管制实施过程中, 理想的结果是: (不监管, 排污达标) , 对应的博弈结果显示为π-πe趋于0, 且C-Te趋于0。这意味着在排污超标和排污达标的情况下, 企业的利润波动不能过大, 这一方面, 需要政府对排污达标企业进行政策上的鼓励 (如环保补贴等) , 尽量缩减企业排污达标时的利润πe与排污超标时的利润π的差距;另一方面, 当排污罚款F足够大时, 排污超标的惩罚才会对企业起到强有力的控制作用, 形成企业自觉排污达标的管制机制, 因此管制机构必须制定并完善相关法律、法规, 约束企业的同时, 提高对违规企业的惩罚力度, 尽可能地使其外部成本内部化。 (3) 对于监管机构而言, 在政府实行上述策略的前提下, 监管成本C与企业交纳的排污费用Te监管成本C之间的差距越小, 反而越能保证企业实现“排污达标”, 即趋于1, 这意味着管制机构必须尽量降低监督成本, 而通过完善监管体系可以减少监管成本, 如优化监管机制、提高监管人员专业水平等措施。
根据博弈结果的分析, 对环境管制体制进行改革, 试图得到对于政府、管制机构和企业而言都是最优的决策, 即企业排污达标能使其周围的环境免遭工业破坏, 管制机构降低了监管成本, 而政府也就达到了实施制度的目的。
3 实现排污收费制度管制效应的策略选择
基于上述对博弈机制的分析, 要解决排污管制中存在的问题, 就必须理清政府、管制机构与企业之间的关系, 使排污企业认真遵守排污收费制度, 为此可以从以下4个方面入手。
3.1 提高环保指标在地方政府绩效考核中的权重
改革现行绩效考核制度, 健全环保考核体系, 可以将排污控制指标、污染物削减指标、环境质量改善情况等纳入地方官员的政绩考核, 并合理提高环保考核在地方政绩综合考核中的权重, 从而加大地方政府放纵污染小企业存在的成本, 增加地方政府污染环境后被惩罚的风险和成本, 督促地方政府自觉地关闭重污染企业。同时建立环境保护责任追究制度, 改变地方官员的经济发展偏好和政策取向, 努力实现经济增长与环境保护的双赢。
3.2 提高监管机构的专业水平以强化监管力度
为了防止管制机构内部人员的受贿、创租等行为, 可推行新的管理措施予以牵制。一方面, 可采取不同区域的监管人员定期和不定期的交叉轮岗交流制度, 可以有效地避免监管人员与企业合谋行为的发生;另一方面, 要注重提高监管人员的专业素质和社会责任感, 可以提供适当的专业培训和思想教育, 细化监管人员的工作流程, 使其立足本职工作, 同时加大对其失职行为的惩罚力度, 减弱监管人员的受贿动机。
3.3 推行排污超标累进收费制实现外部成本内部化
高污染企业的超标排污一直是排污治理的难点, 根据前述博弈模型所得, 当企业上缴排污费时, 企业会自觉选择环保减排, 对此应该提高排污收费标准, 量化排污量等级规定, 对超标排污企业实行累进收费制度, 提高企业的边际生产成本, 使其达到的最优产量接近于社会的最优产量, 实现企业的外部社会成本内部化。同时要合理结合经济杠杆的力量, 诸如拓展细化“绿色信贷”、“绿色保险”体系等调节措施, 遏制并缩减高污染企业的发展。对于严重超标排污甚至恶意拖欠排污费的企业, 要限令停产整治, 整治仍不到位的, 依法提请当地政府予以强制关闭。
3.4 加大环保补贴力度以促进企业的环保投资
中国目前的环境恶化与多数企业不进行环保投资是密切相关的, 为刺激企业的环保自觉性, 一方面, 要加大排污收费力度, 制定严厉的惩罚条例, 降低企业逃避管制的期望收益, 迫使其取消贿赂监管人员的行为。另一方面, 要增加环保补贴, 大力扶持创新型环保企业, 打破企业在创新中遭遇的融资瓶颈, 强化企业的技术创新能力;对自主创新的节能减排产品, 政府应该动用行政力量, 制定灵活便捷的“绿色通道”, 强力推广这些新技术、新产品, 以加快环保减排的步伐。
我国自实施排污收费制度以来, 取得了一定成效, 推动了我国环境保护的进程。但是现行的排污收费制度的运行存在诸多漏洞, 使其难以实现预期效果, 本文的研究表明在制度实施过程中, 上至政府下到企业都存在疏于环境治理等问题, 仍尚待完善, 需要政府、管制机构和排污企业各司其职、各尽其责, 寻求经济增长与环境保护的协调统一。治理排污问题任重而道远, 具有十分迫切的现实意义, 接下来笔者将围绕本课题展开深入探讨, 对我国污染管制的效应进行实证分析。
摘要:近年来, 我国的环境质量急剧恶化, 现行污染管制政策的实施效果受到多方质疑。为保证环境管制的有效进行, 实现环保质量的提高, 通过建立完全信息静态博弈模型, 剖析地方政府、管制机构与排污企业的三方策略选择, 发现存在“管制俘获”、政企合谋等问题, 并提出政策建议以期为环境管制的改革提供参考。
关键词:污染管制,三方博弈,完全信息静态博弈,合谋
参考文献
[1]李程.环境管制:从管理到治理的转变[J].经济与管理, 2011 (3) :5-11.
[2]宋姣姣, 王丽萍.环境政策工具的演化规律及其对我国的启示[J].湖北社会科学, 2011 (5) :97-100.
[3]于良春, 黄进军.环境管制目标与管制手段分析[J].理论学刊, 2005 (5) :4-7.
[4]王齐.政府管制与企业排污的博弈分析[J].中国人口.资源与环境, 2004, 14 (3) :119-121.
[5]向盛斌.环境管制过程中的管制者与被管制者行为分析[J].环境科学与工程, 2006, 31 (9) :20-23.
[6]郭新帅, 缪柏其, 方世建.排污管制中的授权监督与合谋[J].中国人口.资源与环境, 2009, 19 (4) :24-29.
[7]贺立龙, 陈中伟, 张杰.环境污染中的合谋与监管:一个博弈分析[J].青海社会科学, 2009 (1) :33-38.
[8]黄文平.环境污染的预防与环境管制的博弈分析[J].湖北经济学院学报, 2011 (7) :91-96.
[9]张维迎.博弈论与信息经济学[M].上海:上海人民出版社, 2005:27-57.
浅谈第三方支付的博弈分析 篇6
随着电子商务的迅猛发展, 参与电子商务活动的交易主体对更便捷、更安全的支付方式有了更大的需求, 在线支付在这种趋势的推动下得以迅速发展, 然而, 其安全和信用一直是所有参与网上交易的用户最为关注的问题。
目前, 信息不对称及其所引发的逆向选择和道德风险问题降低了整个电子商务市场的效率, 阻碍了其进一步发展。在电子商务中, 信息不对称主要体现为交易双方的身份无法确定、商品质量无法确定、资金能否按时收到无法确定等, 从而参与电子商务交易的双方就产生了博弈:卖方不愿先发货, 怕货到款不到;买方也不愿先付款, 担心财、物两空或是商品以劣充好。博弈的最终结果是双方都不愿意先冒险, 交易行为无法成功进行。而第三方支付模式为电子商务中的信任难题找到了初步解决方案, 将电子商务发展推向一个新高潮。
第三方支付是具备一定实力和信誉保障的非银行独立机构, 集成银行支付结算系统接口或基于其他服务通道, 为交易各方提供货币支付、资金清算、交易监管等交易支持服务而形成的支付模式。采用第三方支付模式具有以下优点:一是第三方支付作为信用中介, 作为资金流的中间站, 消除了交易双方对网上交易的顾虑, 实现了商品和资金的安全交换, 从而避免了网络诈骗、拖延付款等常见的网络贸易陷阱。二是第三方支付和各大银行支付结算系统相连接, 不管是从银行账户提款还是转账到银行账户都快速、高效, 帮助交易双方节约时间, 加快了交易进程。三是使用第三方支付平台, 交易成本低并且为交易双方提供很多增值服务, 如实时交易查询、管理往来账目、及时退款、手机支付功能等。
二、网上交易的一般博弈模型
假设针对网上某件商品, 交易双方已经对于该商品的价格达成一致意见, 两者不存在信息不对称, 并且顾客有购买这件商品的意思表示。之后, 顾客需要决策是否付款, 而商家需要决策是否发货。
简单来看, 双方的博弈可以看作是完全信息下的静态博弈。在双方同时决策的情况下, 形成了以下支付矩阵:一是在顾客决定付款, 商家决定发货的情况下, 双方成功交易, 顾客和商家收益为5;二是在顾客决定付款, 但商家没有发货时, 顾客损失10, 商家收益10;三是在顾客决定不付款, 而商家发货时, 顾客收益10, 商家损失10;四是如果顾客不付款, 商家不发货, 顾客和商家的收益都为0。
如表1所示, 最终上述模型得到的纳什均衡肯定是 (不付款, 不发货) , 也就是两者根本做不成交易。实际上, 这里的 (不付款, 不发货) 不仅是纳什均衡, 而且是一个占优战略均衡, 也就是不论对方如何选择, 个人的最优选择都是不付款或者不发货。实际上, 上述网上交易模型就是一个“囚徒困境”, 它反映了一个深刻的问题:个人理性与集体理性的矛盾。如果网上商城想发挥作用, 长期经营下去, 使网上的交易机制发挥作用, 就必须要找到一种能确保双方交易的纳什均衡。
下面我们结合实际, 对“囚徒困境”进行进一步的探讨, 实际的交易过程中, 往往是一方先付款或者先发货。当某交易的规则是先付款后发货:付款人决定是否付款取决于其预期收益。首先我们假定付款人根据经验和买家以往的交易记录判断卖家发货的预期概率是p。若卖家发货, 付款人收益为x;若不发货, 付款人损失为y。那么付款人的预期收益为r=p×x- (1-p) ×y。如果买家不付款, 那么交易不发生, 付款人收益为0。只有当r>0时付款人才会选择付款。当r=0时, 求得均衡解:。当交易规则为先发货后付款时:首先设卖家根据经验数据或者顾客的信用记录判断付款人付款的概率为q, 买家付款, 卖家完成交易收益为m, 如果买家不付款损失为n。卖家的预期收益为r=q×m- (1-q) ×n。求得均衡解为。由此可以看出, 对于卖家来说, 只有当其收益大于潜在的可能损失时, 卖家才会选择进行网上交易。
在上述两种情况下, 由于信息不对称, 市场没有达到最优化。
三、引入第三方支付的博弈模型
下面依然借由同一个博弈模型来进行分析, 但此时的假设条件由于有第三方支付平台的加入而有所不同:一是市场上除了交易双方参与外, 还有第三方参与;二是交易双方都是为追求自身利益最大化的理性经济人;三是交易双方的策略集合分别是:对于顾客为“支付”与“不支付”, 对于商家为“发货”与“不发货”;四是双方的收益除了此次交易商品的价格P外, 还存在一个信誉所得, 记作S。
信誉所得S, 是在有第三方参与下才出现的指标。“第三方支付平台会在此次交易后对买卖双方的信誉进行评分, 并将信誉情况记录下来并公示。作为买家购物的参考, 也能对买卖双方形成约束。一般情况下, S>P, 因为信用在电子商务中, 是一种资源, 高信用的企业区别于其他企业, 并获得客户的青睐, 获得更多的金融支持。信用将影响交易的数量和质量以及双方的长期收益。所以, S一般会大于P。在以上假设条件上, 构建以下模型, 如表2:
假定顾客先行动, 商家看到顾客的行动后再行动。顾客如果选择了支付, 那么商家选择发货的收益除了获得商品收益P外, 还能得到信誉S, 同样地, 顾客收益也为P+S, 但如果商家选择不发货, 虽然其获得商品收益2P, 但却损失了信誉, 最后的总收益为2P-S, 而顾客虽损失了P但却获得了信誉S, 一般来说S≥n P (n≥2) , 顾客最后的总收益为S-P;顾客如果选择不支付, 那么商家选择发货的收益为S-P, 顾客收益为2P-S, 但如果商家选择不发货, 其收益为0, 顾客收益也为0。
在商家先行动的情况下, 双方的决策组合以及收益情况也与上述情况一致。基于理性经济人假设, 顾客与商家都追求自身利益最大化, 顾客选择支付的情况下, 商家就会选择发货 (P+S>2P-S) ;顾客选择不支付时, 商家也会选择发货 (S-P>0) ;商家选择发货时, 顾客将选择支付 (P+S>2P-S) , 商家选择不发货时, 顾客也将选择支付 (S-P>0) 。所以, 可以得出, 此模型最终的纳什均衡是 (支付, 发货) 。
由上面的模型可以看到, 在有第三方支付平台的参与的情况下, 电子商务交易双方不仅都能取得对方的信用信息, 而且能使交易双方形成自我约束, 进而诚信交易。
四、结论和建议
第三方支付虽然在解决网上交易诚信方面发挥了巨大的作用, 但是它的建设和管理还涉及金融体系和法律规则, 因此也面临着以下三方面的问题。
1. 第三方支付平台的安全问题
安全问题是在线支付的首要问题, 包括计算机网络和网上交易两种类型的风险。病毒威胁和黑客攻击会借助网络环境对大量的计算机造成破坏, 窃取重要的商业秘密、用户信息, 或者破坏数据的完整性, 损害他人经济利益。交易双方的信用识别也是第三方支付平台需要解决的关键问题。因此第三方支付平台要在自身的信息系统建设方面继续增加投入, 增强系统的自我保护和预防功能, 为用户的交易提供安全的物理环境;要执行并不断提高网上交易主体实名认证制度及数字证书等用户认证技术, 严格监测交易主体的市场准入资格;要建立合理有效的信用评价体系以及利用先行赔付等手段, 最大限度地规避信用风险、促进电子商务交易顺利进行。
2. 金融监管问题
随着网上交易金额不断增加, 国内一些第三方支付系统的年交易额已经达数百亿元, 每天滞留在一个较大的第三方支付平台上的资金可达数百万元, 加上每个商户交由第三方支付平台托管的交易保证金, 资金数额可观。如果没有相关部门的监管, 总额巨大的资金就有可能出现被第三方擅自挪用甚至侵吞的风险, 甚至还可能成为资金非法转移、套现、洗钱等犯罪活动的新途径。因此, 我国金融部门应尽快确定合适的监管主体, 建立完善的控制和监管机制对第三方支付平台进行规范管理。另外, 处在数字化时代的监管部门也应该高度信息化, 建立自己的监测系统, 对日常监管中的某些合规性检查高度程序化, 自动收集相关信息自动判断是否符合要求, 并对违规行为给出预警。
3. 法律法规问题
长期以来, 我国法律对交易安全的研究只注重对财产静态权属关系的确认和静态安全保护, 未能反映现代市场经济交易频繁、活泼、迅速的特点。目前, 还未形成专门针对第三方支付的法律法规, 如第三方支付平台在网络支付中的法律地位、企业进入第三方支付市场的准入条件、用户资金产生的利息归属等问题, 这些都亟待我国相关部门予以解决。
参考文献
[1]张维迎.博弈论与信息经济学[M].上海:上海人民出版社, 2005
[2]程淑娣, 张琳.第三方支付—在线支付的一个进化稳定策略[J].南京工业大学学报 (社会科学版) , 2007, 12 (4)
[3]刘小麟, 徐畅畅.“第三方支付”之博弈浅析[J].学术论丛, 2009 (1)
政府与第三方治污的演化博弈研究 篇7
面对日益严重的环境问题,十八届三中全会审议通过的《中共中央关于全面深化改革若干重大问题的决定》中明确提出“建立吸引社会资本投入生态环境保护的市场化机制,推行环境污染第三方治理。”关于“环境污染第三方治理” ( 以下简称“第三方治污”) ,顾名思义,就是当政府和排污企业在其监管及污染治理的博弈中不能处理好环境问题时,由国家提出并由私人建立的一类第三方的污染处理企业。其职能为有偿帮助排污企业处理其在生产过程中产生的“三废”等污染物以及优化污染治理的工艺。
第三方治污是环境管理制度的重大创新。首先,第三方治污的存在,可以改善政企之间关于环境问题的博弈关系。一方面,从政府来说,环保投入逐年增加、各类环境污染治理设施加速建设,却看不到环境状况的改善[2]; 另一方面,从排污企业来说,污染问题持久而难缠,企业不得不花费大量人力、物力于其上[3],导致企业分心他用,不能将注意力集中在激烈的市场竞争中。第三方治污既可以落实政府的环保投入,又可以帮助企业处理污染问题,将政企之间的对弈变成共同为环保出力的合作关系。其次,由于第三方治污的集群化优势,即第三方治污企业可以集中处理集群内的不同企业的相同污染物,而降低了治污成本、为整个社会节约了资源。最后,第三方治污的出现,也给私人企业家创造了新的创业途径,为社会提供更多的就业机会。
第三方治污是提高环境治理效率的一剂“良药”,也为未来我国环境保护模式的发展方向提供一个选择。
1政府与第三方治污的演化模型
不妨假设一个地区存在政府、排污企业群体和第三方污染物治理企业 ( 以下简称第三方治污) 群体。在三个群体之间,政府与排污企业群体的合作不顺利,两者之间多年的博弈与合作致使其形成了一个不健康的情形[4]。企业对污染物的偷排、多排现象时常发生,政府视而不见,其中更包含了包庇、瞒报、捏造数据等现象[5]。只有第三方治污群体与政府、排污企业群体可以顺利合作,而且第三方治污群体与政府的合作成功与否直接影响排污企业群体与第三方治污群体的合作关系。因此,政府与第三方治污之间交往的规则和制度形成成为第三方治污模式发展的关键。第三方治污企业可以对污染进行统一治理,对于社会总体的污染物治理来说,起到一定的节约成本的作用。而对于政府来说,污染物的治理终于落到了实处,真正的对环境问题起到了作用,找到了社会环境污染问题的责任方,更有利于政府的环境治理。而且,对于第三方治污企业来说,他们可以更加专注在污染处理的技术创新上。排污企业更是乐于与第三方治污进行合作,直接将污染问题外包,将更多的注意力集中在激烈的市场竞争中。其运作过程如图1所示。
政府将成立专项基金,投入到推动第三方治污的成长和发展中。其中,政府也可以对第三方治污采取减免税收等政策以表支持,在此,为简化计算,我们将其算入政府对第三方治污的出资支持中。当然,政府依旧会对污染处理情况进行监督,并通过税收和罚款等手段对排污企业进行宏观调控。而由于第三方治污的良好治污表现,会带给政府在治污声誉上的提高。在排污企业和第三方治污企业之间,是简单的以治污经费换得污染处理的服务。污染物
经过第三方治污的处理,会变成无害废弃物和可再利用的物料,第三方治污可以把可再利用的物料投入市场中进行销售,得到一些收益。接下来,本文将利用演化博弈模型来分析政府和第三方治污企业的交往过程。
假定在一个“自然” ( 即不考虑其它约束) 的情况下,第三方治污群体和政府进行策略交往。假定政府机构出于利益的考虑或者说出于避免改革的考虑,首先会尝试保持排污企业自行处理排污问题,但在与第三方治污的谈判中却会表现出两种行为方式: 1) 坚持由排污企业自行处理污染问题 ( A) ;2) 不坚持由排污企业自行处理污染问题 ( A) 。同样,假定第三方治污首先尝试由第三方治污处理排污企业的污染问题,在实际与政府机构的谈判中也会有两种行为方式: 1) 坚持由第三方治污处理排污企业的污染问题 ( B) ; 2) 不坚持由第三方治污处理排污企业的污染问题 ( B) 。
假定B和A相遇无法达成协议,并且双方都将蒙受一定的损失; B遇到A时,B的谈判实力较强因而会达成由第三方治污处理排污企业的污染问题; A遇到B时,A的谈判实力较强因而会达成由排污企业自行处理污染问题。B和A的谈判实力相当,假设以概率实行由排污企业自行处理污染问题,以 ( 1 - r) )概率实行由第三方治污处理排污企业的污染问题,本
政府与第三方治污公司的支付矩阵如表1。
表1政府与第三方治污策略交往的支付矩阵
Table 1 The payment matrix of tactics interaction between governments
and the third party pollution treatment companies
AEp FAE1lF
注: 表中括号内p、q等为选用该策略的概率。
表1中,为不合作成本,即博弈双方都坚持己见、不妥协,以至于没有达成合作协议,所造成的损失; > 0表示政府为支持第三方治污的投入资金; 表示由第三方治污处理排污企业的污染问题时,政府对污染的处理情况的监督成本; 表示政府推进第三方治污发展的改革成本; 表示政府不坚持由企业自行处理排污问题时,对排污超标企业的罚款;表示政府不坚持由企业自行处理排污问题时,从排污企业收取的税费; 表示政府不坚持由企业自行处理排污问题时,得到公众对环境的评价,即声誉; > 0表示排污企业向第三方治污支付的污染治理费; > 0表示第三方治污企业通过污染物再利用的收入; 表示第三方治污的治污成本; 表示由企业自行处理排污问题时,政府对污染的处理情况的监督成本; 表示政府坚持由企业自行处理排污问题时,对排污超标企业的罚款; 表示政府坚持由企业自行处理排污问题时,从排污企业收取的税费; 表示政府坚持由企业自行处理排污问题时,得到公众对环境的评价,即声誉; 表示第三方治污的技术研发成本; 表示第三方治污通过技术研发,得到的专利等科研成果的价值。在本文中,当排污企业自行处理污染问题时,第三方治污企业就只负责搞污染治理的技术研发,类似于高校或者科研机构。
根据Malthusian动态方程,即一个战略的增长就等于它的适应性,可得出政府和第三方治污群体策略交往随时间演化的动力学方程:
通过方程 ( 1) ,可以研究政府和第三方治污群体策略交往的群体行为的演化。设方程 ( 1) 的雅可比矩阵为J,将J的行列式记为Det ( J) ,迹记为Tr,可以讨论方程 ( 1) 的稳定性。
2模型分析
2. 1均衡点的稳定性分析
方程 ( 1) 有五个局部平衡点,其稳定性分析见表2。
注: 1) 由于在推进第三方治污的过程中,政府不单要出资支持,还要花费改革成本,一般有 ; 2) 在第三方治污企业群体的运营过程中,我们要保证其盈利性,一般有 + + > PC,RC < Pa 。
由表2可知,系统的五个平衡点中有两个是稳定的,是演化稳定战略 ( ESS) ,分别对应于两个模式, ( A2,B1) 模式是第三方治污坚持由第三方治污处理排污企业的污染问题而政府不坚持由排污企业自行处理污染问题, ( A1,B2) 模式是政府坚持由排污企业自行处理污染问题而第三方治污不坚持由第三方治污处理排污企业的污染问题,图2描述了政府和第三方治污交往的动态过程。
图2中由两个不平衡点 ( 0,0) 、 ( 1,1) 和鞍点连成的折线可以看作是系统收敛于不同模式的临界线。其中折线左边的点将收敛于模式 ( A2,B1) ,折线右边的点将收敛于模式 ( A2,B1) ,此模式为不良“锁定”状态,因为一旦形成这一演化稳定战略,其它模式都将逐步消失。根据鞍点的表达式,当第三方治污和政府双方收益分配比例发生变化或双方达不成协议遭受的损失发生变化时,鞍点会移动,引起收敛到两种模式的区域的大小发生变化,根据这些参数变化的规律可以对政府与第三方治污之间交往的规则和制度进行宏观调控,使得第三方治污朝着良好的模式演化。
2. 2参数分析及调控
我们可以根据鞍点的表达式,调整参数,使折线上方或左方的区域面积变大,从而使系统 ( 1)收敛到优良模式的概率变大。下面我们选举几个参数进行分析:
( 1) 政府不坚持由企业自行处理排污问题时,对排污超标企业的罚款P
在鞍点处,有。当政府对排污超标企业的罚款P增加时,鞍点垂直下移,使得折线上方的区域面积变大; 反之P减小时,鞍点垂直上移,使收敛到良好模式的面积缩小。这表明,为支持第三方治污的顺利发展,政府应当制定严格的排污惩罚制度和环保法规,会使系统更有可能演化到良好状态。而如果政府对排污企业的惩罚力度较小时,企业的违法成本低,导致排污企业宁愿违法排污、缴纳罚款,也不愿对污染处进行处理,或者委托给第三方治污,从而阻碍系统演化到良好状态。
( 2) 政府不坚持由企业自行处理排污问题时,得到公众对环境的评价,即声誉收益O
由鞍点的表达式可知,。当由第三方治污处理排污企业的污染问题,政府得到声誉收益O增加时,导致鞍点垂直下移,折线上方的区域面积增大。这表明,若第三方治污对污染物进行处理时能使政府得到较高的声誉收益,可以促使系统进化到良好状态。
( 3) 第三方治污的治污成本
由鞍点的表达式可知,。当第三方治污的治污成本减小时,鞍点水平向右移动,会使折线左边的区域面积变大,收敛到良好状态 ( 0,1) 的可能性增加。说明,如果第三方治污能够尽可能的减小治污成本,就更有可能促使系统进化到良好状态。而作为处理污染物的专业机构,更好地减小治污成本正是第三方治污的核心竞争力,也是其发展和努力的方向。
4. 第三方治污企业通过污染物再利用的收入
在鞍点处,有。当第三方治污企业通过污染物再利用的收入时,鞍点水平向右移动,使得折线上方的区域面积变大,收敛到良好状态 ( 0,1) 的可能性增加。这意味着第三方治污企业在一定的情况下,应该在污染物的回收再利用方面相对加大力度,回收再利用的收益越大,就越有利于系统的良好演化。而对于整个社会或者生态环境来说,这也是更有利的行为和选择。
同理可以分析其他参数的影响,总之政府与第三方治污的博弈系统有着自身的规律,根据这些规律可以对调整政府和第三方治污企业之间交互规则,使系统向良好的方向发展。
3数值实验
从上面分析可知,系统会出现两种演化稳定策略,不同的参数会在不同程度上影响演化结果。下面我们采用数值实验方法,通过图形直观地分析选择某种策略的初始群体比例、政府对排污超标企业的罚款以及政府为支持第三方治污的投入资金的变化对演化结果的影响。
( 1) 选择某种策略的初始人群比例变化对演化结果的影响。数值实验结果见图3所示。其中和分别代表政府中选择策略A和第三方治污企业选择策略B的群体的初始比例。参数取值为。从图中可以看出: 政府与第三方治污企业策略交往行为演化的路径依赖性,从不同初始条件出发的轨线在收敛到均衡状态之前不会重叠相交。收敛到均衡时间的长短与政府中坚持由排污企业自行处理污染问题群体的比例有关,该比例越接近均衡状态收敛速度越快。对比图3的两个子图,可以发现,第三方治污企业群体行为的演化结果和收敛时间不仅受本群体中选择“由第三方治污处理污染物”策略的初始比例影响,而且受到政府群体中选择“由排污企业自己处理污染物”策略的初始比例影响。
( 2) 由第三方治污处理排污企业的污染问题时,政府对排污超标企业的罚款对演化结果的影响。数值实验如图4所示,除参数P外,其他参数取值与图3 ( a) 相同。对比图3 ( a) 与图4,可知当政府对排污超标企业的罚款较低时,收敛到不良状态模式的可能性较大; 反之,当政府对排污超标企业的罚款较高时,收敛到良好状态 ( 政府不坚持由排污企业自行处理污染问题,第三方治污坚持由第三方治污处理排污企业的污染) 模式的可能性增大。我们从数值实验中再一次地证明政府加大对排污企业的监管和惩罚力度,会有利于第三方治污的市场推行,从而使这一政策落到实处。我们完全有理由进行推断,当政府有足够严厉和完备的环保法规以及惩罚制度,政府与第三方治污交往的行为就可以完全进化到良好状态。
( 3) 第三方治污的技术研发成本,即技术研发投入对演化结果的影响。数值实验如图5所示,与图3 ( b) 相比,图5 ( a) 中降低了第三方治污的技术研发投入 ,图5 ( b) 中升高了第三方治污的技术研发投入 ,其余参数不变。对比三个图,我们可以发现,当第三方治污的技术研发投入较低时,系统向不良状态演化的几率较大; 而当第三方治污的技术研发投入资金较高时,系统就会更倾向于向良好状态演化。而当第三方治污的技术研发投入足够大时,如图5 ( b) ,政府就会放弃对排污企业自行处理污染决策的坚持,自行转到支持第三方治污的发展。
4结论与建议
( 1) 目前较少有文献采用数理模型研究第三方治污与政府、排污企业的交互关系。本文构建了博弈模型来刻画政府与第三方治污行为的演化规律。通过分析可以发现,本文的模型形成了两种演化稳定战略: 即 ( 政府坚持由排污企业自行处理污染问题,第三方治污不坚持由第三方治污处理排污企业的污染问题) ,( 政府不坚持由排污企业自行处理污染问题,第三方治污坚持由第三方治污处理排污企业的污染问题) 。其中,模式较相似于目前政府对于企业污染问题的处理态度和方法,而模式则较符合于第三方治污产业成熟存在于市场上的情境。本文从理论上推导出两类演化稳定战略,验证了两类污染处理模式。但对于中央发展第三方治污的要求来说,就是演化稳定战略的不良“锁定”状态。
( 2) 为寻求跳出不良“锁定”状态指明了方向。虽然政府与第三方治污策略交往的两类模式都在实践过程中,但模式作为稳定演化战略的不良“锁定”状态,如果演化过程中占了主导地位,那么其它模式将逐步消失。因此,我们需要寻求跳出的有效路径,主要有以下几种:
一是政府应当制定严厉的排污惩罚制度和环保法规,使得排污企业正视污染处理问题,不敢偷排、多排,一经发现,将受到政府严厉的处罚,从而迫使排污企业主动寻求解决污染问题的方法。这就为第三方治污企业市场的打开创造了客观条件。
二是拓宽第三方治污企业的盈利路径。第三方治污企业不仅仅是一个垃圾污染处理站,更是一个净化污染、废料再利用以及进行科技研发的污染物的“回收站”。而想要确保第三方治污的基本收益,确保跳出不良“锁定”状态,就要尽量减小第三方治污的治污成本,增大第三方治污企业通过污染物再利用的收入,以及提高第三方治污的技术研发投入和成果转化率。
( 3) 第三方治污企业的出现,为我国部分地区环境污染严重、工业污染恶劣的现状提供了一剂“良药”。而为实现第三方治污企业迅速且高效率、规范化地融入市场,政府应全力配合并给予大力支持。接下来,我们需要在将来的研究中着重对第三方治污的市场实践经验进行总结,来进一步完善整个市场的环保机制。
演化博弈虽然在分析制度演化等方面获得了巨大成功,但现有的分析制度演化的演化博弈方法也存在一定的局限,比如它忽略了企业自身以及公众等可能发生的变化。对于这个问题,将在后继研究中采用多Agent方法深入研究。
摘要:为研究政府与第三方治污之间交往的规则和制度形成的演化规律,借助演化经济学研究工具,建立政府和第三方治污的支付矩阵,分析政府和第三方治污企业交往过程的演化模型,展示决策参数的不同取值对演化结果的影响。研究发现,政府与第三方治污的交互关系演化系统收敛于两种模式,随着双方成本和收益的改变,收敛于不同模式的概率发生显著变化;为寻求跳出不良“锁定”状态指明了方向,现阶段政府与第三方治污群体的交往模式自发演化依赖于各种策略的相对支付;政府应当制定严厉的排污惩罚制度和环保法规;第三方治污应当扩宽企业的盈利路径。
关键词:环境污染,演化博弈,第三方治污
参考文献
[1]王新,何茜.雾霾天气引反思看国外如何治理[J].生态经济,2013(4):18-23
[2]马小明,赵月炜.环境管制政策的局限性与变革——自愿性环境政策的兴起[J].中国人口资源与环境,2006,15(6):19-23
[3]许晓明.环境领域中公众参与行为的经济分析[J].中国人口资源与环境,2004,14(1):127-129
[4]卢方元.环境污染问题的演化博弈分析[J].系统工程理论与实践,2007,27(9):148-152
[5]朱德米.地方政府与企业环境治理合作关系的形成——以太湖流域水污染防治为例[J].上海行政学院学报,2010(1):56-66
[6]余瑞祥,朱清.企业环境行为研究的现在与未来[J].工业技术经济,2009,28(8):2-6
[7]邓峰.基于不完全执行污染排放管制的企业与政府博弈分析[J].预测,2008,27(1):67-71