混合策略博弈(共7篇)
混合策略博弈 篇1
一、保障性住房理论分析
保障性住房是与商品性住房相对应的一个概念, 保障性住房是指政府为中低收入住房困难家庭所提供的限定标准、限定价格或租金的住房, 一般由廉租住房、经济适用住房和政策性租赁住房构成。
1. 保障性住房的双重属性
保障性住房具有私人属性和公共属性的双重特质。非排他性和非竞争性是公共商品的典型特征, 从公共商品定义来看, 保障房具有排他性和竞争性, 具备私人属性:排他性表现在只有符合申请条件的中低收入家庭才可以享受到保障性住房的福利, 排除了其他群体消费保障性住房的可能;竞争性表现在现实中保障房一直处于供不应求的状态, 消费者之间存在竞争关系。于此同时, 保障房也具有公共属性:保障房是政府基于福利经济学理论对社会财富进行的再分配。保障房中无论是低于市场价格的经济适用房还是采取实物补贴和货币补贴提供的廉租房, 其实质均是政府通过转移支付实现社会收入的再分配, 对于缩小贫富差距, 维持社会和谐稳定发展具有重要意义。
2. 保障房供给的政府失灵
公共选择理论的研究表明, 政府作为公共产品的供给者并不能确保兼顾效率和公平。保障房供给中面临政府失灵的现象:首先, 政府同样存在“经济人”行为, 政府官员在进行决策时往往会参杂个人利益, 并非总能从追求公共利益的角度出发, 存在“寻租”的可能, 这将导致政府在保障房的供给中偏离最初的目标, 无法实现资源的合理配置;其次, 政府和居民之间信息不完全、不对称的现象普遍存在, 政府对居民实际情况的甄别存在障碍, 不能做到将保障福利给予真正需要的人;最后, 公众偏好表达上存在障碍, 因为不论是直接投票还是代议制, 要想将不同社会成员提出的具有各自偏好的方案加总成集体决策结果总是存在着各种困难。
3. 保障房供给的市场失灵
较之政府供给, 市场机制在资源配置的效率上具有天然的优势, 但由于信息不对称, 垄断以及外部性等市场本身不能解决的问题, 保障房供给同样存在市场失灵。首先, 消费者和生产者所了解的市场信息是不完全的, 只能在有限信息的条件下作出决策, 从而导致买卖双方的决策偏离市场均衡;其次, 保障房具有垄断性, 生产者享有定价权, 使最终的均衡价格高于市场均衡价格, 均衡产量低于市场均衡产量, 造成社会福利损失;最后, 保障房具有外部性, 会降低资源配置的效率。
二、我国保障房建设执行情况
1. 1998—2008年, 保障房政策执行缓慢
尽管1999年建设部第70号令颁布了《城镇廉租住房管理办法》, 但是我国廉租房建设起步较晚, 由于近几年房价上涨过快, 廉租房才越来越成为各项政策的焦点。根据建设部2006年城镇廉租住房制度建设报告显示, 截止到2006年底, 全国仍有145个 (4个地级市、141个县级市) 城市未建立廉租房制度, 累计解决了26.8万住房困难群众的住房问题, 仅占所有困难家庭户数的6.7%。此外经济适用房作为我国住房改革的产物, 在我国从福利分房走向货币购房的过程中的推动作用是显而易见的。但目前经济适用房供应在占整个住房市场比例的现实情况与预期依然相去甚远。2000年经济适用房投资占住宅投资的比重约11%, 此后该比例逐年下降, 到2009年已经不足4%。
2. 2008年至今:多项政策全方位支持保障房建设
2008年以后, 保障房建设规模迅速增加, 保障房建设的落实情况也得到了前所未有的改观, 图1为2008—2011年间保障房建设情况, 可以看到, 近几年保障房建设一直呈现超额完成计划的局面。
资料来源:2011年中国房地产政策报告, 其中2011年数据截止到2011年10月底。
为切实贯彻落实“十二五”规划纲要提出的建设3600万套保障性住房的任务, 中央出台了资金、土地等相关政策来支持保障房建设。一方面, 在资金的募集上, 通过财政、金融等多渠道融通资金。另一方面, 为确保保障性住房用地供应, 国土资源部《2011年全国住房用地供应计划公告》要求各地对保障性安居工程实行计划单列, 确保2011年全国1000套保障性安居工程用地。由此可见, 相对2008年前保障房建设的“无人问津”, 目前保障房建设形势有了较大的改观。
三、保障房建设中中央政府和地方政府的博弈模型
为了重点分析中央政府和地方政府的两方博弈, 建立保障房建设中中央政府和地方政府的两方博弈模型。两方博弈有其内在的特点, 首先, 博弈方之间并不总是相互对抗的, 有时候也会出现两博弈方利益方向一致的情况;其次, 掌握信息较多的一方并不能保证利益也一定较多;最后, 个人追求最大化自身利益行为, 往往不能导致实现社会的最大化利益, 也常常不能真正实现个人自身的最大利益。
1. 模型的假设
假定l:地方政府更多地是从增加财政收入的角度出发, 谋求自身利益最大化, 而中央政府则要从全局观点考虑, 从整体范围上提高社会福利。
假定2:由于地方政府更加了解本地区的情况, 而中央政府获得信息的成本相对较高, 中央政府和地方政府间的信息不对称会引发道德风险, 为此, 中央政府可以制定激励或者奖惩制度来规范地方政府的行为。
假定3:中央政府和地方政府都是风险中性者, 各级政府的官员成分复杂, 他们对风险的态度不尽相同。
假定4:出于简化模型的思路, 对各种收益和成本均采用固定值, 即不考虑各变量之间的相关关系。
2. 模型建立及求解
变量解释:
U1:地方政府执行保障房政策时, 中央政府的效用;
U2:地方政府不执行保障房政策时, 中央政府效用; (U1>U2)
V1:地方执行保障房政策时, 地方政府的效用;
V2:地方政府不执行保障房政策时, 地方政府效用;
C1:地方政府建设保障性住房的成本;
C2:不建保障房时地方政府的成本; (V1
C3:中央政府对地方政府执行保障房政策进行监督的成本;
F:当中央政府发现地方政府未执行保障房政策时对地方政府的处罚;
W:中央政府对地方政府建设保障房的行为给予奖励;
P:地方政府执行保障房政策的概率;
Q:中央政府进行监督的概率;
S1:混合策略下, 中央政府的效用;
S2:混合策略下, 地方政府的效用。
由此, 则双方的效用矩阵如表1:
根据混合策略下的效用和概率可以求出:
当时, 该博弈达到混合策略纳什均衡。
解得为该混合策略的纳什均衡解。
3. 模型结果的分析
纳什均衡策略下, 中央政府的纳什均衡解为以的概率对地方政府行为进行监督。当地方政府能够从不建保障房中获得更多利益时 (即Q*分子越大) , 中央政府就应该增加对对方政府的监管;地方政府以P*的概率执行保障房政策, 当中央政府监督成本 (C3) 越小, 对违规的惩罚力度 (F) 越大时, 地方政府执行保障房政策的概率越高。
从以上的博弈分析中可以看出, 中央政府和地方政府均不存在绝对的最优策略, 双方策略的选择与对方的行为紧密相关, 最终的策略选择依赖两者间的动态博弈。中央政府进行监督的概率Q*与地方政府选择不执行保障房政策时获得的差额效用正相关, 而地方政府对这两种策略的抉择又受制于中央政府进行监管的概率, 博弈的双方间相互影响, 相互作用, 具有紧密联系。
四、完善我国保障房建设的路径选择
1. 完善我国住房保障法律体系
虽然在住房改革的过程中, 我国政府颁布了多项政策文件来支持保障房制度的实施, 但这些政策文件都未达到法律的高度, 相关部门难免会有所怠慢。美国住房保障制度的成功之处很大程度上归功于法律体系的完善。美国联邦政府先后通过了《住房法》、《城市重建法》、《联邦住宅法》、《住房与城市发展法》、《住房与社区开发法》等, 对住房保障的贷款、保险、房租补贴等多方面都作了较系统的规定。社会法坚实的理论基础和国家的大力支持为我国住房保障立法奠定了理论基础和现实条件。结合我国实际情况, 出台具有中国特色的住房保障法律制度, 发挥法律的强制性、权威性和领导性, 为我国的住房保障政策的实施护航。
2. 贯彻落实财权和事权的对等原则
目前, 我国分税制的内在机理是一种权力主导型的分税制。中央政府对地方政府享有绝对的权威, 从税收归属和税收返还等角度限制了地方政府的收入来源。1994年分税制后, 地方政府的财政收入占全国财政收入比例陡降, 此后一直低于50%, 但财政支出比例却未呈现大幅下降, 反而在2000年以后呈持续上涨的趋势。这导致中央政府的政策执行超出地方政府的财力, 地方政府无能无力, 只能采取消极态度。2008年前, 我国保障房建设缓慢, 很大程度上是因为中央政府没有充分考虑到地方政府的财权和事权的不对等, 对于保障房政策的实施没有给予足够的财政支持, 在地方政府财力不足的情况下, 保障房建设的工程只能被搁置。近几年来中央不论是从政策上还是从行动上, 都加大了对保障房的投入, 这不仅有利于激发地方政府执行保障房政策的热情, 同时对地方政府和民间资本投入保障房建设起到了拉动效用, 改善了保障房建设被冷落的困境。因此, 改善民生的政策意图要遵循财权事权对等原则。在保障购建设中, 对于经济欠发达的地区, 中央政府应当通过横向和纵向的转移支付给予适当的财政补贴, 缓解地方政府财政压力。
3. 建立有效的监管约束机制
根据博弈模型的结论, 混合策略纳什均衡下, 地方政府执行保障房政策的概率P*=F-C3/W+F, 有效的监管约束应当尽量使P*趋近1。这涉及到两个方面的内容:降低监管成本C3和增加惩罚力度F, 中央政府对地方政府的高效监管要依赖制度的优化。首先, 可以充分利用互联网信息交流平台的优势, 倾听广大人民群众的声音, 而不能一味地依赖地方政府的工作报告;其次, 完善居民退出机制, 减少“以足投票”的成本, 即居民可以根据各地方政府的公共服务水平情况自由的选择社区。目前我国由于户籍制度等原因, 流动成本较高, 居民的诉求并不能得到很好的反馈, 为此, 中央政府应当打破户籍制度带来的流动障碍, 减少流动成本, 实现公共商品供给的民主化;再次, 对于违规的地方政府, 中央应当给予严厉的惩罚措施, 决不能采取放任的态度;最后, 要规范土地管理制度, 实行土地管理部门从中央到地方的垂直管理体制, 使土地管理部门执法行为摆脱同级政府的干预, 增加地方政府违规的难度。
4. 优化我国现行的政绩考核体制
地方政府之所以对保障房建设抱有机会主义的态度, 很大程度上源于我国现行的政绩考核体系的简单化、模糊和片面。现行的政绩考核体制主要关注GDP增长速度、税收收入、招商引资等被量化的经济指标, 而对于许多“以人为本”民生工程却未纳入考核体系内。如果将类似保障房建设的民生工程考核融入政府的绩效评价中, 那么地方政府执行保障房政策的效用就会增加, 地方政府就会更倾心于保障房建设。从一定程度上来看, 我国现行政绩考核体制的缺陷助长了地方政府的投机取巧和短视行为, 应当从根本上予以转变。更加科学的政绩考评体系应当做到经济效益和社会效益的并重, 寻求社会和谐稳定下的经济增长。应当将住房、医疗、环境保护、就业等民生方面的社会效益纳入到考评指标, 力求使考评范围更加多元化。将能否改善民生, 提高地区社会福利水平也作为评判地方政府作为的指标, 以此激励地方政府的工作重心向改善民生倾斜。
参考文献
[1].牛凤瑞, 李景国.尚教蔚等.中国房地产发展报告.社会科学文献出版社.2008.
[2].张宗斌, 汤安中.权力主导型分税制的内在缺陷及完善思路.现代经济探讨, 2006 (6) .
[3].夏永祥, 王常雄.中央政府与地方政府的政策博弈及其治理.当代经济科学, 2006 (2) .
[4].郝国彩, 袁小霞.关于住房市场失灵与政府干预的思考.财政研究, 2010 (12) .
[5].曲顺兰, 申亮.我国廉租房提供的财税政策研究.财政研究, 2007 (9) .
混合策略博弈 篇2
验资是注册会计师依法接受委托, 按照独立审计准则的要求, 对公司或企业注册资本的实收情况或变更情况进行审验, 并出具验资报告。会计师事务所是从事验资业务的法定机构, 验资是注册会计师的一项法定义务, 与英美法系国家不同, 我国实行资本信誉制度, 对公司设立之时严格规定了最低注册资本额。国外多采用授权资本制度, 在公司章程中确定公司设立的注册资本总额, 但发起人只需要认购部分股份, 公司即可设立, 未认购部分可授权董事会根据需要随时发行。
在信誉资本制度下, 为保证企业资金在设立时如实到位, 法律特别赋予具备专业审验资质的会计师事务所为企业设立验资的权利, 并要求会计师事务所提供验资报告, 以证明申报设立的企业是否具备相关法律法规规定的条件。故验资是公司进行工商注册前必不可少的程序, 验资报告是公司成立前的重要证明文件。
随着我国经济的快速发展, 中小企业如雨后春笋般发展起来, 但不少企业在设立之初并非都能达到最低注册资本限额:有限责任公司最低注册资本3万元, 一人有限责任公司10万元, 股份有限公司500万元。即使能筹集到最低限额标准资金, 而由于本身行业的特点, 需要的资金量远远大于最低限额。鉴于部分中小企业设立时出资者资金短缺, 社会上一些资金富有者便打主意为出资者垫资设立公司从中牟取超额利益, 这一行为给注册会计师的验资业务带来了相当大的风险。垫资人为企业代垫资金, 手持企业注册者的身份证明及相关资料, 替注册者找验资中介机构, 待拿到验资报告后, 报工商部门注册登记, 直至领取工商营业执照。企业设立成功后, 代理公司随即将代垫资金抽回, 并从中获取高额的垫资手续费。垫资公司的“一条龙”服务, 不仅严重扰乱了经济社会的秩序, 而且给利益相关者带来了不同程度的风险。这里面的利益关系错综复杂, 而博弈论是分析利益相关者相互决策的有力工具, 本文将以此为工具, 剖析垫资审验的利益关系与会计实质, 以期有效管控垫资验资服务。
二、文献概述
关于验资已有的文献多集中在研究注册会计师的验资风险与防范, 以及商业银行在虚假验资方面的责任问题, 譬如:高允斌 (1999) 对验资业务提出三问, 其中第二问“拒绝验资就可以降低执业风险吗?”, 指出拒做验资业务只能消极地防范风险。潘静 (2007) 提出形成验资风险的原因主要是法规的不完善、行政部门各自为政、“深口袋”理论的滥用、社会对注册会计师的过高期望。李晓慧、孙林 (2001) 从货币出资、非货币出资以及净资产出资三方面的事项分析注册会计师的风险, 并针对以上三类出资的验资风险分别提出了应对措施。李文江 (2011) 分析了商业银行在虚假验资中应承担的法律责任, 提出了商业银行提供虚假验资凭证的法律对策, 并就此法律问题, 论述了商业银行利用验资规定进行信贷资产保全, 同时提出了商业银行验资责任的法律建议。
相比较而言, 集中研究出资者以货币出资、代理验资公司代垫货币的代垫验资行为的文献很少, 而且很少有文献从利益相关者理论的角度, 运用博弈论理论分析垫资验资业务中的利益相关者的倾向。即便有这方面的研究文献, 也仅局限于注册会计师审验中的博弈分析。
三、垫资验资实质及利益关系分析
垫资验资表现为对以货币出资的方式进行审验, 这种验资可以归纳为以下内容:首先垫资人搜集股东的有效证件, 主要是身份证和个人开户银行卡及密码, 并与会计师事务所提前沟通好;然后垫资人将自己的甚至是向银行借贷而来的资金打入验资企业股东的银行卡, 并以股东的身份设立企业临时账户, 随即将股东个人账户的资金转账至临时账户, 此时会计师事务所的人员立即到临时账户开户银行进行函证, 此时验资报告已盖章完毕。而临时账户的资金多则停留三天, 少则当天转出。垫资人拿着验资报告交予工商管理部门, 取得工商许可证, 同时, 垫资人获得与注册资本相应比例的报酬, 并向银行归还借贷资金。以上是代理公司“一条龙”服务的典型流程, 这种行为在实务中十分常见, 甚至广做宣传, 报纸、网上广告等公共传媒均有体现。
在这样的垫资验资过程中, 为企业开设临时账户的银行或者是与垫资人无关的银行, 或者是为垫资人贷款的银行;而为企业出具验资报告的会计师事务所获取的报酬由于竞争激烈显得极其微小, 但资本占优势的会计师事务所亦有验资与垫资同时进行获取多重收益的动机。仔细分析其中的利益关系, 可以看到在股东找到垫资人之前, 垫资人或许已与银行达成默契的借贷关系, 双方之间有相应的比例报酬;在股东找到垫资人时, 垫资人与股东之间有更直接的利益关系;无论垫资人与会计师事务所无关还是有关, 会计师事务所收取的都是规定的验资服务费;当垫资人拿到工商执照时, 企业股东支付代办费于垫资人, 垫资人拿回代垫资金。
《人民币银行结算账户管理办法》 (中国人民银行令[2003]第5号) 第三十七条规定, 注册验资的临时存款账户在验资期间只收不付。在办理工商执照、税务登记及组织机构代码之后开立基本户。通过调查, 笔者发现有些银行基本账户的形成有将临时账户直接转为基本户, 此为同一开户银行;也有银行另开设基本账户, 而验资期间临时账户的资金或许当天存入当天转出, 存入以“验资款”的名义, 转出时有两种形式:一是直接由临时户转至垫资人账户, 二是转至企业基本账户, 再由基本账户以“还款”名义转至垫资人账户。经调查, 地方一些小银行临时账户的资金并不一定先转至基本账户, 而是应股东要求直接从临时账户转至垫资人账户, 当临时账户转至基本账户时, 基本账户显示金额为“零”, 此种行为已明显违反中国人民银行令[2005]第5号文件的规定。
垫资资金往来, 反映到账户上主要有两种:
一是以其他应收款长期挂账, 达到资产负债表的平衡, 具体账务处理过程是:股东设立出资至验资临时户时, 借:银行存款——验资户;贷:实收资本——自然人股东。注资完毕取得工商及税务等执照后, 办理基本账户, 借:银行存款——基本户;贷:银行存款——验资户。基本账户资金转至垫资人时, 借:其他应收款——自然人股东;贷:银行存款——基本账户。这种方式下, 股东从公司账上获取出资后即归还垫资, 资产负债表将会有“其他应收款”长期挂账, 以至账面平衡。事实上, 公司与股东并未发生实际经济业务, 并不存在合规合法的交易支持此笔账务, 故此种行为难免造成股东虚假出资的嫌疑。因为实践中, 若股东并没有支付获取资金的公平对价, 则有可能被认定股东虚假出资。
二是以长期投资的方式转移注册资本, 即:股东设立出资至验资临时账户时, 借:银行存款——验资户;贷:实收资本——自然人股东。注资完毕取得工商及税务等执照后, 办理基本账户, 借:银行存款——基本户;贷:银行存款——验资户。股东以对外长期投资, 借:长期投资;贷:银行存款——基本户。这种方式下, 认定“长期投资”的真实存在性尤为必要。根据《公司法》有关规定, 对于“长期投资”必须明确被投资单位享有此笔投资的出资证明及股权证明, 以及公司作为股东是否真正享有投资收益, 否则, 就是公司以“长期投资”的方式转移资金至自然人股东或控制的公司中。
以上是垫资验资最简单的两种方式, 演变之后无论是设立验资, 还是变更验资, 均有变通。细细分析, 这样的垫资行为实际造就的是大量的空壳公司。但是这样的虚假出资注册或者说抽逃资本目前在法律上并未有明确的解释。《公司法》、《公司登记管理条例》、《公司注册资本登记管理规定》等法律法规和规章, 仅有关于虚假出资及抽逃出资行为的惩责表述, 而没有对行为的概念及其模式给出完整的、具体的陈述和说明。实践中, 认定股东抽逃出资的多是以判断当股东出资资产的所有权在股东与公司之间发生“移转”时, 股东是否向公司支付了公正合理的对价, 包括股东是否向公司支付了等值的资产或权益。对是否支付了公正合理的对价的判断主要是依据公司的相关财务资料, 比如公司的资产负债表、利润表、记账凭证、长期投资账册及银行对账单等。
由以上分析可以看出, 虚假出资或者抽逃出资中的利益关系, 即在假设存在企业管理层、银行及会计师事务所集体合谋的前提下, 银行工作人员为获取协助放贷及虚假出资存在利益关系, 会计师事务所在充当垫资人合谋时获取了垫资佣金, 企业为获取较高的资本信誉证明, 以些许代价获取虚假出资验资报告, 而当企业破产之时, 最后的受害者仍然是不知情的债权人或投资者, 股东只是以出资额承担有限责任, 公司作为企业法人为自然股东挡住了最大的责任。在假设银行及会计师事务所独立客观的前提下, 企业为获取较高的资本信誉证明, 就有向垫资人或放贷人借款虚假注资的动机, 此时最大的受益者是垫资人, 垫资人在资金缺乏的情况下, 便把触角伸向银行或者民间借贷获取利益支持。而这些利益链条也更加形象地解释了经济学的基本假设。
四、基于利益相关者理论的垫资审验博弈模型构建与分析
目前, 国内的利益相关者理论的利益相关者包括在企业的生产经营活动中进行一定专用性投资并承担相应风险的个体和群体。而其活动能够影响或者改变企业的目标, 或者受到企业实现其目标过程的影响。
博弈论作为研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题, 在“个人理性”的假设和信息不对称的情况下, 研究垫资现象中企业管理当局、会计师事务所及工商部门三方的博弈决策将有助于找到解决问题的方法。之所以集中研究这三个主体, 一方面是由于会计师事务所既可能充当垫资人合谋, 也可能只是作为独立客观的机构出具独立客观公正的验资报告, 而其中是否选择合谋的前提就是风险与收益的权衡, 这取决于监管机构即工商管理部门的监管核查, 企业无论设立验资还是变更验资, 可以选择真实出资也可选择虚假出资, 或出资后抽逃资本, 其行为的前提是考虑行为的风险与收益, 这又取决于监管是否严格。而银行作为间接的合谋者, 一方面扮演着监管机构的角色, 另一方面又面临利益的诱惑, 有充当合谋垫资人的动机。
1. 模型构建。
参与者:博弈第一方为企业管理当局, 第二方是依照法律规定对第一方实施监管的工商管理部门, 第三方是受企业管理当局委托出具验资报告的会计师事务所。
动机及特征分析:第一方企业为获得资本信誉及资质, 有通过其他途径在短时间内聚集大量资金证明的动机, 垫资人是社会上专职从事此类信誉证明的代理机构, 会计师事务所是其中之一, 二者有合谋的可能。但是基于外部及上级监管部门的监管, 第三方会计师事务所在充当垫资人合谋时, 会进行风险与收益的权衡, 而这个风险程度与监管的力度有密切关系。即使不参与垫资合谋, 在争取验资服务时, 面对激烈竞争的市场, 利益的驱动会促使第三方舍弃独立客观, 选择协助验资。第二方在选择是否严格监管时, 很大程度上取决于监管成本的高低, 第二方只能以一定比例对第一方和第三方进行检查。这样一个监管上的博弈符合混合战略博弈的特征。
2. 模型假设。
企业管理当局与会计师事务所不进行合谋垫资及审验, 工商管理部门也不进行核查, 则第一方及第三方的支付为零, 第二方由于规范市场规则, 产生的外部性收益为B, 三方的支付为:0、A、0。企业管理当局与会计师事务所不合谋, 合谋的概率为PV, 但第二方以Pa的概率进行核查, 其检查成本是C, 则三方的支付为:0、A-C、0。假设企业管理当局与会计师事务所合谋, 第二方也不核查, 则第一方和第三方的额外收益包括资本信誉证明及合谋的收益, 分别为M、N, 三方的支付为:M、0、N。假设企业管理当局与会计师事务所合谋, 第二方虽然核查, 核查的概率为Pa, 未发现问题的概率为 (1-P0) , 则三方的支付分别为:M、-C、N。假设第一方和第三方合谋, 第二方进行核查, 查出问题的概率为P0, 由此而受到的惩罚和损失分别是-E、-F, 则三方的支付分别为:-E、A-C、-F。综合以上假设, 该博弈模型的支付矩阵可表示如下:
3. 模型求解。
(1) 假定第一方和第三方合谋垫资审验的概率为Pb, 第二方监管核查及不监管核查的期望收益分别为:π1、π2。π1=Pb×[ (A-C) ×P0+ (-C) × (1-P0) ]+ (1-Pb) ×[ (A-C) ×P0+ (A-C) × (1-P0) ];π2=Pb×0+ (1-Pb) ×A。
当工商管理部门核查与不核查的预期收益相同时, 即第二方存在博弈均衡时, 该模型的均衡解即最优概率为:令π1=π2, 得Pb*=C/AP0 (1) 。
(2) 假定第二方工商监管核查的概率是Pa, 则第一方进行合谋的期望收益与不合谋的预期收益分别为:π3、π4。π3=Pa×[ (-E) ×P0+M× (1-P0) ]+ (1-Pb) ×M;π4=0。
当企业管理当局选择垫资审验和真实出资的预期收益相同时, 即第一方博弈均衡时, 就是工商监管核查的最优概率为:令π3=π4, 得Pa*=M/ (E+M) P0 (2) 。
(3) 假定第二方工商监管核查的概率是Pa, 则第三方进行合谋的期望收益与不合谋的预期收益分别为:π5、π6。π5=Pa×[ (-F) ×P0+N× (1-P0) ]+ (1-Pb) ×N;π6=0。
当会计师事务所选择协助第一方进行垫资与不参与合谋垫资审验的预期收益相同时, 即第三方博弈均衡时, 就是工商监管检查的最优概率为:令π5=π6, 得Pa*=N/ (F+N) P0 (3) 。
(4) 依据式 (1) 、 (2) 、 (3) , 可以得到三方混合战略博弈的纳什均衡为:Pb*=C/A P0与Pa*=M/ (E+M) P0, 或者Pb*=C/A P0与P×a=N/ (F+N) P0。
五、博弈分析与讨论
由式 (2) 、 (3) 的分析知, 当Pa
由式 (1) Pb*=C/A P0分析得知, 企业与会计师事务所合谋的概率与工商管理部门监管成本C成正比, 与核查出问题的概率P0和监管外部收益A成正比, 结合以上对式 (2) 、 (3) 的分析得知, 提高工商部门在监管核查中的业务技术是提高P0的关键, 而核查成本又是制约核查效果的又一重要因素, 故可以考虑对监管部门实施绩效考核措施。
最后如果大幅提高M或N时, 则导致Pa*上升, 说明在实际工作中要求工商管理部门监管核查概率需要大于Pa*, 否则第一方和第三方就有可能合谋。
六、总结
在监管垫资审验问题时, 可以从两方面来着手:一是在降低监管成本的同时, 加强工商行政监管的技术水平, 运用多种核查方法, 提高核查水平, 抓住问题的本领;二是加大对企业和第三方会计师事务所的惩处力度, 提高合谋的成本, 使二者不敢铤而走险。除此之外, 就是对资本信誉制度的实质宣传, 虚假出资或者抽逃出资只会降低资本信誉;对会计师事务所而言, 要保有独立客观的立场方能继续为社会做鉴证, 提供虚假审计报告不会使其长久发展。
结合理论部分的阐述, 关于垫资审验, 如同法律中的“天网恢恢, 疏而不漏”, 日常的垫资行为若是真正进入司法程序, 便没有查不出的作假企业。而验资作为会计师事务所的传统业务, 已经不具有竞争意义, 会计师事务所完全没有必要为了些许的报酬而失去立场, 唯有不断创新, 开拓具有自己专长特色的业务才能长久生存下去。
摘要:本文从经济实质及法律实质两个角度剖析, 设立或变更验资中企业管理当局的垫资审验现象, 并构造博弈模型分析对此现象的监管。分析得知, 监管垫资审验:一是要在降低监管成本的同时, 加强工商监管的技术水平, 运用多种核查方法, 提高核查出问题的本领;二是加大对企业和第三方事务所的惩处力度, 提高合谋成本, 使二者不敢铤而走险;三是加强对资本信誉制度的宣传, 指出虚假出资或者抽逃出资只会降低资本信誉。
关键词:垫资验资,混合战略博弈,监管
参考文献
[1].于延琦.验资:理论与实务.大连:东北财经大学出版社, 2003
关于博弈策略研究综述 篇3
1、博弈与博弈决策
博弈 (Game) 在经济学中被定义为被定义为“决策主体在相互对抗中, 对抗双方 (或多方) 相互依存的一系列策略和行动的过程集合”。所谓相互依存, 是指“博弈中的任何一个参与人的行为及行为结果都会受到其他参与人行为的影响, 而他的行为也同时影响其他参与人的行为及行为结果”。
博弈决策 (Game Decision Making) 是指在包含利益相互依存的两个或多个参与人的博弈情境中所进行的行为决策。
2、博弈策略
策略 (Strategy) 又称战略, 是指参与人选择其行为的规制, 即参与人应该在怎样条件下选择怎样的行动, 从而保证自身利益达到最大化。博弈策略 (Game Strategy) 即指在包含利益相互依存的两个或多个参与人的博弈情景中, 参与人进行行为决策所使用的方式, 从而保证自身利益达到最大化。
二、博弈策略理论研究
多年来, 经济学一直用“理性人”假设解释和预测人的行为。但随着行为经济学的发展及与心理学交叉研究的兴起, 有关博弈决策策略的心理学研究在理性决策和非理性决策方面均有涉及, 而后者更是倍受青睐。目前较普遍的有以下几种策略:
1、启发式策略
早期的决策模型中, 研究者将决策者作为“理性人”来看待, 认为他们会遵循理性的行为原则而追求效用最大化和自我利益。卡尔曼和特沃斯基 (Tversky) 提出人们会根据启发式, 即“一种能够引导信息搜索并改变问题在人脑中的呈现形式, 以帮助人们有效解决问题的认知策略”做出决策。在博弈决策的研究中, 也发现了一些典型的启发式策略。例如, Stephen和Pham发现最后通牒博弈中提议者在作出分配要约时采用了情感启发式策略;陈璟发现儿童在囚徒困境博弈决策中采用了快速节俭启发式策略, 在最后通牒博弈决策中采用了情感启发式和非理性的公平策略。
2、公平策略
判断个体分配公平与否, 主要基于三个原则:均衡 (equity) 、平等 (equality) 以及需要 (need) 。研究者采用独裁者博弈和最后通牒博弈这两个典型的博弈范式, 考察的是平等这一公平原则。
在独裁者博弈研究中, 研究者对于儿童随着年龄的增长变得更加公平利他这一观点尚未达成共识, 而最后通牒研究中提议者的分配行为也具有不一致的年龄效应。朱莉琪及于静认为可能是以下几个原因造成的, 第一是文化的影响, 来自不同国家的研究报告儿童及成人被试的分配都存在差异;其次是分配资源类型的影响, 由于各实验中使用的分配物并不一致, 可能会影响分配; 最后是博弈双方的关系, 社会距离的远近也会影响分配。
3、TFT 策略
Axelrod在其著名的囚徒困境重复博弈计算机实验中, 发现了一种完全不需要任何心理理论能力的简单规则“Tit - For - Tat (TFT) ”策略, 即在第一回合中个体单方面地选择合作, 然后观察对对方实际选择的影响, 以便能够在下一回合中带来互惠。后继研究发现:无论在什么环境中, TFT策略都是促使他人做出合作选择的最有效策略, 即在第一次选择中选择合作, 其后模仿他人上一次的选择。此外, TFT策略还支持了Pruitt和Kimmel提出的目标预期假说, 目标预期假说 (goal-expectation hypothesis) 提出:囚徒困境博弈中, 个体之所以选择合作, 最主要原因是为了达到自愿的合作结果。
但某些研究者却持有不同看法。Axelrod就提出TFT策略并不是动态囚徒困境博弈中的最佳策略, 因为当对手首次选择竞争并使用TFT策略, 最后的结果就会是竞争—竞争。Colman也发现: TFT策略只对合作性个体才会产生合作的效果, 但对竞争性个体则可能导致利用行为即选择竞争。
4、RTS 策略
Roberts和Sherratt在模拟的囚徒困境实验中, 考察了各种简单策略的相互影响并发现了可促进合作的“Raise-The-Stakes (RTS) ”策略。该策略是指:博弈开始时, 个体对合作进行少量的付出投资, 而在随后的博弈互动中, 当且仅当对方和自己都合作时, 才逐渐提高自己付出的投资;这可以使个体在减少被利用风险的同时, 尽可能的从合作中得到收益。
其后研究者们针对这一策略进行了大量验证实验。例如, Roberts和Renwick在可变投资的动态囚徒困境实验中, 考察了人类对RTS策略的使用, 发现人类个体在博弈首轮的投资大于RTS策略所需的最低投资限度。这种不同于模拟实验的行为引发了深入讨论。研究者们注意到, 与TFT策略相比, RTS策略的最大优势在于它最初较低的合作付出, 这能使个体避免遭受被欺骗利用的损失。因此RTS策略是否源于人类为有效应对狡猾的欺骗策略的努力, 成为了一个重要问题。相关研究表明, 当使用RTS策略的个体面对欺骗行为时, 会选择以不合作不投资作为对对方的严厉惩罚;也有研究者认为, 人类面对互惠对手时使用RTS策略, 而受到欺骗时则以竞争对应竞争。
三、博弈策略的研究现状
1、年龄与博弈策略
在社会决策中, 理解他人观点将导致策略行为的发展。研究发现, 幼儿园的小朋友被认为是相当没有策略的, 他们分享他们所拥有的一切东西, 相似的研究也发现, 7岁的小朋友在DG和UG中分配行为没有差异 (Harbaugh et al., 2003; Leman, KellerTakezawa, & Gummerum, 2009) 。然而9岁或者10岁的小朋友在UG游戏中, 随着年龄增长显示出分配差异 (Harbaugh et al., 2003;Leman et al., 2009) 。Berna Güroglu等 (2009) 研究发现, 9岁儿童已经发展出公平策略。该研究主要对象为青少年, 年龄范围为9-18岁, 研究结果显示9岁儿童已经表现出公平策略, 这一结果具有天花板效应, 所有被试都具有公平考虑的策略, 并不能说明被试的发展差异。因此在以后的研究中被试的年龄范围应小于9岁, 考虑研究儿童博弈策略发展的年龄范围应为6-9岁。但是又有研究显示, 在儿童三岁时, 已经出现公平考虑 (Wellman, Cross, & Watson, 2001) 。
陈璟, 孙昕怡等 (2012) 研究了在完全信息条件下最后通牒博弈决策的发展, 研究发现, 公平策略和权宜策略是儿童与成人分配者采取的主要策略, 而儿童与成人应答者则主要采用权宜策略。随着年龄增长, 采取公平策略的人数呈现逐渐增长的趋势, 而采取权宜策略的人数呈现下降趋势。
皇甫桦彦 (2011) 研究结果显示, 9岁组被试更多的了采取权宜公平策略;20岁组被试很多的采取了公平策略;采取权宜策略的人数在两组中相差不大;而采取利他策略的被试, 只在9岁组被试中存在。这一结果表明, 儿童在决策过程中的策略存在差异, 而且随着年龄增长表现出不同的发展趋势。
2、权利认知与博弈策略
按照标准博弈论及主流经济学的“理性人假设”, 在最后通牒博弈中提议者会提出尽可能小的要约, 而回应者只要得到利益, 就会接受提议者的任何方案。但是, 大量研究结果均否定了这一假设, 提议者的要约比例通常占总值的40% 到50% 之间, 太小的要约几乎总是被拒绝, 大多数的回应者会拒绝低于占总数三分之一的要约。
已有研究表明, 认知因素会影响个体在决策中对信息的处理与判断推理过程, 在最后通牒博弈中, 提议者需要考虑回应者的否决权及其对自己分配权的认同程度, 同时回应者也存在一个对提议者分配权的认同以及对方对自己否决权认知的预期问题, 而这些信念均建立在决策双方对权利的认知基础之上。
Hoffman等 (1996) 的研究发现, 在最后通牒博弈中, 当提议者是通过知识问答获胜才获得分配权时, 比其之前更多地表现出利己决策;通过三种不同指导语的使用, 被试的决策策略逐渐从公平互利过渡到纯粹理性。因此, 研究者认为提议者在以前的最后通牒博弈中提出平分要约的原因是受到了指导语的影响, 没能认识到自己“先发制人”的分配权。
Forsythe等 (1994) 的研究发现, 最后通牒博弈的结果多为平均分配, 而独裁者博弈 (该博弈中回应者没有否决权) 的平均分配比例则显著下降;他们也认为造成这一差异的原因很可能是: 与具有绝对和明显分配权优势的独裁者博弈相比, 提议者在最后通牒中受到对否决权认知的约束, 缺乏对自身优势权利的充分认知, 从而更多地提出平均分配。
Van Dijk和Vermunt (2000) 比较了提议者在最后通牒博弈和独裁者博弈中的决策差异, 结果发现:提议者在后一任务中比在前一任务中分给回应者更多的利益。提议者在独裁者博弈中, 认识到了自己的绝对分配权优势和回应者的绝对弱势地位, 因此激发了公平和同情意识, 倾向于做出公平或对回应者更有利的分配;而在最后通牒中, 提议者认识到自己的分配权和回应者的否决权, 不存在绝对的弱势群体, 因此激发了竞争和自利意识, 倾向于做出对自己更有利的分配。
在经典的博弈任务中, 被试作为提议者和决策者所行使的权力是不同的。在纳什议价任务中, 博弈双方具有相同的分配权; 在最后通牒博弈任务中, 博弈双方权利不同, 提议者拥有分配权而回应者拥有否决权。皇甫桦彦 (2011) 研究了议价博弈策略的权利认知效应, 证实了在议价博弈任务中权利认知效应的存在, 并且具有年龄差异, 进一步研究发现, 被试对权利认知的不同将影响决策策略的选择。
3、社会角色与博弈策略
在传统的博弈任务中, 博弈双方为匿名的。但在现实的决策情景下, 博弈双方存在一定的社会关系, 双方的社会角色对博弈策略的选择有影响, 这一观点毋庸置疑。张亮 (2012) 基于现实情景下幼儿分配行为的研究发现, 当三个角色各自具有一个明显特征 (饥饿、劳动量最大、朋友) 时, 5岁幼儿偏好的公平分配方式按程度依次为按贡献 (劳) 分配、平均分配、按需要分配 (兼顾贡献和需要的分配并列第三) 。平均分配是6岁幼儿最喜欢的分配方式, 其次是按贡献 (劳) 分配, 第三是偏向朋友的分配方式 (将最多的糖果分给朋友) 。这一结果表明, 儿童在分配时会受到社会角色的影响。
4、情绪与博弈策略
情绪可能通过有选择性地启动记忆中与情绪有关的信息来影响人际决策 (Bower, 1981;Forgas & Bower, 1987) 。比如, 高兴的人会回忆更多积极的信息, 从而表现出更加乐观和独断的行为 (Forgas, 1999) , 消极的情绪则会启动消极的信息, 增加悲观和社会约束反应发生的可能性 (Forgas, 1998, 2002) 。很多研宄表明, 积极的情绪促进更积极的、独断的、自信的和乐观的人际风格。在社会情境中, 高兴的个体更直接并缺乏礼貌 (Forgas, 1999) , 同时也是有效的谈判者 (Forgas, 1998) , 倾向于将他们的内部偏好强加于外部世界 (Bless & Fiedler, 2006) 。高兴的情绪可能也是动机的来源 (Trope, Ferguson, & Raghunanthan, 2001) , 使得高兴的个体能够接受更大的风险。这些研宄结果说明, 高兴的情绪促进更自信、自私的分配策略;而消极的情绪则引起更加谨慎、公正的分配。
同样有大量的研宄表明, 情绪可能影响加工趋向, 即人们如何处理社会信息 (Bless, 2000;Bless & Fiedler, 2006) 。消极的情绪促使更加适应性、集中于外部的加工方式, 而积极的情绪使得集中于内部的、同化的思考方式变得更加容易。博弈游戏中的分配任务提供了一个内部自私驱动和外部社会规则的要求相冲突的情境。相应的, 处于积极情绪中、采取同化的加工策略的人们, 更倾向于遵循自己内部的驱动, 因此在分配中表现出更多的自私;而处于伤心情绪中的人们, 更多地采用适应性的思考方式, 将更多的注意力集中于外部的规范, 表现出更多的公正 (Forgas, 2002) 。处于良好情绪状态的分配者遵循内部的自私倾向, 处于消极情绪的分配者更多地集中于外部的公正规则。有研究结果表明, 在独裁者游戏中 , 积极情绪显著增加自私行为, 消极情绪则减少自私行为 (Tan, & Forgas, 2010) 。
四、研究展望
我国博弈决策研究自20世纪90年代刚刚起步, 其中关于博弈策略的研究不多, 关注博弈策略的发展研究更少见。因此, 未来研究可以考虑以下几方面。
1、博弈策略的发展研究
Berna Güroglu等 (2009) 研究发现, 9岁儿童已经发展出公平策略。该研究主要对象为青少年, 年龄范围为9-18岁, 研究结果显示9岁儿童已经表现出公平策略, 这一结果具有天花板效应, 所有被试都具有公平考虑的策略, 并不能说明被试公平策略的发展差异。因此, 可以进行儿童关于博弈策略的发展研究, 考虑到被试的心理理论能力, 年龄范围可以选择在5-9岁。
2、博弈策略影响因素研究
目前并没有研究者明确指出哪些因素影响了博弈策略, 策略是为了保证个体利益最大化而采用的方式, 策略的使用是存在个体差异的, 在不同的情景下个体所使用的策略会有所不同。
(1) 情绪对博弈策略的影响
总结已有情绪对决策影响的研究发现, 研究者多从情绪对决策结果的影响进行研究, 目前没有研究者关注情绪对决策者在决策过程中采取怎样的策略进行研究。因此, 可以在研究情绪影响决策的基础上进一步探讨情绪对决策过程的影响, 研究在不同情绪状态下, 被试的博弈策略有何差异。
(2) 同伴关系对博弈策略的影响
已有研究显示, 社会角色影响被试的决策。朋友与陌生这两种关系是儿童在发展过程中所经常面对的, 社会道德期望儿童在面对朋友时表现出慷慨、友善的倾向, 而在面对一个陌生人时可以适当表现出敌意与谨慎, 因此探讨被试在不同的同伴关系条件下会有怎样的博弈决策, 采用怎样的博弈策略有一定的社会价值。
(3) 权利认知效应对博弈策略的影响
博弈问题的策略研究 篇4
关键词:博弈,P状态,N状态,必败态
0 引言
博弈是指一些个人、团队或其他组织, 面对一定的环境条件, 在一定的规则约束下, 依靠所掌握的信息, 同时或先后, 一次或多次, 从各自允许选择的行为或策略进行选择并加以实施, 并从中各自取得相应结果或收益的过程。一个完整的博弈应当包括5个方面的内容: (1) 博弈的参加者, 即博弈过程中独立决策、独立承担后果的个人和组织; (2) 博弈信息, 即博弈者所掌握的对选择策略有帮助的情报资料; (3) 博弈方可选择的全部行为或策略的集合; (4) 博弈的次序, 即博弈参加者做出策略选择的先后; (5) 博弈方的收益, 即各博弈方做出决策选择后的所得和所失。
1 博弈的精髓——寻找必败态
“必败态”就是“在对方使用最优策略时, 无论做出什么决策都会导致失败的局面”。其他的局面称为“胜态”, 值得注意的是“在胜态下做出错误的决策也有可能导致失败”。博弈问题的精髓就是让对手永远面对“必败态”。“必败态”和“胜态”有着如下性质: (1) 若面临末状态者为获胜, 则末状态为“胜态”, 否则末状态为“必败态”; (2) 一个局面是“胜态”的充要条件是该局面进行某种决策后会成为“必败态”; (3) 一个局面是“必败态”的充要条件是该局面无论进行何种决策均会成为“胜态”。
例1、N堆的Nim游戏
有N堆石子, 两人轮流取, 每次可以从任意一堆中取任意多颗 (但至少一颗) , 谁先取完谁胜, 请找出必败态。
[问题分析]
采用"手推小数据=>猜想=>证明"的解题模式。显然, 一堆时先手必胜。两堆时, 若两堆相等则先手必败, 否则先手胜。三堆的情况就有点复杂了, 我们可以借助博弈树在小范围内求解, 再从这些解中找出规律。我们发现, 对于由两个不同数字构成的两元组, 都有且仅有一个三元必败态包含它, 这意味着我们可以定义一个函数F (a, b) , 表示"包含a, b的三元必败态中的第三数", 则有:
我们发现, F (a, b) 就是a XOR b的结果 (XOR为异或运算) 。继续求出一些四元必败态, 这个性质仍然符合。于是, 我们猜想:必败态即为"所有堆的石子数XOR运算后结果为零的局面"。证明就是要判断是否满足上面的3条性质。第1条、第3条显然满足, 关键就是第2条。因为在"胜态"下, 设所有堆石子XOR后结果为N, 将其写成二进制, 则至少有一堆石子写成二进制后在N的最高位上为1, 则可以证明从这堆石子中取一定可以变成"必败态"。
例2、威佐夫 (Wythoff) 博弈
有两堆各若干个物品, 两个人轮流从某一堆取或同时从两堆中取同样多的物品, 规定每次至少取一个, 多者不限, 最后取完者得胜。问:先手是否必胜?
[问题分析]
如果局面 (a, b) 是先手必负的, 那么对于任意x>b, y>a, 局面 (a, x) , (y, b) 先手必胜。所以可以知道, 任何数字只能出现在一个先手必负的局面中。同样, 如果局面 (a, b) 是先手必负的, 那么对于任何k>0, (a+k, b+k) 也是先手必胜的。如果用计算机算出前面几个先手必负的局面, 可以得到表1的结果:
看的出表格里的数据非常有规律: (1) 两个数字的差值成等差数列; (2) 对于第一个数, 我们发现“是未在前面出现过的最小自然数”。经过验证, 进一步猜测为:第n个先手必负的局面 (an, bn) 的an=trunk (n* (1+√5) /2) , bn=an+n。
由于2/ (1+√5) = (√5-1) /2, 对于局面 (a, b) , 可以先求出j=[a* (√5-1) /2], 若a等于[j* (1+√5) /2], 那么a=aj, bj=aj+j, (a, bj) 是"必败态";若不等于, 那么a=aj+1, bj+1=aj+1+j+1, (a, bj+1) 是"必败态";若都不是, 那么 (a, b) 就不是"必败态"。然后再按照上述法则进行, 一定会遇到"必败态"。奇妙的是其中出现了黄金分割数 (1+√5) /2=1.618……, 因此, 由an, bn组成的矩形近似为黄金矩形, 或者说如果满足bn=trunc (0.618*an) , 则 (an, bn) 为必败态。
2 博弈的深入应用
例3、N堆的取石子游戏
甲、乙两人面对若干堆石子, 其中每一堆石子的数目是任意的, 两人轮流按下列规则取走一些石子: (1) 每一步应取走至少一枚石子; (2) 每一步只能从某一堆中取走部分或全部石子; (3) 如果谁无法按规则取石子, 谁就是输家。
对于一个初始局面, 判断是先行者 (甲) 有必胜策略, 还是后行者 (乙) 有必胜策略。
[问题分析]
例如有3堆石子, 第1堆的石子数a1=3, 第2堆石子数a2=3, 第3堆石子数a3=1。先来探究这个游戏的一些性质, 用一个n元组 (a1, a2, …, an) 来描述游戏过程中的一个局面, 如用3元组 (3, 3, 1) 来描述上面的例子。改变这个n元组中数的顺序, 仍然代表同一个局面, 如 (3, 3, 1) 和 (1, 3, 3) 可以看作是同一个局面。如果初始局面只有一堆石子, 则甲有必胜策略, 甲可以一次把这一堆石子全部取完, 这样乙就无石子可取了。如果初始局面有两堆石子, 而且这两堆石子的数目相等, 则乙有必胜策略, 因为有两堆石子, 所以甲无法一次取完, 如果甲在一堆中取若干石子, 乙便在另一堆中取同样数目的石子, 根据对称性, 在甲取了石子之后, 乙总有石子可取, 而石子总数一直在减少, 最后必定是甲无石子可取。对于初始局面 (1) , 甲有必胜策略。而初始局面 (3, 3) , 乙有必胜策略。下面详细分析本题中的策略和算法思路。
2.1 局面的加法
(a1, a2, …, an) + (b1, b2, …, bm) = (a1, a2, …, an, b1, b2, …, bm)
例如: (3) + (3) + (1) = (3, 3) + (1) = (3, 3, 1) 。对于局面A, B, S, 若S=A+B, 则称局面S可以分解为"子局面"A和B。同时, 局面 (3, 3, 1) 可以分解为 (3, 3) 和 (1) 。如果初始局面可以分成两个相同的"子局面", 则乙有必胜策略。设初始局面S=A+A, 想象有两个桌子, 每个桌子上放一个A局面;若甲在一个桌子中取石子, 则乙在另一个桌子中对称的取石子;根据对称性, 在甲取了石子之后, 乙总有石子可取;石子总数一直在减少, 最后必定是甲无石子可取。初始局面 (2, 2, 5, 5, 5, 5, 7, 7) 可以分成两个 (2, 5, 5, 7) , 故乙有必胜策略。
2.2 必胜局面
对于局面S, 若先行者有必胜策略, 则称"S胜"。对于局面S, 若后行者有必胜策略, 则称"S负"。若A= (1) , B= (3, 3) , C= (2, 2, 5, 5, 5, 5, 7, 7) , 则A胜, B负, C负。我们所关心的, 就是如何判断局面的胜负。
2.3 分解理论
设初始局面S可以分解成两个子局面A和B, 则: (1) 若A和B一胜一负, 则S胜。不妨设A胜B负, 想象有两个桌子A和B, 桌子上分别放着A局面和B局面。因为A胜, 所以甲可以保证取桌子A上的最后一个石子。与此同时, 甲还可以保证在桌子B中走第一步的是乙。因为B负, 所以甲还可以保证取桌子B中的最后一个石子。综上所述, 甲可以保证两个桌子上的最后一个石子都由自己取得。
(2) 若A负B负, 则S负。无论甲先从A中取, 还是先从B中取, 都会变成一胜一负的局面;因此, 乙面临的局面总是"胜"局面, 故甲面临的S是"负"局面。
综合 (1) (2) , 若B负, 则S的胜负情况与A的胜负情况相同。
(3) 若A胜B胜, 则有时S胜, 有时S负。如A= (1) , B= (2) , S= (1, 2) , 则S胜。如A= (1) , B= (1) , S= (1, 1) , 则S负。
因为局面 (3, 3, 1) = (3) + (3) + (1) , 与局面 (1) 的胜负情况相同。所以初始局面 (3, 3, 1) 是"胜"局面, 甲有必胜策略。一个石子也没有的局面称为"空局面", 空局面是"负"局面。
如果局面S中, 存在两堆石子, 它们的数目相等。用T表示从S中把这两堆石子拿掉之后的局面, 则称"S可以简化为T"。局面 (2, 2, 2, 7, 9, 9) 可以简化为 (2, 2, 2, 7) , 还可以进一步简化为 (2, 7) 。不能简化的局面称为"最简局面"。局面 (2, 7) 是最简局面。一个局面的胜负情况, 与其简化后的局面相同。三个局面 (2, 2, 2, 7, 9, 9) 、 (2, 2, 2, 7) 和 (2, 7) , 胜负情况都相同。最简局面中不会有两堆相同的石子, 如果只关心局面的胜负, 就可以用一个集合来表示最简局面。最简局面 (2, 7) 可以用集合{2, 7}来表示。如果用搜索或者博弈树的方法来解决本游戏, 则采用集合表示一个局面, 比采用多元组表示一个局面, 搜索量将有所减少, 但时间复杂度仍然很高。能不能进一步简化一个局面的表示呢, 请接着看下面的分析。
2.4 类比及证明
我们知道不进位的二进制加法 (也可以理解为逻辑里的"异或"操作) , 即:1+0=1;0+1=1;0+0=0;1+1=0。而二进制数a, b, 若a+b=0, 当且仅当a=b。
我们来类比"不进位的二进制加法"与"局面的加法"。用大写字母AB表示局面, 小写字母ab表示二进制。如果用二进制1和0, 分别表示一个"局面"的胜或负, 则"局面的加法"与"不进位的二进制加法"有很多类似之处。如:
若A和B相同, 则A+B负;若a和b相等, 则a+b=0
若A胜B负, 则A+B胜;若a=1 (≠0) 且b=0, 则a+b=1 (≠0)
若B胜A负, 则A+B胜;若b=1 (≠0) 且a=0, 则a+b=1 (≠0)
若A负B负, 则A+B负;若a=0且b=0, 则a+b=0
若A胜B胜, 则A+B有时胜, 有时负;若a≠0且b≠0, 则有时a+b≠0, 有时a+b=0
下面, 我们用二进制数s来表示一个局面S的胜或负, S胜则s≠0, S负则s=0。"局面的加法"与"不进位的二进制加法"性质完全相同。如何用一个二进制数来表示一个局面呢?用符号#S, 表示局面S所对应的二进制数。如果局面S只有一堆石子, 则用这一堆石子数目所对应的二进制数来表示S。# (5) =5=101。若局面S=A+B, 则#S=#A+#B。局面 (3, 3) = (3) + (3) , 所以# (3, 3) =# (3) +# (3) =11+11=0。局面 (3, 3, 1) = (3, 3) + (1) , 所以# (3, 3, 1) =# (3, 3) +# (1) =0+1=1。
定义函数f (x) 就是x所对应的二进制数。则:若局面S只有一堆石子, 设S={a1}, 则f (a1) =#S, 即f (a1) =# (a1) 。对于本游戏来说, # (5) =101, 所以f (5) =101。
设局面S= (a1, a2, …, an) , 即S= (a1) + (a2) +…+ (an) , 则#S=f (a1) +f (a2) +…+f (an) 。如:# (3, 3, 1) =# ( (3) + (3) + (1) ) =# (3) +# (3) +# (1) =f (3) +f (3) +f (1) =11+11+1=1。对于二进制数a, b, s, 若a+b=s, 则a=b+s。
如果二进制数a1+a2+…+an=p≠0, 则必存在k, 使得ak+p
对于局面S, 若#S=0, 则S负;若#S≠0, 则S胜。如:# (1, 2, 3) =01+10+11=0, 故局面 (1, 2, 3) 负, # (1, 2, 3, 4) =001+010+011+100=100, 故局面 (1, 2, 3, 4) 胜。若S是空局面, 则#S=0。
如果局面S胜, 则必存在取子的方法S→T, 且T负。因为:若#S≠0, 则先行者必然存在一种取子方法S→T, 且#T=0。设S= (a1, a2, …, an) , p=#S=f (a1) +f (a2) +…+f (an) , 因为p≠0, 所以必然存在k, 使得f (ak) +p
如果局面S负, 则对于任意取子方法S→T, 有T胜。因为:若#S=0, 则无论先行者如何取子S→T, 都有#T≠0。先行者只能从某一堆中取若干石子, 不妨设他选择的就是第1堆。设先行者从第1堆中取了x个石子, 用T表示取完之后的局面。设S= (a1, a2, …, an) , 则T= (a1-x, a2, …, an) , #S=f (a1) +# (a2, …, an) =0, 故f (a1) =# (a2, …, an) , #T=f (a1-x) +# (a2, …, an) =f (a1-x) +f (a1) , x>0→f (a1) ≠f (a1-x) →f (a1) +f (a1-x) ≠0→#T≠0, 如图3所示。
2.5 结论
对于本游戏来说, 任意的一个初始局面S= (a1, a2, …, an) , 我们把这里的ai都看成是二进制数。令#S=a1+a2+…+an。若#S≠0, 则先行者 (甲) 有必胜策略, 否则#S=0, 这时后行者 (乙) 有必胜策略。
3 结束语
象取石子、Nim游戏这类博弈问题, 我们可以运用以下的策略来完美地解决: (1) 用一个n元组 (a1, a2, …, an) 来描述游戏过程中的局面 (状态) ; (2) 用符号#S表示局面S所对应的二进制数; (3) 用符号$ (x) 表示局面 (x) 的下一步所有可能出现的局面的集合; (4) 定义集合g (x) :设$ (x) ={S1, S2, …, Sk}, 则g (x) ={#S1, #S2, …, #Sk}; (5) 令非负整数集为全集, 集合G (x) 表示集合g (x) 的补集; (6) 定义函数f (n) :f (n) =min{G (n) }, 即f (n) 等于集合G (n) 中的最小数; (7) 设局面S= (a1, a2, …, an) , #S=f (a1) +f (a2) +…+f (an) , 采用二进制数的加法; (8) 若#S≠0, 则先行者有必胜策略;若#S=0, 则后行者有必胜策略。
参考文献
[1]胡运权.运筹学教程 (第3版) [M].北京:清华大学出版社, 2009.
[2]宿春礼, 邢群麟.活学活用博弈论[M].哈尔滨:黑龙江科学技术出版社, 2008.
[3]罗云峰.博弈论教程[M].北京:清华大学出版社, 2007.
绿色物流地产策略博弈分析 篇5
1 文献综述
目前,尽管研究绿色物流的成果众多,但是涉及绿色物流地产博弈方面的文献却不多见。以“物流地产博弈”和“绿色物流博弈”为关键词,检索中国知网, 将收集到的文献分为两类:第一类是物流地产博弈类,柳瑞禹和殷素萍讨论物流地产供需双方的博弈, 对于地产开发商,构建不同起初状态和不同复制动态的方程,将其与物流需求较大的企业进行演化博弈分析,考虑不同策略下供需双方的行为及收益,结论是认为物流地产供需双方应从长远角度出发,考虑合作剩余收益、租金和物流地产的开发成本等因素制定双赢策略,以促进物流地产的可持续发展[7]。戴航构建物流园区投资开发模式参与主体关系博弈模型,通过划分政府与企业投资物流园区范畴,提出政府和企业的资金投资的合适对象[8]。张成考运用演化博弈论对生态型港口物流园区中物流企业与政府的博弈过程进行探索,分析政府和港口物流企业双方的博弈关系[9]。第二类是绿色物流博弈类,周启蕾、胡伟和黄亚军围绕物流绿色化进程中外部成本内部化的利益分配,探讨物流系统内外各主体之间的博弈关系,具体包括企业与企业之间、政府与企业之间,企业与客户之间的博弈[10]。张颖菁和刘娟娟选取政府收益部门和物流活动中产生环境污染的企业作为博弈双方, 采用基于不完美信息条件下的博弈模型探讨污染企业增加的收益比例[11]。邓良和史言信根据中国基本国情和产业结构调整的要求,认为“十二五”期间,物流产业绿色化是一个迎合时代满足国情的正确抉择, 进而分析第三方物流企业与物流需求企业的合作博弈[12]。李韶庭结合深圳东部盐田港保税物流园区和西部前海湾保税港区两个临近海关特殊监管区的保税物流竞争合作情况,以古诺模型为基础,构建一个双寡头两阶段博弈模型,对基于服务质量和价格的保税物流博弈进行研究[13]。但是,具体对政府与物流地产商、物流地产商之间的博弈进行分析的文献很少,而这恰恰绿色物流地产策略之关键基础所在。
2 政府与物流地产开发商间的博弈
2.1 博弈情形假设
1)假设只有一个政府和一个物流地产开发商,政府与物流地产开发商均为理性的经济人,以追求利益最大化为目标,政府追求社会利益最大化,主要是收益增加和扩大就业,物流地产开发商则追求自身利益最大化;
2)政府与物流地产开发商间的博弈不受入驻物流地产的物流企业及其它外部因素的影响;
3)政府与物流地产开发商间的博弈是完全信息博弈。
2.2 博弈模型建立
博弈最初,由物流地产开发商抉择采取绿色物流策略或传统物流策略。绿色物流是指以降低污染物排放、减少资源消耗为目标,通过面向环境的物流理念和先进的物流技术,进行物流系统的规划、控制、管理和实施[14]。物流地产开发商的绿色物流策略主要侧重于建筑上的节能环保、交通上的节能减排、入驻物流企业的绿色物流行动。如果物流地产开发商选择非绿色物流策略,即传统物流策略,得到的收益为Rd0(R代表收益,d代表物流地产开发商,0代表物流地产开发商采取传统物流策略),政府获得的收益为Rg0(R代表收益,g代表政府,0代表物流地产开发商采取传统物流策略)。如果物流地产开发商选择绿色物流策略,且政府了解物流地产开发商的该种策略,则政府可能会采取两种策略:一种是积极支持物流地产开发商的策略,减免或返还物流地产开发商的土地出让金、税费和规费等,鼓励物流企业入住物流地产等,物流地产开发商的收益为Rd1(R 、d同前,1代表物流地产开发商采取绿色物流策略并得到政府支持),政府的新收益为Rg1(R 、g、1同前); 另一种是政府漠视物流地产开发商的策略,采取不闻不问策略或处处限制策略,地产开发商收益为Rd2 (R 、d同前,2代表物流地产开发商采取绿色物流策略但未得到政府支持),政府的收益仍为Rg0。此时,政府与物流地产开发商间的博弈见图1,各自策略选择见表1。
2.3 博弈结果分析
考虑国家对绿色物流的引领,行业巨头的带动, 物流企业逐渐向绿色物流迈进等,由博弈情形假设可知,物流地产开发商是以追求利益最大化为目的,采取绿色物流策略所获得的收益大于传统物流策略的收益,即Rd1>Rd0,Rd2>Rd0。此时,政府与物流地产开发商间的博弈结果存在两种可能:
当Rg1>Rg0时,说明政府支持物流地产开发商采取绿色物流策略,流地产开发商所得的收益大于漠视此策略的收益,原因可能是物流地产开发商在政府支持绿色物流策略、鼓励其他物流企业入住绿色物流地产等措施后大获成功,物流地产开发商收益增加,纳税和就业人员增加,且政府多获得的那部分收益大于它支 持绿色物 流策略所 支付的成 本,即有Rg1>Rg0。这时,按照理性经济人的假设,政府会支持物流地产开发商的绿色物流策略,那么物流地产开发商与政府的收 益组合为 (Rd1,Rg1)。又由于Rd1> Rd0,物流地产开发商会采取绿色物流策略而不是采取传统物流策略,最终实现 (Rd1,Rg1)的博弈均衡解,即策略2是最优策略组合。
当Rg1<Rg0时,说明政府支持物流地产开发商采取绿色物流策略,物流地产开发商所得的收益小于政府漠视此策略时的收益,其中一种原因可能是从短期角度看,政府支持绿色物流策略所付出的成本大于它多获得的那部分收益。但是从长期角度看,政府达到支持目的后,会减少部分支持成本,收益会逐渐弥补亏损,加之社会其他物流地产开发商效仿,进而获得更多收益,又有Rg1> Rg0,最终 (Rd1,Rg1) 又是博弈均衡解。另一种原因可能是物流地产开发商采取绿色物流策略后,虽扩大收益,但收益较以前并不显著,致使政府多获得的那部分收益小于它为支持绿色物流策略所付出的成本,又由于Rd2>Rd0, 物流地产开 发商与政 府博弈的 均衡解为 (Rd2, Rg0)。这需要政府加大对物流地产开发商的支持, 同时物流地产开发商要扬长避短、去粗取精,完善绿色物流策略。如此一来,最后仍然可以实 现 (Rd1, Rg1)的最优解。
2.4 博弈模型运用
一个物流地产开发商选择传统物流策略,其收益表现为通过库房/货场租金、办公楼租金、各种增值费、物业管理费等。假设其它收益忽略不计,以库房/ 货场租金为主要收入来源,计算物流地产开发商选择传统物流策略的收益。根据中国物流园区发展报告[15]的全国物流园区占地规模图,通过计算可得全国物流园区平均占地规模约s=3.283平方千米,其中占地规模约有λ1=50% 出租;根据物流园区仓储租金价格图,通过计算可得物流园区平均仓储租金价格为p=22.23元/平方米·月;则物流地产开发商通过出租库房/货场的主要收入为:Rd0=p×(s×λ1) ×m = 22.23× [(3.283×106)×50%]×12 = 437886540元,即年收益为43 788.65万元。再根据中国物流园区发展报告(2013)[16]的全国物流园区收益图,通过计算可得政府从物流园区获得的平均收益约r=Rg0=2911.04万元。物流地产开发商采取绿色物流政策主要体现于绿色建筑方面,根据《绿色建筑补贴谨慎开局》[17],2013年4月山东省财政厅会同住建厅研究制定的绿色建筑发展财政奖励政策,具体奖励标准是一星级15元/平方米、二星级30元/平方米、三星级50元/平方米,并根据技术进步、成本变化等因素调整年度奖励标准。假如物流地产能达到一星级绿色建筑标准,可获得p1=15元/平方米的奖励,但物流地产开发商因绿色建筑材料比一般材料昂贵而多支付约p2=10元/平方米的成本,再假设全国物流园区平均占地规模约 λ2=65% 面积达到一星级绿色建筑标准,通过计算可得:Rd1=s×λ2× (p1-p2)+Rd0= (3.283×106)×65% ×(15-10) +437886540=448556290元,即44 855.63万元,在政府支持物流地产开发商实行绿色物流政策,忽略不计物流地产商因此种策略多带来的库房/货场出租面积和平均仓储租金价格的上升,物流地产开发商收益已经提升至44 855.63万元。政府此举措会引致积极的环境效应和社会效应,按照政府从物流地产开发商的物流园区获得的平均收益与物流地产通过出租库房/货场的主 要收益比 值 λ3= Rg0/Rd0 = 2911.04/43788.65=6.65% ,绿色物流地产引来更多的入驻 企业,政府收益 相应增加,约为Rg1 = Rd1×λ3=44855.63×6.65% =2982.90万元。假如政府采 取不闻不 问策略,政府的收 益为Rg0 = 2911.04万元,而物流地产开发商却因绿色建筑材料比一般材料昂贵而多支付约p2=10元/平方米的成本,其年收入 为Rd2 = Rd0 -s× λ2× p2= 437886540-(3.283×106)×65%×10=416547040元,即41 654.70万元。具体见如图2模型。
分析模型:首先,Rg1 = 2982.90万元大于Rg0=2911.04万元,说明政府支持物流地产开发商采取绿色物流策略,物流地产开发商所得的收益大于政府漠视实施绿色策略时的收益,则政府会支持物流地产开发商的绿色物流策略。然后,轮到物流地产开发商决策,44 855.63万元大于43 788.65万元,物流地产开发商会用绿色物流策略而不是用传统物流策略。最终,博弈实现 (44 855.63,2 982.90)的博弈均衡解。
3 物流地产开发商间的博弈
3.1 博弈情形假设
1)假设目前只有甲乙两个物流地产开发商参与博弈,每一个物流地产开发商均为理性的经济人,以追求利益最大化为目标;
2)物流地产开发商间的博弈不受进入物流地产的物流企业及其它外部因素的影响;
3)物流地产开发商间的博弈是完全信息博弈;
4)两个物流地产投资开发企业相互独立。
3.2 博弈模型建立
若甲乙两个物流地产开发商对绿色物流策略理解不深,采取传统物流,获得的收益为R0。假设绿色物流策略是政府支持的策略,政府给予一定支持, 物流地产开发商的收益为Re,相反,采取传统物流策略的物流地产开发商不仅享受不到绿色物流策略带来的好处,反而会因为破坏环境、治理和保护环境等支付一定的成本Rc 。当甲乙两个物流地产开发商均采取绿色物流策略时,甲乙收益组合为 (R0+ Re,R0+Re);当甲采取绿色物流策略,乙采取传统物流策略时,甲乙收益组合为 (R0+Re,R0-Rc); 当甲采取传统物流策略,乙采取绿色物流策略时,甲乙收益组合为 (R0-Rc,R0+Re);当甲乙均采取传统物流策 略时,甲乙收益 组合为 (R0- Rc,R0Rc)。归纳得,博弈模型见表2。
3.3 博弈结果分析
由博弈模型可见,假如甲物流地产开发商选择采取绿色物流策略,获得收益为 (R0+Re),由于R0+ ReR0-Rc,则乙也会选择采取绿色物流策略以获得更大的收益 (R0+Re);假如甲物流地产开发商选择采取传统 物流策略,获得收益 为 (R0-Rc),由于R1+ReR0-Rc,则乙仍会选择采取绿色物流策略获得更大的收益 (R0+Re),与甲相反;同理分析可知,当乙先选择时,无论选择什么,甲都会选择采取绿色物流策略。归纳之,甲乙均选择采取绿色物流策略是最优均衡解,其收益组合为 (R0+Re,R0+Re)。
3.4 博弈模型运用
参考前面2.4,物流地产开发商通过出租库房/ 货场的主要收益为R0=Rd0=43788.65万元,政府通过绿色物流策略的奖励使物流地产开发商的收益为Re=Rd1-Rd0=s-×λ2×(p1-p2)= (3.283×106)×65% × (15-10)=10669750元,即1 066.98万元。假设破坏、治理和保护环境的投资占固定资产投资约λ3=2.2%[18]。物流地产年固定资产投资约f =60000万元,则Rc =f×λ3=60000×2.2% = 1320万元,得到表3模型(单位:万元)。
由模型可见:首先,甲物流地产开发商先做决策, 44 855.63万元42 468.65万元 ,说明甲物流地产开发商采取绿色物流策略所得收益大于采取传统物流所得收益,故甲采取绿色物流策略。然后,轮到乙物流地产开发商决策,44 855.63万元42 468.65万元 , 故乙物流地产开发商也会选择绿色物流策略而不是采取传统物流策略;最后,博弈最终实现 (44 855.63, 44 855.63)的博弈均衡解。
4 结论与建议
通过对物流地产项目中政府与物流地产开发商间的博弈分析、物流地产开发商之间的博弈分析,发现无论从政府角度还是物流地产开发商角度,采取绿色物流策略均为最优决策。基于以上博弈分析,给出绿色物流地产建设开发的建议:
1)政府应该制定负面清单、权力清单和责任清单,做好管理和服务工作,支持物流地产开发商积极实施绿色物流策略。通过税收土地出让金和相关规费的减免等开展绿色行动,同时约束和管制非绿色行为,以推动绿色物流地产的发展。
2)物流地产开发商自身积极实施绿色物流策略。 积极建设绿色物流地产文化,宣扬绿色地产和绿色物流地产理念,倡导绿色物流地产行动,打造绿色物流地产;优先使用绿色环保材料用于建筑,如太阳能光伏发电和日光照明灯,推广节能减排装置,倡导绿色运输、配送、仓储、包装等,打造绿色园区。
混合策略博弈 篇6
2010年以来, 从升息到提高存款准备金率, 再到限贷、限购, 从经济政策到行政政策, 从抑制需求到增加供给, 中国政府对内地房地产行业实施了多次宏观调控。与往年政府行为不同, 近几年的房地产调控措施紧盯市场变化持续出台政策, 力度不断加大并一直延续至今。调控政策的密度、严厉程度超出市场预期, 特别是要求各地方政府明确提出“房价控制目标”, 极大改变了房地产市场相关行为者预期, 特别是投机性投资需求得到显著抑制。另一方面, 提高二套房首付、加紧营业税征收等政策也极大提高了房产投资者的资金成本和未来的交易成本, 这必将增加投资性购房的获利风险。
本文拟通过对房地产业相关者的行为进行博弈分析, 包括完全信息静态博弈 (完全且完美信息动态博弈, 中央政府与单个地方政府间的博弈) 和重复博弈 (基于静态和动态博弈, 加入重复博弈条件后, n个厂商进行多次博弈, 中央政府与多个地方政府之间的博弈) , 研究其背后的决策目的, 为我国房地产行业的持续稳定健康发展提出有益建议。
二、完全且完美信息动态博弈
完全且完美信息动态博弈以下列基础假设为前提, 主要研究中央政府与地方政府及厂商之间的博弈关系, 以此找准政府监管的突破口, 稳定房地产业的健康发展。
(一) 此博弈中假定中央政府不只是关注房地产业所带来的财政收入, 更关注房地产业所带来的社会效用, 而地方政府的政绩与财政收入直接挂钩, 因此地方政策主要由财政收入主导, 所谓“上有政策, 下有对策”, 如没有强力制约必然导致地方政府抬高房价, 激化社会矛盾。房地产商的利益来源于地方政府对待房地产的态度, 因此此处可将地方政府和房地产商合并为同一博弈主体, 并假设目前只有一个地方政府和一个中央政府以便模型分析。
(二) 中央政府和地方政府的政策不可能同时出台, 在时间上具有一定滞后性, 而就一般而言中央政策先于地方政策, 因此此处假定地方政策就中央政策进行调整。此处地方政府的对策简化为地方政府积极配合中央政策或是消极配合中央政策, 中央政府对其消极配合有惩罚和不惩罚两种对策。
基于以上假设可作出下列动态博弈模型:
如果地方政府积极配合中央政策M (图中M为执行参数) , 那么地方政府的得益为土地收益U减去按土地收益的比例上交中央的应付款项αU, 而中央增加了一部分财政收入αU的同时, 由于政策得到落实带来的社会效益βM, 其中β为政策的效用力度。
而如果地方政府消极配合, 则中央会选择惩罚与不惩罚两种措施。倘若不惩罚, 地方政府会在收入土地收益的同时增加一笔额外收入B, 而中央政府则会减少λM的社会效益, 其中λ为政策失效时的影响力度;倘若惩罚, 地方政府会因此缴纳罚金A, 中央政府在惩罚的同时会投入一定的监管资金C。
由上述博弈模型不难看出, 如果中央政府不惩罚地方政府对中央政策的消极配合, 在不考虑财政损失的情况下会减少相当一部分的社会效益, 而政府的职责是维持经济与社会的总体稳定, 因此必须加强监管以惩戒地方政府的消极对待。而惩戒的力度体现在罚金上, 此部分罚金要作为转移支付抵消因此而减少的社会效用和监管成本, 在数值上体现为:
三、重复博弈
重复博弈主要基于静态博弈与动态模型的假设, 在条件上给予一定扩充, 从一个更为广的角度分析房地产业各博弈方之间的关系。
我们知道, 一个国家仅有一个中央政府, 地方政府数量较多但已基本固定不变, 而房地产商的数量却是随着市场的变化而变化的, 因此上述假设模型仅能从某一角度解释房地产业中的问题。由于地方政府及房地产商的数量庞大, 中央如果逐个监管虽然可以保证总体的稳定运营, 但其所造成的高额监管成本和大量的资源浪费必会对社会起到反作用。
就本文静态博弈的例子而言, 根据古诺模型可得出, 在没有市场干预的情况下, 即便施加重复博弈的条件, 地产商1和地产商2之间仍会形成双寡头囚徒困境, 同时不突破的不稳定情况也不会发生。值得注意的是, 如果推广到n个地产商单独博弈的情况时, n数值越大, 总供给越多, 总利润越少, 因此政府调控在n个地产商的市场条件下显得更为重要。由于此模型同理于静态博弈, 此处笔者不再论证。
就本文动态博弈的例子而言, 在重复博弈中地方政府会知道中央政府碍于监管成本, 不会在惩戒力度上面面俱到。假设共有n个地方政府, 其中中央政府每期抽样监督x个, 第i个地方政府Gi的土地收益为Ui, Mi为地方政府Gi对政策的执行参数, C为每监督一个地方政府的单位成本。博弈模型如下所示:
其余参数动态博弈中都已界定此处不再重复。
假设各地方政府理性程度相当 (若消极配合则同时消极配合, 积极配合则同时积极配合) , 则上图可理解为n个地方政府中有x个在当期监管中被发现违规并加以惩戒后, 地方政府加总收益 (有负有正) 与中央政府收益之间的关系。如果地方政府消极配合受到惩罚, 则其将缴纳罚金A, 政府财政收入增加A;如果地方政府消极配合未受到惩罚, 则地方政府额外收入B, 中央不增加财政收入。因为政策受到消极对待所以社会效用必然减少ΣλMi, 监管成本C固定不变, 共有x个政府受到监督因而产生x C的监督成本。
从上述博弈模型可以看出, 只有当地方政府消极配合时的政府罚金作为转移支付可以抵消因此而带来的负面社会效应和监督成本时, 惩戒才会有成效, 在数值上体现为:
进一步简化:
如果能通过统计确定减少的社会效用及所需的监管成本, 则监管数量和罚金间的关系可表示为:
上述公式揭示了罚金和监管数量之间的数量关系, 这就要求当权者在制定惩戒力度和监管范围时需遵循一定的数量规律。
四、结论与建议
本文通过建立基本假设模型求解了房地产之间的寡头博弈、政府财政货币政策与政府干预市场对房地产业的影响、中央与地方政府就房地产政策执行的博弈以及重复博弈条件下中央政府、地方政府、房地产商之间的博弈, 探讨其形成的原因, 得出下列政策建议:
(一) 国家发展房地产业不能只从宏观上进行扩张性房地产政策, 必须进行市场干预使得社会资源有效利用, 地产商之间合理竞争。
(二) 中央政府必须注意惩戒地方政府消极对待中央政策的力度, 综合考虑罚金、监督成本、政策积极执行时正效益与消极执行的负效益等因素, 促进房地产业健康发展, 维持社会与经济的双重稳定。
参考文献
[1]王勇.房地产调控政策下相关者行为的博弈分析[J].重庆科技学院学报, 2012, (06) :95-97.
[2]陆效平, 孙伟.博弈论与地方政府间土地政策的竞争性选择[M].国土资源科技管理, 2008, 25 (3) :107-111.
[3]周斌.房地产政策中的博弈[J].市场周刊 (理论研究) , 2012, (08) :27-28.
[4]王珊, 万龙.房价调控中的利益博弈—以地方政府执行中央政策为视角[J].法制与经济, 2011, (09) :215-216.
[5]王君, 王大伟.基于博弈论的房地产政策研究[J].金融经济, 2010, (09) :100-101.
[6]李英, 张红日, 田雨.基于博弈论的理论探求经济适用房政策失误之根源[J].建筑管理现代化, 2006, (04) :12-14.
[7]冯姗姗, 王望珍, 刘淳.经济适用房政策实施的博弈分析[M].建筑管理现代化, 2008, (04) :5-7.
谈“博弈论”的策略研究 篇7
“博弈论”中的经典案例
1.囚徒困境
两个人由于被怀疑犯罪而被捕。起诉官却苦于没有证据, 为了急于让这两个人坦白, 就把两个犯人分开, 并对每个犯人说:“如果你坦白, 而你的同伙没有, 我可以保证给你减刑至6个月, 同时根据你的坦白你的同伙被判10年徒刑。但是, 如果你们两个同时坦白, 你们每人将被判3年徒刑。”此时, 这两个犯人知道, 如果他们都不坦白, 因为没有证据而只能以轻罪审判他们, 为此, 他们会坐2年牢。
对于两个囚徒总体而言, 他们设想的最好的策略可能是都不交代。但任何一个囚徒在选择不交代的策略时, 都要冒很大的风险, 一旦自己不交代而另一囚徒交代了, 自己就将可能处于非常不利的境地。对于囚徒A而言, 不管囚徒B采取何种策略, 他的最佳策略都是交代。对于囚徒B而言也是如此。最后两人都会选择交代。因此, 囚徒困境反映了个体理性行为与集体理性行为之间的矛盾、冲突。
2.智猪博弈
假设猪圈里有一大一小两只猪, 猪圈的一头有一个猪食槽, 另一头有一个控制猪食供应的按钮, 揿一下按钮会有10个单位的猪食进槽。若小猪去揿, 大猪先吃, 大猪可吃到9个单位, 小猪揿好后奔过来, 则只能吃到1个单位;若大猪去揿, 小猪先吃, 小猪可吃到6个单位, 大猪吃到4个单位;若同时去揿, 奔过来再同时吃, 大猪可吃到7个单位, 小猪吃到3个单位。在这种情况下, 不论大猪采取何种策略, 小猪的最佳策略是等待, 即在食槽边等待大猪去揿按钮, 然后坐享其成。而由于小猪总是会选择等待, 大猪无奈之下只好去揿按钮。这种策略组合就是名闻遐迩的“纳什均衡”。它指的是, 在给定一方采取某种策略的条件下, 另一方所采取的最佳策略。经济学的最基本的假设就是经济人或理性人的目的就是为了效用最大化, 参与博弈的博弈者正是为了自身效用的最大化而互相争斗。参与博弈的各方形成相互竞争相互对抗的关系, 以争得效用的多少决定胜负, 一定的外部条件又决定了竞争和对抗的具体形式, 这就形成了博弈。
沃尔玛连锁店是美国一个极为成功的低价零售商, 它的成功在零售商业中显得非常不寻常。在20世纪六七十年代的美国, 由于现有企业的急剧扩张以及新企业的进入使廉价零售业的竞争极为激烈, 很多大的连锁店接连破产, 但是, 在此期间沃尔玛则不断地扩张, 并且他的利润也不断地提高。为什么沃尔玛成功而其他企业失败呢?关键在于它的扩张策略。当时大城镇中的廉价商店相互竞争, 利润越来越低, 但是在较小的城镇中却没有这类竞争, 沃尔玛进入了这样的小镇, 小镇只能维持一个零售商, 从而这个店成为垄断商, 而不用顾忌其他大连锁店的竞争。沃尔玛处于一种预防性博弈的状况中, 其报酬矩阵如下:
这个博弈有两个纳什均衡:左下角和右上角。哪个均衡成为现实则取决于谁先进入。这里沃尔玛的谋略是预防性德尔决策——在任何商家之前它在其它小镇里已建造了商店。
生活中的“博弈论”
假设你 (Y) 与竞争者 (C) 计划今年暑假在某个海滩上买饮料。建设这海滩长达300米, 并且假设海滩上的人均匀分布。你与竞争者卖的是相同的饮料, 并且价格也相同, 所以顾客愿意到最近的摊位买饮料, 你会在什么位置卖饮料?你认为你的对手会在什么地方设摊位?
分析:假定你的对手选位在A点上, 这时, 你不应该选位在中央, 你应该把你的摊位移动到很接近A的左方。这样你可以独自占领A的市场, 而与C竞争其余的市场, 这当然不会是均衡点, 因为你的对手会把他的摊位移到你的左边。不难发现你与你的竞争对手会在相同的位置设置摊位。
博弈论是一个强有力的分析工具, 现在它不仅在经济学领域得到广泛应用, 在军事、政治、商业征战、社会科学领域以及生物学等自然科学领域都有非常重大的影响, 工程学中如控制论工程也不少应用。现在它与信息经济学紧密联系, 如信号游戏、拍卖形式、激励机制、委托代理理论等博弈无处不在, 博弈就在我们身边。
摘要:在经济学史上曾经发生过三次重大的革命, 分别是“边际分析”革命, “凯恩斯”革命, 和“博弈论”革命。博弈论与信息经济学的产生与发展引发了一场深刻的经济学革命, 因为它代表着一种新的概念, 新方法论和一种全新的思想。
关键词:博弈论,纳什均衡,囚徒困境,智猪博弈,沃尔玛
参考文献
[1]迈尔森, 《博弈论:矛盾冲突分析》北京, 中国经济出版社。2001
[2]迪克西特, 奈尔伯夫, 《策略思维-商界、政界及日常生活中的策略竞争》北京, 中国人民大学出版社。2002
[3]米勒, 《活学活用博弈论:如何利用博弈论在竞争中获胜》北京, 中国财政经济出版社。2006