理性博弈

2024-10-26

理性博弈(共8篇)

理性博弈 篇1

0 引言

博弈论是1980年代以来经济学中发展最迅速和影响最大的分支学科。在短短的20年时间里, 博弈论从一种不为一般经济学家知晓的应用数学理论, 一跃变成主流经济学最核心的内容, 成为很多经济学家的基本分析工具和共同语言。但是, 博弈论在获得巨大成功的同时, 也逐渐暴露出它所隐含的一些问题, 其中对博弈论的发展威胁最大最严重的问题是它的理性基础, 即古典博弈论假设“博弈参与人是完全理性的”。

1“完全理性”的困境

“博弈参与人是完全理性的”, 这是博弈论的公设, 然而理性人假设却导致了诸多博弈困境, 这些困境主要体现为:

“完全理性”假设:

1) 个体理性与集体理性的冲突

一个熟知的博弈困境是囚徒博弈。有一天, 一位富翁在家中被杀, 财物被盗, 警察在此案的侦破过程中抓到了两个犯罪嫌疑人, 甲和乙, 并从他们的住处搜出了被害人家中丢失的财物, 但是他们都否认曾杀过人, 辩称是先发现富翁被杀, 然后只是顺手牵羊偷了点东西。于是警方将两个人隔离, 分别关在不同的房间进行审讯, 由警察和他们两个人单独谈话。警察说:“由于你们的偷盗罪已有确凿的证据所以可以判你们一年的刑期。但是, 我可以和你们做个交易。如果你单独坦白杀人的罪行, 我只判你半年的刑期, 但是, 你的同伴要被判十年。如果你拒不坦白, 而你的同伙坦白, 那么你将被判十年的刑期, 而他只判半年的刑期。但是, 如果你们两个人都坦白交代, 那么, 你们都将判五年的刑期。”

众所周知, 这个经典博弈案例的结果是双方从个人利益最大化出发, 都选择坦白, 都判五年的刑期。

与囚徒困境类似的案例还有“公共地悲剧”, 囚徒困境与公共地悲剧所反映的是个体的理性行为产生的集体的不合理性行为, 体现了个体理性与集体理性的冲突。

2) 过程理性与结果理性之间的冲突

有这样一个动态博弈———A、B两个人分100元钱。规则规定:A提出方案, B对之进行表决。如果B对A提出的方案表示同意的话, A、B就按照A提出的方案进行分配, 如果B不同意A的方案, 那么A和B均将一无所有。这是一个完全且完美信息动态博弈 (dynamic game with perfect and complete information) 。让我们分析这个过程。

A提出方案时, 他知道B是理性人。B的行为是可被A预测的。A将提出这么一个方案:A和B的所得比例为99.99:0.01, 即给B留1分钱, 而将其余99元9角9分留给自己。此时B面临“同意”和“不同意”的选择:如果B“同意”, B所得为1分钱;如果B“不同意”, 他将一无所得。理性的B将选择“同意”———这个选择是A所能够预测的。

因此在“最后通牒博弈”中, 理性的B只能得到1分钱!而A正是根据B的理性的选择而使自己利益最大。当然这不是实际情况, 有博弈论专家对这个问题进行实验研究 (在经济学中实验研究已成时尚, 2002年诺贝尔经济学奖获得者卡尔曼是实验经济学研究的先驱) 。根据宾谟 (K Binmore) , “实验结果呈现多样化, 但是参与人A提出的方案很可能在50:50附近;而对参与人B而言, 如果其分配的数额不少于三分之一, 他将趋向于接受。”

现在, 我们假定B具有某种程度的非理性。他会向A发出威胁“如果你不给我足够的份额, 我将不同意。”A知道B确实不是完全理性的人。A想, 如果不给B足够数额的钱, B将不同意。因此, 在提出分配方案时, A会考虑B的非理性的程度。一个极端的情况是, 如果A是理性人, 而B极端非理性, 那么一个可能的分配方案比例将是0.01:99.99。即A得到1分钱, B得到99.99元!

这个例子中, 我们看到, 人的理性程度与其所得是呈反比关系的。在博弈论中理性人是努力使自己的收益最大的人, 而在最后通牒博弈中, 越理性的人得到的利益越低。

理性人假设导致如此多的困境, 而这些困境好多与实际相违背。博弈论想要作为一门科学发展下去, 除了能够用它的理论解释现实世界中的问题, 还要能够对个人或团体作出正确决策有理论指导。而单纯的假设“博弈参与人是理性的”, 显然不能够做到这一点。

2 完全理性的修正———有限理性下的博弈分析

20世纪80年代以后, 实验博弈和演化博弈进入博弈论, 实验博弈论用实验研究策略行为的一般原理, 而演化博弈则将达尔文的生物进化论引入博弈论, 它假定参与人是有限理性的, 由此与此前的假定人是完全理性的古典博弈论形成区别。

有限理性的概念最初是阿罗提出的, 他认为有限理性就是人的行为“既是有意识的理性, 但这种理性又是有限的”。而“有限理性”概念的主要提倡者是诺贝尔经济学奖得主西蒙 (Simon) 。西蒙认为有限理性的理论是“考虑限制决策者信息处理能力的约束的理论”。

有限理性博弈分析的关键是确定博弈主体学习和策略调整的模式, 或者说机制。由于有限博弈主体理性层次的多样性, 使得博弈主体的学习和策略调整的方式和速度相差甚远, 要对有限理性博弈做出有效的分析预测, 必须发展适合分析博弈主体的学习和策略调整过程, 适合分析这种学习和动态调整过程中的稳定性, 必须用不同的机制来模拟博弈主体的策略调整过程。

目前, 采用较多的两种分析机制:一种是理性层次较高、学习能力较快的群体, 其分析机制是“最优反应动态”;而对于理性层次较低、学习能力较差的行为主体, 相应的分析机制是“复制动态过程”。事实上, 不仅不同博弈的博弈主体的理性和学习能力有差异, 需要多种动态机制来模拟, 甚至同一个博弈中的不同博弈主体在理性方面也会有较大差异, 同样需要不同的动态机制来描述和分析。所以, 生物进化中生物性状和行为特征动态变化过程的“复制动态”, 在有限理性博弈分析中正是模拟有限理性博弈主体学习和调整策略过程最主要的动态机制之一, 而生物进化理论所具有的在动态调整过程中恢复或者达到的稳健性均衡———“进化稳定策略”, 恰是有限理性博弈分析中最核心的均衡概念。

正因为上述有限理性博弈分析与生物进化理论的这种关系, 所以这种博弈分析理论也称为“进化博弈论”或“经济学中的进化博弈论”。下面分析这个鹰 (H) —鸽 (D) 进化博弈模型。在一个生态环境中的一群动物, 可以采用两种策略一鹰策略和鸽策略, 围绕着有限的生存资源进行博弈。其中的鸽策略 (D) 是指比较温顺, 面对强敌就逃跑的策略, 而鹰策略 (H) 是指比较强硬, 碰到对手就一直与对方战斗, 直至对方逃跑, 或自己受伤的策略。V代表双方争夺的利益, C是争夺中失败一方的损失。

这个博弈模型的得益矩阵表示如表1:

可以看出, 如果双方都采用鹰策略, 那么双方获胜和失败的概率都是1/2, 因此各自的期望利益都是V—C/2;如果一方采取鹰策略, 另一方采取鸽策略, 则采取鹰策略的一方获得全部的V, 采取鸽策略方得0;如果双方都采用鸽策略, 那么双方能够分享利益或各有一半机会获得利益但没有损失, 因此各有V/2单位得益。

设战略分布已知, 即集体内采取鹰策略的比率为P, 采取鸽策略的比率为1-P, 则采取鹰策略的个体的期望收益为:EU (H) =p (V-C) /2+ (1-p) V;采取鸽策略的个体的期望收益为:EU (D) =p (1-p) V/2。

当V>C时, 无论P为多少, EU (H) >EU (D) , 因而鹰策略为支配策略, 所有个体均会采取鹰策略。这也是惟一的一个纳什均衡, 但它不是帕累托最优的均衡, 类似于囚徒困境。

当v<C时, 情况要视P的大小而定:

(1) 当P<P﹡时, EU (H) >EU (D) , 采取鹰策略者将获得更高收益, 采取鹰策略的个体数目将会增加;

(2) 当P>P﹡时, EUH<EUD, 采取鸽策略者将获得更高收益, 采取鸽策略的个体数目将会增加。

这里, P﹡为稳定地采取鹰策略的个体占总体的比例, 可以证明P﹡=V/C。所以, 当我们从最佳响应动力的角度出发, 社会中的策略分布无论从哪一点出发, 采取鹰策略的个体比率最终都将收敛到P﹡上来, 从这个意义上说, P﹡具有进化稳定性。

上述进化博弈分析方法, 可用来分析由有限理性博弈主体组成的群体成员的策略筛选、演进, 特别是各个策略在群体成员采用频率、比例意义上的动态稳定性;研究有限理性的博弈主体长期通过学习和模仿调整策略最终会达到的策略频数意义上的均衡及其效率意义;在长期意义上或者对已经延续了相当长时期的问题, 也可用于对相关问题的预测。这种进化博弈分析对完全理性博弈分析的纳什均衡也有一种检验和筛选作用。进化稳定策略是纳什均衡的一个精炼概念, 进化稳定策略必然对应完全理性博弈中的纳什均衡, 包括纯策略纳什均衡和混合策略纳什均衡, 但完全理性博弈的纳什均衡在进化博弈中并不一定是进化稳定策略。更重要的是, 虽然完全理性是唯一的, 但有限理性却有多种情况和层次。对学习速度较快的小群体有限理性博弈主体的动态策略调整, 描述他们的进化博弈过程的有效动态机制主要是“最优反应动态”。而在最优反应动态中还存在各博弈主体究竟是对哪个范围的其他博弈主体的策略进行反应, 是对其他博弈主体的前期策略进行反应还是对过去的平均策略进行反应等的区别。事实上, 进化博弈的动态策略调整机制是很多的, 究竟采用哪种应该根据对具体问题中博弈主体的理性和行为方式的判断而定。

3 结论

由于对理性的假设, 博弈论的发展受到了影响, 引来了诸多的博弈论困境。于是有限理性应运而生, 通过对目前有限理性的发展和现状的分析说明, 我们可以看出它的出现给博弈论的发展带来了曙光。“有限理性”的博弈主体往往不能或不会采取完全理性条件下的最优策略。博弈主体间的策略往往是通过学习调整的结果, 而不是一次性选择的结果, 并且即使达到了均衡也可能再次偏离。能够更大程度的反应现实社会人类的文化传承性对于人类做决策的影响。

摘要:“博弈参与人是完全理性的”, 这是古典博弈论的基本假设, 是博弈论发展的理性基础。但是这个假设却产生出一系列博弈困境和悖论。这促使古典博弈理论理性基础的修正-有限理性下的博弈理论诞生。完全理性和有限理性, 是划分古典博弈论和现代博弈论的分水岭。

关键词:博弈,完全理性,有限理性

参考文献

[1]潘天群.博弈论中理性人假设的困境[J].经济学家, 2003 (4) :99-104.

[2]肯·宾默尔.博弈论教程[M].谢识予, 等译.上海:格致出版社, 上海三联书店, 上海人民出版社, 2010.

[3]谢识予.有限理性条件下的进化博弈理论[J].上海:上海财经大学学报, 2001, 3 (5) :3-9.

理性博弈 篇2

双赢?双输?

2012年3月14日,腾讯创始人、董事局主席马化腾在公司业绩公布会上首次交代与投行「对赌」原因——为了把个人套现的财务安排与公司营运状况「切割」。

2009年,马化腾与投行签订了对赌协议:若两年后腾讯的股价低于67.8港元,那么投行则承担股价下跌的损失;反之,若腾讯股价高过67.8港元,马化腾则需要将自己的股份以67.8港元出售,让对方获利。

也许是互联网业的快速发展远远超过了马化腾的预期,亦或是马化腾过于谨慎,2011年3月28日,腾讯市价高达195.2港元/股。马化腾根据对赌协议,以67.8港元/股的价格向投行出售了200万股腾讯股份。在此后的两年内,马化腾以高折让减持1593万股,账面蚀近10亿港元,引起市场哗然。

马化腾「赌」输了?面对种种质疑,腾讯内部人士指出:「假设在这场对赌中赢者是马化腾,那么腾讯公司的股价势必低于67.8港元,我们可以说马化腾借助对赌成功实现了对自己股票的保值增值,但是,对马化腾持有的更多腾讯股票乃至腾讯公司来说,这样的成功又有什么意义呢?」

「事实上,对赌是一把双刃剑,本身并无成败可言。」 联想投资董事总经理李家庆说,「严格来说,对赌发生在企业上市前的私募融资领域,即企业与投资方都认同公司的价值,只是对于公司某个时点上的价格有不同的看法,大家希望达成交易,于是设立一定的价格调整机制——对赌条款。」

「仅仅作为一种双方交易价格的调整机制,为什么外界会对此有不同的看法?是因为实操中投资人、公司创业者在自我价值的判断上有差别,在信息披露方面并非公平,或者双方无法对未来的变化范围预期做出准确的判断。」

同时,在对赌市场上根本不存在一方赢一方输的问题,赢则双赢,输则双输。「因为对赌往往是以业绩作为基础,如果创业团队的业绩不能达标,往往意味着控制权的转移,但这种转移对投资人来说并无意义,彼时,创业团队的自信心已受到巨大的挫伤与打击,可以想象,创业团队不爽时,投资人也爽不到哪里去。」 李家庆说。

「更何况,大陆根本不存在成熟的职业经理人团队,投资人也就不可能将公司项目重换一个团队来进行,而对于早期的创业项目,空降一名职业经理人也不现实,所以,在对赌问题,即便是投资人赢了控制权,也不过是一个双输的结局。」私募融资律师李磊说。

对赌非「赌」

大多数以失败告终的对赌结局,以及一系列因对赌而引发的矛盾冲突,使得对赌这种做法的合理性受到严重质疑。那么既然于企业、于投资者有百害而少有利,对赌何以存在呢?

在西方,「对赌协议」被称作「企业与投资人之间建立的估值调整机制」,英文简称叫VAM。在西方资本市场,VAM几乎是每一宗投资必不可少的技术环节,目的是通过设定目标盈利水平和触发条件,避免不可预知的盈利能力风险。

「近几年来,大陆市场对对赌有着很大的误读,其实,对赌并非是『赌』,没有一点赌的成分,它需要企业、投资人非常理性地看待业绩能力,同时,对赌协议是在没有什么根据的时候才引用的,根本不需要那么重视对赌、什么都赌一把。」 国际大律师辜勤华坦承。

「在国外,对赌条款只被有限度地使用,其能够调整的范围也非常有限,一般是上下1%,超出部分利用本条款进行风险防范。它是在客观、理性、专业以及充分信任的基础上,在一定程度上起到一定的调节。」李家庆说。

然而,在漂洋过海来到大陆后,对赌的调节作用被无限放大,甚至更多地带有了投机的成分;再被带上一个「赌」字,多少在我们的潜意识里种下一种负面的情绪和情感。

「事实上,对赌协议是一个资本根本不愿意用的办法,国外也不太常用,它只是资本做大时的一个辅助,因为资本运作的好坏,关键在于风险防范机制的好坏。而对赌的运用,往往是在常规风险防范已经做完,但是双方对未来的风险还存在一些不一样的看法,如团队的好坏、经营模式的好坏等,这将直接影响到企业未来的商业表现,业绩及目标的完成,于是,引入对赌条款,对企业及经理人进行约束与激励。」辜勤华说。

「确切地说,真正的商业领域是没有对赌协议的,真正理性的资本市场也没有对赌,对赌不过是人为地追求目标、业绩、增长速度而给自己种下的恶果。」

对赌三原则

如今,在大陆的私募市场上,对赌已经不再那么流行,这一方面是因为投行认识到控制权的转移之于对赌价值并不大,另一方面是中国证监会相关政策对对赌的限制,即对赌将使上市公司的股权结构存在不确定性,因此严禁企业上市时签署有对赌协定。

「然而,投资界淡化对赌的背景在当前大陆近乎火爆的IPO市场上,投资人不用对赌就能获得很好的回报,但是,如果市场下行,投资人很可能会为了规避风险,再次引入对赌机制。」李家庆不无忧虑地说。

在李家庆看来,当前对赌不被重视是非理性的,并不是在一个理性客观评价之后,对是否运用对赌做出的安排,这是非常值得引起注意的。也恰恰基于此,李家庆阐述了「对赌」的三项原则,以引起企业界对对赌的理性看待。

首先,对赌是企业、投资人从相互的价值认同角度出发,而不能以融资成败来衡量,它不是阶段性的套现,而是要从公司长远考虑进行融资;

其次,无论是企业、投资人都应该保持理性、客观、专业,不能为了融资而融资;

再次,对赌只是技术性地调节手段,不是必须的。

「以联想投资的实践来看,通常是以投资组合来进行风险防范,在投资时,首先谈的不是价钱,也不是回报,而是业务,从业务入手,探讨企业的目标、愿景、战略路线及其规划,由此形成共同的价值认同,接下来谈价钱也就会相互理解。」

「而对于后期的风险防范,联想投资则引入了投后服务的团队,针对企业在业务、管理、财务、法律方面的问题,提供数据说明企业少犯错误。」

「所以,有时即使是阶段性地亏,只要对公司的长期发展有利,我们也做,这是投行的态度,但反过来,也暗示企业要理性、客观、从长期的角度来看待融资,动辄拿对赌协议来进行风险防范的投行,完全可以从融资名单中划掉。」李家庆说。

熟话说,「吃人家的嘴软,拿人家的手短」。投行给你资金,目的也是为了赚钱,一旦投行要求跟你签对赌协议作为投资条件之一,你就要小心了。因为真正的商业领域是没有对赌协议的,真正理性的资本市场也没有对赌,对赌不过是人为地追求目标、业绩、增长速度而给自己种下的恶果。

2011年3月28日,腾讯市价高达195.2港元/股。马化腾根据对赌协议,以67.8港元/股的价格向投行出售了200万股腾讯股份。在此后的两年内,马化腾以高折让减持1593万股,账面蚀近10亿港元,引起市场哗然。

假设在这场对赌中赢者是马化腾,那么腾讯公司的股价势必低于67.8港元,可以说马化腾借助对赌成功实现了对自己股票的保值增值,但是,对马化腾持有的更多腾讯股票乃至腾讯公司来说,这样的成功又有什么意义呢?

所谓对赌协议,是投资方与融资方在达成协议时,双方对于未来不确定情况的一种约定。

企业纳税理性的经济博弈分析 篇3

“理性经济人”是经济学的一个基本假设, 企业作为市场经营的利益主体, 其目标是追求企业经济利益的最大化。因此, 企业自然希望能少纳税甚至不纳税, 总是想方设法减轻自己的税收负担。在法制不完善的税收环境下, 这种动机往往演变为违法的偷逃税行为。随着我国税收法制建设的进一步完善和税收征管水平的提高, 偷逃税行为在一定程度上得到了遏制, 纳税人开始转向运用科学的税务筹划手段合法减轻自己的税收负担。作为不同的利益主体, 企业纳税人追求的是税后利润的最大化, 而税务机关则尽可能保证国家税款的应收尽收和及时征缴入库。因此, 企业纳税人与税务机关税收征纳的博弈客观存在, 只是在不同税收环境下两者之间的策略选择存在一定的差别。

一、企业偷逃税与税务机关的博弈分析

假定企业纳税人欲通过偷逃税手段减轻税负, 模型中只考虑税务机关行为对企业偷逃税行为的影响, 此时的博弈双方是企业和税务机关。博弈模型的建立:局中人 (1) 企业, 局中人 (2) 税务机关。博弈双方的策略:企业为偷逃税或不偷逃税也不筹划, 税务机关为税务查获或未查获。这里仍作如下假设: 偷逃税款额为T, 被税务机关查获的概率为P, 查获后应补缴税款为T, 加收滞纳金并处罚金为C32, 查获后用于寻租以减轻处罚的支出为F, 因此影响预期收益的因素有T、P、C32、F (为研究上的方便, 这里不考虑企业开展偷逃税行为的额外成本支出, 如设置两套账成本、心理成本等) 。根据假设条件分析得出企业纳税人的得益矩阵, 如图1所示[1]:

从图1可以分析得出, 纳税人的预期收益为:

U=T× (1-P) + (-C32) ×P= T (1-P) -C32×P= T (1-P) -λT×P= T[1- (1+λ) P]

其中税收处罚率λ=C32/T, 当T[1- (1+λ) P]>0, 即 (1+λ) P<1的情况下, 纳税人将获取偷逃税收益U>0, 此时企业就有了偷逃税的经济激励;但企业并不一定选择偷逃税行为, 其具体行为的选择取决于纳税人的依法纳税意识和税法遵从度[1]。

当T[1- (1+λ) P]<0, 即 (1+λ) P>1的情况下, 纳税人偷逃税收益U<0, 此时企业偷逃税行为是不经济的, 但企业不一定选择不偷逃税。这里需要考虑一个特殊因素——税务寻租, 当不存在税务寻租途径时, 由于偷逃税的预期收益小于零, 企业不会选择完全不经济的偷逃税行为;当存在税务寻租途径, 企业的具体行为选择取决于寻租支出F和逃税支出T+C32之间的关系。若F>T+C32, 则企业纳税人不会选择偷逃税行为, 若F<T+C32, 则纳税人就有了偷逃税的经济激励, 企业就有可能受利益的驱使选择违法的偷逃税行为。

具体来说, 在税收处罚率λ既定的情况下, 当查获概率P<1/ (1+λ) 时, 企业的理性纳税行为是偷逃税行为;当查获概率P>1/ (1+λ) 时, 企业的理性纳税行为是纳税遵从, 但在存在税务寻租的特殊情况下企业的纳税遵从也有可能转化为偷逃税行为。在企业偷逃税行为被查获的概率P既定的情况下, 当税收处罚率λ< (1-P) /P时, 企业倾向于偷逃税的理性纳税行为;当税收处罚率λ> (1-P) /P时, 企业倾向于依法纳税。因此, 为有效遏制纳税人的偷逃税行为, 税务部门应从两个方面着手:一是加大税收稽查力度, 二是加大税收处罚力度, 提高违法行为的查获概率和税收处罚率, 从而促使纳税人依法纳税。

二、企业税务筹划与税务机关的博弈分析

严格意义上讲, 税务筹划是符合国家立法意图的一种合法行为, 但这种“合法性”客观上还需要税务行政执法部门的“确认”, 而在这一确认过程中客观存在着税务行政执法的偏差, 使得企业税务筹划的成功与否存在很大程度的不确定性。对企业和税务机关来说, 二者之间的信息不对称主要表现在企业无法准确预测税务机关对企业税务筹划行为的认定态度, 税务机关也不可能完全掌握企业所有真实的纳税信息[2]。因此, 企业纳税主体与税务机关成为非完全信息博弈下的双方主体。

假定企业所处的环境是一个稳定的经济环境, 则企业优先选择开展税务筹划, 模型中只考虑税务机关行为对企业税务筹划的影响, 此时的博弈双方是企业和税务机关[3]。博弈模型的建立:局中人 (1) 企业, 局中人 (2) 税务机关。博弈双方的策略:企业为筹划或不筹划, 税务机关为税务稽查或不稽查。这里仍作如下假设:企业开展税务筹划的直接成本为C1, 机会成本为C2, 税务筹划被税务机关认定为违法行为的风险成本即加收滞纳金和税收处罚的金额为C32;企业税务筹划的节税利益为T;税务机关进行税务稽查的稽查成本为C。

当企业选择了开展税务筹划, 税务机关具有进行税务稽查或不进行税务稽查这两个选择。当税务机关不进行税务稽查时, 企业的收益函数为U =T-C1-C2;当税务机关进行税务稽查时, 如果认为企业的税务筹划是合法的, 此时企业的收益函数为U =T-C1-C2;如果认为企业的税务筹划是违法的, 此时企业的收益函数为U = -C1-C2-C32[4]。

由于受税收征管力量和水平的影响, 税务机关客观上并不对每个企业开展税务稽查。假设企业估计税务机关开展税务稽查的概率为P1, 不开展税务稽查的概率为1-P1;税务机关开展税务稽查的情况下, 对企业税务筹划“合法性”的认定概率为P2, 对企业税务筹划“非合法性”的认定概率为1-P2, 则企业开展税务筹划的期望收益为:

U = (T-C1-C2) × (1-P1) + (T-C1-C2) ×P1×P2 + (-C1-C2-C32) ×P1× (1-P2) , 企业不开展税务筹划的期望收益为:U = 0。

(一) 税务机关的策略选择

尽管税务机关开展税务稽查的目的在于严格税收征管, 监督企业依法纳税, 现实中并不一定遵循成本收益原则, 但为了研究上的方便, 这里假定税务机关也是理性经济人, 在选择税务稽查时遵循成本收益原则。当企业开展税务筹划时, 税务机关开展税务稽查的期望收益为:U = -C×P2 + (T+C32-C) × (1-P2) ;税务机关不开展税务稽查的期望收益为:U = 0。当企业不开展税务筹划时, 税务机关开展税务稽查的期望收益为:U = -C;不开展税务稽查的期望收益为:U = 0。从以上分析可以看出, 当企业开展税务筹划时, 只有当税务机关的期望收益U = -C×P2 + (T+C32-C) × (1-P2) >0, 即P2< (T+C32-C) / (T+C32) 时, 税务机关应选择税务稽查策略;当企业不开展税务筹划时, 税务机关应采取不稽查策略。

(二) 企业税务筹划的一般策略选择

当税务机关开展税务稽查时, 若企业估计税务机关对企业的税务筹划认定为合法时, 企业将选择筹划策略以取得税收收益, 此时企业税务筹划的期望收益为:U =T-C1-C2, 且U>0;若企业估计被认定为违法行为时, 企业将选择不筹划策略, 此时企业税务筹划的期望收益为:U = -C1-C2-C32<0。即当税务机关开展税务稽查情况下, 企业的收益函数:

P2> (C1+C2+C32) / (T+C32) ,

此时企业应选择开展税务筹划策略;当税务机关不开展税务稽查时, 因为T-C1-C2>0, 企业应选择税务筹划策略。只有当企业开展税务筹划的期望收益:

P1× (1-P2) < (T-C1-C2) / (T+C32) ,

此时企业选择税务筹划策略。

结合前面对税务机关与企业税务筹划的策略选择分析, 只有当 (C1+C2+C32) / (T+C32) <P2 < (T+C32-C) / (T+C32) , 且P1× (1-P2) < (T-C1-C2) / (T+C32) 时, 企业应选择理性的税务筹划策略。

三、企业特殊策略选择的经济博弈分析

这里的特殊策略选择是指企业纳税人在一定的外部环境下, 为减轻税收负担所选择的合法筹划或非法筹划, 即选择合法的税务筹划行为还是违法的偷逃税行为[5]。假定在相对稳定的税收环境下, 企业欲通过一定手段减轻自身税负, 模型中只考虑税务机关行为对企业行为选择的影响, 此时的博弈双方是企业和税务机关。博弈模型的建立:局中人 (1) 企业, 局中人 (2) 税务机关。博弈双方的策略:企业为偷逃税或税务筹划, 税务机关为税务稽查或不稽查。

这里仍作如下假设:节税额为T, 税务机关的稽查概率为P3, 并假定企业的偷逃税行为一旦稽查即被查出, 而企业的税务筹划行为被认定为合法;偷逃税被查获后应补缴税款为T, 加收滞纳金并处罚金为C32, 企业开展税务筹划的直接成本为C1, 机会成本为C2。因此影响偷逃税行为预期收益的因素有T、P3、C32, 影响税务筹划行为预期收益的因素有T、C1、C2 (这里不考虑企业开展偷逃税行为的额外成本支出, 也不考虑现实中可能存在的税务寻租成本) 。为研究上的方便, 现引入三个相对率指标反映这些不同的影响因素:一是税收处罚率λ, 即λ=C32/T;二是税务筹划节税成本率δ, 即δ= (C1+C2) /T, 三是税务稽查概率P3。可以分析得出纳税人偷逃税的预期收益为:

U1=T× (1-P3) + (-C32) ×P1= T (1-P3) -C32×P3

纳税人税务筹划的预期收益为:

若U2= (T-C1-C2) × (1-P3) + (T-C1-C2) ×P3= (T-C1-C2) ;

则U1-U2= (C1+C2) - (T+C32) ×P3。

当U1=U2, 即:

(C1+C2) - (T+C32) ×P3=0时, 企业采取偷逃税行为与开展税务筹划行为取得的预期收益是一致的。对该式进行调整分析, 两边均除以T, 则得出δ- (1+λ) P3=0。在λ和P3既定的条件下, 当U1-U2>0, 即税务筹划节税成本率δ> (1+λ) P3时, 企业偷逃税行为的预期收益大于开展税务筹划的预期收益, 此时企业的最佳选择是偷逃税行为;当U1-U2<0, 即税务筹划节税成本率δ< (1+λ) P3时, 企业开展税务筹划的预期收益大于偷逃税行为的预期收益, 此时企业的最佳策略选择是开展税务筹划。因此, 企业应尽可能降低税务筹划节税成本率, 以提高税务筹划行为的经济效益。

在δ和P3既定的条件下, 当U1-U2>0, 即税收处罚率λ< (δ-P3) /P3时, 企业偷逃税行为的预期收益大于开展税务筹划的预期收益, 此时企业的最佳选择是偷逃税行为;当U1-U2<0, 即税收处罚率λ> (δ-P3) /P3时, 企业开展税务筹划的预期收益大于偷逃税行为的预期收益, 此时企业的最佳策略选择是开展税务筹划。因此, 税务机关应加大税收处罚力度, 遏制纳税人的偷逃税行为, 促进企业开展合法的税务筹划行为。

在δ和λ既定的条件下, 当U1-U2>0, 即税务稽查概率P3<δ/ (1+λ) 时, 企业偷逃税行为的预期收益大于开展税务筹划的预期收益, 此时企业的最佳选择是偷逃税行为;当U1-U2<0, 即税务稽查概率P3>δ/ (1+λ) 时, 企业开展税务筹划的预期收益大于偷逃税行为的预期收益, 此时企业的最佳策略选择是开展税务筹划。因此, 税务机关应加大税务稽查力度, 引导企业减轻税收负担的方式由违法的偷逃税行为转向合法的税务筹划行为。

四、结语

经济激励是影响企业理性纳税行为的根本诱因。偷逃税作为一种违法行为, 其可能的预期收益客观上受税务机关查获概率、税收处罚力度等因素的影响。企业税务筹划作为一项合法的理财行为, 其预期收益客观上受税务筹划节税成本率、税务机关对税务筹划的合法性认定等因素的影响。因此, 为了有效遏制或减少纳税人的偷逃税行为, 引导和促进企业开展合法的税务筹划行为, 税务机关应加大税务稽查力度, 加大对偷逃税等违法行为的税收处罚力度, 减少纳税人偷逃税的收益预期, 有效降低纳税人偷逃税行为的内在经济激励。同时, 加强税务机关人员的职业道德与业务素质教育, 从根本上堵住纳税人税务寻租的源头, 科学认定纳税人的税务筹划行为, 从而切实体现税收执法的严肃性和公正性。对于企业纳税人来说, 应在依法纳税的基础上运用科学的税务筹划手段减轻自身税收负担, 尽可能减少税务筹划成本支出, 降低税务筹划节税成本率, 以取得较好的税务筹划效果。在此基础上, 纳税人依法开展税务筹划、依法纳税, 税务机关依法征税, 这样才能真正体现和谐的税收征纳关系, 实现“税企双赢”的最佳效果。

参考文献

[1]张斌.博弈论在税收筹划中的运用[J].商业经济, 2004 (12) :56-58.

[2]张晓美.企业税收筹划研究——基于风险控制、效应的探讨[D].重庆:重庆大学硕士学位论文, 2005.

[3]王晓芳, 肖琳玲.税收筹划博弈分析[J].合作经济与科技, 2007 (2) :56-57.

[4]王晓灿.企业税收筹划理论分析与策略研究[D].天津:天津财经学院硕士学位论文, 2001.

理性博弈 篇4

随着电子商务的蓬勃发展,电子商务协议的研究越来越深入。从公平交换角度对电子商务协议已做了广泛而详尽的研究。但是对于小额交易的微支付协议,由于保证强公平性的代价比微支付金额本身还要高,从而强公平性不再有任何意义,于是理性交换的研究日渐得到重视。理性交换即参与交换的双方都以遵守协议为最优选择,若一方不遵守协议,其可能给另一方造成损失,但他却并不能因此而获利[1]。简言之,理性交换协议[2,3,4,5]不能完全保证公平性但可保证理性参与方没有理由不遵守协议。文献[6]中以扩展博弈对理性交换协议进行了形式化研究,文献[7,8]则以贝叶斯博弈对此进行了扩展和深化。但是文献[6]中假定网络通道可靠,并在建模时作为博弈参与方,使得分析过于复杂。我们应用动态博弈理论[9]对理性交换协议进行建模,建模时以区别于Buttyan模型,不将网络通道作为博弈参与方,使得模型更有效且分析更简洁,并以此模型为基础研究和分析了由Syverson提出的理性交换协议。

1理性交换协议的动态博弈模型REGM

博弈论是研究多人谋略和决策问题的理论。动态博弈是指博弈的参与者行动有先后的次序,后行动者能够观察到先行动者所选择的行动,并可以根据获得的信息采取自己认为最有利的战略。

对于一个两方参与的交换协议,为保证交换的公平性,通常选择可信第三方(TTP)来实现。但是对于小额交易的微支付协议,由于保证公平性的代价比微支付金额本身还要高。在这种情况下,理性交换协议是一种合适的选择,又因为协议参与方的执行过程是一个动态博弈过程,从而可以运用动态博弈理论对其进行建模。

1.1动态博弈模型REGM

本文约定符号π表示一个两方参与的交换协议,π1和π2分别表示协议的两个参与方各自将执行的部分。约定Mπk表示参与方k在执行πk时能接收和发送的消息集,Mπ=∪Mπk表示协议π能接收和发送的消息集,其中k={1,2},并假定网络通道是可靠的。我们以动态博弈理论为基础[9],为理性交换协议所建的动态博弈模型REGM是一个六元组<T, Q,(Ιi)iT,A, p,(≥i)iT>。

• 参与方集合T

T为协议参与方集合{t1,t2},其中t1可表示为商家,t2表示为客户。

• 参与方的行动序列集Q

Q为参与方的行动序列集合,具备以下性质:

(1) 空序列Ø∈Q;

(2) 如果q=(ak)k=1wQ且0<v<w(w是自然数),则q′=(ak)k=1vQ;

(3) 如果对任意正整数v使得无穷序列q=(ak)k=1Q都满足q′=(ak)k=1vQ,则q=(ak)k=1Q

如果行动序列(ak)k=1wQ是无穷序列或不存在动作aw+1使得(ak)k=1w+1Q,则(ak)k=1w是终点行动序列,其集合用Z表示;非终点行动序列集合为QZ。对于任意动作a,q.a表示在行动序列q后的动作a

• 参与方iT的信息集(Ιi)iT

协议参与方在协议执行过程中,获得一定信息后便可选择不同的动作来执行,用Σi(q)表示参与方i在行动序列q后已经获得的所有信息。对于任意两个行动序列qq*,如果Σi(q)=Σi(q*),则qq*属于参与方i的同一信息集Ιi

为了定义Σi(q),我们先定义两类事件:发送事件和接收事件。发送事件snd(m,j)表示参与方iT可发送消息mMπ给参与方jTi},接收事件rcv(m)表示参与方iT可接收发送给它的消息mMπ。分别用SND={snd(m,j)}和RCV={rcv(m)}表示消息发送事件集和消息接收事件集。于是参与方i在行动序列q后获得的所有信息Σi(q)定义为一个四元组即Σi(q)=<αi(q),MSi(q),MRi(q),ri(q)>,其中:

(1) αi(q)∈{true,false}是一个布尔值,当且仅当参与方i在行动序列q后还是活动的时,取值为true;

(2) MSi(q)⊆SND×N表示参与方i在行动序列q后的消息发送历史;(N是自然数集,下同)

(3) MRi(q)⊆RCV×N表示参与方i在行动序列q后的消息接收历史。

(4) ri(q)是一个非负整数,表示参与方i在行动序列q后的轮计数器值。

协议执行之前,对每一个参与方iT,αi(Ø)=true,MSi(Ø)=ϕ,MRi(Ø)=ϕ,ri(Ø)=1。

• 可选行动集合A

可选行动集合A是各参与方的可选行动集合的并集,Ai(q)表示参与者iT在非终点行动序列q后的可选行动集合,即A=∪Ai(q)。

参与方iT在任何非终点行动序列q后可选择退出协议或发送消息mMπ,用quitisendi(M)分别表示参与方i的退出动作和消息发送动作,MMi(Σi(q))表示参与方i在信息集Ιi后可发送的消息子集,定义Mi(Σi(q))={(m,j):mMπ,jTi}是消息m的接收方}。这样,参与方iT在信息集Ιi后的可选行动集合Ai(Σi(q))={quiti}∪{sendi(M):MMi(Σi(q))}。此时,可选行动集合A=∪Ai(Σi(q))。

参与方iT选择不同的动作将使得Σi(q)发生如下改变,从而可得到不同的信息集Ιi:

(1) 在任一个行动序列q后,如果一个参与方iT选行动quiti,则:αi(q.quiti)=false;MSi(q.quiti)=MSi(q);MRi(q.quiti)=MRi(q);ri(q.quiti)=ri(q);

对每一个其他参与方jTi},Σj(q.quiti)=Σj(q)。

(2) 在任一个行动序列q后,如果一个参与方iT选行动sendi(M)且M≠Ø,则:αi(q.sendi(M))=αi(q);MSi(q.sendi(M))=MSi(q)∪{(snd(m,j),ri(q)): (m,j)∈M};MRi(q.sendi(M))=MRi(q);ri(q.sendi(M))=ri(q)+1;

对每一个其他参与方jTi},如果αj(q)=true,则:αj(q.sendi(M))=αj(q);MSj(q.sendi(M))=MSj(q);MRj(q.sendi(M))=MRj(q)∪{(rcv(m),rj(q)):(m,j)∈M};rj(q.sendi(M))=rj(q)+1;如果αj(q)=false,则:Σj(q.sendi(M))=Σj(q)。

• 参与方函数p

p:{QZ}->T为计算非终点行动序列的下一个参与者。在协议未执行之前,协议参与方的行动序列集合都为空,但总有一个协议参与方会先做动作,从而不妨假定p(Ø)=t1。用P′(q,v)={tk:tkT,αtk(q)=true,k>v}表示在行动序列q后还处于活动状态且下标号大于v的参与方,kmin(q,v)表示P′(q,v)中最小的下标。这样,便可根据参与方行动序列集的性质和参与方函数来得到各参与方的行动序列集Q和每一个非终点行动序列q后的下一个参与方。

如果一个行动序列qQ并且p(q)=tv,则:

(1) 对每一个行动aAtv(Σtv(q)),q.aQ;

(2) 如果P′(q.a,v)≠Ø,则p(q.a)=tkmin(q.a,v);否则,q.a为终点行动序列,即协议执行完毕。

如果一个行动序列qQ并且p(q)=Ø,则q为终点行动序,即协议执行完毕。

• 参与方i关于终点行动序列的偏好关系(≥i)iT

一般用参与者的收益ui(q)来表示参与者的偏好关系,ui(q)是对每一个终点行动序列qZ通过计算给定的一个实数值,即ui(q)=ui+(q)-ui-(q),其中ui+(q)和ui-(q)分别表示参与者i在行动序列q后的收入和支出。对于终点行动序列集合Z 中的任何终点行动序列qq*,若参与者i关于它们的偏好关系为qiq*,则用收益表示为ui(q)≥ui(q*)。

假设协议的交换项为γt1和γt2,实值ui+ui-分别表示参与方i获得(γj)jTi}即收入和失去(γi)iT即支出并满足ui+>ui->0。若参与方i有收入而无支出,在协议博弈完成后,将会受到比收入还大的罚金FA。由协议参与方的终点行动序列便可得到各参与方的收益,从而确定各参与方的偏好关系。

1.2动态博弈模型REGM中理性交换定义

• 战略和纳什均衡

战略是参与方在非终点行动序列后从其可选行动集合中选一动作,战略组合是各参与方所选战略构成的向量组。纳什均衡是这样一个战略组合,各参与方在其他参与方战略选择不变的情况下,选这个战略组合中的战略是最优的。根据动态博弈理论中战略和纳什均衡的定义[9],在我们的模型中,其具体定义如下:

定义1 战略 参与方iT的战略si是一个函数即计算参与方i在非终点行动序列q后从其可选行动集合中所选择的动作,形式化表述为si:QZ->Ai(q)。

Si={si}表示参与方i的战略集。战略组合(si)iT或(sj,(si)iTj})是每个参与方从Si选择一战略si所构成的向量组。o((si)iT)表示参与方i执行战略组合(si)iT所得到的结果。

定义2 纳什均衡 一个战略组合(sj*,(si*)iTj})是一个纳什均衡,当且仅当对每个参与方jT的每个战略sjSj使得:o(sj*,(si*)iTj})≥jo(sj,(si*)iTj})。

• 理性交换的形式化定义

根据上述模型REGM中参与方集合及定义1和定义2,我们给出了理性交换的形式化定义。在REGM中,参与方tk选择诚实执行πtk的战略用stk*表示,k={1,2}。

定义3 协议π是理性交换的当且仅当在REGM中:

(1) 参与方战略组合(st1*,st2*)是一个纳什均衡;

(2) 若参与方存在其他战略组合(st1,st2)也是纳什均衡,则(st1*,st2*)≥t1(st1,st2)且(st1*,st2*)≥t2(st1,st2)。

2实例研究

为满足网上赛事直播按即时流量小额付款的交易要求,Syverson从理性交换角度设计了一个适合这种小额交易的微支付协议[2],它不采用可信第三方,不保证公平性,但理性参与方却没有理由不遵守协议。我们应用第1节建立的动态博弈模型对此协议进行了研究和分析。

2.1Syverson协议

A->B:m1=(dscA,e(k,itemA),w(k),sig(kA-1,(dscA,e(k,itemA),w(k))))

B->A:m2=(itemB,m1,sig(kB-1,(itemB,m1)))

A->B:m3=(k,m2,sig(kA-1,(k,m2)))

协议符号含义:A是商家,B是客户;dscA是对itemA的描述;itemi是参与方i用来交换的项目;e(k,itemA)即用对称密钥kitemA进行加密;w(k)是时限保密函数,即在一定时间内能对密钥k有效保密;sig(ki-1,μ)是参与方i用其私钥ki-1对消息内容μ进行数字签名。

2.2Syverson协议的动态博弈模型SREGM

由第1节所建模型得SREGM=<T, A,(Ιi)iT, Q,p,(≥i)iT>

• 协议参与方集合是:T={A,B};

• 参与方A的可选行动集合是:A可能发送在消息m1中加密的itemAdscA描述不一致的消息m1*, 即AA={sendA(m1*),sendA(m1),sendA(m3),quitA} ;参与方B的可选行动集合是:AB={sendB(m2),quitB};

• 参与方A的信息集ΙA:协议由参与方A开始执行,从而空集构成它的一个信息集。又根据它做不同的动作后参与方B接着做动作便构成不同的非终点行动序列,而参与方AAA选不同的动作使得ΣA(q)随之改变。

不同的非终点序列q*=sendA(m1*).sendB(m2)和q=sendA(m1).sendB(m2),使得ΣA(q*)和ΣA(q)并不相等,从而q*和q不属于参与方A的同一信息集。由于A的非终点序列只有Ø,q*和q,从而可以得知其信息集为ΙA={Ø}或ΙA={sendA(m1*).sendB(m2)}或ΙA={sendA(m1).sendB(m2)};同理,易得参与方B的信息集是:ΙB={sendA(m1*),sendA(m1)};

• 协议博弈的行动序列集 由于行动序列是双方依次做动作后所构成的,从而根据双方的可选行动集合,则可得出行动序列集合Q={Ø,quitA,sendA(m1*).quitB,sendA(m1).quitB,sendA(m1*).sendB(m2).quitA,sendA(m1*).sendB(m2).sendA(m3),sendA(m1).sendB(m2).quitA,sendA(m1).sendB(m2).sendA(m3)};

• 参与方函数p 由其定义p:{QZ}->T,又根据已得到的信息集和行动序列集Q,从而当为下述非终点行动序列时参与方函数p(q)取值为A,即:p(Ø)=p(sendA(m1*).sendB(m2))=p(sendA(m1).sendB(m2))=A;

当为下述非终点行动序列时参与方函数p(q)取值为B,即:p(sendA(m1*))=p(sendA(m1))=B;

• 参与方A关于终点行动序列的偏好关系≥A是:

sendA(m1).sendB(m2).sendA(m3)≥AsendA(m1).sendB(m2).quitAAquitAAsendA(m1).quitBAsendA(m1*).sendB(m2).quitAAsendA(m1*).sendB(m2).sendA(m3)≥AsendA(m1*).quitB;

参与方关于终点行动序列的偏好关系≥B是:

sendA(m1).sendB(m2).sendA(m3)≥Bguit1≥BsendA(m1).quitBBsendA(m1*).quitBBsendA(m1*).sendB(m2).quitABsendA(m1*).sendB(m2).sendA(m3)≥BsendA(m1).sendB(m2).quitA

2.3Syverson协议的分析

(1) SREGM的博弈树

根据上述模型的建立,整个协议的动态博弈过程可以表示为一棵博弈树。协议从商家A开始,在第一轮,A有三个可选动作即{sendA(m1*),sendA(m1),quitA},动作执行完毕,第一轮结束。第二轮由客户B开始,若第一轮,A选择动作quitA,则B不做动作,双方博弈结束,收益都为0;而A选其他动作B无法区分,所以B可选择执行动作sendB(m2)或quitB,若执行quitB,则博弈结束且其收益为0,若执行sendB(m2)完毕,则第二轮结束。第三轮由A开始,若B在第二轮选择动作quitB,则A不做动作,双方博弈结束,此时,若A在第一轮选动作sendA(m1*)其收益为-FA,选动作sendA(m1)其收益为-uA-;若B选动作sendB(m2),则A可选动作sendA(m3)或quitA,此时,只要A在第一轮选动作sendA(m1*),不管其此轮A选择动作sendA(m3)或quitA,则其收益都为uA+-FA,而B的收益为-uB-;若A在第一轮选动作sendA(m1),则当其选动作sendA(m3)时其收益为uA+-uA-,B的收益为uB+(r)-uB-,而当A选动作quitA时其收益为uA+-uA-,B的收益为-uB-。由此可得到如图1所示的博弈树。

在图1中:m1*表示A发送消息m1中加密的itemAdscA描述不一致;FA表示A发送m1*后所受罚金,在协议博弈完成后由仲裁方根据B方提供的证据确定;FA>uA+>-uA->0,uB+(r)>uB->0,r表示轮计数器值;uB+(r)表示B在第r轮后的收益,因A的对称密钥k是通过计算w(k)使得k可在一定时限内被有效保密,虽然在完成第3轮所需时间之前是保密的,但超过一定时限,保密便失效了,此时,Bk获得加密的itemA后的意义也不大了,如网络赛事直播完后才获得观看密码就没意义了,也即轮数越大,B的收益越小。 (x,y)中第一项表示A的收益,第二项表示B的收益,如(-FA,0)即第一项-FA表示A的收益,第二项0表示B的收益。

(2) 根据SREGM的博弈树对Syverson协议的分析

A来说:其收益表示的偏好关系为(uA+-uA-)>0>(-uA-)>(uA+-FA)>(-FA),其战略(sendA(m1*),quitA)和(sendA(m1*),sendA(m3))是强劣于战略(sendA(m1),quitA)和(sendA(m1),sendA(m3))的,不构成参与方A,B的纳什均衡。若A选择战略(sendA(m1),quitA),则B选择战略sendB(m2)比quitB的收益要低,也不构成参与方A,B的纳什均衡。若A选择战略(sendA(m1),sendA(m3)),则B选择战略sendB(m2)比quitB的收益要高,即有可能构成参与方A,B的纳什均衡。

B来说:其收益表示的偏好关系为(uB+(r)-uB-)>0>(-uB-),若B选战略sB=quitB,则A选择战略sA=quitA比其它战略收益要高,即(sA,sB)构成纳什均衡;若B选战略sB*=sendB(m2),则A选择战略sA*=(sendA(m1),sendA(m3))构成纳什均衡。

通过以上分析得知(sA*,sB*)是纳什均衡且o(sA*,sB*)≥Ao(sA,sB)且o(sA*,sB*)≥Bo(sA,sB),这表明Syverson协议是理性交换的。

3结语

本文在假定网络通道可靠的前提下,应用动态博弈理论对理性交换协议进行了建模,所建协议博弈模型中不将网络通道作为博弈参与方,这减少了博弈过程中因多余参与方而导致的计算和通信开销,从而使得模型更有效且分析更简洁。结合协议的动态博弈模型REGM和博弈论中纳什均衡的定义,本文对理性交换做了形式化的定义。运用此模型使得对Syverson协议的分析变得更方便和简洁,也更能直观且合理地得出Syverson协议是满足理性交换的。我们的模型是基于完全信息的动态博弈理论,由于协议的其中一个参与方存在发送或不发送一个消息的可能性,这对于另一参与方在接收之前是不确知的。从而在不完全信息条件下以及假定网络不一定可靠时,如何建立一个基于不完全信息的动态博弈理论的协议博弈模型,在这样的协议博弈模型中一个交换协议是否依然满足理性交换将是进一步研究的方向。

摘要:小额交易的微支付协议中,采用TTP以保证公平性的代价比微支付金额本身还要高,所以理性交换协议是一种合适的选择。虽然理性交换协议不能完全保证公平性,但可保证理性参与方没有理由不遵守协议。基于动态博弈对理性交换协议进行建模,根据协议博弈中纳什均衡的概念形式化定义了理性交换,并以Syverson提出的理性交换协议进行了实例研究。

关键词:理性交换,协议博弈,博弈理论,纳什均衡

参考文献

[1] Alcaide A.Rational Exchange Protocols[D].UNIVERSIDAD CARLOS III DE MADRID,Madrid,Spain, 2008.

[2]Syverson P.Weakly secret bit commitment:Applications to lotteries andfair exchange[C]//Proceedings of the IEEE,Computer Security Foun-dations Workshop,1998:2-13.

[3] Sandholm T.Unenforced e-commerce transactions[J].IEEE,Internet Computing,1997,1(6):47-54.

[4] L Buttyan.Removing the financial incentive to cheat in micropayment schemes[J].IEE Electronics Letters,2000,36(2):132-133.

[5] Alcaide A,Estevez-Tapiador J M,Hernandez-Castro J C.A multi-party rational exchange protocol[C]//R Meersman,Z Tari,P Herrero.OTM 2007,Part I.LNCS, vol.4805,Springer, Heidelberg,2007:42-43.

[6] Buttyan L,Hubaux J P,Capkun S.A formal model of rational exchange and its application to the analysis of syverson's protocol[J].Comput. Security,2004,12(3/4):551-588.

[7]Alcaide A,Estevez-Tapiador J M,Hernandez-Castro J C.An extendedmodel of rational exchang based on dynamic games of imperfect infor-mation[C]//ETRICS’06,LNCS Vol.3995/2006,Springer-Verlag,Berlin/Heidelberg,2006:396-408.

[8]Alcaide A,Estevez-Tapiador J M,Hernandez-Castro J C.Bayesian ra-tional exchange[J].International Journal of Information Security.2008,7(2):190-195.

理性博弈 篇5

一、美国金融调控机制的显著特征

即使有了金融调控的成功经验,又能借助信息网络有效揽控机制,但经济波动和金融危机的发展状况表明,美国也无法完全掌控金融变化形势。有限理性是美国政府和美国金融市场在金融调控和金融活动的最显著特征之一。也就是说,美国政府和美国金融市场对对方和自己在博弈中所采取的策略以及得益情况并非完全清楚,而且对对方博弈策略的选择过程也不是完全清楚。博弈方在博弈的过程中采取某种博弈决策的依据完全来自于对当期博弈的了解以及过往的博弈经验。具体地讲,也就是美国政府在做出监管与否的决策时,并不完全清楚当下金融市场具体的状况(也许会有很多学者不认可这一点。但是,如果仔细看看2004-2006年美联储联邦基金利率的调整情况,就会发现2年时间内,美联储对美联储联邦基金利率的调整达到17次之多。这说明:如果美国政府对金融市场的情况了如指掌,又何必在两年内连续17次将美联储联邦基金利率从1.0一直上调至5.25)。美国政府在做出决策之前,会对金融市场进行全方位的考察,以期获得足够的信息,但是尽管如此,信息仍然是不完全的或不对称的。美国政府的监管与否,力度如何,何种方式的博弈策略的选择只能依靠本身对博弈对方以及自身的信息的有限掌握和对过往博弈信息的综合。除此之外,由于经济世界的普遍联系性,美国政府在做决策的时候也会遇到更多的其他因素的干扰,例如某些利益集团的个人利益等。

这对作为美国政府博弈方的对手美国金融市场要做出某种有关金融创新的决策就更加复杂。首先,金融市场不像政府是一个机构,拥有共同的意志。金融市场能够作为一个博弈方参加到博弈中来更多地要取决于一个最基本的经济学原则——“看不见的手”。如果没有这个原则,金融市场只能是一盘散沙。参与金融市场的各个经济单位虽然不是完全理性人,但却都是经济人。正因为各经济单位对经济利润的追求,才使得“看不见的手”的经济原则能够发挥作用,金融市场才能够作为一个博弈方参与到博弈中来,金融市场作为博弈方才能够拥有共同的博弈决策偏好。和美国政府相比,美国金融市场作为博弈方参与博弈的最大的特点就是博弈方群体庞大,各微观经济单位的理性程度、偏好方式、决策目标都不尽相同。这样一个博弈组合方的整体决策的选择将非常困难。其次,和美国政府相比,金融市场作为一个博弈方进行策略选择的时候,对博弈信息的掌握有着天壤之别。金融市场上的微观群体在做出决策之前不可能对整个美国金融情况做系统的调查,只能通过自身当时所拥有的有限资源进行有限的理性分析而获得相对有限的博弈信息。通常情况下,主要还是对市场上的大群体或者某些垄断者的模仿。最后,金融市场上的微观群体本身就有强弱之分,它们所要面临的不是同一个美国政府机构机制,因为美国政府的某些措施偏好会根据它们的实力大小而有所不同。这就使得金融市场上的小群体在做决策的时候更加“迷茫”。

在次贷危机之前的美国新经济奇迹得以形成的众多原因中,美国不断创新的金融市场即是美国独有的优势之一。在以高新技术创新为主要特征的新经济中,资本市场的制度创新发挥了不可替代的作用,可以说是促进经济增长的有效率的制度创新,在美国由传统经济向新经济过渡中发挥了重要作用。

目前,理论界以及业界针对当前美国所爆发的危机来寻找危机内部的成因,他们所总结的原因涉及美国经济与金融的各个方面。学者们在对这次美国次贷危机的形成原因的讨论中,达到一个共识:危机的根源在于忽略金融监管的金融创新泛滥。由于金融创新似乎成为一柄“双刃剑”,以往的金融创新理论已经对金融监管和金融创新之间的关系做了系统详尽的论述:金融监管与金融创新其实是“一个硬币的两面”。根据我们的研究,发现金融监管的力度大小及方向就是美国金融调控的实质。根据美国长期以来的金融调控体现出来的特征,我们将美国的金融发展历程分为四个阶段:大危机之前的自由放任发展阶段、大危机之后到20世纪70年代末的分业经营阶段、80年代到21世纪初的金融创新阶段、以及随后的金融危机阶段。这四个阶段的特点可以简单的描述为:监管少、创新少;监管强、创新弱;监管强、创新强;监管弱、创新强。

二、美国金融调控机制的进化博弈模型建立

美国金融的发展过程其实就是通过金融监管与金融创新的相互博弈来完成的,政府在这个动态博弈中主导了金融监管,而市场主导了金融创新。很明显这是一个双人博弈,博弈方1为市场,而博弈方2为政府,而有着两个博弈方分别所主导的金融创新和金融监管则为该博弈的两个可选策略,并且该博弈不是只进行一次就结束了。随着时间的推移,只要美国政府存在,这个博弈将无限地进行下去。在这种情况下,这个博弈还是一个完美且完全动态博弈。

在本文所要构建的博弈模型中假设的是博弈中的两个博弈方的理性是有限的,这也非常合乎现实。有限理性意味着博弈方往往不会一开始就找到最优的策略,会在博弈过程中学习博弈,必须通过试错寻找较好的策略。有限理性也意味着一般至少有部分博弈方不会采取完全理性博弈的均衡策略,意味着均衡是不断调整和改进而不是一次选择的结果,而且即使达到了均衡也可能再次偏离。按照这个思路,人们可以很容易理解美国的金融发展已经经历的4个阶段中金融创新与金融监管之间的优势地位的反复。

既然是在有限理性条件下分析美国的金融创新和金融监管之间的博弈,那么就必须引入有限理性条件下的进化博弈模型。现将美国金融发展的4个阶段,按照各自的特征归入博弈矩阵,如表1所示。对于一个博弈而言,最重要的是这个博弈的得益。同样一个博弈,各博弈方得益不同将直接改变博弈的最终均衡策略。因此,可以美国从1947年到2007年的金融年产出的相关数据的某些特征来度量各个不同时期的博弈方1与博弈方2的不同策略的得益。金融监管的目的在于使得金融市场能够稳定的发展。因此,如果一个金融市场在发展的过程中体现出来的波动性比较大,我们则可以得出一个结论:金融监管没有起到应有的效果,金融监管的得益小,反之亦然。

注:表中各时期所对应的创新、不创新、监管、不监管并不是绝对的,只是相对力度而言。

一个国家的金融创新如果非常活跃,那么它的直接效果就是该国的金融产出比重增大。因此,如果一个金融市场在发展过程中体现出来的金融产出在GDP中的份额增大,结论就是:金融创新效果显著,金融创新的得益大,反之亦然。现将美国金融发展的4个时期金融年产出占GDP份额年均增长额权重作为各个时期的金融创新得益,将美国金融发展的4个时期的金融年产出占GDP份额的方差均值倒数的权重作为各个时期的金融监管的得益,如表2所示。

数据来源:表中各数据参照IMF金融统计数据计算得出。

值得注意的是,由于数据的可得到性和统计口径的不同,我们的数据选取是从1947 -2007年,但是并不会对我们的分析产生大的影响(由于大危机之前的美国金融市场的特征是监管少、创新少,因此我们假设其得益为0)。表2中给出的分析只包含了大危机之后到70年代末的分业经营阶段、80年代到本世纪初的金融创新阶段、以及随后的金融危机阶段。根据表2 的分析,我们得出了博弈的得益矩阵,如表3所示。

数据来源:根据表2数据计算得出。

根据博弈的得益矩阵,通过最基本的划线法,我们可以清楚地看出这个博弈中只有一个纳什均衡策略,并且是子博弈完美纳什均衡。如果是在两个完全理性的博弈方之间进行这个博弈,那么该博弈的均衡策略就应该是(监管,创新)。现在我们分析的是美国政府与金融市场之间的有限理性条件下的博弈。美国政府和金融市场主体的有限理性意味着博弈方没有追求子博弈完美纳什均衡的能力和坚持这种策略的信心,因此博弈结果往往不是上述子博弈完美纳什均衡。

假设在博弈方1位置博弈群体中,采取“创新”策略的偏好为X,那么采取“不创新”策略的偏好为1-X;同时,假设在博弈方2位置博弈群体中,采取“监管”策略的偏好为Y,那么采取“不监管”策略的偏好为1-Y。这样在博弈方1位置博弈的“创新”、“不创新”两类博弈方的期望得益U1Y、U1N和群体平均得益U1分别为:

U1Y = Y*0.56233 + (1-Y)*(-0.01822) =0.58055*Y-0.01822

U1N=Y*0.13904 + (1-Y)*0=0.13904* Y

U1=X*U1Y + (1-X)* U1N =0.12466*X*Y-0.01822*X+0.45589*Y

在博弈方2位置博弈的“监管”、“不监管”两类博弈方的期望得益U2Y、U2N和群体平均得益U2分别为:

U2Y =X*0.45166 + (1-X)*(0.40930) =0.04236*X+0.40930

U2N =X*0.45589 + (1-X)*0 = 0.45589*X

U2 = Y*U2Y + (1-Y)* U2N =-0.41353*X*Y+0.45589*X+0.40930*Y

现在分别对两个博弈方群体进行进化博弈复制动态分析,得到在博弈方1位置博弈的博弈方偏好类型比例的复制动态方程:

dx/dt=X*[ U1Y- U1]

=0.12466*X*Y-0.12466*X*X*Y+0.01822*X*X-0.01822*X

=X*(1-X)*[0.44151*Y-0.01822]

=0.44151X*(1-X)*[Y-0.04127]

≈ 0.44151X*(1-X)*[Y-0]

在博弈方2位置博弈的博弈方偏好类型比例的复制动态方程:

dy/dt= Y*[ U2Y- U2]

=-0.41353*X*Y+0.41353*X*Y*Y-0.40930*Y*Y+0.40930*Y

=Y*(1-Y)*[0.40930-0.41353*X]

=0.41353Y*(1-Y)*[0.98977-X]

≈0.41353Y*(1-Y)*[1-X]

首先对博弈方1位置博弈群体的复制动态方程作一些分析。根据该动态方程,如果Y=0,则dx/dt始终为0,这意味着所有X水平都是稳定状态;如果Y≠0,则X=0和X=1是两个稳定状态,其中Y>0(Y不可能小于0)时,X=1是ESS,如图1所示。

同样,对博弈方2位置博弈群体的复制动态方程作一些分析。根据该动态方程,如果X=1,则dY/dt始终为0,这意味着所有Y水平都是稳定状态;如果X≠1,则Y=0和Y=1是两个稳定状态,其中X<1时(X不可能大于1),Y=1是ESS,如图2所示。

进一步可以把上述两个群体偏好类型比例变化复制动态的关系,在以两个比例为坐标的坐标平面图上表示出来,如图3所示。

根据图3中所反映的复制动态和稳定性,不难看出博弈的进化稳定策略(ESS)有O(0,0)和A(1,1)两点,其他所有点都不是复制动态中收敛和具有抗扰动的稳定状态。从图3可以看出X和Y在进化博弈的过程中,最终将会收敛于两点:O与A点,O点是个很特殊的点,X与Y在这点都等于0。在这些博弈中,含义就是两个群个体通过长时间的进化和学习,最终会有可能偏好于不进行金融监管和金融创新。只要一开始博弈就完完全全落在这个点,那么从理论上讲,这种不创新也不监管策略是有可能的。不过在现实中这种情况是不会出现的。

至于两群体复制动态的另一个收敛点A点,它包含了非常重要的经济含义:只要一开始博弈双方的策略偏好不落在O点,那么经过复杂的学习、调整和进化后,最终博弈的双方的博弈策略偏好终将落在A点。也就是说,只要通过长期的进化、调整和学习,美国政府和美国金融市场最终将完全偏好于金融监管与金融创新。如果把博弈方群体的策略偏好理解成博弈方的策略行为强度的话,模型最终给出的ESS均衡解就是强创新与强监管。这与完全理性条件下博弈的子博弈纳什均衡完全一致,说明在这个问题上有限理性的美国政府与美国金融市场通过学习是能够掌握子博弈完美纳什均衡策略的。

三、美国金融调控机制的ESS分析

(一)动态周期性分析

在建立模型进行分析的一开始,本文就已经考虑到美国政府和美国金融市场的有限理性。也就是说,美国政府和美国金融市场对对方和自己在博弈中所采取的策略的得益情况并非完全清楚,而且对对方博弈策略的选择过程也不是完全清楚。博弈方在博弈的过程中采取某种博弈决策的依据完全来自于对当期博弈的了解以及过往的博弈经验。

在有限理性条件下的进化博弈中的每一个博弈方的策略偏好的不同(注意是方向的不同,而不是强弱的不同)主要根据还是对手的策略偏好。如果美国政府采取的策略偏好是强监管,那么金融市场的策略偏好在一开始将是不创新,而后会对博弈进行学习。之所以后来策略偏好会变化成创新,原因在于当金融市场进行学习博弈的时候,美国政府也在学习博弈。精炼地讲,一个博弈方的策略偏好的变化是博弈中另一博弈方的反应函数。正因为这样才会有20世纪30年代的美国经济大危机时期到之后的金融分业经营时期,再到新经济时期的结束,最后到次贷危机的爆发。各个时期在历史上的出现不是偶然,是一种必然,是美国政府与美国金融市场进行博弈的必然。

从图4中可以看出博弈决策过程的周期性,当所有的策略组合轨迹都出现在45°角的左上方时,紧跟着出现的是一段45°角右下方的策略组合轨迹。并且,它们的变化方向始终不变,都是朝着ESS稳定策略的方向运动。在图中我们会发现会有很多的波峰和波谷出现。每一个波峰或者波谷的出现代表着美国金融发展过程中的一个重大突破,繁荣或者衰落,美国经济大危机、新经济时期的到来以及目前次贷危机的爆发都是图4中的某些个波峰与波谷。它们是美国政府金融调控出现重大方向性调整的分界点。

(二)波动进化性分析

这种动态波动趋势并不是一成不变的。各个时期的波动从长时期来看将会逐渐趋于平缓,最终达到ESS组合,这就是所谓的进化。正如前面我们的模型推导出来的结果一样,最终将收敛于A点。作为博弈方的美国政府和美国金融市场能够像生物一样进行进化的关键原因在于作为博弈方的它们具有学习的能力。但是,它们的学习也只能是在有限理性的条件下进行,因此注定博弈的过程将无限延续下去(针对短期而言,是无限的。针对长期而言,是有限的)。而在整个博弈过程中,博弈双方的策略选择并不是无迹可循。

如图4所示,有限理性的博弈双方的策略组沿着途中的曲线运行。在开始阶段,轨迹的振幅相对比较大,这意味着博弈方的行为理性相对不充分。美国政府所主导的金融监管的力度,也就是金融调控的力度变化幅度非常大,而美国金融市场说主导的金融创新的力度的变化也非常大。当20世纪30年代的经济危机发生时,美国政府从危机中意识到应该对金融市场进行监管,在当时的条件下采取了非常严格的监管调控。在20世纪80年代后,美国金融市场面对严格监管了近60年的金融环境逐步采取了金融创新的策略,并且创新力度空前。这些都揭示了图4中的博弈方策略组合轨迹的振幅。

但是,并不是整个博弈过程中的各个博弈周期中的博弈方策略组和轨迹的振幅都是按照一样的幅度进行下去的。在经过前面周期的博弈之后,博弈方都对博弈过程进行了学习。之后的博弈方策略组合轨迹的振幅会逐渐变小。20世纪30年代大危机发生后,20世纪80年代后美国金融市场上的金融创新的力度和美国政府对金融的监管调控力度相比,虽然力度空前,但是还是比不上30年代后的金融监管力度的。

人们已经清楚有限理性条件下的博弈与完全理性条件下的博弈之间的区别,在于当有限理性博弈双方的策略组合与ESS组合一致时,有限理性的博弈方会由于各种原因改变自身的策略,从而使得博弈双方的策略组合又一次离开ESS组合。从图4中我们可以更加清楚地看到这一点。在图4中,不同周期的博弈中,博弈双方的策略偏好都曾收敛与(1,1),也就是(强创新,强监管)的ESS组合,但是随后美国政府与美国金融市场的决策都离开了这个完全理性的均衡策略组合。在短期中这是不可避免的,因为有限理性的博弈方需要学习博弈。但是,当博弈的过程足够长,博弈方将达到ESS组合,并不再离开它。

四、结论

在美国金融调控进化机制中,美国政府和美国金融市场,无时无刻不对自己的博弈对手的博弈策略采取反应;并且在每个博弈周期中都会学习博弈对手,从而在面对下一次博弈的时候能够采取更优的决策。从美国政府的角度来看,就是采取更优的金融调控,从而使得美国的金融市场的发展更加的平稳,波动性更小。美国政府的金融调控进化机制是美国金融能够持续发展的一个至关重要的因素。目前,美国正在经历大危机以来最为严厉的一次金融危机。学术界、金融界以及政界对这次金融危机的前景感到悲观,甚至对资本主义的信心也开始动摇。本文认为大可不必这样悲观,原因在于美国政府的金融调控进化机制的存在。美国金融市场次序必将更加的完善,金融市场结构必将更加合理,金融企业必将更加理性。

理性博弈 篇6

《博弈论与信息经济学》是张维迎教授的著作。该书从1996年第一次出版到现在已有15年, 2004年该书出了新的版本, 2009年这个新版本第9次印刷。此书在中国的影响力, 由此可见一般。

在《博弈论与信息经济学》这本书中, 有一个著名的囚徒困境的例子, 根据这个例子, 作者得出一个结论:个人理性与集体理性冲突。这个结论在1996年的旧版本和2004年的新版本上都有, 也就是说这个结论至少存在了15年。关于囚徒困境的例子, 主流经济学有如下三种观点:

(1) 指明囚徒困境中不存在理性的悖论, 但是又没有加以详细的论证和说明。持这种态度的人比较少, 英国的肯·宾默尔是一个, 其在《博弈论教程》这本书中有所说明。

(2) 明说或者暗示在囚徒困境中存在“个人理性与集体理性冲突”。持这种态度的人比较多, 袁志刚等 (2008) 、谢识予 (2002) 、肖条军 (2004) , 等等。

(3) 在囚徒困境的例子中, 完全不提个人理性与集体理性的问题。持这种态度的人比较多, 汪贤裕等 (2008) 、赵耀华等 (2010) 、吴广谋等 (2009) , 等等。

从上面的论述可知, 对于囚徒困境这个例子, 现在主流的观点还是倾向于“个人理性与集体理性存在冲突”。本文对这种观点提出质疑。

2 书中原文

本文摘录的是2004年版的书中第8-9页的原文。

例一:囚徒困境 (见表1) 。

这个例子的创造本身就部分地奠定了非合作博弈论的理论基础, 并且它可以作为实际生活中许多现象的一个抽象概括。几乎没有一本涉及博弈论的书不举到这个例子。囚徒困境讲的是两个嫌疑犯作案后被警察抓住, 分别被关在不同的屋子里受审讯。警察告诉他们:如果两人都坦白, 各判刑8年;如果两人都抵赖, 各判1年;如果其中一个坦白另一个抵赖, 坦白的放出去, 不坦白的判刑10年。表0.2给出囚徒困境的战略式表述。这里, 每个囚徒都有两种战略:坦白或抵赖。表中每一格的两个数字代表对应战略组合下两个囚徒的支付, 其中第一个数字是囚徒A的支付, 第二个数字为囚徒B的支付。战略形式又称标准形式, 是博弈论的两种表述形式之一, 它特别方便于静态博弈分析。博弈的另一种表达形式是扩展式表述, 我们后面会谈到。

在这个例子里, 纳什均衡就是 (坦白, 坦白) :给定B坦白的情况下, A的最优战略是坦白;同样, 给定A坦白的情况下, 是B的最优战略也是坦白。事实上, 这里 (坦白, 坦白) 不仅是纳什均衡, 而且是一个占优战略均衡, 就是说, 不论对方如何选择, 个人的最优选择是坦白。比如说, 如果B坦白, A坦白的话被放出来, 不坦白的话判1年, 所以坦白比不坦白好;如果B坦白, A坦白的话判8年, 不坦白的话判10年, 所以坦白还是比不坦白好。这样, 坦白就是A的占优战略。同样, 坦白也是B的占优战略。结果是, 每个人都选择坦白, 各判刑8年。

囚徒困境反映了一个很深刻的问题, 这就是个人理性与集体理性的矛盾。如果两个人都抵赖, 各判刑1年, 显然比都坦白各判刑8年好。但这个帕累托改进办不到, 因为它不满足个人理性要求, (抵赖, 抵赖) 不是纳什均衡。换个角度看, 即使两囚徒在被警察抓住之前建立一个攻守同盟 (绝不坦白) , 这个攻守同盟也没有用, 因为它不构成纳什均衡, 没有人有积极性遵守协定。

3 两点疑问

为了将问题讲清楚, 笔者需要不厌其烦的将囚徒困境的例子重新分析一遍。从书中原文给出的条件可知, A只能单独的进行理性选择, B也只能单独的进行理性选择。对于A而言, 如果B坦白, A选择坦白的支付为-8, 选择抵赖的支付为-10, 因而A会选择坦白;如果B选择抵赖, A选择坦白的支付为0, 选择抵赖的支付为-1, 因而A还是会选择坦白。由以上的分析可知, A肯定会选择坦白。同理, 对于B而言, B也肯定会选择坦白。因而, 可以得出如下结论:

A肯定会选择坦白, B也肯定会选择坦白。 (坦白, 坦白) 是A单独作出理性选择, 是B单独作出理性选择的结果。换句话说, A肯定不会选择抵赖, B也肯定不会选择抵赖。其他的三种结果肯定不会发生。

这个结论对后文的分析极其重要。

3.1 疑问一:假定肯定不存在的条件为存在, 可以吗

书中先得出一个结论:

坦白是A的占优战略, 坦白也是B的占优战略。 (坦白, 坦白) 是占优战略均衡。

然后, 又得出第二个结论:

囚徒困境反映了一个很深刻的问题, 这就是个人理性与集体理性的矛盾。

得出第二个结论之后, 再说明得出第二个结论的原因:

如果两个人都抵赖, 各判刑1年, 显然比都坦白各判刑8年好。

笔者在此想问, 这个“如果”可能存在吗?

根据书中所给出的条件, A、B两人被关在不同的房间里受审讯。因而, A肯定只能进行单独的选择, B肯定只能进行单独的选择。根据上面的分析可知, A单独进行选择, 肯定会选择坦白。B单独进行选择, 也肯定会选择坦白。也就是说, A、B两个人肯定都不会选择抵赖。这是根据已知条件可以得出的非常肯定的结果。因而, 得出第二个结论“个人理性与集体理性的冲突”的理由肯定不存在。作者在书中也说道:

但这个帕累托改进办不到, 因为它不满足个人理性要求, (抵赖, 抵赖) 不是纳什均衡。

也就是说作者自己也否定了这个理由。

既然如此, 笔者在此想问, 书中得出“个人理性与集体理性冲突”这个结论的理由何在?或者应该这样问:先假设一个肯定不存在的条件为存在, 然后根据这个条件得出一个结论, 这个结论可信吗?

笔者认为, 书中犯了一个逻辑上很隐蔽的错误, 笔者将这个逻辑推理过程分为以下四步:

(1) 先得出一个结论。

(2) 再得出一个肯定的结论。

(3) 说明得出上述这个结论的原因:假定一个肯定不存在的条件存在, 然后与第一个结论进行比较。

(4) 否定 (3) 中的不合理假定, 但没否定由这个假定得出的结论, 仍然默认这个结论的存在。

为了形象的说明上述逻辑的荒谬之处, 笔者在此对比着举一个例子, 如下表所示:

根据书中的逻辑, 在对应的例子中, 会得出一个结论:中国不是世界上人口最多的国家。显然, 这个结论很荒谬。

3.2 疑问二:集体不理性

书中说:“囚徒困境反映了一个很深刻的问题, 这就是个人理性与集体理性的矛盾。”从经济学的角度出发, 这就话只能理解为“个人理性而集体不理性”。要集体不理性至少存在两个前提条件:第一, 存在集体;第二, 集体做出选择。

先来考虑第二个前提条件——集体做出选择。由书中所给的条件可知, A只能进行单独选择, B也只能进行单独选择。“坦白”是A单独选择的结果, 也是B单独选择的结果。因而, (坦白, 坦白) 是A单独选择和B单独选择的结果。以上表述肯定没有问题。

那么, 能不能说 (坦白, 坦白) 是A、B这个集体的选择呢?如果不能, 那就说明A、B这个集体没有做出选择, 既然集体没有做出选择, 那怎么知道, 集体是“理性”还是“不理性”。如果能, 那说明以下两种表述是同一种意思:

(1) (坦白, 坦白) 是A单独选择和B单独选择的结果。

(2) (坦白, 坦白) 是A、B这个集体的选择。

以上两种表述是同一种意思吗?在哲学中, 有一个基本命题:整体由各部分组成, 但不是各部分的简单加总。就拿囚徒困境的例子来说吧, A单独理性选择的结果是坦白, B单独理性选择的结果也是坦白, 因而A、B单独理性选择的结果是 (坦白, 坦白) 。而对于A、B这个集体来说, (抵赖, 抵赖) 严格优于 (坦白, 坦白) , 因而, A、B这个集体的理性选择肯定不是 (坦白, 坦白) 。也就是说, A、B这个集体的理性选择的结果不是A、B单独理性选择的结果。因而, 上述两种表述不能等同。这也就说明 (坦白, 坦白) 不是A、B这个集体的选择。从而, 也就不知道A、B这个集体是否理性。

再来考虑第一个前提条件——存在集体。为了形象的说明是否存在集体, 这里先举两个例子。例一:甲、乙两个人关系很好, 感情很好, 二者选择结婚, 并领取了结婚证。这个时候, 说甲、乙两人是夫妻, 一点问题也没有。后来, 二人因为感情不和而闹离婚, 并领取了离婚证。这个时候, 二人就不存在夫妻关系了, 再说二人是夫妻, 显然不适合了。

例二:抗日战争期间, 尽管国民党和共产党之间存在战争, 但由于国民党和共产党的首要敌人都是日本。这个时候说国共在集体作战, 没有什么问题。现在条件变了, 抗日战争胜利了, 国民党向共产党开战, 共产党被迫还击, 内战爆发。这个时候, 再说国共在集体作战, 就荒谬了。

从前面的两个例子中, 可以看出, 由于条件变了, 导致集体不复存在。书中囚徒困境的例子也是一样。两个囚犯在作案的时候, 可以看做是一个集体, 但是被抓住, 并被关在不同的房间里之后, 二者组成的集体就不复存在了。既然不存在集体, 也就不存在集体的选择, 也就不知道集体是否理性。

4 结语

从本文的分析中, 可以发现:从囚徒困境这个例子中, 得出“个人理性与集体理性冲突”的结论是很值得怀疑的。

本文认为, 在囚徒困境的例子中, 两个囚犯在作案的时候, 可以看做是一个集体。但是, 当二者被抓住, 并被关在不同的房间里受审讯时, 二者所组成的集体就不复存在了。因而, 也就没有集体的选择, 只有A单独的选择和B单独的选择。 (坦白, 坦白) 只是一个战略组合而已, 只是将A单独选择和B单独选择的结果人为组合在一起得到的, 而不是集体的选择。因为不存在集体, 也就不存在集体是否理性, 也就不知道, 个人理性与集体理性是否冲突。

摘要:经济学中有个囚徒困境的例子, 通过这个例子, 有些书籍的作者会得出“个人理性与集体理性冲突”的结论。通过的分析可以发现, 上述结论值得怀疑。

关键词:个人理性,集体理性,囚徒困境

参考文献

[1] (英) 肯.宾默尔.博弈论教程[M]. (中译本) .上海:上海人民出版社, 2010.

[2]汪贤裕, 肖玉明.博弈论及其应用[M].北京:科学出版社, 2008.

[3]吴广谋, 吕周洋.博弈论基础与应用[M].南京:东南大学出版社, 2009.

[4]肖条军.博弈论及其应用[J].上海:上海三联书店, 2004.

[5]谢识予.经济博弈论 (第二版) [M].上海:复旦大学出版社, 2002.

理性博弈 篇7

美国教育行政专家罗森庭格 ( Rosentengel,W. E. ) 曾说过: “学校经费如同教育活动的脊椎。”正如他所言,要谋求教育的发展,必须有足够的经费予以支持。

从1949年新中国成立到1988年,我国的高等 教育一直 是“免费的 午餐”。高等教育具有成本递增的特点,如果一直由国家包揽办大学,经费的缺口将越来越大。我国高校收费改革始于1989年,1997年开始在全国推行,学费大幅增长。据统计,2013年全国公办普通本科高校生均学费为5775元,公办高职高专学校生均学费为5164元。

而近日部分省份调整高校学费标准的情况又引起广泛关注。全国有9个省份调整了普通高校收费标准,分别是:天津、江苏、福建、山东、湖 北、湖南、广西、贵州、宁夏; 另外有6个省份正在启动调整收费标准的相关程序,分别是: 浙江、广东、山西、安徽、内蒙古、青海。这些省份的学费涨幅多在20% ~ 35% 之间。

从已经调整高校学费标准的9个省份来看,调整后的学费标准,一般专业在4000至6000元之间,艺术类专业在7000至12000元之间,涨幅近10倍于居民收入的增长,给学生家庭带来较大的经济负担。

学者们对普通高校收费合理性的分析大多是基于市场经济“谁受益谁付费”原则和由美国教育经济学家约翰·斯通( D. Burce Johnstone) 于1986年提出的教育成本分担理论,以及高等教育的产品属性理论。但是如果“谁受益谁付费”是市场经济条件下的一个普遍真理,就应该普遍适用于所有教育,义务教育也使受教育者受益,当然也应该适用于对义务教育收费制度合理性的解释。

事实上,当今义务教育普遍实行的是免费制度。“谁受益谁付费”原则无法完全解释高校收费合理性。高等教育成本分担理论认为,高等教育成本应由这些受益者共同分担,高等教育收费实质上是高校学生分担的高等教育成本,遵循“谁受益谁分担成本”原则。但是,学生分担高等教育成本的学费的多少,取决于各个高校的高等教育成本的高低,而高校内部管理直接影响到各个高校的高等教育成本的高低。由于高校内部管理失序所导致的高等教育成本上升,在“谁受益谁分担成本原则”的逻辑下又被无理分摊给高等教育的各个受益者。所以“谁受益谁分担成本原则”内含着反市场经济机制的非等价交换原则。

有学者用高等教育的“准公共产品”属性来解释高等教育收费的合理性,认为高等教育服务属于准公共产品,政府与消费者 ( 受教育者) 应共同负担其成本,受教育者直接负担的形式就是学费,学费从性质来说应是准公共产品的收 费。但是,“准公共产 品观”将高等教 育说成是 “准公共产品”,将“准公共产品”置于公共产品理论中公共产品、私人产品、共有资源、自然垄断物品四类产品之外,而且对于“准公共产品”与“准私人产品”的界限也模糊不清。因此,这一解释也还有待商榷。

而博弈论作为研究决策主体行为的科学,在经济学及其他学科领域都得到广泛的应用。本文尝试用博弈论工具,对高等教育收费的历史合理性进行分析,以期对这一问题作出合理的经济学解释。

二、博弈论概述

博弈思想的发展历史悠久,公认最早应从《孙子兵法》开始,现代博弈论的研究也都多从《孙子兵法》的辩证思想着手进行。其真正的发展一般从20世纪40年代冯·诺依曼的《博弈论和经济行为》一书开始,直至20世纪80年代在数学、逻辑、心理学的基础上建立了完善的博弈理论体系。这一时期,博弈论以其新的思维方式和理论极大地推动了当代经济学的发展。

著名的经济学家泰勒尔说过: “正如理性预期使宏观经济学发生革命一样,博弈论广泛而深远地改变了经济学家的思维方式。”

随着博弈论的发展,有许多的学者不再局限于对经济领域的研究,还把视野放开,并运用博弈论的思想方法解决不同领域的策略问题。严格地讲,博弈论是一种思维方式、技术方法和理论体系,其应用的范围不仅包括经济学,也包括政治、军事、外交、犯罪、管理、决策乃至教育等许多不同的领域。

博弈论,英文为game theory,博弈论是研究“个人、队组或组织面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,以各自允许选择的行为或策略中进行选择并加以实施,并从中各自取得相应结果的过程”。这个定义有四点是值得注意的: 1博弈的参与者; 2全部策略的集合; 3策略实施与次序; 4博弈的得益。这就是博弈的四个基本要素,确定了这四个方面就确定了一个博弈。

博弈论也就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题,即当一个主体,好比一个人或一个企业的选择受到其他人、其他企业选择的影响,而且反过来影响到其他人、其他企业选择时的决策问题和均衡问题。

博弈理论对参与人的任何决策有一个基本的假设: 参与人的行为是理性的,他们总是偏好于更高收益的结果,它强调个人理性,也就是在既定的约束条件下追求效益的最大化。

三、现阶段高校收费的博弈论分析

高等教育收费制度的历史性是由生产力水平、经济水平、社会发展水平决定的。现阶段,我国还处在经济、社会发展水平所积累的剩余产品不足以把高等教育免费提供给每个社会成员的历史阶段。

本文假设在高校收费中各高校都是理性人,都追求其效益的最大化。另外,为了得到一个较为一般化的结论,下文中并未涉及具体数字,对于一些不决定行为人决策的问题也尽可能地做了简化或未加以考虑,但是这并不影响对问题的分析和最终的结论。

在假定市场上有甲、乙两所普通高校 ( 即两个参与者) ,且两所普通高校在理性选择的情况下,每所高校都有两个可选择的策略,这两个策略都是收费和不收费。这样,就会产生以下三种策略组合: 一是全部不收费,所有的办学费用全部由国家承担; 二是某个普通高校收费,某个普通高校不收费; 三是在国家投入资金有限的情况下,普通高校都选择收费。

由于第一种选择对普通高校来说,寡占性最强,收益最大,笔者赋予其收益值为20 ( 两高校同时选择10) ,第三种选择,相对收益要小,笔者赋予其收益值为16 ( 两高校同时选择8) 。此外,如果一所普通高校选择收费,另一所普通高校选择不收费,那么,实行收费的普通高校的收益无疑将会增加,笔者假定选择收费的高校收益值为12,选择不收费的高校收益值为6。四种可能的博弈可用下述支付矩阵 ( 也称报酬矩阵) 来描述和分析。

在上述矩阵中,数对中的第一个数表示甲所获的收益,第二个数表示乙所获的收益。这里要讨论的收费选择模型与博弈论中最经典的“囚徒困境”的结构式一样。

在本模型中,先来分析甲参与者的策略选择。当乙选择不收费策略时,甲若选择合作策略,可得10; 甲若选择收费策略,可得12。当乙选择收费策略时,甲若选择不收费策略,可得6;甲若选择收费策略,可得8。很清楚,不管乙选择收费还是不收费策略,甲都会采取收费策略。收费策略是甲的占优策略。类似分析对乙也适用。收费策略也是乙的占优策略。

所以,尽管如果普通高校都选择不收费策略,整体来说是最佳的,但是,对各普通高校来说,采取收费策略总是最好的选择。而且在现实中,如果各高校都不收费,完全由国家来负担是不现实。在同等条件下,普通高校选择收费,有利于扩大招生和办学规模,增强师资教学力量,改善办学条件。

由此得出了上述关于讨论收费上学问题的明确结论: 因双方各自的自利行为,将不可避免地导致双方均选择收费的结果,即 ( 8,8) 。

高等教育产品的供给也是一个“囚徒困境”问题。如果大家都出钱来兴办教育事业,支持高校建设,那么接受高等教育的人数将会增加。问题是,如果我出钱而你不出钱,我得不偿失; 而如果你出钱我不出钱,我就可以占你的便宜。所以,每个人的最优选择都是“不出钱”。这种纳什均衡 ( 又称为非合作博弈均衡,是博弈论的一个重要术语,使得每个参与人的策略是对其他参与人策略的最优反应) 使得受高等教育的人的机会在大大减少,相应来说所有人的福利都得不到提高。

在高校实践中,适当向学生收取学费,能够有更多的经费投入以改善办学条件,吸收优秀的师资留在高校,让学生接受到更好的教育。同时,由于学校经费充足,可以扩大招生名额,提供更多人上大学的机会。在目前我国社会经济发展条件下,如果不向学生收取一定学费进行教育成本补偿,那么高校的发展只会越来越艰难。因此,在现阶段所处的社会主义初级阶段的条件下,实行的高校收费制度具有历史合理性。

摘要:高校收费问题是教育经济学研究的一个热点问题。对高等教育收费制度合理性的分析大多是用“谁受益谁付费原则”、高等教育成本分担理论和高等教育的产品属性来解释。本文在概述博弈论的基础上,尝试用博弈论来分析普通高校收费制度的历史合理性。

理性博弈 篇8

一组织文化的缺位已成为制约民营企业发展的一大瓶颈

中国大部分民营企业核心价值体系的缺失一直是制约企业长期发展的瓶颈。民营企业在诚信方面的缺失诸如合同欺诈、欠账赖账、假冒伪劣、违背合同、账目造假、偷税漏税等问题日趋严重。此外, 近年来在食品药品安全领域, 我国民营企业的一些行为, 我们也能管中窥豹我国民营企业组织文化的道德价值观缺失到了何等地步。安徽阜阳“毒奶粉”事件、“三聚氰胺”、“瘦肉精”、“毒胶囊”、“老酸奶”等事件, 国人近年来上了几堂深刻而惨痛的化学课, 对一些民营企业的“开源节流”敛财法都“深感钦佩”。

核心价值体系是一个企业成功最重要的因素。管理大师彼得·德鲁克在谈到企业价值观的重要性时说:“企业要思考三个问题:第一个问题:我们的企业是什么?第二个问题:我们企业将是什么?第三个问题:我们的企业应该是什么?”可以说, 对三个问题实践与否, 则在很大程度上决定着企业的成败。诸多案例可以证明, 企业可以在短期内攫取较多的利润, 但是其要持续成长和良性发展所要依靠的绝不仅仅是简单的财务指标, 更为重要的是企业是否确立了正确的价值观并为之奋斗。

从种种迹象看来, 中国民营企业许多傲人成绩是建立在一种“求量不求质”的陋习上的, 这是十分可怕的。组织文化的缺位, 特别是企业核心价值观的缺位是民营经济进一步发展壮大的一大“瓶颈”。在当前竞争激烈的市场经济下, 这样的民营企业队伍只能算作是一支不正规的“游击队”, 是不可能和其他装备精良、训练有素的“正规军”相抗衡的。即使不得不上战场, 大概也只能用上“打不过就跑”的原则, 如果不积极寻求壮大之道, 迟早是要被国外的竞争对手鲸吞蚕食的。

二民营企业组织文化缺位的原因分析

如何弥补企业组织文化缺位已成为当前我国众多民企积极探寻的命题。其实, 这个道理许多民营企业都了解, 因为已经有太多名家讲座与著作强调这个问题, 但为什么还是有这么多民企深陷这个泥沼难以自拔, 甘心做个杀鸡取卵的短视者?笔者认为原因是多方面的, 有无知也有无奈, 有内部因素也有外部制约。

1. 内部因素

第一, 组织文化断层——历史遗传基因未能较好延续, 新文化尚未形成。在中国历史上, 曾经出现过十大商帮。作为中国第一商帮, 晋商资格最老、历史最久、经营范围与地域最广, 在中国历史乃至世界历史上都留下了不可磨灭的印痕。而晋商之所以辉煌, 是因为他们创造了独特的商业伦理和道德, 其中很重要的就是传统儒家思想里的诚信理念与群体意识。中国历史上如徽商、晋商等都是比较推崇儒家文化、注重“道义”经商的, 这也算是一种“民营经济”, 而现在所说的民营企业应该是新中国成立以来的一些现代意义上的企业组织。中国民营企业的发家成长真正是得益于改革开放的春风。民营企业家们正是在此基础上摆脱了“社”“资”的枷锁, 成为“敢吃螃蟹”先富起来的一部分人群。在这些民营企业家中, 农民占了绝大多数, 从工人、销售员逐渐走上管理者、总裁的职务。这样的起步方式不可避免的带上了中国民企发展的历史独特性——草根性。再加上近代以来的新文化运动和文化大革命等对传统文化的冲击, 民营企业身上流淌的基因中原先的商业伦理和道德, 那些组织文化已经几乎找不到踪迹。而且在引入市场经济的同时, 西方的契约精神又没有很好地树立和融入, 导致价值观的模糊。来自田间, 受教育程度低, 对国际国内大环境的变化缺少敏锐的洞察力, 对现代科技、文化和管理知识难以熟练把握和运用, 这是对绝大多数民营企业家“草根性”的最好描述。“埋头做产品, 积极把钱赚”的民企老板们大多所保有的观念, 他们更在乎眼前的效益而缺少长远的战略目标, 走一步算一步, 哪里有利就往哪里钻。很少有人会去注意一个企业的组织文化建设这样看似务虚无用的东西, 缺乏企业长期经营的战略眼光。

第二, 民营企业内部缺乏行之有效的组织文化创建与维系体系。长期以来我国民企主要采用粗放式的经营模式, 靠廉价劳力、低价竞争抢占低端市场, 但这种缺乏核心竞争力的经营方式必将在竞争日益加剧的市场洪流中被淘汰。经营模式的转型升级迫在眉睫, 这其中包括了企业文化、产业结构、增长方式等等的脱胎换骨。而组织文化是极其重要的一环, 在组织文化创建与维系中均存在较大缺陷。

马云的阿里巴巴算是在民企中的佼佼者, 在组织文化的愿景规划中, 提出了十年规划等, 做好“过冬”的准备, 提出的“深挖洞, 广积粮, 做好做强不做大”的策略等都是建立组织文化的良好开端。但正如先前讲到的民营企业的“草根性”, 很多企业缺乏这些战略目标。

2. 外部因素

在过去的三十年里, 中国一直处在一个剧烈转型的时代。从计划经济逐渐向市场经济国家转型过程中, 似乎一切都是“摸着石头过河”, 没有明确的改革目标与蓝图, 农民企业家也是一步一个脚印摸索着前进, 如同温州龙港农民城镇长陈定模所说“改革总从违法开始的”。没有清晰的法律界定, 加上邓小平“不管白猫黑猫, 抓住老鼠就是好猫”的论断, 极大的鼓舞了农民企业家的冒险精神, 只要不动摇社会的稳定, 一切发展皆是硬道理;只要能够赚取更大的利润, 驰骋于“灰色地带”又有何妨?这种整个社会浮躁冒进、一切以“利”为先的心态成就了当前中国独特的商业环境。过分地夸大“发展”“利益”导致社会物质和精神追求上的极不平衡, 反映在商业上即众多企业的“商术发达而商道缺失”。民营企业的组织文化当然也难逃大环境思想的影响熏陶。

三博弈论视角下以诚信为核心的组织文化是强企之路的必然选择

企业诚信文化是指在市场经济条件下, 用以规范和调节企业与社会、企业与企业、企业与个人之间信用关系的一种道德理念, 它要求企业在追求自身利益的同时, 尊重他人利益, 诚实守信, 遵纪守法, 不损害对方和公众利益。企业诚信文化是企业的一种无形资产, 一种稀有资源, 是企业在生产经营活动中必须遵守的道德规范。诚信文化作为企业文化的重要组成部分, 体现于企业经营活动的各个领域, 是企业在生产经营活动中必须遵守的行为准则和道德规范。

美国著名管理学家埃德加·沙凶 (Edgar H.Schein) 在《企业文化生存指南》一书中指出:“大量案例证明, 在企业发展的不同阶段, 企业文化再造是推动企业前进的原动力, 但是诚信作为核心价值观是万古长存的, 它是企业文化的一个永恒主题——诚信作为企业生存发展和企业核心竞争力的基础是不能动摇的。诚信孕育于企业文化、扎根企业文化、渗透于企业核心竞争力的基石。”

下面是笔者简单地分析两个企业之间的诚信博弈模型列表:

从上述的分析框架中我们可以可以发现只有在两方都诚信的前提下才能够达成利益的最大化, 虽然可能存在着“囚徒困境”, 但应当了解到企业之间的博弈是重复的, 不是一次性的, 存在着合作的可能与必要, 是重复博弈的过程。企业要学会在重复博弈中觉醒, 学会保护自己, 明白在现今不断激烈的市场竞争中, 建立以“诚信”为核心价值观的组织文化是一个企业长期生存与发展的必由之路, 这样才能在重复博弈中获得长久的利益。

摘要:本文针对当前中国民营企业的组织文化建设中核心价值观缺位的问题, 从内外部展开分析组织文化在民营企业中缺位的原因, 并点出了中国民营企业家“草根性”特质, 运用博弈论科学地论证以诚信为核心价值观的组织文化是企业长期生存与发展的必然选择。

关键词:组织文化,民营企业,文化断层,博弈论

参考文献

[1]陈琳、张晓华.组织文化基础理论研究[J].现代商业, 2010 (3)

[2]茅理翔.民企需要应对三大挑战[J].经营管理者, 2010 (11)

[3]刘韬.关于企业文化研究的思考[J].商场现代化, 2008 (4)

[4]李明玉、郭小慧.构建民营企业诚信经营自律机制的思考[J].现代商业, 2010 (26)

[5]莫昌珍、张丹丹.我国民营企业“短命”现象的原因分析[J].经营管理, 2010 (10)

[6]王晓佳.晋商文化对组织文化构建的启示[J].中共山西省直机关党校学报, 2011 (1)

[7]史少博、张文青.现代企业精神对儒家思想的汲取[J].吉首大学学报:社会科学版, 2009 (4)

[8]王若冰.民营企业现状及发展探讨[J].消费导刊, 2006 (11)

上一篇:乙型肝炎病毒X基因下一篇:县级电网的安全调度