纳什均衡

2024-11-24

纳什均衡(精选10篇)

纳什均衡 篇1

“纳什均衡”是由1994年诺贝尔经济学奖得主、美国数学家约瀚·纳什提出的非合作博弈理论.它是指在非合作的前提下, 所有人的行动都是个别自主的决策. 如果选择的策略形成这样一种局面———任何一个参与者单方更改自己的策略不能带来任何好处, 这就形成了“纳什均衡”.如果你认为这样的描述过于抽象晦涩, 那么, 不妨先来看下面这则“猎人选择”问题:

两个猎人A、B出发去打猎.假设一头鹿有400公斤肉, 但必须两人合作才能打到, 一个人去打猎肯定一无所获. 同地区还有一群兔子, 一共有200公斤肉, 两人合作可以全部打完, 但一个人打也可以获得100公斤肉.两个猎人各自都知道这样的前提, 但双方不能交流沟通更不能协商共议, 即不允许通过任何方式影响对方的决策, 那么请你推测判断一下, 两个猎人最终会选择什么猎物去打猎?

看起来, 这是个比较现实也比较有趣的问题.为了进行相对理性和可信的分析, 我们不妨列举出所有可能的四种情形 (如表) :

从表中可以看出, 就个体而言A、B都存在“有收获”和“没收获”两类情形, 所以从利已角度出发, 双方都要尽力避免“没收获”, 这应该可以理解.但要注意到, 题意中已经说明:双方不允许通过任何方式影响对方的决策. 即不能通过交流达成共同打鹿的协议, 所以, 尽管这是A、B收获最多的策略, 但不能沟通的双方并不能保证对方如此选择.因此在各自独立选择时, 为了确保自己有收获, A、B都会在 “有收获”的两种情况“两人都猎鹿或两人都猎兔”中选择后者, 这样至少保证自己收获100公斤肉.

如果你理解了两个猎人的选择, 也就弄清了所谓“纳什均衡”的基本涵义:从全局看起来不见得是最好选择, 但是对每个人来说, 它又确实是在别人不可控时自己的最佳策略.这也从另一方面说明:当个人利益与群体利益产生冲突时, 个体的利已行为必然导致 “纳什均衡”———看似对个体有利, 实际对所有人都不利的结局.比如美国斯坦福大学的客座教授塔克在1950年的一次讲演中, 叙述的“囚徒困境”的故事就是具体形象的事例.

假设有两个小偷A和B联合犯事、私入民宅被警察抓获. 警方将两人隔离分别关在不同的房间, 由地方检察官分别和每个人单独谈话.检察官是这样叙述的:如果一个犯罪嫌疑人坦白了罪行, 交出了赃物, 于是证据确凿, 两人都被判有罪.其中如果另一个犯罪嫌疑人也作了坦白, 则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖, 则以妨碍公务罪 (因已有证据表明其有罪) 再加刑2年, 而坦白者有功被减刑8年, 立即释放.如果两人都抵赖, 则警方因证据不足不能判两人的偷窃罪, 但可以私入民宅的罪名将两人各判入狱1年.

现在, 摆在A、B面前的只有两种选择———坦白或抵赖.理论上, 最好的策略是双方都抵赖, 那么两人都只会被判1年.但由于两人处于隔离的情况下, 无法互通信息进行串供, 所以他们不能聚在一起达成共同抵赖的协议. 况且即使达成了抵赖协议, 从心理学的角度来分析, 他们也不能充分信任对方的承诺. 因此, A、B都会从利己角度如此盘算:

假如对方坦白.若自己抵赖, 就得坐8+2=10年监狱;若自己也坦白会判8年.

假如对方抵赖.若自己抵赖, 就会被判1年;若自己坦白就会被立即释放, 对方则会坐10年牢.

显然, 任何一方抵赖都要冒被同伙利用的巨大风险. 所以, A、B从损人利己目的出发, 他们选择坦白交代才是最佳策略.因为坦白交代可能得到最佳结果———立即释放, 当然前提是同伙抵赖, 这和对方坦白而自己抵赖, 那自己就得坐10年牢的结果有天壤之别.不仅如此, 即便自己坦白了对方也坦白, 那么自己至多也只判8年, 总比被判10年好吧.可见, 不管对方怎么选择, 自己坦白总是最划算的选择.如此一来, 两个人都选择了坦白, 认罪服法, 皆得8年刑期.

必须指出, 在博弈中, 当每个参与者的信息对称时, 个体利益最大化与群体利益最大化一致, 即所谓共享双赢, 并不属于“纳什均衡”;只有当信息不对称时, 个体追求利益最大化, 则将导致群体利益最小化, 这才是“纳什均衡”的研究范畴.上述“猎人选择”和“囚徒困境”正是 “非合作博弈” 的生动说明.

纳什均衡 篇2

纳什均衡模型在公交营运问题中的应用

运用博弈论的概念与方法,通过建立数学博弈模型,剖析人们对公共道路和公交客源的.利用,研究了二者对公交运营规模的影响,博弈结果证明了对公交运营进行宏观协调的必要性和重要性.

作 者:钟延风 作者单位:吉林市城市公共交通有限公司,吉林省吉林市,13刊 名:科技资讯英文刊名:SCIENCE & TECHNOLOGY INFORMATION年,卷(期):“”(35)分类号:G712关键词:非合作博弈 纳什均衡 公交资源 运营规模

纳什均衡 篇3

竞赛中的输赢

年轻的约翰·纳什在普林斯顿大学的校园里下围棋,原本信心满满的他却输给了对手,于是他自嘲地说道:“在竞赛行为中总有人要输。”或许正是这个时候,关于博弈论的想法在他心中扎了根。在博士在读期间,他对亚当·斯密的“看不见的手”原理提出了挑战:按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。纳什试图推翻这种说法,提出了每个人都从团队利益出发,才能找出一种让大家都获利的策略。

影片中有一个令人印象深刻的场景。纳什与他的同学去一个小酒馆喝酒,这时走进来三个女孩,其中一个女孩金发碧眼尤其出众。当其他人都在品头论足、跃跃欲试的时候,纳什在脑海中迅速地设计出了唯一确保能追到这个女孩的公式,可他并不付诸实施,而是飞快地跑回寝室,将公式写在了橱窗上。

对于该如何把那个金发碧眼的女孩追到手,纳什的设想是:假如一群人都去约她,其结果是全军覆没,谁也追不到;然后这一群人又去约她的女朋友,其结果也一定是被泼冷水,因为没有人愿意屈居第二。但是,如果没有人去追那个金发美女,那么他们一群人与她互不侵犯,同时也没有干扰到其他女孩,如此便能顺利约到其他女孩,对大家来说都是赢。

这个看似简单,但是大部分人都想不到的理论,就是纳什毕生最有贡献的研究成果——纳什均衡。

在博弈中战胜自己

博弈论最初是在1944年由冯·诺依曼提出的,1950年,纳什发表了他27页的博士毕业论文。在这篇以“非合作博弈”为题的论文中,纳什提出了一种重要的理论,就是后来被广泛应用的“纳什均衡”。

纳什提出的博弈论,帮助人们分析市场经济中的博弈与共赢。而他自己,同样在博弈中度过了很长一段痛苦的岁月。正如电影里所表现的,纳什在就读于普林斯顿大学时幻想出了自己的室友。开始执教之后,他的精神分裂症愈发严重,开始幻想自己是在为中情局工作,并且破解了来自宇宙的神秘的密码。在之后的三十年中,纳什不断地与精神分裂症做斗争,并且多次进入精神病院进行治疗。直到二十世纪八十年代,他才逐渐开始清醒,不久之后他得到了他人生中最重要的肯定—1994年的诺贝尔经济学奖。

在经济学界有一种说法,经济学家要想获得诺贝尔奖,只要活得够长就可以了。这是说,经济学理论并不是一种立竿见影的理论,需要长时间的经济活动,才能见证这些理论的正确性和实用性。在纳什的理论刚提出时,曾被认为过于简单而没有受到重视,进入二十世纪七八十年代后,人们越来越多地在日常生活中发现博弈论的影子,也正因为如此,纳什站在了诺贝尔奖的领奖台上。

我们身边的“纳什均衡”

简单来说,纳什均衡的定义就是,团队中的每一个人都从团队的利益出发,做对团队最有利的事情,从而使整个团队利益最大化,从而达到的一种均衡。

这种理论应用于我们的生活中,就能够分析前不久进行得如火如荼的电商价格战。博弈论所举出的案例基本上都只有两方利益进行博弈,但是在实际生活中,情况要复杂得多。拿电商价格战来说,市场上并不是只有两家电商进行博弈,而是涉及整个电商行业。

我们可以把整个电商行业看成一个团队,每一家电商企业都是其中的一个成员。他们之间有着竞争关系,也有着合作关系,当各方都从整个电商行业的利益角度出发,保持一个相差不多的价格水平时,就达到了一种均衡。这时每一家电商获得的利润都是在保证团队利益的前提下最大化的利润。

然而当其中的某一方忽然不再遵守行业中的约定,开始大幅度降价的时候,这种均衡就被打破了。价格降低后,销售额会大幅度攀升,但是因为成本并没有降低,实际上获得的利润并不会有所增加。同行业内的其他电商为了挽回流失严重的销售额,则开始采取更低的价格。这种并博弈现象被纳什称为合作博弈这种情况下达到的均衡被称为“纳什均衡”当然是消费者喜闻乐见的,可以用比从前低很多的价格买到同样的商品。可如果从长远的角度来看,价格战势必会淘汰大部分小规模商家,剩下的一家或几家实力雄厚的电商就可以重新进行联合并对市场进行垄断,把价格抬的更高。俗话说,买的没有卖的精,受到侵害的仍旧是消费者的利益。这就是国家并不鼓励价格战并且会有反垄断法律出台的原因。

由于纳什均衡的提出和不断完善,博弈论开始广泛应用于经济学、管理学、社会学等学科中。不光是这些专业领域,我们在生活中打扑克、买东西、下围棋时,都有可能在不经意间运用了博弈论和纳什均衡。我们都不是科学家,但可以站在科学家的肩膀上,利用他们的研究成果帮助我们思考,帮助我们更好地生活。

(责任编辑/刘阳)

语言顺应中的“纳什均衡” 篇4

博弈论 (Game Theory) , 是当代经济学领域中最著名也是最重要的理论。属应用数学的一个分支, 它考虑游戏中个体的预测行为和实际行为, 并研究它们的优化策略。为了达到各自的目标和利益, 各方必须考虑对手各种可能的行动方案, 并力图选取对自己最为有利或最为合理的方案。博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案, 以及如何找到这个合理的行为方案的数学理论和方法 (维基百科) 。

纳什均衡是博弈论中非常普遍的概念。可用以下的案例进行解释:假设两个合谋犯罪的嫌疑犯被警察抓住, 分别被关在两个不能互通信息的房间进行审讯。警察告诉他们, 如果两人都坦白, 则各判2年;如果一人坦白一人抗拒, 则坦白者立即释放而抗拒者则重判10年;如果两人拒不认罪, 则他们会被以较轻的妨碍公务罪各判半年 (著名的囚徒困境案例) 。对该博弈中的两个博弈方来说, 各自都有两种可供选择的策略, 即:坦白或抗拒。共有四种可能结果。但假设A选择的是坦白, B的最优选择也是坦白;假设A选择的是抗拒, B的最优选择同样还是坦白。在这里, (坦白, 坦白) 就称作是纳什均衡, 而且是占优战略选择。它指的正是如果某情况下无一参与者可以通过独自行动而增加收益, 则此策略组合被称为纳什均衡点 (维基百科) 。但事实上, 两个罪犯都以自己的最大利益为目标, 无法实现组合或集体利益的最大化。

二博弈论与语言顺应论的共通点

既然笔者要把博弈论与语言顺应论结合起来, 那必然要寻找它们两理论的共通点。

(一) 目标相同:顺应

语言顺应论中, Verschueren认为使用语言就是“不断地作出语言选择”, 始终不断地顺应不同的交际意图和使用环境。选择是手段, 顺应是目的和结果。而且, 通常面临的选择不是均等的。人们总是接受更有利的选择, 并称这种现象为“优先组织” (preference organization) , 也就是我们所说的倾向于选择“无标记”形式。如我们在了解一个人身高时, 我们更倾向于询问“他多高”这个无标记词而不是“他多矮”这个有标记词, 语言在头脑之中已经有过一次选择和过滤。同样, 在博弈论中, 囚徒困境这个例子里的两名嫌疑犯 (假设为理性经济人) 对自身实际情况进行判断, 对判刑轻重的环境进行判断, 最终双方均坦白也就是在进行选择, 而这样选择的目的也是希望能够顺应外界条件和使用目的, 最终得到最有利于自己的审判。即:语言顺应论和博弈论中选择都是为了顺应。

(二) 侧重点相同:策略

语言顺应论中, 语言使用可以在语言的各个层面 (如语音层、词汇层、句法层、语义层、话语/篇章层) 上进行。语言使用者不仅要选择形式 (forms) , 而且要选择策略 (strategies) 。也就是说, 选择既在语言结构层面上发生, 也在策略层面上展开。交际中要传达一个意图并被对方所理解, 理论上说话者可选择无限个具有不同效用的策略, 即表达方式, 因此, 说话者需要从多个方面比较这些策略的预期效用, 以作出权衡。同样, 听者根据接收到的语言信号进行理性解读, 并继而做出反应。吴诗玉 (2008) 也认为这种双重、双方的交互或者策略理性使得成功交际成为可能。博弈论研究策略交互的情形, 即两个或更多的参与者必须分别作出自己的选择和决定, 而所做选择和决定的结果又同时要依赖于别的参与者的选择和决定。两名嫌疑犯 (假定为理性经济人) 对对方思想和行为进行理性解读, 最终背叛彼此选择坦白是最有可能的策略选择, 即:语言顺应论和博弈论都侧重语言或者行为策略的展开。

(三) “纳什均衡”

博弈经典案例囚徒困境中, 两犯罪嫌疑人面临警察给出的选择, 只能从各自利益出发, 依据各自理性选择招供, 这种双方 (于个人而言) 均没有第二选择, 如前定义所述就被称为纳什均衡。也就是说在这一策略组合中, 所有的参与者面临这样一种情况, 当其他人不改变策略时, 他此时的策略是最好的。但此种情况下, 也并没有实现他们双方的利益最优化。在语言顺应论中, 同样存在语言“纳什均衡”现象。正如Verschueren所归纳, 围绕语言选择有三个关键概念:可变性、协商性以及顺应性。不断选择、在动态变化中的协商过程目的也就是为了达到语言上的顺应, 也就是语言上的“纳什均衡”———交际中彼此的“满意位点”, 纳什均衡点上。在这个点上每一位理性的交际者都不会有单独改变策略的冲动。也就是说, 双方均认为达到了“顺应”的高度。但从语言顺应角度来说, 在经历选择、协商的过程之后所达到的“语言顺应”不一定是最好的结果。以下将着重对语言“纳什均衡”现象进行分析。

三语言“纳什均衡”

(1) 如说话者:我在池塘里看到了他。 (基于以下理论假设:说话者和听者的语用能力和理性能力均为最佳;说话者和听者具有相同的知识背景、信息兴趣和推理能力)

我们假定说话者有两种可能的意图, M1:我在池塘里的时候, 看见了他。M2:我看见他的时候, 他在池塘里。

而听者相对应的也有两种理解上的策略M1和M2。

在这个对话理解中, 存在着四种理解上的可能性, (M1, M1) , (M2, M2) , (M1, M2) , (M2, M1) 。达到的纳什均衡有两种: (M1, M1) , (M2, M2) 。经过听话人对说话人语言的选择、协商直至顺应说话人的说话背景后, 此时出现了多纳什均衡, 这就为理解顺应语境下的语言增加了难度。

(2) 如法庭上, 法官:被告, 你承认所犯下的罪行吗?

被告:我承认。

对被告罪行的判断现在也会出现误判, 有时候证据表面指向被告, 但原因却是被告可能由于种种原因 (如维护他人) 故意混淆视听而为之, 并对罪行供认不讳。此时, 两方对语言的选择、协商也一样是为了顺应自身利益, 实现自身利益最大化。法官根据表面证据急于定案, 被告也愿意将自身定罪, 事实便在这里出现歪曲现象。表面双方策略的选择顺应了语境, 也达到了彼此的“纳什均衡”, 事实却与之大相径庭。这也就对语言顺应论提出了更高的要求, 表面上的顺应达到均衡, 也并不算是最优化, 如果要将其运用到各种现实语境中, 对语境、对话人背景的考量也是不可忽视的一部分。

(3) 如女方:如果我和妈妈同时掉进水中, 你先救哪个?

男方:先救未来的妈妈。

这是一则恋爱关系中男女双方的小对话, 女方提出的问题希望听取到的答案肯定是希望自己被救, 而男方语言机智, 他可以选取答案“救你”、“救妈妈”还是“救未来的妈妈”。他灵活运用策略, 选取了最后最为灵活的答案。“未来的妈妈”可以指代女方本身也可以指代岳母或者自己的妈妈, 这样女方会满意, 双方妈妈也都没有得罪。是博弈中选择、策略均较好的案例, 顺应了语境。

由上可以看出, 交际对话中并不能总保证语言双方的交流效果达到最优化。即便是经语言顺应论中三步曲语言选择、协商直至顺应达成的“纳什均衡”, 有时也不一定是占优“纳什均衡” (经济术语中称作“帕累托最优”) 。一次言语交际博弈能够达到纳什均衡, 只能说该博弈获得了解, 但仍无法说明成功交际的目的是否有达到。

同时, “多纳什均衡”在语言交际中的出现也会对语言交际效果最优化产生影响。这便需要我们对相应语境作出全面的了解。语言交际的双方都会受到语境的影响 (这里指的是广义的语境, 不仅包括语言语境, 还包括自然语境和社会语境) 。而一成功的言语交际, 则在很大程度上依赖于语言博弈模型中奕者对策略的选择。每一奕者策略的选择都不仅受到自身条件的限制, 同时还受到其他奕者策略的影响。更重要的是, 这仍需要我们在具体的语言环境、双方地位、学术水平的基础上做出相应的判断。我们还需要寻求交际方式、如何优化改进, 达到最优的“语言纳什均衡”。

目前, 博弈论是研究理性行动者相互作用的形式理论, 被各门社会科学研究所应用, 深刻改变着人类的思维。无论大到经济活动中的企业经营、市场竞争还是小到个人生活中的夫妻争吵、家庭聚会、朋友约会还是与陌生人交谈, 语言博弈无处不存在, 相应的语言顺应论应用也自不会避免, 如何在语言顺应论视角下更好地将“纳什均衡”运用到语言交际并达到占优均衡, 仍有很大的研究空间并需进一步探索。本文仅是尝试在这交叉领域进行一小步探讨, 希望能真正跳出圈子进行交叉研究。

参考文献

[1]丁社教.法制博弈分析导论[M].西北工业大学出版社, 2007 (4) .

[2]董明.谈“语言博弈”中否定的使用[J].北京师范大学学报 (社会科学版) , 1995 (6) :87-91.

[3]何自然, 于国栋.语用学的理解-Jef Verschueren的新作评价[J].现代汉语, 1999 (4) .

[4]吴炳章.交际博弈论—一种认知语用学的理论框架[D].河南大学研究生博士学位论文, 2009.

[5]吴诗玉.语言交际的博弈论解析[EB/OL].上海交通大学“985工程”外语学院二语习得研究平台. (2008-06-22) [2010-03-21].http://sla.sjtu.edu.cn/www/6/2008-06/6.html.

[6]向明友, 夏登山.民俗语用学-语用学研究的新视角[J].外语研究, 2001 (4) :23-24.

模糊二人零和对策的纳什均衡求解 篇5

关键词二人零和对策;三角形模糊数;区间数;多目标线性规划

中图分类号C934 文献标识码A

The Solution of the Nash Equilibrium

of Fuzzy TwoPerson ZeroSum Game

AN Jingjing1,2, NAN Jiang xia1,2,BO Hong1,2

(School of Mathematics and Computing Science, Guilin, Guangxi541004,China;

Guangxi Colleges and Universities Key Laboratory of Data Analysis and Computation,

Guilin University of Electronic Technology, Guilin, Guangxi541004,China)

AbstractThe payoffs of twoperson zerosum game were presented as triangular fuzzy numbers. We presented a new methodology for solving twoperson zerosum games with payoffs of triangular fuzzy numbers. Based on the ranking of interval, we provided a new ranking method of triangular fuzzy number. Then the solution of the fuzzy twoperson zerosum games can be obtained through solving a pair of multiobjective linear programming models. The validity and applicability of the proposed methodology were illustrated with a numerical example.

Key wordstwoperson zerosum game; Triangular fuzzy number; Interval; Multiobjective linear programming

1引言

关于支付值为三角形模糊数的二人零和对策[1](简称模糊二人零和对策)已有大量的研究和应用,Bector et al.[2],Campos[3],Campos et al.[4]都是运用一种模糊数的排序方法将支付值中的模糊数进行去模糊化转化成实数,进而把原问题的模糊线性规划模型转化为求解一般的线性规划模型,这样求得的对策值是一个实数.因为局中人的支付值是模糊数,所以在模糊二人零和对策中,局中人的最优策略和对策值也应是一个模糊数.目前只有少量的文献涉及这部分的研究.Clemente[5]运用了标准排序函数将模糊二人零和对策的模糊线性规划模型转化为与之等价的多目标线性规划模型,利用这种排序函数所得最优解也是模糊数.Li[6]研究了支付值是三角形模糊数的约束二人零和对策,证明了局中人的对策值与支付值满足单调线性关系,运用模糊数的0-截集和1-截集,通过求解三个线性规划模型得到局中人的最优策略和对策值,所求得的局中人的最优策略和对策值也是一个三角形模糊数.提出了一种新的基于区间数比较的三角形模糊数的排序方法,将支付值为三角形模糊数的模糊二人零和对策的求解转化为一个含有参数α的多目标线性规划模型,所得最优策略和对策值是三角形模糊数.

本文组织结构如下,第二部分是预备知识,给出了三角形模糊数的定义、截集及运算法则,介绍了区间数的比较,并提出了一种新的基于区间数比较的三角形模糊数的排序方法.第三部分运用三角形模糊数的比较方法将模糊二人零和对策的求解转化为求解带有参数α的多目标线性规划模型.第四部分给出了关于商业销售策略选择的一个数值实例,并建立模型,给出了数值结果.

经济数学第 32卷第3期

安京京等:模糊二人零和对策的纳什均衡求解

2预备知识

2.1三角形模糊数的截集及运算法则

定义1设=a,a,是一个三角形模糊数,那么它的隶属函数定义为

μx=x-a/a-a,a≤x

1,x=a;

-x/-a,a

0,x∈,其他.(1)

若a≥0,a,a和至少有一个不为零,则称=a,a,是一个非负的三角形模糊数.

定义2设=a,a,和=b,b,是两个非负的三角形模糊数.它们的代数运算和数乘分别为

+=a+b,a+b,+,(2)

λ=λa,λa,λ,λ≥0,λ,λa,λa,λ<0. (3)

三角形模糊数=a,a,的α-截集定义为α=xμx≥α,其中α∈0,1.记为α=aLα,aRα.

2.2区间数的比较

区间是实数集R的一个特殊子集[7],记做=[aL,aR]={x∈RaL≤x≤aR},其中aL和aR分别是区间的左、右端点.区间数也可表示为=〈m(),r()〉,其中m()=(aL+aR)/2是区间数的中点,r()=(aL-aR)/2是区间数的半径.

nlc202309020846

设=[aL,aR]和=[bL,bR]是两个区间[7].‘≤I’是一个模糊集,它的隶属函数为:

φ≤I=1,aR≤bL,

1-,aL≤bL≤aR≤bRr,且>0,

bR-aR/2r-r,aL≤bL≤aR≤bR且r>r,

0.5,r=r且aL=bL.(4)

同样地,也可以定义≥I.

设=aL,aR和=bL,bR是2个区间[7].‘≥I’是一个模糊集,它的隶属函数φ≥I=1-φ≤I,即

φ≥I=0,aR≤bL,0-,aL≤bL≤aR≤bR且r>0;aL-bL/2r-r,aL≤bL≤aR≤bR且r>r,0.5,r=r且aL=bL.(5)

区间不等式≤I的弱等价形式为[7]:

aRx≤bR,φ≥I≤α,

这里α∈0,1,表示违背区间不等关系≤I的可接受程度.

同样地,定义区间不等式≥I的弱等价形式为:

aLx≥bL,φ≤I≤α.

2.3基于区间数比较的三角形模糊数的排序方法

基于区间数的比较,给出一种新的三角形模糊数的排序方法.

定义3设=a,a,和=b,b,是两个三角形模糊数,

1)若aIb,≤α,则

2)若a>b,a>b,且φa,TFN;

3)若a=b,a=b,=,则=TFN.

其中,符号 “TFN”和“=TFN”表示三角形模糊数的模糊不等关系.φa,>Ib,

SymbolcB@ αα∈01是关于对违背a,Ib,<1,那么就认为决策者对违背Ib,=1,那么就认为Ib,=0,说明决策者完全同意TFN和=TFN.

定义4设=a,a,是一个三角形模糊数.模糊目标函数的极大值问题可描述为

maxs.t.∈Ω1

等价于下面的区间多目标数学规划问题:

maxa,a,s.t.∈Ω1.

上述规划问题可等价于下面的多目标数学规划问题:

maxa,a,a+2s.t.∈Ω1.

这里Ω1是变量在实际问题中应该满足的约束集合.

同样地,模糊目标函数的极小值问题可描述为:

mins.t.∈Ω2.

可等价于下面的多目标数学规划问题:

mina,,a+2s.t.∈Ω2.

这里Ω2是变量在实际问题中应该满足的约束集合.

3模糊二人零和对策及求解方法

设局中人1和2分别具有纯策略集S1=α1,α2,…,αm与S2=β1,β2,…,βn,当局中人1和2分别选取纯策略αi∈S1、βj∈S2时,局中人1获得的支付值为三角形模糊数ij=aij,aij,iji=1,2,…,m;j=1,2,…,n,而局中人2相应地损失的支付值为三角形模糊数ij=aij,aij,ij.局中人1在所有局势下的支付值可直观地用表表示为:

=ijm×n.

假定局中人1和2分别以概率xi和yj选取纯策略αi∈S1和βj∈S2,记x=x1,x2,…,xmT,y=y1,y2,…,ynT,称x和y分别为局中人1和2的混合策略.称

X={x∈Rm∑mi=1xi=1,xi≥0,i=1,…,m}

和Y={y∈Rn∑ni=1yi=1,yi≥0,i=1,…,n}分别为局中人1和2的混合策略空间.

在混合策略x,yx∈X,y∈Y下,局中人1和2的对策值分别为=Ex,y=xTy

和=-Ex,y=xT-y.因为支付表中的元素为三角模糊数,所以局中人1和2的对策值也为三角模糊数,分别记为=v,v,和=w,w,.

不难得到在模糊二人零和对策中,则有

*=maxx∈Xmminy∈YnEx,y

≤TFNminy∈Ynmaxx∈XmEx,y=*

根据前面所述理论,模糊二人零和对策的最优解可以通过下面一对区间数学规划来求解:

maxv,v,s.t.∑mi=1aijxi≥v,∑mi=1aij,ijxi≥Iv,,j=1,2,…n;∑mi=1xi=1,xi≥0i=1,2,…,m.(6)

minw,w,s.t.∑nj=1aijyj≤w,∑nj=1aij,ij≤Iw,,i=1,2,…,m;∑nj=1yj=1,yj≥0,j=1,2,…,n. (7)

根据定义4,区间数学规划模型(6)可转化为下面的多目标规划模型:

maxv,v,v+2s.t.∑mi=1aijxi≥v,∑mi=1aijxi≥vj=1,2,…,n,-∑mi=1ijxi-v-∑mi=1ijxi-∑mi=1aijxi≤α,j=1,2,…,nv≤,∑mi=1xi=1,xi≥0,i=1,2,…,m.(8)

多目标规划模型有许多的求解方法,在这里,用加权平均法可将上述多目标数学规划转化为下面的带有参数α的单目标规划:

min12v+13v+16

s.t.∑mi=1aijxi≥v,∑mi=1aijxi≥v.1-α∑mi=1ijxi+α∑mi=1aijxi≥1-α+αvj=1,2,…,nv≤,∑mi=1xi=1,xi≥0,i=1,2,…,m. (9)

根据定义4,并用加权平均法,区间多目标数学规划模型(7)可转化为下面的带有参数α数学规划模型:

nlc202309020846

min16w+13w+12s.t.∑nj=1aijyj≤w,∑nj=1ijyj≤,1-α∑nj=1aijyj+α∑nj=1ijyj≤1-αw+αi=1,2,…,m.w≤,∑nj=1yj=1,yj≥0j=1,2,…,m.(10)

显然,如果模糊矩阵 A ~中的所有三角模糊数ij=aij,aij,ij退化为一个实数,即aij=aij=ij,那么v*和w*也是一个实数,即v=v=,w=w=.因此,方程(9)和(11)分别退化为经典的二人零和对策的线性规划.从而说明的模型是经典二人零和对策模型的推广.

4数值分析

现有公司C1和C2欲占领某一产品市场,各自拟定下一年度产品的销售计划,以便增加自己产品在市场上的销售量.假定该市场对这类商品的需求为大致稳定,故一家公司销售量增加,则会引起另一家公司销售量减少.每家公司都在考虑采用两种策略之一来增加自己产品在市场上的销售量.策略α1:进行产品广告宣传;策略α2:改进产品包装.两个公司之间策略的选择可以看成是二人零和对策,即公司C1和C2分别看成是两个局中人.由于市场环境的复杂性和信息的不确定性,两个公司管理者只能给出下一年度各种局势下销售结果的近似值.假设

公司C1在所有局势下的支付值表示为如下的三角形模糊数:

=1751801901501561588090100175180190

利用前面所述理论,根据式(9)和(10)可分别建立局中人1和局中人2的期望收益模型如下:

max1/2v+1/3v+1/6s.t.180x1+90x2≥v,156x1+180x2≥v;175x1+80x2≥v,150x1+175x2≥v;1-α190x1+100x2+α175x1+80x2≥1-α+αv;1-α158x1+190x2+α150x1+175x2≥1-α+αv;v≤,x1+x2=1,x1≥0,x2≥0. (11)

min1/6w+1/3w+1/2s.t.180y1+156y2≤w,90y1+180y2≤w;190y1+158y2≤,100y1+190y2≤1-α175y1+150y2+α190y1+158y2≤1-αw+α;1-α80y1+175y2+α100y1+190y2≤1-αw+α;w≤,y1+y2=1,y1≥0,y2≥0.(12)

对于给定的参数α∈0,1的特定的值,利用线性规划的单纯形法[8,9]分别求解式(11)和(12),可得到局中人1的最小最大策略x*和其最小收益*=v,v,与局中人2的最大最小策略y*及其最大损失*=w,w,,不妨设α=0.6,可以得到x*T=(0.791 7,0.208 3),*=(155,161,165),y*T=(0.262 3,0.737 7),*=(157,162,166).显然*

5结束语

根据Li[7]提出的区间数的比较方法,提出了一种新的基于区间数比较的三角形模糊数的排序方法,将支付值为三角形模糊数的模糊二人零和对策的求解转化为求解一个含有参数α的多目标线性规划模型,所得的局中人的最优策略和对策值是三角形模糊数,这个结果与Bector et al.[2],Campos[3],Campos et al.[4]中所求得的局中人的最优策略和对策值是不同的.尽管所提出的模型和方法在一个数值实例中具体阐述了,这种方法也可以运用于解决其他的竞争对策问题,如在经济,金融和管理等领域.此外,提出的三角形模糊数的排序方法可以推广至梯形模糊数的排序,并且提出的排序方法和模型也可以运用到支付值为三角形模糊数的多目标二人零和对策.今后将进一步研究更多有效的求解模糊二人零和对策的方法.

参考文献

[1]李登峰.模糊多目标多人决策与对策[M].北京:国防工业出版社,2005.

[2]C R BECTOR, S CHANDRA, V VIDYOTTAMA. Duality in linear programming with fuzzy parameters and matrix games with fuzzy payoffs[J]. Fuzzy Sets and Systems,2004,146(2): 253-269.

[3]L CAMPOS. Fuzzy linear programming models to solve fuzzy matrix games[J]. Fuzzy Sets and Systems,1989,32(3):275-289.

[4]L CAMPOS, A GONZALEZ, M A VILA. On the use of the ranking function approach to solve fuzzy matrix games in a direct way[J]. Fuzzy Sets and Systems,1992,49(2):192-203.

[5]M CLEMENTE, F R FERNANDEZ, J PUERTO. Paretooptimal security strategies in matrix games with fuzzy payoffs[J]. Fuzzy Sets and Systems,2011,176(1):36-45.

[6]D F LI, F Y HONG. Solving constrained matrix games with payoffs of triangular fuzzy numbers[J]. Computers and Mathematics with Applications,2012,64(4):432-446.

[7]D F LI, J X NAN, M J ZHANG. Iterval programming models for matrix games with interval payoffs[J]. Optimization Methods and Software,2012,27(1):1-16. [8]王正东.数学软件与数学实验[M].北京:科学出版社,2010.

[9]张宜华.精通matlab5[M].北京:清华大学出版社,1999.

纳什均衡与我们的生活 篇6

在博弈论中,纳什是完全信息静态博弈的代表人物,他在1950年和1951年发表的两篇论文中定义了非合作博弈及其均衡解,并给出了均衡解的证明,后来人们称它为纳什均衡,即是假设有个参与人博弈,给定其他人战略的情况下,每个人选择自己的最优策略(个人最优策略可依赖于也可能不依赖于其他人的策略),所有参与人选择的策略一起构成一个策略组合。纳什均衡指的就是所有参与人的最优策略组合。为了清楚地了解纳什均衡,我们就以“囚徒困境”为例。据说有一位富翁家中财物被盗,警方通过此侦破此案,发现有两个嫌疑人A和B,将他们抓获后从他们的住处搜出受害人家中丢失的财物。但是,他们都矢口否认,于是警方将两人分开审讯。为了击垮他们的心理防线,警方告诉他们,如果主动坦白,可以从轻处罚;如果顽抗到底,一旦同伙招供,就要受到严惩。当然,如果两人都坦白,就不存在“主动交代”,两人都要受到严惩,只不过比抵赖要处罚轻一些。在这种情形下,两个囚犯都可以作出自己的选择,或者招供,即与警察合作,从而背叛他的同伙;或者保持沉默,与警察对抗到底。这样,就会出现以下几种情况:

在这个例子里,纳什均衡就是(坦白,坦白),在给定B坦白的情况下,A的最优策略是坦白,同理,给定A坦白的情况下,B的最优策略也是坦白。实际上,这里的(坦白,坦白)不仅是纳什均衡,而且是一个占优策略均衡,就是说,不论对方如何选择,个人的最优选择都是坦白。比如说,若B抵赖,A坦白的话被放出来,抵赖的话被判1年,所以坦白比抵赖好;若B坦白,A坦白的话被判8年,抵赖的话被判10年,所以坦白还是比抵赖好,这样坦白既是A的占优策略,又是B的占优策略,结果是每个人都选择坦白,各判8年。“囚徒困境”反映了个人理性与集体理性的矛盾,虽然两个都抵赖各判刑1年显然比都坦白各判刑8年好,但是他不满足个人理性要求,即(抵赖,抵赖)不是纳什均衡。

“囚徒困境”的思想在我们的日常生活中有着广泛的应用,比如市场上的商家常常通过降价来争夺市场,假设商家A和商家B是某市场上的两个竞争对手,他们原来用同一种较高的价格销售相同的产品,若这两商家不满足他们原来的市场份额和利润,就都想通过降价来争夺更大的市场份额和利润。但值得注意的是,当自己的降价引起对手的报复时,这种目的就不一定达到。假设两商家在原来的高价策略下各可以获利200万元,若商家A单独降价可以获得250万元利润,此时商家B因为市场份额被商家A抢去利润将下降到80万元,此时商家B也采取了降价,则两商家都只能得到120万元利润,此时博弈可以由下表表示:

由此表容易看出,假设商家B采用高价策略,那么商家A采用高价的200万,采用低价得250万,由于250大于200,商家A应采用低价,假设商家B采用低价,那么商家A采用高价得益80万,采用低价得益120万,由于120大于80,因此商家A也采用低价,用同样的方法分析商家B,商家B也应选低价策略,因而这个博弈的最终结果就是两商家都采用低价,最终各得120万元利润,即(120,120)就是纳什均衡解。当然囚徒困境思想的应用不仅仅是这一个例子,它还应用在公共产品的供给、军备竞赛、股票市场等许多方面。

由于一个博弈的纳什均衡解不止一个,有些博弈可能有无数个纳什均衡解,于是泽尔腾在1965年通过对动态博弈的分析完善了纳什均衡的概念,定义了“子博弈精炼纳什均衡”,这个概念的中心意义是将纳什均衡中包含的不可置信的威胁战略剔除去,使均衡战略不再包含不可置信的威胁。他要求参与人的决策在任何时点上都是最优的,决策者要随机应变,而不是固守旧略。由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也缩小了纳什均衡的个数。当然这里应该指出的是一个精炼均衡首先必须是一个纳什均衡,但纳什均衡不一定是精炼均衡,只有那些不包含不可置信威胁的纳什均衡才是精炼纳什均衡。例如:假如有一个富家千金爱上了一个穷小子,可是姑娘的母亲觉得并不门当户对,于是姑娘的母亲坚决不同意,并威胁说,若女儿与小伙子不断绝恋爱关系,她就与女儿断绝母女关系。若女儿相信母亲的话,女儿就会中断与小伙子的恋爱关系,因为恋人可以重新选择,而母亲则无法重新选择。问题是假设女儿坚持到底最终与小伙子结婚,母亲难道真的会去断绝母女关系吗?一般来说是不会的,因为断绝母女关系对母亲的损害会更大,这就是说,母亲的威胁是不可置信的。聪明的女儿当然会明白,一旦与男友生米煮成熟饭,母亲只好妥协。结果是女儿会勇敢地坚持恋爱并结婚,母亲最终承认那个她当初并不喜欢的女婿。这就是此博弈中唯一的精炼纳什均衡。

纳什均衡和子博弈完美纳什均衡所反映的博弈都包括了一个基本假设,即博弈的结构、博弈的规则、所有局中人的策略空间和支付函数都是共同知道的,满足这样一个假设的博弈称为“完全信息博弈”,但在现实生活中这一假设往往得不到满足。在非合作博弈中,局中人对博弈的结构和其他局中人的特征并没有准确的了解的情况叫“不完全信息博弈”。在1967年以前,博弈论专家对不完全信息博弈是束手无策的,直到1967年至1968年海萨尼提出了不完全信息静态博弈,并定义了贝叶斯纳什均衡,即在不完全信息静态博弈中,参与人同时行动,没有机会观察到别人的选择,给定别人的战略选择,每个参与人的最优策略依赖于自己的类型,由于每个参与人仅知道其他参与人的类型的概率分布而不知道其真实类型,他不可能准确地知道其他参与人实际上会选择什么策略,这样他决策的目标就是在给定自己的类型和别人的类型依从策略的情况下,最大化自己的期望效用。也就是说,贝叶斯纳什均衡就是给定自己的类型和别人类型的概率分布的情况下,每个参与人的期望效用达到了最大化。这种类型的例子在生活中也是无处不在,例如:某交通局有一段柏油路要包出去,通过招投标来进行。假设招标的办法为一级密封投标,让每个投标者将自己的标价写下并装入信封,一同交给交通局,信封打开后交通局选择标价最低者为中标者,此时不同的投标者之间进行的就是一场博弈。假定每个投标者都不知道其他投标者的真实生产成本而仅仅知道其概率分布,那么他在选择自己的报价时就面临着一种交替:一方面报价越低,中标的可能性越大,但另一方面,给定中标的情况,报价越低,利润就越小。分析证明,每个投标人的标价都依赖于他的生产成本,但一般来说,生产成本会低于贝叶斯纳什均衡标价,二者之间的差异随总投标人数的增加而减少,也就是说,投标人越多,交通局越有利。

前面说了静态博弈,其实在生活中还有动态博弈。在一个动态博弈中,行动是分先后次序的,后行动者可以通过观察先行动者的行动获得有关后者偏好、战略空间等方面的信息,修正自己的判断。就像日常生活中通过观察某人的行为表现来了解其品德一样,显然,先行动者知道自己的行为有传递自己特征信息的作用,就会有意识地选择某种行动来掩饰自己的真实面目。当然,在均衡状态下,理性人是不会被蒙混的。1975年泽尔腾和克瑞普斯(1982年)等人相继给出了不完全信息动态博弈的精炼贝叶斯纳什均衡的定义,即是当事人根据所观察到的他人的行为来修正自己有关后者类型的主观概率,并由此选择自己的行动。在我们的生活中,这样的例子也很多,例如:“黔驴之技”的故事就是一个不完全信息动态博弈:一头毛驴被带到贵州时,老虎从没见过驴子见它威武高大,心想它的本领一定很大。老虎就很好奇,于是凭着这个判断,老虎就躲在树林里偷偷观察毛驴,这是它的最优选择。过了一会儿,老虎走出树林,逐渐靠近毛驴,就想获得这个庞然大物的真实本领的信息。突然毛驴大叫一声,老虎吓了一跳,急忙逃走,这也是老虎的最优选择,因为毛驴的叫声是老虎意料之外的。过了两天,老虎又来观看,发现毛驴除了会大声叫之外没什么本领,可是仍然不敢吃毛驴,因为它还是不完全了解毛驴的真实本领。后来,老虎逐渐靠近毛驴,并故意往毛驴身上挤,毛驴实在忍无可忍,就往老虎身上踢了一脚,这下老虎反倒高兴了,因为它知道了毛驴不过就这点真实本领,此时,老虎对毛驴就有了全面的了解,于是扑过去就把毛驴吃掉了。在这个故事里,老虎通过观察毛驴的行为逐渐修正了对毛驴的看法,直到看清它的真实本领,最后把它吃掉,就是一个精炼贝叶斯均衡,而老虎的每一步行动都是给定它的判断下最优的。事实上,毛驴的行为也是理性的,它知道自己技能有限,不到万不得已它不会用仅有的一技,否则它早就被老虎吃掉了。这种博弈的思想在生活中也很多,比如:强者欺负弱者,信号传递模型,等等。

以上这些例子是我们日常生活中经常碰到的,这些博弈的思想也不知不觉地被人们使用,虽然博弈的例子数不胜数,但有一个共同特点,即参与者都是在每一场博弈中寻求自己的最优解。其实,人生就是一个不断合作和竞争的过程,在这些合作与竞争中,每个人都想使自己的利益最大化,从而得到一个自己认为满意的结果。由此看来,学习博弈论的目的不在于解法而在于寻求巧妙的策略,学习博弈论不是为了享受分析博弈的过程,而在于赢得更好的结果。博弈的思想来自现实生活,它既可以高度抽象地用数学来表述,又可以用日常事例来说明,并运用到生活中去,没有高深的数学知识,我们同样可以学习博弈论并成为生活中的策略高手,就像孙膑没有学过高数,但是这并不影响他通过最优策略来帮助田忌赢得赛马。

参考文献

[1]张维迎.博弈论与信息经济学.上海人民出版社,2004.

会计信息失真中的纳什均衡 篇7

1 囚徒困境博弈及会计信息失真的博弈分析

纳什均衡,又称为非合作博弈均衡,是博弈论的一个重要术语。假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略,从而使自己效用最大化。所有局中人策略构成一个策略组合,这种组合由所有参与人的最优策略组成,在给定别人策略的情况下,没有人有足够的理由打破这种均衡。

纳什均衡论中有一个有趣的问题叫“囚徒困境”。假设有甲、乙两名小偷联合作案,私入民宅,被警方抓获并隔离审讯。如果一人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一人也坦白了,则两人各被判刑8年;如果另一人抵赖,将被加刑2年,而坦白者有功,将被释放。如果两人都抵赖,则警方只能以私入民宅的罪名将两人各判入狱1年,见表1。请问他们将作何选择?

在无法串供时,这两个人都会有这样一个盘算过程:假如他坦白,我抵赖,得坐10年牢,坦白最多才8年;他要是抵赖,我坦白,我就可以被释放,而他会坐牢10年。综合考虑,不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最终两个人都选择了坦白,都被判刑8年。

如果甲乙能够串供,意志坚定,抵赖到底,每人只获刑1年,这不是达到了利人利己的目的了吗?这个问题说明了参与博弈的双方出于利己的动机,并不一定选择对大家都有利的行为,而是常常做出像上面的两名囚徒一样的所谓“纳什均衡”选择。

类似囚徒的困境在经济活动中普遍存在。假设有甲、乙两个企业,实力相当,它们占据着某地区某产品的各一半市场,两个企业都想超过对方。当两个企业都做真账或者都做假账时,他们的获利也是相当的,而企业是追求自身利益最大化的经济体,做真账或做假账依其利益最大化原则而定。企业做假账当然有一定的风险,但其潜在的利益是巨大的,比如得到企业投资人的奖励、偷逃税款、获得更多的银行信贷支持、从股市上筹集到更多的资金、有更多的机会扩大再生产、获得更大的利润等,如表2所示。

乙企业在进行策略选择时,假定甲企业做真账,则乙企业做假账可以比做真账多获利2个单位;若甲企业做假账,则乙企业做假账可以比做真账多获利1个单位。这样,无论甲企业怎么选择,乙企业做假账总是最优选择。甲企业在进行策略选择时也是一样的,纳什均衡的结果是,大家都倾向于做假账。

2 会计主体与监督者的博弈

正是因为有假账的存在,所以有了会计监督。会计监督是通过记录、计算、分析和检查等会计工作,对企事业单位的生产经营活动的合法性、合理性或预算执行情况等所进行的监督,其过程就是会计主体与监督者的博弈过程。

博弈的参加者有两个,一个是提供会计信息的企业,一个是检查会计信息的监督者,包括税务部门、会计师事务所等。企业的纯策略有两个:做真账和做假账,当企业按不同的概率分布选择做真账和做假账时,则形成了企业的混合策略;监督者的纯策略也有两个:检查和不检查,当监督者按不同的概率分布选择检查和不检查时,则形成了监督者的混合策略。二者的博弈矩阵见表3。表3中:C为监督者的检查成本;F为监督者查出假账后对企业的罚款所得;A为监管部门没有查出假账的损失,包括被罚款、信誉危机、停业整顿等;R为企业做假账的额外所得;L为企业做假账被查出后的市场形象导致的损失。

矩阵中有四种情况:①企业做真账,监督者不检查,这时对双方来说都是无损失也无额外收益;②企业做真账,监督者检查,这时监督者损失检查成本C,而企业无损失也无额外收益;③企业做假账,监督者不检查,企业由于做假账没被查出而获得额外好处R,而监督者由于失职造成损失A;④企业做假账被监督者查出,企业将蒙受罚款F的损失和市场形象导致的损失L,企业的总获益为R-F-L,而监督者得到罚款F,扣除检查成本C,监督者的总获益为F-C。

3 纯策略的博弈分析

如果企业总是做真账,会导致监督者总是查不出问题,那么监督者不愿意总是每次白白耗费检查成本而倾向于不检查;由于不被检查,加上假账的利益对企业的诱惑,则导致企业倾向于做假账。如果企业总是做假账,总是被查出,最终肯定会被停业,所以企业不会总做假账。如果监督者总是检查的话,企业就不敢做假账了;监督者查不出问题,得不到罚款奖励,还要每次白白耗费检查成本,从而导致监督者不愿意检查。如果监督者不检查的话,必然给了企业造假的机会,所以总是会有企业做假账,而监督者则必须开始进行检查。综上所述,不可能存在一个双方都不愿意改变自己策略的纯策略组合,所以企业和监督者之间的博弈是一个混合策略博弈问题。

4 混合策略纳什均衡的解

设监督者检查的概率为p,企业做假账的概率为q。由表3可知,在给定p时,企业做假账的额外收入的数学期望是:G假=R×(1-p)+(R-F-L)p=R-(F+L)p;企业做真账的额外收入的数学期望是:G真=0。要达到纳什均衡,企业做真账和做假账的期望收益要相等,故G真=G假,得到p=R/(F+L)。如果监督者检查的概率小于R/(F+L),则企业的最优选择是做假账;如果监督者检查的概率大于R/(F+L),则企业的最优选择是做真账。

举一个具体的例子。假设某企业做一次假账平均额外获利40万元,监督者查出假账后罚款100万元,企业被查出假账后的市场形象导致的损失平均为60万元,则R/(F+L)=40/(100+60)=0.25。如果监督者检查的概率为0.1,G假=40-(100+60)×0.1=24万元,即企业做一次假账平均可额外获利24万元,此时企业的最优选择当然是做假账;如果监督者检查的概率为0.35,G假=40-(100+60)×0.35=-16万元,即企业做一次假账将平均损失16万元,企业的最优选择当然是做真账。

由表3可知,在给定q时,监督者选择检查而获益的数学期望是:G査=(F-C)×q-C×(1-q)=Fq-C;监督者选择不检查而获益的数学期望为:G查=-Aq。要达到纳什均衡,则G查=G不査,得到q=C/(F+A)。如果企业造假的概率小于C/(F+A),则监督者的最优选择是不检查;如果企业造假的概率大于C/(F+A),则监督者的最优选择是检查。同样,根据本段的公式可以举出具体数据的例子。

5 治理会计信息失真的对策

5.1 降低监督者的检查成本C,也就减小了企业做假账的概率q

首先要改善会计检查环境,使检查能顺利进行,节约人力物力。这包括加强会计法规宣传和执法力度,使各种会计行为都有法可依,有法必依。其次要大力推广先进的检查技术。统计抽样和估计是一种很好的会计检查方法,它能科学地确定抽样规模,计算抽样误差的概率,控制抽样误差大小,并能由样本的数据以一定的概率保证计算出会计信息的总体特征,从而有效地提高会计检查效率,并降低了检查成本。

5.2 加强对监督者的奖惩

对不合格的监督者进行处罚,就是增大监管部门没有查出假账的损失A,从而减小企业做假账的概率q。监督部门包括财政、税务、银行、国家审计和注册会计师审计等。首先,财政、税务等部门应扩大稽核、监督检查的工作面,监督检查企事业单位、社会团体等经济业务活动是否真实,规范其业务交易行为与会计核算工作。对监督检查发现的弄虚作假等会计违法行为,要坚决依法处理。其次,加强对注册会计师事务所等中介机构的管理。这些监督者对其客户的会计报表进行审计,并发表审计意见,同时也要向使用会计报表的公众负责,充分发挥中介机构的监督检查作用。完善财政部门对注册会计师的再审制度,对那些出具虚假审计报告的机构应予以严惩,以提高中介机构的社会责任感。

5.3 提高对违规企业的处罚力度

提高造假成本,企业违规的积极性就会下降。监督者查出假账后对企业的罚款F增大了,企业做假账的概率q就会变小。目前,由于监管者查处不力,从而使企业做假账的成本过低,相对收益过高,会计造假往往使企业获得很大利益。在对作假企业进行处罚的同时也要对企业法人代表及有关会计人员进行处罚,情节特别严重的可追究其刑事责任,使造假者不敢以身试法。同时,要结合我国实际情况,进一步修改、完善相关法律法规,加大对造假者的打击力度,使其造假的预期成本远远大于造假收益。

6 结语

企业的市场形象是一种无形资产,代表着产品质量、售后服务、公司诚信等在公众心目中的资信力度。市场形象一旦变坏,它会像多米诺骨牌一样使企业一蹶不振,因此,很多企业将自己的市场形象看得很重。其实,企业做假账的另一个动因是为了提高自己的市场形象,但这是一个虚假的市场形象。如果监管者将违规做假账的企业在媒体和业内曝光,使违规企业市场形象变坏导致的损失L变大,企业做假账的额外收益的数学期望G假就会变小,企业会倾向于少做或者不做假账。

摘要:文章针对会计造假和监督行为建立博弈模型,运用纳什均衡理论,分析当前会计信息失真的重要原因,同时提出了防范和治理措施。

关键词:会计信息失真,纳什均衡,博弈论,对策

参考文献

[1]龙江智.企业制假的博弈分析[J].税务与经济,2002(3).

[2]牛丽娟.探析会计信息失真的成因及治理[J].经济师,2006(3).

纳什均衡在施工管理中的应用 篇8

随着的经济学界博弈论热潮的兴起, 博弈论一些模型与理论也广为人知, 其中最著名的莫过于囚徒困境与纳什均衡。

“囚徒困境”是最经典的博弈模型之一, 其基本模型是:在一次凶杀案后, 警察抓住了两个合伙的犯罪嫌疑人张三和李四, 但却没有掌握足够的证据证明张三和李四是凶杀的犯罪人。于是警察把他们隔离关押起来以防止串供, 并要求二者坦白交代。如果两人都坦白, 每人将入狱5年;如果两人都不坦白, 将以防碍公务罪入狱3个月;如果一人抵赖另一人坦白, 那么坦白者将入狱1年, 而抵赖者则将入狱10年。面对这样的局面, 你张三与李四的就不得不面对两难的选择——坦白或者抵赖。不难看出, 此案例中最好的策略就是双方都抵赖, 每人只坐牢3个月。而现实的情况是, 按亚当斯密理性经济人的理论, 人从都会从利己的角度进行相关选择。从张三与李四的情况来看, 他们都会想:如果我不招, 他也不招, 我们都坐3个月牢;如果我招了, 他不招, 我坐牢1年, 他坐10年;如果我招了他也招了, 那两人都坐5年;而如果他招我不招, 那我就得坐10年。这几种可能一盘算, 显然无论另一方如何盘算, 自己招了最划算, 如此一来, 因为这种利己的考虑角度, 两个人都选择了招供, 而最佳的策略——两人同时抵赖、最好的结果——两人都坐3个月牢没有出现, 这就是著名的囚徒理论, 反映了人的集体理性与个人理性的冲突。

由于每个人都是考虑自己利益的理性经济人, 在不能串供的情况下, 两人都是不敢相信对方的, 因此自然选择坦白是了保险的, 这种张三与李四都坦白的情况就构成了纳什均衡。纳什均衡是现代博弈论最为重要的理论之一, 正是纳什均衡的提出, 推动了博弈理论在各个领域的广泛应用。所谓纳什均衡, 也叫非合作均衡, 它指的是一种由所有参与人的最优战略组成的战略组合, 意味着在给定别人战略的情况下, 没有任何单个参与人有积极性选择其他战略以获得自己的最大利益, 从而也就没有任何人有积极性打破这种均衡。

纳什均衡描述的是一种非合作博弈均衡, 它虽然由单个人的最优战略组成, 但并不意味着是一个总体最优的结果。如今, 纳什均衡被广泛应用于各个领域, 发挥着其重要的作用, 特别是在制度分析中, 纳什均衡基本上是一种常态, 达不到纳什均衡的制度安排, 其往往是不能成立的。

2 纳什均衡在施工管理中的运用情况介绍

2.1 在施工质量管理中的企业与项目经理的博弈与纳什均衡

项目经理负责着工程的施工组织, 其日常工程料使用的掌控对于工程的最后质量起着重要作用。假设工程料的供应企业是有一定奖励返还给项目经理的, 而且价格越高, 返还越多。从项目经理与企业的关系来看, 他们之间也是一个博弈, 经过深入分析, 我们可以看到, 项目经理在与公司领导博弈时, 其工程料使用的情况可以选择高价或是低价这两种策略, 假设竞争不强或是没有竞争, 项目经理在面对公司领导时, 将毫不犹豫的选择高价策略 (相当于抵赖) , 以获得最大的个人收益。这种选择意味着项目经理失去了提高业务水平与管理水平, 以降低项目成本的动力, 成本的上升、生产效率与经济效益的下降都不可避免。最后带来的后果是由于信息的不对称, 使施工项目的实际管理水平与利润空间得不到真实的体现, 从而给公司决策层予错误信息, 对公司的经营造成重大隐患。

由于高价策略让项目经理获得了较大收益, 使得项目经理会追求更大的利润空间, 不断刺激他, 每次有交易的时候, 都会想到高价策略, 这样一来, 选择高价策略的也就成为了此刻的纳什均衡。

2.2 企业施工管理中的多个项目经理与企业的博弈及纳什均衡

一个施工类企业, 可能有多个项目同时在施工, 项目经理也有多名, 在一些项目中, 大家的日常工程料的使用都是差不多的。项目经理在日常工程料的使用中, 仍然面临着高价与低价的两种选择, 其结果分别是项目经理可以获得较高的收益或是因为成本最高而被公司认定为不会控制施工成本, 因此被撤职。虽然项目经理之间是可以找机会交流的, 但可以想象, 一是日常工程料的使用很多情况下是临时性的, 来不及交流。二是从个人的心理来看, 谁也不愿意就这些隐秘的事与他人交流, 以防泄密。这样一来, 项目经理们就陷入的囚徒困境, 一方面, 他们希望以高价策略来获得更大的个人收益, 另一方面, 选择高价策略, 可能会使自己成为那个施工成本最高的项目经理, 从而被公司的弃用。其实项目经理们都知道, 大家同时选择高价最好的选择, 给大家都带来非常可观的个人收益, 但其实这种的理想情况显然不太可能实现, 就如亚当·斯密所说的理性经济人理论, 每个人会从自己的利益角度出发, 即千万不能成为那个的成本最高的项目经理, 因此, 所有的项目经理都陷入了高价获利与低价保工作的两难困境中。假设A、B两个项目的项目经理, 需要对日常工程料进行采购, 具体分析一下:如果A项目经理选择的高价策略 (相当于抵赖) , 而B项目经理选择低价策略 (相当于坦白) , 那A就会成为公司领导层的弃子。如果B项目经理选择低价策略的时候, A项目经理也选择了低价策略, 那双方都将得到公司领导的信赖。由此可见, 无论B项目经理选择的是高价策略或是低价策略, A项目经理选择低价策略是最为保险的, 所以A项目经理的最佳选择始终是低价策略。同样的道理, 对于B项目经理来说也是如此。虽然大家都知道高价策略能给大家带来最好的收益, 但因为成为最高价的那个项目经理的风险太大 (被公司弃用) , 所以大家都会首先选择低价策略, 以保证自己的利益。对于有多个项目同时施工 (同时任命多个项目经理) 情况的企业来说, 这种纳什均衡的存在是有好处的, 在这种情况下, 无论其它的工地上采用什么策略, 自己选择低价策略始终是最好的策略。这种选择, 就是企业实行项目经理成本控制的纳什均衡。

3 纳什均衡下企业内部施工项目管理机制的启示

企业内部施工项目管理机制, 是指企业在施工项目中实行项目经理负责制, 强化项目经理职权, 建立内部竞争机制, 在企业内部员工中具有项目经理资质的, 并经企业认可的有能力担任项目经理的人员范围内, 在进行施工成本控制时, 通过评审各个项目经理的施工成本而建立的制度。从上面的分析中我们可以看到, 如何设置项目内部控制机制, 是使项目经理与企业的博弈中, 大家都选择低价策略的纳什均衡的关键。可以从以下几个方面达成纳什均衡, 从而降低企业的施工成本。

1) 项目经理人数要足够多, 以实现充分竞争, 即使项目经理在某时段只有两个, 也可以使用项目之间的纵向对比来控制项目经理的费用使用。

2) 制定相关措施, 防止博弈方 (项目经理们) 的合作, 可以是经常改变的某项材料的使用或是其它的措施。这些措施的实行, 使项目经理之间的合作成一件高风险的事情, 如此一来, 项目经理间的合作自然瓦解, 这是因为瓦解项目经理之间合作的那个项目经理, 将会得到最高的奖励 (被公司领导认为可信赖的项目经理, 得到提拔或是其它奖励) 。

3) 根据公司以往的施工经验, 建立一般施工项目的参考成本, 降低项目经理的操作空间, 从而降低项目经理之间合作的意义。

4) 在具体的项目管理部的人员设置上, 在实行项目经理负责制的同时, 也要有相应的管理钱财与采购人员的设置, 从而对项目经理形成牵制, 减少项目经理采取高价策略的可能。

4 结论

企业施工管理中的纳什均衡, 对于企业的成本控制是有好处的, 要提供外部条件以促成这种纳什均衡的持续, 以提高项目施工管理人员的积极性, 提高企业经济效益。

摘要:纳什均衡是博弈论的经典理论, 自上世纪50年代提出以来日益受到人们的重视, 在经济学中的应用越来越广泛。本文运用博弈论的观点, 分析纳什均衡在企业施工管理中的几种运用情况, 以期透视施工管理各方利益追求的实质, 提高企业施工管理水平。

关键词:施工管理,博弈,囚徒困境,应用

参考文献

[1]谢识予著.经济博弈论.上海:复旦大学出版社.

[2]则柯著.新编博弈论平话.北京:中信出版社, 2004.

纳什均衡 篇9

假设某市场仅存在两个企业生产一种产品, 他们的收益函数如下:

其中, p是企业1的价格, q是企业2的价格。

二完全信息静态博弈下的纳什均衡

在这种情况下, 两家企业同时作出决策, 并且价格是相互知道的, 每家企业根据对方的价格决定自己的最优收益:

假设, (p*, q*) 是纳什均衡下的最优解, 企业1的对价格p一阶偏导等于零, 即:-2 (p-aq*+c) =0,

企业2的对价格q一阶偏导等于零, 即:-2 (q-b) =0, q*=b;

则, 两家企业的利润分别为:

三完全信息动态博弈下子博弈精炼纳什均衡

在这种情况下, 博弈是完全且完美的动态博弈, 一家企业观察另外一家企业决策后再作出自己的决策, 具体过程分两步:

1. 企业1观察企业2的行动后作出决策:

首先, 企业2作出自己的行动, 其收益函数对价格q一阶偏导等于零, 即:

则, 企业1的收益函数为:- (p-ab+c) 2+b

企业1对价格p一阶偏导等于零, 即:-2 (p-ab+c) =0, p*=ab-c。

此时, 企业1与企业2与完全信息静态博弈下的纳什均衡是一样的。

2. 企业2观察企业1的行动后作出决策:

首先, 企业1作出自己的行动, 其收益函数对价格p一阶偏导等于零, 即:

则, 企业2的收益函数为:- (q-b) 2+aq-c

企业2对价格q一阶偏导等于零, 即:-2 (q-b) +a=0, q*=a/2+b。

这时, 两家企业的利润分别为:

四不完全信息静态博弈下的贝叶斯纳什均衡

假设c为企业1的成品, 并且存在两种类型 (高成本, 低成本) , 记为 (ch, cl) :

1. 则企业1在高成本为ch的情况下, 收益函数对价格p一阶偏导等于零:

收益函数为:∏1=b

企业1在低成本为cl的情况下, 收益函数对价格p一阶偏导等于零,

收益函数为:∏1=b

由上述分析可知, 任何情况下企业1的收益都是∏1=b

2. 企业2知道企业1以概率θ知道选择高成本ch, 以概率 (1-θ) 知道选择低成ch, 在这种情况下, 企业2的收益函数在q*=b的情况的均值为:

五决策分析

1. 完全信息博弈下决策对比分析。

(1) 企业1观察企业2的行动后作出决策双方所获得的收益与完全信息静态博弈下的纳什均衡相同。

(2) 在完全信息动态博弈下, 若企业1先作出决策的收益大于后作出决策的收益, 则满足:

这时企业1先作决策与后作决策是一样的, 企业1不会先作出决策。

若企业2先作出决策的收益大于后作出决策的收益, 则满足:

又因为当a=0时, ∏2=a2/4+ab-c>=0, 得到c=0。

这时, 企业2先作决策与后作决策的收益都是零, 企业2也不会先作出决策。

2. 不完全信息静态博弈与完全信息博弈下的决策对比分析。不完全信息下主要是企业2的决策问题。

若企业2的收益大于完全信息动态博弈后决策下的收益, 即:

若企业2的收益大于完全信息动态博弈先决策下的收益, 即:

在这两种情况下, 企业2的收益取决于企业1以多大的概率选择高成本, 以多大的概率选择低成本。

参考文献

[1]Robert Gibbons.Game Theory for Applied Economists

纳什均衡 篇10

一、影响环评行业良性发展的表象

(一) 环评行业近年来出现的问题

2013年环保部加强了对环评单位的检查力度, 发现我国少数环评单位中存在工作质量不高, 内部管理松散, 出借资质以及人员“挂靠”等严重问题。 (详见环保部网站公开内容) 。实际工作中出现过, 环评单位为了通过环评审批, 和项目单位联手以欺瞒的手段达到目的。还有的环评单位一切以利益为出发点, 没有从环保和社会责任的角度考虑问题, 一味的向项目单位妥协。

(二) 环评审批部门出现的现象

审批部门由于专业程度和知识培训更新的延后, 造成一些问题发现不及时或者处理问题时间较长引起企业不满。同时一些地方, 借有审批权限, 不择手段设卡的现象也确实存在。而在处理相对较复杂的问题时, 审批部门甚至所在局、厅也要顺从经济发展的需要, 考虑到服务大局, 听从上级领导的安排。因此, 应该在环评阶段解决的环保问题, 由于各种原因被拖延到建设期、验收期、生产经营期, 甚至是很多年以后, 直到发生了环境污染事故, 才开始倒追责, 这时已经给企业造成了经济损失, 给自然环境造成了污染。

(三) 企业方面出现的问题

部分企业对“环评”工作没有正确的认识, 认为只是为了拿到一个批文, 不得不花钱去做一本“环评报告”, 至于里面的内容, 是否可行, 对企业健康发展是否有价值, 并不关心, 更有甚者为了申请国家资金, 虚报项目, 拿环评工作当儿戏。还有企业, 针对审批部门提出的问题持怀疑态度, 认为是勒、拿、卡、要的“手段”, 少数单位存在抵触情绪, 甚至到处上访告状妨碍了正常的审批工作。

二、产生上述现象的原因分析

(一) 纳什均衡”理论的定义

“纳什均衡”是一种策略组合, 使得每个参与人的策略是对其他参与人策略的最优反应。假设有n个局中人参与博弈, 如果某情况下无一参与者可以独自行动而增加收益 (即为了自身利益的最大化, 没有任何单独的一方愿意改变其策略的) , 则此策略组合被称为纳什均衡。所有局中人策略构成一个策略组合 (Strategy Profile) 。纳什均衡, 从实质上说, 是一种非合作博弈状态。

在本文所提到的事件中三方的利益笔者认为应该是:政府的利益莫过于体现“为人民服务”, 体现以人民的利益为根本利益, 并以此作为政绩, 而作为环保审批部门还要多加上一条即控制环境污染;企业的利益是取得合理合法的政府批件, 增加为自己继续创收的机会;环评编制单位的利益是盈利, 即利益最大化, 同时应该还包括获得更多的市场份额。在这场博弈中, 缺乏任何一方, 三方都无法获利。

(二) 政府、企业和环评编制单位的目标不一致造成博弈

作为政府的环评审批机关, 目标之一是坚持生态文明建设, 将不符合环保要求的企业拒之门外。严格把关, 最大限度的在项目实施前控制住污染, 严格控制污染物的排放标准是应有的职责之一, 在这个过程中, 审批机关是独立存在的, 它和编制单位和项目单位不构成任何合作关系, 完全站在维护国家生态环境安全的立场上进行。

作为环评编制单位, 从公司的性质上来说利益最大化是它的一个目标;从社会责任角度来说, 给与客观、科学、准确的技术数据、科学分析、预测是它的责任。环评编制单位应以事实为基础, 以科学分析为方法, 明确地站在第三方的立场上来编制环评报告。因此“环评”有它自身的特殊性, 它不是一种可以定制的产品, 不是以委托方的意愿而转移的产品, 而是客观存在的事实。因此, 环评单位的社会责任感在很大的程度上决定着报告的编制质量, 一个报告的科技含量和法律效力的才是一个项目单位所应该重视的。而从另一个盈利的角度来说, 公司性质的环评编制单位无法摆脱利益最大化这样的目标驱动。

作为项目单位, 办理“环评”手续真是不得已而为之, 属于必办的法律要件之一。从法律的角度来诠释, 办理“环评”的目的就是来判断项目实施的可行性, 对建设项目实施后可能造成的环境影响进行分析、预测和评估。如果在建设前, 连“环评”都无法通过, 就说明项目本身存在风险, 需要引起项目单位、管理部门甚至是社会的重视。从企业的角度来看, 缺少“环评”审批文件, 就不能办理规划许可证、土地许可证以及后续的各种开工手续, 就像目前在中国没有了身份证, 没有办法获得房产和正式工作一样。由此可见, 在问题项目上, 三方都会持有各有不同的目的, 很难形成一致的意见, 而达成共识才是解决问题的根本。

(三) 政府、企业和环评编制单位之间的信息不对称

在实际工作中发现, 企业的一些信息是直接转交给环评编制单位的, 而技术信息主要由环评编制单位所把握, 相关的法律、法规、行业政策信息由政府所掌握, 而三方又不同时出现, 能在“评审会”上出现的项目是很有限的, 因此各方之间的信息并不对称, 容易给各方造成损失和误解。由于各方的最终目的并不一致, 而且各方所得到的消息也不对称, 因此产生了在整个环评审批过程中的三方博弈, 加之理论之外的社会因素, 使得博弈更加的复杂化。从理论上讲, 这种博弈是可以完全不存在的。

三、对策和建议

(一) 坚持信息公开

我们国家先后出台了《环境影响评价工程师职业资格登记管理暂行办法》 (2005年7月1日起施行) 、《国家计委、国家环境保护总局关于建设项目环境影响咨询收费有关问题的通知》 (2005年10月12日发布) 、《建设项目环境影响评价资格证书管理办法》 (2006年1月1日起施行) , 从法律的角度对环评行业进行了规范, 并制定了准入标准, 这证明我们国家的环评行业的规范化程度在世界上也是处于领先位置的, 国家的制度和法律法规及相关的信息, 企业在环保部网站上均可以查阅。

但是目前, 官方的详细环评单位信息还没有完全公开, 企业对于环评单位的选择还处于“困难当中”, 而且截至2013年1月, 在《全国建设项目环境影响评价资质单位名单》中, 全国共有1160家环评研究院, 具有甲级资质的191家, 乙级资质的969家。在信息不完全的前提下, 从符合条件的1000余家企业中寻找适合的环评编制单位无异于大海捞针一样的困难。

(二) 倡导信息共享

由于目前一些地区还处于较落后地区, 无法做到完全的无纸化办公, 无法做到所有的审批事项通过审批系统完成, 很多政策信息完全靠个人平时的积累, 信息效率较低。由于主动或者被动的信息封闭, 造成一些项目处理时间较长。在本文的写作过程中, 很幸运的, 国家环保部将环保相关的“法律法规及标准导则数据库”搜索进行了公开, 这说明我们环保部的可公开的信息的共享制度正在逐步完善, 是正在向新的文明进一步的一个表现。信息共享制度可以使企业在明确国家政策的前提下, 合理的选择自己的开发策略, 减少不必要的损失。

(三) 完善行业标准和规范

对于环评编制单位首先要有严格的行业准入标准和规范。我国目前现有的相关法律法规文件对环评单位的准入标准已有明确规定。2013年9月2日, 哈尔滨市环境保护下属事业单位市评估中心组织23家环评单位代表召开了座谈会, 市环保局主要领导参会, 征求各单位对评估方面的意见和建议, 这也体现了我们哈尔滨市有意于从管理部门的角度和环评编制单位进行沟通, 但是如果真的想对一个行业进行规范和管理, 首先行业自身应该有一个认识, 有自己遵守的社会规范和行业规范, 而这些规范应该是公开的、公正的、透明的, 作为环评行业有它的特殊性, 在于, 它需要独立于政府和企业之间, 需要提供客观详实的数据和证据来证明它所做出的判断和预测的合理性、合法性和可行性。从政府的角度, 这就需要商务部门、行业主管部门、工商等部门联合工作, 真正的从源头控制影响生态文明建设的关键问题。

更重要的一点是, 我国应该对各行业准入的环保标准进行明确细致的要求, 仅仅靠《产业结构调整指导目录》和《建设项目环境影响评价分类管理名录》等等名录不足以解决目前的问题, 我们需要的是更加细致和确定的标准, 这需要我国的环保技术人员共同努力, 逐步完善。

(四) 加强制度建设

在以上几条作为铺垫以后, 我们国家强大的制度建设将发挥重大作用, 在实现中华民族伟大复兴“中国梦”的进程中, 树立宁可放弃金山银山, 也要保护碧水蓝天, 绝对不能走“先污染, 后治理”的老路, 做到依法行政, 依章行事。古语有“不以规矩, 无以成方圆”, 一个国家的制度好不好, 可以用一个很简单的事情来衡量一下, 一件事情找人和不找人如果同样可以办成, 那我们就可以说, 涉及到这件事情的制度是有效的可行的, 是具有科学性的。

参考文献

上一篇:六大解放下一篇:空间智能