纳什均衡(精选10篇)
纳什均衡 篇1
“纳什均衡”是由1994年诺贝尔经济学奖得主、美国数学家约瀚·纳什提出的非合作博弈理论.它是指在非合作的前提下, 所有人的行动都是个别自主的决策. 如果选择的策略形成这样一种局面———任何一个参与者单方更改自己的策略不能带来任何好处, 这就形成了“纳什均衡”.如果你认为这样的描述过于抽象晦涩, 那么, 不妨先来看下面这则“猎人选择”问题:
两个猎人A、B出发去打猎.假设一头鹿有400公斤肉, 但必须两人合作才能打到, 一个人去打猎肯定一无所获. 同地区还有一群兔子, 一共有200公斤肉, 两人合作可以全部打完, 但一个人打也可以获得100公斤肉.两个猎人各自都知道这样的前提, 但双方不能交流沟通更不能协商共议, 即不允许通过任何方式影响对方的决策, 那么请你推测判断一下, 两个猎人最终会选择什么猎物去打猎?
看起来, 这是个比较现实也比较有趣的问题.为了进行相对理性和可信的分析, 我们不妨列举出所有可能的四种情形 (如表) :
从表中可以看出, 就个体而言A、B都存在“有收获”和“没收获”两类情形, 所以从利已角度出发, 双方都要尽力避免“没收获”, 这应该可以理解.但要注意到, 题意中已经说明:双方不允许通过任何方式影响对方的决策. 即不能通过交流达成共同打鹿的协议, 所以, 尽管这是A、B收获最多的策略, 但不能沟通的双方并不能保证对方如此选择.因此在各自独立选择时, 为了确保自己有收获, A、B都会在 “有收获”的两种情况“两人都猎鹿或两人都猎兔”中选择后者, 这样至少保证自己收获100公斤肉.
如果你理解了两个猎人的选择, 也就弄清了所谓“纳什均衡”的基本涵义:从全局看起来不见得是最好选择, 但是对每个人来说, 它又确实是在别人不可控时自己的最佳策略.这也从另一方面说明:当个人利益与群体利益产生冲突时, 个体的利已行为必然导致 “纳什均衡”———看似对个体有利, 实际对所有人都不利的结局.比如美国斯坦福大学的客座教授塔克在1950年的一次讲演中, 叙述的“囚徒困境”的故事就是具体形象的事例.
假设有两个小偷A和B联合犯事、私入民宅被警察抓获. 警方将两人隔离分别关在不同的房间, 由地方检察官分别和每个人单独谈话.检察官是这样叙述的:如果一个犯罪嫌疑人坦白了罪行, 交出了赃物, 于是证据确凿, 两人都被判有罪.其中如果另一个犯罪嫌疑人也作了坦白, 则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖, 则以妨碍公务罪 (因已有证据表明其有罪) 再加刑2年, 而坦白者有功被减刑8年, 立即释放.如果两人都抵赖, 则警方因证据不足不能判两人的偷窃罪, 但可以私入民宅的罪名将两人各判入狱1年.
现在, 摆在A、B面前的只有两种选择———坦白或抵赖.理论上, 最好的策略是双方都抵赖, 那么两人都只会被判1年.但由于两人处于隔离的情况下, 无法互通信息进行串供, 所以他们不能聚在一起达成共同抵赖的协议. 况且即使达成了抵赖协议, 从心理学的角度来分析, 他们也不能充分信任对方的承诺. 因此, A、B都会从利己角度如此盘算:
假如对方坦白.若自己抵赖, 就得坐8+2=10年监狱;若自己也坦白会判8年.
假如对方抵赖.若自己抵赖, 就会被判1年;若自己坦白就会被立即释放, 对方则会坐10年牢.
显然, 任何一方抵赖都要冒被同伙利用的巨大风险. 所以, A、B从损人利己目的出发, 他们选择坦白交代才是最佳策略.因为坦白交代可能得到最佳结果———立即释放, 当然前提是同伙抵赖, 这和对方坦白而自己抵赖, 那自己就得坐10年牢的结果有天壤之别.不仅如此, 即便自己坦白了对方也坦白, 那么自己至多也只判8年, 总比被判10年好吧.可见, 不管对方怎么选择, 自己坦白总是最划算的选择.如此一来, 两个人都选择了坦白, 认罪服法, 皆得8年刑期.
必须指出, 在博弈中, 当每个参与者的信息对称时, 个体利益最大化与群体利益最大化一致, 即所谓共享双赢, 并不属于“纳什均衡”;只有当信息不对称时, 个体追求利益最大化, 则将导致群体利益最小化, 这才是“纳什均衡”的研究范畴.上述“猎人选择”和“囚徒困境”正是 “非合作博弈” 的生动说明.
纳什均衡 篇2
纳什均衡模型在公交营运问题中的应用
运用博弈论的概念与方法,通过建立数学博弈模型,剖析人们对公共道路和公交客源的.利用,研究了二者对公交运营规模的影响,博弈结果证明了对公交运营进行宏观协调的必要性和重要性.
作 者:钟延风 作者单位:吉林市城市公共交通有限公司,吉林省吉林市,13刊 名:科技资讯英文刊名:SCIENCE & TECHNOLOGY INFORMATION年,卷(期):“”(35)分类号:G712关键词:非合作博弈 纳什均衡 公交资源 运营规模
纳什均衡 篇3
竞赛中的输赢
年轻的约翰·纳什在普林斯顿大学的校园里下围棋,原本信心满满的他却输给了对手,于是他自嘲地说道:“在竞赛行为中总有人要输。”或许正是这个时候,关于博弈论的想法在他心中扎了根。在博士在读期间,他对亚当·斯密的“看不见的手”原理提出了挑战:按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。纳什试图推翻这种说法,提出了每个人都从团队利益出发,才能找出一种让大家都获利的策略。
影片中有一个令人印象深刻的场景。纳什与他的同学去一个小酒馆喝酒,这时走进来三个女孩,其中一个女孩金发碧眼尤其出众。当其他人都在品头论足、跃跃欲试的时候,纳什在脑海中迅速地设计出了唯一确保能追到这个女孩的公式,可他并不付诸实施,而是飞快地跑回寝室,将公式写在了橱窗上。
对于该如何把那个金发碧眼的女孩追到手,纳什的设想是:假如一群人都去约她,其结果是全军覆没,谁也追不到;然后这一群人又去约她的女朋友,其结果也一定是被泼冷水,因为没有人愿意屈居第二。但是,如果没有人去追那个金发美女,那么他们一群人与她互不侵犯,同时也没有干扰到其他女孩,如此便能顺利约到其他女孩,对大家来说都是赢。
这个看似简单,但是大部分人都想不到的理论,就是纳什毕生最有贡献的研究成果——纳什均衡。
在博弈中战胜自己
博弈论最初是在1944年由冯·诺依曼提出的,1950年,纳什发表了他27页的博士毕业论文。在这篇以“非合作博弈”为题的论文中,纳什提出了一种重要的理论,就是后来被广泛应用的“纳什均衡”。
纳什提出的博弈论,帮助人们分析市场经济中的博弈与共赢。而他自己,同样在博弈中度过了很长一段痛苦的岁月。正如电影里所表现的,纳什在就读于普林斯顿大学时幻想出了自己的室友。开始执教之后,他的精神分裂症愈发严重,开始幻想自己是在为中情局工作,并且破解了来自宇宙的神秘的密码。在之后的三十年中,纳什不断地与精神分裂症做斗争,并且多次进入精神病院进行治疗。直到二十世纪八十年代,他才逐渐开始清醒,不久之后他得到了他人生中最重要的肯定—1994年的诺贝尔经济学奖。
在经济学界有一种说法,经济学家要想获得诺贝尔奖,只要活得够长就可以了。这是说,经济学理论并不是一种立竿见影的理论,需要长时间的经济活动,才能见证这些理论的正确性和实用性。在纳什的理论刚提出时,曾被认为过于简单而没有受到重视,进入二十世纪七八十年代后,人们越来越多地在日常生活中发现博弈论的影子,也正因为如此,纳什站在了诺贝尔奖的领奖台上。
我们身边的“纳什均衡”
简单来说,纳什均衡的定义就是,团队中的每一个人都从团队的利益出发,做对团队最有利的事情,从而使整个团队利益最大化,从而达到的一种均衡。
这种理论应用于我们的生活中,就能够分析前不久进行得如火如荼的电商价格战。博弈论所举出的案例基本上都只有两方利益进行博弈,但是在实际生活中,情况要复杂得多。拿电商价格战来说,市场上并不是只有两家电商进行博弈,而是涉及整个电商行业。
我们可以把整个电商行业看成一个团队,每一家电商企业都是其中的一个成员。他们之间有着竞争关系,也有着合作关系,当各方都从整个电商行业的利益角度出发,保持一个相差不多的价格水平时,就达到了一种均衡。这时每一家电商获得的利润都是在保证团队利益的前提下最大化的利润。
然而当其中的某一方忽然不再遵守行业中的约定,开始大幅度降价的时候,这种均衡就被打破了。价格降低后,销售额会大幅度攀升,但是因为成本并没有降低,实际上获得的利润并不会有所增加。同行业内的其他电商为了挽回流失严重的销售额,则开始采取更低的价格。这种并博弈现象被纳什称为合作博弈这种情况下达到的均衡被称为“纳什均衡”当然是消费者喜闻乐见的,可以用比从前低很多的价格买到同样的商品。可如果从长远的角度来看,价格战势必会淘汰大部分小规模商家,剩下的一家或几家实力雄厚的电商就可以重新进行联合并对市场进行垄断,把价格抬的更高。俗话说,买的没有卖的精,受到侵害的仍旧是消费者的利益。这就是国家并不鼓励价格战并且会有反垄断法律出台的原因。
由于纳什均衡的提出和不断完善,博弈论开始广泛应用于经济学、管理学、社会学等学科中。不光是这些专业领域,我们在生活中打扑克、买东西、下围棋时,都有可能在不经意间运用了博弈论和纳什均衡。我们都不是科学家,但可以站在科学家的肩膀上,利用他们的研究成果帮助我们思考,帮助我们更好地生活。
(责任编辑/刘阳)
语言顺应中的“纳什均衡” 篇4
博弈论 (Game Theory) , 是当代经济学领域中最著名也是最重要的理论。属应用数学的一个分支, 它考虑游戏中个体的预测行为和实际行为, 并研究它们的优化策略。为了达到各自的目标和利益, 各方必须考虑对手各种可能的行动方案, 并力图选取对自己最为有利或最为合理的方案。博弈论就是研究博弈行为中斗争各方是否存在着最合理的行为方案, 以及如何找到这个合理的行为方案的数学理论和方法 (维基百科) 。
纳什均衡是博弈论中非常普遍的概念。可用以下的案例进行解释:假设两个合谋犯罪的嫌疑犯被警察抓住, 分别被关在两个不能互通信息的房间进行审讯。警察告诉他们, 如果两人都坦白, 则各判2年;如果一人坦白一人抗拒, 则坦白者立即释放而抗拒者则重判10年;如果两人拒不认罪, 则他们会被以较轻的妨碍公务罪各判半年 (著名的囚徒困境案例) 。对该博弈中的两个博弈方来说, 各自都有两种可供选择的策略, 即:坦白或抗拒。共有四种可能结果。但假设A选择的是坦白, B的最优选择也是坦白;假设A选择的是抗拒, B的最优选择同样还是坦白。在这里, (坦白, 坦白) 就称作是纳什均衡, 而且是占优战略选择。它指的正是如果某情况下无一参与者可以通过独自行动而增加收益, 则此策略组合被称为纳什均衡点 (维基百科) 。但事实上, 两个罪犯都以自己的最大利益为目标, 无法实现组合或集体利益的最大化。
二博弈论与语言顺应论的共通点
既然笔者要把博弈论与语言顺应论结合起来, 那必然要寻找它们两理论的共通点。
(一) 目标相同:顺应
语言顺应论中, Verschueren认为使用语言就是“不断地作出语言选择”, 始终不断地顺应不同的交际意图和使用环境。选择是手段, 顺应是目的和结果。而且, 通常面临的选择不是均等的。人们总是接受更有利的选择, 并称这种现象为“优先组织” (preference organization) , 也就是我们所说的倾向于选择“无标记”形式。如我们在了解一个人身高时, 我们更倾向于询问“他多高”这个无标记词而不是“他多矮”这个有标记词, 语言在头脑之中已经有过一次选择和过滤。同样, 在博弈论中, 囚徒困境这个例子里的两名嫌疑犯 (假设为理性经济人) 对自身实际情况进行判断, 对判刑轻重的环境进行判断, 最终双方均坦白也就是在进行选择, 而这样选择的目的也是希望能够顺应外界条件和使用目的, 最终得到最有利于自己的审判。即:语言顺应论和博弈论中选择都是为了顺应。
(二) 侧重点相同:策略
语言顺应论中, 语言使用可以在语言的各个层面 (如语音层、词汇层、句法层、语义层、话语/篇章层) 上进行。语言使用者不仅要选择形式 (forms) , 而且要选择策略 (strategies) 。也就是说, 选择既在语言结构层面上发生, 也在策略层面上展开。交际中要传达一个意图并被对方所理解, 理论上说话者可选择无限个具有不同效用的策略, 即表达方式, 因此, 说话者需要从多个方面比较这些策略的预期效用, 以作出权衡。同样, 听者根据接收到的语言信号进行理性解读, 并继而做出反应。吴诗玉 (2008) 也认为这种双重、双方的交互或者策略理性使得成功交际成为可能。博弈论研究策略交互的情形, 即两个或更多的参与者必须分别作出自己的选择和决定, 而所做选择和决定的结果又同时要依赖于别的参与者的选择和决定。两名嫌疑犯 (假定为理性经济人) 对对方思想和行为进行理性解读, 最终背叛彼此选择坦白是最有可能的策略选择, 即:语言顺应论和博弈论都侧重语言或者行为策略的展开。
(三) “纳什均衡”
博弈经典案例囚徒困境中, 两犯罪嫌疑人面临警察给出的选择, 只能从各自利益出发, 依据各自理性选择招供, 这种双方 (于个人而言) 均没有第二选择, 如前定义所述就被称为纳什均衡。也就是说在这一策略组合中, 所有的参与者面临这样一种情况, 当其他人不改变策略时, 他此时的策略是最好的。但此种情况下, 也并没有实现他们双方的利益最优化。在语言顺应论中, 同样存在语言“纳什均衡”现象。正如Verschueren所归纳, 围绕语言选择有三个关键概念:可变性、协商性以及顺应性。不断选择、在动态变化中的协商过程目的也就是为了达到语言上的顺应, 也就是语言上的“纳什均衡”———交际中彼此的“满意位点”, 纳什均衡点上。在这个点上每一位理性的交际者都不会有单独改变策略的冲动。也就是说, 双方均认为达到了“顺应”的高度。但从语言顺应角度来说, 在经历选择、协商的过程之后所达到的“语言顺应”不一定是最好的结果。以下将着重对语言“纳什均衡”现象进行分析。
三语言“纳什均衡”
(1) 如说话者:我在池塘里看到了他。 (基于以下理论假设:说话者和听者的语用能力和理性能力均为最佳;说话者和听者具有相同的知识背景、信息兴趣和推理能力)
我们假定说话者有两种可能的意图, M1:我在池塘里的时候, 看见了他。M2:我看见他的时候, 他在池塘里。
而听者相对应的也有两种理解上的策略M1和M2。
在这个对话理解中, 存在着四种理解上的可能性, (M1, M1) , (M2, M2) , (M1, M2) , (M2, M1) 。达到的纳什均衡有两种: (M1, M1) , (M2, M2) 。经过听话人对说话人语言的选择、协商直至顺应说话人的说话背景后, 此时出现了多纳什均衡, 这就为理解顺应语境下的语言增加了难度。
(2) 如法庭上, 法官:被告, 你承认所犯下的罪行吗?
被告:我承认。
对被告罪行的判断现在也会出现误判, 有时候证据表面指向被告, 但原因却是被告可能由于种种原因 (如维护他人) 故意混淆视听而为之, 并对罪行供认不讳。此时, 两方对语言的选择、协商也一样是为了顺应自身利益, 实现自身利益最大化。法官根据表面证据急于定案, 被告也愿意将自身定罪, 事实便在这里出现歪曲现象。表面双方策略的选择顺应了语境, 也达到了彼此的“纳什均衡”, 事实却与之大相径庭。这也就对语言顺应论提出了更高的要求, 表面上的顺应达到均衡, 也并不算是最优化, 如果要将其运用到各种现实语境中, 对语境、对话人背景的考量也是不可忽视的一部分。
(3) 如女方:如果我和妈妈同时掉进水中, 你先救哪个?
男方:先救未来的妈妈。
这是一则恋爱关系中男女双方的小对话, 女方提出的问题希望听取到的答案肯定是希望自己被救, 而男方语言机智, 他可以选取答案“救你”、“救妈妈”还是“救未来的妈妈”。他灵活运用策略, 选取了最后最为灵活的答案。“未来的妈妈”可以指代女方本身也可以指代岳母或者自己的妈妈, 这样女方会满意, 双方妈妈也都没有得罪。是博弈中选择、策略均较好的案例, 顺应了语境。
由上可以看出, 交际对话中并不能总保证语言双方的交流效果达到最优化。即便是经语言顺应论中三步曲语言选择、协商直至顺应达成的“纳什均衡”, 有时也不一定是占优“纳什均衡” (经济术语中称作“帕累托最优”) 。一次言语交际博弈能够达到纳什均衡, 只能说该博弈获得了解, 但仍无法说明成功交际的目的是否有达到。
同时, “多纳什均衡”在语言交际中的出现也会对语言交际效果最优化产生影响。这便需要我们对相应语境作出全面的了解。语言交际的双方都会受到语境的影响 (这里指的是广义的语境, 不仅包括语言语境, 还包括自然语境和社会语境) 。而一成功的言语交际, 则在很大程度上依赖于语言博弈模型中奕者对策略的选择。每一奕者策略的选择都不仅受到自身条件的限制, 同时还受到其他奕者策略的影响。更重要的是, 这仍需要我们在具体的语言环境、双方地位、学术水平的基础上做出相应的判断。我们还需要寻求交际方式、如何优化改进, 达到最优的“语言纳什均衡”。
目前, 博弈论是研究理性行动者相互作用的形式理论, 被各门社会科学研究所应用, 深刻改变着人类的思维。无论大到经济活动中的企业经营、市场竞争还是小到个人生活中的夫妻争吵、家庭聚会、朋友约会还是与陌生人交谈, 语言博弈无处不存在, 相应的语言顺应论应用也自不会避免, 如何在语言顺应论视角下更好地将“纳什均衡”运用到语言交际并达到占优均衡, 仍有很大的研究空间并需进一步探索。本文仅是尝试在这交叉领域进行一小步探讨, 希望能真正跳出圈子进行交叉研究。
参考文献
[1]丁社教.法制博弈分析导论[M].西北工业大学出版社, 2007 (4) .
[2]董明.谈“语言博弈”中否定的使用[J].北京师范大学学报 (社会科学版) , 1995 (6) :87-91.
[3]何自然, 于国栋.语用学的理解-Jef Verschueren的新作评价[J].现代汉语, 1999 (4) .
[4]吴炳章.交际博弈论—一种认知语用学的理论框架[D].河南大学研究生博士学位论文, 2009.
[5]吴诗玉.语言交际的博弈论解析[EB/OL].上海交通大学“985工程”外语学院二语习得研究平台. (2008-06-22) [2010-03-21].http://sla.sjtu.edu.cn/www/6/2008-06/6.html.
[6]向明友, 夏登山.民俗语用学-语用学研究的新视角[J].外语研究, 2001 (4) :23-24.
模糊二人零和对策的纳什均衡求解 篇5
关键词二人零和对策;三角形模糊数;区间数;多目标线性规划
中图分类号C934 文献标识码A
The Solution of the Nash Equilibrium
of Fuzzy TwoPerson ZeroSum Game
AN Jingjing1,2, NAN Jiang xia1,2,BO Hong1,2
(School of Mathematics and Computing Science, Guilin, Guangxi541004,China;
Guangxi Colleges and Universities Key Laboratory of Data Analysis and Computation,
Guilin University of Electronic Technology, Guilin, Guangxi541004,China)
AbstractThe payoffs of twoperson zerosum game were presented as triangular fuzzy numbers. We presented a new methodology for solving twoperson zerosum games with payoffs of triangular fuzzy numbers. Based on the ranking of interval, we provided a new ranking method of triangular fuzzy number. Then the solution of the fuzzy twoperson zerosum games can be obtained through solving a pair of multiobjective linear programming models. The validity and applicability of the proposed methodology were illustrated with a numerical example.
Key wordstwoperson zerosum game; Triangular fuzzy number; Interval; Multiobjective linear programming
1引言
关于支付值为三角形模糊数的二人零和对策[1](简称模糊二人零和对策)已有大量的研究和应用,Bector et al.[2],Campos[3],Campos et al.[4]都是运用一种模糊数的排序方法将支付值中的模糊数进行去模糊化转化成实数,进而把原问题的模糊线性规划模型转化为求解一般的线性规划模型,这样求得的对策值是一个实数.因为局中人的支付值是模糊数,所以在模糊二人零和对策中,局中人的最优策略和对策值也应是一个模糊数.目前只有少量的文献涉及这部分的研究.Clemente[5]运用了标准排序函数将模糊二人零和对策的模糊线性规划模型转化为与之等价的多目标线性规划模型,利用这种排序函数所得最优解也是模糊数.Li[6]研究了支付值是三角形模糊数的约束二人零和对策,证明了局中人的对策值与支付值满足单调线性关系,运用模糊数的0-截集和1-截集,通过求解三个线性规划模型得到局中人的最优策略和对策值,所求得的局中人的最优策略和对策值也是一个三角形模糊数.提出了一种新的基于区间数比较的三角形模糊数的排序方法,将支付值为三角形模糊数的模糊二人零和对策的求解转化为一个含有参数α的多目标线性规划模型,所得最优策略和对策值是三角形模糊数.
本文组织结构如下,第二部分是预备知识,给出了三角形模糊数的定义、截集及运算法则,介绍了区间数的比较,并提出了一种新的基于区间数比较的三角形模糊数的排序方法.第三部分运用三角形模糊数的比较方法将模糊二人零和对策的求解转化为求解带有参数α的多目标线性规划模型.第四部分给出了关于商业销售策略选择的一个数值实例,并建立模型,给出了数值结果.
经济数学第 32卷第3期
安京京等:模糊二人零和对策的纳什均衡求解
2预备知识
2.1三角形模糊数的截集及运算法则
定义1设=a,a,是一个三角形模糊数,那么它的隶属函数定义为