非合作可能性博弈

2024-08-11

非合作可能性博弈（精选7篇）

非合作可能性博弈篇1

所谓“一事一议”,是指在农村兴办农田水利基本建设、植树造林、修建和维护村级道路等集体公益事业时,所需要的资金和劳务要通过村民大会或者村民代表大会集体讨论、研究,实行专事专议的办法筹集部分资金。当前,“一事一议”制度已成为农村社区公共产品供给的重要运行机制。

一、农村社区公共产品供给机制“一事一议”由来以及博弈主体特征

建国以来,我国农村公共产品供给制度经历了数次变迁。在人民公社制度时期,作为既是行政组织又是经济政治的人民公社具有提供公共产品的组织优势。但改革开放后,家庭联产承包责任制取代了人民公社制度,乡镇政府成为政权实体,而不再是经济组织,乡村财政可支配的经济资源与改革前相比已十分有限。由于现实的需要,农村社区形成了向农民分摊公共产品的货币成本(乡统筹、村提留)、以及活劳动方式的人力成本(义务工和积累工,即“两工”)并存的农村公共产品供给体制。然而,由于农村行政体制改革等不配套等原因,这种公共产品供给制度逐渐蜕变为乡、村两级政府为了自身利益向农民伸手、损害农民利益的工具。为了减轻农民负担,中央2000年开始在安徽推行税费改革试点,在《安徽省农村税费改革试点方案》中,明确规定到2003年取消“两工”,取消“两工”后村内兴办集体和公益事业,要通过村民大会或者村民代表大会集体讨论、研究,采取“一事一议”的办法筹集部分资金,地方政府应对村内实行“一事一议”的生产公益事业的投劳数额实行上限控制。

“一事一议”制度作为我国农村社区公共产品供给机制,实际上体现了中央、地方和农民利益安排的一种博弈均衡。根据李琴等分析:农村税费改革后,中央政府作为强博弈主体,其利益并没有受到损伤,而是通过其强大的政治权力把维护公共产品建设职能推给了乡镇政府和农民,从而形成了基层政府财权和事权不对称的“中央请客、地方买单”的格局[1]。另外,基层政府实际上包括乡镇政府和村级组织,因为村民委员会名义上是自治组织,但事实上成为乡镇政府的派出机构,成为政府职能行使的组织保障,其运行原则与乡镇政府基本相同。“一事一议”制度虽然作为我国农村社区内的公共产品供给机制,但实际上体现基层政府与农民的关系。因此在分析农村社区公共产品博弈过程中,博弈过程发生在基层政府与农民、农民与农民之间;中央政府作为博弈“局外人”,但在政策建议中,中央政府可调整政策以便解决问题。

(一)基层政府特征

1. 按照经济学“理性经济人”的基本假设,任何政府行为主体在其行动过程中都会追求自身效用最大化,而基层政府由于层级低,制度约束弱,监督成本高,自利性明显。

2. 在基层政府与农民长期博弈过程中,乡镇政府依靠其权力控制和信息不对称一直取得博弈优势,长期处于劣势的农民对乡镇政府最终会选择消极态度。而中央政府出于对弱势农民的保护,禁止基层政府对在公共产品供给中不合作农户实施惩罚,导致基层政府博弈优势丧失。

(二)农民特征

中国农民除了是“理性小农”,趋利避害外,同时,还具有以下表现。

1. 农民日趋“原子化”,组织和监督成本过高当前农村社区社会关联程度低、组织性差,组织和监督成本过高。一个行政村人数众多又缺乏有效监督机制时,村民们完全可以在不付任何代价的情况下,享受通过其他人的捐献的公共产品的效益。行政村成员越多,人们“搭便车”心理就越强,造成缺乏“有选择性激励”动力机制。

2. 特殊公正观。贺雪峰认为,在行动中,农民往往不是根据自己实际能够得到的好处来计算得失,而是根据与周围人的收益比较,来权衡自己的行动,不在乎自身得到多少及失去多少,而在于其他人不能白白的从自己的行动中得到额外的好处,农民的这种心理构成了他们特殊的公正观念[2]。吴理财认为:农民的这种特殊观念看起来是不符合“经济人”的理性思维逻辑的。实际上,它更多的是农民一种正常的理性反映。在很大程度上,农民就是以承担这种极具反差的“损失”来惩罚其他村民的搭便车行为,以此来维护村庄共同体的公正[3]。

二、“政府失灵”与“市场失灵”———农村社区公共产品提供的两个非合作博弈过程分析

取消农业税后,农村公共产品的短缺之所以成为当今农村的一个突出问题,是因为存在着农村公共产品供给的“政府失灵”与“市场失灵”。农村公共产品提供在短期和静态层面上主要取决于乡村基层政府与农户之间的博弈过程以及各个农户之间的博弈过程。

(一)“政府失灵”———基层政府与农户之间的博弈

笔者所指的“政府失灵”,不是指由于政府行为的干预失效,而是指取消农业税后基层政府的不作为现象。罗兴佐教授认为:“政府失灵不是由于政府干预过多或干预不当,而是由于政府长期以来执行一种“放”与“甩”的策略,导致农业基础设施建设投资严重不足”[4]。周飞舟指出:税费改革后基层政府已从“汲取型”政权演变成“悬浮型”政权[5]。这里也可以用表1来说明他们的博弈均衡。

如表1中所示,“汲取型政权”基层政府的支出秩序为:支付日常办公费用、工资福利发放、农村公共产品、偿还债务。因为在“汲取型政权”时期:(1)日常办公费用、工资、福利发放的多少与农民的税费交纳是联系在一起的,而只有提供农村公共产品才能要求农民交纳税费。一般领导者会首先满足自己的日常办公费用,政府工作人员的工资、福利发放要与催缴农民税费挂钩。(2)基层政府依靠其权力控制和信息不对称优势,会选择对其有利的博弈路径,利益自我膨胀。农民税费交纳后,将出现过度的日常办公费用和工资福利,又导致只能部分农村公共产品建设(“放”与“甩”的策略)。(3)支付日常办公费用、工资福利发放、部分农村公共产品建设又导致新的债务,只能期望下一次的农民税费交纳偿还债务或者借新债偿还部分旧债。

而在基层政府为“悬浮型”政权时,支出秩序为:工资支付、日常办公费用、福利发放、偿还债务、农村公共产品建设。因为税费改革后:(1)政府工资发放、日常办公费用来自于财政转移支付(基层政府称“吃饭钱、死钱”,意思是不够、不能随便支用),福利、日常办公费用的富裕程度主要取决于当地的工商税收,因此基层政府的精力会集中于招商引资。(2)当前大部分中西部农村地区基层政府有很大一笔债务(有专家认为全国基层政府大约有3000-5000亿,周飞舟更是指出:为了满足日常办公费用,基层政府债务有扩大的苗头)[5],这已经是令人很头痛的事了,更无财力进行公共产品建设。(3)“一事一议”提供公共产品有着负激励:即使农民愿意提供“一事一议”费用,一般也需要基层政府自筹部分资金。根据安徽省现行政策,农村的六小工程、村村通工程、自来水工程等公共产品的提供,基层政府申报得到审批,可以从省或市或县争取到工程建设预算金额一半的数额,另一半则需要自筹。由于“一事一议”制度规定了筹资上限是15元/农民,一般大一点的公共产品建设基层政府都必须自筹资金。同时,只要有提供公共产品的过程,基层政府就必须参与管理所要付出的管理成本和组织村民起来举行“一事一议”之类的公共决策必须付出的协调费用;因此,政府也会报着“多一事不如少一事”。同时,长期处于劣势的农民对乡镇政府行为往往会选择消极的非合作态度,而一旦农民拒绝交纳“一事一议”费用,基层政府只会选择不提供。

(二)“市场失灵”———农户与农户之间的博弈

这里的农村公共产品供给“市场失灵”,是指政府执行“放”与“甩”的策略,把部分农村公共产品供给(基本上是“一事一议”制度规定的农村公共产品内容,美国公共选择学派创始人布坎南称之为俱乐部产品)推向社会,并美其名曰:市场资源最优配制。解决社区这些俱乐部产品供给特别需要社区人们之间的合作,然而,当前农村社区的农民“原子化”,农户与农户之间的合作已陷入了“困境囚徒”,导致“市场失灵”。这里用博弈论中的“市民责任博弈框架”[6]来分析农户与农户之间的博弈。

图1展示了农户与农户之间的博弈过程,博弈的基本要素有:(1)局中人:农户A和农户B;(2)策略组合:选择提供和选择不提供。这里假设农户从农村公共产品的使用中可得到收益为10,但他俩若选择提供公共产品,只要各支付成本3(根据现行政策,农村的六小工程、村村通工程、自来水工程等公共产品的提供,基层政府申报得到审批,可以从省或市或县争取到工程建设预算金额一半的数额,另一半则需要自筹。付出成本3是在村民举行“一事一议”讨论提供公共产品,向村民收取多少建设成本的合理假设)。该博弈有两个纯策略均衡和一个对称的混合策略均衡。在解博弈为混合策略均衡时,设两个局中人变为N个。在这个博弈的N个局中人的情况下,若都无人提供公共产品,则农户A的支付为0,若他选择提供公共产品则其支付为7,若他选择不提供公共产品而公共产品又被提供出来,则其支付为10。根据农民责任博弈框架,如果所有局中人都以同样的概率q来选择不提供公共产品,那么除农户B之外的N-1个局中人都选择不提供的概率为qN-1,因此,他们之中有人选择提供公共产品的概率为1-qN-1。使用计算均衡的支付均等化方法将农户B的纯策略的支付设为相等,有:

由以上方程解得:

方程(a),因此

若N=2,则农户B选择不提供的概率为0.3,但随着N的增加,农户B的期望支付始终是7,因为他的期望支付总是等于他由纯策略提供所得的支付。然而,他选择不提供得概率会随着N的增加而增加。当一个行政村的村民更多时,每个局中人都会越来越指望别人去提供公共产品,而自己尽量选择不提供。这样,无人选择提供的概率就为q*N。方程(a)表明,q*N-1=0.3,这显然是随着N的增大而增大的。其实当N=38位时,无人选择提供的概率为0.29,因为q*大约是0.97。即当一个公共产品提供博弈的局中人,即一个行政村的村民越来越多时,农户选择提供公共产品的概率就越小。

作为理性经济人,即使是愿意提供资金的农民,在特殊公正观作用下,也会促使他们选择“搭便车”。因此,在“一事一议”自愿捐资的制度安排下,基层政府没办法对农户“搭便车”实施强有力惩罚的情况下,农村公共产品的供给量就会严重不足,远远低于其应有的最佳水平。

综上所述,取消农业税后,在“一事一议”筹资机制下,农户选择了不提供,基层政府也选择了不提供,即“选择不提供,选择不提供”成为唯一的纳什均衡。这就是说,在这两个非合作博弈中,如果没有中央和上级政府的扩大转移支付和行政命令,我国大部分贫困乡村的农村公共产品提供将会严重不足,如今我国大部分贫困地区的农业和生活基础设施至今还比较落后就是一个很好的例证。

三、从非合作博弈到合作博弈

以上两个非合作博弈,锁定了全面取消农业税后,农村公共产品的供给困境。农村公共产品需求者是广大农民,这样的困境,隐含的政策是把提供公共产品的责任推向单个农户。当然,解决困境绝不是退回原来的“计划经济时代”,公共产品的属性也不可能“完全市场化”。奥斯特罗姆认为:摆脱这种困境需要“多中心治理”:明确国家、市场和公民社会责任,公共部门、私人经济部门和第三部门之间正在形成一种相对独立、分工合作的新型治理结构。“这种制度安排中,对公共资源的治理是由一群相互依赖的委托人自己把自己组织起来进行自主治理的,这样才能在所有人都面对搭便车、规避责任或其他机会主义行为的诱因下,取得持久的共同收益。”[7]因此,我国中央和基层政府需要调整政策,使基层政府与农民、农民与农民之间从非合作博弈到合作博弈。

(一)积极引导农民组织化,使农民与农民之间从非合作博弈到合作博弈

要克服农民的“搭便车”心理,一是发挥激励机制,即激发他们的责任感和荣誉感。基于乡村社会现在基本上还是熟人或半熟人社会,讲求面子和人情世故,可以创新多种激励形式。如可以在生产农村公共产品,鼓励经济条件比较好的村民带头提供资金;宣传“捐资办学,造福桑梓”、“铺桥造路,功德无量”、采用刻碑、评优等等方式,筹措尽量多的资金。二是农民组织化。根据西方经济学理论,由于搭便车问题,自愿捐资和成本分摊的合作融资方式不能保证公共产品的有效供给。在一次次的发动捐资中,总有一些“不食人间烟火”的村民不捐,如果一次次得逞就会破坏激励机制。因此,根据奥斯特罗姆的“多中心治理”理论中社区组织在社会服务功能方面积极作用的启示,我国的各级政府必须正视农民的“原子化”趋势,积极引导农民组织化,大力发展各种合作经济组织,让农民在组织中获得利益,为今后由各种农民合作组织来提供农村社区公共产品打下基础,也为政府避免同众多农民交易而减少交易成本创造条件。

(二)培育多元的供给主体,使基层政府与农民之间从非合作博弈到合作博弈

公共产品供给机制的核心是筹资机制。针对取消农业税后乡村财政困难而无力保障农村公共产品有效供给的问题。政府的政策应该从培植财源和节省其他开支入手,尽量满足农村公共产品有效提供的资金需要。在当前财政收入一定的情况下,进行机构改革和节省其他方面开支以确保农村公共产品投入资金的空间已经很小,发展村集体经济和乡镇工商业经济以增强乡镇财政和农村社区财力又有着20世纪八、九十年代的历史隐痛。因此,在我国民间资本已成规模之时,政府政策的着力点是培育多元的供给主体,积极引导民间资本进入农村公共产品领域,增加农村公共产品供给筹资渠道。当然,如何委托、规范民间资本的投机性将是基层政府、农民共同与民间资本之间的长期博弈。

(三)中央政府应确立公共财政理念,理顺各级政府的公共产品供给责任

从公共财政理论上讲,全国性公共产品应由中央政府提供,地区性公共产品应由地方政府提供,而社区公共产品应由社区提供。因此,国家应根据农村公共产品的不同性质,按照财权与事权相统一的原则,建立起由中央、省、县、乡、社区四位一体的农村公共产品供给体制。当前要做好两方面工作:一是用法规形式规定公共产品供给支出占各级财政支出的比重,确保农村公共产品供给有稳定的资金来源;二是让“公共财政的阳光”普照乡村。当前的农村公共产品供给短缺,从根源上讲,是长期的城乡二元结构,农村公共产品“体制外供给”造成的。城乡统筹、“工业反哺农业”要求“公共财政的阳光”普照乡村,目前在县乡财政比较困难的情况下,应采取以中央、省两级政府财政为主导,地方财政适当配套的方式,着重解决好与当前农业经济发展和农民生活紧密相关的公共产品供给问题。在此基础上,根据城乡统筹进程,实时开征新的税种,确保财政筹资能力不断提高,并将新征税收大部分留给基层财政,以保证其有足够资金提供农村公共产品。

参考文献

[1]李琴.利益主体博弈与农村公共品供给的困境[J].农业经济问题,2005(4):34.

[2]贺雪峰.熟人社会的行动逻辑[J].华中师范大学学报,2004(1):5.

[3]吴理财.对农民合作“理性”的一种解释[J].华中师范大学学报,2004(1):9.

[4]罗兴佐.治水:国家介入与农民合作[M].武汉:湖北人民出版社,2006:134.

[5]周飞舟.从汲取型政权到“悬浮型”政权[J].社会学研究,2006(3):1、33.

[6]谢识予.经济博弈论[M].上海:复旦大学出版社,2002:119.

[7]埃莉诺.奥斯特罗姆.制度激励与可持续发展[M].上海:上海三联书店,2000.

非合作可能性博弈篇2

关键词：非合作博弈物流园区协同发展

▲▲一、物流园区协同发展所存在的问题

（一）我国的物流园区的发展还是有很多方面需要改进的，因为无论是从理论还是实践上都不难发现它的发展存在很多不足是一种还没有发展成熟的产物。大体上看，物流园区在实践上的发展是要高于理论上的发展，认识往往是不全面的。因而就会对物流园区的发展有一个误导作用，使得它的建设或是运营与实际不相符。还有一个很严重的问题就是存在很多的物流园区的定义会使得人们对他的所在位置产生错误的判断。

（二）行政色彩非常明显。在布局上不断的规范化、需求上进行相应的预测、规模上加以确定、科学的进行选址、开发及赢利模式等方面是理论研究所涉及的内容。这些大部分都是仅仅把单一物流园区作为研究的对像来研究。但是却又把物流园区列入区域物流网络体系的重点，但是对于这两个方面现在所进行的研究的研究者还不是很多。无论是在规划还是在运营上都是块状的。考虑的角度还是个体及单个物流园区。并没有考虑到其周边地区经济可能产生的影响。在建设上没有做好，首先就表现在层次建设上，层次不好，所产生的联动效应不明显。

▲▲二、在非合作博弈的我国物流园区所进行的互动过程

每个博弈方都很具理性，他们会是可以实现自身利益最大化为目标，来对其他方进行各种能预期。判断出他们所可能采取的行为策略，然后再做出自己的决策，通过这样来使自己的得利益最大化。这里有两个过程来对其进行分析：

（一）库诺特（Cournot）博弈模型是针对其投入规模而设定的。对他进行的假设大体如下：

1、因为物流园区具有很多属性，例如：排斥他物性、相互的竞争性、外部性等等。他的目的是为了盈利，因而是一种经营性的活动而不是公益性的活动。换言之其是以经营性为主导的。如过一共有n 个物流园区在研究区域，一个博弈方就是一个物流区域，他们所能选择的物流园区投入规模就是他们各自的策略空间qi，且这是一个连续可微的值。所以每个博弈方都有数之不尽的可选策略 si= [0，pimax]，i=1，2，…，n。

2、一定对象一定环境里的物流需求是有限的。如果各博弈方在同一时刻且在决策中互不干扰。让 ci（i=1，2，…，n）做为每个博弈方的边际成本，μi（i=1，2，…，n）是各博弈方的固定折旧成本，看做一个常数，如果他们的折旧年限一样。所以，这个博弈中每个参与方的得利益ui（i=1，2，…，n）就是他们自身的销售收益减去自身的成本：ui= qi·fi = 1Σqi）- iqi- μii =1，2，…，n可以得出这一结论，每个博弈方的得利益由其他博弈方的策略所决定，随便一个博弈方r的策略qr*都是对其它博弈方策略的组合（q1，q2，…，qr -1，qr+1，…，qn）的最好的策略，自然就是这个博弈的纳什均衡解。可以发现，这样所获得的总体利益是最高的，尽管总规模还是不大。但是比起单独决策、仅仅考虑自身却不考虑共同利益最大化的博弈结果相比的话还是有很大进步的。

（二）伯特德（Betrand）博弈模型是应用于其服务水平上的。这个的模型基本假设

1、有n个物流园区柱在研究区域，并且都以经营性为他的主体而不是公益性。如果每个物流园区所给的物流服务内容是不存在不同的，在一些方面适可替代的，对它做一个统一化改造，用不同的“价格”p1，p2，…，pn来表示各个物流园区物流服务水平的不同。

2、如果每个博弈方在同一时间且在决策上不受干扰。让每个物流园区的需求函数为 qi= fi（p1，p2，…，pn），大都有：qi= a-bipi+（j = 1，j≠iΣ djpj）ai，bi，dj> 0当中，dj是指每个物流园区之间的服务替代系数，用来表示差别服务的特点。用ci（i = 1，2，…，n）表示每个博弈方的边际成本，μi（i=1，2，…n）是各博弈方固定折旧成本，用常数表示，且如果没物流园区有相同的折旧年限。所以，这个博弈中每个参与者的得利益i（i=，2，…，n）就是他们本身的销售收益减去各自的成本。i= piqiciqi- μii=1，2，…，n=（pi- ci）（ai- bii+nj=1，j≠iΣdjpj）- μi相同的，每个博弈方的得利益是由其他博弈方的策略决定的，任何一个博弈方r的策略pr*都是对其它博弈方策略的整合（p1，p，…，pr -1pr+1，…，pn的最好的策略，那么这个博弈的纳什均衡解一定满足max uii=1，2，…，n。pi令坠ui坠pi=0，就可得到这个方程组唯一的解（p1*p2*，…，pn*），也就是博弈的纳什均衡解。那么在仅有两个参与方的博弈中，有这样的关系：p1*=12b1（a1+ b1c+ d1p2*）p2*=12b2（a2+ b2c+ d2p1*）算出这个参与方之间博弈的均衡结果是：1*=d14b1b2-d1d2（a2b2c）+2b4bbd1d2a1+ bc1）2*=d24bb-d1（a1+ b1c1）+11b2- d12（a2c）（p1*，p2*）就是这个参与方之间博弈的均衡结果。

▲▲三、结语

非合作博弈实际上是不能够很好地推动经济的发展，也会导致整个物流业效益下降，因为在他的观念里是以个体为单位的，所以要想实现物流业的发展，就需要改变之前的那种模式，要更好地促进相互之间的合作才是关键。这样方能很好地提高资源的利用率。那么对于物流园区就该有个新的发展思路，即协调性发展合作性发展，使各个区域内的物流园区进行联合，尽可能的建立一个物流园区联盟会，这样一来就能实现很好的互动，就能更好地推动物流园区的发展。

参考文献：

[1]武天竹.物流外包风险探讨[J].现代经济信息，2011 .

[2]刘伯超，王晓明，夏平.企业物流外包风险分析方法综述[J].合作经济与科技，2012

[3]赖卫东.企业物流外包的风險及其法律防范[J].中小企业管理与科技（下旬），2010.

非合作可能性博弈篇3

作为无线资源管理的关键技术之一的功率控制, 引起了人们广泛地关注[1,2,3,4,5,6,7,8,9,10,11]。集中式的功率控制算法由于需要整个系统的链路信息来控制系统的功率分配, 越来越难以实现。另外, 有些网络系统, 如Ad Hoc网就不适于采用集中式的功率控制, 所以研究分布式功率控制就更具有实际意义。一个有效的功率控制算法对整体系统性能的提高是至关重要的。但在分布式的环境下, 各用户之间是相互独立的, 甚至是“自私的”, 他们更多关心自身性能的改善, 且在资源分配上相互之间存在分歧和冲突。针对这一系列问题, 人们适时地引入了博弈论, 为解决干扰系统中的功率控制提供了新途径。非合作博弈功率控制的主要思想是假设所有的参与者具有完全理性且相互独立的策略选择, 然后根据不同的优化目标设计不同的效用函数, 并对其进行最优化求解, 使得每个用户“自动”地达到系统所期望的性能, 即博弈论中的 “纳什均衡”。在已有的文献中, 人们由于优化的出发点不同, 使得所设计的博弈功率控制效用函数千差万别。基于此, 本文的主要工作是从优化目标的角度, 对已有的研究成果进行分类和分析。

1干扰系统模型

我们给出一个MIMO干扰系统, 共有L个发射终端随机分布其内, 并与L个接收终端一一对应, 构成L条传输链路 (信道) 。各发射端配有Nt根天线 (各发射端发射天线数可不同, 方便起见, 这里假设各发射端具有相同发射天线数) , 各接收端配有Nr根天线, 只考虑单用户检测技术, 则发射端k在其对应接收端上接收到的信号可表示为:

undefined. (1)

其中, xk是终端k的发射信号, ρk是终端k的归一化发射功率, ηk, l是终端l相对于终端k的接收信号所产生的干噪比 (INR) 。Hk, l是终端l的发射端与终端k的接收端之间的Nr×Nt维复信道矩阵。nk是接收终端k处的循环对称复高斯噪声向量, 且E[nknundefined]=I。具体的系统模型如图1所示。需要指出的是, 当多个发送终端拥有共同的接收终端时, 干扰信道退化为多接入信道, 或称为上行信道。

2基于博弈论的分布式功率控制及应用策略分析

考虑干扰系统中, 任意终端为提高自身性能而调整发射功率时, 都会对其它用户的性能造成不同程度的干扰。传统的分布式功率控制算法, 如信干比平衡算法等, 当运用到多小区、多天线或Ad Hoc网时, 会导致收敛速度慢, 对发射功率增加的限制性不强, 有时甚至无法获得可行解。因此, 人们引入了博弈论来解决。本节从优化目标的角度对下列四种效用函数算法进行总结分析。

2.1基于互信息量的效用函数

根据第二节中的MIMO干扰系统模型, 可将终端k所获得的互信息量表示如下:

I (xk, yk) =log2det (I+ρkR-1/2kHkQkHHkRundefined) , k=1, …, L. (2)

其中, Qk=E[xkxundefined]为终端k发射信号的协方差矩阵, undefined为接收端k接收到的总干扰噪声协方差矩阵。

文献[1,2,3,4,5]以各发射端发射信号的协方差矩阵为博弈模型中的参与者, 且策略空间定义为undefined半正定Hermitian阵且tr (Q) ≤PT}, 则以互信息量为优化目标且发射功率受限的MIMO干扰系统中的非合作博弈功率控制模型中终端k的收益函数可表示为:

Uk (Qk, Q-k) =log2det (I+ρkR-1/2kHkQkHHkRundefined) ,

k=1, …, L. (3)

其中, Q-k表示Q中去除Qk后的矩阵集。在这个博弈中, 各个终端都是理性且自私的, 在策略的选择中更多地关心如何最大化自己的收益, 因而可将这个博弈表示如下:

undefined. (4)

具体而言, 文献[1]研究的是使MIMO干扰系统减少干扰的最优发射信号向量问题。文献[2]在此基础上, 对发射信号进行了一定的线性变换, 使得各终端从系统的角度, 以合作的行为, 对各自的发射天线进行选择, 以优化系统整体性能。文献[3,4]研究的是如何达到MIMO系统中多接入和容量的分配策略。另外, 值得一提的是以上的博弈过程都是在假定信道状态信息 (CSI) 均完全获知的前提下采用迭代功率注水的方法进行的, 各发射端Qk的更新取决于Rk与Q-k。为了更易于在分布式系统中实现, 每次迭代中每个发射端轮流更新, 且更新过程中Rk和Q-k保留上一步的值。即便这样, 上述收益函数中纳什均衡的求取仍无闭式解, 纳什均衡的存在性也需要一些条件的保证, 且会涉及大量矩阵求导﹑矩阵相乘, 运算复杂。

另外, 文献[5]考虑了信道状态信息不知道的情况。它主要针对单用户MIMO系统而言, 将其建模成基于互信息量的零和博弈。根据其特点以及实际环境下信道总是恶劣的特性, 博弈模型中的参与者为发射信号的协方差矩阵和恶劣的信道。其实质是最大最小化问题, 具体的博弈模型可表示为:

undefined. (5)

通过证明可知, 此时的纳什均衡解为每根天线上功率值的平均分配, 即Q*=PT/NtINt。

2.2目标容量确定下的效用函数

目标容量确定下干扰系统中的分布式功率控制博弈模型, 它的实质是容量限制条件下总发射功率的最小化问题。具体表示为:

undefined, subject to log2det (I+

ρkR-1/2kHkQkHHkRundefined) ≥ck, k=1, …, L. (6)

其中, ck为终端k的目标容量, 其接收端所获得的信号以及各符号所代表的含义均同上。在文献[6]中, 每个发射端分别采用迭代注水算法来调整自己的协方差矩阵, 直至每个终端都达到目标容量。在文献[7]中, 先将干扰项奇异值分解, 并代入 (6) 中, 取变形后的约束条件的等式关系, 从而导出最小化发射功率的显式表达式, 并作为该博弈模型的效用函数。该算法相较于注水算法而言, 其发射功率总和基本趋于一致, 迭代收敛速度也趋于一致, 但运算复杂度大大降低。

2.3目标信干噪比确定下的效用函数

目标信干噪比确定下MIMO干扰系统中的分布式功率控制博弈模型, 它的实质是信干噪比限制条件下总发射功率的最小化问题。具体表示为:

undefined, subject to γk, min≥Γk, k=1, …, L. (7)

其中, Γk为终端k的目标信干噪比, γk, min为发射端k在接收端经过线性MMSE接收机后所获得的SINR的下界。此外, 接收端所获得的信号及各符号所代表的含义均同上。该博弈模型以各终端均能达到目标信干噪比的前提下, 最小化总发射功率为优化目标。于是令每个终端的接收信号在经过线性MMSE接收机后的SINR的下界为该用户接收端的目标信干噪比, 可导出各发射端发射功率的下界, 类比于SISO系统可得效用函数, 从而得到发射功率的更新表达式。由于所获得的更新表达式满足广义更新算法 (GUA) , 因此若纳什均衡存在则必唯一。该算法相较于注水算法而言, 计算复杂度大大降低, 且在低信干噪比时系统平均吞吐量优于注水算法, 但在高信干噪比时其系统平均吞吐量很容易下降到零, 成为容量的不可达区域。

2.4基于效率的效用函数

该效用函数的物理含义是求取各终端单位功率下的归一化吞吐量的最大值。它能使系统中各终端依据其它终端的发射策略, 谨慎地选择自已的最佳发射功率策略, 以期最大化各自的收益。具体而言, 在文献[10]中, 若令γk, i为终端k的第i根天线上的信干噪比, Pk为终端k的总发射功率, 则其效用函数可表示为:

undefined. (8)

其中, f (γk, i) 表示成功发送率, 同时还假设各发射端的天线上都采用平均功率分布, 即Pk, j=Pk/Nt。经证明, 它是超模博弈, 故纳什均衡点必存在, 且它能有效抑制各用户对发射功率的盲目追求。但它在接收端只考虑各终端对应天线之间的干扰, 未考虑系统中终端自身天线间的干扰。此外, 假设每个发射端的发射天线上的功率都采用平均分布, 这样不能很好地运用空间分集, 且对于同一终端, 为了满足信道状态不好天线的QoS要求, 信道状态好的天线所获得发射功率必然比实际要求的多, 这无疑会增大系统中的干扰。

3结论

本文从优化目标的角度, 对现有的MIMO系统中非合作博弈功率控制问题进行了分类和总结。主要从基于互信息量的效用函数, 目标容量确定下的效用函数, 目标信干噪比确定下的效用函数, 以及基于效率的效用函数这四个方面对各自的算法进行了总结分析。综上所述, 它们各有侧重, 各有利弊。所以进一步研究和设计更有效、更具一般性的效用函数是今后研究的重点。

参考文献

[1]Ye S, Blum R.Optimized Signaling for MIMO InterferenceSystems with Feedback[J].IEEE Trans Signal Process-ing, 2003:2839-2848.

[2]Arslan A, Demirkol M F, Song Y.Equilibrium EfficiencyImprovement in MIMO Interference:A DecentralizedStream Control Approach[J].IEEE Transaction on Wire-less Communications, 2007, 6 (8) :2984-2993.

[3] Yu W, Rhee W, Boyed S, et al.Iterative Water-filling for Gaussian Vector Multiple Access Channel[J].IEEE Trans Comm, 2006:748-759.

[4] Yiping Xing, Chandramouli R.Distributed Discrete Power Control in Wireless Data Networks Using Stochastic Learning[J].In Proc of ICC, 2004.

[5] Palomar D, Cioffi J, Lagunas M.Uniform Power Allocation in MIMO Channels:A Game-theoretic Approach[J].IEEE Trans Inf Theory, 2003:1707-1727.

[6]Yu W, Ginis G, Cioffi J M.Distributed Multiuser PowerControl for Digital Subscarrier Line[J].IEEE J Select Ar-eas Commun, 2002, 20 (5) :1105-1115.

[7]Duong Hoang, Ronald A.Iltis.Noncooperative Eigencod-ing for MIMO Ad Hoc Networks[J].IEEE Transaction onSignal Processing, 2008, 56 (2) :865-869.

[8]Runhua Chen, Jeffrey G, Andrews, et al.Uplink PowerControl in Multi-cell Spatial Multiplexing Wireless Sys-tems[J].IEEE Transaction on Wireless Communication, 2007, 6 (7) :2700-2711.

[9]Adrian Agustin, Olga Munoz, Josep Vidal.A Game Theo-retic Approach For Cooperative MIMO Schemes With Cel-lular Reuse of The Relay Slot[J].IEEE ICASSP, 2004:581-584.

[10]Wang B, Han Z, Liu K J R.Distributed Relay Selectionand Power Control for Multiuser Cooeprative Communica-tion Networks Using Buyer/Seller Game[J].INFOCOM, 2007:544-552.

非合作可能性博弈篇4

1 主动防御技术的概述

随着计算机的不断普及, 在网络安全领域中新诞生了一项技术就是主动防御技术, 人们对其非常重视, 网络安全主动防御技术不仅能够提高网络所具备的的安全性, 而且还能够对影响网络安全的因素及时的发现, 并预测出影响因素所进行的攻击路线, 以采取有效的措施来进行攻击因素的防御的一种技术。由于在保护网络安全的过程中采取了主动防御技术, 给攻击者的攻击增加了难度, 网络系统可以在无人的状态下主动进行防御。目前网络安全中的主动防御技术已经将网络中的安全提高了一个很大的层次, 为网络安全的防护指明了发展的方向。

2 非合作动态博弈定义描述

定义一.通过四元组来对非合作动态博弈的主动防御进行描述的话, 使用来进行参与博弈人员这一集合的表示。而在网络安全的攻防之中, 人员既是策略制定的主要决定着, 也是选择策略的主体, 而大多数的网络攻击中, 攻击者和防御者就会被看成是Pa和Pd二者之间的博弈。

定义二.在网络安全中, 攻防双方是树形的结构, 经常通过三元组进行表示, 也就是 (V, E, U) 。V—一切节点的集合, 节点代表着攻防双方在博弈过程中的不同状态;E—一切有向边的集合, 是攻击和防御的一种策略;U—网络安全中, 一切收益向量的集合, 也就是攻防双方在博弈过程中所得到的收益。

定义三.在网络安全中, 攻防双方的博弈会被集中在信息集h中, 能够满足状态节点集合所提出的的要求:

1) 在信息集h中, 在状态节点的Si位置处, 局中人都会在此处采取行动;

2) 在博弈的过程中, 如果攻防双方到达信息集中的某个状态节点时, 攻防双方也不知道具体的节点位置。攻防双方的博弈树如图1所示:

从图1中可以看出, 网络安全中的攻防双方的博弈树中存在着攻方的信息集h1, 且节点具备着决策的功能。而防御方却存在着两个信息集h2与h3, 这两个信息集中都存在着具备决策功能的节点。

3 多阶段非合作动态博弈

3.1 攻防博弈树的生成

在安全网络中存在着动态博弈, 需要依靠博弈树T (V, E, U) 来对其进行分析和描述, 这主要是由博弈树中体现着攻防双方所选择的策略, 也可以说成是采取行动的时间以及方式方法等。在网络安全中, 攻击方与防御方进行博弈时所形成的博弈树T还包括很多方面。例如参与者的集合、行动的时间、可选择的策略以及收获的信息等多种方面。

为了减少网络攻防图和博弈树上存在的差异性, 网络攻防图可以使用虚拟节点来变成博弈树。将虚拟节点按照是收益量化的方式进行处理, 并保证节点中的高级状态向着低级状态转换, 在此过程中, 攻击节点也会从正常的状态转变到不正常的状态, 而转换的过程也就属于逆过程。通常情况下, 攻击节点会将防御者所使用的策略节点转变为正常状态。子图转换后的新的子图如图2所示。

3.2 多阶段动态博弈的算法

在对安全信息提出假设的基础之上, 与博弈树进行有机结合, 提出多阶段动态博弈的逆向算法。

将博弈树T (V, E, U) 进行输入, 将攻击者所要进行的攻击路线和防御措施、收益等输出。该算法再使用的过程中, 需要对博弈树进行处理, 需要根据叶节点至根节点的位置顺序进行编号, 从左到右依次进行编号, 并对节点的类型进行标示。如果节点属于攻击决策类型的话, 那么在同一高度上的节点都会属于攻击节点的范畴, 在算法计算的过程中, 会对攻击方进行攻击所选用的路径进行预测, 并根据攻击的路径制定出极为有效的防御措施, 并计算出在博弈过程中攻防双方所获取的收益。通常情况下, 攻击者所采取的的策略会保证攻击所使用的路径和攻击效益属于正比的关系, 但是在防御方看来却是反比的关系。在博弈过程中, 攻击方在进行策略的选择中, 往往是考虑自己所获取利益的大小, 因此会选取自己收益较大的攻击方式来进行处理。

在使用多阶段动态博弈的算法进行计算时, 需要先进行假设, 也就是说在博弈的过程中攻防两方都是属于较为理性的, 因此在选择策略的过程中都会选择自己收益最大的策略进行;对完全信息进行假设, 也就是说攻防双方的信息具备对称的性质, 但是这与攻防双方的理性的假设在理论上属于相违背, 如果攻击方所选取的攻击策略与计算方法预测的攻击策略出现偏离的现象的话, 防御方还是可以采取多阶段动态博弈的算法继续进行计算。但是如果完全信息在假设的过程中不能进行有效保证的话, 或者是攻击方的攻击策略出现更新时, 攻击双方的信息就会呈现出非对称的性质。

4 结论

综上所述, 随着科学技术的不断发展, 黑客技术得到了突飞猛进的进步, 我们在网络安全中所使用的传统的防火墙和防入侵等防御技术已经不能满足防御黑客技术入侵的要求了, 因此为了提高网络的安全, 需要在非合作动态博弈的基础上, 对网络安全主动防御技术进行研究, 并将虚拟节点引入到网络攻防图中, 以解决网络安全中存在的安全隐患。在非合作动态博弈的基础之上, 所形成的攻击方和防御方两方的攻击路径和防御措施的预测和计算就会更为准确, 双方在博弈的过程中都会获得最大化的收益。

摘要：科学技术的进步推动了黑客技术的快速发展, 而我国计算机中所使用的被动防御技术已经无法阻止黑客的入侵了, 因此要对现有的防御技术进行研究和更新, 以求发展出的新的防御技术可以改变目前较为被动的防御局面。在非合作动态博弈的基础之上, 对攻防双方在博弈过程中的路径以及措施进行预测, 从而实现主动防御技术的目的。本文先是对主动防御技术进行了概述, 又详细阐述了非合作动态博弈的定义, 最后分析介绍了多阶段非合作动态博弈。

关键词：非合作动态,博弈,网络安全,主动防御技术

参考文献

[1]高晓飞, 申普兵.网络安全主动防御技术[J].计算机安全, 2009 (1) .

非合作可能性博弈篇5

在突发事件常造成多个灾点的今天,能否迅速恢复灾后受损的通信网络系统以保证通信畅通,是整个应急救援行动在响应、指挥、调度等方面的成败关键。而多灾点应急通信资源调度的公平、合理、有效是整个救灾行动重要的前提和基础,关系到突发事件下应急通信保障工作的优劣,将对整个灾后应急救援行动造成影响。此时,应急决策者更倾向于运用决策分析工具构建简单的决策模型,故恰能满足上述要求的博弈论在应急资源调度决策中就有了用武之地。国内外一些学者已在该领域进行了相关研究,Shetty,Gupta和Ranganathan以博弈论作为工具,在对多事故点与多救援点之间应急资源配送关系进行分析后,建立了关于应急资源调度的博弈模型和求解算法,有效解决了资源合理调度的问题[1,2]。张婧等人为解决多事故同时存在时应急救灾中心的资源分配问题,设计了一种基于偏好序的改进效用函数,描述了各事故得到救援的有效性和及时性,最后建立了多事故应急资源调度博弈模型[15]。蒋一波、周鹏先后提出了流媒体监控系统中调度策略的非合作博弈模型,并对模型中Nash均衡点的存在性和唯一性进行了论证[5][16]。上述研究将博弈理论运用到资源调度中,但文献中尚未有专门针对突发事件后多灾点应急通信资源调度与分配的研究,本文基于非合作博弈理论建立多灾点应急通信资源调度模型,运用Nash均衡的迭代算法进行求解得到最佳调度方案。首先建立博弈模型并求解,然后对模型的解进行分析,最后通过实例对应急通信资源调度策略展开验证,为应急决策者提供最优策略方案。

1 多灾点应急通信资源调度的非合作博弈模型

突发事件发生后,往往造成移动、固定电话等通讯中断,此时急需合理调度应急通信资源以促进通信网络的恢复,常见的应急通信资源包括应急通信车、发电油机、卫星电话等。以下在模型假设的前提下建立应急通信资源调度的非合作博弈模型。

1.1 模型假设

在突发事件发生后应急通信资源有限的情况下,各灾点所需资源常相互冲突和对抗,各灾点间对应急通信资源的需求是非合作博弈的,博弈目的是尽量减少所获资源的成本。因此,对应急通信资源调度非合作博弈模型作出假设如下[13]:

(1)鉴于单个救援中心往往无法满足多个灾点的需求,需要其他救援中心协助配合共同完成救灾任务。当该区域内救援中心的资源不能满足自身需求时,可从邻近区域的救援中心获取援助,假设目的是为达到救灾成本最小化。

(2)根据各灾点灾情严重程度进行分级,Ⅰ表示灾情最高,依次为Ⅱ、Ⅲ、Ⅳ。

(3)资源配送最初未考虑救援中心资源数量,仅根据救灾成本最小原则进行初始分配。而作为一个多元复合函数,成本函数的影响因素包括灾情的严重程度、响应时间、平均速度和救援中心到灾点的距离,故首先需对各灾点向各救援中心支付的调度成本按大小依次排序。

1.2 建立模型

根据前述问题描述与假设,结合非合作博弈理论,构建多灾点应急通信资源调度的非合作博弈模型,该模型的标准形式定义如下:

G={t,N,(Sp(t))p∈N,(P(t)p)p∈N} . (1)

其中,t表示救灾时间段;N={1,2,…,n}为n个灾点的集合;Sp(t)为灾点p在t阶段全部可选策略的集合,即p可采取的行动方案;Pp(t)=Pp(s1,s2,…,sn)为灾点p在t阶段由调度成本倒数映射得到的效用函数;s=(s1,s2,…,sn)为n个灾点的一个组合策略。为了突出第p个灾点的行动策略,记s={sp,S-p},其中S-p表示除灾点p外其它所有灾点采取的组合策略;全部行动策略的集合undefined构成博弈的策略空间。

下面列出博弈模型的相关因素与数学表达式[13]:

(1) 应急通信资源调度速度vundefined(t)

在特定时段,灾点p的调度速度vundefined(t)与灾区路况密切相关,通常采用从救援中心k到灾点p的平均速度undefinedundefined(t)间接求取:

undefined. (2)

其中,μ(t)为路况系数,反映救援中心k到灾点p的道路好坏状况,μ(t)∈[0,1],路况越好,μ(t)越大。

(2)应急通信资源调度总成本函数Cp,q

对灾点p的第q个调度策略sp,q=(uundefined,uundefined,…uundefined,…,uundefined),其调度总成本函数表示为:

undefined. (3)

其中,M为所有救援中心的集合;h为所有灾点的集合;uundefined表示灾点p采用第q个策略时从救援中心k调度的资源量;cundefined为灾点p从救援中心k调度资源的救灾单位成本,作为调度依据,cundefined的函数如下:

其中,Dundefined表示救援中心k到灾点p的距离;Lp表示灾点p的灾情级别;∞表示从博弈范围外的救援中心调度资源时的单位成本为无穷大。

(3)收益函数

博弈中,一个特定策略组合下各灾点所期望得到的效用水平用收益函数表示,在调度过程中,用调度单位成本的倒数表示灾点p选择从救援中心k调度资源而获得的效用:

undefined. (5)

其中,Δcp为灾点p在救援中心k未得到满足的资源需到下一个救援中心进行调度而增加的成本。

灾点p从所有救援中心M调度所需资源的效用满足叠加定理,函数如下:

undefined. (6)

(4)目标函数

应急通信资源调度旨在对各灾点实现公平调度的情况下,最大化总效用。目标函数定义如下:

undefined. (7)

2 应急通信资源调度的非合作博弈模型的算法求解

2.1 基于Nash均衡算法的应急通信资源调度求解步骤

基于Nash均衡算法的应急通信资源调度求解按下列步骤进行[13]:

(1) 首先,进行资源初始分配,确定各灾点向各应急救援中心调度所需应急通信资源应支付的成本;

(2) 在不考虑各应急救援中心最大供给量的前提下,按成本最小原则分配各灾点所需资源;

(3) 考虑单个应急救援中心k的实际资源量,若资源数量能满足同级(同级指灾点的调度支付成本和灾情级别处于同一级,如模型假设表2中的灾点2、3)各灾点,则按各灾点需求直接进行分配;若k的资源最大供给量小于同级灾点的资源总需求量,则同级各灾点会针对k的资源存在竞争,构成一个博弈关系;

(4) 建立多灾点应急通信资源调度博弈模型,利用Nash均衡算法进行求解,并按Nash均衡解对救援中心资源进行调配;

(5) 同级灾点若依照Nash均衡解进行分配后仍存在未满足需求的部分,按成本次最小原则从下一救援中心调度所需资源,直至满足需求;

(6) 重复(3)完毕。

2.2 应急通信资源调度策略的Nash均衡存在性及迭代求解

在非合作博弈中的Nash均衡点上,任一理性参与者都不会有单独改变策略的冲动,因为当其他人的行动策略不变时,每一个局中人若单独改变自身策略都不会增加其效用。这样既能保证各灾点的收益最大化,也从总体上体现了应急通信资源调度方面的社会公平性。因此,利用Nash均衡算法所得到的解堪称对各灾点进行应急通信资源调度的最优可行策略。

由非合作博弈Nash均衡存在性定理及相应迭代算法可得到:

定理1:在n灾点的非合作博弈中,若每个灾点的最佳反应函数Op(S-p)满足下述条件:

(1) 对灾点q的每个调度策略sq(∀q≠p),Op(S-p)是sq的可微函数;

(2)undefined

则此次n灾点非合作博弈必定存在Nash均衡点。

证明:首先,定义S=Rn中的距离,选取任意两点s(1)={sundefined,sundefined,…,sundefined},s(2)={sundefined,sundefined,…,sundefined},则两点间距离为d(s(1),s(2))=undefined。

另外,∀S=(s1,s2,…,sn)∈S(策略空间),定义Xs=(O1(s-1),O2(s-2),…,sn(s-n)),很显然,X是S→S的算子。于是:

undefined

根据中值定理得:

undefined

其中,φp是sundefined和sundefined连线上的一点。

undefined

其中,由定理条件得到0≤λ0≤1,故X是S到自身的一个压缩因子;由压缩映像定理可得:S中一定存在满足Xs*=s*的不动点s*={s*1,s*2,…,s*n},即Op(s*-p)=s*p(p=1,2,…,n),由此可知s*为n灾点非合作博弈的Nash均衡点。

由上述证明过程可知,在实际迭代计算中可从任意点s(0)∈S开始,设初始点s(0)与Nash均衡点s*之间的距离为d(0),经m次迭代后,d(s(m),s*)≤λundefinedd(s(0),s*)=λundefinedd(0),由于0≤λ0≤1,故可用迭代公式s(m+1)=Xs(m)来任意逼近非合作博弈的Nash均衡点s*。

上述定理同时也说明当各灾点所选择的策略对其他灾点的策略选择影响不大(undefined表示收敛因子)时,多灾点非合作博弈的Nash均衡点一定存在且唯一[12]。

3 算例分析

2010年4月14日,青海玉树藏族自治州发生7.1级大地震,造成多地区受灾,选取玉树县、杂多县、曲麻莱县作为3个灾点(分别编号1、2、3),根据突发事件分级标准设3灾点灾情级别分别为Ⅰ、Ⅱ、Ⅲ。灾点所在区域玉树州内有2个应急通信救援中心(A、B)向各灾点提供应急通信资源(以应急通信车为例),另外,该区域附近有1个应急救援中心,位于甘肃省(C)境内。假设各灾点和各救援中心之间资源供需关系如表1。

假设3灾点从各应急救援中心进行应急通信车调度所支付的单位成本相同,分别为:

Cundefined=Cundefined=Cundefined=2,Cundefined=Cundefined=Cundefined=3,Cundefined=Cundefined=Cundefined=5

从上表可看出,玉树州内的救援中心A和B不能同时满足3县的需求,因为SA、B供给量=18

依据1.1中模型假设知,各灾点的最优调度方案都是从调度成本最低的救援中心调度所需资源,本例中,出现了多个对应急资源需求的竞争,如3灾点从A调度资源的成本最低,同为2单位,在不考虑灾情级别的情况下则存在三方资源竞争。

通过2.2中迭代算法算得该博弈的纯策略Nash均衡解:

s*1=(8,5,0),s*2=(0,5,3),s*3=(0,0,7)

那么,3救援中心向3灾点调度应急通信车的最终调度策略如表2:

按公式(3),带入Nash均衡解计算3灾点的资源调度总成本分别为:

C1,q=2×8+3×5+5×0=31;C2,q=2×0+3×5+5×3=30;C3,q=2×0+3×0+5×7=35

通过上述分析可以得最佳的应急通信车调度方案,即:灾点1受灾最为严重,应优先考虑,先从救援中心A调度8个单位所需资源到灾点1,然后再从B调度5单位,此时调度总成本最少,达到最大效用;灾点2的灾害程度低于灾点1,则先从B调度5单位资源,然后从C调度3个单位来满足需求;灾点3灾情最轻,应最后考虑,因A和B的应急通信车已率先满足较严重的2个灾点,故灾点3从C调度全部所需应急通信车7台。这样,可得到为玉树、杂多、曲麻莱3县调度应急通信车的总成本Cp,q=C1,q+C2,q+C3,q=31+30+35=96,此时,组合策略达到应急通信车调度总成本最少,为96个单位。

根据公式(5)、(6),计算3个灾点的收益函数分别为:

undefined

将单个灾点的收益结果代入公式(7),可得总的效用目标函数值:

undefined

计算结果表明,在该Nash均衡解策略组合下向玉树、杂多、囊谦3县调度应急通信车的总收益值达到最大,为28/3。

综上,可知按照通过迭代算法计算得出的Nash均衡解s*1=(8,5,0),s*2=(0,5,3),s*3=(0,0,7)向玉树、杂多、曲麻莱3县进行应急通信车公平调度,可实现全部3灾点应急通信车调度成本最小化和效用最大化。

4 结束语

非合作可能性博弈篇6

在提高系统性能的同时,Co MP技术也改变了LTE系统的网络结构,无线资源管理变得更加复杂,需要对传统的资源分配算法进行改进,合理的分配无线资源。文献[3]考虑在一定Qo S和节能要求下,提出一种分布式资源分配算法。文献[4]提出了基于最大信漏噪比矩阵的多用户Co MP资源分配算法。文献[5,6]研究了多用户Co MP系统中总功率约束条件下提高系统吞吐量的问题,但是未深入讨论用户调度问题。文献[7,8]基于非合作博弈研究多小区Co MP系统的资源分配问题,构建基于线性定价机制、Co MP协作方式和功率控制的非合作博弈模型。然而该算法在子信道的分配方面并不能保证用户间的公平性,同时在基于非合作博弈的功率控制模型中,其纯效用函数表达式并不能准确的反映Co MP用户效用值。

基于此,采用非合作博弈论研究Co MP系统动态资源分配问题,借鉴文献[9]的思路,建立新定价机制下的功率分配博弈模型,在此基础上分析Co MP用户在其协作簇内功率分配时相互协作,推导该模型的求解算法,分析了该模型纳什均衡解的存在性和唯一性; 最后通过仿真,与文献[7]中算法进行对比分析,验证本文算法的性能。

1 系统模型与问题描述

1. 1 系统模型

考虑下行单用户多点协作传输系统 ( SU-Co MP) Co MP系统。该系统包含N个小区和M个用户,各个移动终端只配备一根天线,系统的总带宽设为B,子信道数设为K,所有基站的频率复用因子为1。同时假定各个基站通过X2接口共享彼此的数据信息和用户信道状态信息,方便对小区边缘的用户进行联合处理,其系统模型如图1所示。

在Co MP联合传输系统中,所有用户被分为普通用户和Co MP用户这两类。普通用户因距离所在小区的基站较近、信道条件较好,故只需所在小区为其服务。Co MP用户往往位于小区边缘,受到干扰较大,因此需要协作簇中几个基站同时为其服务。

Co MP用户的信干噪比可以表示为

式( 1) 中,A代表所有小区; ρkn,m为基站n在子信道k上对用户m的分配指示值,它是一个布尔值,如果为1表示基站n将该子信道分配给用户m; 反之,则不分配,系统要从所有小区中为Co MP用户分配合适的协作簇Cm; δ2表示噪声功率; gkn,m是子信道k上基站n与用户m之间信道增益; pkn表示子信道k上基站n发送功率。可以看出,用户的有用信号得到加强。设单位资源块的带宽为wRB,由香农公式,得到Co MP用户的传输速率为:

1. 2 问题描述

假定在任意给定的时隙,N个基站需要联合决定每个子信道的调度用户集合、每个调度用户的协作簇集合以及每个子信道的发送功率,其联合最优问题可以表述为:

式( 3) 中,αm为用户m的权重因子,它与用户的业务类型相关。约束1) 保证了每基站最大可发送功率Pnmax; 约束2) 和约束3) 共同保证了每个基站的每个子信道最多只能分配给一个用户,避免了用户之间发生碰撞。

显然式( 3) 所述的联合资源分配问题是一个非线性规划问题,需要基站间传输大量的交互信息才能获得最优解,计算量庞大,通常难以实现。可以采取降低维度或者近似计算的方法简化处理[5—9],式( 3) 变为:

式( 4) 中,约束1) 保证了每个基站在每个子信道的最大发送功率。将原来的总功率约束分割成每个子信道的独立功率约束,尽管在一定程度上牺牲了系统的频率选择性增益,但降低了计算复杂度。

2 Co MP 动态功率分配算法

2. 1 Co MP 用户分类及协作簇选择

首先,为Co MP用户选择合适的动态协作簇集合。在本文,根据用户的RSRP测量报告来动态选择Co MP用户和其协作簇。首先,当用户的SINR低于确定门限值时,上报给服务小区,确定其为Co MP用户。然后,Co MP用户估算服务小区和相邻小区的平均参考信号接收功率( RSRP) ,并上报给服务小区。服务小区根据上报的RSRP平均值从大到小排序,大于某一阈值的小区加入到当前Co MP用户的协作簇中; 反之,则不加入。注意,每个Co MP用户协作簇的小区不能超过3个。

2. 2 基于非合作博弈论的多小区 Co MP 系统用户调度与功率分配

经过上一节,完成了用户分类,并为Co MP用户选择协作簇。可以发现,普通用户可以看做特殊的Co MP用户,即协作簇Ckm= 1的特例。因此,本文后续部分仅对Co MP用户进行分析。假设用户都是理性和自私的,为达到系统最优,设计新的定价函数。非合作博弈模型如下:

式( 7) 中,fμm( pkCkm,pk- Ckm) 是净效用函数。fm( pkCkm,pk- Ckm) 是纯效用函数,pkCkm表示子信道k上用户m的协作簇在子信道k的发送功率向量,pk- Ckm表示其他用户对用户m的干扰功率向量。μm( pkCkm,pk- Ckm) 是本文设计的定价函数,它不仅对功率进行了定价,而且还考虑pkn/ p珋n功率利用效率的影响,这有助于提升用户间的公平性。令式( 5) 的一阶导为零,用户m的最优功率响应满足

整理式( 8) ,可得用户m在其协作簇小区n发射功率的纳什均衡解为

I1包含协作簇中其他小区发射功率、同频干扰功率和噪声功率。如果用户m协作簇Ckm中各小区发送功率采用非合作模式( 即根据上一次迭代所得发送功率代入式( 9) 计算本次迭代的发送功率) ,其结果将与传统的功率更新方式相同。这虽然也能获得用户的最优响应,但割裂了协作簇之间的合作关系,因为这些协作簇为同一个用户服务,它们共同决定了用户m的吞吐量。观察式( 9) 可知,用户m的最优响应集合是一个拥有Ckm个变量和Ckm个等式约束的非线性方程组,可利用固定点迭代法求解,递推公式形如

注意,Co MP用户的协作簇最多不超过3个,因此上述迭代过程能快速收敛。综上所述,本文的算法流程如图2所示。算法流程为:

步骤1) 为所有用户分类,低于SINR门限值的为Co MP用户,反之为中心用户,并根据RSRP测量报告为Co MP用户选择协作簇;

步骤2) 初始化迭代次数T = 1,设置最大迭代次数Tmax,分配初始功率;

步骤3) 将当前各个基站在子信道k上的发送功率代入式( 7) ,并利用式( 11) 选择每个基站在子信道k上具有最大净效益值的用户 ^m,即

步骤4) 启动协作簇内功率迭代; 初始化各个基站的子信道k上的发送功率pkn( 1) = 0,初始化迭代次数t = 1,收敛精度为ξ = 0. 01;

步骤5) 将用户m的干扰功率向量pk- Ckm代入公式( 9) 更新协作簇中小区n的最优发送功率pkn( t) ;

步骤6) 根据由递推公式( 10) 计算t + 1次迭代时的发送功率向量pkn( t +1) ; 对于任意n,k,如果| pkn( t + 1) - pkn( t) |≤ξ,则功率博弈结束,转到步骤7) ; 否则t = t + 1,回到步骤4,继续功率博弈;

步骤7) 对于任意子信道k,如果迭代次数T =Tmax,则联合用户调度和功率分配算法结束; 否则T变为T + 1,转到步骤3) 。

3 纳什均衡解的存在性与唯一性的证明

证明该模型有效的关键是要证明其纳什均衡解的存在性和唯一性。证明其存在性,需要满足: 1所有用户发射功率的策略空间是的一个非空的、闭的、有界的凸集; 2所有用户的净效用函数是连续并且是拟凹的。对本文,所有用户的发射功率满足pkn∈[0,p珋n],是正实数空间上的一个非空的、闭的、有界的凸集,条件1满足。用户m的净效益函数对其协作簇的发送功率求二阶导可得:

用户m的发射功率是连续的,其净效益函数在pkn域是凹的,条件2满足,本文纳什均衡点存在性得证。

综上所述,用户m的最优响应函数是标准函数,满足正性、单调性和可测量性,因此纳什均衡解唯一性得证。

4 仿真分析

本文仿真通过Matlab2012软件实现,考虑7小区六边形蜂窝系统,仿真采用单用户Co MP-JT技术,主要仿真参数设置见表1。

为了验证文中所提算法的性能,本文仿真部分将与文献[7]中所提非合作博弈论算法进行对比分析,文献[7]算法思想是: Co MP用户协作簇中各个小区独立计算吞吐量,并提出关于各协作簇信道增益的线性定价函数。其效用函数不够准确,会引起一定的功率损失。

Co MP用户频谱效率如图3所示,从图中可以看出,在惩罚因子较小的时候,每个Co MP用户都是“自私”的,都希望所在协作基站为其增加发射功率,频率效率得到了提高,但增大了对其他用户的同频干扰; 随着惩罚因子的持续增大,Co MP用户频率效率开始降低,而且本文算法比文献[7]所提算法下降更快,这是因为本文算法采用关于用户功率的非线性代价函数,用户想要从基站处获得功率所需的“代价”更大,限制用户的“自私”行为。

图4反映了两种算法所需功耗。

因为本文算法考虑Co MP用户协作簇内协作,而且采用对用户“自私”行为惩罚更大的非线性代价函数,本文算法的功耗更小。

图5比较了两种算法以及不考虑协作簇内功率迭代时的能效,可以看出本文算法的能效值得到了很大提升。同时,相对于不考虑协作簇内功率迭代的情况,本文算法能够减少迭代次数,实现快速收敛,减小了能量的消耗,进一步提升系统性能。

图6是用户公平性的仿真分析,本文使用Jain’sfairness index公平指数,定义为:

式中,Rk表示Co MP用户k的吞吐量。

可以看出,在功率迭代结果稳定后,本文算法的公平性有了很大的提高,改善了Co MP用户的公平性。

5 结束语

提出了一种提高边缘用户吞吐量的Co MP系统动态功率分配算法。算法分为两部分: 首先在确定Co MP用户后,引入非线性定价函数,提出一种新的功率分配博弈机制,分析其纳什均衡解的存在性和唯一性,并给出了基于该模型的分布式求解算法; 然后在Co MP用户协作簇内进行功率迭代,进一步减小功率损耗。仿真结果表明,该算法能提升边缘用户频谱利用率,减小功耗。值得注意的是,只研究单用户Co MP系统,相对于多用户Co MP系统,其对系统性能提升有限,这也是本文需要进一步研究的方向。

摘要：针对下行单用户多点协作传输系统(SU-Co MP)的资源分配问题,提出一种基于非合作博弈论的动态功率分配算法。首先协调不同用户在同频子信道上的发射功率,然后建立新定价机制下的功率分配博弈模型。在此基础上分析Co MP用户在其协作簇内功率分配时相互协作,推导该模型的求解算法,最后论证该算法纳什均衡解的存在性和唯一性。仿真结果表明,所提算法能提升边缘用户频谱利用率,减小功耗。

关键词：小区间干扰,多点协作传输,功率分配,非合作博弈论

参考文献

[1] Yang Chenyang,Han Shengqian,Hou Xueying,et al.How do we design Co MP to achieve its promised potential.Wireless Communications,IEEE,2013;20(1):67—74

[2] Cao Yu,Xia Hailun,Feng Chunyan.Evaluation of diverse cell range expansion strategies applying Co MP in heterogeneous network.Personal Indoor and Mobile Radio Communications(PIMRC),2013IEEE 24th International Symposium on.London:IEEE 2013:1962—1966

[3] Chung Wenching,Chang Chungju,Huang Chinya,et al.A green radio resource allocation scheme for LTE-A Co MP systems with multimedia traffic.Communications in China(ICCC).2013 IEEE/CIC International Conference on.Xi'an:IEEE,2013:758—762

[4] Abdelaal R A,Ismail M H,Elsayed K.Resource allocation strategies based on the signal-to-leakage-plus-noise ratio in LTE-A Co MP systems.Wireless Communications and Networking Conference(WCNC),2012 IEEE.Shanghai:IEEE,2012:1590—1595

[5] Akbudak T,Czylwik A.Co MP in heterogeneous networks:a joint cooperative resource allocation approach.Smart Antennas(WSA),2012 International ITG Workshop on,Dresden:IEEE,2012:12—19

[6] Li Shiyuan,Cui Qimei,Haas H,et al.Joint power allocation for coherent downlink coordinated transmission.Vehicular Technology Conference(VTC Fall),2012 IEEE.Quebec City:IEEE,2012:1—5

[7] Fu Shu,Wu Bin,Ho Pinhan,et al.Interference coordination in Co MP with transmission scheduling and game theoretical power reallocatin.Communications(ICC).2012 IEEE International Conference on.Ottawa:IEEE,2012:4212—4217

[8] Fu Shu,Wu Bin,Wen Hong,et al.Transmission scheduling and game theoretical power allocation for interference coordination in Co MP.Wireless Communications,IEEE Transactions on,2014;13(1):112—123

非合作可能性博弈篇7

集装箱租赁是指集装箱租赁公司与承租人，签订协议，用长期或短期的方式把集装箱租赁给承租人的一种租赁方式。对于集装箱租赁公司而言，如何定价才能最大化收益，是一个值得研究的课题。

在日趋严峻的竞争环境下，制定合理的定价策略，不仅能使公司的利益最大化，而且关系到在市场竞争中的成败。目前有许多定价策略，但是都是过于主观，量化的程度还不够，还不能作为一个实际性的指导。我们旨在依据非合作竞争博弈理论，构建集装箱租赁定价模型，并能对具体的定价给出一个量化的而又比较客观的指导。

本文旨在通过非合作竞争博弈构建集装箱租赁定价模型，并指导集装箱租赁企业如何定价。

2 影响集装箱租赁定价因素

影响集装箱的定价因素主要由市场需求、竞争环境、经济成本和风险成本四个方面组成。

2.1 市场需求

尽管受全球金融危机的影响，世界贸易量有所下降，但随着世界经济的逐渐复苏，全球贸易量的增加，集装箱的市场需求量也不断增加[1]。当市场需求大于市场供应时，集装箱租赁公司可以提高价格增加收益。相反，当市场需求低于市场供应的时，集装箱租赁公司只能通过降低价格来增加竞争力。

2.2 竞争环境

近年来我国经济的迅猛发展带动了集装箱租赁业的发展，集装箱设备需求量大增，集装箱租赁租金及利用率攀升。集装箱租赁业的迅速发展，吸引了众多投资者的目光，因此，也造就了集装箱租赁公司之间的竞争异常激烈。各大租箱公司之间纷纷开发先进的集装箱租赁管理信息系统，力求快速响应市场变化，跟踪服务往来客户，以此占据租箱市场，做出高效准确的投资方案。

2.3 经济成本

修理费用:是集装箱堆场对于集装箱提供的维修服务所收取的费用。集装箱堆场是指办理集装箱重箱或空箱装卸、转运、保管、交接的场所。它是集装箱运输关系方的重要组成部分，在集装箱运输中起到重要作用。集装箱在使用过程中，发生损坏的集装箱必须经过修理才能再次使用。维修中的注意事项:集装箱的基本修理，外部尺寸，箱顶面的位置，底结构底面的位置，自重，风雨密性。

场站管理费用:集装箱进入堆场后，堆场会对集装箱进行装卸、转运、装箱、拆箱、收发、交接、保管、堆存、搬运等。场站应按照双方协议规定，按照不同的海上承运人将空箱和重箱分别堆放。空箱按完好箱和破损箱、污箱、自有箱和租箱分别堆放。

空箱运输成本:就是指箱子里面不放任何货物，从集装箱堆场出发，集合到港口，然后上船，到达目的港，最后交到客户手里所产生的费用，包括拖车费，海运费，报关费等费用。

公司运营成本:是指公司在经营期间应该负担的全部成本，包括销售成本，销售税金，及期间费用等。

2.4 风险成本

自然因素:集装箱都是由钢材制造而成，长期的时间原因，风吹雨打，很多会产生锈蚀，属于自然老化。

运输因素:箱子在运输过程中，可能由于各种原因所产生的灭失，碰撞等所产生的费用。

3 基于博弈论的定价模型

具有竞争或对抗性质的行为称为博弈行为。在这类行为中，参加斗争或竞争的各方各自具有不同的目标或利益。所谓非合作竞争博弈是指每个参与者都是自私的，都独自作决定，参与者之间没有互相约束力的一种博弈过程[2]。在博弈论中，纳什均衡是一种非合作博弈中的一种平衡状态，如果每个玩家选择了一个策略，没有玩家可以在其他玩家保持不变的情况下可以通过改变策略而受益，那么就达成了一个纳什均衡[3]。

本文考虑对称信息状态下的定价模型。在这种情况下，每一家集装箱租赁企业所知道的市场信息都是相同的。

3.1 问题描述

假定有n个集装箱租赁企业，他们各自的价格分别为p1…，pn，他们的边际成本根据影响集装箱租赁定价因素的不同也不同，分别为c1，…，cn。各个集装箱租赁企业之间都很清楚对方的边际成本，并且都想最大化自己的收益。所以在租赁市场中的平均价格和平均边际成本可以分别表示为

所以i企业的需求函数可以表示为Qi=M-lpi+kpa,M,l,k均为常数。

所以i企业的利润可以表示为

相应的各个企业的利润可以表示为

3.2 问题求解:

企业i为了最大化自己的利润，可以得出最优的定价则需要使得piui=0。

可以求的

因为所有企业都企图最大化自己的利润，所以可以得出

将以上各式相加可得

所以可以得到