动态贝叶斯(共7篇)
动态贝叶斯 篇1
0 引言
随着高通量数据的产生和计算机技术的发展,对这些大数据的处理和挖掘已经成为研究的热点。一个网络可以抽象为由结点和边组成的一个图,结点表示现实网络中的一些研究对象,边可以理解为结点之间潜在的相互作用关系。如在疾病基因网络中,一些疾病基因可以看成网络中的结点,基因之间的相互作用关系可以理解为网络中的边,那么就可以通过网络的手段知道哪些基因作用关系密切,可能会成为致病因素,这就对药物设计和疾病治疗起到一定的理论意义。因此构建的网络可以系统地研究网络中结点之间的调配关系,为深入挖掘结点之间的复杂关系及作用机制提供理论模型。
现今已经诞生了很多数学模型和计算机方法来推断网络构建,这些模型方法主要包括布尔网络模型(Boolean networks)[1],常微分方程模型[2],信息论模型[3,4],线性规划[5]模型和贝叶斯网络模型[6,7]。这些方法能够对网络系统动态行为提供更深层次的理解,但是构建方法的精度对模型中参数的依赖性非常大,且算法的时间复杂度非常大,这就使得构建大规模网络变得异常困难[8]。由于基因调控过程的复杂性、调控的方向性、网络的规模性以及基因表达数据的噪声等因素的影响,这些都会影响基因调控网络构建性能。如基于互信息的方法不能检测网络的方向,不能区分直接和间接调控;基于优化模型的方法很难解决高维低样本数据;基于贝叶斯网络的方法具有较高的计算复杂度,且很难处理大规模网络等。如何克服这些模型和方法中的缺点,是基因调控网络构建方法提高其性能的关键所在。
贝叶斯网络模型是一种图形概率模型,利用贝叶斯规则建立结点间的联合概率分布来构造调控网络的。贝叶斯网络模型是基于统计理论的,并且能够应用到各种类型的生物数据中,因此能够捕捉到表达数据中固有的噪声,而且准许在决定结点间相互作用关系的过程中可以利用贝叶斯规则来结合一些先验生物学知识。动态贝叶斯网络(DBN)是贝叶斯网络的扩展版,既可以使用稳态数据,也可以应用到基因表达时间序列数据中。当构建的调控网络包含大量的基因结点时,DBN需要花费大量时间来学习条件依赖关系。为此我们提出了一种数据相对变化率的策略来预处理随机结点数据,以此来识别出网络中一些关键的结点,在这个基础之上我们再采用时延的动态贝叶斯方法和一些先验知识来构建网络,所构建网络的优劣用性能指标AUPR和AU-ROC值来评估。试验结果验证我们的方法取得了良好的网络构建性能,在网络的构建准确率和精度方面都取得了较好的结果。
1 理论方法
1.1 相对变化率
网络中的边表示结点之间潜在的相互作用关系,在给定的网络中,一个结点的表达水平值发生变化会影响那些和它有相互作用关系的结点的表达值。如果结点在整个网络中扮演了一个非常重要的角色,那么它的变化会引起其周围近邻结点的变化,我们也称这些点为中心结点或者关键结点(Hub Node)。因此一些结点值的表达类型不同(如原态数据,表达缺失数据,表达值减小数据和带有噪声的数据等)就会影响网络构建的精度。这里我们引入相对变化率的数据预处理策略来识别出一些中心结点,为进一步网络构建减小时间复杂度。
对于给定实验数据集中的每一个结点数据,我们以它的原态表达数据作为参照点,然后计算每个数据结点的相对变化率,数据的相对变化率公式定义如下:
其中Ri,j表示结点j在结点i表达值敲除情况下的相对变化率,Gi,j表示结点j在结点i表达值敲除情况下的表达值,Wj表示结点j原态表达值,Max(G:,j)-Min(G:,j)表示结点j对所有结点表达值变化范围,如果i=j,则相对变化率Ri,j为零。
如果结点的变化率大于给定的一个阈值,我们就认为这个结点是关键结点,在整个网络中扮演非常重要的角色。当结点的表达值相对于参照结点的变化小于给定的一个阈值时,我们认为它是噪声,把它从潜在的调控结点表单中剔除。如图1所示,计算结点1到10对于结点1的相对变化率,其中结点2,4,5,7,8明显高出阈值,那么我们就认为这些节点潜在的被结点1调控,结点1在整个网络中是一个关键结点。
1.2 动态贝叶斯网络
动态贝叶斯网络是贝叶斯网络在时序上的扩展,它是代表复杂时序数据随机过程的通用模型。典型的动态贝叶斯模型可以用图2来表示。二元组(B0,B1)表示时序变量结点X={X1,X2,…,Xn}的联合概率分布,其中Xi(1≤i≤n)表示网络中的二值结点,小写xi(1≤i≤n)表示变量结点Xi的样本值。动态贝叶斯网络由初始态的贝叶斯网络B0=(G0,θ0)和过渡态的贝叶斯网络B1=(G1,θ1)组成,其中B0表示变量结点X(0)的联合概率分布,B1表示对于所有的时间t转移概率。那么Xi(0)的双亲结点假设就在网络B0中,即的双亲结点其中1≤i≤n,t0。随机结点变量X(0)∪X(1)∪…∪X(T)可以被表示成如下的一个联合概率[9,10]:
1.3 时延动态贝叶斯网络
K Murphy[11,12]提出了动态贝叶斯的表示方法,网络推断及结构学习,但是这个模型有两个主要的缺陷。第一,这个算法的时间复杂度非常大,对于网络中某结点,其父节点可能是剩余结点的一个或者多个,其算法的时间复杂度会随着网络规模成指数级增长。由于计算的时间太长一般认为一个结点的父节点数量限制在30个以内。第二,这个算法没有考虑相关性的延时问题,这会降低网络构建的精度。
为了克服这个缺陷,Conzen[7]74提出了基于时序数据的带有时延的动态贝叶斯网络构建算法,这种方法能够有效地降低算法的时间复杂度和提高算法的准确性。在网络中相互作用的两个结点,它们的时序表达值都有一个相应的延时趋势或者同时发生变化,那么用这种方法就可以限制一个结点的父节点的数量,以此来降低算法的时间复杂度。还发现在生物分子网络中,调控结点和被调控结点之间都会存在一个转录时延周期,那么结点表达值的延迟就代表了生物相对延时周期。这种方法考虑了结点变量间的相对关系,借助表达值的变化来估计调控结点和被调控结点之间的关系。那么用这种带有延迟的动态贝叶斯方法就可以直接从时序的基因表达数量识别出其对应的网络。
在我们的方法中,首先用相对变化率从时序数据中找出那些关键的网络结点,这些结点比其它结点更可能成为其它节点的父节点,在生成的网络中这些结点会扮演非常重要的角色,用相关性给这些关键结点先构建出一个调控网络。其次用时延的动态贝叶斯网络方法再从这些时序数据中构建另一个调控网络,把两个网络中都存在的那些边保留成为我们构建的最终网络,用DREAM[13]人工合成数据和真实网络数据来对我们的算法进行检测,证明我们方法的有效性和准确性。
2 结果分析讨论
2.1 构建的网络和标准网络比对结果
网络预测的性能可以用如下参数来评估,用真阳性(true positive,TP),假阳性(false positiv,FP),真阴性(true negative,TN),假阴性(flase negative,FN),召回率(Recall)也叫真阳性率(true positive rate,TPR),假阳性率(flase positive rate,FPR),精确度(Precision)也叫查准率(Positive Predictive Value,PPV)和准确率(accuracy,ACC)来对构建的网络进行检测,它们的公式定义如下:TPR=TP/(TP+FN),FPR=FP/(FP+TN),PPV=TP/(TP+FP),ACC=(TP+TN)/(TP+FP+TN+FN)。除了上述指标外还有受试者工作特性曲线(Receiver Operation Characteristic Curve,ROC曲线)和其曲线下的面积(Area under ROC,AUROC),精度召回率曲线(Precision and Recall Curve,PR曲线)和其曲线下的面积(Area under PR,AUPR)来衡量构建算法的优劣性。
我们的方法成功地应用到了人工合成数据集上[14,15],在E.coli数据集上,真实网络有10个结点,10条边。我们预测出来的网络共有11条边,其中7条正确,精度达到70%。在另外一个酵母(yeast)数据中,有50个结点,77条边,我们的方法预测的带有方向的网络如图3所示,其中预测正确的边有52条,准确率达到了68%。实验验证了我们的方法取得了较好的性能。
2.2 相对变化率在网络构建中的作用
在三个不同的实验数据集上用我们的方法来构建网络,在10个结点的实验数据集上,只用相对变化率的方法来构建网络;在50个结点的实验数据集上,用相对变化率结合时延动态贝叶斯的方法来构建网络;在100个结点的实验数据集上,只用动态贝叶斯网络的方法来构建网络,以此来测试这三种网络构建方法的性能。
结果显示在10个结点和50个结点的网络构建中效果明显好于100个节点的网络构建,在E.coli数据集上构建网络的效果明显好于在yeast数据集上,具体参数如表1所示。结果显示采用了相对变化率策略可以比单独使用延迟动态贝叶斯方法取得更高的网络构建性能,这就可以解释为什么在100个结点的网络构建中,AUPR和AUROC值都相对偏低,在10个结点和50个结点的网络构建中,AUPR和AUROC值都相对偏高。这是因为在100个结点的网络构建中只采用了延迟的动态贝叶斯方法,在10个和50个结点的网络构建中都有相对变率策略的干预,由此可见,相对变化率的策略能提高网络构建的精度。
为了进一步说明相对变化率策略在网络构建中所起的作用,在10个结点的数据集上分别采用延迟动态贝叶斯方法,相对变化率策略方法和它们二者结合的方法来构建网络,这三种网络构建方法所获得的AUPR值如图4所示。实验结果说明采用相对变化率策略的方法和它们二者相结合的方法性能都优于单独使用时延动态贝叶斯方法,这充分说明相对变化率策略在网络构建中起着比较重要的作用。动态时延贝叶斯网络构建方法在计算结点潜在调控的父节点时,选取范围偏大导致网络中有较高的假阳性边,以致降低了网络构建的精度,如何把相对变化率策略和时延动态贝叶斯网络更好的结合,以提高网络构建的精度将是我们将来继续研究的问题。
3 结束语
文中提出了一种数据相对变化率的策略来预处理随机结点数据,以此来识别出网络中一些关键的结点,为后续的网络构建提供帮助,这些关键结点在生成的网络中会扮演一个非常重要的角色,它们会潜在地调控网络中的其它结点。在这个基础之上我们再采用时延的动态贝叶斯方法和一些先验知识来构建网络,所构建网络的优劣用性能指标AUPR和AUROC值来评估。试验结果验证我们的方法取得了良好的网络构建性能,在网络的构建准确率和精度都取得了较好的结果。如何把相对变化率策略和时延动态贝叶斯网络更好地结合,以提高网络构建的精度将是我们将来继续研究的问题。
摘要:从大规模实验数据中构建的网络可以反向发掘网络结点之间潜在的相互作用关系,可以更深层次解释网络结点间复杂的作用机理,因此产生了很多网络构建的理论建模方法。在一些实验数据中某个时间点的样本值表达减少或者被敲除,这会影响网络构建的精度。为了克服这个问题提出了相对变化率的策略来识别结点间潜在的作用关系。在时序实验数据中,用策略融合时延动态贝叶斯方法来进行网络构建。可以缩减贝叶斯的搜索空间,以此来获得较高的网络构建性能和精度。DREAM(Dialogue for Reverse Engineering Assessments and Methods)竞赛项目最早被提出用来严格检测结点间网络构建模型方法的性能和优劣。在这个数据集上推测出来的网络在AUROC(area under the ROC curve)和AUPR(area under the precision recall curve)指标上和其它方法进行了比较,实验结果验证算法在网络构建过程中总体性能略胜一筹。
关键词:复杂网络,网络构建,相对变化率,时延,贝叶斯网络
动态贝叶斯 篇2
炼化过程在大量的稳定工作状态中有不可避免的状态之间的转换过程,称之为过渡过程,启动和关闭过程是过渡过程的常见形式。当化工装置经历过渡过程,参数变量的从一个稳定状态值过渡到另一个稳定状态值。在此过程中,传统的报警系统无法判断过渡过程并为其预先设定告警管理方法。因此,在过渡过程期间,可能出现潮水般的误报警,即使转换到新的稳态过程后,报警洪水依然存在。当过渡过程已经结束,一个新的稳定状态开始,也可能因为阈值设置不当而导致报警错误。我国较早开展的告警管理方法的研究是在1982年应用于电力系统的云南电网计算机监控系统[1]和郑州供电网的计算机调度监控系统[2],利用DJS-131单机系统实现了功率信号的自动采集、叠加计算和告警功能。在工业过程领域内的告警管理主要包括以下几种方法:
1)基于典型案例的告警管理方法
基于对告警案例的分析总结经验提出这种方法,在处理一个告警信息后,将其作为典型告警案例记录下来,为后续的相似问题的解决提供学习经验。文献[3]研究多层次范例推理方法,提出了时序预测中的CBR循环模型,应用于时序数列的告警中。文献[4]提出了基于范例推理的工程监测位置和时序曲线矩阵的探索方法,建立支持向量机先验知识的告警管理模型。基于典型案例的分析方法直接引用以往的经验,但典型案例的数量的不断增多将造成查找的不便,此方法需要增加告警知识库或经验库来对典型案例进行分类和储存。
2)基于规则判断的告警管理方法
此方法引入了对告警信息的判断规则,一般在告警系统中添加一个告警策略监控机制,该机制决定了判断规则的使用逻辑顺序和推导条件。文献[5]提出一种基于频繁加权模式树的关联规则告警挖掘算法,该方法提高了数据挖掘的速度,提高告警管理的效率。文献[6]采用数据挖掘和大数据存储技术,实现故障特征与关联设备信息的提取及时发布告警信息协助运行人员分析和处理事故。文献[7]利用动态时间窗生成技术,通过判断规则对动态过程的故障征兆和发展信息进行监控,连续动态地进行告警管理。基于规则判断的告警信息分析方法的判断规则由专家或用户基于自主经验自定义,判断结果受到主观性影响较大。
3)基于神经网络的告警管理方法
在告警信息处理中引入人工神经网络方法,作为一种系统故障定位的途径。文献[10]通过高斯核函数的变换将离散的采集数据转化为伪连续的时间函数,减少间断点带来的误告警,但是提高了在线告警处理的难度,对实际应用中的实时函数值判断尚需进一步的研究。文献[11]研究在过程工业中由于告警算法的设计不当或缺乏适当的调试导致频繁告警(alarm chatter)的现象,通过分析历史告警数据得到频繁告警评判指数,用于甄别分类。文献[12]提出一种新的告警信息显示方法来解决告警洪水问题,改善了传统告警信息显示的列表模式。文献[13]提出一种基于有向网络目标检测方法(NIDS)的告警管理系统,该系统对每个告警信号赋予有向标识和分类处理,将误告警最小化。文献[14]提出一种支持决策告警管理方案,在实际告警发生前预测告警的发生情况和时间点,该方法有助于更快地完成诊断和告警,但是没有从根源上提高告警信息判断的准确性。文献[15]提出一种基于有向图的概率分析告警信号选择方法,使告警管理系统更加合理,该方法降低了误告警的概率。
结合国内外研究现状,针对动态关联炼化系统的告警管理方法存在以下两点技术难点:(1)现有的告警管理方法无法准确判断炼化装置运行中的过渡过程。(2)在过渡过程的正常运行中工艺参数随着工艺调节而动态变化,而现有的告警线设置无法自行动态调试。
因此,本文提出了基于贝叶斯估计的动态告警线计算方法,通过训练历史过渡过程数据得到先验概率,自适应判断过渡过程和估计动态告警线,解决了传统告警线的斜率不能赋值且只能依靠人为调节的问题,并可通过判断系统状态调节告警管理方式。
1 贝叶斯估计方法基本理论
与常用估计方法极大似然估计法相比,贝叶斯估计方法考虑先验知识的影响,更适用于历史数据的训练,估计结果更加准确。该方法不仅提高了预测的准确性和适应性,还大大地提高了系统的灵活性。贝叶斯估计方法是通过给定的样本数据D来确定在假设空间H中的D的最佳假设。最佳假设的定义是在给定样本数据D以及空间H时,D的同假设的先验概率在有关知识下的最可能假设。
一个线段变量是n对有序点的集合(ti,yi)(i=1,…,n),其中yi是时间ti的观测值,在点(ti,yi)中包括错误信息和噪声信息。为了建立[ti,tn]的回归模型,需要得到观测值与时间值之间的线性关系。一般地,线性方程的关系由两个因素决定:斜率β和y轴的截距α0,方程表示如式(1):
无论方程以何种形式表示,斜率β和y轴的截距α0必须已知。传统的方程参量估计方法经常使用最小二乘法,但是在没有数据概率模型的情况下无法得知斜率β和y轴的截距这两个必要条件。因此,引入贝叶斯估计的方法来进行方程的参量估计。
在应用贝叶斯估计方法前,作出以下假设:
1)方程假设
有关的未知线性方程:
其中,是直线t=珋t的y轴截距。假设和β的最小平方估计值是相互独立的,这使得计算的复杂性大大降低。
2)误差假设
每个变量的误差服从0到方差的正态分布,假设所有观测值yi的误差相对独立并恒等分布:
其中,是y的平均值,β是斜率,每一个误差ei服从0到方差的正态分布。
假设变量数据[tanchor,tn],需要应用贝叶斯估计方法做出拟合线段。根据上述假设,拟合线段由两个因素决定,斜率β和y轴的截距α0。斜率β的联合分布和由贝叶斯估计算出的y轴截距α0与先验概率和节点概率的乘积成正比。
其中,是联合概率密度,是节点概率。
由式(3)得知,yi|ti服从正态分布对于观测点联合概率密度为:
由于假设观测数据都是相互独立的,联合概率密度又可以表示为:
斜率β和y轴截距α0的节点概率有如下关系:
且斜率α0和y轴的截距α0服从正态分布:
计算β和α0的联合后验分布,由式(7)推出:
其中,
由此,可将变量数据[tanchor,tn]的下一时刻误差算出:
计算下一时刻的节点状态:
其中,
一旦预测分布算出,预测数据的置信区间可以得出,由置信区间计算动态告警线。估计方差用于获得未知离散噪音置信区间如下:
2 基于贝叶斯估计的炼化装置动态告警策略
本节采用贝叶斯估计法通过训练历史数据得到的动态告警线的先验概率,自适应判断过渡过程和估计动态告警线,具体实施步骤如下:
步骤一:训练历史数据
收集目标样本过渡过程的历史数据,将50次过渡过程的参数值时间序列作为贝叶斯估计的训练对象,以期实现过渡过程的准确识别和告警线的动态估计。
步骤二:贝叶斯估计动态告警线
对于一个典型的过程参数变量,预测值置信区间在95%的界限内是合理的[22],因此将高告警线和低告警线之间的间隔按照95%的置信区间设置,动态告警线的设置结果为(my-T0.025×s'y,my+T0.025×s'y)。
在历史数据的训练基础上,利用贝叶斯估计对动态告警线进行自适应估计,得到动态告警线的状态方程中各未知参数的估计值,估计过程见图1。
步骤三:动态告警管理
告警管理过程通过判断运行状态是否属于过渡状态,参数值是否触发动态告警线,对系统进行告警管理。管理过程见图2。
步骤四:动态告警结果检验
统计动态告警过程中告警数量,判断告警洪水是否发生。
历史数据的处理与训练在离线阶段完成,离线阶段的任务需在对过渡过程进行动态告警之前完成,并在不断的数据采集和告警过程中收集有效数据,及时更新贝叶斯估计的训练数据定时训练,以保障贝叶斯估计的有效性。
在线阶段的实时数据具有恒定的采样频率,根据贝叶斯估计方法,动态告警线不断的拟合确定,对不同阶段的过渡过程自适应地调整动态告警线。
3 案例分析
常压蒸馏是在接近大气压力条件下完成原油的分馏,从而将原油生产为石脑油、煤油、溶剂油、柴油及变压器油料等不同产品。原油通过加热炉被加热到360~370℃,进入到常压蒸馏塔,塔顶操作压力约为0.05MPa,塔顶蒸馏得到石脑油馏分,可与初馏塔顶的轻汽油一起作为催化重整的工业原料。由于常压蒸馏工艺在原油蒸馏流程中有“承上启下”的作用,因而要操作好常压蒸馏流程使其稳定运行。某炼化厂常减压塔的原油进料流量随着生产过程进行调节,流量调节过程属于过渡状态。
步骤一:训练历史数据
将50次124 min的过渡状态原油进料流量的历史数据作为训练对象,根据图1对样本进行动态告警线的训练,并用贝叶斯估计方法估计动态告警线。
步骤二:贝叶斯估计动态告警线
在历史数据训练的基础上,分别以两次原油进料流量的过渡过程作为目标样本,以5%浮动区间作为告警阈值区间,进行动态告警线的贝叶斯估计。
步骤三:动态告警管理
图3和图4为分别对两次原油进料流量的过渡状态数据进行动态告警的结果。
在图3中可看出通过贝叶斯估计训练成功在42、44、71和74 min识别出过渡状态并及时调整上下告警线,对过渡状态进行监控。
在图4中可看出通过贝叶斯估计训练成功在35、42、65和73 min识别出过渡状态并及时调整上下告警线,对过渡状态进行监控。
步骤四:动态告警结果检验
以传统告警方式为对照组,对比两种告警管理方法的误告警数量。在44和74 min时(示例1)及42和73min时(示例2),传统告警方式通过人为调节,更改告警上下线,告警线始终为与x轴平行的直线。两种告警方法的误告警数量对比分别见表1及表2。
通过两组对比数据得出,在过渡状态中传统告警管理方法难以实时调整告警线,产生大量误告警,造成告警洪水。动态告警管理方法适应性较强,能够完成过渡过程的监控与管理。
4 结论
1)研究了动态告警管理策略,以离线阶段的历史数据处理与训练为基础,在线实时的判断系统运行状态,采用不同的告警管理方式。动态告警管理方法解决了现有告警管理方法无法准确判断过渡过程并无法及时调整告警线的问题,系统性地判断动态过程并实时监控。
动态贝叶斯 篇3
配电系统在电力系统中处于末端,直接与用户联系,主要包含配电站、馈电线路、断路器、隔离开关等设备,因此配电系统可靠性评估不仅关系到配网规划的优劣,而且关系到电力系统供电能力和电能质量。
针对多状态元件组成的配电系统可靠性定量分析的难点及传统故障树在配电系统可靠性评估中的局限性,提出基于贝叶斯网络和随机集理论的复杂配电系统可靠性建模与评估的新方法。应用贝叶斯网络在建立由不确定因素组成的结构层次清晰的配电系统模型和图形化直观表达的优势,计算配电系统可靠性指标,从而对配电系统进行整体评价;结合包含DemP-ster组合规则在内的多种经典组合规则的随机集统一表示模型对任何一个或多个要素影响配电系统可靠性的概率进行计算,从而有效识别目前配电系统薄弱环节,为配电系统的改造提供坚实基础,为台州配电系统建模分析提供新思路。
1 配电系统可靠性指标
1.1 系统平均停电频率指标
每个由系统供电的用户在单位时间内的平均停电次数,以用户停电次数与系统供电的总用户数之比来表示,即:
式中,λi为负荷点的故障率;Ni为负荷点的用户。
1.2 系统平均供电可用率指标
1年内用户不停电的时间总数与用户要求供电的时间总数之比,即:
式中,μi为负荷点年平均停电时间。
1.3 系统平均停电持续时间指标
每个由系统供电的用户在1年内的平均停电持续时间为:
1.4 用户平均停电持续时间指标
1年内被停电用户的平均停电持续时间为:
1.5 总电量不足
系统在1年中因停电而造成的用户总电量损失为:
式中,Li为连接在每个负荷点上的平均负荷;Fi为负荷系数。
2 配电系统评估建模步骤
本文应用动态故障树和贝叶斯网络混合法建模的步骤如图1所示。
2.1 静态子树的分析计算
由于静态子树只包含用电负荷对配电系统可靠性的影响,因此对于只由用电负荷节点构成的静态子树,可采用二元决策图(BDD)直观算出系统故障概率。
在BDD中,配电系统正常时表示为0,故障时表示为1,因此有:
2.2 动态子树的分析计算
由于传统动态子树的求解采用马尔可夫链有组合爆炸的危险,因此利用贝叶斯网络的图表直观和双向推理更适合大型复杂配电网系统。本文将动态子树转换为贝叶斯网络分析求解。
2.2.1 贝叶斯网的定义
贝叶斯网络是一个有向无环图(Directed Acyclic Graph,DAG),它由代表变量的节点及连接这些节点的有向边构成。设“系统故障”为事件DSF,事件DSF为样本空间Ω,B1,B2,…,Bn为Ω的子集,且,并假定P(Bi)>0,则由贝叶斯公式可知某节点故障概率的计算公式为:
因此,系统整体故障概率为:
由式(1)推出动态贝叶斯网络的求解法,即由动态模块求出系统在任何时刻的故障概率为:
根据贝叶斯网络的反推,得出最可能引发系统故障的薄弱点为:
I(t)=P(DS=1|Si=1)—P(DS=1|Si=0)
2.2.2 逻辑门转化为动态贝叶斯网络
贝叶斯网络逻辑门的转换:故障树的先验概率表现为父节点的先验概率,转换形式如图2所示。
3 配电系统可靠性算例分析
下面以台州某10kV配电系统为实际算例,检验算法的有效性。台州某10kV配电系统如图3所示,主线路有工业负荷4个、商业负荷2个、居民负荷12个;支路1有工业负荷3个、商业负荷1个、居民负荷6个;支路2有工业负荷5个、商业负荷1个。
以主馈线为例建立的贝叶斯网络如图4所示,部分节点实际可靠性指标见表1。
各层次计算式如下:
式中,Li为线路长度;λi为线路故障率;ri为线路因故障停运时间;λPi为变压器故障率;rPi为变压器因故障停运时间。
负荷点概率式如下:
P(LP1=1)=1—P(L1=0)P(L2T1=0)
P(LP2=1)=1—P(L1D1L3D2=0)P(L9T2=0)
结合节点的实际可靠性指标,部分节点可靠性指标及配电系统可靠性指标见表2、表3。
由表2、表3可知,采用本算法计算出的数值与实际指标相差不大,且耗时短。
本文取P(DSF=1|C=1)求元件处在故障状态时系统故障概率,取P(C=1|LP2=1)求系统处于故障状态时各元件故障概率,这样不仅可求出各元件故障概率,而且通过计算运行状态下节点故障概率最高值可找出系统薄弱环节。
该算法可找出由隔离开关、断路器拒动造成的系统故障次数与总的系统概率百分比。如图5所示,线路L1、线路L3故障概率最高,其次为线路L4、线路L5、线路L6,提高这些元件的可靠性或缩短检修时间可适当提高系统可靠性。
如图6所示,当负荷点LP3故障时,线路L5、线路L10、变压器T3为故障概率较大的3个元件,概率值分别为0.423 7、0.238 8、0.217 2,其次为L1、L3、L4,提高这些元件的可靠性,可以增强负荷点LP3的可靠性。
4 结束语
本文结合动态故障树与贝叶斯网络,提出了完整的配电系统可靠性算法,并通过建立数学模型对配电系统进行评估。该模型解决了传统故障树无法反映配电系统动态特性的问题,真实反映了配电系统的实际情况,并可利用贝叶斯网络的双向性,找出配电系统中的薄弱点,以便加强监测及检修,确保配电系统的可靠性,适用于大规模复杂配电系统。通过对台州某配电系统可靠性的评估,证明了该模型的有效性。
参考文献
[1]陈文高,配电系统可靠性实用基础[M].北京:中国电力出版社,1998
[2]万国成,任震,吴日异,等.混合法在复杂配电网可靠性评估中的应用[J].中国电机工程学报,2004,24(9):92-98
[3]李志民,李卫星,刘迎春.复杂辐射状配电系统的可靠性评估[J].中国电机工程学报,2003,23(3):69-73
贝叶斯网络 篇4
贝叶斯网络是一种概率网络, 它是基于概率推理的图形化网络, 以下是贝叶斯网络中涉及的概率知识:
(1) 条件概率[2]:设A, B是两个事件, 且P (A) >0, 称P (B|A) =P (AB) /P (A) 为在事件发生的条件下事件发生的条件概率。
(2) 联合概率[2]:设A, B是两个事件, 且P (A) >0, 它们的联合概率为:P (AB) =P (B|A) /P (A) 。
(3) 全概率公式[2]:设实验的样本空间为S, A为E的事件, B1, B2, …, Bn为E的一组事件, 满足:互不相容; (3) P (Bi) >0, i=1, 2, …, m。则有全概率公式:。
(4) 根据 (1) 、 (2) 和 (3) , 很容易得到贝叶斯公式[26]:。
(5) 先验概率[2]:根据历史的资料或主观判断所确定的各种事件发生的概率, 该概率没能经过实验证实, 属于检验前的概率, 称之为先验概率。
(6) 分隔定理 (d-seperation) [3]:设A, B, C为网络节点中三个不同的子集, 当且仅当A与C间不存在以下情况的路径时, 称B隔离了A和C, 记作:D:
(1) 所有含有聚合弧段的节点或其子节点是B的元素。
(2) 其它节点不是B的元素。
(7) 条件独立性假设[4]:依据分隔定理, 如果B隔离了A和C, 则认为A和C是关于B条件独立的, 即:P (A|C, B) =P (A|B) 。
2贝叶斯网络的结构
贝叶斯网络又称信念网络, 一个典型的贝叶斯网络由两部分组成[5]:第一部分是一个有向无环的图形结构G, 其中每个节点代表一个变量, 节点之间的有向弧段反映了变量间的依赖关系, 指向节点X的所有节点称为X的父节点, 图1为一个贝叶斯网络的拓扑结构;另一部分是与每个节点相关的条件概率表 (CPT, conditional probability table) , 该表列出了此节点相对于其父节点的所有可能的条件概率。
贝叶斯网络规定以节点Xi的父节点为条件, Xi与任意非Xi子节点条件独立, 按此约定有n个节点的贝叶斯网络的联合概率分布为[6]:
其中π (Xi) 是网络中Xi父节点集合∏ (Xi) 中的变量取值后的一个组合。若Xi没有父节点, 则集合∏ (Xi) 为空, 即P (Xi|π (Xi) ) =P (Xi) 。
3贝叶斯网络的推理
贝叶斯网络的推理通常是从先验知识入手, 按贝叶斯规则沿网络弧线层层演进而计算出我们感兴趣的概率。依据贝叶斯学派的观点, 概率推理本质上就是信任度的传播, 按推理方向贝叶斯网络有三种重要的推理模式[7]。
3.1因果推理或自上而下的推理
此模式是从先验概率开始的正向推理过程。之所以称为因果推理, 是因为贝叶斯网络中相连两节点表达了一种直接的因果关系。以图1为例, 求概率:, 因果推理的过程可总结如下:
(1) 将询问节点 (X4) 的其它父节点 (未在条件中出现) 加入到询问节点, 条件不变, 对新节点的所有状态求和。
(2) 利用贝叶斯规则将和式中的每一项展开, 因为伴随询问节点的CPT只提供了形式为P (Xi|π (Xi) ) 的概率。
3.2诊断推理或自下而上的推理
此模式是在已知结论的前提下, 推断出可能引发该结论的原因。以图1为例, 求概率P (X1|X4) 的过程为:, 其中P (X4|X1) 需利用因果推理求得。所以诊断推理的主要一步是将概率转换为因果推理的形式。
3.3解释推理
问题中已经包含了原因和结果, 这时如果要推断其它导致该结果的原因, 就需要运用解释推理。解释推理可概括为:诊断推理中运用因果推理。例如求P (X1|X4, X2) 的过程:, 这就是解释推理, 其中P (X4|X2) 也需要利用因果推理, 本质上解释推理是前两种模式的混合。
4结束语
综上, 贝叶斯网络是一系列变量的联合概率分布的图形表示。实际上这种表示法最早被用来对专家的不确定知识编码, 今天它们在现代专家系统、诊断引擎和决策支持系统中发挥了关键作用。贝叶斯网络的一个被经常提起的优点是它们具有形式的概率语义并且能作为存在于人类头脑中的知识结构的自然映像。这有助于知识在概率分布方面的编码和解释, 使基于概率的推理和最佳决策成为可能。论文主要介绍了贝叶斯网络的概率基础、拓扑结构以及贝叶斯网络的推理。
参考文献
[1]王军, 周伟达.贝叶斯网络的研究与进展[J].电子科技, 1999 (8) :5-7.
[2]盛骤, 谢式千, 潘承毅.概率论与数理统计[M].北京:高等教育出版社, 第2版, 1989:18-25.
[3]Judea Pearl.Causal diagrams for empirical research.Biometrika, 1995, 82 (4) :669-709.
[4]余东峰, 孙兆林.基于贝叶斯网络不确定推理的研究[J].微型电脑应用, 2004, 20 (8) :6-8.
[5]Luis M.de Campos, Juan M.Fernández-Luna, Juan F.Huete.Clustering terms in the Bayesian network retrieval model:a new ap-proach with two term-layers.Applied Soft Computing, 2004, 4:149-158.
[6]Berthier Ribeiro-Neto, Iimério Silva, Richard Muntz.Bayesian network models for IR.Soft Computing in Information Retrieval Tech-niques and Application, 2000:1-32.
贝叶斯网络推理算法研究 篇5
现代大型复杂系统的贝叶斯网络结构也是庞大复杂的,对于诊断推理存在困难。因此在进行诊断推理前,应适当地对其网络结构进行简化。本文采用分簇优化联合树算法对贝叶斯网络结构进行简化处理及推理运算,下面介绍分簇优化联合树算法及其用于网络参数学习及诊断推理算法。
1 分簇搜索算法基本思想
用于故障诊断的贝叶斯网络的结构是非常复杂的,并且由于其结构的复杂性致使故障诊断推理也非常复杂,因此,通过贝叶斯网络结构学习,寻找一个与训练数据拟合度高且网络复杂性相对较低的网络结构成为一个非常有意义和研究价值的问题。由式可知,n个变量构成的贝叶斯网络结构的数目是指数级的,要从这些可能存在的网络结构空间中搜索出最优的网络结构也是很难的。当n=10时,需要搜索的模型个数就已经达到约为4.17*1018,可见搜索空间太大,为了缩小搜索空间,有效地找到最优解,一个较好的搜索算法就非常必要。
贝叶斯网络结构的学习实际就是优化搜索的问题。基于分簇的优化搜索方法就是将问题节点划分为团簇结构。团簇结构思想最早用于物理和化学领域中对分子和原子的处理,而在近代,团簇结构在许多领域得到了广泛的应用,包括模式识别,数据分析,图像处理等。许多学者都在这方面做出了研究,旨在发现能够用于更好聚类方法的簇结构,不同的网络拓扑结构对于分簇算法都是不同的。人工智能越来越多地研究这种方法,使之成为一种较为优秀的搜索算法。基于簇的搜索方法被证实较好地用于解决TSP问题。这种方法的主要优势在于不会陷入局部最优,并且搜索时间非常短。
分簇算法的基本思想是把网络结构中的节点划分为若干个簇,簇内依据某种事先约定的值进行连接,在簇与簇之间,也根据这种约定进行点与点之间的连接,这里设定一个阀值,节点间的关联程度大于这个阀值时就连接这两个节点,最终基于簇的这种搜索算法将形成一个团簇树状结构。
基于簇的结构学习算法是由初始的贝叶斯网络结构经过优化搜索构造出用于诊断的树形结构。设用于该算法的阀值为θ,由当前信息得到相关节点的关联程度为θij,表示第i个节点和第j个节点的关联程度,设两个数据结构D 1,D 2分别存放局部网络的起始参数节点表和目标节点表,首先把网络的所有节点都放入D 1表中。具体的步骤如下:
步骤1:随即选取一个起始节点V1,比较与V1相关的各个节点的θ1k值,若θ1k≥0,则将V1和Vk划分到一个簇S1内,把簇S1中的节点都从D1表中移出,放入表D2中。
步骤2:如果D1为空表,则转到步骤4。
步骤3:在D1表中随即选取一个节点Vn,比较与Vn相关的各个节点,分两种情况:
(1)若无关联节点,则将Vn单独划分到簇S2中,并将节点Vn从表D1中移出,放入表D2中,转入步骤2。
(2)若有关联的节点,且关联值为θnm,若θnm≥0,则将Vn和Vm划分到一个簇S2中,把簇S2中的节点从D1表中移出,放入表D2中,转入步骤2。
步骤4:在簇到S1之Sn间,观察是否簇间有相关联的节点,若相关联,且关联值θij≥θ,则将Vi与Vj相连接。
该算法的最终目的是搜索出一个较为简单的网络结构,减少网络推理的复杂度,使学习后的网络结构能够使用精确推理算法来实现推理,得出一个较为准确的结果。
搜索的过程如图1所示。
从图1可以看出,在经过分簇搜索之后,网络结构(d)比网络结构(a)有了一定程度的简化。
有效的贝叶斯网络推理算法是贝叶斯网络的重要内容,也是其应用的前提。大型复杂的故障诊断系统,所建立的贝叶斯网络模型也具有非常复杂的结构,为了降低贝叶斯网络的推理复杂度,使其更容易应用于解决实际问题,一般的推理算法都是在简化网络结构上进行研究的。下面来分析经过分簇结构优化算法后的网络推理。
2 联合树推理
分簇优化联合树算法实现对贝叶斯网络的诊断推理。分簇优化联合树算法是分簇优化算法与联合树算法的结合,其流程图如图2所示。分簇优化已在前文介绍,下面介绍流程图中其余步骤。
2.1 贝叶斯网络转化为联合树
将贝叶斯网络B转化为联合树,分为四步:建立B的Moral图;三角化Moral图;确定所有的团(Cliques);建立联合树。
(1)建立B的Moral图
简历Moral图的过程就是找出每个节点的父节点,并将他们用无相边两两相连,同时将所有有向边改为无向边。
(2)三角化Moral图
在Moral图中添加一些无向边,使图中每个大于或等于4的环中,都存在一条边连接两个非相邻节点。这就完成了对Moral图的三角化。
(3)确定所有的团(Cliques)
对Moral图三角化的目的就是找到构成联合树的所有团。团是Moral图三角化后最大的全连通子图,团中每对不同的节点都有边相连。
(4)建立联合树
利用得到的团,添加一些边和分隔节点就可构造一棵联合树T。联合树T要满足:树中任意两个团C,C′在连接它们的路径上的所有团节点必须包含变量C∩C′。
2.2 初始化
将贝叶斯网络转化为联合树后,就要对联合树的所有节点指定参数,即对联合树进行初始化。下面的算法实现了对满足条件的联合树参数的指定。
若联合树中的团Ci由X1,X2,…,Xr,r个节点组成,每一个节点有Sr个状态,则共有个状态组合。i代表Ci的分布函数,ij代表图Ci第j个状态组合的分布函数。具体步骤是:
for一个随机变量V
找到包含V的家庭的团Ci;
fori=1,…,n(n为团的数目)
orj=1,…,m(m为团C状态组合的个数)
初始化Φij,使Φij=1;
forj=1,…,m
Φij=Φij*P(Vj|Pa(Vj))
2.3 消息传递
对联合树进行初始化后,要在联合树上进行消息传递。通过个团节点之间的消息传递,可以是联合树达到全局一致,即达到稳态。如图3所示是团节点间一次消息传递的过程。
从节点Ci到Cj的一次消息传递过程包括以下几步:
(1)产生消息:
(2)吸收信息,更新团结点的分布函数:
(3)更新分隔节点的分布函数:
2.4 概率计算
当一个联合树通过消息传递满足全局一致性后,即可计算任意随机变量V的概率分布。找到任意一个包含变量V的团节点C,通过可计算出变量V的分布。
2.5 加入证据
若有新的证据加入,重复证据收集和证据扩散的过程,直到得到全局一致的联合树为止。当联合树再次满足全局一致性时,对任意的团C有:C=P(C,e),(e表示加入的证据)。要计算假设的变量V的概率分布,首先找到任意一个包含变量V团结点C,,再根据条件概率公式,求出变量V的概率分布
3 结束语
有效的贝叶斯网络推理算法是贝叶斯网络的重要内容,也是其应用的前提。大型复杂的故障诊断系统,所建立的贝叶斯网络模型也具有非常复杂的结构,为了降低贝叶斯网络的推理复杂度,使其更容易应用于解决实际问题,一般的推理算法都是在简化网络结构上进行研究的。而分簇简化联合树算法在对网络结构简化之后再进行网络推理,一定程度上简化了网络推理的难度。
摘要:大型复杂贝叶斯网络的诊断推理存在困难,在其推理诊断之前对网络结构进行适当的简化,可以有效地加快诊断推理速度。采用分簇联合树算法实现对网络结构的简化与推理。主要介绍了分簇搜索算法的基本思想、实现步骤及联合树推理算法,并将它们结合使用,使贝叶斯网络的简化推理更有效。
关键词:贝叶斯网络,概率推理,分簇理论,联合树
参考文献
[1]Wang Weidong,Zhu Qingxin.A Hierarchical Clustering Algorithmand Cooperation Analysis for Wireless Sensor Networks[J].Journalof Software,2006,17(5):1157-1167.
[2]Stephenson T.A.An Introduction to Bayesian Network Theory andUsage[Z].IDIAP-PR,Feb,2000.
[3]Gregory F Cooper,Edward Herskovits.A Bayesian method for theinduction of probabilistic networks from data[J].Machine Learning(S0885-6125),1992,9(4):309-347.
[4]衡星辰,覃征,邵利平,等.动态贝叶斯网络在复杂系统中建模方法的研究[J].系统仿真学报,2006,18(4):1002-1005.
[5]邢永康.信度网理论及应用研究:[D].重庆:重庆大学,2001.
贝叶斯公式的教学初探 篇6
一、创设情境, 图片案例引入———以背景导课
利用多媒体播放图片和网络视频案例“湖北武汉苑先生发烧住院, 检查费3500元”, 并提出一个问题 (你被“过度医疗”过吗?) 吸引学生的注意。在以药养医的问题之外, 以查养医更应引起有关部门的关注, 医生看病是应该有针对性的开方, 还是列出清单式的化验指标进行排查?引发学生思考, 使学生尽快进入学习状态。
二、案例求解“医疗诊断”———以疑难启思
结合已有基础, 循序渐进启发教学对提出案例尝试求解, 锻炼学生建模能力, 突破难点。
分析案例中苑先生的症状是发烧 (结果) A, 目的是找到病因Bi (原因) , 这实际上是一个因果求因的过程, 根据医学知识及临床数据的统计资料, 对发烧病因总结为四大类 (1) B1:感染性疾病, 发病率为0.1 (2) B2:结缔组织疾病, 发病率为0.05 (3) B3:肿瘤性疾病, 发病率为0.005 (4) B4:其它类, 发病率为0.845。每种病因导致发烧的可能性分别为0.6, 0.8, 0.85, 0.005, 问题变为求P (Bi│A) =?
解
计算得到P (Bi│A) =0.55, 0.37, 0.04, 0.04 (i=1, 2, 3, 4) , 即最有可能得的是感染类疾病。
三、新课教学“贝叶斯公式”———以方法解惑
对案例的求解过程总结方法, 得到本次课的具体内容, 结合案例, 详细讲解公式的背景含义, 实现认识目标。
求解中体现了另一种思想, 已知结果找原因, 把公式推广到一般情况, 即是贝叶斯公式:
定理:设B1, B2, …, Bn为样本空间S的一个划分, 如果以P (Bi) 表示事件Bi发生的概率, 且P (Bi) >0。对于任一事件A, 则有:
在对公式的总结过程中, 教师可以提问与学生互动。关于公式含义的理解, 直观地将Bi看成是导致A发生的各种可能原因, 且P (A│Bi) 已知, 如果A已发生, 反过来要根据这个新信息讨论Bi中哪个发生的可能性最大, 是导致A发生的真正原因, 它是一个由果求因的条件概率。
设B1, B2, …, Bn是病人可能患有n种不同疾病, A为病人出现的某种症状, 从概率论的角度讲, 若P (Bi│A) 较大, 则病人患Bi种病的可能性较大, 可利用贝叶斯公式建立一种定量化的诊疗方案, 由此可更直观认识到这个公式的意义。公式的应用还需要注意以下几个方面 (1) 必须有准确的数据, 即准确预测某种疾病的发病率P (Bi) , 可由过去的统计数据得到, 在诊断之前已知, 也称先验概率 (先于试验) , (2) 找到引起A发生的所有病因, 但因为病因的复杂性, 会导致样本空间的划分个数较大, 需要结合医学规律进行合理的选择。因此我们喜欢找专家看病, 较准确在确定几种可能的疾病及估计先验概率, 有针对性化验、确诊, 能更好地“对症下药”。对应的P (Bi│A) 称为后验概率, 是根据症状A的出现对Bi发生概率的修正。通过可能患有的疾病Bi和出现的症状A的假设可以更直观的理解贝叶斯公式的意义——由果求因。
四、寓言解析“狼来了”———以问题开拓
贝叶斯公式的应用远远不止如此, 在我们身边无处不在, 所有需要作出概率预测的地方都可以见到它的影子, 这时教师可以和学生积极互动, 让学生思考还有哪些方面可以体现这一公式的思想。以重温寓言故事“狼来了”为切入点, 教育学生做言而有信的人, 实现教书中育人。提出问题:用数学方法分析此寓言中村民对这个小孩的可信程度是如何下降的呢?
分析:设Ai:小孩说谎i次, B:小孩可信, 设村民过去对小孩的印象为
即可信孩子说谎的可能性为0.1, 不可信孩子说谎的可能性为0.5。小孩说了一次谎后, 村民对他可信程度的改变即求P (B│Ai) 。
说明村民上了一次当后, 对这个小孩的可信程度由原来的0.8调整为0.444, 按照上面的方法, 第二次说谎后, 村民对他的可信程度改变为0.138, 如此低的可信度, 村民听到第三次呼叫时怎么再会上山打狼呢?通过这样的介绍, 既提高了学生对公式的运用能力, 同时对学生也进行了一次关于诚信的教育, 所谓“一箭双雕”。
五、背景前沿介绍———以思想为纲
贝叶斯公式体现的是一种思想方法, 这种思想经过多年的完善和发展如今形成一整套统计推断方法, 即贝叶斯方法, 如今它的应用已延伸到各个问题领域, 在人工智能、计算机诊断、医学研究、经济学等方面都有重要的应用。对公式的发展背景及前沿作一介绍, 了解相应数学史及应用领域, 拓宽知识。通过一个简单的概率公式给我们的实际生活以理论指导, 这也是理论联系实际的一个表现。
通过这样的教学设计, 使学生学得主动, 学得深刻, 知识掌握得更加牢固。循循善诱, 步步紧逼, 激发学生的求知欲望, 使学生主动去学, 主动去探讨, 变被动为主动, 从而培养学生的探索能力和自学能力。不仅能理解该公式的含义, 更重要的是掌握了其应用及这种思想方法, 为后续的学习打好基础, 经过课堂实践, 效果非常好。
参考文献
[1]茆诗松, 程依明, 濮晓龙.概率论与数理统计教程 (第1版) [M].北京:高等教育出版社, 2004.
基于利他的贝叶斯均衡研究 篇7
基于Marco G和Morgan J于2008年提出非合作博弈轻微利他理论[10],王能发[11]在企业成本信息完全公开且成本相同的条件下,引入利他因子0<ε<1,推广至n个企业的利他博弈,并且分析了随着利他因子的变化,总产量和总利润的变化规律,为实际竞争中打破垄断提供了最优策略。
本文推广张维迎[7]的结论,分析对手成本信息不完全公开下的古诺-纳什模型,比较成本信息完全公开与否对两个企业最优均衡产量的影响。并引入利他因子0<ε<1,讨论两个企业在成本信息不完全公开竞争中实现利他(期望)利润最优化的贝叶斯利他均衡产量,分析了利他因子对两个企业贝叶斯利他均衡产量的影响。
一、成本信息不完全公开的古诺模型
企业1的成本c1为公共信息,企业2的成本c2是两点分布的随机变量,c2以概率p21取到低成本c2L,以概率p22取到高成本c2H。其中p21+p22=1,p21cL2+p22c2H=Ec2。
企业1和企业2的利润函数:
假设1:π1(q1,q2),π2(q1,q2)分别为企业1和企业2的利润函数;
假设2:产品价格p=a-q1-q2,其中a为常数且a>c1,a>c2。
企业2的利润函数极值条件为:
企业2的反应函数:
由于企业1不知道企业2的使用成本,所以考虑企业1的期望利润函数:
企业1的期望利润函数的极值条件为:
企业1的反应函数:
联立(1)式,解得:
(q1*,q2*)即为两个企业在成本信息不完全公开下的贝叶斯均衡产量。
定理1设企业1在成本信息完全公开下的纳什均衡产量为q1*L和q1*H,有q1*L<q1*<q1*H,企业2在成本信息完全公开下的纳什均衡产量为q2*L和q2*H,有q2*H<q2*<q2*L。
证明:若企业2公开成本为c2=c2L,得到企业1的纳什均衡产量:
若企业2公开成本为c2=c2H,得到企业1的纳什均衡产量:
由于c2L<Ec2<c2H,所以
同理可证,对企业2有q2*H<q2*<q2*L。证毕。
结论:若企业2公开成本为c2=c2L,则企业1的纳什均衡产量低于贝叶斯均衡产量,企业2作出相应反应;若企业2公开成本为c2=c2H,则企业1的纳什均衡产量高于贝叶斯均衡产量,企业2作出相应反应。
定理2设企业1在成本信息完全公开下的最优期望利润为Eπ1*L(q1*L,q2*L)和Eπ1*H(q1*H,q2*H),在成本信息不完全公开下的最优期望利润为Eπ1*(q1*,q2*),有Eπ1*L(q1*L,q2*L)<Eπ1*(q1*,q2*)<Eπ1*H(q1*H,q2*H);企业2在成本信息完全公开下的最优利润为π2*L(q1*L,q2*L)和π2*H(q1*H,q2*H),在成本信息不完全公开下的最优利润为π2*(q1*,q2*),有π2*H(q1*H,q2*H)<π2*(q1*,q2*)<π2*L(q1*L,q2*L)。
证明:设企业1在成本信息不完全公开下的最优期望利润为Eπ1*(q1*,q2*),有Eπ1*(q1*,q2*)=(q1*)2
根据定理1,有q1*L<q1*<q1*H,则
同理可证,对企业2有π2*H(q1*H,q2*H)<π2*(q1*,q2*)<π2*L(q1*L,q2*L)。证毕。
结论:两个企业在成本信息不完全公开下的最优(期望)利润介于成本信息完全公开下的两个最优(期望)利润之间。
二、成本信息不完全公开下,考虑利他的古诺模型
在成本信息不完全公开的古诺模型里,引入利他因子0<ε<1。建立企业1和企业2的利他函数:
假设1:π1ε(q1,q2),π2ε(q1,q2)分别为企业1和企业2的利他函数;
假设2:产品价格p=a-q1-q2,其中a>0,a均为常数;
假设3:ε为利他因子,0<ε<1。
企业2的利他函数极值条件为:
企业2的反应函数:
由于企业1不知道企业2的使用成本,所以考虑企业1的利他函数期望:
企业1利他函数期望的极值条件为:
企业1的反应函数:
联立(2)式,解得:
(q*1ε,q*2ε)即为两个企业在成本信息不完全公开下考虑了利他的贝叶斯利他均衡产量。
定理3设企业1在成本信息完全公开下的纳什利他均衡产量为q1ε*L和q1ε*H,有q1ε*L<q*1ε<q1ε*H,企业2在成本信息完全公开下的纳什利他均衡产量为q2ε*L和q2ε*H,有q2ε*H<q*2ε<q2ε*L。
若企业2公开成本为c2=c2L,得到企业1纳什利他均衡产量:
若企业2公开成本为c2=c2H,得到企业1纳什利他均衡产量:
同理可证,对企业2有q2ε*H<q*2ε<q2ε*L。证毕。
结论:若企业2公开成本为c2=c2L,则企业1的纳什利他均衡产量低于贝叶斯利他均衡产量,企业2作出相应反应;若企业2公开成本为c2=c2H,则企业1的纳什利他均衡产量高于贝叶斯利他均衡产量,企业2作出相应反应。此结论与成本信息不完全公开的古诺模型结论一致。企业2成本信息不完全公开时,企业1采用的最优贝叶斯(利他)均衡产量介于企业2公开成本时的两个纳什(利他)均衡产量之间,企业2作出相应反应。
图2企业2的纳什利他均衡产量和贝叶斯均衡利他产量比较
考虑下列情形的数值模拟。
设a=2,c1=1,c2L=0.6,c2H=0.9,p21=0.5,p22=0.5,此时,Ec2=p21c2L+p22c2H<c1。取0<ε<0.7,做出企业1纳什利他均衡产量和贝叶斯利他均衡产量的比较图图1及企业2纳什利他均衡产量和贝叶斯利他均衡产量的比较图图2。由图1、图2观察到,无论企业2成本信息是否完全公开,企业1的均衡产量均随着利他因子的增大而减小。企业2的均衡利他产量随着利他因子的增大而增大,说明当企业2的成本具有明显优势时,企业2更倾向于利他。
定理4当0<ε<1时,两个企业的贝叶斯利他均衡总产量为Qε*(ε),满足Qε*(1)<Qε*(ε)<Qε*(0)。
证明:当0<ε<1时,两个企业的贝叶斯利他均衡总产量为Qε*(ε),有:
因为c1<a,c2<a,Ec2<a,所以:
因此Qε*单调递减。又
即Qε*(1)<Qε*(ε)<Qε*(0)。证毕。
结论:此结论具有一般性,无论企业2成本信息是否完全公开,两个企业的利他均衡总产量随着利他因子ε的增大而减少。
三、结束语
面对成本信息不完全公开的竞争,企业1的贝叶斯均衡产量介于成本信息完全公开时的两个纳什均衡产量之间,企业2相应作出反应,这一特征,在考虑了相同利他因子的情况下仍然成立。成本信息不完全公开下的最优期望利润,可能会比成本信息完全公开下的最优期望利润小,但是不失为化被动为主动的最优竞争策略。而两个企业总产量随着利他因子的增加而减少,这为企业在成本信息不完全公开下的反垄断提供决策参考。结论推广到n个企业成本信息不完全公开的竞争是否成立,或一般化为企业间的差异利他,结论会怎样改变,有待进一步论证。
摘要:本文比较了成本信息公开与否对两个企业均衡产量的影响,在成本信息不完全公开的情况下,引入利他因子0<ε<1,建立企业在成本信息不完全公开下的利他函数,讨论了两个企业在成本信息不完全公开下的贝叶斯利他均衡产量。