贝叶斯决策分析

2024-10-04

贝叶斯决策分析（精选8篇）

贝叶斯决策分析篇1

一、风险决策理论基础

（一）风险决策概念

风险的基本含义是损失的不确定性。但是，对于这一基本概念的出发点和关注点不同，它在不同人眼中的定义也各不相同。由于本文主要探讨风险决策问题，故把风险定义为不确定性。而这种不确定性又可以分为客观的不确定性和主观的不确定性。客观的不确定性是实际结果与预期结果的离差，它可以使用统计学工具加以度量。主观的不确定性是个人对客观风险的评估，它同个人的知识、经验、精神和心理状态有关，不同的人面临相同的客观风险时会有不同的主观的不确定性。每一个风险单位面临的风险都是纷繁复杂的，而应对一种特定的风险可以采用的方法又是多种多样的。为达到以最小投入获得最大安全保障目标，必须在所有的对策中选择最佳组合，这就是风险决策过程中的重要内容。风险决策的前期工作都是为决策工作提供必要的信息资料和决策依据，以帮助风险管理人员制定尽可能科学、合理的风险决策。

（二）风险决策意义与原则

决策工作在风险管理中的关键作用可从决策本身的内涵中得到体现：其一，风险决策取决于风险管理宗旨，风险决策对应于风险管理目标，是实现风险管理目标的保障和基础，必须确保所采取的风险决策能达到以最少的费用支出获得最大的安全保障这一管理目标。其二，风险决策是对各种风险管理方法的优化组合和综合运用，从宏观的角度制订总体行动方案。风险管理计划的编制要依据风险管理目标，分析风险因素、风险程度，了解可供选择的方法的利弊及成本，在综合评价后做出合理的选择和组合。同时，风险本身所具有的一些特性，如客观存在性、偶然性和多变性，使风险决策具有区别于其他一般管理决策的特点。为保证风险管理目标的实现，风险管理决策应该坚持全面周到原则、量力而行原则、成本效益比较原则及注重运用商业保险，但不忽视其他方法的原则。

二、贝叶斯分析法理论说明

（一）基本思想

贝叶斯决策分析就是在不完全情报下，对部分未知的状态用主观概率估计，然后用贝叶斯公式对发生概率进行修正，最后再利用期望值和修正概率做出最优决策。贝叶斯决策理论方法是统计模型决策中的一个基本方法。其基本思想是：（1）已知含有未知参数的概率密度表达式以及未知参数先验概率；（2）利用先验分布计算其后验概率；（3）根据后验概率求参数贝叶斯决策。寻求贝叶斯决策函数有两条路径，一条是使后验风险最小，一条是使贝叶斯风险最小。

（二）相关模型与计算方法

贝叶斯分析法的相关模型及计算方法可以简述为：设A1,A2，…An，为一完备事件组，事件B仅在完备事件组中某一事件发生时才发生，而且P(B)>0，在事件B出现的条件下，事件Ai出现的条件概率用P(Ai/B）表示，则由如下贝叶斯公式求出P(Ai/B):

上式中P(B/Ai）表示在事件Ai发生的条件下B发生条件概率，P(B）是事件B发生的全概率，即：

对于贝叶斯决策，先进行先验分析，也就是详尽列出决策矩阵或决策树，对各种状态发生的概率和条件结果都要加以估计或测算，但如果人们有可能进一步收集信息，就有可能使决策进行得更有把握一些。所谓决策树，是组织和表示决策者所面临的各种决定和不确定问题的一个系统化方法。通过对一个不确定事件所有可能出现数值结果的加权平均值的计算，得出预期的货币值，从而根据择优原则，进行评估和选择的决策方法。本文也会将贝叶斯分析法体现在决策树分析过程中，进行对不确定事件风险决策的应用与研究。

（三）案例说明

下文以一个投资示例来表明贝叶斯分析法的基本思想。

吉姆有10万元资金，如果用于某项开发事业，估计成功的概率为96%，成功时可获利12%，若一旦失败，将丧失全部资金。如果把资金存入银行，可得稳定利息6%。此外，吉姆发现使用咨询公司可以得到一些信息上的帮助，咨询费用为500元。本文将该咨询公司的意见实施结果列出来，如表1所示。吉姆经过考虑，决定去咨询公司咨询，虽然他知道这些信息只能供参考，如果咨询公司的意见是可以投资开发这项事业，问：吉姆现在应该如何决定？

本例中，存在投资成功（S）和投资失败（F）两种状态，各状态的先验概率为：

本例中，针对咨询公司意见实施结果，设事件Y为可以投资，N为不可以投资。则此时有：

此时，利用贝叶斯公式，计算出两种投资状态发生的后验概率。事实上，吉姆更关心如果咨询公司意见为可以投资的情况下，投资成功和投资失败这两种状态发生的概率。即有：

同理，咨询意见为不宜投资的情况下，投资成功和投资失败的概率分别可计算为：

根据计算分析可以推断，在咨询意见为不宜投资的情况下，吉姆将把资金存入银行。故根据后验概率调整计算结果，可得到在咨询意见为可以投资的情况下，投资于开发事业的货币的期望收益值（EMV1）为：

存入银行的货币期望收益值（EMV2）为：

因此，从计算结果中选出最大者10544元，即通过贝叶斯决策方法调整出的最优方案为投资于开发事业。而基于最大货币期望收益值准则，决策结果也是投资于开发事业。

上述风险决策的分析过程将贝叶斯决策分析的应用原理及计算方法加以说明，同时，在这个过程中，也看到了贝叶斯分析法在决策中的重要应用作用。

三、风险决策中贝叶斯风险分析的具体应用

（一）提出问题

某套待售房屋要价是40万美元，并且上市仅仅一天。有一个客户A打算购买此房屋，他的经纪人B说明在当天看了这套房子的客户中，至少有20个以上的客户想购买这套房子。B还补充，另外一个经纪人打算当天下午商谈有关这套房子的购买事宜。B劝告A如果决定购买，出价应该接近40万美元的要价。如果另一个购买这套房子的竞争者出相近的价格，那么销售商通常要求购买房子的客户第二天给出最终的价格。

针对这一情况，客户A认为房子40万美元可以考虑。如果他购买这套房子成功，他给这套房子的“情感值”赋值为1万美元。也就是说，如果可接受市场价格为40万美元，他需要花41万美元购买这套房子。因此，如果他以39万美元成功地购买了这套房子，这套房子的最终获益结果值为2万美元。当然，如果他们并没有成功购买这套房子，那么这套房子的结果值将仅为0美元。客户A对于他仅仅是一个竞争的参与者的概率也赋值为0.3。

他已经决定考虑选择以下三种价格中的一个：39万美元、40万美元或40.5万美元。他估计，如果他仅仅是一个竞争的参与者，那么花费39万美元价格的概率是0.40，花费40万元价格的概率是0.60，花费40.5万美元价格的概率为0.90。

然而，如果还有其他的竞争者，A假设销售商要求他第二天呈送最终的价格。在这种情况下，他将不得不重新考虑做出决定：他可以取消购买计划，呈上相同的购买计划，或者再增加5000美元的购买计划。他认为在多个竞争者存在的情况下，花费39万美元价格的概率是0.20，花费39.5万美元价格的概率是0.30，花费40万美元价格的概率是0.50，花费40.5万美元价格的概率是0.70，花费41万美元价格的概率是0.80。

（二）解决问题

为了客观做出购买这套房子的决策，试想客户A选择运用贝叶斯风险决策方法，将不同决策的结果进行预测，并构建决策树模型来帮助他作出决定。可以根据前面的思路进行决策分析，将贝叶斯分析法的结果体现在决策树模型中来，如图1所示。

由上述决策树的分析方法，可以清楚地看到在面临每一种不确定事件的时候，即需要做出风险决策的时候，都是给定一个概率，根据各事件发生的可能性不同和所得的结果值不同，又可以进一步运用贝叶斯风险决策方法，将不同的事件结果值和相对应的发生概率相结合，求出不同风险决策结果所带来的货币加权平均值，根据这种结果，就可以对决策有一个清晰的认识，并对决策事件价值有一个初步的评估，具有相当的参考意义。

为了说明决策树求解过程中的思路，就客户A选择出价39万美元的决策进行分析：在这个事件中，风险决策事件为“购房报价决策问题”，所采取的方法为“贝叶斯风险决策法”，将不确定事件的结果尽量明晰化，将损失减少到最小，以期利益最大化。

故：设购房者中只有客户A一人，而没有其他的竞争者，表示为：

由于该房子在A心理价位最高可达41万美元，故如果客户可以出价39万美元购到房子，获益的心理结果值如描述所说为2万美元，这种结果发生即房产商接受这种价位的概率为0.4，表示为P(one-39)=0.4，故若客户A在没有其他竞争购买者，出价39万美元所获得的风险决策价值Y(one-39）的计算结果是：

若客户A不是唯一的购房者，也就是说A还有竞争者，则需要二次竞价。此时，A仍出价39万美元，即此时获益的心理结果值仍为2万美元，但房产商买给A的概率降为0.2，即P(multi-39)=0.2，未成功竞价，1-P(multi-39)=0.8，此时

另一种情况，A为了得到房子，准备增加5000美元，即同理有P(multi-39.5)=0.3，且此时获益的心理结果值为1.5万美元（41-39.5=1.5），则有

由上述计算结果，看到若存在二次竞价时，增加5000美元报价的风险决策价值4500美元高于使用原价39万美元的风险决策价值，即此种情况下，客户A的决策应为增加5000美元的报价，获得4500美元的风险决策价值。

综上所述，就可以求出，客户A在第一次报价，报出39万美元的风险决策均值为：

上述贝叶斯分析法计算将客户A第一次报价为39万美元的决策各种结果及需要二次报价的情况下应作出的最优决策进行了估值，这个过程在决策树中明显地体现了出来，并且，客户A如果选择初次报价为40万美元或41.5万美元的决策价值的计算方法，也与上述计算分析过程同理，这里不再赘述，仅将这两种决策的最终风险决策价值列出，即分别为：

Y(first-40)=5300（美元）

Y(first-40.5)=3800（美元）

可见：Y(first-39)>Y(first-40)>Y(first-40.5)

结合决策树的分析，不难得出结论：选择第一种方案即第一次报价39万美元，若需二次报价，则再加5000美元即达39.5万美元的方案为最优决策。至此，此购房问题的风险决策问题得以分析解决，并为风险决策者客户A提供了在众多选择中有可能使得风险最小化且利益最大化的参考意见。

四、结论

基于上述对日常购房事宜风险决策的分析可以看出，贝叶斯风险决策方法充分利用了不确定事件发生的概率及其与各种事件可能发生结果的关系，使人们在一项不确定事项面前做决策有了一定的把握性和认知性，将零散的信息经过数理统计计算的方式，以货币收益值的形式表现得一目了然，有助于决策者客观做出决策。然而，运用这种方式也不是完美无缺的。对于先验概率的估计，每个决策者可能会有不同的风险偏好程度，即赋予的概率值不一定具有实际的参考性和科学性。同时，面对事件考虑的决策往往是有限的，不一定能够考虑到所有可能的事项，并且事项之间的相互影响也未必能通过贝叶斯方法完全考虑周全，故这些局限也需要在以后的研究和运用中需要特别注意且进一步解决和改善的。

参考文献

[1]何江妮、王玟:《浅谈贝叶斯风险决策分析》,《新疆师范大学学报》2006年第12期。

[2]冯为民、朱俊、李嘉荣:《贝叶斯方法在房地产风险决策中的应用研究》,《重庆建筑大学学报》2006年第2期。

[3]李亚利:《基于贝叶斯理论的风险投资决策问题研究》,《新财经(理论)》2012年第2期。

贝叶斯决策分析篇2

目前常用的运动目标检测方法是减背景法[1]。减背景法的关键是背景模型的建立和更新,研究思路主要在于开发不同的背景模型,其中混合高斯模型(MOG,Mixture of Gaussians)[2]是效果较好的一种。混合高斯模型是将每个像素按照多个高斯混合建模,该模型的参数可以自适应更新。Friedman利用3个高斯分布的交通监控场景中的道路、阴影和车辆的像素分别进行建模。文献[3]利用自适应的混合高斯模型可靠地处理了光照变化、树叶摇动等影响。其它的背景建模方法如参考文献[4],运用维纳滤波器预测每个背景像素的颜色值变化;kalmann与brandt、Kilger采用基于卡尔曼滤波的自适应背景模型以适应天气和光照的时间变化。

本文对复杂场景中背景的静止物体和运动物体,用不同的特征向量来表征其像素。对于静止背景物体,用其颜色值来表示;对于运动背景物体,充分利用其帧间信息,用颜色共生特征(color co-occurrence feature)来表示。在此特征表示的基础上,采用贝叶斯决策规则来判断一个像素是背影中的运动点还是前景点。在更新方法中针对复杂场景中背景的“渐变”和“突变”情况,提出了不同的更新策略。实验表明,该方法在包含有摇动的树枝或者灯的开关等复杂背景中能准确地提取运动目标。

1 运动目标检总体结构

运动目标检测首先需要检测出图像中的变化部分,但是由于背景的复杂性,如灯光、背景扰动等因素的影响,并不是所有变化的像素都是由前景目标所引起的,因此需要区分背景中的变化像素和前景运动目标中的像素。基于上述的要求,我们提出了如下的运动目标检测总体结构。该结构按功能大致可分为四个部分:变化检测、变化分类、前景目标提取、背景更新和验证。首先,采用时间差分法(Temporal difference)[5]进行变化检测。然后,将检测结果输入到变化分类器中,通过贝叶斯决策规则判断当前的变化点是背影点还是前景点。其次,提取前景目标,更新背景图像。各部分的结构关系如图1所示。

2 变化检测

时间差分法是利用视频序列中当前两帧或当前帧的某一帧的差分来提取图像中的变化区域。该方法具有较强的场景变化适应能力。背景不随时间积累,更新速度快。文中的变化检测方法如下:

(1)将t时刻的视频帧和t-1时刻的视频帧相减得到差分图(Difference Map);

(2)将t时刻的视频帧和一参考背景图像相减得到另一差分图;

(3)将差分图、Ftd和分别进行二值化处理后得到二值化图像Ftd和Fbd。其中,差分图二值化处理阈值的选取很关键。如果阈值太低,一些由于噪声而引起变化的点会被误认为前景点;如果阈值太高,一些前景点会被误认为是背景点。本文采用的是自适应的阈值法LMedS(Least Median of Square)[6],该方法能有效去除图像中的噪声。

3 变化分类

设Ftd(s,t)表示t时刻在二值化图像Ftd在s=(s,y)处像素的值,Ftd(s,t)=1表示运动物体上像素值发生变化的点,Ftd(s,t)=0表示静止物体上的像素点。它们通过基于贝叶斯决策规则的分类器进一步判断到底是前景还是背影表。对于Ftd(s,t)=0的像素点,其颜色特征向量Vt=[rt,gt,bt]T,每个颜色分量的量化级别为64;对于Ftd(s,t)=1,其颜色特征向量Vt=[rt-1,gt-1,bt-1,rt,gt,b]T,每个颜色分量的量化级别为32,采用这种特殊的颜色特征向量表示法是因为由于物体表面的局部一致性,在一个很小的时间段内,不同视频帧同一位置上的像素通常产生相似的变化,实验证明采用这种像素特征表示法增强了系统的鲁棒性。另外,通过对颜色分量进行量化提高了系统的运行效率,节省了存储空间。

3.1 贝叶斯决策规则

运动目标检测的目的就是将前景点和背景点分开,可以看作是模式识别中的两类别分类问题。本文采用基于最小错误率的贝叶斯决策规则,即:

其中:Vt表示t时刻像素点S=(x,y)的颜色特征值;b表示背景像素点的集合,f表示前景像素点的集合。

又因为一个像素点要么是背景点,要么是前景点,所以有以下的式子成立:

由以上各式可得:

由先验概率P(b|S)、类条件概率P(Vt|b,S)和P(Vt|S)就可判断一个像素点是否是背景点。

3.2 统计特征的表示与计算

统计特征的表示在许多视频处理的应用中,背景点只是在短时间内被前景点遮住。因此我们通过考察长度为N的视频序列中同一位置像素的颜色特征值,计算出其先验概率、类条件概率,最后通过贝叶斯决策规则就可判断它是背景点还是前景点。下面描述式(5)中几个统计特征的表示与计算。

设,N表示根据P(Vt|b,S)按降序排列的前N个数,即:

对于给定的值M1和M2(如M1=90%,M2=10%),一定存在N1使得(6)式成立:

其中N1的值取决于颜色特征向量和量化的级别。对于图像中的每个像素,与其相关的统计特征有:

其中i=1,2….N2>N1,前N1个数用来计算公式(5)中各项值,N2-N1个数用于背景模型的更新。在我们的试验中,当量化等级为32时,N1=50,N2=80;当量化等级为64时,N1=30,N2=50。

在确定了N2和N1的值之后,公式(5)中各项的计算方法如下:

实验证明当δ=2时效果较好。将以上各项的值算出来代入到式(5)之后就可以判断出当前点是前景点还是背景点。

4 前景目标提取

对于时间差分图Ftd经过变化分类后,定义和的值如下:

对于背景差分图Ftd经过变化分类后,定义的值如下:

设O(s,t)表示前景的集合,则:

实验中我们发现变化分类之后只有一小部分的背景点被误认为前景点。这些孤立的点可以通过腐蚀和膨胀操作将其去除。

5 背景更新

5.1 背景图像的更新[7,8,9,10,11,12]

本文采用运行值均值法(Running Average)来进行背景更新,其思想是通过引入学习率α1来体现背景图像对场景变化的响应。α1通常取0.05,α1越低,则前景的变化越不会影响背景。

其中B(s,t)表示t时刻的背景图像,I(s,t)表示t时刻的帧图像。

当时,表明该像素是变化的背景点,此时背景图像的更新方式如下:

采用这种更新方式使得参考背景图像能够及时更新以适应变化的背景,如树叶的摇动、天空的变化等。

5.2“渐变”变化像素统计特征更新

对于图像中的“渐变”,即

设t时刻的特征向量为v1,则此时与该像素相关的各个统计特征的更新如下:

其中,i=1,2……,N2,α2是更新速度,通常取α2>1-(1-T)1/n;

其中,表示两个向量之间的距离。

如果N2个像素中没有一个像素的颜色和t时刻中对应像素的颜色特征相匹配,则统计特征表格中N2个元素的更新如下:更新完成之后,依据的值重新排序。

5.3“突变”像素统计特征更新

即时说明当前的“突变”像素可以作为新的背景点。在我们的实验中T取95%。此时像素统计特征的更新如下:

其中i=1,2….N1

本文用患者带有不同背景的视频对本算法进行仿真实验(图2)。实验结果见表1。

6 结论

本文提出了运用贝叶斯决策规则在复杂场景中有效地提取运动目标的方法。该方法对背景中的运动点和前景中的运动点进行分类,实验表明,该方法能准确提取复杂场景中的运动目标,也获得了较高的时间一致性,可以应用在医学步态分析等相关领域中。

参考文献

[1]李国辉,等.监控视频运动目标检测背景技术的研究现状和展望[J].现代科学,2006,11(7):920-927.

[2]LIPTON A,FUJIYOSHI H,PATIL R.Moving target classification and tracking from real-time video.In proceedings IEEE Workshop on Application of computer Vision[J].IEEE Computer Society,1998:8-14

[3]STSUFFER C,GRIMSON W.Adaptive background mixture models for real-time tracking[C].Fort Collins:Proceeding of IEEE International Conference on Computer Recognitiong,1999:246-252.

[4]TOYAMA K,KRUMM J,BRUMITT B,et al.Wallflower:principles and practice of background maintenance[C].Kerkyra:Seventh International Conference on Computer Vision,1999:255-261.

[5]LIPTON A,FUJIYOSHI H,PATIL R.Moving target classification and tracking from real-time video[M].Washington,DC:IEEE Computer Society,1998.

[6]ROSIN P.Thresholding for change Detection[M].Washington,DC:IEEE Computer Society,1998:274.

[7]刘渊,等.基于USB摄像头的通用Morris水迷宫实验系统[J].中国医疗设备,2009(5):26-29.

[8]苏松志,王丽,李绍滋.医学步态分析中的复杂场景下运动目标检测技术[J].中国数字医学,2001(10):28-31.

[9]王丽,李晓磊,李绍滋,等.人的异常步态检测算法[J].中国数字医学,2007(11):41-45.

[10]张娟.基于单目视觉运动背景下的动目标检测有关问题的研究[D].西安:西北大学,2009.

[11]虞永方.基于步态的身份识别的算法实现[D].长春:吉林大学,2009.

贝叶斯决策分析篇3

为提高对战场态势判断的准确性,从而提升指挥引导战斗机的效率,提出运用贝叶斯方法对敌机态势进行估计的方法.首先介绍了贝叶斯决策的基本原理、基于最小错误率的.贝叶斯决策规则,以及基于最小风险的贝叶斯决策规则.其次,对两种决策规则分别进行仿真,在情况不明的状态下,可以得到比较合理的决策结果.最后说明了在判明战场态势的情况下如何进行指挥引导解算.

作者：杨建广王瑾卢霞 YANG Jian-guang WANG Jin LU Xia 作者单位：杨建广,YANG Jian-guang(空军工程大学电讯工程学院,西安,710077)

王瑾,WANG Jin(空军工程大学科研部,西安,710051)

贝叶斯决策分析篇4

在贝叶斯统计中,先验分布是贝叶斯参数统计模型的重要组成部分。由贝叶斯推断原则,后验分布是统计推断的基础,而只有正确的选取先验分布,才能有正确的后验分布。因此,在贝叶斯统计中,深入探讨选取先验分布的方法是非常有意义的。

对于先验分布的确定方法,已经有很多学者的研究成果,但所有这些确定先验分布的方法只是提供了寻求先验分布的手段,而对于先验分布的合理性和准确性缺少合理的评价体系。换句话说,对于同一个问题,不同的人根据不同的经验和规则,可以得到不同的先验分布,那么对于同一个问题,面对具有多个先验分布可供选择时,应该选择哪一个更加合理,这就是先验分布的选取问题。

对于先验分布的选取问题,许多学者提出了不同的策略和方法,其中文献[1]对此问题作了比较细致的研究,提出利用后验信念的后验最大似然方法选取先验分布,并得到了一些比较好的结论。本文正是基于文献[1]的基础之上,引入损失函数和风险函数,把选择一个合理先验看做是一个贝叶斯决策问题,从而展开了对先验分布选择问题的一些探讨。

一、后验似然合理先验

用πi(i=1,2,…,m)表示θ的可能先验分布,μ(πi)(i=1,2,…,m)表示我们对每个先验πi(i=1,2,…,m)的先验信念,μ(πi|x)表示在数据x下的后验分布,于是有和

引理1[1]:设x~f(x|θ),θ∈Θ,参数θ的可选先验分布族Γ=Σπi:πi(θ)是θ的先验,i=1,2,…,mΣ。πi(θ)的先验分布为,μ(πi)(i=1,2,…,m)则πi(θ)在数据x下的后验分布为

后验最大似然先验选择原理[1]:设x~f(x|θ),θ∈Θ,参数θ的可选先验族Γ=乙πi:πi(θ)是θ的先验,i=1,2,…,m乙,πi(θ)的先验分布为μ(πi),在数据x下的后验分布为μ(πi|x),若存在先验π0(θ)∈Γ,满足μ(π0|x)=supμ(πi|x),则称先验中后验最大似然合理先验。

二、基于贝叶斯决策的先验分布的选取

引理中的μ(πi|x)表示关于一个先验的后验信念,它的表达式给出了先验信念,后验信念和样本信息之间的关系。于是这就为我们用决策机制来处理先验分布的选择问题提供了条件。

如果用δ(x)表示根据样本信息选择先验分布的一个决策,引入损失函数和风险函数来度量一个决策的准确性是合理的,因此我们可以选择一个δ(x)使后验期望损失或风险最小。

假定选择一个关于参数θ的合理先验πi(θ),我们视其为一种决策活动,如果用L(π,δ[x])表示损失函数,用Rμ(π,δ[x])表示δ(x)关于先验分布πi(θ)的后验分布μ(πi|x)的风险。

定义1.δ(x)=π0(θ)称为最小风险合理先验,如果使Rμ(π,δ[x])取值最小。

例1.设θ的先验密度族Γ=乙πi:πi(θ)是θ的先验,i=1,2,…,m乙,决策函数δ(x)损失函数为L(π,δ[x]),先验分布的后验信念为μ(πi|x)=Pi,求最小风险合理先验。

解:由(2)式知

根据定义知,使得Pi取值最小的决策δ(x)=πi(θ),(i=1,2,…,m)为最小风险合理先验。从上式,我们不难看出当采用不同的损失函数时,会得到不同的最小风险合理先验。m i=1ΣL(πi,δ[x])

定理1.如果采用“0-1”损失,即L(πi,δ[x])=i10,,δ(x)≠πiδ(x)=πi则最小风险合理先验就是文献[1]中的后验似然合理先验。

证:考虑某个决策δ(x)=πi,由(2)式得:

如果我们要使Rμ(π,δ[x])达到最小,就必须使μ(πi|x)达到最大,从而定理得证。

定理2.若仅有两个考虑的先验分布π1(θ)和π2(θ),如果采用“0-1”损失,且,则先验分布π2(θ)就是最小风险合理先验。

证:考虑某个决策δ[x]=πi(θ),i=1,2。由(2)式和(3)式有

当δ(x)=π1(θ)时,Rμ(π,δ[x])=μ(π2|x)

当δ(x)=π1(θ)时,Rμ(π,δ[x])=μ(π1|x)

由提设知μ(π1|x)<μ(π2|x),先验π2(θ)是最小风险合理先验。

定理3.若所有先验分布的先验信念相等且采用“0-1”损失时,ML-Ⅱ先验即为最小风险合理先验。

证:假设参数的先验分布族为Γ=iπi:πi[θ]是θ的先验,i=1,2,…,m≠,其中

π1(θ)为ML-Ⅱ先验,即

由提设知所有先验分布的先验信念相等且

易得μ(π1|x)的值最大。

下面考虑最小风险合理先验

从而当π1(θ)是ML-Ⅱ先验时,决策δ(x)=π1(θ)的后验风险最小,即π1(θ)是最小风险合理先验。

结语

贝叶斯理论中先验分布的确定,是利用贝叶斯方法的关键,能够优选出合理的先验分布,对于问题的合理解决至关重要。本文在后验似然选取先验分布的基础上,建立了基于贝叶斯决策,通过后验决策风险的大小选取先验分布的方法。这种方法具有其优越性:首先,它把ML-Ⅱ先验选取方法和后验似然合理先验作为其特例;其次,当采用不同的损失函数时,会得到不同的先验分布,这可以使我们视具体问题而定,采用合理的损失函数,从而获得准确合理的先验分布;最后,这三种方法,在一定条件下是相互等价的,也就是说它们能统一在一个理论构架中。

参考文献

[1]李勇.基于先验的贝叶斯先验选择方法[J].重庆工商大学学报,2006,(6):548-550.

[2]茆诗松.贝叶斯统计[M].北京:中国统计出版社,1999.

[3]茆诗松,王静龙,濮晓龙.高等数理统计[M].北京:高等教育出版社,1998.

[4]Freedman,D.On the asmptotic of Bayes estimates in the discrete case[J].Ann.Math.statist.34,1963:1386-1403.

风险投资中的最小贝叶斯风险决策篇5

寻求贝叶斯决策函数有两条路径,一条是使后验风险最小,一条是使贝叶斯风险最小。实际中,人们常使用后验风险途径,因为它的计算相对简单和方便,本文我们使用的实际上正是后验风险准则。

在不同的先验分布假设下,参数的贝叶斯决策量一般是不同的。本文旨在通过在各种不同的先验分布条件下进行参数的贝叶斯决策,最终比较并探讨各种情况下贝叶斯决策的优良性问题。

一、提出问题

设想有一投资公司对某一项目已经投入100万元。现在决定是追加投资100万或是保持原投资不变,还是将已经投入的100万撤回。若在一年后该项投资的收益会因市场的变化而不同,如果一年后的市场对该项投资分为有利和不利两种情况。且根据以往的经验有利和不利两种情况发生的概率分别为:0.7和0.3。有利时可获利30%,不利时会损失40%。在这种情况下,寻求最小贝叶期风险决策。如果该公司投资前用5万元聘请一名投资顾问,该顾问在未来有利的情况下预测的准确率为85%,不利时预测的准确率是90%。这时,最小贝叶期风险决策又是什么?投资公司是否有必要聘请这位投资顾问?

用θ=θ1表示未来市场情况对该项投资有利,用θ=θ2表示未来市场情况对该项投资不利。分别用a=a1,a=a2,a=a3表示追加投资100万,投资不变和撤回原来投入的100万。这样决策空间为:。损失函数如下表

用R(d)表示用d作为

决策函数时的贝叶斯风险函数,则R(d)=EL(θ,d)。R(d)。与R(θ,d)的不同这处在于此时θ也是随机变量,其先验概率为:

(1)先考虑不聘请专家,公司做所可能采取的决策有:。即这时的决策函数空间:R(d2)=EL(θ,d2)=30×P(θ=θ1)+40×P(θ=θ2)=33

R(d3)=EL(θ,d3)=60×P(θ=θ1)+0×P(θ=θ2)=42

由此可见,决策函数d1的贝叶斯风险最小。故做决策就是由d1来确定。那追加投资100万。采取这种决策所面临贝叶斯风险为:24万元。

(2)如果聘请了专家,并且用ξ=x1表示专家认为未来市场情况对该项目投资有利,用ξ=x2表示专家认为未来市场情况对该项目投资不利。根据θ先验概率及全概率公式可得出:

这时公司所可能采用的决策函数有:

即此时的决策函数空间:{d1,d2,d3,d4,d5,d6,d7,d8,d9}。根据相关信息知道:P(ξ=x1|θ=θ1)=0.85 P(ξ=x2|θ=θ2)=0.90所以容易得出:P(ξ=x2|θ=θ1)=0.15 P(ξ=x1θ=θ2)=0.10由此可以进一步得到θ的后验概率为:

同理,R(d3(ξ))=42:R(d4(ξ))=16.35:R(d5(ξ))=40.65:R(d6(ξ))=25.35:R(d7(ξ))=49.65:R(d8(ξ))=8.7:R(d9(ξ))=57.3

最小贝叶斯决策为d8,即:若专家认为未来市场情况对该项目投资有利,则追加投资100万,否则撤资。

二、结果

综合上述分析结果发现,若不请顾问,则选取的投资方式为追加100万,承担的平均风险为24万元;而聘请顾问后,当选取追加的投资方式时,承担的风险为8.7万元,加上聘请顾问需要花费的5万元,共计13.7万元。所以结论是应该聘请顾问。

三、结论

从以上的实例分析我们可知,在从事经济活动中,决策前对有关的随机状态因素事先能够获得的信息愈多,愈可靠,则据此做出的最优决策愈可靠,其期望效益值也可能愈高。反之,若能够获得的信息愈少,愈不可靠,则得到的最优决策的可靠性愈差,期望效益值也可能愈低。而且根据情况选择适合的风险决策方法,也会让你的据侧达到事半功倍的效果。

风险决策时方案选择决定于外界环境状态,而这种状态是无法确知的,更不受决策者控制,但通过判断、调查和实验,可以获得有关信息。此时利用统计决策方法便可制订出较合理的风险投资决策。贝叶斯决策属于风险型决策,决策者虽不能控制客观因素的变化,但却可掌握其变化的可能状况及各状况的分布概率,并利用期望值即未来可能出现的平均状况作为决策准则。由于决策者对客观因素变化状况的描述不确定,所以在决策时会给决策者带来风险。但是完全确定的情况在现实中几乎不存在,贝叶斯决策不是使决策问题完全无风险,而是通过其他途径增加信息量使决策中的风险减小。由此可以看出,贝叶斯决策是一种比较实际可行的方法。

参考文献

[1]Liang F,Paulo R,Molina G,Clyde M,Berger J.Mixtures of g-priors for Bayesian variable selection[J].Amer.Statist Assoc,2008, 481(103):410-423.

[2]Giorgi E D.Reward-risk portfolio selection and stochastic dominance[J].Journal of Banking & Finance,2005,29(4):895-926.

[6]冯为民,朱俊,李嘉荣.贝叶斯方法在房地产风险决策中的应用研究.重庆建筑大学学报2006,28:111-114.

贝叶斯决策分析篇6

关键词：风险管理,创新风险,风险决策,贝叶斯决策

1 引言

创新是一个民族进步的灵魂,是国家兴旺发达的不竭动力,也是企业的生命之源[1]。没有创新,企业的产品结构就难以升级换代,企业的竞争力就会逐渐弱化,最终生命枯竭。而创新又是一把“双刃剑”,具有高潜力、高投入、高收益、高风险的显著特征,来自技术、市场和管理等方面的高风险使许多创新项目受挫、夭折,甚至对人类社会的健康发展造成危害。因此,对创新风险的管理意义重大。

目前,对于创新的讨论多数是研究如何促进企业自主创新的方法与模式,而对创新风险的研究并不多。文献[2]根据高新技术企业面临风险的特点,构建了高新技术企业全面风险管理的实施框架;[3]研究了高技术企业持续风险管理的整个过程;[4]提出基于综合集成方法的企业合作创新集成风险管理模型;[5,6]提出技术创新过程中的风险管理策略,进行有效的风险防范;[7]从风险投资视角研究了技术创新风险管理。以上文献对风险规划、风险辨识、风险分析、风险处理等风险管理各阶段进行了定性的研究。

理论界对于创新风险的管理也有定量研究:[8]提出了基于网络层次分析法与灰色关联分析法的集成评价方法,并应用于企业技术创新风险评价;[9]提出了技术风险事件量化指标的体系结构、等级标准和量化方法,建立了技术风险三参数量化模型;[10]从产品市场生命周期特点出发,研究具有企业产品创新特色的、个性化的产品创新项目风险估计方法;[11]构建了企业技术创新项目风险预警系统;[12]结合区间数概率分布评价理论建立了多目标决策的综合评价模型,对风险投资进行了综合评价;[13]提出了以市场或客户数据驱动的产品创新方案。这些研究从理论与实践上促进了技术风险管理决策的科学化,但总体应用效果并不理想。一方面,由于方法过于复杂,企业实现起来存在一定困难;另一方面,大多的定量研究集中在风险评估阶段,而对于风险决策的定量研究较少。

风险决策就是不完全信息下的决策,根据风险管理的目标,在风险识别和风险衡量的基础上,对各种风险管理方法进行合理地选择与组合,制定出风险管理的具体方案。面对来自技术、市场和管理等方面的高风险,企业管理者应该掌握科学的、易行的风险决策方法,对创新风险进行有效地管理。本文就是要探讨这种行之有效的定量风险决策方法,帮助企业管理者进行有效地创新风险管理。

贝叶斯方法是进行风险性决策的有力工具[14,15],由于方便易行,该方法在各个领域都有广泛的应用。文献[16]应用贝叶斯网络决策技术支持新产品开发管理;文献[17]将贝叶斯决策理论应用于客户关系管理中的客户选择;[18]将贝叶斯网络方法应用于新产品研发中的风险评估;[19]提出了一个贝叶斯的解决方案,用于公司战略营销管理决策预测;[20]提出了一个贝叶斯模型,实现动态知识更新, 以处理供应不确定性及风险。目前将贝叶斯风险决策方法进行企业创新风险管理的文献并不多见,本文将探讨如何运用贝叶斯风险决策方法进行创新风险管理。

2 贝叶斯风险决策理论概述

2.1 原理

风险决策贯穿于整个风险管理过程,它依据对风险和损失的科学分析,选择合理的风险处理技术和手段,从若干备选方案中选择一个满意方案。每个风险决策问题都包含三个要素:由各种自然状态形成的状态集、由决策者采取的行动构成的行动集、在各种状态及行动组合下的收益或损失描述。从这三个要素出发,可以得到不同的风险情景空间。例如,企业要产品创新,在未来市场需求无法准确预测的情况下,面临着研发、投资、生产规模等一系列风险决策问题。决策者做出某种决策后,后果不确定,带有一定风险。在风险决策中,一般要增加投入来获取不断变化的市场信息,在及时掌握各种自然状态的发生情况的基础上,合理利用收集的信息,科学地选择决策方案,从而减小风险,提高经济效益与社会效益。在风险性决策中,对自然状态估计的准确程度直接影响到收益期望值。为了更好地决策,往往需要进一步补充新信息,获得新信息后,可根据这些补充信息修正最初对自然状态出现概率的估计值,并利用修正的概率分布重新进行决策。由于这种概率修正主要根据概率论中的贝叶斯定理进行,故这种决策称为贝叶斯决策。

2.2 贝叶斯风险决策步骤

2.2.1 先验分析。

首先估计自然状态 Ni出现的概率P ( Ni)(i=1,2,…,m), uij为方案dj(j=1,2,…,n)在状态Ni下的效益值,见表1。根据期望值准则,计算各方案期望效益值: $E (d_{j}) = \sum_{i = 1}^{m} Ρ (Ν_{i}) u_{i j} (, j = 1, \dots, n)$ 。相应最优决策方案及最优期望效益值: $\max_{j} E (d_{j}) = E (d_{k}) = E Μ U$ 。

2.2.2 预验分析。

在预验分析中,首先估算出完全信息的价值,并以它为一个标准,如果补充信息费用远远小于完全信息价值,则可认为这种补充信息是合算的。反之,如果信息费用接近甚至超过完全信息的价值,则可认为这种补充信息是不合算的。当完全信息预报出现状态时,问题变为确定型决策问题。最优方案显然应由下式确定: $\max_{j} {u_{k j}}$ ,于是在完全信息下,决策所能获得的最大期望效益值: $E U Ρ Ι = \sum_{k = 1}^{m} Ρ (Ν_{k}) \max_{1 \leq j \leq n} {u_{k j}}$ 。显然, EUPI与 EMU之间的差额就是得到了完全信息而使期望效益增加的部分。这个值就是该问题的期望完全信息价值,简记为 EVPI(Expected Value of Perfect Imformation),且EVPI=EUPI-EMU。 EVPI是作为支付信息费用的一个上限,也是决定是否与必要进一步获取情报信息的依据。

2.2.3 后验分析。

后验分析工作由补充新信息、计算修正概率、后验决策、计算补充信息价值四部分组成。

(1)补充新信息:

补充新信息一般是通过对X1 、X2、…、 Xs共s个状态的调查、勘探、咨询,预报其中哪一个将出现,同时通过资料获取条件概率 P(Xj|Ni),即实际出现自然状态Ni而预报Xj的概率。

(2)修正概率:

在已知先验概率P(Ni)(i=1,2,…,m)及条件概率 P( Xj|Ni)(i=1,2,…,m;j=1,2,…,s) )的基础上,计算后验概率分布: $Ρ (X_{j}) = \sum_{i = 1}^{m} Ρ (Ν_{i}) Ρ (X_{j} | Ν_{i})$ 。再利用贝叶斯公式计算出修正概率,即后验概率:

$Ρ (Ν_{j} | X_{i}) = \frac{Ρ (Ν_{i}) Ρ (X_{j} | Ν_{i})}{Ρ (X_{j})}$ 。

(3)后验决策:

根据已得的后验概率,可预先作出决策的框架。假设补充信息预报将出现Xk状态,则使用后验修正概率分布 P(Ni|Xk)( =1,2,…,m),计算各方案的期望效用值,并以期望值准则进行决策,得: $E (d_{i} | X_{k}) = \sum_{i = 1}^{m} Ρ (Ν_{i} | X_{k}) u_{i j} ‚ (j = 1 ‚ 2 \dots ‚ n$ ; k=1,2,…,s ),相应最大期望效益值记为 $E (X_{k}) = \max_{j} E (d_{i} | X_{k}) = E (d_{j k} | X_{k})$ 。一旦得到补充信息预报,即可选择期望效益值最大的djk为预报Xk时的最优方案,进行决策。

(4)计算补充信息价值:

根据已计算出的补充信息预报各状态出现的概率P(Xi) ( i=1,2,…,s ),可计算出后验分析中最大期望效益值: $E Μ U^{*} = \sum_{i = 1}^{m} Ρ (X_{i}) E (X_{i})$ 。显然,获得补充信息后,期望效益值增加了:EMU*- EMU。于是,补充信息的价值为 EMU*- EMU。由此,可将补充信息的价值与获得信息所付出的代价进行对比,从而作出正确决策。

3 创新风险管理实例

3.1 创新风险管理决策三要素

(1)自然状态集:

对创新活动的综合评价N={N1,N2,…,Nm} ,例如N1代表很好,N2代表较好,…,Nm 代表很差等。专家给出各状态的先验概率 P(Ni),(i=1,…,m)。

(2)行动集:

对创新活动采取的行动D={d1,d2,…,dn} ,例如d1代表高投资,如大力研发,上新生产设备,生产新产品; d2代表中投资,如中等研发规模,改进产品功能; d3代表低投资,如改良生产工艺,提高产品质量; d4代表不进行创新投资,如只改进产品包装或加强广告宣传等。

(3)效益或损失描述集:

由矩阵 U=(uij)mn表示,其中 uij∈[-100,100]可以是以货币因素衡量的经济效益,也可以是以非货币因素衡量的效用函数。这里建议使用效用函数,因为创新活动不仅带来经济效益,更能带来社会效益,从而为企业带来无形资产和长远利益。这里的效用函数可用满意度来度量,如企业的满意度、顾客满意度、专家打分等综合评分。

3.2 产品创新风险问题描述

某企业计划投入一种新产品的研发,对产品的经济效益及社会效益的综合评价有五种状态 N={N1,N2,N3,N4,N5};其中N1代表很好, N2代表较好, N3代表一般, N4代表较差,N5 代表很差。根据市场调研数据分析及专家预测,各状态的概率分布为 P(N1)=0.2 ,P(N2)=0.4,P(N3)=0.2,P(N4)=0.15,P(N5)=0.05 。企业有四种方案供选择 D={d1,d2,d3,d4},d1代表高投资,如大力研发,上新生产设备,生产新产品; d2代表中投资,如中等研发规模,改进产品功能; d3代表低投资,如改良生产工艺,提高产品质量; d4代表不进行创新投资,如只改进产品包装或加强广告宣传等。四种方案在不同状态下的期望效用表(见表2):

数据说明:期望效用随市场前景状态的下降而递减。例如:

u11代表企业高投资下,市场很好,此时经济效益和社会效益最高,期望效用 u11=100;

u21代表企业高投资下,市场较好,此时经济效益和社会效益较高,期望效用 u21=70;

u31代表企业高投资下,市场一般,此时经济效益和社会效益一般,期望效用 u31=50;

u41 代表企业高投资下,市场较差,此时经济效益和社会效益较差,期望效用 u41= -20;

u51代表企业高投资下,市场很差,此时企业严重亏损,期望效用 u51=-100;

需要注意的是最后一列,企业若采取不投资策略,则期望效用均为负值,如:

u14代表企业不投资,市场却很好,此时损失了潜在的经济效益和社会效益,期望效用 u14=-80; u54代表企业不进行创新投资,市场也不好,此时既无经济效益也无社会效益,期望效用 u54=0。

3.3 贝叶斯风险决策过程

3.3.1 先验分析。

由自然状态出现概率及期望效益表(参见表2),根据期望值准则,计算各方案期望效用值: $E (d_{j}) = \sum_{i = 1}^{5} Ρ (Ν_{i}) u_{i j} ‚ j = 1 ‚ \dots ‚ 4$ 。相应最优决策方案及最优期望值: $\max_{j} E (d_{i}) = E (d_{k}) = E Μ D$ 。例如: E(d1)=0.2*100+0.4*70+0.2*50+0.15*(-20)+0.05*(-100)=50;类似的, E(d2)=55.5, E(d3)=58.5, E(d4)=-51。于是相应最优决策方案及最优期望效用值为 EMU= E(d3)=58.5。即在只有先验信息的条件下,采取低投资策略。

3.3.2 预验分析。

在预验分析中,首先估算出完全信息的价值:当完全信息预报出现 Nk状态时,问题变为确定型决策问题。最优方案显然应为: $\underset{j}{m a x} {u_{k j}}$ ,于是在完全信息下,决策所能获得的最大期望效用值:

$E U Ρ Ι = \sum_{k = 1}^{5} Ρ (Ν_{k}) \max_{1 \leq j \leq n} {u_{k j}} = 0.2 * 100 + 0.4 * 80 + 0.2 * 80 + 0.15 * 30 + 0.05 * 0 = 72.5$ 。

于是,完全信息价值 EVPI=EUPI-EMU=72.5-58.5=14。即完全信息价值是14个效用单位,是支付信息费用的一个上限,也是决定是否与必要进一步获取情报信息的依据。

3.3.3 后验分析。

(1)补充新信息

补充新信息一般是根据市场情况,对 X1(很好)、 X2(较好)、 X3(一般)、 X4(较差)、X5(很差)共5个状态的调查、勘探、咨询,预报其中哪一个将出现,同时通过资料获取条件概率 P(Xj|Ni),即实际出现自然状态Ni而预报Xj的概率(见表3)。

(2) 修正概率

在已知先验概率P(Ni) ( =1, 2,…,5)及条件概率P(Xj|Ni) ( i=1, 2,…, 5; j=1, 2,…,5)的基础上,计算出各 Xj的概率分布: $Ρ (X_{j}) = \sum_{k = 1}^{5} Ρ (Ν_{i}) Ρ (X_{j} | Ν_{i})$ 。例如: P(X1)=0.2*0.5+0.4*0.2+0.2*0.1+0.15*0.05+0.05*0.05=0.21,类似的,有 P(X2)=0.3075,P(X3)=0.2475, P(X4)=0.155, P(X5)=0.08。利用贝叶斯公式可计算出各Ni修正概率,即后验概率(见表4):

$Ρ (Ν_{i} | X_{j}) = \frac{Ρ (Ν_{i}) Ρ (X_{j} | Ν_{i})}{Ρ (X_{j})} ‚ (i = 1 ‚ 2 ‚ \dots ‚ 5$ ; j=1, 2,…,5)。

(3) 后验决策

假设补充信息预报将出现Xk 状态,则使用后验修正概率分布 P(Ni|Xk)( i=1,2,…,5),计算各方案的期望效用值,并以期望值准则进行决策,得:

$E (d_{j} | X_{k}) = \sum_{i = 1}^{5} Ρ (Ν_{i} | X_{k}) u_{i j} (j = 1 ‚ 2 ‚ \dots ‚ 5 ‚ k = 1 ‚ 2 ‚ \dots ‚ 5)$ 。

如:经过市场调研,若市场状况为X1时,计算各dk期望效用值(见表5):

E(d1|X1)=0.4762*100+0.381*70+0.0952*50+0.0357*(-20)+0.0119*(-100)=77.14,类似的,有 E(d2|X1)68.93, E(d3|X1) =63.45, E(d4|X1)=-65.48。

即:当市场状况好时,应采取策略d1 ,此时最大期望效用值为 E(d1|X1)=77.14;

若市场状况为X2时,计算并比较各dk期望效用值,最大期望效用值为 E(d2|X2)=68.37;

若市场状况为X3 时,计算并比较各dk期望效用值,最大期望效用值为 E(d3|X3)=64.65;

若市场状况为 X4 时,计算并比较各dk期望效用值,最大期望效用值为 E(d3|X4)=44.49;

若市场状况为 X5 时,计算并比较各dk 期望效用值,最大期望效用值为 E(d3|X5)=28.13。

(4) 计算补充信息价值

根据已计算出的补充信息预报各状态出现的概率 P(Xi)( i=1,2,…,5),可计算出后验分析中最大期望效用值: $E Μ D^{*} = \sum_{i = 1}^{5} Ρ (X_{i}) E (X_{i}) = 0.21 * 77.14 + 0.3075 * 68.37 + 0.2475 * 64.65 + 0.155 * 44.19 + 0.08 * 28.13 = 62.325$ 。

显然,获得补充信息后,期望效用值增加了:EMD*- EMD=62.325-58.5=3.825。于是,补充信息的价值为3.825个效用单位。由此,可将补充信息的价值与获得信息所付出的代价进行对比,从而作出正确决策。应当指出的是,补充信息通常具有不确定性,因而,这样的信息是不完全的,或说不是绝对准确的,这种信息也称为抽样信息。与完全信息相比,补充信息价值不会大于完全信息价值。

4 结语

企业的创新风险管理对于企业的生存发展至关重要。本文以企业产品创新活动为例,探讨了基于贝叶斯风险决策方法的创新风险管理问题。进一步需要指出的是:将上述风险决策过程进行多周期的反复应用,可实现对创新活动的动态风险管理,以适应不断变化的市场环境,从而帮助企业管理者实现创新风险的科学管理。

贝叶斯决策分析篇7

随着计算机网络的快速发展,尤其是开放性的计算机网络,越来越多的计算机系统遭受着入侵威胁。因此,网络安全系统日益受到人们的重视和研究[1]。入侵是指那些试图绕开计算机系统安全机制的活动[2]。目前,主要的入侵形式有攻击者通过互联网或者内部访问系统、得到官方授权的用户尝试获得和滥用非授权的权限。因此,入侵可以被认为是威胁网络资源安全性、可用性和机密性的一系列活动。

入侵检测(Intrusion Detection)系统是防火墙之后的第二道安全防线,它能够在发现可疑传输时发出警报或者采取主动反应措施,全方位检测网络攻击,是一种主动防御技术[3]。与防火墙相比,它是一种积极主动的安全防护技术。入侵检测技术主要有异常入侵检测和误用入侵检测2种类型。异常入侵检测是指使用计算机资源判断异常行为进行检测入侵,它尝试用定量的方式描述那些可以接受的行为特征,以区分正常的和非正常的入侵行为。误用入侵检测通过预先定义的入侵行为监视系统的运行,从中找出符合预先定义规则的入侵行为。

入侵检测使用数据挖掘方法,主要有决策树(DT)、朴素贝叶斯(NB)[4]、神经网络(NN)、支持向量机(SVM)[5]、k临近(KNN)、模糊逻辑模型[6]。目前的入侵检测系统存在许多问题,比如低检测率,不同类型攻击的检测率差别较大,误检率较高。入侵检测系统的另一个困难是在实时高速网络中进行检测,这是因为高速网络要求入侵检测系统在非常短的时间内处理海量数据。另外,由于有不相关和冗余属性的存在,有必要选择有效的属性。因为不相关和冗余属性会使检测过程复杂化,同时也会降低检测率。一些额外属性也可能增加运算时间,影响检测率。

本文提出一种基于贝叶斯和决策树的入侵检测方法。该方法可以处理连续属性和缺失的属性值,降低训练数据中的噪声,与单独使用朴素贝叶斯或决策树的入侵检测系统相比,具有较高的检测率。

1 朴素贝叶斯方法

贝叶斯理论就是依据新的信息从先验概率求得后验概率的一种方法,其关键是利用概率表示各种形式的不确定性[7]。朴素贝叶斯分类器是一种经常用到的分类器。

假设数据样本是一个有n维特征的向量X={x1,x2,…,xn},有n个属性分别为A1,A2,…,An,属性值分别为b1,b2,…,bn,m个类分别为C1,C2,…,Cm。若有一个未知样本B,朴素贝叶斯分类将预测B属于最高后验概率的那个类。

根据贝叶斯公式: $Ρ (C_{j} | B) = \frac{Ρ (B | C_{j}) Ρ (C_{j})}{Ρ (B)}$ ,先假设P(C1)=P(C2)=…=P(Cm),再假设各个属性间相互独立,根据式(1)得出预测样本B所属类别为

$\begin{array}{l} C_{n b} = \underset{C \in C}{\arg \max} Ρ (C_{i} | b_{1}, b_{2}, \dots, b_{n}) = \\ \underset{C \in C}{\arg \max} Ρ (C_{i}) \prod_{i = 1}^{n} Ρ (b_{i} | C_{i}) (1) \end{array}$

式中:P(Ci)为类Ci的先验概率;P(bi|Ci)为条件概率。

通常情况,使用单纯的贝叶斯方法没有考虑属性对检测结果的影响,因此,会在一定程度上出现分类误差[8]。为了解决这一问题,对训练集在训练之前先进行特征选择。常用的特征选择方法有信息增益[9]、卡方检验等,然而这些方法并不能全面衡量各个特征属性对分类意义的影响大小。本文使用基于特征相似度的特征提取方法来降低数据维数,提高分类效率。

2 决策树方法

决策树[10]是数据挖掘中的一种分类方法,它是一个预测模型,代表的是对象属性与对象值之间的一种映射关系。使用决策树进行决策的过程就是从根节点开始,测试待分类项中相应的特征属性,并按照其值选择输出分支,直到到达叶子节点,将叶子节点存放的类别作为决策结果。决策树的核心是在各级节点上选择属性时,通过计算信息增益来选择属性。具体步骤如下。

假设有一个集合D,m个不同类别Cj,freq(Cj,D)为类Cj在D中出现的次数,则对一个给定样本集合F的信息熵的期望为

$Ι n f o (D) = - \sum_{j = 1}^{m} \frac{f r e q (C_{j}, D)}{| D |} \log_{2} (\frac{f r e q (C_{j}, D)}{| D |}) (2)$

令属性A将决策树分为n个子集{T1,T2,…,Tn},对于一个子集Ti ,其样本集的期望是Info(Ti)。则属性A划分当前样本集合期望的信息熵为

$Ι n f o (Τ) = \sum_{i = 1}^{n} \frac{| Τ_{i} |}{| Τ |} Ι n f o (Τ_{i}) (3)$

式中:|Ti|为Ti的样本个数;|T|为划分之前的样本总数。

由式(2)和式(3)得出信息增益值为

InformationGain(Ai)=Info(D)-Info(T) (4)

ID3算法作为决策树分类最经典的算法,其最大的不足是分裂属性选取时的多值偏向问题,而现实中属性值数量与属性重要性之间并无必然联系,因此,通常会出现归纳出不正确知识的问题[8]。

3 基于贝叶斯和决策树的入侵检测方法

3.1 数据预处理

基于贝叶斯和决策树的入侵检测方法首先遍历整个训练集,找出是否有多个拷贝的样本,如果发现,只保留1个(假设如果2个样本的所有属性值相等,那么这2个样本相等)。然后,将训练集中连续的属性离散化。

3.2 基于相似度的特征提取

相似度是指2个对象的相似程度,它是数学的一个概念。概率统计中的相关系数经常用来刻画2个随机变量的分布相似程度。

记 $ρ_{x y} = \frac{C o v (X, Y)}{\sqrt{D (X)} \sqrt{D (Y)}}$ ,为随机变量X与Y的线性相关系数,简称相关系数。其中D(X)、D(Y)为X、Y的方差,Cov(X,Y)为X和Y的协方差。ρxy越大,表明变量的相似度越高。本文使用ρxy来计算每个攻击类型中属性之间的相似度。删除其他与该属性相似度高的属性,得到一个新的属性集合B={b1,b2,…,bk}。具体步骤:计算与属性Ai之间的相似度,选择低于阈值0.95的属性对,然后计算两属性的方差,选择方差小的属性;如果两者方差相同,任取其一。这样可以得到每个类型数据的新属性集,用以计算每个类别中属性的条件概率。然后再使用 $Ρ (C_{i} | e) = \arg \max Ρ (C_{i}) \prod_{j = 1}^{n} ρ_{j} Ρ (x_{j} | C_{i})$ 进行分类操作。上式中:e为样本;xj为属性bj的值。

3.3 分类器训练

对于一个训练集D,包含属性{A1,A2,…,An}。每一个属性Ai包括以下属性值{Ai1,Ai2,…,Ain}。这些属性值可以是离散的或者连续的。训练集包含一些类集C,C={C1,C2,…,Cm},训练集中的每个样本有一个专属的类Cj。对经过数据预处理的训练集,提取每一类的特征,计算先验概率P(Cj)和条件概率P(Aij|Cj)。然后,假设样本ei的各个属性相互独立,使用朴素贝叶斯公式P(ei|Cj)=∏k=1→pP(Aij|Cj)对训练集中所有的例子进行分类。估计样本ei在每个类的概率,取具有最大的后验概率的类为该样本的归属类。对所有的样本分类完毕后,更新每个样本的所属类值。使用更新后的类值重新计算先验概率和条件概率,再次对训练集的每个样本分类。如果存在误分类的样本,则计算样本集的每个属性的信息增益。选择训练集中信息增益最大的属性Ai,依据Ai的属性值将训练集分成子数据集。计算每一个子数据集先验概率和条件概率,并且使用它们各自的概率对该子数据集中的样本进行分类。如果有任何样本或者任何子集被错误划分,那么计算子集属性的信息增益,在子集中选择有着最大信息增益的属性,使用该属性将子集再划分成子子集。然后为每一个子子集重新计算先验概率和条件概率,并且使用它们的概率分类每一个子子集。重复这个过程直到所有的样本都被正确划分。检测方法终止后,每一个数据集的先验概率和条件概率被保存起来,用来对测试样本进行分类。基于贝叶斯和决策树的入侵检测方法流程如图1所示。

4 实验结果及分析

使用如下环境验证本文提出方法的检测效果:系统Windows7,CPU(Core i5 2.3 GHz), 内存为2 GB, 编程工具为Matlab R2010a,入侵检测数据集使用KDD99数据集。KDD99数据集主要有5大类:1个正常类(Normal)和4个主要攻击类,即DOS、U2R、R2L、Probe。其中DOS选取ping-of-death, syn_flood, smurf;U2R选取buffer_overflow, xterm;R2L选取guess_password, imap, snmpguess;Probe选取port-scan, ping-sweep, saint, mscan, ntifoscan。实验结果如表1 所示。

本文提出的入侵检测方法将朴素贝叶斯和决策树结合起来,对数据样本首先进行相似度特征提取,在不影响样本分类的情况下,保留数据样本中的关键属性,消除数据冗余。从表1可看出,与传统的朴素贝叶斯和决策树单独使用时比较,本文提出的入侵检测方法的检测率有明显提升。

5 结语

基于贝叶斯和决策树的入侵检测方法很好地降低了数据冗余和维数,有效减少了数据的计算量。同时使用2次朴素贝叶斯分类来确定存在二义性的分类,然后使用决策树的信息增益来确定属性划分子类,从而建立了基于朴素贝叶斯和决策树的分类模型。实验结果验证了该方法的可行性,具有很好的检测效果。

参考文献

[1]马晓春.数据挖掘技术在网络入侵检测系统中的研究和应用[D].西安:西北工业大学,2005.

[2]LIPPMANN R,HAINES J W,FRIED D J,et al.1999 DARPA off-line intrusion detection evaluation[J].Computer Networks,2000,34(4):579-595.

[3]BARBARD,COUTO J,JAJODIA S.ADAM:A method for exploring the use of data mining in intrusion detection[J].SIGMOD,2001,30(4):15-24.

[4]AMOR,BENFERHAT S,ELOUEDI Z,et al.Decision trees in intrusion detection systems[C]//Proceeding of2004ACM Symposium on Applied Computing,2004.

[5]MUKKAMALA S,JANOSKI G,SUNG A H.Intrusion detection using neural networks and support vector machines[C]//Proceeding of the IEEE International Joint Conference on Neural Networks,2002.

[6]LUO J,BRIDGES S M.Mining fuzzy association rules and fuzzy frequency episodes for intrusion detection[J]International Journal of Intelligent Systems,2000,15(8):687-703.

[7]MICHALSKI R S,CARBONELL J,MITCHE L T.Machine Learning:An artificial intelligence approach[M].San Mateo:Morgan Kaufmann,1983:463-482.

[8]黄宇达,王迤冉.基于朴素贝叶斯与ID3算法的决策树分类[J].计算机工程,2012,38(14):41-43,47.

[9]何慧,苏一丹,覃华.基于信息增益的贝叶斯入侵检测模型优化的研究[J].计算机工程与科学,2006,28(6):38-40.

贝叶斯决策分析篇8

研发产业以及研发开发过程的特殊性,使得研发产品在开发周期中存在着许多不确定的风险因素,这些风险因素的存在,常常导致研发项目失败。根据Standish Group对美国公司的一项调查,只有28%的研发项目在预定的时间和预算内完成[1]。

解决上述问题的可行方法是引入风险管理技术。研发项目的风险管理包括风险的识别、风险评估、风险应对和风险监控,其中风险评估是做好风险管理,保证研发项目成功率中非常重要的一环。研发项目风险管理之父Barry Boehm在研发项目风险评估的系统化定义与分析方面做了开创性的工作,他以风险的影响大小来量化风险,从而对已知风险进行优先级排序,进而控制风险。他将风险影响水平定义为:风险当量(RE)=P×C,其中,P是出现不如意结果的可能性,C是不如意结果发生带来的后果[2]。这是目前研发企业进行项目风险管理所用到的最简单、适用的方法,在此基础上很多专家学者和企业,又在风险当量中考虑到了风险的可控性指标。

随后,国内外相继开发了各种风险评估技术:定性分析方法(如专家判断法)、AHP方法(层次分析法)[3]、模糊综合评判方法[3]、灰色评价方法[4]等。继Pearl于1986年提出采用贝叶斯网络(Bayesian Networks)来研究不确定性知识的表达和推理后,贝叶斯网络也逐渐被应用于研发项目风险评估:Chin-Feng Fan和Yuan-Chang Yu就应用贝叶斯网络进行研发项目风险管理[5],唐爱国等也将贝叶斯网络应用于研发项目风险评估中[6],并取得很好的效果。金俊丽等将遗传算法和EM算法与贝叶斯网络结合起来,有效减少了人为构建贝叶斯网络及其参数带来的主观性,使研发风险评估更加科学、合理[7]。

但是,由于研发项目风险管理理论体系还不完善,而且贝叶斯网络模型的设计和计算比较复杂,还不能普遍应用于研发项目风险评估中。基于此,本文提出一种基于贝叶斯风险决策理论的研发项目风险评估方法,它以贝叶斯理论最基础也是最根本的贝叶斯概率公式为理论基础进行研究,大大减少了模型计算的工作量,并有效地弥补了先验概率精确度低的问题,提高了研发项目风险评估的准确度,为风险评估提供了一种简便而科学的方法[8]。

1 贝叶斯风险决策理论

1.1 理论基础

在进行风险决策时,在有历史数据时,决策者可以根据已有的历史数据通过类比法分析出风险发生的概率;在没有历史数据或历史数据不充分时,决策者往往会根据专家判断法,由根据专家的知识经验对未来可能发生事件的概率做出主观判断。但是,这并不足以反映客观现实情况,这时就需要对专家判断的概率进行修正,而贝叶斯网络就是一种修正先验概率的科学方法。

贝叶斯概率公式表述如下:

设有n个事件Xi(i=1,2,…,n),它们组成一个完整的事件集合,而存在另一个事件Y,只在任一Xi发生时与其同时发生。设已知Xi发生的概率为P(Xi),事件Y在Xi发生的条件下发生的概率为P(YXi),由此可得事件Y发生的概率P(Y)为:

undefinedXi) (1)

则可推出:

undefined (2)

式(1)和式(2)就是贝叶斯网络中最基础的贝叶斯概率公式。在公式中,由于P(Xi)是先验概率,而P(Y/Xi)就是所要求的概率,即后验概率。

简单地说,贝叶斯风险决策理论就是利用先验概率和相关的条件概率得出后验概率,并基于后验概率进行决策。由于先验知识得到的先验概率并不是很准确,贝叶斯决策方法就是修正了先验概率,使得决策更加完善和科学。

1.2 贝叶斯风险决策

贝叶斯风险决策是依据事件状态的先验分布和后果的损失函数进行分析的,通过推理得到贝叶斯风险最小的决策规则,这就是最佳风险决策。下面以一个随机事件Y为例说明如何进行贝叶斯风险决策[9,10,11]。

(1)定义一个先验分布π(θ),以及一个决策函数δ(Y),则相应的损失函数为L(θ,δ(Y))。

然后,定义风险函数如下。

R(θ,δ)A Eθ[L(θ,δ(Y))]=∫YL(θ,δ(Y))dPθ(Y) (3)

则称

R(δ)A∫R(θ,δ)π(θ)d(θ) (4)

就是贝叶斯风险。

而

R(δY)A∫L(θ,δ(Y))π(δY)dθ (5)

就成为贝叶斯后验风险。根据积分次序的可交换性和Fatou引理可以证明:当supR(δ)<∞时,贝叶斯决策函数和贝叶斯后验决策函数是等价的,因此,根据后验风险准则来寻求贝叶斯风险决策解即可。

2 基于贝叶斯风险决策理论的研发项目风险评估模型

对于风险决策来说,贝叶斯网络为风险决策者提供了一种更加精确科学的决策方法,即遵循贝叶斯风险最小原则。在研发项目中,由于存在很多不明确风险,而项目人力和物力有限,因此只能着重控制风险发生概率高和风险发生后损失大的风险事件,这与贝叶斯风险决策理论是相通的,只不过这里要找到贝叶斯风险中最大的几项风险。

由于项目中的风险评估与风险决策中的风险分析有所不同,所以需要重新建立研发项目风险评估模型,其具体操作如下:

(1)定义先验概率分布,由于研发项目发展较晚,并没有较完备的风险数据资料,所以这里可以由专家进行判断。

(2)给出相关的条件概率参数,并结合先验概率计算出相应的后验概率。

(3)定义风险损失函数(风险严重性:指风险对项目造成的危害程度)。由于研发项目风险评估与风险决策不同,这里的风险损失将依据表1所示的原则进行定义[12],根据风险对项目工作量增加程度的大小分为5级。

需要说明的一点是,本文对于风险严重性的确定标准,是以工作量作为标准来进行的。在对研发项目进行风险评估时,还可以以成本或其他指标作为衡量的标准,而且这一标准的确立应根据研发组织的实际情况而定,并没有统一的标准。

(4)将贝叶斯后验风险概率与相应的风险严重性等级相乘可得到最终的贝叶斯风险,并根据风险大小进行排序以便风险控制。

3 实例验证(实际应用)

下面将以某研发项目需求风险为例对其应用效果进行说明。将需求风险命名为Y,其影响因素有以下几个:X1需求变动风险、X2需求不明确风险、X3需求变化管理风险,并建立相应的贝叶斯网络。案例中风险评估的目的是对需求风险中的3个子风险大小进行排序,进而找到风险最大的风险事件,并着重对其进行控制。

(1)根据专家判断,赋予3个子风险事件先验概率,分别为:

P(X1)=(0.7,0.3);

P(X2)=(0.6,0.4);

P(X3)=(0.4,0.6);

(2)根据专家知识赋予相应的条件概率参数,分别为:

P(X/X1)=0.7;

P(X/X2)=0.8;

P(X/X3)=0.6;

进而依据公式(2)可以计算出3项风险的后验风险分别为:

P(X1/X)=0.405;

P(X2/X)=0.397;

P(X3/X)=0.198;

(3)依据表1确定的风险严重性判别准则,并根据基于DELPHI的专家判断法得出3项风险的严重性等级权值分别为:3、4、1。

(4)可以得到最终的贝叶斯风险值排序,如表2所示。

根据分析可知,需求不明确风险和需求变动风险的贝叶斯风险值较大,项目经理应着重对其进行控制,如有必要甚至需要改变计划,而需求变化管理风险的贝叶斯风险值较小,不用投入太多的成本和人力。

为验证本文所示方法的客观性和有效性,在对本文中的案例进行风险评估时,除了用本文中的方法,同时还运用了另外一种常用的风险优先级确定方法来对其进行评估。即通过评估出该项目风险的概率(风险可能发生的程度)和严重性,并将概率乘以严重性,确定风险的优先级,风险优先级也称之为风险系数,是指风险对项目造成的影响,定义为风险严重性权值和风险可能性权值的乘积,必要时也可以考虑到项目风险的可控性,乘上风险的可控性系数。风险概率的确定如表3所示,评估的优先级顺序如表4所示。

从表4可见,其判断结果与本文的判断结果差别非常大,而项目的实际运行结果表明,本文所研究方法的评估结果更加接近项目的实际情况。对风险进行有效的评估后,就可以根据风险评估的结果对风险进行监督和控制。通常情况下,风险响应的措施如下:对于风险优先级比较低的项目,如表4中的“需求变化管理风险”,项目采取的措施是不予响应,因为对于低等级的风险进行响应,固然会提高项目的安全度,但项目付出了额外的成本,不必要也不划算;对于优先级处于中等级的风险,由项目经理负责响应,项目内部制定补救、缓解措施,如表4中的“需求不明确风险”;而对于高等级的风险,因其会对项目及企业造成重大影响,因此由公司高管直接参与制定补救、缓解措施,并亲自审批风险管理措施,如对于表4中的“需求变动风险”。这样才能确保项目既不付出额外的成本,但又能确保项目有序、安全的完成。

根据风险识别和评估的结果对于风险的管理一般分为4个层次:危机管理(风险已经造成麻烦后才着手处理它们)、风险缓解(事先制定好风险发生后的补救措施,但不制定任何的防范措施)、着力预防(将风险识别和风险防范作为软件项目的一部分加以规划和执行)、消灭根源(识别和消灭可能产生风险的根源)。根据这4个层次的划分,我们应该根据风险评估的结果对风险进行预防,但同时我们也必须认识到不是所有的风险都能够预防的,所以还必须建立一个应付意外事件的计划。所以正确地对项目风险进行评估,确定项目的风险系数和优先级,是制定合理风险应对措施和进行风险监控的基础,也是关系到项目成败的重要一环。

4 结语

总之,研发项目风险管理是研发开发过程中一项非常重要的工作,是关系到研发项目成败与否的一个很重要的因素。研发项目风险管理主要包括项目风险的识别、评估、应对和控制4项主要活动,即首先要识别出项目的风险,评估风险之间的关系及风险发生的可能性、后果及影响范围,根据评估的结果制定风险应对计划,并对风险进行跟踪和控制。研发项目评估的主要目的是量化项目开发活动中可能碰到的各类风险,估计风险的可能性和对项目开发的影响程度,划分风险的优先级,为制定项目风险管理计划及对风险进行监控提供依据和参考。由此可见风险评估在研发项目风险管理中起着非常重要的作用,是风险管理成败与否的关键。

本文主要通过采取基于贝叶斯风险决策理论的研发项目风险评估模型来对研发项目中的风险进行评估。实践证明,该方法比较简单有效,且容易实施,大大降低了模型的工作量,采用这一模型可以有效地弥补先验概率精确度低的问题,提高了研发项目风险评估的准确度,为风险控制提供了更加可靠的依据。

该方法存在的不足之处是有些数据的获得依赖于专家知识,鲁棒性比较差,下一步将通过调研企业的实际数据,引入建立在实际数据基础上的更为客观的评估方法。

参考文献

[1].Project Failure and Success Research Report[R].Standish Group International Chaos,2005

[2].Boehm B W.Software risk management:Principlesand practices[J].Software,IEEE,1991,8(1):32～41

[3].段秉乾,司春林.基于模糊层次分析法的产品创新风险评估模型[J].同济大学报(自然科学报),2008,36(7):1002～1005

[4].庞庆华.一种软件项目风险的灰色评价方法及应用[J].科学技术与工程,2009,23(9):7162～7165

[5].Chin-Feng Fan,Yuan-Chang Yu.BBN-basedsoftware project risk management[J].The Journal of Systemsand Software,2004,(73):193～203

[6].唐爱国,王如龙,胡春华.贝叶斯网络在软件项目风险评估中的应用[J].计算机工程与应用,2010,46(7):62～65

[7].金俊丽,赵川,杨洁.基于EM-GA改进贝叶斯网络的研究及应用[J].计算机应用研究,2010,27(4):1360～1362

[8].N.Fenton,M.Neil.Making decisions:using Bayes-ian nets and MCDA[J].Knowledge-based systems,2001,14:307～325

[9].Rajendra P.Srivastava.An introduction to evidentialreasoning for decision making under uncertainty:Bayesian andbelief function perspectives[J].International Journal of Ac-counting Information Systems,2011,12:126～135

[10].Xiaomo Jiang,Sankaran Mahadevan.Bayesian risk-based decision method for model validation under uncertainty[J].Reliability Engineering and System Safety,2007,92:707～718

[11].朱慧明,韩玉启.贝叶斯多元统计推断理论[M].科学出版社,2006:41～44

【贝叶斯决策分析】推荐阅读：

贝叶斯决策树07-30

分析和决策06-09

决策分析方法06-19

分析决策树09-25

决策分析法06-15

战略决策分析06-29