Bayes法

2024-09-02

Bayes法(精选7篇)

Bayes法 篇1

桩基础属于隐蔽工程, 其完整性检测的优劣受人为影响因素较多。桩基础属于隐蔽工程, 当前检测其完整性一般采用低应变动力测桩法, 然而动力测桩的正确性很大程度上取决于检测人员的经验。目前已有学者用人工神经网络判断桩基础的完整性, 利用神经网络 (主要是BP网络) 估计桩身完整性时, 由于样本数有限和缺乏理论指导, 存在一些不足[1]。还有学者利用支持向量机理论对桩基低应变检测完整性进行了判别, 并且取得了较好的成效[2]。与上述研究者不同, 本文试图利用判别分析方法来对桩基低应变检测完整性进行判别, 以期得到较好的结果。本文借鉴判别分析理论的思想, 选取影响桩基完整性的主要指标, 建立Bayes判别模型来对桩基低应变检测完整性进行判别。

1 Bayes判别分析理论[3]

Gj的概率密度为fj (X) , 样本X= (x1, x2, …, xp) T来自总体Gj的先验概率为pj, 各总体出现的先验概率为:

pj=P (Gj) , j=1, …, k (1)

则满足j=1kpj=1

对于p元指标X= (x1, x2, …, xp) T, 它的取值空间是p元欧式空间Rp。一个判别法则实质上是对空间Rp的一个不相重叠的划分R1, R2, R3, …, Rk, 并且满足:

j=1kRj=Rpj=1k=ϕ (2)

这一划分记为R= (R1, R2, …, Rk) , R代表一个判别准则。

在上述判别准则下, 将来自Gi的样本误判为来自Gj的概率:

设来自Gi的样本误判为来自Gj的损失记为c (j|i) , 并且约定c (i|i) =0。c (j|i) 构成一个损失矩阵:

多数情况下假定c (j|i) 为常数, ij。这时, 可设:

c (j|i) ={1, ji0, j=i

此时, 来自Gi的样本误判为来自其他总体的概率为:

Gi出现的先验概率是pj时, 误判的平均概率为:

一个最优划分R= (R1, R2, …, Rk) 应使p*最小。

此时, 因为:

则:jiΡ (j|i, R) =1-Ρ (i|i, R)

当取Ri={Xpifi (X) =max1jkpifi (X) }, i=1, , k时, R= (R1, R2, …, Rk) 是Rp的一个划分且p*达到最小值, 也就是最优划分。

又由Bayes公式, 当出现样品X时, 总体Gi后验概率为:

故最优划分R= (R1, R2, …, Rk) 又可表示为:

Ri={XΡ (Gi|X) =max1ikΡ (Gj|X) }i=1, 2, , k (6)

这说明, 当出现样品X时, 应判定X来自后验概率最大的那个总体Gi, 这符合Bayes统计推断的原则, 其统计意义非常清楚。

2 桩基低应变检测的Bayes判别分析模型

2.1 检测介绍

1) 检验设备。

测试仪器:PIT桩基低应变完整性检测仪, 包括PIT主机、加速度传感器、手锤及电脑、打印机等。

2) 检验方法及原理。

试验采用反射波法进行, 即:桩顶实施锤击后, 激起桩顶质点的振动, 运动在混凝土桩身中传播而形成应力波, 应力波在下行途中, 如果遇到阻抗减小 (缩径、离析等) , 即产生上行的拉伸波, 该拉伸波上行到达桩顶面时, 将导致顶面质点向下的速度增加;反之, 如果遇到阻抗增大 (扩径等) , 则产生上行的压缩波, 该波运行至桩顶面将导致质点向下的速度减小;这些信息都被安装于桩顶的加速度传感器接收。根据初始激励与桩身阻抗变化处反射到达时刻之间的时间差Δt及应力波在桩身混凝土介质中的传播速度C来推求阻抗变化的位置x (x=CΔt/2) ;根据速度曲线的上下起伏大小来判断桩身的阻抗变化程度。

2.2 判别模型的建立

本次低应变法检测抽检基桩85根, 检测和分析依据为中华人民共和国行业标准JGJ 106-2003建筑基桩检测技术规范。将桩基完整性分为四个级别:Ⅰ类桩:桩身完整;Ⅱ类桩:桩身基本完整, 但存在轻微缺陷;Ⅲ类桩:桩身存在明显缺陷, 应采取其他方法进一步检测或处理;Ⅳ类桩:桩身存在严重缺陷或断桩。以参考文献[4]所提供的从大量的桩基低应变完整性检测案例中选取12个典型样本作为训练样本, 其中, Ⅰ类桩、Ⅱ类桩、Ⅲ类桩、Ⅳ类桩各3根, 实际资料见表1。

运用选好的桩基低应变完整性判别模型对4个待判的样本进行判别, 根据本文预测 (见表2) , 从判别结果得知, 判断结果全部正确, 判对率为100%, 说明本文方法桩基低应变完整性判别应用中有良好的实用性和有效性。

3结语

1) 利用Bayes判别法进行桩身质量识别可以较好的判别结果, 证明该方法具有良好的可行性, 为桩基低应变检测判别问题提供了一条新途径。2) Bayes判别法可以进行小样本学习, 预测的精度较高, 本文的结果表明这种方法可在工程实践中应用。

参考文献

[1]蔡棋瑛, 林建华.基于小波分析和神经网络的桩身缺陷诊断[J].振动与冲击, 2002, 21 (3) :97-98.

[2]苏华.支持向量机在桩基低应变检测中的应用[J].土工基础, 2009, 23 (2) :61-63.

[3]范金城, 梅长林.数据分析[M].北京:科学出版社, 2002.

[4]江苏省赣榆县建设工程质量检测中心.维多利亚A区6号楼桩身完整性检测报告[R].2005.

Bayes法 篇2

近年来, 我国公路隧道水害事故时有发生, 对公路隧道及行车安全造成了极为严重的影响。据统计[1,2,3,4], 约30%~40%的公路隧道发生过较为严重的水害事故, 造成了较大的人员伤亡及财产损失。因此, 对公路隧道水害倾向性评价迫在眉睫, 基于Bayes判别理论, 根据相应的实测数据构建公路隧道水害倾向性分级的Bayes模型, 对构建的模型运用交叉确认估计法进行验证, 进而将其运用到公路隧道水害的评价之中, 最后得出公路隧道水害倾向性分级评价结果。

学界对公路隧道水害的研究倾向于水害分析及防治处理, 但对于公路隧道水害倾向性评价的研究却不够充分, 而且定性评价处理不确定影响因素时缺少了客观性, 较大的影响了评价结果。如文献[5]基于SVM的隧道涌水来源进行识别隧道水害预测与评估;文献[6]运用模糊层次分析法综合评价隧道施工安全。许多定性、定量因素共同影响着公路隧道水害的危险性, 基于此, 将Bayes判别理论运用到公路隧道水害倾向性分级之中, 选取反应公路隧道水害倾向性的关键性指标并对其进行定量分析, 超前预测公路水害倾向性。根据倾向性分级结果, 分析、辨识、处理公路隧道水害危险源, 保证公路隧道的安全性和可靠性, 进而促进我国公路隧道的健康发展。

1 Bayes判别分析法概述

1.1 两正太总体的Bayes判别

1) 马氏距离和判别函数。设G为m维总体, 数学期望为μ, 协方差矩阵为∑, m维样本X与总体G的马氏距离定义为[7,8]:

假设G1和G2分别代表两个不同的m维总体, 考察样本X到G1和G2的马氏距离的平方差:

设W (x) 为判别函数, 令

2) Bayes判别函数。设2个m维总体G1和G2, 其概率密度函数为[10]:

其中, i=1, 2。

假设∑1=∑2=∑, 由式 (2) 和式 (3) 可得

相应的Bayes判别函数为:

实际应用中, 参数μ1, μ2和∑一般未知, 那么它们的取值需要根据训练样本进行估计, 即分别代替μ1, μ2和∑, 于是:

1.2 多正态总体的Bayes判别

正态总体的个数由两个推广至多个进行判别分析, 其概率密度函数同式 (4) , 其对应的判别函数如下:

与两正态总体类似, 在实际应用中:

1.3 Bayes判别准则及评价

1) 两正态总体的Bayes判别准则。两总体的概率密度函数在x处的函数值, 其Bayes判别准则为

其中, q1和q2分别代表总体G1和G2的先验概率分布, c (2|1) 和c (1|2) 则为误判损失。

2) 多正态总体的Bayes判别准则。记c (i i) =0, 在等误判损失, 相应的Bayes判别准则[14]为

其中, i=1, 2, …, g;j=1, 2, …, g;i≠j。

判别准则确定后, 可采用以训练样本为基础的交叉确认估计法计算误判率[15]:

(1) 从G1 (容量为n1) 的训练样本中剔除1个样品, 用剩余 (容量为n1-1) 的训练样本和G2 (容量为n2) 的训练样本建立判别函数。

(2) 用所构建的判别函数对剔除的样品进行判别。

(3) 重复步骤 (1) 和 (2) , 直到G1的训练样本全部被剔除, 设误判样品数为n*12。

(4) 对G2的训练样本重复上述3个步骤, 设误判样品个数为n*21, 那么误判率为:

2 公路隧道水害倾向性分级的Bayes模型

2.1 水害倾向性判别因子

隧道区水害倾向性预测的Bayes判别分析方法受到多种因素的影响, 所以公路隧道水害判别因子必须客观全面, 判别因子过多或者过少都会影响评价结果, 选取的判别因子过多增加测试工作成本, 选取的判别因子太少不能全面客观的反应公路隧道水害倾向性的本质特性。综合公路隧道水害倾向性相关研究成果[4,5,6,7,8,9,10,11,12,13,14,15], 选取隧道区渗透系数 (X1) 、降水情况 (X2) 、单位涌水量 (X3) 、构造断裂带类型 (X4) 、围岩分级 (X5) 、隧道施工情况 (X6) 、防排水措施情况 (X7) 等7个因素作为Bayes判别分析模型的判别因子, 其中隧道区渗透系数表征隧道区岩体及土质的渗透性能, 渗透系数越大渗透水量就越多, 隧道区水害危险性就越大;单位涌水量、降水情况与隧道水害危险性成正相关性, 水量越大隧道区水害危险性就越大;构造断裂带类型和围岩分级是影响隧道水害的重要因素, 可查询相关规范进行分级;隧道施工情况、防排水措施情况也严重影响着公路隧道的安全性。

2.2 Bayes判别分析函数

公路隧道水害倾向性可以划分4个等级, 依次为危险性极大 (I) 、危险性较大 (II) 、危险性一般 (III) 、危险性小 (IV) 。将此4个等级作为Bayes判别分析的4个正态总体W1, W2, W3和W4, 从而建立公路隧道水害倾向性分级的判别模型。以所测定的大量实测数据为参考, 从中选取20个典型公路隧道水害倾向性指标实测值作为训练样本, 见表1。

依据Bayes判别理论分析, 采用MINITAB软件对训练样本进行学习, 运用交叉估计法进行计算得到误差率为5% (11号公路隧道样本被误判) ;获得公路隧道水害倾向性分级的判别函数, 如下:

3 工程实例应用

为判定公路隧道在运营过程中潜在的水害倾向性, 选取国内6条具有代表性的公路隧道开展实测工作, 基于测定的各个公路隧道样本的隧道区渗透系数、降水情况、单位涌水量、构造断裂带类型、围岩分级、隧道施工情况、防排水措施情况等判别因子测定值, 利用所得的判别分析函数对6条公路隧道的水害倾向性级别进行分类, 并与公路隧道实际情况进行比较。具体数据参见表2。

表2数据显示:将训练好的Bayes判别模型用于公路隧道水害倾向性分级时, 所判别的6条公路隧道样本的分类结果与实际情况完全相符, 正确率为100%。结果表明, 采用Bayes判别分析法开展公路隧道水害倾向性分级工作是可行的, 有效的, 合理的。结合公路隧道区的自然环境、地表水文、现场管理水平等外界因素, 可以有效的指导公路隧道水害的防治工作, 保证公路隧道的安全可靠。

4 结论

1) 基于隧道水害形成的内因和外因, 以评价分级合理有效位总值, 选取隧道区渗透系数、降水情况、单位涌水量、构造断裂带类型、围岩分级、隧道施工情况、防排水措施情况等作为判别因子, 并将隧道水害倾向性分为4个级别。

2) 从不同类型的公路隧道选取20条具有代表性的作为Bayes判别模型的训练样本, 利用交叉确认法对其进行验证, 正确率高达95%, 将训练好的Bayes判别函数应用于6条国内典型公路隧道的水害倾向性分级中, 所得结果与实际情况完全吻合。对评价结果为危险性极大、较大的公路隧道采取相应措施以保障公路隧道的安全性, 有利于减少事故的发生。

3) 对于造成误判的各种因素, 还需要在今后的研究工作中收集更多的案例, 发现新思路找到突破点以更一步提高公路隧道水害倾向性Bayes判别模型的准确性。

摘要:为提高公路隧道整体安全性能, 保障人员安全, 减少财产损失, 避免公路隧道水害事故的发生, 将Bayes判别理论应用于公路隧道水害倾向性判别和分级中。采用影响隧道水害发生的隧道区渗透系数、降水情况、单位涌水量、构造断裂带类型、围岩分级、隧道施工情况、防排水措施情况等7项指标作为基本判别因子;将公路隧道水害倾向性分为4个等级作为Bayes判别分析的4个正态总体。以采自典型的20组公路隧道的实测数据为训练样本, 建立公路隧道水害倾向性分级的Bayes判别函数。对训练后的模型运用交叉确认估计法进行验证, 然后运用该模型对6条待检验的公路隧道样本的水害倾向性进行分级。研究结果表明:构建的Bayes判别分析模型误判率极低, 分级效果合理有效, 可以运用于公路隧道水害倾向性的分级中, 有利于公路隧道水害的预防和治理。

Bayes法 篇3

1在 Bayes公式教学中学生认知障碍的成因分析

在以往教学实践中,Bayes公式的教 学效果十分不理想.作者通过案例分析,发现造成学生认知障碍的成因如下.

1.1传统教学观念是导致学生认知障碍的一个关键因素

目前大学教学过程中,传统式教学手段比比皆是.即先给出概念、公式、定理,然后再去解释概念,推导公式、定理的教学方式.这种教学模式在Bayes公式教学过程中往往是事倍功半.

1.2Bayes公式 本 身 的 知 识 结 构 造 成 认 知障碍

Bayes公式是从现实生活 中抽象出 来,有其鲜明的特色和强烈的直观意义.一方面其形式比较复杂,不便于学 生记忆,另一方面,它是一种“逆向思维方式”.很多学生因此产生了“知识断链”,进而不能对其形成很好地认知.

1.3学生获取知识的方式造成认知障碍

学生接受“Bayes公式”的思想往往过多依赖于教材.同时教师在授课过程中,往往忽视学生的认知发展规律,忽视学生从现实生活中发现问题、提出问题和解决现实问题的能力;学生不能理解其由来和应用价值,生搬硬套,没有主动去发现和提炼出其所包含的概率思想和统计方法.

1.4学生整合水平不高造成认知障碍

由于整合水平低,学生不能迅速地将捕捉的知识信息纳入已有的知识系统,也不能根据需要来激活、检索和提取信息.致使应用起来困难重重,易于全概率公式混淆.并对公式的作用模糊,不利于解决实际问题等等.

2Bayes公式教学方法探讨

基于以上分析,作者结合教学实践,在教学过程中尝试了以下教学方法.

2.1转变教学观念,优化教学内容

首先应当转变教学观念.在Bayes公式教学过程中,由以往的侧重教师传授为主转变为鼓励学生创新和应用为主.做到“理解理论,掌握应用”.教师在授课过程中要选用一些生活实例,比如用Bayes公式分析“狼和孩子”的故事中,村民对小孩的可信度是如何下降的;又如用Bayes公式分析“出现某种传染疾病,寻找传染源”等.运用Bayes公式的方法观察和分析这些实例,以此来激发学生的学习兴趣,让他们感受到知识的实用性.

2.2创设教学情景,激发认知动因,使学生体会 Bayes公式的特点

通过生活实例,创设情境,使学生在解决问题过程中体会Bayes公式的特点.

例1某地在过去的20年里一共发生过2次被盗,该地的主人有一条狗,狗平均每周晚上叫3次,在盗贼入侵时狗叫的概率被估计为0.9,问题是:在狗叫的时候发生被盗的概率是多少?

解析设事件A={狗在晚上叫},事件B={被盗},则A珡={狗不在晚上叫},B珚={未被盗},以天为单位统计,则有

问题:狗叫,结果是发生被盗的概率,即求P(B|A).由条件概率公式易得

再由乘法公式得

于是有

例2商店的玻璃杯成箱出售,每箱10只.假设每箱含0,1,2只次品的概率为0.8,0.1和0.1.有一顾客欲买一箱玻璃杯,售货员随意取一箱交给顾客,而顾客只随意察看了其中4只,结果未发现次品,于是买下.试求在顾客买下的一箱中确实无次品的概率.

解析引入事件A={顾客买下所察看的一箱},Hi={箱中恰有i件次品}(i=0,1,2).由条件知

P(H0)=0.8,P(H1)=0.1,P(H2)=0.1.

P(A|H0)=1,

由全概公式知

于是,再由乘法公式得

从而有

上述问题的实质是求“所买一箱无次品”结果是由“察看”原因造成无次品的概率.在顺应知识同化中推导出一个新的公式,推而广之,就得到Bayes公式.简述如下:

设事件H1,H2,…,Hn为样本空间Ω的一个分割 或完全事 件组,即满足:则对Ω中任一事件A,有

这里事件A表示某种实验结果,事件 {H1,H2,…,Hn,…}是关于A发生的原因.其特点是贝叶斯公式的分母便是全概率公式,而分子是分母的其中一项.

2.3引导学生形成建模的思维机制,扩大认知成果,完善认知结构

Bayes公式提供 了一种重 要的统计 方法,即如何充分利用验后信息逐步修正对事件概率的估计.是人们充分利用概率方法进行决策的一个有力的工具.在Bayes公式教学过程中要使学生理解模型的内容、处理方法和应用价值,在遇到同类型的问题时能迅速地提取和对应起来,将复杂的问题转化为简单的模型加以处理.

例3[5](Bayes公式在医疗诊断上的应用)假设在一项利用血液化验诊断某种疾病的过程中,发现95% 的患者反应呈阳性,但是其中有1% 的健康人也呈阳性反应———伪阳性.统计资料表明,这种疾病的患者在人口中的比重为0.2% .试求这种血液化验反应呈阳性的实际并没有患这种疾病的概率.

解随机抽取1人进行化验.设事件A={血液反应呈 阳性},H1= {患者},H2={非患者}.则由已知条件知

于是,由Bayes公式得

上述计算结果表明:利用这种验血方法,尽管对于确实患有这种疾病的确诊 率高达95% ,但是在血液化验呈阳性反应的人群中平均约有84.1% 的人没有患这种疾病.即用这种方法进行诊断,把未患这种疾病的人误诊为患者的概率高达84.01% .显然,需要改进这种验血方法.

为了降低错检率,在实际医务工作中,一个行之有效的方法就是———复查.譬如,对首次检查“患者”的人 群再进行 复查,此时P(H2)=84.01% ,P(H1)=15.99% .再用贝叶斯公式计算得

复查结果 使这种验 血错误率 不足5.1% ,两次利用贝叶斯公式定量地对医学问题进行相关分析,使其结论更具有可信度,何乐而不为?

2.4整合教学资源,提高学生整合水平,使教学迈上新台阶

Bayes法 篇4

模式识别就是机器识别、计算机识别或机器自动识别, 目的在于让机器自动识别事物, 如手写数字的识别、智能交通管理信号的识别、文字识别、语音识别等等。该学科研究的目的是使机器能做人类能做的事, 具备人所具有的对各种事物与现象进行分析、描述与判断的部分能力。模式识别是直观的、无所不在的。人和动物具有模式识别能力是极其平常的, 但对计算机来说却非常困难。让机器能识别、分类, 需要研究识别的方法。

模式识别可以概括为两个类型, 一是有直觉形象的, 如图片、相片、图案、字符图案等;另一种是无知觉形象而只有数据或信号的波形, 如语言、声音、心电图、地震波等。字符识别处理的信息可分为两大类:一类是文字信息, 处理的主要是用各国家、各民族的文字书写或印刷的文本信息;另一类是数据信息, 主要是由阿拉伯数字及少量特殊符号组成的各种编号和统计数据。手写数字识别就是字符识别处理中的一种, 它的研究对象是如何利用电子计算机自动辨认人手书写的阿拉伯数字。

1 Bayes算法

若已知总共有M类物体, 以及各类在d维特征空间的统计分布, 具体说来是已知各类别wi=1, 2, …, M的先验概率P (wi) 及类条件概率密度函数P (X/wi) , 对于待测样品, Bayes公式可以计算出该样品分属各类别的概率, 叫做后验概率, 后验概率作为识别对象归属的依据, 看X属于哪个类的可能性最大, 就把X归于可能性最大的哪个类。Bayes公式可以表示如下:

undefined。

其中:P (wi/X) 称为后验概率。

类别的状态是一个随机变量, 而某种状态出现的概率是可以估计的。Bayes公式体现了先验概率、类概率密度函数、后验概率3者之间的关系。

1.1 先验概率P (wi)

先验概率P (wi) 针对M个事件出现的可能性而言, 不考虑其他任何条件。如总数为n, 其中类1数为n1, 类2数为n2, 则:

undefined

1.2 类条件概率密度函数P (X/wi)

类条件概率密度函数P (X/wi) 是指在已知某类别的特征空间中, 出现特征值X的概率密度, 即第wi类样品它的属性X是如何分布的。

在工程上的许多问题中, 统计数据往往满足正态分布规律。正态分布简单, 分析方便, 参量少, 是一种适宜的数学模型。如果采用正态密度函数作为类条件概率密度的函数形式, 则函数内的参数如期望和方差是未知的, 那么问题就变成了如何利用大量样品对这些参数进行估计, 只要估计出这些参数, 类条件概率密度函数P (X/wi) 也就确定了。单变量正态分布概率密度函数为:

undefined。

其中:μ为数学期望 (均值) ;σ2为方差。

多维正态概率密度函数为:

undefined。

其中:S为N维协方差矩阵, S-1为S的逆矩阵;|S|为S的行列;undefined为N维均值向量。

在多数情况下, 类条件概率密度函数可以采用多维变量的正态概率密度函数来模拟, 即:

undefined。

1.3 后验概率

后验概率是指呈现状态X时, 该样品分属各类别的概率, 这个概率值可以作为识别对象归属的依据。由于属于不同类的待识别对象存在着呈现相同观察值的可能, 即所观察到的某一样品的特征向量为X, 而在类中又有不止一类可能呈现这一值, 它属于各类的概率可用P (wi/X) 表示。可以利用Bayes公式来计算这种条件概率, 称之为状态的后验概率:

undefined。

P (wi/X) 是表示在X出现条件下, 样品为wi类的概率。在这里要弄清楚条件概率这个概念。P (A/B) 是条件概率的通用符号, 在“/”后边出现的B为条件, 之前的A为某个事件, 即在某条件B下出现某个事件A的概率。

1.4 P (w1/X) 和P (w2/X) 与P (X/w1) 和P (X/w2) 的区别

P (w1/X) 和P (w2/X) 是在同一条件X下, 比较w1与w2出现的概率, 如P (w1/X) >P (w2/X) , 则可得以下结论, 在X条件下, 事件w1出现的可能性比事件w2出现的可能性大。

P (X/w1) 与P (X/w2) 都是指各自条件下出现X的可能性, 两者之间没有联系, 比较两者没有意义。P (X/w1) 与P (X/w2) 是在不同条件下讨论的问题, 不能仅因为P (X/w1) >P (X/w2) , 就认为X是第一类事物的可能性较大。

2 数字识别举例

2.1 实现步骤

(1) 计算先验概率P (wi) , 先验概率可由各类的样品数和总数近似计算。此处为数字, i=0, 1, 2, …, 9, 得:

P (wi) ≈Ni/N 。

其中:P (wi) 为数字i的先验概率;Ni为数字i的样品数;N为样品总数。

(2) 计算Pj (wi) 。Pj (wi) 表示样品X (x0, x1, x2, …, x24) 属于wi条件下, X的第j个分量为1 (xj=1) 的概率估计值。

其中:i=0, 1, 2, …, 9, j=0, 1, 2, …, 24。

再计算类条件概率P (X/wi) 。样品X的类条件概率为:

P (X/wi) =P[X= (x0, x1, x2, …, x24) /X∈wi] 。

(3) 应用Bayes公式求后验概率, 得:

undefined。

(4) 后验概率的最大值的类别 (0~9) 就是手写数字的所属类别。

2.2 效果图

图1 (a) 为手写数字的特征样品, 图1 (b) 的左边是待测样品特征提取后的模板示意图, 右边是从样品库中找到的样品模板, 该样品距离待测样品最近, 也就是最像或最相似, 可以通过图1 (b) 的显示来比较它们的相似程度。

3 结束语

本文所采用的方法仅是概率统计分类器中的一种。Bayes决策采用分类器中最重要的指标——错误率作为产生判别函数和决策方面的依据, 给出了最一般情况下使用的“最优”分类器设计方法, 对各种不同的分类器设计在理论上都有指导意义。

参考文献

[1]杨淑莹.图像模式识别[M].北京:清华大学出版社, 北京交通大学出版社, 2005.

[2]徐士良.C常用算法程序集[M].北京:清华大学出版社, 1996.

[3]王正军.Visual C++6.0程序设计[M].北京:人民邮电大学出版社, 2006.

[4]Tang YT.Offline recognition of Chinese handwriting bymultifeature and multilevel classification[J].IEEETransactions on PAMI, 1998, 20 (5) :556-561.

Bayes法 篇5

设随机变量X服从两参数复合Rayleigh分布,相应的概率密度函数和分布函数分别为:

f(x;θ,λ)=2θλθx(λ+x2)-(θ+1);x>0,θ,λ>0 (1)

F(x;θ,λ)=1-λθ(λ+x2)-θ;x>0,θ,λ>0 (2)

其中θ为尺度参数,λ为形状参数。

1最大似然估计

X1,X2,…,Xn为来自两参数复合Rayleigh分布式(1)的容量为n的一个简单随机样本,(x1,x2,…,xn)为的样本观测值。则给定下参数θ的似然函数为:

L(θ)=i=1nf(xi;θ)=i=1n2θλθxi(λ+xi2)-(θ+1)=2nθnλnθi=1nxii=1n(λ+xi2)-(θ+1)(3)

相应的对数似然函数为:

lnL(θ)=nln2+nlnθ+nθlnλ+i=1nlnxi-(θ+1)i=1nln(λ+xi2)(4)

从而似然方程为:

lnL(θ)θ=nθ+nlnλ-i=1nln(λ+xi2)=0(5)

于是参数θ的最大似然估计为:

θ^=nΤ(6)

式(6)中Τ=i=1nln(1+Xi2λ)~Γ(n,θ)

注1:由文献[8],我们有Τ=i=1nln(1+Xi2λ)~Γ(n,θ)。从而T的概率密度函数为:

fΤ(t)=1Γ(n)tn-1e-θtt>0(7)

则有EΤ-1=θn-1,且易知T为参数θ的完全充分统计量,从而尺度参数θ的最小方差无偏估计为[9]:

θ^UΜVU=n-1Τ(8)

2Bayes估计

以下均设X1,X2,…,Xn为来自复合Rayleigh分布式(1)的容量为n的一个简单随机样本,Τ=i=1nln(1+Xi2λ)。本文我们感兴趣的的损失函数为平方误差损失函数:L(θ^,θ)=(θ^-θ)2和LINEX损失函数[10]:

L(Δ)=ecΔ-cΔ-1,c0(9)

式(9)中Δ=θ^-θ,θ^为参数θ的估计, c为损失函数的形状参数,且在LINEX损失下,参数θ的Bayes估计为:

θ^BL=-1cln[E(e-cθ|X)](10)

定理2.1设X=(X1,X2,…,Xn)为来自复合Rayleigh 分布式(1)的容量为n的简单随机样本,x=(x1,x2,…,xn) 为相应的样本观测值, tT的观察值,并设参数θ的先验分布为伽玛分布Γ(α,β),则

(i)在平方误差损失函数下,参数θ的Bayes估计为:

θ^BS=n+αβ+Τ

(ii) 在LINEX损失函数下,参数θ的Bayes估计为:

θ^BL=n+αclnΤ+β+cΤ+β

证明 设参数θ的共轭先验分布为伽玛分布

Γ(α,β)

即相应的概率密度函数为:

π(θ;α,β)=βαΓ(α)θα-1e-βθ; θ>0,α,β>0。

由式(3)及Bayes 定理,参数θ的后验密度函数为:

h(θ|x)∝l(θ|x)π(θ;α,β)∝

θne-θtθα-1e-βθθn+α-1e-(β+t)θ (11)

从而θ的后验分布为Γ(n+α,β+t)。

则(i)在平方误差损失函数下,参数θ的Bayes估计为其后验均值,从而θ的Bayes估计:

θ^BS=E(θ|X)=n+αβ+Τ

(iii)由式(11)有

E(e-cθ|X)=0+e-cθ(β+Τ)n+αΓ(n+α)θn+α-1e-(β+Τ)θdθ=(β+Τ)n+αΓ(n+α)Γ(n+α)(β+Τ+c)n+α=(Τ+βΤ+β+c)n+α

于是在LINEX损失函数下,参数θ的Bayes估计为:

θ^BL=-1clnE(e-cθ|X)=n+αclnΤ+β+cΤ+βc0

3数值模拟例子和结论

利用Monte Carlo数值模拟一组来自参数θ=1.5和λ=2的复合瑞利分布式(1) 容量为n=21的样本(见表1)。

利用公式Τ=i=1nln(1+Xi2λ)T=10.978 3,从而可以计算出尺度参数θ的各种估计值(见表2)。

从表2以及大量的数值模拟可以得到如下结论:

(i)给定合适的先验参数值,尺度参数θ的Bayes估计会比最大似然估计和最小方差无偏估计的估计结果更加准确;

(ii)随着样本容量的增大,这几种估计值都越来越接近参数真值.

摘要:基于完全样本讨论了复合Rayleigh分布尺度参数的估计问题。在平方误差损失、LINEX损失函数下导出了复合Rayleigh分布尺度参数的Bayes估计。给出了Monte Carlo数值模拟例子,将得到的估计与最大似然估计进行比较。

关键词:最大似然估计,Bayes估计,平方误差损失函数,LINEX损失函数,复合,Rayleigh分布

参考文献

[1] Bekker A,Roux J,Mostert P.A generalization of the compound Ray-leigh distribution:using a Bayesian methods on cancer survival times.Communications in Statistics-Theory and Methods,2000;29(7):1419—1433

[2] Al-Hussaini E K.Predicting observables from a general class of distri-butions.Journal of Statistical Planning and Inference,1999;79(1):79—91

[3] Abushal T A.Estimation of the unknown parameters for the com-pound Rayleigh distribution based on progressive first-failure-censoredsampling.Open Journal of Statistics,2011;1:161—171

[4]王炳兴.Burr Type XII分布的统计推断.数学物理学报,2008;28A(6):1103—1108

[5] Kundu D.,Hatem H.Bayesian inference and prediction of the inverseWeibull distribution for Type-II censored data.Computational Statis-tics and Data Analysis.2010;54:1547—1558

[6]王琪,阳连武.对称熵损失函数下一类分布族参数的Bayes估计.科学技术与工程,2011;11(22):5241—5243

[7]王亮,师义民.逐步增加II型截尾下比率危险率模型的可靠性分析.数理统计与管理,2011;30(2):315—321

[8]任海平.熵损失函数下一类广义分布族参数估计的容许性.西北师范大学学报(自然科学版),2010;46(6):19—22

Bayes法 篇6

为此,我们给出今天介绍的内容:《概率论》中的基本公式———全概率公式与Bayes公式.

一、准备知识:设A、B是随机试验E的两个随机事件

1.条件概率公式 :

2.乘法公式 :

二、全概率公式与Bayes公式:设Ω是随机试验E的样本空间

1.定 义 :若E的 事件组A1,A2,…,An满足

则称事件组A1,A2, … ,An为Ω的一个划分 (或完备事件组).

2.公 式 :设B是 随机试验E中 的任一事件 ,A1,A2,… ,An是Ω的完备事件组,P(Ai)>0(i=1,2,…,n).

(1)全概率公式:

(2)Bayes公式:P(B)>0

例 :设某批产 品中 ,甲、乙、丙三 厂生产的 产品分别 占45%,35%,20%,各厂产品的次品率分别为4% ,2% ,5% , 现从中任取一件,

(1)求取到的是次品的概率;

(2)经验证发现取到的产品是次品 ,求该产品是甲厂生产的概率.

解:设事件:

A1={该产品是甲厂生产的},A2={该产品是乙厂生产的}

A3={该产品是丙厂生产的},B={该产品是次品}

则A1,A2,A3为一个完备事件组,且已知:

P(A1)=45%,P(A2)=35%,P(A3)=20%

P(B|A1)=4%,P(B|A2)=2%,P(B|A3)=5%

(1)由全概率公式有:

(2)由Bayes公式有:

三、小结

1.完备事件组就是任一事件发生的情况 、原 因或途径 ;

2.运用全概率公式与Bayes公式的关键是找出一个完备事件组;

Bayes法 篇7

1 主观Bayes方法

主观Bayes方法又称主观概率论, 是杜达 (R.O.Duda) 等人在1976年提出的, 是一种不确定性推理模型, 又称为主观概率论。成功的应用在了地矿勘探专家系统PROS-PECTOR中。这一方法在文献[2, 3]有详细的描述。

(1) 结论不确定性的合成算法思想。

(2) 假设有n条知识都支持同一个结论H, 而且这些知识都分别是相互独立的证据Ei (i=1, 2, …, n) , 且每个证据对应的观察分别是Si (i=1, 2, …, n) 。在此情况下求P (H/S1, S2, …, Sn) 的后验概率的方法如下。

先分别对每条知识求出H的后验几率, 然后在用如下公式求出所有观察下的后验几率:

(2) 结论不确定性的更新算法思想:如果n条知识都支持同一个结论, 先用第一条规则对结论的先验概率进行更新, 再将得到的更新概率作为第二条规则的先验概率再对结论进行更新, 依次类推, 直到所有的规则都更新使用完。设LSi (i=1, 2, …, n) 表示第i条规则成立的充分性, 用于指出证据Ei对结论H为真的支持程度, 而LNi (i=1, 2, …, n) 表示第i条规则成立的必要性, 用于指出证据Ei对结论H为真的必要性程度。P (H) 表示结论H的先验概率。那么, 用如下公式求出结论H的后验概率P (H/S1, S2, …, Sn) :

2 结论不确定性的算法设计

在主观Bayes方法中涉及到了知识的充分性量度LS和必要性量度LN, 因此, 在设计算法中, 我将知识作为一个对象处理, 且知识包含两个属性 (LS, LN) , 即充分性量度LS和必要性量度LN。对于推理过程, 如图1所示。

求后验几率的算法设计:

算法中, ClassE类包含LS和LN属性, 度量产生式规则的不确定性。参数p表示结论H的先验概率P (H) , 参数e表示单条知识ClassE类的对象, 算法结果返回证据E出现时将结论H的先验概率, P (H) 更新为后验几率O (H/E) , 在算法中还应用到了将概率转化为几率的算法, 此算法有概率与几率的关系可设计一重载方法为:

算法中参数p表示概率, 算法结果返回几率函数值。

2.1 结论不确定性的合成算法

关于结论不确定性的合成算法, 可先对每条知识分别求出后验几率, 再由公式 (1) 、 (2) 进行算法设计:

算法中参数n表示n条知识都支持相同的结论的集合, 参数p表示知识对结论H的先验概率P (H) , 参数e表示一条知识对象, 算法结果综合每条知识的合成算法的后验概率值。

2.2 结论不确定性的更新算法

结论不确定性的更新算法思想, 设计流程图如图2所示。

详细算法代码设计如下:

算法中参数n表示n条知识都支持相同的结论的集合, 参数p表示知识对结论H的先验概率P (H) , 参数e表示一条知识对象, 算法结果返回更新后的后验概率值。

3 主观Bayes方法算法求解结果

应用上述Java算法, 首先读取文本文件“Reliability_knowledge_data.txt”的数据, 文本文件如图3所示。

结果如图4所示。

在误差允许的范围内, 两种方法得到的结果是一致的。

4 结论

本文根据知识不确定性推理的主观Bayes方法的求解思想, 设计了基于主观Bayes方法的不确定性推理的合成与更新算法, 并在Java平台上实现了这一算法。从实验结果来看, 我们的算法结果正确, 两种算法的结果一致, 实现了不确定推理问题求解的自动化。

参考文献

[1]石纯一, 黄昌宁, 王家廞.人工智能原理[M].北京:清华大学出版社, 1993.

[2]张仰森, 黄改娟.人工智能实用教程[M].北京:北京希望电子出版社, 2002.

[3]王万森.人工智能原理及其应用[M].2版.北京:电子工业出版社, 2007.

[4]刘玉凤.Bayes概率在不确定性方法中的应用[J].辽宁教育学院学报, 2002 (9) :1-2.

【Bayes法】推荐阅读:

上一篇:蜂鸣营销下一篇:腹腔镜联合不同药物

本站热搜

    相关推荐