诊断贝叶斯网络

2024-08-22

诊断贝叶斯网络(通用9篇)

诊断贝叶斯网络 篇1

0 引言

信息化的迅速发展使得网络的规模和复杂度都在迅速的增大,网络管理的智能化成为迫切的需要。SNMP网络管理模型由于简单,易于实现等优点得到了广泛的使用。研究基于SNMP网络管理模型的网络管理具有实际而重要的意义。在网络故障管理方面,基本方法是接受SNMP-Trap的告警信息来确定网络的故障问题。但是由于网络的复杂性,一个故障可能会引起很多的告警,如何对这些告警信息进行处理,提供给网络管理员简单有效的提醒是一个值得研究的问题。

传统的告警产生方式是为MIB变量设置一个阈值,当超过阈值时,即产生报警,但是网络的动态特性使得阈值设置方法无法准确的反应网络的故障情况。国内外有很多工作利用统计方法对网络流量数据采用统计分析方法来判断是否异常,是否要产生告警。CS·Hood[1]通过分段把时间序列近似为段内平稳信号,然后又采用二元自回归模型拟合,对模型参数进行自适应性的GLR测试来判断流量是否异常。孙朝晖[2]等提出了用AAR模型来监测网络流量异常的方法,不需要对时间序列分片和单独拟合,可以直接处理获取的新数据,实现在线故障监测。本文参考该方法判断网络流量是否异常。文献[1]通过贝叶斯网络将监测到的MIB变量告警信息进行融合,最终通过路由器的异常情况给出对网络整体情况的预测。这种预测没有考虑到故障的传播特性等问题,也无法给网管员提供较为具体的故障信息。本文尝试先分别考虑各层协议的故障情况,然后再考虑低层协议对高层协议的影响。在此基础上,分层考虑故障在网络中的传播情况,依照网络的拓扑结构建构相应的贝叶斯网络。最后,对该模型进行了仿真,验证了方法的有效性。

1 网络管理协议SNMP

SNMP网络管理模型是为了管理TCP/IP网络提出来的,它的体系结构一般是非对称的,由管理站、代理、管理信息库(MIB)和通信协议SNMP构成。配置Manager实体的系统为管理站,配置Agent实体的系统被称为代理。管理站可以向代理下达操作命令访问代理所在系统的管理信息。

管理站和代理之间的共享管理信息由代理系统中的管理信息库MIB给出,各个代理系统中的被管对象的集合构成该系统的MIB。系统中所有的被管对象逻辑上被组织为一棵树,即MIB树。最基本和最重要的MIB的实例是MIB-Ⅱ,它分为11个组,除了cmot和dot3是预留外,其余9个组都有了定义,每个组描述系统的一个方面的信息。比如IP组,它包含IP协议中的各种参数信息,例如,有关IP层流量的一些计数器。如果IP协议的在运行中出现了故障,则会体现在相应的MIB变量中。可以根据MIB变量和协议之间的这种关系构建贝叶斯网络监测网络中某层的运行情况。

2 贝叶斯网络

贝叶斯网是一种系统地描述随机变量之间关系的语言。构造贝叶斯网的主要目的是进行概率推理,即计算一些事件发生的概率。要在一些随机变量之间进行推理,理论上只需要一个联合概率分布即可,但是联合概率分布的复杂度相对于变量个数成指数增长,所以当变量众多时不可行。贝叶斯网把概率分布分解成一系列相对简单的模块,大大降低了知识获取的难度和概率推理的复杂度,使得人们可以把概率论应用于大型问题[3]。

在贝叶斯网中,节点代表变量,节点之间的有向边代表两变量之间的条件概率关系。每个节点都附有一个概率分布,对于根节点X所附的是它的边缘分布,而非根节点所附的是条件概率分布P(X|π(X))。其中π(X),表示X的父节点。

贝叶斯网是联合概率分布的分解的一种表示。具体地,假设贝叶斯网络N中的变量为X1……Xn,那么把各变量所附的概率分布相乘就得到联合分布,即

如果把每个概率分布作为一个函数,用F表示N中所有概率分布函数的集合。在此类问题中,已知变量通常称为证据变量;需要计算其后验概率分布的变量称为查询变量。假设观测到了证据E=e,在F的各函数中,将各证据变量设为它们的观测值,得到另一组函数,记之为F′,则将这些函数相乘,即得P(Y,E=e),其中Y=XE,表示除去E之后X集合中剩余的变量。

设Q是所关心的查询变量的集合。从F′中逐个消去所有在Y中但不在Q中的变量,得到另一个函数集合,记之为F″,将F″的各函数相乘,可得P(Q,E=e),按照条件概率的定义,可进一步得到

其中P(E=e)=ΣQP(Q,E=e),这样就通过推理计算出所关心变量的后验概率。

如果构建了一个故障诊断的贝叶斯网络,那么这个问题就是,根据可以观察到的故障现象的取值,去计算关心但是无法直接观测到的部分故障的后验概率。

3 分层故障定位模型

本文以SNMP系统的MIB变量为基础构建了一个4层的故障诊断模型。数据处理部分对MIB数据采用自适应自回归模型处理,根据自回归模型参数的变化来判断是否产生了异常,进行MIB级别的告警。然后将MIB状态输入到协议故障判断部分,通过协议和MIB之间的贝叶斯网判断协议功能是否正常。将协议状态输入到协议间故障定位模块,通过不同协议之间构建的贝叶斯网推理故障的根源协议。在此基础上,确定了节点在某协议上的状态后,根据网络的拓扑结构,推理问题的根源在哪个节点上。模型结构图图1所示。

4 MIB变量特征提取

MIB变量大致可以分为两类,第一类就是在一定时间内不会改变的量,比如ipForwarding,表示是否作为IP网关。另一类是随时间动态改变的,比如IPInAddrErrors,它是一个计数器类型的变量,表示由于IP地址错被丢弃的输入数据报总数。

对于第一类而言,判断其异常与否只需要根据变量的值直接判断即可。比如ifOperStatus表示当前的接口状态(up(1),down(2),testing(3)),直接根据其值即可知道当前其状态是否异常。

对于第二类而言,则需要通过统计分析的方式去提取特征,才能做出判断。本文采用自适应自回归模型(AAR)来分析网络流量数据[2],进行MIB变量级异常检测。

对MIB变量M进行时间间隔为Δt的采样,获得的时间序列SM(N,Δt)是元素xi(i∈[1,N])的时间偏序集,N为序列长度。为任意序列定义p阶AAR模型,即

式中,ei是数学期望为0、方差为σe2的网络流量白噪声;i是当前样本序号。假定当前处在时刻t,那么因此参数aj是时间的函数。根据流量序列可以计算出相应的参数序列,减弱网络噪声的影响,用这个相对稳定的序列可描述流量序列的特性。定义t时刻的样本对应的AAR参数向量为

与式(3)对应,定义MIB变量M的样本构成向量为

采用时间序列SM(N,Δt)的观测样本拟合AAR模型,并通过其参数向量来描述系统特性的变化。时间序列SM(N,Δt)的样本i的噪声估计为

根据kalman过滤,相应的前馈向量为

此处T(i-1)表示样本(i-1)的相关矩阵,是一个p阶方阵,UC是更新系数,样本对应的AAR参数向量的估算值为

样本i的相关矩阵为

用上述几式构成的迭代算法即可拟合AAR模型,迭代过程可以在线完成。

向量A(i)表达了流量数据的状态变化,通过对其求二阶差分来反映其变化趋势,然后为了消除流量白噪声引起的尖峰,再使用时间平均法对差分结果进行平滑,最后可以根据序列值的变化来判断网络是否发生了变化。

5 节点贝叶斯网络建模

SNMP管理系统的管理站通过代理获得网络中各个节点的MIB信息(这里的节点是网络中配备有代理的主机,交换机,路由器等的统称)。在对MIB变量进行特征提取之后,已经可以进行MIB级的异常告警了,但是MIB所描述的信息仍具有很大的局限性,不能说明它所表示的协议层的功能正常情况,更难以说明整个网络的运行情况。贝叶斯网络能够通过概率关系描述各个MIB变量和其上层的协议之间的关系,并能根据已有的网络的先验概率和证据信息推理所关心节点的后验概率,适合于将多个MIB变量因素融合,获得一个协议层级的功能情况描述。

选网络接口层(MIB-II中的IF组)为例,其功能实现会影响相应组的MIB变量,因此可以以MIB树的结构作为贝叶斯网络的结构[1],如图2所示,而各个MIB变量之间的关系可以认为是近似相对独立的,这就符合了朴素贝叶斯网络的结构特点,由于其结构简单,可以使用多项式复杂度的Pearl信念传播算法,使得计算复杂度大大降低。

在通过MIB变量获得各协议的功能情况之后,考虑计算机网络按协议分层的特点,各层之间并不是完全独立的,每一层故障情况不仅依赖于本层功能的实现,还依赖于下一层所提供的服务,图3为计算机网络协议关系图。结合各协议之间的依赖关系,可以构造出节点层级的贝叶斯故障诊断模型[4]。层之间的的故障传播一般是低层影响高层,比如,网络接口层如果某个接口down,则IP层的数据报就无法到达,运输层的功能也就无从实现。考虑IF,IP,UDP三种协议之间的故障传播关系,可以构建出图4所示的贝叶斯网。通过协议之间的贝叶斯网络,可以对故障根源的协议层进行推理。

6 基于网络拓扑的贝叶斯网络

在考虑单个节点的故障定位问题的时候,考虑了故障在不同协议之间的传播关系,并没有考虑到故障在网络各节点间的传播问题。考虑图5所示通过路由器R连接到互连网的常见拓扑结构的网络。网络中的故障传播方向多数是从路由器到交换机,从交换机到主机,主机H1出现故障是由两种原因决定的,第一是其本身出现了故障,其二即上一层故障传播到主机H1。这样,对其构造故障传播图即先将网络拓扑转化为贝叶斯网络,然后再在除路由器R之外的每个节点上加一个表示本身故障的节点并指向该节点,如图6所示。由于路由器是网络层的中继,并没有运输层和应用层,这种依据网络拓扑构建的贝叶斯网络只适合于网络接口层和网际层。

上述建立的贝叶斯网络中,根节点的先验概率和有向边的条件概率可以根据历史数据统计获得,或者根据专家经验估计。在此基础上,还可以根据EM算法学习、更新网络参数。

7 实验仿真

采用MATLAB贝叶斯网络工具箱对本文中构建的几种贝叶斯网络进行了仿真实验。根据MIB树的结构,首先构建了如图2所示的两层的树状贝叶斯网络。根节点设为F,子节点为Mi,网络根节点的先验概率根据经验设为P(F)=[0.9 0.1],当F故障时的条件概率P(Mi=1|F=1)(i=1,2,…,n)在[0.75,1]之间服从均匀分布。先设定F=1,即F出故障,获得M1到Mn的故障概率。对Mi,生成一个[0,1]间服从均匀分布的随机数,如果小于其故障概率,则将Mi的状态设为1,即出现故障。在获得M1到Mn各节点的状态之后,将之作为观测结果,计算F节点的出现故障的概率。如果P(F=1|all M)>0.5,则认为F诊断结果为F出现故障。通过随机产生条件概率产生10种不同的贝叶斯网,对每个贝叶斯网选取不同MIB变量个数,每种情况仿真200次。计算平均故障诊断率如下图7所示。

节点级的贝叶斯网络和网络级贝叶斯网络的拓扑会随着选取协议的变化而不断变化,此处针对图5所示贝叶斯网络进行仿真。根节点故障概率设为0.1,条件概率设置如下表1所示。首先设置故障集R0,由R0产生一组可观察节点的征兆集S0,根据S0通过贝叶斯网络来推理,以表2所示几种故障情况为例,每种情况仿真500次,故障诊断正确率如表2所示。

8 结论

本文以广泛应用的SNMP网络管理模型为基础,首先构建了针对单个网络节点的分层的故障监测模型,然后考虑各层之间的故障传播关系,实现针对节点的故障根源定位,再考虑到故障在网络节点之间的传播模型,提出了依据网络的拓扑结构再对网络故障根源定位的贝叶斯网络模型。由于SNMP网管系统适用于各种异构网络,所以这种贝叶斯网络能适用于各种网络。

本文提出的贝叶斯网络可以应用更多的MIB组,考虑更多的协议进行推理。还可以拓展到更大型的网络,为骨干网络管理提供参考。而且,模型的尺度可以也可以更加精细。比如在构建基于网络拓扑的故障定位模型时,还有很多影响因素可以考虑。另外,文中考虑的网络拓扑比较简单,对于更加复杂的网络拓扑,故障传播情况更为复杂,还需要进一步研究。

摘要:本文以SNMP网络管理模型的管理信息库(MIB)为基础,在不同层次上构建了用于故障判别与定位的贝叶斯网络。对MIB变量采用自适应自回归(AAR)模型建模分析,构建与其相关协议之间的贝叶斯网络,推断协议功能是否发生异常。分析各个协议之间的功能依赖关系,构建协议间的贝叶斯网络,定位协议间的故障根源。考虑网络中故障传播构建了基于网络拓扑的贝叶斯网,定位故障根源节点。最后,对构建的模型进行了实验仿真,并分析了模型的优点和缺点。

关键词:网络故障,故障定位,贝叶斯网络

参考文献

[1]H ood C J.Proactive network fault detection[A].Sixteenth annual Joint Conference of the IEEE Computer and Communications Societies,Kobe,Japan,1997

[2]孙朝晖,张德运,孙钦东.异构网络环境中的自适应在线故障检测[J].西安交通大学学报,2004,38(4):409.

[3]张连文,郭海鹏.贝叶斯网引论[M].北京:科学出版社2006:85.

[4]谭林,胡谷雨,胥光辉,等.基于贝叶斯网络的计算机端到端服务故障诊断[J].海军工程大学学报,2005,17(5):5.

[5]郭军.网络管理[M].北京:北京邮电大学出版社,2007:105

[6]谢希仁.计算机网络[M].第四版.大连:大连理工出版,2004:29

诊断贝叶斯网络 篇2

基于贝叶斯网络的飞机易损性评估方法

文中介绍了贝叶斯网络的.基本知识以及结点概率的计算方法,提出了飞机易损性评估的贝叶斯网络方法,并建立了基于某型飞机模型的易损性评估的贝叶斯网络模型,最后通过算例证明了该方法的合理性.

作 者:范俊 李曙林 王怀威 侯满义 FAN Jun LI Shu-lin WANG Huai-wei HOU Man-yi 作者单位:空军工程大学工程学院,西安,710038刊 名:弹箭与制导学报 PKU英文刊名:JOURNAL OF PROJECTILES, ROCKETS, MISSILES AND GUIDANCE年,卷(期):27(1)分类号:V214.1关键词:贝叶斯网络 飞机易损性 易损性评估

贝叶斯网络推理的研究与分析 篇3

关键词:贝叶斯网络;贝叶斯网络推理;概率推理

中图分类号:TP18 文献标识码:A文章编号:1009-3044(2007)15-30834-02

Research and Analysis of Bayesian Networks Inference

HUANG Jian-ming1,FANG Jiao-li1,ZHAO Bo2

(1.Computer Center,Kunming University of Science and Technology,Kunming 650093,China;2.Yunnan Nationalities University,Kunming 650031,China)

Abstract:Bayesian networks is a powerful tool to uncertain knowledge representation and reasoning in Artificial Intelligence。This thesis gives a introduction to the concept of Bayesian networks,and gives one example,the method and process is presented to Bayesian networks inference。

Key words:Bayesian ntworks;Bayesian networks inference;Probability inference

1 引言

贝叶斯网络是一种有向无环图(DAG),由Pearl于1988年提出的一种基于概率论和图论的不确定知识表示和推理模型。它具有坚实的理论基础,知识结构的自然表达方式,灵活的推理能力,方便的决策机制。随着研究的逐渐成熟,贝叶斯网络已被广泛应用在医疗诊断、数据挖掘、模式识别、决策支持等领域。目前贝叶斯网络的研究热点主要集中在结构学习、推理和应用三个方面。

2 贝叶斯网络

贝叶斯网是每个结点都带有一张概率表的有向无环图(DAG),在贝叶斯网中,结点表示问题域中的随机变量,弧表示这些变量之间的条件依赖关系。每一个结点都包含一张概率表,把各结点和它的直接父结点关联起来。

定义:贝叶斯网络是一个有向无环图,它可以表示为一个三元组(N,E,P)。N是一组结点的集合,N={x1,x2,…,xn},每一个结点代表一个变量(属性)。E是一组有向边的集合,E={|xi≠xj并且xi,xj∈N}。每一条边表示变量xi,xj具有因果关系(xi是xj的因,xj是xi的果)。P是一组条件概率的集合,P={p(xi|πi)|p(xi|πi)}表示xi的父亲们πi对xi的影响,p(xi|πi)表示给定条件πi,xi发生概率}。

定理:一个贝叶斯网络表示的联合概率函数p=(x1,x2,…,xn)定义为:(假设贝叶斯网有n个结点)p=(x1,x2,…,xn)=■p(xi|πi),其中πi为xi的父亲结点的集合。P=(x1,x2,…,xn)表示事件x1,x2,…,xn同时发生的概率。

图1是一个简单的贝叶斯网,表示下雪、堵车、摔交、迟到、骨折之间的关系。它表示的联合概率函数为:

p(a,b,c,d,e)=p(a)p(b|a)p(c|a)p(d|b,c)p(e|c)

贝叶斯网络中的一个结点,如果它的父结点已知,则它条件独立于它的所有非后代结点。图1中,给定C,则E条件独立于A,B,D。

除了条件独立性外,每个结点还关联一个概率表。

(1)如果结点X没有父结点,则表中只包含先验概率P(X)。

(2)如果结点X只有一个父结点Y,则表中包含条件概率P(X|Y)。

(3)如果结点X有多个父结点{Y1,Y2,...,Yk},则表中包含条件概率P(X|Y1,Y2,...,Yk)。

图1 一个简单的贝叶斯网络

3 贝叶斯网络的推理

贝叶斯网的推理是在给定的网络结构和已知证据下,计算某一事件发生的概率。贝叶斯网络推理有两种推理模式,即因果推理(由上向下)和诊断推理(自底向上)。因果是给出一些特征,来预测可能发生的情况;而诊断是指己知发生的事件,去探索发生该事件的可能原因。根据不同的推理目标,贝叶斯网推理有四种推理任务: 信度计算与更新(Belief Updating),最大后验假设(Most Aposterior Hypothesis),最可能解释(Most Probable Explanation),期望有利度最大(Maximize the Expected Utility of Problem)。

贝叶斯网的推理方法可分为两类:一类称为精确推理,即精确地计算假设变量的后验概率。另一类称为近似推理,即在不影响推理正确性的前提下,通过适当降低推理精度来达到提高计算效率的目的。精确推理一般用于结构简单的贝叶斯网推理。对于结点数量大、结构复杂的贝叶斯网,精确推理的复杂性会很高,因此常采用近似推理。

精确推理完全按着概率基本公式对查询给以回答,当前的一些精确算法是有效的,能够解决现实中的大部分问题,然而受知识的认知程度所限,精确推理算法中还面临着很多问题需要解决,其中网络的拓扑结构是影响推理复杂性的主要原因。比较典型的精确推理算法有:基于Poly Tree Propagation的算法,基于Clique Tree Propagation的算法,Graph Reduction方法,基于组合优化问题的求解方法(SPI)。

理论上,精确推理能够满足任何推理任务,然而随着网络规模的扩张,精确推理的时间是难以预测的。同时,网络拓扑结构的一个微小变动可能使相对简单的问题变得相当复杂,所以研究近似的推理算法成为一个相当活跃的领域,然而就算法复杂性而言,精确推理和近似推理都是NP问题,但近似推理算法确实可以解决一些精确推理无法解决的问题。近似推理方法在运行时间和推理精度之间采取了一些折中,力求在较短的时间内给出一个满足精度的解。近似推理算法主要有:随机仿真法(Stochastic Sampling),基于搜索的近似算法(Search-based),模型简化方法(Model Simplification)和循环信度传递方法(Loopy Propagation)。

3 一个贝叶斯网络推理的实例

图2是对心脏病或心口痛患者建模的贝叶斯网络。假设图中每个变量都是两个值。心脏病结点(HD)的父结点为影响该疾病的危险因素,有锻炼(E)和饮食(D)等。心脏病结点(HD)的子结点对应该疾病的症状,如胸痛(CP)和高血压(BP)等。而心口痛(h)可能源于不健康的饮食,同时又可能导致胸痛。

图2 发现心脏病和心口痛病人的贝叶斯网络

根据图2,讨论不同情况下,如何诊断一个人是否患有心脏病。

(1)没有先验信息

可通过计算P(HD=Yes)来判断一个人是否患心脏病。设α∈{Yes,No}表示锻炼情况的两个值,β∈{健康,不健康}表示饮食的两个值。

即此人得心脏病的可能性为49%。而P(HD=No)=1-P(HD=Yes)=0.51。

(2)患高血压的情况下

如果一个人有高血压,可计算P(HD=Yes|BP=高)来诊断他是否患心脏病。首先,应先计算P(BP=高)。

P(BP=高)=■P(BP=高|HD=γ)P(HD=γ)=0.85×0.49+0.2×0.51=0.5185

其中,γ∈{Yes,No}。所以,此人患心脏病的概率为:

因此,当他患有高血压时,患心脏病的概率为80.33%。相应地,P(HD=No|BP=|高) 1-0.8033=0.1967。

(3)患高血压、饮食健康、经常锻炼身体的情况下

此人患心脏病的概率为:

即在此情况下,他患心脏病的概率为58.62%。

4 结束语

贝叶斯网络是人工智能中不确定知识表示和推理的有力工具,而贝叶斯网络的推理和贝叶斯网络的学习、贝叶斯网络的应用都是贝叶斯网络当前研究的热点。本文给出了贝叶斯网络的定义,并结合实例,介绍了贝叶斯网络推理的方法和过程。

参考文献:

[1]Pear J.Probalilistic reasoning in intelligent systems:Networks of plausible inference.San Mateo:Morgan Kaufmann Publishers,1988.

[2]Nils J.Nilsson(美).人工智能[M].郑扣根,庄越挺,译.北京:机械工业出版社,2005:197-224.

[3]Pang-Ning Tan Michael Steinbach Vipin Kumar(美),范明,范宏建,译.数据挖掘导论[M].北京:人民邮电出版社,2006:139—150.

[4]刘启元,张聪,沈一栋.信度网推理-方法和问题[J].计算机科学,2001,28(1):74-77.

诊断贝叶斯网络 篇4

机械设备预知维护与故障诊断是提高制造业运营管理水平和生产效率的有效手段[1]。但由于对设备维护诊断机理的认识不充分,往往会产生大量不确定性因素[2],主要表现在:①诊断知识的来源与结构各异,既有实时监测运行数据,也有根据经验得出的设备运行状态主观判断;②故障的划分边界比较模糊,导致故障征兆定义以及诊断行为建模存在一定程度的模糊性与随意性;③复杂动态诊断维护环境本身存在不可预知性,使得由故障征兆推断故障成因的反向推理成为一种不确定性的过程。如何减小上述不确定性因素的影响是机械设备维护与诊断过程中亟需研究解决的重要问题。

基于本体的智能诊断技术可以减小设备维护诊断过程中不确定性因素影响,其重要基础是维护诊断知识的表示。本体已广泛应用于制造领域中的产品生命周期管理[3]、制造过程管理[4]、产品知识集成[5]等方面,而基于本体的制造过程语义模型通过对诊断行为、工况状态和维护决策等进行建模,实现了协同制造环境下的维护诊断知识共享[6]。但这些应用忽略了本体自身逻辑推理的局限性,模型推理能力仅限于本体语义规则推理,很难进一步对故障原因做出恰当的推理解释。

作为一种不确定性建模与推理工具,贝叶斯网络(Bayesian networks,BNs)可以实现设备维护决策与故障机理分析过程中的诊断推理[7,8]。Gilabert等[9]利用BNs来解决预知维护过程中的不确定性,但诊断维护经验以先验概率的形式表示,设备状态与故障征兆之间的映射对先验概率依赖性很强。姜万录等[10]引入贝叶斯参数估计算法进行了多特征信息融合,然后通过最大后验概率估计值的计算进行故障识别,但诊断结构模型定义不清晰,诊断过程知识缺乏合理的表达形式。

本文将基于本体的维护诊断知识表示与BNs概率推理方法相结合,构建了基于本体的故障诊断贝叶斯网络(ontology-based diagnostic Bayesian networks,OntoDBN)。OntoDBN对诊断语义模型进行概率扩展,实现了诊断贝叶斯网络的概率推理。针对故障知识、诊断证据以及维护诊断过程的不确定性,重点研究了设备工况状态识别与故障成因概率推理算法,根据算法产生的可能故障的概率解释,制订出相应的维修方案和决策。

1 OntoDBN的体系结构

基于诊断知识表达、故障成因分析、因果关系推理等方面不确定性因素的分析,结合本体论与贝叶斯网络,本文提出以本体语义为基础的故障诊断贝叶斯网络模型,其体系结构如图1所示。图中本体语义模型包括状态层、征兆层、故障层和决策层,分别对应了从数据到智能的4个知识加工层次,涵盖了工况识别、特征提取、模式分类以及维护决策等基本诊断步骤所涉及的数据信息;BNs推理引擎以概率形式逐步给出各个层次的诊断实体主观信度,构建出完整的故障诊断贝叶斯网络模型。此外,在保持诊断语义模型及其描述逻辑兼容性的前提下,OntoDBN对本体模型中的关键概念及关系进行扩展,以支持后续的故障概率推理。

贝叶斯网络是由一些节点与有向边组成的有向无环图(directed acyclic graph,DAG),其中,节点代表不同的随机变量或事件,有向边表示这些变量之间的直接因果关联或概率相关性[11]。节点及其直接前驱的条件概率分布与前驱节点的先验概率组成了条件概率表(conditional probability table,CPT)。对维护诊断过程进行BNs建模时,利用随机变量表示维护诊断实体、状态或事件,如Fi表示某个机械部件发生故障的事件;再利用有向边来表示状态或事件之间的依赖关系,如P(Fi|Si)表示故障征兆Si出现时故障Fi发生的概率值。在Markovian假设下,故障向量F=(F1, F2, …, Fn)的联合概率分布为Ρ(F)=iΡ(Fi|Si)。一旦获得了联合概率分布P(F),就可以完成随机变量空间内任意变量的概率推理[11]。OntoDBN推理引擎主要利用贝叶斯分类器与概率推理进行故障分析,其中,异常状态识别区分出工况状态中的异常特征(即故障征兆),而故障模式识别是由故障征兆推理获得故障成因的概率解释。

OntoDBN使用本体作为故障知识的表示形式,通过增加本体语义并添加概率信息,将带有概率信息的故障本体转换为贝叶斯网络,以贝叶斯网络作为底层推理机制,实现对故障诊断知识的不确定性推理研究。将本体语义描述和贝叶斯网络概率推理相结合,既实现了诊断领域知识的形式化描述与共享,又能在一定程度上消除诊断过程中不确定性因素的影响。

2 设备维护与故障诊断本体

设备维护与故障诊断涉及设备制造、投运到最终报废的整个过程,关键维护与诊断要素隐藏于海量的生产环境信息流中。因此,首先要过滤这些异构多源的信息并使信息结构化和形式化,然后从多方面扩展设备维护与故障诊断方法,在有效地获取、使用并存储语义知识的基础上建立一个可靠、完备的维护诊断知识本体模型。

2.1 维护诊断本体建模

本体建模的首要任务是理清应用领域中的核心概念,并针对应用实体与行为构造出可扩展的语义模型(即核心本体)。核心本体是定义维护对象、诊断行为、实体关系及维护方法论的顶层本体,且独立于任何特定设备或应用。OntoDBN核心本体包括设备域本体、过程域本体和诊断域本体,见图2。

(1)设备域本体用于描述维护诊断对象实体的功能、结构和依存关系,依照类别、设备、部件、特征4个层次对设备实体进行信息分解,Component和Characterization为设备域本体的核心类(图2中使用灰色标识的类)。

(2)过程域本体是维护过程的知识表示,包括维护行为、工况状态(Condion)、过程步骤(ProcessStep)及测试方法等。过程域本体一方面要与设备域本体建立联系,另一方面还关联到后续的诊断分析与维护决策。

(3)作为故障诊断和维护决策知识的语义描述,诊断域本体给出了设备动态性能的变化规律和故障征兆的识别方法。设备故障(Fault)及其征兆(Symptom)是诊断域本体的核心概念。故障征兆本质上是设备运行状态的另一种表现形式,可划分为数值型征兆(NumericSym)、语义型征兆(DescriptiveSym)和图形征兆(GraphicSym)三类。

2.2 维护诊断本体的概率扩展

为了实现故障的概率推理,需要对OntoDBN核心本体进行概率扩展,在本体实例中加入概率信息。在OntoDBN核心本体模型基础上,实现本体结构向BNs结构的转换,具体包括:本体概念与BNs节点的转换、本体关系与BNs有向边的转换、属性值的转换以及建立合适的CPT。诊断的本质是故障模式识别,因此可以从设备状态、故障征兆以及故障本身的相互关系出发,全面考虑维护诊断过程中涉及的相关因素,建立围绕状态、征兆、故障三者的BNs概率基本模型,见图3。

故障诊断过程中,先要进行设备异常状态的识别(如图3中的转换②),识别的结果表示为故障征兆;而设备的正常运行状态或数据与故障征兆同样重要,故障推理的过程可能会需要参考设备正常运行时的状态数据(如图3中的有向边①);故障模式识别则涉及故障征兆与故障成因的概率推理(如图3中的③)。因此,OntoDBN诊断推理可以分为两个紧密相连的步骤:其一,使用Bayes决策方法从设备运行状态数据中找出异常状态(即故障征兆);其二,根据设备状态或特征值、故障征兆的概率推理出故障发生的概率。此外,诊断过程中的其他相关信息也需要以恰当的方式在诊断知识模型中表现出来,如维护人员与诊断专家的经验、设备运行历史状态等。以下给出了OntoDBN故障本体及其属性集的定义。

定义1OntoDBN故障本体OF={F, I, PF, finst},其中,F为故障类集合,I为故障实例集合,PF为属性集,finst为故障类实例化函数:F→2I

定义2 属性集PF={hasCause, hasCondition, hasSym, isObserved, hasPriorPr, hasCondPr}。其中,hasCause表示故障原因,hasCondition表示故障发生时设备的运行状态,hasSym表示故障征兆,isObserved表示故障是否被观察到。先验概率与条件概率是表示BNs节点不确定性程度的重要特征,这里我们利用了本体实例的属性hasPriorPr和hasCondPr来分别表示这两种概率值。例如,S表示故障征兆“润滑油温度超限”,F表示“减速箱齿轮故障”,那么P(S=true)=0.7可表示为

<Context rdf:ID=" Oil_temp_exceed">

<hasPriorPr rdf:datatype="&xsd;float">

0.7</hasPriorPr>

<hasConditionrdf:datatype="&xsd;boolean">

true</ hasCondition >

<hasSym rdf:resource="# Oil_temp_exceed_threshold"/>

</Context>

而条件概率P(F=true|S=true)=0.9可表示为

<Decision rdf:ID="Gear_fault_ in_reducer">

<hasCondition>

<Context rdf:ID="Oil_temp_exceed">

<hasCondition rdf:datatype="&xsd;boolean">

true</ hasCondition>

</Context>

</hasCondition>

< hasCondition rdf:datatype="&xsd;boolean">

true</ hasCondition>

<hasCondiPr rdf:datatype="&xsd;float">0.9</hasCondiPr>

<hasCause rdf:resource="#Oil_temp_greater_than_70"/>

</Decision>

3 OntoDBN的概率推理

贝叶斯网络概率推理问题分为三类:后验概率、最大后验假设(MAP)和最大可能解释(MPE)[11]。本文选取部分观测变量组成一个征兆集合,利用Bayes分类器进行工况异常状态识别,然后采用MPE方式通过概率推理计算出某种故障发生时相关的概率分布。

3.1 异常工况状态识别

故障诊断通常需要考虑目标设备在异常工况状态和正常工况状态下的运行趋势,因此正确区分工况正常与异常状态十分重要。某些情况下,由设备工况状态可以直接判定故障的发生(如转子出现断裂情形),而大部分工况状态需要利用各种数据采集设备获取运行数据,再进行数据分析来确定该状态是否为故障征兆。在OntoDBN本体模型中,异常工况状态识别实质上是设备工况状态空间到故障特征空间的本体映射。例如,转轴不平衡引起的振动是旋转机械的常见多发故障,一般需要实时监测转轴的振动频率以获取轴振动方向上的频谱特征,当设备出现异常且进行频谱分析时,这些振动特征量就表现为故障征兆。异常工况状态识别主要依靠设备运行状态类(Condition)、监测特征类(Characterization)、故障征兆类(Symptom)、设备部件类(Component)以及这些类之间的相互关联关系来完成。

根据先验知识对工况状态出现的概率(即先验概率)进行估计时,若设备工况状态空间Ωj=(ω1,ω2,…,ωi,…,ωc),其中ωi(i=1,2,…,c)表示状态空间的一个模式点,那么正常和异常工况状态可以分别用P(ω1)和P(ω2)表示,且P(ω1)+P(ω2)=1。再假定x是表示工况状态的离散随机变量,结合工况状态为ωix的概率分布函数P(x|ωi)和Bayes公式可以得出:

Ρ(ωi|x)=Ρ(x|ωi)Ρ(ωi)i=1cΡ(x|ωi)Ρ(ωi)(1)

设{α1,α2,…,αk}表示有限的k种可能判定行为集,风险函数λ(αi|ωj)表示工况状态为ωj时判定行为αi的风险,那么条件风险定义为

R(αi|x)=j=1cλ(αi|ωj)Ρ(ωj|x)(2)

根据Bayes决策规则,异常工况状态识别问题就是选取合适的异常状态判定行为αi,使得条件风险最小,即

α*=argminiR(αi|x)(3)

设工况状态特征向量x=(x1,x2,…,xd),为简化问题,我们仅考虑工况状态特征相互独立的情形,即针对独立的二值离散特征量进行分类。由于只考虑正常状态ω1和异常状态ω2两类模式,因此可以采用线性二分分类器[12]来判定工况状态,其判别函数为

g(x)=lnΡ(x|ω1)Ρ(x|ω2)+lnΡ(ω1)Ρ(ω2)=i=1dwixi+w0(4)

wi=lnpi(1-qi)qi(1-pi)w0=i=1dln1-pi1-qi+lnΡ(ω1)Ρ(ω2)

其中,piqi分别是设备处于正常状态ω1与异常状态ω2时(xi=1)的条件概率值。当g(x)>0时,工况状态判为ω1;否则判为ω2。

3.2 故障诊断概率推理算法

判定目标设备的正常与异常状态之后,就可以采用MPE推理方式进行故障概率分析,即根据已有证据找出所有可能的假设中后验概率最大的假设,即

argmaxΗFΡ(Η|C,S)(5)

其中,P(H|C,S)表示在给定设备运行状态C和故障征兆S的条件下,故障假设子集H中故障发生的概率。3.1节给出了故障征兆的判定方法(即工况异常状态识别),根据贝叶斯定理可知:

P(H|C,S)∝P(C,S|H)P(H) (6)

则式(5)可简化为

argmaxΗFΡ(C,S|Η)Ρ(Η)=argmaxΗFΡ(C|Η)Ρ(S|Η)Ρ(Η)(7)

式(6)中P(H)为H中故障发生的概率,P(C|H)和P(S|H)为H中故障出现时的工况状态和故障征兆的条件概率。设某种故障f的先验故障概率为P(f),且f∈{0,1},那么:

Ρ(Η)=fΗΡ(f)f(1-Ρ(f))(1-f)(8)

Ρ(C|Η)=cCΡ(c|Η)=xcC(1-Ρ(c))+(1-x)Ρ(c)(9)

Ρ(S|Η)=cSΡ(c|Η)=xcSΡ(c)+(1-x)(1-Ρ(c))(10)

其中,x=fΗ(1-Ρ(c|f)),表示故障假设H成立时,状态cH中故障f无关的概率。

尽管OntoDBN对贝叶斯网络结构进行了简化,但上述精确推理过程依然是NP-hard问题[13]。为了降低推理的复杂度,可以在每次推理循环中选择最有可能发生的故障(即故障信度值最大)加入故障假设子集,并删除该故障所对应的征兆。当故障征兆集为空时,就认为所有可能的故障都已加入故障假设子集中,此时退出推理循环并获得最大可能的故障解释。

4 应用实例分析

为了验证本文提出的OntoDBN模型,选取某化工企业凉水塔风机机组为诊断对象(图4),并以减速器振动位移、减速器润滑油温度和电机电流作为状态监测特征量。为了简化研究过程,不考虑风机的启停升降速状态,仅研究设备稳定运行过程中的故障诊断分析。

首先,借助Protégé本体建模工具[14]和本体描述语言OWL(web ontology language)建立OntoDBN诊断本体模型,实现OntoDBN诊断本体的主要类、数据属性、对象属性以及实例成员。本体结构与实例存储于关系数据库中,通过Jena[15]提供的应用编程接口进行访问。最后,采用贝叶斯网络开发环境GeNIe[16]实现故障诊断的概率推理计算。主要的推理过程包括风机故障征兆判定和可能故障的概率计算,分析结果用来指导后续的设备维护决策与实施。

4.1 风机故障征兆的判定

风机的主要部件包括叶片、转轴、减速器和电机,其中转轴故障是风机的多发故障。故障征兆的判定过程是在设备工况状态监测的基础上,根据专家及现场操作人员经验给出各类故障发生的主观信度。我们利用实时监测数据和式(4)所给出的征兆特征判决函数,可以区分出风机运行过程中出现的故障征兆,即某种工况状态属于故障征兆的主观判定。

以风机转轴工频振动为例,基频幅值增速过快一般视为转轴不平衡或热弯曲故障的征兆,那么可将实时监测到的转轴基频振动幅值作为工况特征量,根据预先设定阈值和二值特征线性分类器来判断该工况特征量是否属于故障征兆。例如,某化工企业4号凉水塔风机转轴的径向振动出现不断增长趋势,需要对设备状态进行诊断与评估。图5所示为4号风机基频幅值增速异常征兆的判定结果。根据最近15次监测到的转轴基频幅值变化,计算出工况状态ωi下幅值x的概率分布函数P(x|ωi),再由式(1)得出条件概率P(ωi|x),最后结合设备状况和专家经验划分出风机正常状态ω1和异常状态ω2。由图5可以看出,新观测到的证据A应视为基频幅值增速异常征兆。

4.2 风机故障概率的计算

诊断对象的异常征兆判定之后,正常工况状态和故障征兆以先验概率值的形式与设备故障联系起来,结合诊断对象常见故障的先验概率就可以进行故障概率推理计算。表1给出了风机常见故障与工况状态或征兆之间的部分概率关系。在OntoDBN故障推理过程中,先利用GeNIe建立诊断贝叶斯网络结构并导入表1中的概率值,然后输入实时状态监测数据作为推理证据,根据式(8)~式(10)计算出概率推理结果。除了判断最大可能发生的故障之外,还可以利用OntoDBN模型进行其他诊断或预测推理。例如某故障发生时,会出现哪些故障征兆以及这些征兆出现的可能性定量分析等。

图6给出了4号风机故障概率推理实例,由于篇幅原因,这里只列出了在设定证据前后“转子不平衡”与“转子弯曲”两种故障的推理结果。图6a表示在输入推理证据前各节点的先验概率和条件概率值,图6b则表示某次推理过程中输入证据之后目标节点的概率变化。由图6b可以看出,在诊断BNs中输入状态数据后,“转子不平衡”故障发生的概率较大(99%)。设备停机大修结果证明,设备状况与前述诊断分析结论一致,4号风机转轴由于设备老化及叶片结垢等原因而出现了不平衡量的增大,经过现场动平衡校验后,设备运转恢复正常。

5 结束语

为了减小设备维护与故障诊断过程中不确定性因素的影响,本文设计了一种本体驱动的诊断贝叶斯网络(OntoDBN),用于智能故障诊断应用中的知识表示与故障推理。OntoDBN包括诊断语义知识表示模型和故障诊断概率推理算法,用贝叶斯决策理论和概率精确推理方法对设备工况状态、故障征兆以及故障成因进行了定量分析。OntoDBN中的知识表示模型与概率推理算法相互关联且相对独立,在促进知识共享的同时提高了故障诊断推理效率。故障诊断概率推理过程还集成了专家的主观诊断经验,与设备运行状态证据相结合,共同完成基于概率的严格推理过程。某凉水塔风机的故障诊断实例分析表明,基于本体的故障诊断贝叶斯网络适用性较强,在一定程度上消解了故障诊断过程各种不确定性因素的影响。本文所采用的精确推理算法计算复杂度高,当诊断网络结构复杂且连接稠密时难以满足工程应用要求,因此,采用近似推理算法与本体模型结合的方式展开诊断贝叶斯网络研究是今后需进一步研究的重要问题。

诊断贝叶斯网络 篇5

电力变压器是电力系统中的重要设备,但由于变压器结构复杂,故障不确定因素很多,变压器故障的正确诊断很难,目前在我国,油中溶解气体分析DGA(Dissolved Gas Analysis)的三比值法(IEC标准)是对变压器进行故障诊断的最方便、有效的方法之一[1]。三比值法可以根据油中溶解气体分析结果,给出故障点的物理信息,将故障分为8类不同的放电性或过热性故障[2]。这种方法规则简明、故障机理判断明确,但对故障定位及制定维修策略缺乏指导性;同时,在现场应用中,也发现了不少问题,主要有缺编码、编码边界过于绝对等[3]。

针对这些不足,各种智能技术如模糊推理、人工神经网络等已被引入变压器的故障诊断中,并取得了较好的效果[4,5,6,7,8]。分析变压器故障产气的机理可知,单一类型的变压器故障与油中气体含量之间并没有明确的函数映射关系,气体含量之间的分布特性也很难推测[9]。能够体现概率模型相关性的表示方法的贝叶斯网络被认为是目前不确定知识表达和推理领域最有效的理论模型之一。文献[10]利用贝叶斯网络和DGA方法对变压器进行故障诊断,取得了明显的效果,但是最终只是把故障类型分为4类,且没有完成故障定位。本文基于贝叶斯网络理论和Ada Boost方法,针对DGA分析结果,提出了变压器故障诊断的组合贝叶斯网络方法。

1 Ada Boost方法与贝叶斯网络简介

1.1 Ada Boost方法

Ada Boost方法是目前组合分类器boosting方法中采用比较多的方法[11]。Ada Boost M1是其中的一个应用比较广泛的算法,该算法有一个学习器作为基分类器,boosting过程重复迭代调用学习器若干次,在每次迭代过程中改变训练集上的分布。在第1次迭代时,训练集上每条实例的权值都一样,然后在下一次的迭代过程中,上次正确分类的实例权值减小,而错误分类的实例权值不变,最后对这些更改后的权值进行正规化。从这里可以看出,那些容易被学习器正确分类的实例的权值将会减小,否则权值将会相对的增大。就变压器故障诊断而言,Ada Boost M1算法会将焦点定位在那些拥有很大权值的故障样本之上,也就是难以被学习器正确诊断的样本之上。

1.2 贝叶斯网络组合诊断

贝叶斯网络[12]是用来表示变量间连接概率的图形模式,它提供了一种自然的表示因果信息的方法,用来发现数据间的潜在信息。贝叶斯网络直观地表达变量的联合概率分布及其条件独立性,能大量节约概率推理计算,对概率推理非常有用。

朴素贝叶斯分类器是一种简单有效的贝叶斯分类方法,但它的属性独立性假设限制了其分类性能的提高。TAN(Tree-Augmented Naive Bayes)是一种受限的贝叶斯网络模型,是严格受限的朴素贝叶斯分类器与无限制的贝叶斯网络之间的一种折衷。TAN是由Fried-man等人[12]提出的一种树状贝叶斯网络,是naive Bayes的一种改进模型。TAN分类器的分类性能明显优于naive Bayes分类器[12,13,14],其基本思路是放松朴素贝叶斯中的独立性假设条件,借鉴贝叶斯网中表示依赖关系的方法,扩展朴素贝叶斯的结构,使其能容纳属性间存在的依赖关系,但对其表示依赖关系的能力加以限制。图1是一个简单的TAN模型,每个属性变量最多可以有2个指向它的关联边。

给定训练数据集D={(X1,Y1),…,(Xi,Yi),…(Xn,Yn)}(其中,Xi是训练数据中第i个实例,yiY是实例Xi所属的类别),分类任务的目标是对数据集D进行分析,确定1个函数f:X Y,使得对任意的未知类别的实例(xi1,xi2,…,xin)可标以适当的类标签c*Y。根据贝叶斯最大后验准则,给定某一实例(xi1,xi2,…,xin),贝叶斯分类器选择使后验概率P(c襔xi1,xi2,…,xin)最大的类c*作为该实例的类标签。

本文采用文献[15]的方法进行多个TAN的组合。

2 基于组合贝叶斯网络的电力变压器故障诊断

2.1 多贝叶斯网络的产生

TAN是naive Bayes的一种自然扩展,与naive Bayes相比,它能以树型结构描述属性之间的依赖关系。对任意的数据集,数据属性之间的依赖关系很可能不是简单的树结构,TAN仅仅是对属性之间复杂依赖关系的一个子集的描述。如果不是选择具有较强依赖关系或改进分类器分类性能较大的弧集构成TAN,而只是随机地选择依赖关系子集构成TAN,得到的TAN分类器的分类性能可能不是最好的。但是,这种分类器能够详细描述某个与标准TAN描述的依赖关系不同的依赖关系子集。

按照文献[15]的方法,在构造TAN时,不必按照构成弧的2个属性之间的条件互信息对所有弧排序,而只在条件互信息大于某阈值ε的弧集中,以某种方式选择若干弧,将这些弧添加到朴素贝叶斯结构中,组成一个TAN,不同的弧选择方式将会得到不同的TAN。

在实现过程中,阈值ε和起始边es是2个很重要的参数。如果ε特别小,有可能使所有边都成为TAN的候选边,这时,在TAN中表示依赖关系的关联边,实际属性之间的依赖程度可能是极小的;如果ε特别大,有可能使极少的边成为TAN的候选边,极端情况是候选边集为空,由此得到的TAN模型可能就是naive Bayes模型。采用这种TAN构造算法,可通过调整参数ε和es,生成多个不同结构的TAN,不同结构的TAN从不同侧面反映属性间依赖关系,它们的分类性能也会不同,在某些情形下可能差别很大。

2.2 基于组合贝叶斯网络的电力变压器故障诊断

Boosting方法能够提高不稳定学习算法的分类精度,其原因在于由学习算法生成的一系列基分类器之间存在差异,基分类器差异较大时,组合得到的分类器的效果就较好。本文中,分类器就是变压器故障诊断器。

在2.1节中,通过调整参数es(起始边),可生成多个不同结构的TAN,不同结构的TAN从不同侧重点详细描述贝叶斯网络结构,因而存在一定的差异。

在变压器故障诊断中,参数es的取值不同,使生成的TAN倾向于描述某些DGA属性之间的关联关系。因此,在某个TAN分类器中误判的样本极有可能是由于属性之间的某些关联边不存在造成的,在另一个这些关联边存在的不同结构的TAN诊断器中,误判的样本将会得到正确的分类。

Ada Boost M1算法能够提高变压器故障诊断器的分类性能,为此,本文将由2.1节生成的若干个不同结构的TAN看作一系列基诊断器,进行boosting迭代,即依次在训练集上训练每个基诊断器。第1个基分类器用原始的训练集训练,其他基诊断器的训练决定于在其之前产生的诊断器的表现,被已有诊断器错误判断的实例将以较大的概率出现在新诊断器的训练集中,最后,形成贝叶斯网络组合诊断器。具体的诊断流程如图2所示。

结合图2,对组合诊断的算法说明如下:

输入:变压器故障训练数据集D={(X1,Y1),…,(Xi,Yi),…,(Xn,Yn)},基诊断器TAN以及基诊断器的个数T。初始化所有变压器故障训练样本的权值,

a.如2.1节所述,利用训练数据集D和es构造第t个TAN诊断器Tt:X→Y;

b.用TANt对变压器故障训练数据集D中的每个样本进行诊断,并估计Tt的误判率es;

c.如果et>0.5,转向g;

d.计算βt=log((1-et)/et);

e.修改下一个故障诊断器所需样本的权值wit+1=wt i×eβt·I(yi≠Tt(xi));

f.正则化wit+1,使其总和为1;

g.t=t+1;

h.l=l+1;es=es+n/(2 T);

输出:多个贝叶斯网络的组合诊断器,有

2.3 变压器故障分类

表1列出了13种变压器常见故障。TAN作为一种具有树状结构的贝叶斯网络,为确定故障类别提供了清晰的陈述,但由于变压器的故障多数是由直接原因、间接原因和扩展性原因等综合引起的,单一的贝叶斯往往难以对如此众多和复杂的故障类型进行分类。为了实现有效的分类,对容易误判的故障采用再次划分的方法将有助于故障的分析,因此本文提出组合贝叶斯网络的变压器故障诊断模型。

3 实例分析

由于变压器故障的表现是多样的,且不同型号之间,不同电压等级之间征兆的表现是有差异的。不同的变压器在其故障的表现形式上有差异,同一变压器在不同的运行状态下的表现也不尽相同。因此,样本还应尽量采用更多不同类型的变压器和足够多的运行状态。本文共收集了519例训练样本[16],各类故障在样本集中的分布如表2所示。

采用本文的组合贝叶斯网络(BN)方法进行变压器故障诊断的结果如表3所示。表3中也列出了文献[16]中相关方法的故障诊断结果。

由表3可见,组合神经网络的正判率仅有75.4%,判决树的正判率有83.3%,模糊神经网络的正判率有90.4%,而基于组合贝叶斯网络(BN)的正判率可达91.3%,比前3种方法都高,基本达到现场应用可以接受的水平。在实际应用过程中,可以随时、不断地对训练样本进行补充修正(例如补充新样本、去掉冗余样本等),使分类决策的效果更好。

4 结论

按照发生部位,本文将电力变压器故障划分为13类。利用Ada Boost M1算法构造组合贝叶斯网络,运用于变压器的故障识别。组合贝叶斯网络侧重对容易误判的故障类别进行诊断,使故障诊断过程更加合理。通过与其他方法的比较,利用组合贝叶斯网络使故障分析的准确度得到了提高。

摘要:针对电力变压器故障诊断中的信息和知识具有随机性和不确定性的特点,提出了一种利用AdaBoostM1算法构建组合贝叶斯网络进行变压器故障诊断的方法。AdaBoostM1算法能够提高分类器的性能,为此,将若干个不同结构的TAN看作一系列基分类器,进行boosting迭代。即依次在训练集上训练每个基分类器。第1个基分类器用原始的训练集训练,其他基分类器的训练决定于在其之前产生的分类器的表现,被已有分类器错误判断的实例将以较大的概率出现在新分类器的训练集中,最后,这些分类器组合成为一个贝叶斯网络组合分类器。由于贝叶斯网络是用来表示变量间连接概率的图形模式,它提供了一种自然的表示因果信息的方法,用来发现数据间的潜在信息,因此应用中显示了该方法对于变压器故障诊断的适用性。在讨论变压器故障空间的基础上,针对已积累的故障变压器的大量油中溶解气体等数据,利用boosting迭代,并在此基础上构造出组合贝叶斯网络诊断模型,实现了变压器故障诊断,有利于提高诊断的准确性。此外,通过与其他组合诊断的方法进行比较进一步表明了该模型的有效性。

诊断贝叶斯网络 篇6

随着电网规模的扩大和互联程度的提高,故障诊断成为保证系统安全运行的重要手段,故障元件的识别是其关键问题。目前,尽管已有专家系统[1,2]、人工神经网络[3]、粗糙集[4]等多种传统智能方法用于解决电网故障诊断,但随着电网规模的日益扩大,当电网出现异常尤其是复杂故障(如级联跳闸)时,多个元件和保护动作,加之保护和断路器的拒动与误动、信息缺失等不确定性因素给电网故障诊断带来难度,传统智能故障诊断方法对这种不确定性就显得处理不够。

基于概率推理的贝叶斯网络应用于电网故障诊断,能较好地弥补传统诊断技术在不确定性和容错处理的不足[5,6,7]。文献[5]提出根据电网拓扑结构和保护装置的动作原理建立基于元件的诊断贝叶斯网络及其概率学习算法,将Agent与贝叶斯网络结合,但这种结合仅停留在系统框架层面,没有实际算法的支持;文献[6]由Noisy-Or和Noisy-And节点组成贝叶斯网络,分别建立线路、变压器和母线等通用故障诊断模型,但模型较简单,不适用于结构复杂的电网;文献[7]将主观贝叶斯方法应用到电网故障诊断,既克服贝叶斯网络方法参数难以获得的问题,又发挥贝叶斯网络在推理方面的优势,但该方法在处理异常事件时可能出现组合爆炸问题。已有研究在每次发生故障时,都是对整个电网进行推理与诊断,无疑会影响诊断的精度和可靠性,对保护和断路器的误动与拒动处理仍不够好。

本文提出基于贝叶斯网络的电网故障诊断方法,与传统的贝叶斯网络故障诊断不同的是,根据SCADA(数据采集与监视系统)和RMS(保护信息管理系统)中的断路器动作信息,采用故障区域识别法确定故障目标区域,将故障元件的诊断锁定在目标区域内,从而缩小故障诊断范围。再利用断路器位置信息和保护动作信息,送入贝叶斯网络进行反向推理来获得故障元件。为了抑制多种干扰因素可能造成的诊断不准确,对诊断结果做概率平抑的修正措施,再做正向推理以判断保护的误动与拒动。通过仿真实例验证了该诊断方法的有效性。

1 贝叶斯网络原理

贝叶斯网络是一个有向无环图,如图1所示。图1中每个节点表示所讨论问题域中的事件,节点之间的弧表示事件之间的概率依赖关系,使得不确定性推理在逻辑上更清晰、更容易理解[1]。

给定贝叶斯网络B=,包含一组随机变量X={X1,X2,…,Xn},其中:Bs表示贝叶斯网络的结构,是一个具有n个节点的有向无环图,其中每个节点代表一个变量Xi,节点状态对应于变量值,有向边表示节点(变量)之间的条件(因果)依赖关系;BP表示贝叶斯网络的条件概率分布表(CPT)集合,每个变量Xj的条件概率分布为P(Xi|Pai),其中:Pat为Xi的父节点的集合。

贝叶斯网络提供了对域的完整描述,联合分布中的一般条目是对每个变量赋予一个特定值P,可使用BP将网络中的概率信息计算出来。用符号P(X1,X2,…,Xn)作为联合概率的简化表示,则有:

联合概率分布中的每个条目都可表示为CPT中适当元素的乘积。因此CPT提供了联合概率分布的一种分解表示方法。

2 电网故障区域的识别

2.1 故障区域识别的必要性

由于电网规模庞大、元件数量众多,如果每次故障诊断时都对电网内所有元件考虑进行分析,不仅没有必要,而且将遇到严重的速度问题。事实上电网发生故障后,与故障元件有关的继电保护和断路器会动作,将其与系统的健全部分隔离开形成停电区域,故障元件肯定在停电区域之中。这样,故障元件的确定可局限于这些停电区域之内,由于每个停电区域内设备数一般不会超过50个[2],因此识别故障区域将大大缩小诊断规模、提高诊断速度。

2.2 故障区域识别原理

利用断路器的实时信息,采用实时接线分析方法识别故障前与故障平息后系统拓扑结构,比较这两个拓扑结构的差异,找到故障后形成的无源网络(可能是一个,也可能是多个),故障元件则肯定在这(些)个无源网络中,这里称这些无源网络为故障区域。在找到这(些)个目标区域后,故障元件的识别就可局限于这些区域中所包含的元件,这样就大大减少了诊断变量,大大提高了诊断速度。

如图2所示,由SCADA/RMS系统得到因故障致使CB2、CB4、CB7、CB11、CB15、CB17动作跳闸,由实时接线分析法可知,虚线所示区域与系统相互孤立,形成一个无源网络,因此可得知虚线网络即是所要找的故障目标区域,该区域中元件T1、L1、T4可能是故障元件,因此只需对上述三个元件的贝叶斯网络进行诊断即可,从而大大提高诊断效率。

3 基于贝叶斯网络的电网故障诊断

3.1 目前超高压电网保护配置和动作原理

本文侧重于输电网电网故障诊断研究,目前我国电网220 k V及以上输电线路主要采用的主保护是光纤电流差动保护,后备保护采用两端距离保护和零序过流保护。从图3中线路L1左端保护L1Lm、L1Lp和L1Ls来分析,其中L1Lm是主保护,即光纤电流差动保护,它只保护线路本身;L1Lp是第一后备保护,它也保护线路全长,是主保护L1Lm的后备保护;L1Ls是第二后备保护,它一般在相邻的元件故障下保护动作,当相邻元件(母线C)故障下保护未动作时,L1Ls作为后备保护动作切除故障。这三个保护动作后都是触发断路器CB3跳闸。

对于母线保护,差动保护是其主保护,只保护母线本身。变压器或线路后备保护是其后备保护。图3中Cm是母线保护,当母线C故障时,母线保护Cm动作触发继电器CB2,CB4和CB5跳闸。

变压器保护一般也是三段式。图3中变压器T的三段式保护为TLm(TRm)、TLp(TRp)以及TLs(TRs)。其中主保护TLm(TRm)和第一后备保护TLp(TRp)的保护范围都为变压器本身,第二后备保护TLs(TRs)在相邻元件故障下动作,如在图3中,当母线C故障而Cm未动作时,则TLs(TRs)动作。TLm(TRm)、TLp(TRp)和TLs(TRs)保护动作后都是触发断路器CB1和CB2跳闸。

3.2 贝叶斯网络的建模

根据上述继电保护原理,可准确地建立系统中每个元件的故障诊断贝叶斯网络拓扑图。在图4所示的电网模型中,建立线路L1和变压器元件T1的贝叶斯网络图,如图5和图6所示。在每个贝叶斯网络模型中,电网元件作为网络中唯一的根节点,其状态为0和1分别表示“正常”和“故障”状态。保护装置节点和断路器节点构成网络中叶节点,其状态0和1分别表示它们处于“不动作”和“动作”状态。

3.3 贝叶斯网络的赋值

贝叶斯网络的准确赋值是实现正确诊断的关键。本文综合了设备可靠性数据、历史运行数据和试验模拟数据进行赋值建模,从而获得更为可靠的概率数据。

对于元件节点的故障先验概率,通过一次设备年故障频率μ来计算[8]。设备连续运行一段时间t后,发生故障的概率就是故障时间间隔为t的概率。

式(2)中:T是设备连续无故障运行的时间。以文献[9]中的数据为依据取ω,取t=0.5,计算出元件节点的故障先验概率,如表1所示。

对于保护节点,先计算保护拒动和误动概率,再根据保护原理确定条件概率。保护拒动概率可用拒动次数与要求动作次数之比来计算;保护误动概率可先计算出保护装置年平均误动频率μ,然后按照公式(2)来计算误动概率。以文献[8-9]中数据为依据,计算出继电保护的误动、拒动概率如表2所示。

保护节点的条件概率根据保护原理从保护拒动和误动概率计算获得。利用保护节点的条件概率具有相似性的特点,先确定几类关键继电保护节点的条件概率,然后相应获得所有节点的条件概率。

3.4 基于贝叶斯网络的故障推理

3.4.1 故障元件的确定

考虑到本文针对元件建立的贝叶斯网络模型,因此每一个电网元件只可能出现在自己的贝叶斯网络中,设经过反向推理得到的各元件故障概率为an(n=1,2,3,…),设定0.8作为元件正常故障的阈值,即若a的值满足下列条件:

则判定该元件为故障元件,否则为正常元件。

3.4.2 保护误动与拒动的确定

在推断出故障元件后,将故障概率带入各元件贝叶斯诊断网络进行正向推理,得到保护和断路器真实的动作概率,是由某一个元件故障得出其它误动作,考虑到SCADA/RMS系统中存在许多干扰信息,导致部分非故障诊断概率出现误差的现象,因此又对这些元件概率进行修正。

设若非故障元件诊断故障概率大于0.5,则判定为概率为不准确概率,需要进行修正。

设故障区域中故障元件诊断概率小于0.5的概率值分别为{a1,a2,a3,…,an},设需要修正的元件修正后的概率为{b1,b2,b3,…,bm}。

通过对这些不准确元件概率进行合理修正,保证了诊断的容错性,再将这些修正后的概率赋值到各元件的贝叶斯网络中用于正向推理。通过对各层的节点逐层修正和正向推理可得到各节点(各保护或断路器)贝叶斯网络诊断保护(断路器)的动作概率,如果某保护(断路器)同时出现在不同元件的贝叶斯网络节点中,那么取它们在各网络中所得动作概率的平均值。

设m1为保护(断路器)实际动作概率,从SCADA/RMS系统直接读取。

设2m为各保护(断路器)通过正向推理得到的动作概率。令Δm=m1-m2,则通过Δm的计算,根据下述判据得到保护(断路器)的诊断结果:

通过以上计算分析可得到出保护和断路器的误动、拒动的情况。

4 算例实例

本文采用贝叶斯网络仿真软件GENIE构建相应的贝叶斯网络,可获得图形化的贝叶斯网络拓扑结构、设置各节点的条件概率数据,进行推理计算。

以图3的电网模型为例进行实例推理。已知SCADA/RMS接收到的故障信息如表3所示。

1)故障区域识别

由SCADA/RMS系统的信息,利用2.1节故障区域识别原理可得到故障区域(图3虚线框内区域),故障区域中的元件有L1、L3、T1、T2、B1、B2。

2)故障区域中各元件建模

对各元件建立相应的贝叶斯网络诊断模型。3)对于各贝叶斯网络模型中节点赋先验概率利用3.3节贝叶斯网络赋值原理对各节点计算出先验概率并对各节点赋值。

4)应用贝叶斯网络仿真软件GENIE分别对各网络进行诊断

可诊断得到线路L1的正常概率为0.86,故障概率为0.14,同理可得其它设备的故障概率。

5)故障元件的确定

通过第4步得到故障元件概率如表4所示。

由表4可知,T1的故障概率大于0.8,所以推断出T1是故障元件。

6)保护误动、拒动的确定

根据3.4.2节,由于非故障元件L3、T2的故障概率大于0.5,因此需要对两元件的故障概率进行修正,设L3、T2修正后的故障概率分别为b1、b2,L3、B2的故障概率分别为a1、a2、a3。则:

将元件故障概率带入各元件贝叶斯网络中通过正向推理,得到各保护(断路器)的动作概率,如表5所示。将表5中的Δm代入3.4.2节的判定规则,得到最终的诊断结果,如表6所示,该诊断结果是正确的,其容错性更强。

5 结论

本文结合故障区域识别法,依据元件、保护及其关系,给出电网元件故障诊断贝叶斯网络模型,实现了电网故障诊断。该方法先通过识别故障区域合理缩小诊断范围,有效提高诊断速度和精度;采用阈值判据来判定元件故障,对于单一元件故障和多个元件故障导致的级联跳闸均能有效诊断;对反向推理得到的故障元件概率做合理修正,有效解决SCADA/RMS系统因干扰信息导致误判的情况,保证了诊断的容错性。仿真结果表明,提出的电网故障诊断方法简单有效,对于级联跳闸可准确诊断出故障,从而为操作运行人员提供了参考的依据。

参考文献

[1]赵冬梅,张东英,徐开理,等.分层分布式电网故障诊断专家系统设计[J].现代电力,2004,8(3):41-46.ZHAO Dong-mei,ZHANG Dong-ying,XU Kai-li,et al.Design of delaminated and destributed fault diagnosisexpert system for power system[J].Modern Electric Power,2004,8(3):41-46.

[2]朱永利,张文勤,高曙.电力系统故障判断专家系统[J].华北电力大学学报,2005,12(1):1-6.ZHU Yong-li,ZHANG Wen-qin,GAO Shu.Power system fault diagnosis expert system[J].North China Electric Power University,2005,12(1):1-6.

[3]毕天姝,倪以信,吴复立.基于新型神经网络的电网故障诊断方法[J].中国电机工程学报,2002,22(2):73-78.BI Tian-shu,NI Yi-xin,WU Fu-li.New neural network-based fault diagnosis method[J].Proceedings of the CSEE,2002,22(2):73-78.

[4]张耀天,何正友.基于粗糙集理论和朴素贝叶斯网络的电网故障诊断[J].电网技术,2007,12(7):14-19.ZHANG Yao-tian,HE Zheng-you.Study on power grid fault diagnosis method based on rough set theory and naive Bayesian networks[J].Power System Technology,2007,12(7):14-19.

[5]吴欣,郭创新.基于贝叶斯网络的电力系统故障诊断方法[J].电力系统及其自动化学报,2005,17(4):11-15.WU Xin,GUO Chuang-xin.Power system fault diagnosis approach based on Bayesian network[J].Proceedings of the EPSA,2005,17(4):11-15.

[6]霍利民,朱永利,贾兰英,等.基于贝叶斯网络的电网故障诊断方法[J].华北电力大学学报,2004,31(3):30-34.HUO Li-ming,ZHU Yong-li,JIA Lan-ying,et al.Power system fault diagnosis based on Bayesian network[J].North China Electric Power University,2004,31(3):30-34.

[7]李强,徐建政.基于主观贝叶斯方法的电力系统故障诊断[J].电力系统自动化,2007,31(15):46-50.LI Qiang,XU Jian-zheng.Power system fault diagnosis based on subjective Bayesian approach[J].Automation of Electric Power Systems,2007,31(15):46-50.

[8]周玉兰,王俊永,等.2002年全国电网继电保护与安全自置运行情况[J].电网技术,2003,27(9):55-60.ZHOU Yu-lan,WANG Jun-yong,et al.Relay protection and security to the national grid operation of home in2002[J].Power System Technology,2003,27(9):55-60.

[9]吴玉鹏,陈丽鹃,等.2002年全国电力可靠性统计分析[J].中国电力,2002,36(5):1-7.WU Yu-peng,CHEN Li-juan,et al.Statistical analysis of the national electric reliability in2002[J].Electric Power,2002,36(5):1-7.

诊断贝叶斯网络 篇7

随着电力系统日趋大型化, 电网故障日趋复杂化, 所以在电力中故障是系统不可避免的。一旦发生故障, 如何快速诊断故障类型, 防止事故扩大非常重要。如果故障不能及时有效地控制和处理, 将可能造成系统稳定破坏、电网瓦解、重大设备损坏和大面积停电, 直接影响到用户的切实利益, 甚至影响社会大生产的顺利进行。为了保证电力生产的安全性, 保证电能供应的可靠性和连续性, 在输配电网发生故障时, 需要可靠的电网故障诊断系统为工作人员迅速进行诊断和处理提供决策参考。

目前国内外用于电网故障诊断的技术包括:遗传算法, 专家系统, Petri网络等。

遗传算法从优化的角度出发基本上可以解决故障诊断问题, 尤其是在复杂故障或存在保护、断路器拒动、误动的情况下, 能够给出全局最优或局部最优的多个可能的诊断结果。但遗传算法存在的主要“瓶颈”是如何建立合理的电网故障诊断数学模型。专家系统的典型缺点为学习能力差、容错性差及诊断速度偏慢。Petri网络用于建模的时间较长, 随着设备的增加和网络的扩大, 存在着较大的问题, 同时针对现场普遍存在的保护、断路器误动拒动及由于通信线路故障引起的故障信息畸变, Petri网络需要提高其容错能力和处理电网拓扑的改变。

本文主要采用贝叶斯网络进行诊断。贝叶斯网络是一种不确定性的因果关系关联模型、具有强大的不确定性问题处理能力, 同时它能有效的进行多源的信息表达与融合, 是一种基于网络结构的有向图解描述。贝叶斯网络的以上的特性与故障诊断问题的要求内在一致, 故贝叶斯网络也可以应用于不同领域的故障诊断。在电网故障诊断中, 贝叶斯网络具有很多独有的特性和优点, 基于贝叶斯网络的故障诊断方法, 是对贝叶斯公式本身的改进, 在处理不完备信息时, 提出了采用证据的不确定性推理和比较异常事件数两种方法, 减少了计算量, 提高了算法的实用性。

1 贝叶斯网络方法概述

贝叶斯网络是一种对概率关系的有向图解描述, 它提供了一种将知识直觉地图解可视化的方法。一个贝叶斯网络是一个有向无循环图 (DAG) , 它的节点用随机变量标识, 弧代表影响概率, 用条件概率标识。一个简单的贝叶斯网络如图1所示。

在网络中, 定性信息通过网络的拓扑结构表达, 定量信息通过节点的联合概率密度表示。其数学描述为:若论域U={x1, x2, …, xn}, 其中, x1, x2, …xn对应于网络中各节点, 则联合概率P (x1, x2, …, xn) 为:

式中Pparents (xi) 为xi父节点的集合。

对一具有m个基本事件{xi1}, {xi2}, …, {xim}的随机变量xi, 假设已取得除xi外所有与其相关变量的观察结果V= (x1, …, xi-1, xi+1, …, xn) , 则其条件概率为:

贝叶斯网络模型能表示变量集合的联合概率分布, 并能分析大量变量之间的相互关系, 利用贝叶斯网络方法, 可以完成预测, 分类和诊断等任务。

2 基于贝叶斯网络的故障诊断方法

由于贝叶斯网络是一种不确定性因果关系关联模型, 具有强大的不确定性问题处理能力, 它的特性和故障诊断中要求解决因不确定性和不完备故障信息带来的故障诊断困难的要求内在一致, 因此本文提出运用贝叶斯网络对电网故障进行诊断的方法。根据电力系统的物理拓扑结构和保护装置的动作原理, 分别建立系统中元件的故障诊断贝叶斯网络模型, 实现故障诊断的分布式处理。

2.1 电网故障类型及粗糙集约简

常见的电网故障主要是短路故障, 短路故障包括单相接地短路、两相短路、两相接地短路故障、三相对称短路故障。电网在发生各种短路故障时, 电流和阻抗也不断变化。当电力系统发生不对称故障时, 三相阻抗不同, 三相电压和电流的有效值不同, 相与相间的相位差也不相等。对于这样的不对称三相系统就不能只分析其中一相, 通常是用对称分量法, 将一组不对称三相系统分解为正序、负序、零序三组对称的三相系统, 来分析不对称故障问题。

粗糙集理论是研究不完整数据及不精确知识的表达、学习、归纳的一套方法, 能在保留关键信息的前提下对知识进行处理, 并求得知识的最小表达。本文选用粗糙集理论对故障信息量进行约简, 选取平均互信息最小的组合作为最佳属性约简组合。

2.2 基于贝叶斯网络电网故障诊断模型

本文根据故障信息判定故障类型。提取故障时的信息量, 运用粗糙集进行约简, 约简后的故障类型对应着一个贝叶斯网络, 网络的输入是决策表的条件属性, 输出是决策表的决策属性, 综上, 本文是一种基于粗糙集与贝叶斯网络相融合的电网故障类型诊断网络模型, 其网络结构如图所示。

2.3基于贝叶斯网络的电网故障类型诊断方法

本文用粗糙集进行知识挖掘, 以便在故障发生后能迅速判别出故障区域及故障元件。

基于贝叶斯网络的电网故障类型诊断过程如下:

(1) 将获取的故障信息作为条件属性, 故障类型作为决策属性, 形成故障类型决策表。

(2) 运用粗糙集对故障类型决策表进行知识挖掘, 删除冗余属性, 实行属性优选, 消除不一致性的噪声, 进行对象约简, 形成故障类型简化决策表。

基于贝叶斯网络的电网故障诊断方法流程如图3所示:

3 结论

本文通过对常见电网短路故障进行分析, 提出了一种基于粗糙集理论和贝叶斯网络相结合进行电网故障诊断的方法, 能够优势互补。

(1) 先利用粗糙集的属性约简, 分析故障信息的冗余性, 在保证分类能力不变的情况下, 化简故障信息, 然后利用贝叶斯网络及推理得出诊断结果, 可以提高系统在缺失关键警报信息情况下的容错性;

(2) 利用贝叶斯网络进行诊断推理, 可以提高诊断速度, 克服单独使用粗糙集诊断速度较慢的缺点。

通过仿真实验表明, 该方法能在一定程度上提高系统的容错性, 诊断速度快, 可靠性高, 具有很好的实用性。

摘要:本文提出一种通过贝叶斯网络和粗糙集对常用的电网故障情况进行诊断的方法 。该方法可以灵活的表示不确定信息, 并能进行不确定性推理。通过研究分析电网在各相短路故障时的电流和阻抗的变化, 选用粗糙集理论对故障信息量进行约简, 最后通过贝叶斯网络对故障情况进行诊断。通过仿真实验, 验证了该方法的正确性和有效性。

关键词:电网故障,贝叶斯网络,粗糙集

参考文献

[1]聂倩雯.基于关联规则数据挖掘和扩展贝叶斯网络的电网故障诊断方法研究[D].成都:西南交通大学, 2010.

[2]张耀天, 何正友, 赵静, 等.基于粗糙集理论和朴素贝叶斯网络的电网故障诊断方法[J].电网技术, 2007, 31 (1) :37-43.

[3]基于粗糙集和朴素贝叶斯的电网故障诊断方法研究[D].成都:西南交通大学, 2007.

[4]宋功益, 王晓茹, 周曙.基于贝叶斯网的电网多区域复杂故障诊断研究[D].成都:西南交通大学, 2011.

[5]刘伟娜, 霍利民, 张立国.贝叶斯网络精确推理算法的研究[J].微计算机信息, 2006, 22 (3) :92-94.

诊断贝叶斯网络 篇8

感应电机在现代工业系统的各个领域中发挥着重要作用。目前,电机故障诊断的方法主要是针对定子电流的频谱分析方法[1],通过找出对应的故障频率判断电机是否发生故障。但在复杂的噪声背景下,故障频率分量极易被淹没,特别是在电机早期轻微故障时,微弱的故障信号更加难以支持判断,而且直接分析故障特征信号的方式带有很强主观性,容易造成误判,并且效率低下。近年来,一些新的异步电机故障诊断方法不断被提出,例如小波脊线法[2],Park变换法[3]和基于非线性理论的故障识别方法[4]等,但是小波脊线法只能在电机启动时进行检测; Park变换法容易被噪声干扰; 基于混沌理论的诊断方法则需要大量的采样点进行诊断,而且无法灵活应对更加复杂的故障情形。随着贝叶斯网络( Bayesian network,BN) 相关理论的不断丰富和完善,张家良等人[5]提出结合一种非线性频谱与贝叶斯网络进行故障诊断,但是文中提及的贝叶斯网络仅为分类性能一般的朴素贝叶斯网络,难以实现复杂情况下的推理诊断。

Hilbert边际谱能够准确反映信号的频谱特征,同时不会发生能量泄露,因而成为一种新兴的频谱分析方法。笔者探究定子电流信号的Hilbert边际谱对于发现电机故障的意义,结合贝叶斯网络决策支持理论[6],提出基于贝叶斯网络的电机故障诊断方法,在贝叶斯网络的构建过程中,引入布谷鸟搜索算法( cuckoo Search,CS)[7],提高贝叶斯网络结构学习的有效性。笔者以异步电机的转子断条故障为例,对该模型进行验证。

1贝叶斯网络及经验模态分解

1. 1 贝叶斯网络

贝叶斯网络能够在不完全信息下进行推理、决策,在故障诊断、模式识别、医疗卫生、机器人以及金融系统等领域有着广泛的应用,被认为是目前不确定知识表达和推理领域最有效的理论模型。贝叶斯网络包括贝叶斯网络结构和参数两部分,而朴素贝叶斯分类器( nave Bayes classifier,NBC) 是一种典型的贝叶斯网络分类器,朴素贝叶斯分类器的典型结构如图1 所示。

该分类器可以通过训练数据学习出每个属性Ai在已知分类节点C的条件下的条件概率P( Ai| C) ,i =1,2,…,n,其中: n—除节点C以外的节点数目。朴素贝叶斯由于其构建的简易性,十分具有实用价值,但是这种贝叶斯网络分类能力并不突出,许多改进型的贝叶斯网络分类器增加了节点间依赖关系的学习,因此具有相对较高的分类预测性能,例如树增广型朴素贝叶斯分类模型( tree augmented nave Bayesian networks,TAN) 。

1. 2 经验模态分解

黄锷等人[8]提出的经验模态分解能够针对复杂信号自身的时间尺度进行自适应的分解成若干内禀模态分量( intrinsic mode components,IMF) ,对各个内禀模态分量进行希尔伯特-黄变换( Hilbert-Huang Transform,HHT) 后进行积分得到Hilbert边际谱。Hilbert边际谱是一种新兴的频谱分析方法,相比快速傅立叶变换,Hilbert边际谱分辨率更高,特别对于非平稳信号的分析,Hilbert边际谱优势更加明显。

2基于定子电流信号的HHT-BN电机故障诊断模型

在故障诊断模型构建过程中,本研究首先采集定子电流信号序列,经过经验模态分解,得出数个IMF分量,再由Hilbert变换得出Hilbert边际谱,将Hilbert边际谱的频谱特征按照不同的频段提取出,Hilbert边际谱频段特征量作为贝叶斯网络的各个节点,利用布谷鸟搜索算法学习出相对较优的贝叶斯网络结构,将电机是否发生故障的属性作为其它节点的根节点,构建出基于贝叶斯网络的电机故障诊断模型。整个过程如图2 所示。

2. 1 Hilbert边际谱特征提取

定义某一IMF分量ci( t) 的Hilbert变换为:

对n个内禀模态分量进行Hilbert变换得到n个解析信号,那么原始信号的Hilbert谱为:

Hilbert边际谱定义为:

在频率段[ωi,ωi + 1]中,Hilbert边际谱的能量为,将频率带宽均分成N份,则有边际谱能量特征向量: ( E1,E2,…,EN) ,定子电流信号的频谱分析具有较高的复杂性,人为根据Hilbert边际谱判定故障存在一定难度,而这种分段量化方法避免了主观因素的干扰,通过贝叶斯网络这一不确定推理计算工具,能够有效地实现故障推断。

2. 2采用布谷鸟算法的贝叶斯网络电机故障诊断模型

本研究以电流信号的边际谱能量特征值作为贝叶斯网络的节点构建贝叶斯网络分类模型,在朴素贝叶斯网络分类器的基础上采用一种更加灵活的方式得到各属性之间的概率依赖关系: 先利用贝叶斯网络学习算法( 搜索打分算法)[9]得出各特征节点之间的贝叶斯网络,再将分类节点C作为其他节点的父亲节点,得出贝叶斯网络结构如图3 所示。

通过结构学习构建的贝叶斯网络分类器摆脱了属性间条件独立或者结构为树状图的假设,与实际依赖关系更加符合,在推理分类能力上更加优秀。

搜索打分算法学习贝叶斯网络结构的过程实际上可以看作组合优化问题。本研究采用贝叶斯信息准则( Bayesian information criterions,BIC) 评分函数作为组合优化的目标函数,基于一个原始的贝叶斯网络结构不断进行寻优,得出与数据最适应的网络结构。

本研究将边际谱能量特征向量( E1,E2,…,EN) 按照等距离散化的原则进行离散化为,采集大量定子电流信号,以1 000 个定子电流样本数据为一组进行边际谱的提取和特征向量的转化计算,得出k组正常电机的定子电流k组故障电机的定子电流进行边际谱特征提取形成贝叶斯网络结构学习的样本数据。本研究以特征向量作为贝叶斯网络的节点并运用布谷鸟搜索算法进行搜索打分BN结构学习。

布谷鸟搜索算法是模拟种属布谷鸟的寄生育雏来寻找最优解的一种启发式搜索算法。布谷鸟有一种特殊的习性,它们在别的宿主鸟类的鸟窝中产蛋,宿主往往分辨不出那些布谷鸟蛋,从而帮布谷鸟孵蛋。如果宿主发现鸟蛋不是自己的,则宿主会破坏布谷鸟蛋或者重新另建一个鸟巢。模拟这种行为YANG Xin-she和DEB Suash提取出3 种基本的原则:

( 1) 每个布谷鸟每次下一个蛋,放在一个随机选择的巢中。

( 2) 拥有质量高的鸟蛋的优秀蛋巢将被转到下一代。

( 3) 宿主的总数量是固定的。每个布谷鸟蛋被宿主发现的概率为P,如果鸟蛋被发现,则产生任意一个随机的鸟巢。

布谷鸟搜索采取Levy飞行的机制随机找出鸟巢。许多研究表明,在群体智能算法中融入Levy飞行机制对算法的搜索效率和种群的多样性方面有很大帮助。基于Levy飞行的布谷鸟窝位置更新公式为随机游走方程:

式中: xi(t)—第i个鸟窝在t代更新后的位置( i = 1,2,…,N) ,N—种群的规模; —步长调节参数; L服从Levy分布。

Levy飞行实际上是一种结合短距试探和长距跳跃的混合搜索策略,这在搜索大范围空间时是一种高效的方案。本研究依据刘建华[10]公式将连续空间的Levy飞行机制向二进制空间变换得出贝叶斯网络结构中两两节点之间有向边的更新规则。

在现有布谷鸟算法中,布谷鸟蛋被宿主发现的概率为固定值P,也即无论鸟巢的优劣都具有同样的淘汰概率,实际上,将被发现的概率设置成与鸟巢优劣程度成相关性的自适应值能够产生寻窝的竞争机制,促进优胜劣汰。将各鸟巢的BIC评分Si( i = 1,2…N) ,根据公式归一化到区间[0,1],si代表每个鸟巢归一化以后的评分值,将鸟巢被宿主发现的概率pi= 1 -si。这样评分高的网络结构( 鸟巢) ,不容易被发现和淘汰,而评分较低的鸟巢则会迅速被宿主发现,这样就加快了鸟巢质量更新的效率。所以,整个贝叶斯网络结构学习算法如下:

( 1) 初始化种群数量N,最大试探步数K,试探步数j = 1,每个布谷鸟随机选取鸟巢产一个卵,从而产生N个有向无环图gi( i = 1,2…N) ,并计算相应的BIC评分。

( 2) 将各鸟巢的BIC评分Si( i = 1,2…N) ,根据公式归一化到区间[0,1],si代表每个归一化的评分值,鸟巢被宿主发现的概率pi= 1 - si。

for i = 1: N

( 3) 产生N个[0,1]区间的服从均匀分布的伪随机数ri( i = 1,2…N) ,对比pi与ri来确定是否被宿主发现。若ri< pi,则表明被宿主发现,舍弃该鸟巢,并在保证更新后为有向无环图的基础上随机选取某一边进行某一种操作( 增边,减边或反边) ,进行鸟巢的更新,若ri≥pi,依据Levy飞行更新规则更新鸟巢代表的贝叶斯网络的每一条有向边。

end for

( 4) 计算此时所有N个鸟巢对应的BIC评分,在这些鸟巢中如果存在某个现有鸟巢评分大于原来的鸟巢评分,则保留更新后鸟巢,还原试探步数j = 1 返回执行( 2) ,如果所有鸟巢中,所有现有鸟巢评分都小于原有鸟巢,则保留原有鸟巢,j = j + 1; 如果j > K则结束结构学习,否则继续执行( 2) 。

布谷鸟搜索能够选用较少的参数,采用Levy飞行机制优化搜索路径有利于提高搜索效率,降低陷入局部最优的可能性; 在布谷鸟搜索过程中引入竞争机制,进一步加快学习速度。在贝叶斯网络结构学习问题中,一方面需要采取随机的策略扩大搜索范围,一方面要加快搜索的速度,布谷鸟搜索算法则能够发挥其长处,灵活高效地进行搜索。

3实验及结果分析

感应电机的转子断条故障是一种常见的故障类型,转子断条会导致气隙磁场畸变,恶化电机的各项性能指标,如果不及时排除会使电机严重损伤以至故障停机。本研究以该故障为例验证HHT-BN诊断模型。

该实验系统如图4 所示。

它由转速控制系统、数据采集系统组成。通过霍尔电流检测计采集得到定子电流,在故障诊断平台上更换不同故障类型的转子实现不同故障信号的采集。Hilbert边际谱特征的提取和贝叶斯网络的构建均是在Matlab 7. 6. 0 平台上实现。本研究分别采集正常电机k = 200 组正常电机、转子有一根断条的故障电机、转子有3 根断条的故障电的定子电流{ Gn( ω) ,G'n( ω) ,G″n} ,( n = 1,2,…k) ,其中100 组用来BN诊断模型的构建,另外100 组数据用来验证算法的有效性。每组数据是由截取的1 000 个定子电流数据样本点构成的序列,对各信号序列分别进行EMD分解和HHT变换得到{ Hn( ω) ,H'n( ω) ,H″n( ω) } ,( n = 1,2,…k)将每组信号的边际谱进行频段特征提取,得到N维特征向量,利用提取的特征数据集根据CS算法学习特征向量各元素之间的贝叶斯网络。本研究将故障类型节点指向特征向量的每一个节点,得到基于定子电流边际谱特征的贝叶斯网络分类器。

3. 1 边际谱特征提取

本研究对采集的数据进行EMD分解,得出原始信号的各个IMF分量。将分解后的信号进行HHT变换,得到Hilbert谱和边际谱。正常电机、转子有一根断条故障电机和转子有三根断条故障电机的Hilbert谱如图5 所示。

可以看出,图5 能够反映定子电流的频率随时间变换的情况,电机定子电流的频率变化情况具有非线性特征,单纯通过Hilbert谱无法判定电机的健康状态。对Hilbert谱进行积分得出如图所示的边际谱,3种类型电机的边际谱柱状图如图6 所示。

图6 中横轴f代表频率值,而纵轴A则表示归一化后的幅值大小,可以看出,Hilbert边际谱准确反映了电流频谱分布特征,同时定子电流的频谱分布较为复杂,很难通过人为判断的方式得出电机是否正常的结论,所以笔者采取机器学习的方式,对边际谱进行进一步的识别和判定。

本研究将边际谱的幅值在频率为某个大小区间上进行累加,得出每个频段的频率能量的分布,将能量值等距离散化后得出的决策表如表1 所示。

表1 反映了不同电机健康程度所获得边际谱的频段能量大小。其中,A,B,C,D分别代表不同的能量类型,可视为极低,低,中,高4 种不同的大小状态。而电机的状态则有3 种不同的情况: 1健康电机,2转子有1 根断条的电机,3转子有3 根断条的电机。

3. 2 故障诊断效果

本研究依据提取出的边际谱特征决策表,运用布谷鸟搜索算法学习出贝叶斯网络的结构,构建贝叶斯网络。本研究结构学习算法学习出的贝叶斯网络分类器的结构如图7 所示。

同时,笔者运用爬山算法( hill climbing,HC) 进行边际谱特征节点结构的学习,故障节点作为其他节点的父亲节点的贝叶斯网络结构如图8 所示。

运用最大权张成树算法得到的TAN贝叶斯网络分类器的结构如图9 所示。

在图( 7 ~ 9) 中,节点8 为电机故障类型节点,有3 种可能的状态: 健康电机,转子有1 根断条的电机,转子有3 根断条的电机。节点1 ~ 7 则代表0 Hz ~ 15Hz,15 Hz ~ 30 Hz,30 Hz ~ 45 Hz等7 个频段Hilbert边际谱特征的能量大小,每个节点均有A,B,C,D 4种不同的状态,代表不同的能量类型。基于这7 个节点的状态,贝叶斯网络可以推理出节点8 电机的健康状态。

本研究运用团树传播算法进行概率推理对故障类型进行分类,得出基于边际谱特征的判定结果,对比其他两种贝叶斯网络分类器和SVM方法的故障诊断效果,故障电机诊断识别的正确率如表2 所示,反映了故障电机被识别为有故障的概率。

无故障电机诊断虚警率如表3 所示,反映了没有故障的电机被误判为故障的概率。

由表3 可以看出,基于布谷鸟搜索算法的贝叶斯网络分类器具有较高的故障诊断准确率,同时虚警率较低。笔者分别对比不同数据量下Hilbert变换对诊断精度的影响: 每组数据序列由500 个样本点或者1000 个样本点构成。在同样的200 组不同故障数据序列下进行模型构建和验证。可以看出,本研究的故障诊断框架不对样本规模敏感,以采集500 个电流数据的样本点进行故障诊断识别仍然有较高的诊断准确率。而且其他贝叶斯网络分类器也都能达到不错的分类精度,这说明提取的边际谱特征包含有电机故障的信息,能够用来对电机故障进行识别、诊断。

4结束语

针对现有异步电机故障诊断方法误判率高的问题,本研究提出了采用布谷鸟算法的贝叶斯网络的异步电机故障诊断新方法,在原有贝叶斯网络分类器原理的基础上提出基于布谷鸟搜索的贝叶斯网络结构寻优方案,提高贝叶斯网络分类器的预测性能。

实验表明,结合HHT的边际谱理论和贝叶斯网络分类器的诊断方案具有较高的诊断准确率,克服了传统电流频谱方案的抗干扰能力差,误判率高的问题,基于布谷鸟搜索算法学习出的贝叶斯网络结果具有较高的分类效率。

参考文献

[1]许允之,龚乃玮,葛垚,等.基于信息融合方法的电机故障诊断研究[J].华北电力大学学报:自然科学版,2012,39(3):53-58.

[2]姜万录,李宁宁,朱勇.基于小波脊线的滚动轴承故障诊断方法[J].振动与冲击,2015,10(14):1-6,10.

[3]方芳,杨士元,侯新国,等.基于Park矢量旋转滤波的感应电机复合故障检测[J].武汉大学学报:工学版,2008,41(5):111-115,136.

[4]许允之,赵月南,仝年,等.基于混沌理论的异步电机偏心故障诊断的研究[J].大电机技术,2015(3):4-7,40.

[5]张家良,曹建福,高峰.结合非线性频谱与贝叶斯网络的复杂装备传动系统故障诊断[J].电机与控制学报,2014,18(3):107-112.

[6]高翔,王守城,石晓慧.基于贝叶斯网络的垃圾压块机可靠性分析[J].机电工程,2015,32(1):64-66.

[7]YANG X S,DEB S.Engineering optimisation by cuckoo search[J].International Journal of Mathematical Modelling and Numerical Optimisation,2010,1(4):330-343.

[8]LI H,.KWONG S,.YANG L,et al.Hilbert-huang transform for analysis of heart rate variability in cardiac health.[J]IEEE/ACM Transactions on Computational Biology and Bioinformatics,2011,8(6):1557-1567.

[9]沈佳杰,林峰.基于混合自适应Memetic算法的贝叶斯网络结构学习[J].系统工程与电子技术,2012(6):1293-1298.

贝叶斯网络 篇9

贝叶斯网络是一种概率网络, 它是基于概率推理的图形化网络, 以下是贝叶斯网络中涉及的概率知识:

(1) 条件概率[2]:设A, B是两个事件, 且P (A) >0, 称P (B|A) =P (AB) /P (A) 为在事件发生的条件下事件发生的条件概率。

(2) 联合概率[2]:设A, B是两个事件, 且P (A) >0, 它们的联合概率为:P (AB) =P (B|A) /P (A) 。

(3) 全概率公式[2]:设实验的样本空间为S, A为E的事件, B1, B2, …, Bn为E的一组事件, 满足:互不相容; (3) P (Bi) >0, i=1, 2, …, m。则有全概率公式:。

(4) 根据 (1) 、 (2) 和 (3) , 很容易得到贝叶斯公式[26]:。

(5) 先验概率[2]:根据历史的资料或主观判断所确定的各种事件发生的概率, 该概率没能经过实验证实, 属于检验前的概率, 称之为先验概率。

(6) 分隔定理 (d-seperation) [3]:设A, B, C为网络节点中三个不同的子集, 当且仅当A与C间不存在以下情况的路径时, 称B隔离了A和C, 记作:D:

(1) 所有含有聚合弧段的节点或其子节点是B的元素。

(2) 其它节点不是B的元素。

(7) 条件独立性假设[4]:依据分隔定理, 如果B隔离了A和C, 则认为A和C是关于B条件独立的, 即:P (A|C, B) =P (A|B) 。

2贝叶斯网络的结构

贝叶斯网络又称信念网络, 一个典型的贝叶斯网络由两部分组成[5]:第一部分是一个有向无环的图形结构G, 其中每个节点代表一个变量, 节点之间的有向弧段反映了变量间的依赖关系, 指向节点X的所有节点称为X的父节点, 图1为一个贝叶斯网络的拓扑结构;另一部分是与每个节点相关的条件概率表 (CPT, conditional probability table) , 该表列出了此节点相对于其父节点的所有可能的条件概率。

贝叶斯网络规定以节点Xi的父节点为条件, Xi与任意非Xi子节点条件独立, 按此约定有n个节点的贝叶斯网络的联合概率分布为[6]:

其中π (Xi) 是网络中Xi父节点集合∏ (Xi) 中的变量取值后的一个组合。若Xi没有父节点, 则集合∏ (Xi) 为空, 即P (Xi|π (Xi) ) =P (Xi) 。

3贝叶斯网络的推理

贝叶斯网络的推理通常是从先验知识入手, 按贝叶斯规则沿网络弧线层层演进而计算出我们感兴趣的概率。依据贝叶斯学派的观点, 概率推理本质上就是信任度的传播, 按推理方向贝叶斯网络有三种重要的推理模式[7]。

3.1因果推理或自上而下的推理

此模式是从先验概率开始的正向推理过程。之所以称为因果推理, 是因为贝叶斯网络中相连两节点表达了一种直接的因果关系。以图1为例, 求概率:, 因果推理的过程可总结如下:

(1) 将询问节点 (X4) 的其它父节点 (未在条件中出现) 加入到询问节点, 条件不变, 对新节点的所有状态求和。

(2) 利用贝叶斯规则将和式中的每一项展开, 因为伴随询问节点的CPT只提供了形式为P (Xi|π (Xi) ) 的概率。

3.2诊断推理或自下而上的推理

此模式是在已知结论的前提下, 推断出可能引发该结论的原因。以图1为例, 求概率P (X1|X4) 的过程为:, 其中P (X4|X1) 需利用因果推理求得。所以诊断推理的主要一步是将概率转换为因果推理的形式。

3.3解释推理

问题中已经包含了原因和结果, 这时如果要推断其它导致该结果的原因, 就需要运用解释推理。解释推理可概括为:诊断推理中运用因果推理。例如求P (X1|X4, X2) 的过程:, 这就是解释推理, 其中P (X4|X2) 也需要利用因果推理, 本质上解释推理是前两种模式的混合。

4结束语

综上, 贝叶斯网络是一系列变量的联合概率分布的图形表示。实际上这种表示法最早被用来对专家的不确定知识编码, 今天它们在现代专家系统、诊断引擎和决策支持系统中发挥了关键作用。贝叶斯网络的一个被经常提起的优点是它们具有形式的概率语义并且能作为存在于人类头脑中的知识结构的自然映像。这有助于知识在概率分布方面的编码和解释, 使基于概率的推理和最佳决策成为可能。论文主要介绍了贝叶斯网络的概率基础、拓扑结构以及贝叶斯网络的推理。

参考文献

[1]王军, 周伟达.贝叶斯网络的研究与进展[J].电子科技, 1999 (8) :5-7.

[2]盛骤, 谢式千, 潘承毅.概率论与数理统计[M].北京:高等教育出版社, 第2版, 1989:18-25.

[3]Judea Pearl.Causal diagrams for empirical research.Biometrika, 1995, 82 (4) :669-709.

[4]余东峰, 孙兆林.基于贝叶斯网络不确定推理的研究[J].微型电脑应用, 2004, 20 (8) :6-8.

[5]Luis M.de Campos, Juan M.Fernández-Luna, Juan F.Huete.Clustering terms in the Bayesian network retrieval model:a new ap-proach with two term-layers.Applied Soft Computing, 2004, 4:149-158.

[6]Berthier Ribeiro-Neto, Iimério Silva, Richard Muntz.Bayesian network models for IR.Soft Computing in Information Retrieval Tech-niques and Application, 2000:1-32.

上一篇:量子粒子群算法下一篇:卫生监督专业