不确定推理(共4篇)
不确定推理 篇1
摘要:针对专家系统多证据规则中各证据对结论的重要程度不同,且同一证据在不同的时期对结论的重要程度也不同的特点,提出了为证据引入动态加权因子的不确定推理方法。该方法使证据的权值在不同时期能够根据证据发生的次数适时改变,使证据的权值分布更合理,使不确定推理的结论真值更准确;还提出了动态规则强度和动态规则阈值的计算方法,并通过算法实例验证了该方法的有效性和实用性。
关键词:动态加权,不确定推理,动态规则强度,动态阈值
0引言
目前,针对不确定性推理,众多学者已经提出了多种算法。文献[1]针对极值法推理比较极端,丢失信息较多,提出了修正权值法,该算法根据各证据重要程度的不同很好地区分了各证据重要程度的差异,借助对数函数对真值传播结果进行分析处理,区分了可信度分布的差异。文献[2]提出了一个新的不确定推理算法,该方法不受函数的影响,具有较好的泛化能力。文献[3]提出了加权模糊逻辑推理,该算法表达式简单,易于理解和计算。在上述算法中,各证据在不同的使用期具有相同的重要性,针对此本文提出了动态加权不确定推理真值计算方法,根据证据在不同使用期重要性不同的特点,给规则中每个证据引入了动态加权因子,使同一证据在不同的使用期具有不同的权值。
1动态加权不确定推理的规则表示
专家系统的不确定推理方法中,一条规则的各证据所包含的信息量不同,对结论的重要程度也不同,而且同一证据在不同时期具有不同的重要性。为此,本文给规则中每个证据引入动态加权因子,使不同证据具有不同的权值,同一证据在不同时期也具有不同的权值。本文采用的规则表示如下:
IF e1(w1,CF1) e2(w2,CF2)…en(wn,CFn) THEN h(RC,λ) 。
其中:ei为证据,i=1,2,…,n;CFi为证据的真值;h为规则的结论;RC为规则强度,指规则中所有证据为真时规则对结论的影响程度;λ为规则阈值,它是相应规则是否激活可用的一个限度,0<λ≤1;wi为证据的加权因子,取值范围为[0,1],且满足归一条件。
2动态加权不确定推理真值的计算
2.1 动态加权的引入
证据权值的确定是典型加权不确定推理过程中的一个重要问题。权值大小反映了在不确定推理过程中各证据的相对重要程度,取值的恰当与否将直接影响到不确定推理结论的好坏。本文中证据的初始值由某领域专家给出,推理过程中证据的相对重要程度是根据概率统计的结果变化的,其取值范围为[0,1],且满足归一条件。证据的加权因子计算公式为:
undefined。 (1)
其中:N(h)为规则结论发生次数;Ni(ei/h)为规则结论发生时证据ei发生的次数。
2.2 证据组合的不确定性计算
动态加权不确定性推理中结论的真值不仅和证据的真值有关,而且与同一证据在不同使用期的不同权值有关。为此,本文根据不确定推理模型中多证据的合取组合的不确定性总是小于它们的析取组合的不确定性这一原则,提出如下动态加权不确定推理真值的计算公式。
(1) 当规则证据之间是合取关系时,n个证据的合取组合真值计算公式为:
undefined。 (2)
(2) 当规则证据之间是析取关系时,n个证据的析取组合真值计算公式为:
undefined。 (3)
其中:E为n个证据的组合,合取关系时E=e1∧e2∧…∧en,析取关系时E=e1∨e2∨…∨en;undefined规则所有证据绝对真值之和;E(T)为证据组合真值的修正量,当为精确推理时,E(T)=0。
2.3 规则结论的不确定性计算
专家系统的规则强度RC一般由领域内专家设定,没有充分利用用户给出的全部证据信息。本文提出动态规则强度RC′能够使各规则强度随着获取的证据信息不同而改变,从而使不确定推理结论更准确。动态规则强度RC′的计算公式为:
undefined。 (4)
其中:a为用户给出的所有证据总数;b为用户给出的所有证据中不属于要匹配规则证据的总数。b=0时,表明用户给出的所有证据只属于某一规则,即RC′=RC;反之,随着b增大,即不属于某规则的证据信息量的增加,该RC′会逐渐减小。
不确定推理结论真值的计算公式为:
CF(h)=RC′×CF(E) 。 (5)
另外,规则阈值λ一般也是由某领域内专家给出,本文通过使用规则中各证据的动态权值,在文献[4]规则阈值计算公式的基础上,提出了动态规则阈值λ的计算公式:
λ=max(undefined) 。 (6)
3算法举例
根据文献[5]中的车辆故障介绍,设在车辆磨合期和正常工作期,专家给出的规则如下:
IF e1(0.4) e2(0.4) e3(0.2) THEN h1(0.8,0.7) 。
其中:e1为电磁开关铁芯行程太短;e2为辅助线圈短路或断路;e3为飞轮齿严重磨损或打坏;h1为发动机空转。
在车辆损耗期,用文献[3]中的算法计算得出的规则证据权值不变,规则不变;而本文根据概率统计在某时刻得出:车辆损耗期间出现发动机空转的次数为3,发动机空转的故障发生时,电磁开关铁芯行程太短发生次数为1,辅助线圈短路或断路发生次数为1,飞轮齿严重磨损或打坏发生次数为3。则由公式(1)计算得出的规则如下:
文献[3]:IF e1(0.4) e2(0.4) e3(0.2) THEN h1(0.8,0.7)。
本 文:IF e1(0.4) e2(0.2) e3(0.6) THEN h1(RC′,λ)。
此时,检测到故障电磁开关铁芯行程太短、辅助线圈短路或断路和排气系统阻塞3个故障原因,为计算简便,其真值取为1,即CF(e1)=1,CF(e2)=1,CF(e4)=1(e4为排气系统阻塞),用文献[3]中的算法得出的结论真值为:
undefined。
本文算法得出的结论真值为:
undefined。
文献[3]算法中各个时期的阈值都为0.7,而本文在车辆的磨合期和正常工作期的阈值λ=0.7,损耗期的阈值λ=0.8。
由文献[3]算法得出的结论真值CF(h1)=0.576<0.7和本文算法得出的结论真值CF(h1)=0.149<0.8都推理出由电磁开关铁芯行程太短、辅助线圈短路或断路和排气系统阻塞3个故障原因不能够导致发动机空转的结论。但本文算法计算结果得出的发动机空转的结论真值小,阈值大,所以结论真值更准确。由车辆故障诊断的实际情况来看,在损耗期,电磁开关铁芯行程太短、辅助线圈短路或断路是发动机空转的2个次要的故障原因,对发动机空转的影响很小,因此,本文算法更有效,更符合车辆故障发生时的实际情况。此外,本文算法还考虑了不属于匹配规则的排气系统阻塞这个证据信息,从而使规则强度更合理,更符合实际。
4结论
在动态的加权不确定推理过程中,证据权值的确定是一个重要问题。权值的大小反映了不确定推理过程中各证据的相对重要程度,取值的恰当与否将直接影响到不确定推理结论的好坏。本文算法表达式简单、易于理解和计算,而且知识表示和推理更准确。此外,本文还提出了动态规则强度和动态阈值的计算方法,合理有效地解决了规则强度因人为设定而不能根据证据信息量多少而改变的问题,比传统方法更具有准确性和实用性。
参考文献
[1]陈明亮,李怀祖.基于规则的专家系统中不确定性推理的研究[J].计算机工程与应用,2000,36(5):50-53.
[2]范九伦,马远良.新的不确定推理真值传播计算方法[J].系统工程理论与实践,2001,21(2):102-107.
[3]范九伦.加权模糊逻辑真值传播的计算方法[J].系统工程理论与实践,2002,22(9):15-21.
[4]曹顺安,胡家元,葛磊.基于数据挖掘及可信度理论的火电厂水汽化学过程故障诊断方法[J].计算机与应用化学,2010,27(4):523-527.
[5]林晓斌.基于不确定推理的车辆故障诊断专家系统[D].大连:大连理工大学,2007:40-44.
不确定推理 篇2
1 主观Bayes方法
主观Bayes方法又称主观概率论, 是杜达 (R.O.Duda) 等人在1976年提出的, 是一种不确定性推理模型, 又称为主观概率论。成功的应用在了地矿勘探专家系统PROS-PECTOR中。这一方法在文献[2, 3]有详细的描述。
(1) 结论不确定性的合成算法思想。
(2) 假设有n条知识都支持同一个结论H, 而且这些知识都分别是相互独立的证据Ei (i=1, 2, …, n) , 且每个证据对应的观察分别是Si (i=1, 2, …, n) 。在此情况下求P (H/S1, S2, …, Sn) 的后验概率的方法如下。
先分别对每条知识求出H的后验几率, 然后在用如下公式求出所有观察下的后验几率:
(2) 结论不确定性的更新算法思想:如果n条知识都支持同一个结论, 先用第一条规则对结论的先验概率进行更新, 再将得到的更新概率作为第二条规则的先验概率再对结论进行更新, 依次类推, 直到所有的规则都更新使用完。设LSi (i=1, 2, …, n) 表示第i条规则成立的充分性, 用于指出证据Ei对结论H为真的支持程度, 而LNi (i=1, 2, …, n) 表示第i条规则成立的必要性, 用于指出证据Ei对结论H为真的必要性程度。P (H) 表示结论H的先验概率。那么, 用如下公式求出结论H的后验概率P (H/S1, S2, …, Sn) :
2 结论不确定性的算法设计
在主观Bayes方法中涉及到了知识的充分性量度LS和必要性量度LN, 因此, 在设计算法中, 我将知识作为一个对象处理, 且知识包含两个属性 (LS, LN) , 即充分性量度LS和必要性量度LN。对于推理过程, 如图1所示。
求后验几率的算法设计:
算法中, ClassE类包含LS和LN属性, 度量产生式规则的不确定性。参数p表示结论H的先验概率P (H) , 参数e表示单条知识ClassE类的对象, 算法结果返回证据E出现时将结论H的先验概率, P (H) 更新为后验几率O (H/E) , 在算法中还应用到了将概率转化为几率的算法, 此算法有概率与几率的关系可设计一重载方法为:
算法中参数p表示概率, 算法结果返回几率函数值。
2.1 结论不确定性的合成算法
关于结论不确定性的合成算法, 可先对每条知识分别求出后验几率, 再由公式 (1) 、 (2) 进行算法设计:
算法中参数n表示n条知识都支持相同的结论的集合, 参数p表示知识对结论H的先验概率P (H) , 参数e表示一条知识对象, 算法结果综合每条知识的合成算法的后验概率值。
2.2 结论不确定性的更新算法
结论不确定性的更新算法思想, 设计流程图如图2所示。
详细算法代码设计如下:
算法中参数n表示n条知识都支持相同的结论的集合, 参数p表示知识对结论H的先验概率P (H) , 参数e表示一条知识对象, 算法结果返回更新后的后验概率值。
3 主观Bayes方法算法求解结果
应用上述Java算法, 首先读取文本文件“Reliability_knowledge_data.txt”的数据, 文本文件如图3所示。
结果如图4所示。
在误差允许的范围内, 两种方法得到的结果是一致的。
4 结论
本文根据知识不确定性推理的主观Bayes方法的求解思想, 设计了基于主观Bayes方法的不确定性推理的合成与更新算法, 并在Java平台上实现了这一算法。从实验结果来看, 我们的算法结果正确, 两种算法的结果一致, 实现了不确定推理问题求解的自动化。
参考文献
[1]石纯一, 黄昌宁, 王家廞.人工智能原理[M].北京:清华大学出版社, 1993.
[2]张仰森, 黄改娟.人工智能实用教程[M].北京:北京希望电子出版社, 2002.
[3]王万森.人工智能原理及其应用[M].2版.北京:电子工业出版社, 2007.
[4]刘玉凤.Bayes概率在不确定性方法中的应用[J].辽宁教育学院学报, 2002 (9) :1-2.
不确定推理 篇3
在火电厂中, 水汽品质直接关系到机组的正常运行, 水汽循环系统中的结垢、积盐和腐蚀, 绝大部分是由水汽品质不良引起的[1,2]。对导致水汽品质恶化的故障进行迅速准确的诊断, 从而指导运行人员及时采取处理措施, 具有重要意义。在水汽化学过程中, 故障及故障征兆之间, 包含着不确定关系[3]。文献[4]等采用基于模糊模式识别的推理方法来诊断此类模糊关系, 存在着无法区别各征兆的重要性差异、少数参数值缺失将直接影响后续判断等问题。同时, 目前未见文献报道针对整个水汽化学过程的诊断方法。本文吸收了可信度推理的优点, 采用可信度及模糊识别相结合的诊断方法, 率先提出以水汽化学过程中各子系统为分析单元, 建立各自的诊断模型块, 并设定各模型块间跳转条件, 从而构成了一个完整的水汽化学过程故障诊断系统模型。本模型能够在参数值获取不全、仪表或取样过程异常等情况下, 依然具有推理简单、反应灵敏、准确性高、适应性强等优点, 具有较高的理论意义和重要的实用价值。①
2 不确定推理的理论描述[5,6]
在火电厂水汽化学过程中, 故障征兆的表示带有模糊性, 其与故障原因之间的关系也是非线性的, 需采用不确定理论对上述知识进行处理。根据计算方法的不同, 不确定推理可以分为基于概率理论的不确定推理、基于可信度理论的不确定推理和基于模糊理论的不确定推理。本文采用基于可信度理论的不确定推理进行预判断, 采用基于模糊理论的不确定推理完成后续诊断。
2.1 可信度推理
根据经验对一个事物或一件事情的相信程度称为可信度 (CertaintyFactor) 。带证据权值与规则阈限的可信度表示为:
(1) wi称为证据ei的权值, 取值范围一般规定为0≤wi≤1, i=1, 2, …, n, 且应满足归一条件,
如果证据ei对结论h成立的重要性较高, 则应使ei具有较大的权值。
(2) 对组合证据E:
n个证据合取的可信度用下式表示:
(3) λ为规则阈限, 它为规则能否被使用规定了限制。只有当规则中组合证据E的可信度CF (E) ≥λ时, 该规则才能被使用。其取值范围为0<λ≤1。
证据权值与规则阈值可通过行业专家结合现场实际情况给出。
本文以故障征兆作为规则的证据来推导故障原因。故障征兆的可信度值CF (e) , 由指标测量值x通过升半矩阵模糊化函数式 (5) 计算得到。
设定以火力发电厂水汽质量标准[7]中, 指标的标准值作为a2值, 期望值作为a1值;若某指标无期望值, 则认为标准值的一半为a1值。当测量值高于a2值, 其对应征兆的可信度为1;当测量值低于a1值, 对应征兆的可信度为0;当测量值处于两者之间时, 对应征兆的可信度处于[0, 1]的范围内。
有时, 受仪表故障等情况干扰, 某些指标的检测值可能无法及时得到, 将直接影响后续诊断步骤的执行。为了增强诊断模型的适应能力, 使其在少量数据缺失的情况下, 仍然能正常地进行判断, 在信息处理过程中引入最大模糊度概念[8]。对于未能及时得到的指标值, 设定相应征兆的可信度为0.5, 使其不干扰结论的导出。
2.2 规则的冲突消解
设有以下两条规则:
R1:ife1 (w1) ∧e2 (w2) thenh1 (λ1) ;
若与数据库中已有证据经过匹配, 并计算得到:
则两条规则都可被使用, 而且它们发生了冲突。冲突消解的方法是:比较发生冲突的规则中组合证据可信度值, 选择可信度大的规则优先执行。
2.3 模糊模式识别
模糊模式识别方法属于模糊识别方法, 适用于针对识别对象本身的模糊性或识别要求上的模糊性。在水汽化学过程中, 可事先建立各子系统中故障征兆和故障原因之间的关系矩阵;用求距离方式, 判断待识别模糊集与关系矩阵中各模糊子集的接近程度。这就是基于距离原则的模糊识别方式, 该过程可分为以下三个步骤[9,10]:
(1) 识别对象的特征抽取。抽取与模糊识别问题有显著关系的特性指标 (故障征兆) , 并将待识别对象y用特征矢量y0=[CF (e1) , CF (e2) , …, CF (en) ]表示。特征抽取是否得当, 将直接影响到识别的结果。
(2) 建立隶属函数。一种待识别个体的模糊特性能否充分应用, 其关键在于能否获得 (或建立) 良好的隶属函数, 因此, 这一步是识别工作的关键。
(3) 识别判决。按最小距离原则对y0进行判决, 指出它应归于哪一类。
设待识别对象y0=[CF (e1) , CF (e2) , …, CF (en) ], 它与故障模糊模式各子集之间的距离为:
式中:CF (ej) ———待识别对象y0中征兆xj的可信度值, j=1, 2, …, n;uij———典型故障模糊模式中, 故障原因y的特性指标, i=1, 2, …, n。
由式 (6) 求得距离后, 若di (y0, yi) =min[d1 (y0, y1) , d2 (y0, y2) , …, dn (y0, yn) ], 则认为y0归属于yi所代表的故障模糊模式, 判定故障原因为yi。
3 故障诊断过程
3.1 水汽化学过程故障机理分析
现仅以某电厂300MW汽包炉凝结水系统为例, 分析故障机理。根据专业知识并结合电厂实际情况, 提取出能及时反映故障情况的水汽及热工指标17个, 作为故障征兆, 以x1, x2, …, x17表示;故障原因14个, 以y1, y2, …, y14表示。
E1:y1凝汽器泄漏时主要征兆有:x1热井氢电导率高、x2凝结水氢电导率高、x4凝结水钠高;次要征兆有:x3凝结水硬度高、x5凝结水硅高、x6凝结水溶氧高、x14凝汽器真空度低。
E2:y2凝汽器真空系统不严密时主要征兆有:x6凝结水溶氧高、x14凝汽器真空度低;次要征兆有:x17凝结水过冷度大。
E3:y3凝结水泵盘根处漏气时征兆有:x6凝结水溶氧高。
E4:y4凝汽器后系统漏入生水时主要征兆有:x2凝结水氢电导率高、x4凝结水钠高、x5凝结水硅高;次要征兆有:x3凝结水硬度高、x6凝结水溶氧高。
E5:y5过冷度高使凝结水溶氧高时征兆有:x6凝结水溶氧高、x17凝结水过冷度高。
E6~E7:y6, y7补给水品质不合格时征兆有:x2凝结水氢电导率高、x12补给水电导率高;或x5凝结水硅高、x10补给水硅高。
E8~E9:y8, y9疏水品质不合格时征兆有:x2凝结水氢电导率高、x13疏水电导率高;或x3凝结水硬度高、x11疏水硬度高。
E10:y10热井水位高影响除氧时征兆有:x6凝结水溶氧高、x15热井水位高。
E11:y11蒸汽冲刷沉积物时主要征兆有:x1热井氢电导率高、x2凝结水氢电导率高、x16机组负荷波动大;次要征兆有:x4凝结水钠高、x5凝结水硅高。
E12~E14:y12~y14过热蒸汽品质不合格时征兆有:x2凝结水氢电导率高、x7过热蒸汽氢电导率高;或x4凝结水钠高、x8过热蒸汽钠高;或x5凝结水硅高、x9过热蒸汽硅高。
3.2 凝结水系统诊断模型块中的规则信息
每个诊断模型块应建立相应的诊断规则, 凝结水系统诊断模型块的规则信息如下:
(1) 可信度推理规则。
依据上部分机理分析, 整理出相应的凝结水系统故障可信度分析表, 见表1。
(2) 模糊识别规则。
由表1可见, 有时诊断模型可从凝结水系统诊断模型块直接跳转至过热蒸汽系统诊断模型块 (如故障y14) , 或直接得出诊断结果 (如故障y6) , 此类故障无须在本模型块中作进一步诊断, 在整理模糊识别规则时, 应剔除该类故障及征兆。整理出凝结水系统故障模糊识别表, 见表2。
3.3 故障诊断模型执行流程
本文中诊断模型的执行流程如图1所示, 主要包括下述步骤。
(1) 读取数据。诊断模型依据设定频率读取测得的指标值, 将其存储于原始数据库中, 供后续步骤调用及作出日常报表。
(2) 判断是否存在异常。当读取的数据中无超标值时, 显示系统无故障;当出现异常测量值时, 后续诊断步骤被触发。
(3) 计算故障征兆可信度。利用升半矩阵模糊化函数对本次采集的指标值进行模糊化, 计算各征兆的可信度。
(4) 计算组合证据可信度。根据输入指标类别, 调用相应子系统模型块中的可信度分析表, 计算各规则的组合证据可信度。
(5) 分析可信度计算结果。只有存在大于等于阈限的项时, 才可能进行后续诊断, 否则认为本次采集的异常数据是由取样测量过程产生的。
(6) 判断直接得出结果或跳转至其他模型块的规则中, 组合证据可信度值是否大于阈限, 即是否可直接得到诊断结果或需跳转至其他诊断模型块, 否则执行下一步。
(7) 进行模糊模式识别。调用当前诊断模型块中的模糊识别规则, 依据最小距离原则判定故障原因。
4 诊断实例
该电厂某时刻凝结水系统的17个故障征兆的指标测量值为:热井氢电导率:0.30μS/cm;凝结水氢电导率:0.31μS/cm;凝结水硬度:0.63μmol/L;凝结水钠:9.13μg/L;凝结水硅:17.58μg/L;凝结水溶氧:2.05μg/L;过热蒸汽氢电导率:0.21μS/cm;过热蒸汽钠:4.06μg/kg;过热蒸汽硅:15.32μg/kg;补给水硅:12.6μg/L;疏水硬度:2.72μmol/L;补给水电导率:0.13μS/cm;疏水电导率:未知;凝汽器真空度情况:未知;凝结器热井水位:1 160mm;机组负荷:正常;凝结水过冷度:0.9℃。
执行步骤2:后续诊断步骤被触发。
执行步骤3:调用式 (5) 进行模糊化计算, 各征兆的可信度见表3。
执行步骤4:调用表1中的规则信息, 计算出各规则中组合证据的可信度值, 见表4。
执行步骤5:存在CF (E1) >0.7、CF (E4) >0.7, 大于规则阈限。
执行步骤6:本次诊断无法直接得出结果, 并且无需跳转至过热蒸汽系统诊断模型块, 故继续执行后续识别步骤。
执行步骤7:将待识别对象表示为y0=[CF (e1) , CF (e2) , CF (e3) , CF (e4) , CF (e5) , CF (e6) , CF (e14) , CF (e15) , CF (e16) , CF (e17) ]= (1.0, 1.0, 0.63, 1.0, 0.52, 0, 0.5, 0, 0, 0.8) , 根据冲突消解原则, 将其依次与表2中第1个和第4个子集, 按式 (6) 进行求距离运算, 以确定故障原因。计算结果:
依据模糊识别的最小距离原则, 判定导致本次异常情况的故障原因是“凝汽器泄露”。现场实际检查表明, 采集此组数据时正处于该机组凝汽器泄露初期。可见, 该诊断模型具有很强的适用能力, 能够在故障初期, 征兆尚未完全出现、部分征兆值未能获取等情况下得到正确结果。
5 结论
(1) 本文以火电厂水汽化学过程中各子系统为研究单元, 建立各自诊断模型块, 并设定各模型块间跳转条件, 构建了一个适用于整个水汽化学过程的诊断系统模型。
(2) 本文将可信度推理与模糊识别相结合进行故障诊断, 发挥了各自的优势。通过可信度分析, 区别了各征兆对导出结论的重要程度差异, 设定了模型块间跳转条件, 并对故障进行了预判;采用基于最小距离原则的模糊模式识别判断故障原因, 合理利用了所有征兆信息, 能较快速准确地获得诊断结果
(3) 本文利用故障征兆可信度, 进行模糊模式识别, 避免了直接将其表示为0或1, 而造成信息大量丢失的情况发生;引入最大模糊度概念, 减小了信息未能及时获取等情况对诊断过程的影响, 使该诊断模型具有更强的适应能力。
参考文献
[1]曹长武, 宋丽莎, 罗竹杰.火力发电厂化学监督技术[M].北京:中国电力出版社, 2001.
[2]李培元.火力发电厂水处理及水质控制[M].北京:中国电力出版社, 1999:386-489.
[3]李玉荣.模糊专家系统在火电厂故障诊断中的应用研究[D].北京:华北电力大学, 2006.
[4]王培红, 朱玉娜, 贾俊颖, 等.模糊模式识别在凝汽器故障诊断中的应用[J].中国电器工程学报, 1999, 10 (19) :46-49.
[5]尹朝庆, 尹皓.人工智能与专家系统[M].北京:中国水利水电出版社, 2001:211-230.
[6]牛玉广, 胡晓艳, 李玉荣.运行故障知识表达及模糊专家系统诊断[J].控制工程, 2007, 14:99-101.
[7]GB/T12145-1999, 火力发电机组及蒸汽动力设备水汽质量[S].
[8]李安贵.模糊数学及其应用[M].北京:冶金工业出版社, 2005.
[9]范圣平, 曹顺安, 张晋.模糊数学在凝汽器故障诊断中的应用研究[J].汽轮机技术, 2003, 2 (45) :113-115.
不确定推理 篇4
电力系统状态估计利用实时量测系统的冗余度来提高数据精度,自动排除随机干扰所引起的错误信息,估计或预报系统的运行状态,是能量管理系统的基础和核心环节[1]。传统的状态估计、不良数据辨识以及结线分析都是建立在电力系统开关遥信量均为正确的基础上[2]。如果在有拓扑错误的网络模型上进行状态估计,将会导致状态估计结果不可信, 进而影响到其他基于网络分析实时模型的高级应用[3]。目前提出的拓扑错误辨识方法主要有规则法[3-5]、新息图法[6]、广义状态估计法[7-9]、转移潮流法[10]、最小信息损失法[11]等。 其中规则法早在20世纪90年代就已在欧洲电网中得到应用,该方法快速、简单、适应性好,不存在收敛失败的问题, 是一种有效的拓扑错误辨识方法。
随着智能电网的发展,智能变电站已在国内得到推广建设,智能变电站拥有功能更加强大的计算机监控系统和种类更丰富的量测数据,有利于实现变电站拓扑错误辨识。近年来,变电站拓扑错误辨识方面的研究受到了广泛关注。变电站模型小、数据冗余度高,有利于进行拓扑错误辨识。文献[12] 建立了变电站三相物理模型,在此基础上提出了一系列不良数据辨识和拓扑错误辨识的通用规则,但没有充分利用多源数据,也没有给出解决规则间冲突的方法。文献[13]针对配电网变电站提出了简单的拓扑错误辨识规则,但没有考虑三相模型、多源数据,且规则过于简单,对复杂错误的辨识存在困难。 文献[14]归纳了元件、间隔、电压等级等多空间尺度的关联性规则,考虑了多时间断面的关联规则,提出了基于多源多时空规则的变电站拓扑检错方法,但没有考虑各种数据和规则的可信度不同的问题,且对接线方式不同的变电站模型的适应性较差。
本文利用变电站多源冗余数据,根据不确定性推理方法,对拓扑错误辨识规则建立了一个不精确推理模型,赋予每个数据和规则相应的可信度,通过不确定性推理的传播算法和合成算法得到每个开关的可信度值,从而辨识出拓扑错误。
1不确定性推理
不确定性推理方法自20世纪70年代提出以来得到了广泛研究。不确定性推理是指从不确定性的初始证据出发,通过运用不确定性的知识,最终推理出具有一定程度的不确定性、但是又合理或者似乎合理的结论的思维过程[15]。
本文将不确定性推理引入状态估计领域。变电站拓扑错误辨识的证据及规则都具有不确定性,利用普通的规则法时,忽视了这种不确定性,因而得到的结果不一定可靠。因此,利用不确定性推理方法对变电站拓扑错误辨识建模,可以推理出合理的变电站拓扑结构。本文采用的基于确定因子的不确定性推理是美国斯坦福大学Shortliffe等人提出的一种不确定性推理方法。
1.1规则的不确定性表示
本文中的知识就是拓扑错误辨识的规则,可以表示为[16]:
式中:E表示证据;H表示结论;F(H,E)为该规则的强度,称为可信度因子。
F(H,E)的作用域为[-1,1]:F(H,E)>0表示该证据增加了结论为真的程度;F(H,E)<0表示该证据增加了结论为假的程度;F(H,E)=0表示证据E和结论H没有关系。 一般情况下,F(H,E)的值要由领域专家根据经验给出。
1.2证据的不确定性表示
拓扑错误辨识中的证据就是变电站内的多源冗余数据。证据的不确定性用证据的可信度F(E)表示。初始证据的可信度由用户在系统运行时提供, 中间结果的可信度由不精确推理算法求得。证据的可信度F(E)的取值范围同规则可信度一样,也是-1≤F(E)≤1。
当组合证据为多个单一证据的合取时:
则有
当组合证据是多个单一证据的析取时:
则有
1.3不确定性的传播算法
结论的不确定性通过不确定性推理的传播算法求出。若已知规则如式(1)所示,且证据的可信度为F(E),则结论的可信度F(H)为:
如果两条不同规则推出同一结论,但可信度各不相同,则可用合成算法计算综合可信度。若已知两条规则推出的结论可信度为F1和F2,则其综合可信度F1,2为:
2基于不确定性推理的规则建模
变电站自动化系统采集的有来自测控装置、保护装置和相量测量单元(PMU)的三相多源遥测和遥信数据。这些量测数据之间存在着大量的电气约束和运行约束。根据规则使用的数据类型及关系, 将变电站拓扑错误辨识的规则划分为四大类。本节根据不确定性推理,对规则进行描述归纳。下文中的规则强度只作为举例说明,应用中可根据实际情况进行调整。
本文以3/2断路器接线方式为例,阐述具体的规则和相关概念。典型的3/2断路器接线方式如图1所示。图中:TL为输电线路;PL为支路,本文中支路是指包含一个断路器和两端刀闸的一段线路; S为支路刀闸;CB为断路器;GS为接地刀闸。
2.1基于实时数据与设备状态关系的规则
2.1.1遥测数据
某一支路上,如果电流有功/无功量测大于门槛值,则该支路为闭合,且该支路上的断路器和刀闸都应为闭合状态;某一支路上,如果电流/有功/无功量测小于门槛值,则该支路有可能是断开的,因此,该规则的可信度应该是一个小于1的正数。
根据不确定性推理,以上规则可以描述成表1的形式。
表中:I,P,Q分别为电流、有功和无功量测;C和S分别为待求的当前断面的断路器、刀闸状态, 状态为1时表示闭合;上标为相别,取A,B,C;下标θ为数据来源,取1,2,3时分别表示测控、保护、 PMU;z为小正数的门槛值,各个公式中的门槛值根据具体情况而有所不同。
为了便于之后的合成算法,假设所有断路器和刀闸的状态均为闭合,每条规则都用来推理设备状态为闭合的可信度,因此,表1中的第2条规则的强度是负数。
2.1.2遥信数据
遥信数据包括断路器、支路刀闸以及接地刀闸的开合状态,遥信值为0时的开关状态为断开,为1时的开关状态为闭合。
根据不确定性推理理论,可以描述成表2的形式。表中:分别为断路器、支路刀闸和接地刀闸的遥信位置信息;G为待求的当前断面接地刀闸的状态。
对于某一断路器或刀闸,若某一来源的遥信既有总位置也有各相位置信息,则只利用分相遥信去判断各相位置;若对某一断路器或刀闸,某一来源的数据只有总位置信息,则判定该断路器或刀闸各相开合状态与总遥信一致。
2.2基于相邻设备间关系的规则
由于刀闸没有灭弧装置,需要与断路器配套使用,必须避免其带负荷合闸或拉闸。因此,对于某一条支路,若断路器为闭合状态,则刀闸也应该在闭合状态;若刀闸在断开状态,则断路器也应该在断开状态。
支路刀闸和接地刀闸匹配时(如图1中一条支路上的刀闸与支路所连接的接地刀闸之间属于匹配关系),根据变电站防误操作的规定,接地刀闸必须在相应支路刀闸分闸之后才能进行合闸操作,在支路刀闸合闸之前进行分闸操作,即两者不可能同时处于闭合状态。
在检修状态下,相邻设备的状态可能会不满足上述规则,因此在判断此类规则前,应先检测相关间隔或设备是否在检修状态。如果在检修状态,则跳过这段规则。
以上两条规则描述如表3所示。
2.3基于断面关系的规则
由于运行方式的约束,电力系统的运行状态在时间序列上具有连续性。当前运行状态是由上一时间断面的状态转移过来的,只可能是某几种固定的状态。而上一断面的数据是经过拓扑错误辨识过的,因此可信度较高,利用上一断面和当前断面的数据进行比较,可归纳出以下规则。
1)与上一断面比较,如果支路上的电流(功率) 没有明显改变,而断路器状态却发生改变,则断路器状态可疑。
2)对于一条支路,若上一断面断路器和两个刀闸的状态均为断开,当前断面断路器遥信为闭合,刀闸遥信为断开,则断路器状态错误,应该为断开;若上一断面3个设备状态均为闭合,当前断面断路器遥信为闭合,刀闸遥信为断开,则刀闸遥信错误,刀闸状态应该为闭合。
规则如表4所示。其中分别为上一断面遥测的电流值、通过拓扑错误辨识处理后的断路器和支路母线刀闸位置。利用断面关系时,由于遥信和遥测不同步,可能存在中间态。例如:开关状态已经改变,遥信将改变后的状态采集上传,但遥测却是改变前的数据。此时,要多考虑几个断面,根据前后两断面的数据对过渡态进行判断。
2.4基于三相状态的规则
输电网很少非全相运行,本文针对高电压等级的输电网,假设正常运行时都是全相的。对于任一开关,若其中两相的状态一致,那么第三相也应该是一致的,否则第三相状态可疑。此规则只应用于有分相开关遥信的开关,对只有总位置遥信的开关则无法判断。规则如表5所示。
3拓扑错误辨识流程
典型的变电站接线方式有3/2断路器、双母线、 单母线、双母线带旁路等,不同接线方式的规则也会有所区别,但拓扑错误辨识的步骤是相同的。拓扑错误辨识的流程如图2所示。
具体实现步骤如下。
1)假设所有开关状态都为闭合,此时所有状态都还没有经过证据和规则的判断,可信度为0。
2)为所有遥测量和遥信量赋予一个可信度值。
3)利用不确定性推理知识依次对每个开关进行不确定性计算,具体方法如下。
①如果对于某一开关,其所在支路的同一类型数据的遥测及开关遥信等数据满足某一条规则的条件,首先利用式(2)或式(3)计算证据的可信度,然后根据不确定性的传播算法(式(4))计算该条规则所得结论的可信度。
②将该可信度和该开关原来的可信度通过不确定性的合成算法(式(5))进行累加,并进入下条推理知识。所有规则判断完毕后,得到该开关的综合可信度。然后,对下一个开关进行同样的判断。
4)将最终得到的每个开关闭合状态的可信度, 与可信度门槛值进行比较。在不确定性推理中,当结论可信度为0时,表示无法判断结论是否正确。 因此,如果开关闭合的可信度的绝对值小于门槛值, 则无法判断开关闭合状态是否正确,处于不确定状态;如果可信度绝对值超过门槛值,且可信度为正时,则表示开关闭合状态可信,假设成立;如果可信度绝对值高于门槛值,且为负数时,则开关闭合状态不可信,开关的真实状态应该为断开。
5)将辨识后的正确开关状态上传到调度中心, 列出采集结果和辨识结果不一致的开关,对不确定的拓扑状态进行报警,利用人工判别开关状态,上传人工辨识结果,若无人工辨识,则上传其测控装置采集的原始遥信状态并进行可疑标记。
4问题讨论
在变电站拓扑错误辨识的实现过程中,会遇到一些实际问题,讨论如下。
1)本文提出的规则实例是3/2断路器接线间隔,对于其他类型的间隔,该方法同样适用,但需要对模型有所改动,如支路和支路刀闸等会存在一些差异。
2)对于不同配置的变电站,证据的可信度有所不同,要根据变电站实际情况进行初始化。有时甚至规则的可信度也会不同,如对于电压等级低的输电网可能不是处于全相运行,此时应当调低其第4类规则的规则强度。
3)开关闭合状态可信度的门槛值是经验值。不同的接线方式、量测冗余度,或者不同的证据可信度配置,都会影响门槛值的确定。在实际应用中,可首先利用几组试验结果,判定确定状态和不确定状态间的临界可信度,以确定门槛值。
4)基于断面的规则需要多个断面数据,相对比较复杂,在一些设施简陋的变电站可能不具备几个断面的数据,就可以跳过这部分规则。多断面的规则本文列出了一部分,还有其他可以继续深入研究的规则,可以在后续实践中对其进行补充。
5算例分析
5.1算例设计
采用图1所示的3/2接线变电站物理模型进行算例研究。该段间隔内共包括3个断路器、6个支路刀闸、8个接地刀闸和3条支路、2条出线线路。
令所有断路器和支路刀闸三相均闭合,所有接地刀闸三相均断开,支路上均有电流流过。对于量测配置,令测控有各条支路上的电流、有功功率、无功功率的三相数据,断路器三相位置和总位置信息, 以及刀闸的总位置信息。令PMU有各条支路上的电流三相数据。令保护装置有各条支路上的电流三相数据和断路器的三相位置信息。上一断面的全部为真。给定各类遥测数据的可信度为0.6,各类遥信数据的可信度为0.5。
假设CB1的测控A相位置存在拓扑错误,遥信为断开,支路①上的测控电流三相量测为坏数据,均为0。刀闸S3和S4的测控遥信错误,为断开。CB3的测控B相、C相遥信错误,为断开,支路③上保护三相电流为坏数据,均为0。
5.2结果分析
利用本文的变电站拓扑错误辨识方法,首先对CB1的可信度进行计算。
CB1所在支路有测控的电流、有功功率、无功功率三相数据,PMU的电流三相数据,以及保护的电流三相数据。一条规则对同类数据只判断一次,利用表1中的规则判断完毕后,CB1的A,B,C三相开关闭合的可信度分别为0.909,0.909,0.909。
CB1有测控的三相遥信和保护的三相遥信,利用表2中的规则判断完毕后,CB1的A,B,C三相的开关闭合可信度分别为0.909,0.977,0.977。CB1上的数据不满足表3至表5的规则,跳过表3至表5,利用5.1节的三相状态规则对CB1进行判断,得到最终CB1的A,B,C三相的开关闭合综合可信度分别为0.955,0.977,0.977。故CB1的三相状态应该全为闭合。
对其他的开关进行拓扑错误辨识,得到的结果如表6所示。本算例的可信度门槛值设定为0.7。 辨识状态中1代表闭合,0代表断开,-1表示状态不确定。
从辨识结果可以看到,在拓扑错误和坏数据同时存在的情况下,本文方法辨识出了所有的拓扑错误。对于CB3的B相和C相,与之相关的证据有多个错误,利用这些证据很难判断其真实状态,因此, 状态估计结果显示其状态不确定,需人工辨识。
6结语
本文提出了基于不确定性推理的变电站拓扑错误辨识方法,利用变电站内来自测控装置、保护装置和PMU的多源冗余数据,建立针对变电站拓扑错误辨识规则的不精确模型,根据不确定性算法,实现了快速、准确的变电站拓扑错误辨识功能。该方法提高了开关的辨识能力,通过计算综合可信度值,有效解决了规则冲突的问题。变电站是各种数据的源头,数据实时性和同步性高,有利于拓扑错误辨识的实现。利用本文方法可在变电站内剔除拓扑错误, 为调度中心状态估计提供正确的网络拓扑,从而可提高状态估计结果的可靠性,为其他高级应用和电网安全稳定运行提供基础保障。