网络故障诊断综述

2024-07-11

网络故障诊断综述(精选12篇)

网络故障诊断综述 篇1

1 网络故障的分类

引起网络故障的因素有很多种, 总体可划分为硬件故障和软件故障两类, 以下是几种常见的硬件和软件故障。

1.1 硬件故障

1.1.1 设备自身故障:

如网卡质量不良或有故障;网卡和主板PCI插槽没插牢导致的接触不良;网卡和网线接口存在问题;网线接头制作不良;网线接头部位或中间线路部位有断线;集线器质量不良;集线器供电不良;集线器和网线的接口接触不良;交换机质量不良;交换机供电不良;交换机和网线的接口接触不良。

1.1.2 设备与设备间故障:

如网卡和网卡之间发生中断请求和I/O地址冲突;网卡和声卡之间发生中断请求和I/O地址冲突;网卡和显卡之间发生中断请求和I/O地址冲突。

以上硬件故障中最常见的就是网线和网卡故障。

1.2 软件故障

1.2.1 设备驱动程序故障:如驱动程序与操作系统不兼容;驱动程序之间的资源冲突;驱动程序与主板BIOS程序不兼容;设备驱动程序没有安装好引起设备不能正常工作。

1.2.2 网络协议故障:如缺少相关的网络协议;网络协议和网卡绑定不当;网络协议设置不当。

1.2.3 网络服务方面故障;如Windows操作系统中共享文件和打印机方面的服务, 即安装Microsoft文件和打印共享服务故障。

1.2.4 网络表示方面故障:用户计算机在网络中的网络标识设置不正确, 可能会导致用户之间不能相互访问。

1.2.5 其他故障:这些问题与用户设置无关, 但和用户的某种操作有关, 例如大量用户同时访问网络造成网络拥挤甚至网络阻塞。

由软件设置引起的网络故障中, 最常见的是TCP/IP协议中的IP地址设置不当导致网络不通, 其次是网络标识设置不当引起的相互间无法访问。

2 网络故障的排除过程

2.1 识别故障现象

排除网络故障前, 必须确切地知道网络中问题所在, 例如网络中资源无法共享或找不到其他计算机。成功排除故障的首要任务就是判断识别故障现象。

识别故障现象时, 应该向操作者询问以下几个问题: (1) 用户最后一次网络正常的时间。 (2) 当故障现象发生时, 有哪些进程正在运行。 (3) 该进程是否曾经正常运行过。 (4) 如运行过这个进程后, 计算机有哪些改变。

2.2 详细描述故障的现象

对故障现象的详细描述尤为重要。管理员应注意出错信息, 仔细操作出错的程序。在故障排除前, 首先要收集相关故障现象的信息, 注意故障现象的细节, 因为这会为缩小问题范围提供有利的信息。然后详细描述问题和故障现象, 并及时记录, 而无需急于下结论。

2.3 分析导致故障的原因

如信息无法查看, 管理员应当分析导致故障的原因有哪些, 如网络设备故障、连接故障、硬件故障等等。

2.4 测试并排除故障

测试每一个可能导致网络故障发生的因素, 排除故障原因, 缩小故障范围。测试工作往往需要进行多次, 只根据一次测试就断定某一区域的网络是运行是否正常是不够准确的。在测试过程中, 当发现一个问题后是否应该停止, 答案是否定的, 应将所有任务测试我完为止。

2.5 隔离错误

经过以上的操作后, 已经基本知道故障的部位, 对于电脑的错误, 可以开始检查该电脑网卡是否安装好、TCP/IP协议是否安装并设置正确、Web浏览器的连接设置是否得当等一切与已知故障现象有关的内容。

2.6 故障分析

对网络故障处理完成后, 为避免以后出现类似的故障, 需要总结导致发生故障的原因, 拟定相应的对策, 采取必要的措施, 制定严格的规章制度。

3 网络故障原因

引起网络故障的原因多种多样, 常见的网络故障有网络协议、网络连接性问题、配置文件选项方面的故障。

3.1 网络协议

网络协议负责网络内的计算机与网络设备间的正常通信。没有网络协议, 所有的硬件只不过是各自为政的单机, 不能实现资源共享, 从而失去了网络的意义。

3.2 配置文件和选项

服务器、计算机中配置选项和配置文件设置不正确。如服务器权限的设置不当, 会导致资源无法共享的故障。网卡配置不当, 会导致计算机无法连接的故障。

3.3 网络连接性

网络连接性是网络故障中常见因素。连通性的问题通常涉及到网卡、网线、跳线、信息插座、交换机、集线器、路由器等设备和通信介质。如果其中任何一个设备损坏, 都会导致网络连接的中断, 可以通过软件和硬件工具进行连通性的测试和验证。

4 结束语

计算机网络是一个错综复杂系统, 要想顺利地诊断并排除网络故障, 需要网络管理员具备一定的知识和经验。对计算机硬件、网络设备、网络技术和协议, 故障诊断与排除工具及命令都充分的了解。网络故障诊断工作非常繁杂, 引起网络故障的因素多种多样。文章对网络故障的分类及排除过程做了详细的介绍, 并总结了网络故障的原因。

参考文献

[1]宋文重.浅析网络故障的诊断与解决方法[J].硅谷, 2008 (3) .

[2]霍扬, 龚俭.计算机网络故障分析及维护研究[J].硅谷, 2008 (7) .

[3]房春玲, 范金玺, 等.浅谈计算机网络故障与维护[J].中国新技术新产品, 2009 (14) .

网络故障诊断综述 篇2

一.引言

世纪之交,全球因特网高速发展。抓住机遇,迎接挑战,我国的网络建设方兴未艾。政府上网工程拉开序幕,网络建设的新高潮已经到来。网络诊断是管好、用好网络,使网络发挥最大作用的重要技术工作之一。本文首先简单介绍网络及路由器的基本概念,简述分层诊断技术,结合讨论路由器各种接口的诊断,综述互联网络连通性故障的排除。

二.网络与路由器概述

网络诊断是一门综合性技术,涉及网络技术的方方面面。为方便下面的讨论,首先简单回顾一下网络和路由器的基本概念。

1.计算机网络是由计算机集合加通信设施组成的系统,即利用各种通信手段,把地理上分散的计算机连在一起,达到相互通信而且共享软件、硬件和数据等资源的系统。计算机网络按其计算机分布范围通常被分为局域网和广域网。局域网覆盖地理范围较小,一般在数米到数十公里之间。广域网覆盖地理范围较大,如校园、城市之间、乃至全球。计算机网络的发展,导致网络之间各种形式的连接。采用统一协议实现不同网络的互连,使互联网络很容易得到扩展。因特网就是用这种方式完成网络之间联结的网络。因特网采用TCP/IP协议作为通信协议,将世界范围内计算机网络连接在一起,成为当今世界最大的和最流行的国际性网络。

2 .为了完成计算机间的通信,把每部计算机互连的功能划分成定义明确的层次,规定了同层进程通信的协议及相邻层之间的接口和服务,将这些层、同层进程通信的协议及相邻层之间的接口统称为网络体系结构。国际标准化组织(ISO)提出的开放系统互连参考模型(OSI)是当代计算机网络技术体系的核心。该模型将网络功能划分为7个层次:物理层、数据链路层、网络层、传输层、会话层、表示层和应用层。

3 .TCP/IP即传输控制协议和网间互联协议是一组网络协议。TCP/IP起源于美国ARPANET网,发展至今已成为因特网使用的标准通信协议。使用TCP/IP能够使采用不同操作系统的计算机以有序的方式交换数据。

4 .路由器是一种网络设备,是用于网络连接、执行路由选择任务的专用计算机。路由器工作于网络层,对信包转发,并具有过滤功能。路由器能够将使用不同技术的两个网络互连起来,能够在多种类型的网络之间(局域网或广域网)建立网络连接。它将处在七层模型中的网络层的信息,根据最快、最直接的路由原理从一个网络的网络层传输到另一个网络的网络层,以达到最佳路由选择。同时在内部使用高档微处理器,用高速的内部总线连接适合各种网络协议的接口卡。并具有多种网管功能,能监视与路由器相连接的一些网络设备和它们的配置运行情况。

5 .CISCO路由器是目前网络建设中使用最多的一种路由器,有多种档次、多种系列,目前常用的当属2500系列,本文以2500系列为例讨论。2500系列路由器是固定接口的多协议路由器,支持CISCO IOS全部功能。根据特定的协议环境分为以下四种类型:固定配置的路由器(2501)、带HUB口的路由器(2507)、摸块化的路由器(2514)和访问服务器(2511)。它们结构简单、操作方便、易于配置和管理,是一种用于小规模局域网和广域网网络层中继的路由设备。

6.CISCO IOS是CISCO所特有的互连网操作系统,所有的CISCO产品都运行IOS,IOS将它们无缝连接在一起协同工作。给用户提供一个可支持任意硬件界面、任意链路层、网络层协议的可扩展的开放型网络。IOS支持众多的协议,包括各种网络通信协议和路由协议等。CISCO IOS已成为工业界网际网互联的事实标准。CISCO IOS提供几种不同的操作模式,每一种模式提供一组相关的命令集、不同的操作权限和操作功能。基于安全目的,CISCO用户界面中有两级访问权限:用户级和特权级。第一级访问允许查看路由状态,叫做用户EXEC模式,又称为查看模式;第二级访问允许查看路由器配置、修改配置和运行调试命令,叫做特权EXEC模式,又称为配置模式。在特权级中,按不同的配置内容,可进入不同的配置模式,如全球配置模式、接口配置模式、线配置模式等。

三.网络故障诊断概述

网络故障诊断应该实现三方面的目的:确定网络的故障点,恢复网络的正常运行;发现网络规划和配置中欠佳之处,改善和优化网络的性能;观察网络的运行状况,及时预测网络通信质量。

网络故障诊断以网络原理、网络配置和网络运行的知识为基础。从故障现象出发,以网络诊断工具为手段获取诊断信息,确定网络故障点,查找问题的根源,排除故障,恢复网络正常运行。

网络故障通常有以下几种可能:物理层中物理设备相互连接失败或者硬件及线路本身的问题;数据链路层的网络设备的接口配置问题;网络层网络协议配置或操作错误;传输层的设备性能或通信拥塞问题;上三层CISCO IOS或网络应用程序错误。诊断网络故障的过程应该沿着OSI七层模型从物理层开始向上进行。首先检查物理层,然后检查数据链路层,以此类推,设法确定通信失败的故障点,直到系统通信正常为止。

网络诊断可以使用包括局域网或广域网分析仪在内的多种工具:路由器诊断命令;网络管理工具和其它故障诊断工具。CISCO提供的工具足以胜任排除绝大多数网络故障。查看路由表,是解决网络故障开始的好地方。ICMP的ping、trace命令和Cisco的show命令、debug命令是获取故障诊断有用信息的网络工具。我们通常使用一个或多个命令收集相应的信息,在给定情况下,确定使用什么命令获取所需要的信息。譬如,通过IP协议来测定设备是否可达到的常用方法是使用ping命令。ping从源点向目标发出ICMP信息包,如果成功的话,返回的ping信息包就证实从源点到目标之间所有物理层、数据链路层和网罗层的功能都运行正常。如何在互联网络运行后了解它的信息,了解网络是否正常运行,监视和了解网络在正常条件下运行细节,了解出现故障的情况。监视那些内容呢?利用show interface命令可以非常容易地获得待检查的每个接口的信息。另外show buffer命令提供定期显示缓冲区大小、用途及使用状况等。Show proc命令和 show proc mem命令可用于跟踪处理器和内存的使用情况,可以定期收集这些数据,在故障出现时,用于诊断参考。

网络常见的几种故障诊断 篇3

信息时代飞速发展,承载信息的网络已经成为人们生活不可或缺的一部分。但网络运行中经常会发生一些硬件故障,这些故障的产生使日常工作不能正常进行,及时找到故障原因并快速解决问题是使网络正常运行的有力保证。本文以软件学院实验中心的网络为依托,侧重于网络硬件故障做如下简单分析。

1网卡故障

故障分析:这是比较容易发生的问题,如安装了错误的驱动程序、IRQ或I/O0端口地址设错了,操作系统不支持这块网卡等。

故障诊断:

①网卡设置错误。如果怀疑网卡设置有问题,可以用网卡附带的软件检测当前的设置,再检查系统设置是否与其相符,检查网卡设置的IRQ或I/O端口地址等参数,如果有问题,重新设置就能解决。再检查一下网卡驱动程序,若有误重新安装正确的即可。

②网卡硬件故障可以通过指示灯观察。网卡通常有两个指示灯,即“连接指示灯”和“数据传输指示灯”。正常情况下“连接指示灯”应一直亮,而“数据传输指示灯”在数据传输时应不停闪烁。若“连接指示灯”不亮,应考虑连接故障,即网卡自身是否工作正常,安装是否正确。若网卡损坏只能更换。

2网线和HUB故障

故障分析:电缆有否缠绕、断头和磨损,RJ-45接头接触是否良好,双绞线通不通,HUB有没有问题等,均可造成网络不通。

故障诊断:

查看网卡指示灯、HUB指示灯。

①检查网线是否插好。重插后指示灯仍不亮,用电表测双绞线两端,看通否,若不通,换一根双绞线试一下,否则有可能是网卡或HUB端口问题。

②检查RJ-45接头。RJ-45接头容易出现故障,例如网线没有与RJ-45接头良好接触,网线未按照标准脚位压入接头,接头规格不符或者网线内部的绞线断了。接头的镀金层也很重要,镀金层太薄不耐用,多次插拔后就会把镀金层磨掉,也就容易发生断线。

③若部分计算机的网络功能同时失效,则有可能是连接这些计算机的HUB出现故障。HUB上的刚-45插槽一般都有相对应的指示灯,观察HUB的各个指示灯状态,若某一插槽在连接计算机之后,指示灯却不亮,这个插槽可能就有问题了。如换一个插槽指示灯仍不亮,则可能是插槽接出去的网线出了故障,只能更换。

3交换机故障

故障分析:交换机是现在局域网的主要接入设备,也经常会出现各式各样的故障。一般分为交换机硬件故障和交换机软件故障。

故障诊断:

交换机的硬件故障一般为交换机电源、背板、模块、端口等部件的故障。

①电源故障。如果面板上的POWER指示灯是绿色的,表明正常;如果指示灯不亮,则说明交换机没有正常供电。外部供电不稳、电路老化或雷击等都能造成交换机电源损坏。

②断口故障。这是比较常见的故障,无论是光纤端口还是双绞线的RJ-45端口,在插拔时都要注意,以免弄坏端口。带电插拔接头也增加了端口故障发生率。接在端口上的双绞线要避免暴露在室外,以免被雷电击中,导致端口损坏。遇到此类故障,可以关闭电源后用酒精棉球清洗端口。如果端口损坏严重那就只能更换端口了。

③模块故障。交换机是由许多模块组成的,比如:堆叠模块、管理模块、扩展模块等。这些模块在插拔时,或者搬运时受到碰撞,或者电源不稳定时都可能出现故障。模块出现故障只能更换。

④背板故障。交换机各个模块都是接插在背板上的。如果环境潮湿,电路板受潮短路,或者元器件因高温、雷击等因素而受损都会造成电路板不能正常工作。在外部电源正常供电的情况下,如果交换机的各个内部模块都不能正常工作,那就应该是背板坏了。背板坏了唯一的办法就是更换。

交换机的软件故障一般指系统及其配置上的故障等。

①系统错误。在交换机内部有一个可刷新的只读存储器,它保存了这台交换机所必需的软件系统。由于设计的原因。存在一些漏洞,在条件满足时,会导致交换机丢包、满载、错包等情况的发生。在升级交换机系统时也有可能发生错误。解决此类问题需要及时更新交换机厂家推出的补丁。

②配置不当。由于各种交换机配置不一样,有时在配置交换机时会出现配置错误,如:VLAN划分不正确导致网络不通,端口被错误地关闭,交换机和网卡的模式配置不匹配等。如果不能确定是用户的配置有问题,可以先恢复出厂默认配置,然后再一步一步进行配置。

③交换机网络堵塞。由于病毒等情况的存在,有可能某台主机向所连接的端口发送大量不符合封装原则的数据包,造成交换机处理器过于繁忙,致使数据包来不及转发,进而导致缓冲区溢出产生丢包现象。还有就是广播风暴,它不仅占用大量的网络带宽,而且还占用大量的CPU处理时间。网络长时间被大量的广播数据包所占用,正常的点对点通信就无法正常进行,网络速度会变慢甚至瘫痪。

4光纤故障

故障分析:光纤如果有断点,通信就无法正常工作。

故障诊断:对光纤进行线路检测的方式有仪器测试和手工测试两种。由于检测线路的仪器设备价格昂贵,所以一般都用手工测试的方法。具体方法是:在线路不通时,采用电筒照明的方法,即在光纤的一端用电筒对准光纤头部照亮,在另一端看光纤头部是否有亮点,如果有说明光纤通信正常,反之则说明光纤有断点,需要更换。

网络故障诊断综述 篇4

随着计算机技术和网络技术的飞速发展和广泛应用,现代计算机网络的规模越来越庞大,结构和功能越来越复杂。当网络出现故障时,要求在最短的时间内,正确地判断出网络故障的位置、类型和原因,以便及时对故障进行修复。面对庞大、复杂的计算机网络,仅以人工方式很难处理网络中出现的各种故障。如何高效、准确地进行网络故障的定位、排除和恢复,是网络管理面临的重要课题。由于缺乏精确的数学模型和算法,传统的故障检测和诊断方法难以进行有效处理,人工智能的理论方法和工具为解决上述问题提供了新的方法。在分析网络故障基本特征的基础上,总结分析了基于专家系统、模糊逻辑、神经网络和多智能体系统的故障诊断方法的原理、优缺点及在网络故障诊断中的应用。最后对智能化网络故障诊断技术的发展趋势进行了展望。

随着网络结构和功能的日益复杂,越来越困难。基于人工智能的网络故障诊断方法为复杂网络故障诊断提供了新的解决方案。

2 网络故障基本特征分析

大型网络系统故障作为一种复杂系统故障具有如下的特征:

(1)层次性:网络系统在结构上由物理层、数据链路层、网络层和应用层组成,从而形成其功能的层次性,因此其故障和征兆也具有层次性。

(2)传播性:纵向传播,指物理层的故障相继引起数据链路层、网络层和应用层的故障;纵向传,指故障在同一层次传播。

(3)相关性:某一故障可能对应若干征兆;某一征兆也可能对应多个故障。

(4)不确定性:系统的故障和征兆具有随机性、模糊性和某些信息的不确定性。

对于复杂网络系统的故障诊断,由于其功能单元很多,各个单元及层次都有可能产生不同的故障,网络故障的巨大数量和复杂性使得很难对其进行精确状态描述和完整模拟。采用传统的故障检测方法难以实时、准确地判别出故障原因。因此,近年来基于人工智能的故障诊断方法的发展应用为复杂系统网络故障诊断提供了新的方法,下面对各种基于人工智能技术的故障诊断方法及其在网络故障诊断中的应用进行综述。

3 人工智能技术在网络故障诊断中的应用

人工智能技术是利用计算机实现通常与人类智能有关的功能,如判断、推理、证明、识别、感知、理解、设计、思考、规划、学习和为题求解等思维活动[1]。基于人工智能的故障诊断方法主要有专家系统、模糊逻辑、神经网络和多智能体系统(Multi-agent system,MAS)等方法。

3.1 专家系统在网络故障诊断中的应用

专家系统是一种模拟人类专家解决领域问题的计算机程序系统。专家系统能够运用人类专家的知识和解决问题的方法进行推理和判断,模拟人类专家决策过程,来解决该领域的复杂问题[2]。

基于产生式规则的专家系统是构建专家系统最常用的方法,基于产生式规则的故障诊断专机系统是根据以往专家诊断的经验,将其归纳成规则,通过启发式经验知识进行故障诊断[3]。基于规则的专家系统具有知识表示直观、形式统一、易于理解和解释方便等优点。但是复杂网络系统故障征兆与原因之间的联系相当复杂,通过归纳专家系统来获取规则,存在知识获取困难、容易产生规则冲突、组合爆炸等问题。

针对基于产生式规则的网络诊断专家系统知识表示方法不完备和知识获取方法不灵活等问题,刘培奇等[4]提出一种具有自然语言接口的网络故障诊断专家系统设计模型,采用概念图和产生式规则相结合的扩展产生式规则知识表示(EPR方法),可以将Internet上有关故障问题的汉语语句转换成概念图,经过专家系统推理后,将推理结果和推理过程转换成汉语输出。

3.2 基于模糊逻辑的网络故障诊断法

在网络故障诊断中,有些故障和征兆之间的关系往往是模糊的,故障与征兆之间的关系很难用精确的数学模型来表示,这些故障称为不确定性故障。模糊逻辑提供了表达和处理模糊状态的机制,能够处理网络故障诊断中的不确定性信息。

模糊诊断方法利用集合论中的隶属度函数和模糊关系矩阵的概念来解决故障和征兆之间的不确定性关系。基于模糊逻辑的故障诊断首先需要构造隶属度函数,然后建立故障现象和征兆之间的模糊关系矩阵,再通过模糊关系方程进行故障诊断,得出结论。另一种方法是利用隶属度函数,建立故障与征兆之间的模糊知识库,再进行模糊逻辑推理。

基于模糊逻辑的故障诊断方法具有启发性,类似人类思维过程,能够处理不确定性故障。但故障征兆和原因之间的模糊关系较难确定,隶属度转换困难,且模糊推理知识获取困难,推理能力依赖模糊知识库,学习能力差。

3.3 基于神经网络的网络故障诊断法

故障诊断的核心技术就是故障诊断模式识别,人工神经网络作为一种重要的模式识别方法,故障诊断也是其重要应用领域[5]。人工神经网络是一种模拟人脑组织结构和人类认知过程的信息处理系统。

人工神经网络在网络故障诊断中的应用主要从模式识别的角度作为分类器进行故障诊断,以故障征兆作为神经网络的输入;通过故障实例及诊断经验的训练和学习,用分布在神经网络中的连接权值来表达所学故障诊断知识,以故障诊断结果作为输出。

基于神经网络的故障诊断法具有并行分布处理、自适应、联想记忆等优点,有利于克服专机系统知识获取瓶颈、知识库维护困难等问题,但由于神经网络技术学习速度慢、训练时间长、解释能力弱,从而影响了神经网络的实用性。

3.4 多智能体技术在网络系统故障诊断中的应用

利用专家系统、模糊逻辑或者神经网络方法可以解决一些简单的故障诊断问题,但是大型网络系统是一个分布式的复杂系统,采用单系统方法往往不能满足要求,需要多个系统协作共同解决问题。多智能体系统是当前人工智能研究中的前沿和热点领域,多智能体系统是由多个可计算的智能体组成的集合,通过对问题域的描述、分解和分配,将大的复杂系统分解成小的、相对简单子系统,并协调各子系统并行、相互协作的进行问题求解,适合于大规模复杂系统的故障诊断问题求解[6]。

网络系统可以看作一个异构、分布、开放的复杂分布式人工智能系统,因此可以利用多智能体理论和技术来研究网络系统分布式故障诊断问题。多智能体具有自主性、分布式、协调性,并具有自组织能力、学习能力和分解能力。但如何将复杂网络系统合理分解以及多智能体之间的协调通信问题是多智能体技术在网络故障诊断中面临的主要问题。

4 结语

对网络系统进行故障诊断,要根据实际情况,如故障信息、用户需求等,选择合适的故障诊断方法,力求准确、快速诊断故障原因。复杂网络系统由于自身结构和功能的多层次性以及环境因素复杂等,一般故障诊断方法难以满足网络系统故障诊断的全部任务要求。随着人工智能和模式识别技术的发展,复杂系统的故障诊断方法也有了很大发展。基于人工智能技术的故障诊断方法内容越来越丰富,融合各种智能方法的故障诊断方法不断发展,如结合专家系统和神经网络的故障诊断方法、模糊神经网络方法、模糊专家系统方法以及分布式专家系统方法等。通过引进及其学习和数据挖掘技术,改进现有智能诊断系统的知识获取和推理能力,也是复杂系统故障诊断领域的发展趋势。

摘要:随着网络结构和功能的日益复杂,高效、准确地进行网络故障诊断越来越困难。基于人工智能的故障诊断方法为网络故障诊断提供了新的解决方案。针对网络系统故障的特点,分析了基于专家系统、模糊逻辑、神经网络和多智能体系统的网络故障诊断方法的原理、特点和应用。对智能化网络故障诊断研究的发展趋势进行了展望。

关键词:网络故障诊断,专家系统,模糊逻辑,神经网络,多智能体

参考文献

[1]蔡自兴,徐光祐.人工智能及其应用.北京:清华大学出版社,2004.

[2]杨兴,朱大奇,桑庆兵.专家系统研究现状与展望.计算机应用研究,2007,24(5):4.

[3]杨良士.动态系统故障诊断的新方法-专家系统.信息与控制,1998,17(5):26.

[4]刘培奇,李增智,赵银亮.扩展产生式规则的网络故障诊断专家系统.西安交通大学学报,2004,38(8):783.

[5]彭羽,樊锐,刘强.基于人工神经网络的电路故障诊断系统.系统工程与电子技术,2002,24(1):116.

腾达路由网络故障诊断 篇5

一、首先确定故障的具体现象,分析造成这种故障现象的原因的类型。例如,主机不响应客户请求服务。可能的故障原因是主机配置问题、接口卡故障或路由器配置命令丢失等。

二、收集需要的用于帮助隔离可能故障原因的信息。从网络管理系统、协议分析跟踪、路由器诊断命令的输出报告或软件说明书中收集有用的信息。

三、根据收集到的情况考虑可能的故障原因,排除某些故障原因。例如,根据某些资料可以排除硬件故障,把注意力放在软件原因上,

四、根据最后的可能故障原因,建立一个诊断计划。开始仅用一个最可能的故障原因进行诊断活动,这样可以容易恢复到故障的原始状态。如果一次同时考虑多个故障原因,试图返回故障原始状态就困难多了。

五、执行诊断计划,认真做好每一步测试和观察,每改变一个参数都要确认其结果。分析结果确定问题是否解决,如果没有解决,继续下去,直到故障现象消失。

六、物理层的故障主要表现在设备的物理连接方式是否恰当;连接电缆是否正确;Modem、CSU/DSU等设备的配置及操作是否正确。确定路由器端口物理连接是否完好的最佳方法是使用show interface命令,检查每个端口的状态,解释屏幕输出信息,查看端口状态、协议建立状态和EIA状态。

浅谈计算机网络故障的诊断与排除 篇6

【摘要】网络故障极为普遍,网络故障的种类也多种多样,要在网络出现故障时及时对出现故障的网络进行维护,以最快的速度恢复网络的正常运行,掌握一套行之有效的网络维护理论、方法和技术是关键。就网络中常见故障进行分类,并对各种常见网络故障提出相应的解决方法。

【关键词】网络故障 网络维护 分类 解决办法

【中图分类号】TP393 【文献标识码】A 【文章编号】1672-5158(2013)01—0147-01

随着计算机的广泛应用和网络的日趋流行,功能独立的多个计算机系统互联起来,互联形成日渐庞大的网络系统。计算机网络系统的稳定运转已与功能完善的网络软件密不可分。计算机网络系统,就是利用通讯设备和线路将地理位置不同的、信息交换方式及网络操作系统等共享,包括硬件资源和软件资源的共享:因此,如何有效地做好本单位计算机网络的日常维护工作,确保其安全稳定地运行,这是网络运行维护人员的一项非常重要的工作。

在排除比较复杂网络的故障时,我们常常要从多种角度来测试和分析故障的现象,准确确定故障点。

一、分析模型和方法

(一)七层的网络结构分析模型方法

从网络的七层结构的定义和功能上逐一进行分析和排查,这是传统的而且最基础的分析和测试方法。这里有自下而上和自上而下两种思路。自下而上是:从物理层的链路开始检测直到应用。自上而下是:从应用协议中捕捉数据包,分析数据包统计和流量统计信息,以获得有价值的资料。

(二)工具型分析方法

工具型分析方法有强大的各种测试工具和软件,它们的自动分析能快速地给出网络的各种参数甚至是故障的分析结果,这对解决常见网络故障非常有效。

(三)综合及经验型分析方法靠时间、错误和成功经验的积累

在大多数的阿络维护工作人员的工作中是采用这个方法的,再依靠网管和测试工具迅速定位网络的故障。

二、计算机无法上网故障排除

1、对于某台联网计算机上不了网的故障,首先要分别确定此计算机的网卡安装是否正确,是否存在硬件故障,网络配置是否正确在实际工作中我们一般采用Ping本机的回送地址(127.0.0.1)来判断网卡硬件安装和TCP/IP协议的正确性。

如果能Ping通,即说明这部分没有问题。如果出现超时情况,则要检查计算机的网卡是否与机器上的其它设备存在中断冲突的问题。通过查看系统属性中的设备管理器,查看是否在网络适配器的设备前面有黄色惊叹号或红色叉号,如有则说明硬件的驱动程序没有安装成功,可删除后重新安装。另外,要确保TCP/IP协议安装的正确性,并且要绑定在你所安装的网卡上。如果重新安装后还是Ping不通回送地址,最好换上一块正常的网卡试一试。

当确保了计算机的硬件设备和网络配置正确后,接着就要查看计算机与交换机之间的双绞线,交换机的RJ45端口或交换机的配置是否有问题。此时我们要Ping上网计算机所在VLAN的网关,不通的话就要分段检查上面所说的各项。

最简单的方法是检查双绞线,用线缆测试仪检测双绞线是否断开。双绞线没有问题,就要查看交换机的端口是否坏了。交换机每一个端口都有状态指示灯以询问一下其它网管人员就可以排除了,如果不放心可以对照查看。交换机的参数配置表也是网络管理员必备的资料之一,并且随着网络用户的变化要不断地修改,检测到此,如果端口指示灯不亮,就只能是端口损坏了,可以把跳线接到正常使用的端口上排除其它原因,确定是端口的问题。

2、一批联网计算机上不了网对于同时有一批计算机上不了网的故障,首先要找到这些计算机的共性,如是不是属于同一VLAN或接在同一交换机上的,若这些计算机属于同一VLAN,且属于计算机分别连接于不同的楼层交换机,那么检查一下路由器上是否有acl限制,在路由器上对该VLAN的配置是否正确,路由协议(如我局的OSPF协议)是否配置正确。若这些计算机属于同一交换机,则应到机房检查该交换机是否有电源松落情况,或该交换机CPU负载率是否很高,与上一级网络设备的链路是否正常。

通常某交换机连接的所有电脑都不能正常与网内其它电脑通讯,这是典型的交换机死机现象,可以通过重新启动交换机的方法解决。如果重新启动后故障依旧,则检查一下那台交换机连接的所有电脑,看逐个断开连接的每台电脑的情况,慢慢定位到某个故障电脑,会发现多半是某台电脑上的网卡故障导致的。

故障通常是交换机的某个端口变得非常缓慢,最后导致整台交换机或整个堆叠慢下来。通过控制台检查交换机的状态,发现交换机的缓冲池增长得非常快,达到了90%或更多。原因及解决方法为:首先应该使用其它电脑更换这个端口上原来的连接,看是否由这个端口连接的那台电脑的网络故障导致的,也可以重新设置出错的端口并重新启动交换机,个别时候,可能是这个端口损坏了。

三、故障定位及排除的常用方法

(一)告警性能分析法

通过网管获取告警和性能信息进行故障定位。我们单位使用了深信服网络网管,可以对全单位的网络设备进行管理,平时多观察各设备CPU负载率和各线路的流量。当有人反映不能连接至网络或网速很慢时,可通过网管观察计算机与交换机的连接情况,是否有时断时通的现象,交换机CPU负载率是否很高,线路流量是否很大。通过观察设备端口状态,分析和观察交换机哪个端口所接的计算机发包量不太正常。

(二)查看网络设备日志法

经常看一下网络设备的日志,分析设备状况。我曾经通过showlonging命令观察到4006交换机下连的2950交换机经常每隔7小时down掉,然后又up,因时间间隔较长,单位人员未感觉网络中断,在此期间我们检查并确定了光缆、光收发器、网线、交换机配置、交换机端口均正常,后来的间隔时间由原来的7小时减为7分钟。由此我们立即判定2950交换机本身有故障,马上将已准备好的备用交换机换上,从而减少了处理故障的时间,并在最短时间内恢复网络。

(三)替换法

替换法就是使用一个工作正常的物体去替换一个工作不正常的物体,从而达到定位故障、排除故障的目的。这里的物件可以是一段线缆、一个设备和一块模块。

(四)配置数据分析法

查询、分析当前设备的配置数据,通过分析以上的配置数据是否正常来定位故障。若配置的数据有错误,需进行重新配置。

四、结束语

计算机网络技术发展迅速,网络故障也十分复杂,本文介绍了常见的几类故障及其维护方法。为了在网络出现故障时及时对网络进行维护,以最快的速度恢复网络的正常运行,在网络维护中还需要注意以下几个方面:

1、建立完整的组网文档,以供维护时查询。如系统需求分析报告、网络设计总体思路和方案、网路拓扑结构的规划、网络设备和网线的选择、网络的布线、网络的IP分配,网络设备分布等等。

2、做好网络维护日志的良好习惯,尤其是有一些发生概率低但危害大的故障和一些概率高的故障,对每台机器都要作完备的维护文档,以有利于以后故障的排查。这也是一种经验的积累。

3、提高网络安全防范意识,提高口令的可靠性,并为主机加装最新的操作系统的补丁程序和防火墙、防黑客程序等来防止可能出现的漏洞。

参考文献

[1]黄中伟.计算机网络管理与安全技术[M]。北京:人民邮电出版社,2007

故障诊断技术综述及发展趋势 篇7

在部队中对系统、设备的安全要求更高, 对快速、准确、高效的故障诊断技术的需求更迫切。比如在军队油料储运过程中, 油泵房是管道输油中最关键的场所, 泵房的运行管理水平的高低直接关系着输油能否安全、平稳、高效、低能耗和部队保障能力的好坏。而目前, 油料储运过程在用故障诊断模式主要为人工巡检获取故障征兆, 基于专家经验实施人工故障诊断。在油库泵房的具体工作过程中, 由于其工作环境恶劣、工作状态复杂, 当故障发生时, 很难及时准确地判断故障发生的部位及原因。因此, 如何将人工诊断模式转变为自动诊断模式, 实时获得低误报率和低漏报率的故障检测与诊断结果, 是进一步提高油料储运安全与稳定的前提。

1. 故障诊断技术发展概述

众所周知, 基于解析冗余的故障诊断技术是从二十世纪七十年代初首先在美国发展起来的。1967年, 在美国宇航局和海军研究所的倡导和组织下, 成立了美国机械故障预防小组 (MFPG) , 对故障诊断技术分专题进行研究。1971年, 麻省理工学院的Beard发表的博士论文[1]和Mehra和Peschon发表在Automatica上的论文[2], 首先提出了用软件冗余代替硬件冗余、通过系统自组织使系统闭环稳定、通过比较器的输出得到系统故障信息的新思想, 标志着控制系统故障诊断技术的开端。

在国内, 第一篇故障诊断技术的综述文章[3]由叶银忠等人于1985年在《信息与控制》上发表;1994年, 清华大学出版社出版了国内第一本动态系统故障诊断技术的学术专著, 即周东华等人编写的《控制系统的故障检测与诊断技术》[4]。随后几年又有新的论文发表和学术专著出版。

1990年, 国际控制系统故障诊断权威、德国杜伊斯堡大学的P.M.Frank教授将基于软件冗余的故障诊断方法划分为三大类[5]:基于解析模型的方法、基于知识的方法和基于信号处理的方法。基于解析模型的故障诊断方法是最早发展起来的, 适用于被控过程能够建立精确的数学模型。基于信号处理的故障方法适用于那些虽然被控对象的精确的解析数学模型很难建立, 但是可以得到输入输出信号的被控过程。基于知识的故障诊断方法则适用于被控对象的数学模型和输入输出信号都不能得到的被控过程。

在理论研究的深入和相关领域的发展的同时, 各种新的诊断方法也层出不穷, 上述划分方式已不是十分准确, 尤其对于工业过程故障诊断领域发展起来的新方法更是如此。如控制图方法、主元分析法 (PCA) 和部分最小二乘法 (PLS) 等与统计学有关的方法, 归为信号处理的方法并不恰当。此外基于图论的一些方法, 把它们归于基于知识的方法也不是很合适。美国Purdue大学Venkatasubramanian教授将控制系统故障诊断方法分为:基于定量模型的方法、基于定性模型的方法和基于过程历史数据的方法三大类[6], 突出了基于数据驱动的故障诊断知识获取方式。

2. 故障诊断方法及其研究现状

2.1 基于定量模型的方法

基于定量模型的方法是发展最早、研究最系统的一种故障诊断方法。它随着解析冗余思想的提出而形成发展, 指导思想是用解析冗余取代硬件冗余, 通过比较诊断对象的可测信息和由冗余数学模型表达的系统先验知识, 产生残差, 并对残差进行分析和处理, 获取故障信息, 从而实现故障诊断[7]。基于定量模型的故障诊断方法分为基于状态估计的方法和基于参数估计的方法。

(1) 基于状态估计的故障诊断方法。

由于被控过程的状态直接反映系统的运行状态, 所以只要估计出系统的状态, 并结合适当的模型即可对被控对象进行故障诊断。这种方法首先利用系统的解析模型和可测信息, 重构系统的被控过程, 构造残差序列, 残差序列中包含丰富的故障信息, 再对残差进行分析处理, 从而实现故障的检测与诊断[8]。残差序列通过设计检测滤波器 (观测器) 产生。通常可用Luenberger观测器及卡尔曼滤波器进行状态估计。如Caliskan将Kalman滤波器用于传感器的故障检测[9]。Keller则仔细分析了用于故障诊断的Kalman滤波器的结构, 并对其残差进行了解耦, 使得能够同时检测多个传感器故障[10]。国内应用kalman滤波器进行故障诊断的方法如文献[11]采用卡尔曼滤波器组, 建立航空发动机控制系统传感器故障诊断系统, 实现对单个传感器故障的检测、隔离与重构 (FDIA) , 并分析了测量噪声对故障诊断系统性能的影响, 为发动机在线传感器故障诊断系统的实现提供了理论依据。基于状态估计的故障诊断方法依然是人们研究的一个热点。状态估计方法, 在能获得系统的精确数学模型的情况下, 是最简单、有效的故障诊断方法。然而由于实际控制系统大多是非线性系统, 且非线性系统对象的数学模型很难建立, 所以基于状态估计的故障诊断方法研究主要集中于线性系统, 对非线性系统的研究成果还比较少。目前处理非线性系统主要有两种方法, 一是将非线性系统整体或局部线性化, 二是基于非线性观测器和参数估计的方法。

(2) 基于参数估计的故障诊断方法。

参数估计的故障诊断方法是根据模型参数及相应的物理参数的变化量序列的统计特性来进行故障诊断。其基本思想是根据系统参数及相应的过程参数变化来检测故障。因为被诊断对象的故障可以视为其过程参数的变化, 而过程参数的变化又往往导致系统参数的变化。基于参数估计的故障诊断方法主要有滤波器方法和最小二乘法。参数估计方法与状态估计方法相比, 前者更利于故障的分离, 但计算量偏大。

2.2 基于定性模型的方法

基于定性模型的故障诊断方法不需要系统精确的数学模型。基于定性模型的方法把过程特性的外部表现和人类专家对故障判断和处理的经验, 通过抽象化方法直接建立各种过程变量与故障模式之间的定性模型, 对系统进行推理, 预测系统的定性行为, 通过与实际的系统行为比较, 检测系统是否发生故障, 并诊断系统的故障原因[12]。基于定性模型的方法可以分为因果模型方法和抽象层次方法, 主要包括定性过程理论法 (QPT) 、定性仿真法 (QSIM) 和知识观测器法、定性观测器法 (QOB) 、有向图方法 (SDG) 、故障树方法 (fault tree) 等。其中, 定性仿真方法是基于定性模型的故障诊断方法的重要部分。定性仿真方法于1994年由Kuipers提出, 它依据系统的故障模型进行诊断推理。该方法首先利用定性变量 (系统物理参数) 和定性微分方程 (参数间相互关系) 构造约束模型, 然后通过约束模型描述和模仿系统的结构, 从而得到由约定初始状态出发的系统状态。文献[13]提出了一种全新的类似于基于解析模型的方法中的状态观测器和Kalman滤波器的知识观测器。该知识观测器由定性模型、差异检测器、候选人发生器及相应诊断策略组成, 其核心是定性模型。

基于定性模型的故障诊断方法一般比较简单, 构造模型容易、可靠性高、解析能力强、鲁棒性好, 具有新故障辨识能力等。但是此方法也存在许多不足, 如:利用定性方法描述系统, 预测较为保守, 因此微小的故障往往容易被忽略。

2.3 基于历史数据的方法

基于历史数据的故障诊断方法的研究与应用兴起于上世纪90年代。不同于基于模型的方法需要过程先验知识 (不管是定性的还是定量的) , 基于历史数据的方法仅需要大量有效的过程历史数据。基于过程历史数据的方法以采集的过程数据为基础, 通过各种数据处理与分析方法 (如多元统计方法、聚类分析、频谱分析、小波分析等) 挖掘出数据中隐含的信息, 提高监控系统的监控和故障诊断能力。基于历史数据的故障诊断方法又分为定性方法和定量方法。

(1) 定性方法。

定性方法中应用最广的是基于规则的专家系统方法和定性趋势分析方法。

(1) 专家系统专家系统方法通过系统知识的获取, 由推理机根据故障特征诊断出故障。专家系统通常由数据库、推理机和知识库组成。文献[14]利用专家系统工具CLIPS并结合C语言开发传感器故障在线诊断专系统。专家系统的优点是不依赖于系统模型, 规则易于增加和删除, 但也有不易克服的缺陷, 如实际应用中知识获取的“瓶颈”问题, 而且对新故障不能诊断。传统的专家系统进行传感器的故障诊断存在局限性。

(2) 定性趋势分析方法趋势可以反映仿真系统[15]运行状态的重要参数、发展速度与趋势, 为故障的早期判定提供一个有效的手段。基于定性趋势分析的故障诊断方法的基本思想是首先利用趋势提取算法, 将时间序列转换为基元序列, 然后采用相容度检验或基于模糊逻辑的相似度检验, 将实时趋势与知识库里的特征趋势相匹配, 以检测过程状态或行为, 获取故障类型, 实时诊断故障。基于定性趋势分析的故障诊断方法具有快速检测诊断故障、解析能力强、鲁棒性好并新故障辨识能力等优点, 已被广泛地用于过程状态监测、数据压缩、故障检测和诊断。但由于这种方法是基于数据的, 在提取和识别趋势的过程中, 计算的时间会限制这种方法的应用。

(2) 定量方法。

基于历史数据的故障诊断定量方法分为统计学方法和非统计学方法。这两类方法都是对实时数据的抽样进行特征提取的方法。统计学方法包括支持向量机 (SVM) 、主元分析法 (PCA) 、部分最小二乘法 (PLS) 等, 非统计学方法即常用的神经网络法。

(1) 主元分析法主元分析法的基本思想是用一组互不相关的新变量代替原变量。这组新变量是原变量的线性组合, 不但个数比原变量少, 而且尽可能地携带原变量的有用信息。

(2) 神经网络方法神经网络具有以任意精度逼近任何连续非线性函数的能力, 以及从样本学习的能力, 已经广泛应用于控制系统元部件、执行器和传感器的故障诊断。针对控制系统的非线性特征, 利用神经网络的非线性大规模并行处理方面的能力, 以及容错性及学习能力[16], 通过离线学习构建神经网络观测器、神经网络辨识器或神经网络预测器模型, 在线将模型输出与系统实际输出比较得到残差, 通过对残差进行分析和处理, 获取故障信息, 从而实现控制对象故障的实时诊断。

(3) 支持向量机下面将着重介绍支持向量机的故障诊断方法。

3. 支持向量机的研究现状

作为支持向量机的奠基者, Vapnik早在60年代就开始了统计学习理论的研究, 1971年, Vapnik和Chervonenkis提出了SVM的一个重要理论基础——VC维理论。1982年, Vapnik进一步提出了具有划时代意义的结构风险最小化原理, 堪称SVM算法的基石。

1992年, Boser、Guyon和Vapnik, 提出了最优边界分类器。

1993年, Cortes和Vapnik进一步讨论了非线性最优边界的分类问题。

1995年, Vapnik完整地提出了SVM分类器。

1997年, Vapnik、Gokowich和Smola详细介绍了基于SVM方法的回归算法和信号处理方法。

Vapnik在1995年出版了专著“The Nature of Statistical Learning Theory”[17]之后, 在国际范围内引起了研究学习统计学习理论 (Statistical Learning Theory, SLT) 和支持向量机 (Support Vector Machines, SVM) 算法的热潮, 各种杂志都纷纷撰文介绍SLT和SVM的内容[18,19], 各个领域的研究人员也纷纷将SLT理论和SVM算法应用到不同的领域, 如模式识别[20,21], 回归分析[22], 信号处理[23]等。

和目前比较常用的神经网络诊断方法相比, SVM具有以下显著的优势[17,24]:

(1) 坚强的理论背景使得SVM有很高的推广能力, 可以避免过度训练。

(2) SVM通常有解, 可以使用一个标准的算法 (二次规划) 很快地求得解, 而且这个解通常是全局最优解, 因此不会出现局部能量最小点的问题。

(3) SVM不需要事先确定网络拓扑结构, 当训练过程结束时自动地确定拓扑结构。

(4) SVM可被看作信息缩减的一种表达, 它可以解决高维问题而且可以避免“维数灾难”。

(5) SVM对小样本机器学习有着良好的性能。

由于SVM算法的潜在的应用价值, 吸引了国际上众多的知名学者, 近几年对其研究不断深入, 出现了许多发展和改进的支持向量算法[25]。SVM机器学习算法很好地执行了统计学习理论的结构风险最小化原则, 其应用于故障诊断最大的优势在于它适合于小样本决策, 其学习方法的本质在于能够在有限特征信息情况下, 最大限度地发掘数据中隐含的分类知识, 这一点对于故障诊断而言有很强的实际意义。

支持向量机理论表现出来的良好性能吸引了故障诊断领域研究人员的注意, 国内外众多学者对其在智能故障诊断领域的应用进行了研究。如Poyhonen.S等人在电子机器故障诊断方面对SVM的应用进行了研究[26];Achmad Widodo等将SVM应用于异步电动机故障诊断中[27];Jun Feng Gao等将SVM用于往复式泵故障诊断[28];肖健华对应用于故障诊断的SVM进行了理论研究[29], 对样本不对称情况进行了算法改进[30]并在齿轮故障诊断中进行了应用研究[31];胡寿松将SVM应用于非线性系统故障诊断[32];重庆大学博士马笑潇对SVM在智能故障诊断中的应用[33,34]进行了详细的探讨;西安交通大学博士祝海龙在其博士学位论文[25]中对统计学习理论的工程应用进行了不同领域的研究, 涉及信号消噪机械故障诊断和人脸检测, 其中故障诊断方面研究了汽车发动机振动故障的自动诊断;张周锁等对基于支持向量机的机械故障诊断方法进行了研究[35];董明等将其用于大型电力变压器故障诊断模型研究[36];朱凌云等从数据挖掘的角度运用SVM分类算法进行自动缺陷识别的方法研究[37]。

这些针对不同故障对象的诊断研究在理论和仿真方面都取得了基本令人满意的结果, 表明了支持向量机算法适合于故障诊断领域。可考虑将支持向量机引入油库泵房过程监控和故障诊断中, 以确保油库泵房的正常运行。

4. 故障诊断发展趋势

工程机械故障诊断方法综述 篇8

工程机械的故障诊断就是当其某些功能失效后,通过知适宜的方法,找出功能失效的原因。其内容还包括对故障程度进行判断,将故障状态下的运行特征与机械正常功能进行比较,从而决定采取相应的修复措施。如果属于轻微的偶发性故障,且不会产生重大影响,则可继续运行,并实施监控;若故障比较严重,须实施停机修理。

例如某一工程机械液压系统温度有所增高,但尚未达到液压元件所允许的温度极限,经过诊断是系统过滤装置通透率下降,更换新过滤器后温度正常。此类故障即属轻微故障。

2. 常见故障诊断方法

一般的故障诊断使用听、看、摸、嗅这4种方式,利用了人的听觉、视觉和触觉对设备运行中的异常现象进行诊断,来确认故障的类型。

在这里,我们总结了人体感官对一些物理现象的正常反应,可以用人体能够感受的程度,对感官的感受进行量化。

(1)听力量化法

普通人都会听出音频的高低,而音频的高低恰恰就是判断故障的一个重要方面。工程机械运行都会有速度或频率,因此产生的噪声节律会帮助我们判断故障点。使用听力诊断可以由远到近,由外部到内部。

比如,对于液压泵产生的噪声,如果噪声是高频的、比较尖的声音,很可能是吸空引起的。如果噪声是低频的,即比较低沉的“嗡嗡”声,很可能是内泄而产生的声音。

再比如,一台工程机械有异常噪声,如果噪声的频率很高,节律很快,可以直接到高速运行的机构找故障;反之,如果噪声的频率很低,可到低速运行的机构找故障。

上面的例子即是我们所说的由远到近的听力判断方法。找到故障部位后,要继续缩小故障范围,可使用声音传导器,寻找噪声的声源。

(2)目测判断法

工程机械的运行往往是由执行机构来完成的,所以观察执行机构运转情况可以判断工作状态。观察的内容有2点,一是元件的颜色变化;二是元件的动作变化。

例如可观察机械运转的速度(或速度差)、元件运转速度的均匀性、同步状况;对于电器系统来讲,可观察元件是否存在高温变色、电火花以及查看仪表等;对于液压系统来讲,一是看仪表,即要看液压系统各测压点压力有无变化,流量是否满足要求;二是查看油液颜色和含杂质情况,即观察油液是否清洁、变质,黏度是否满足要求以及表面有无泡沫等;三是查看泄漏,即看各接头及密封处是否存在渗漏现象;四是查看振动,即看活塞杆等机构在运动时有无跳动、冲击等异常现象;五是看产品,即从加工出来的产品判断系统工作压力和流量的稳定性。

(3)触摸判断法

用手触摸机械零部件的判断法有2个内容。

一是用手触摸感觉温度高低。因为人体对温度会有下意识的反应,即当物体温度特别高或特别低的时候,普通人的皮肤接触时就会有神经反应。我们姑且量化这个神经反应时间和温度,用于判断元件的故障,具体如附表所示。

例如,如果柱塞泵出现故障,其内部的3个摩擦副都会发热。找到摩擦副的位置,用手感觉3个摩擦副的温差,就可以轻易地判断柱塞泵损坏的大致原因。

二摸振动,即用手摸机械零部件的振动强度。比如,诊断液压系统的故障时,可用手摸某个阀的振动情况,来判断这个阀的工作状况。对于规格相同的管路,用手去摸液压管路时,振动较大的其内部压力一定也较高。如果回油管路振动较大,证明系统的内泄量比较大。

(4)三关共用法

三“关”指的是微观、宏观和相关。具体说,微观法指的是通过细微观测,找到机械部件或元件在工作过程中产生的人们不易发现的故障点。例如,电器元件发热只是元件温度增加,其基理是电流通过了较小的导电面积,即电阻增大导致的发热。具体原因有导线虚接、导线拉伸和电流增大等。

宏观法指的是通过感官、仪器等检测手段判断机械是否存在故障。检测参数包括发动机的转速、机油压力、温度及排烟等参数;液压系统的压力、流量、方向、温度、泄漏和振动等参数;电气系统的电流、电压和温度等参数。

相关法指的是在诊断机械故障点时,一定要综合考虑各部件和各系统的相关因素,找出正确的故障点。例如,柴油机冒黑烟,就有2个方面原因:一是柴油机动力下降;二是设备的负荷意外增加。

3. 其他方法

科学诊断法有3种:一是根据系统图查找故障;二是利用故障树或分析图查找故障;三是动态监控法。

动态监控把测试到的数据输入计算机系统,计算机根据输入的数据汇总各种信息及技术参数,并发出报警或自动停机等信号。

网络故障诊断综述 篇9

关键词:故障诊断,数据驱动,工业过程

0 引言

随着现代经济的快速发展和流程工业规模的不断扩大,工业过程的复杂性也不断提高,如石油、化工、发电、钢铁等行业。这类系统一旦发生故障,将会造成巨大的经济损失[1]。例如2002年2月23日辽阳石化分公司因聚乙烯系统运行不正常,导致大量的乙烯气体泄漏,发生了剧烈爆炸,结果造成8人死亡,1人重伤,18人轻伤,事后统计,公司直接经济损失高达452.78万元。切实保障现代复杂工业系统的可靠性与安全性,降低事故发生率,维持生产稳定,是企业非常关注的重要技术课题。可见,故障诊断研究对于流程工业长期安全稳定运行具有十分重要的意义。

过程故障诊断技术的出现,为提高复杂工业系统的可靠性开辟了一条新的途径。故障检测与诊断的任务是选取方便有效的方法发现过程中的异常事件,而且还能识别和诊断出生产过程异常事件的根源,进而指导操作员正确处理过程异常[1]。传统的故障诊断方法是由常规的控制系统发出警报信号,然后现场操作人员通过过程变量的变化,并依据他们的经验来完成的。而现代工业系统的大型化和复杂化,使人工完成故障诊断任务变得十分困难。因此,故障诊断技术日益受到各国政府和科研人员的关注,开展工业过程故障诊断技术的研究,是一个既有理论性,又有很高应用价值的研究课题。

1 常用故障诊断方法

故障诊断技术是一门综合性技术,它涉及现代控制论、信号处理与模式识别、计算机科学、人工智能、电子技术、统计数学等学科。经过近40年的研究与发展,出现了多种分类方法。就工业过程的故障诊断而言,当前研究方法有三类[2]:基于数学模型的方法、基于人工智能的方法和基于数据驱动的方法。

1.1 基于数学模型的方法

它的机理是通过建立过程的数学模型,利用系统辨识的方法辨识其参数。在应用这类方法时,人们必须知道过程的异常状况与模型参数或状态之间的关系。总之,基于数学模型的故障诊断方法,其优点是能深入系统本质的动态性质和实现实时诊断;缺点是当系统模型未知、不确定或具有非线性时,这种方法不易实现。对于复杂的工业过程来说,准确详细的数学模型往往很难得到,这就限制了基于数学模型的故障诊断方法的应用。基于此,过程的故障检测与诊断不得不依赖于非模型的方法。

1.2 基于人工智能的方法

其主要是利用人工智能领域的研究成果,包括模糊逻辑、因果分析、专家系统、神经网络、符合有向图等方法,构造某些系统功能以模仿和实现人类在监控过程中的某些思想和行为,自动完成整个监测和诊断过程。基于人工智能的方法适合于不能获取详细数学模型的系统,但必须有大量生产经验和工艺知识可以利用。因此,其通用性较差。

1.3 基于数据驱动的方法

基于数据驱动的故障诊断方法就是在建立模型时仅仅需要过程中的历史数据,即通过各种数据分析处理方法挖掘其中的有用信息,获取正常操作和故障的特征模式,从而实现故障诊断。这种方法是在过程中有大量数据存储并且在计算机、数据库技术的发展背景下发展起来的,正成为故障诊断领域内的研究热点。常用的有多元统计分析方法、支持向量机等。

2 基于数据驱动的故障诊断方法的研究进展

随着集散控制系统及智能仪表在工业过程中的广泛应用,大量过程数据被记录下来,另外计算机、数据库技术的发展为分析大规模数据提供了可能性。但是这些包含过程运行状态信息的数据并没有被有效的利用,以至出现了所谓“数据丰富,信息缺乏”的现象。工业界己越来越意识到将现有数据变为有用的信息,使之服务于系统监控,以增加系统的可靠性并降低维护成本的重要性。因此出现了基于数据驱动的故障诊断方法。

近年来,西方发达国家已加强对该领域的研究资助。国内也开展了相关的研究,典型研究机构主要有浙江大学工业控制技术国家重点实验室先进控制研究所,清华大学的过程控制国家重点实验室,以及其它的科研机构正在从事此方面的应用研究。

2.1 此方面研究成果

应用多元统计理论,Chiang et al[3]、陈耀[4],研究了工业过程的故障检测与诊断,提出了主元分析、部分最小二乘法的过程监控方法。

在此基础上改进的方法,如一些研究学者通过在主元分析和部分最小二乘中引入过程变量的延时测量值后构成新的数据矩阵,再对新构成的数据矩阵进行多变量统计投影分析,从而构成了动态主元分析[5]和动态部分最小二乘[4]。Westerhuis[6]阐述了多模块主元分析和部分最小二乘的思想,使监控模型的解释能力大为增强。

主元分析和部分最小二乘法等统计性能监控方法都是线性化的建模方法,而实际工业过程本质上都是非线性的。目前文献中提到的用于解决非线性问题的方法主要有神经网络方法、主元曲线方法。基于神经网络非线性统计性能监控的应用研究可参见文献[7];Dong[8]提出了一种利用神经网络实现的主元曲线非线性主元分析模型。在该方法中,需要两个神经元网络,一个用于学习数据和非线性得分之间的关系,另外一个用来学习非线性得分与修正过的数据之间的关系。

当数据的实际分布情况偏离正态假设时,利用正态分布计算出的控制限将给性能监控带来误报和漏报。Chen[9]对主元分析进行了改进,利用主元分析算法对过程数据进行降维,然后采用核密度估计算法估计主元变量的分布情况。独立主元分析是统计信号处理领域内一种新的方法,它利用信号的高阶统计信息,将混和信号分解成相互独立的非高斯成分。由于各非高斯成分满足独立性条件,联合概率密度等于各成分概率密度之积,因此避免了高维概率密度估计问题。早期的独立元分析研究主要集中在信号处理领域,近年来许多学者将此方法推广应用于统计性能监控与故障诊断,如Lee和何宁等。

应用模式识别技术,支持向量机是建立在结构风险最小化基础上,对有限的训练样本集能够获得最优的推广能力。其在故障诊断中的应用包括,Chu[10]利用训练好的支持向量机来判别不同工况的操作模式;Chiang[11]将支持向量机和判别式方法结合进行故障诊断等;zhang[12]等介绍基于支持向量域描述的故障诊断方法,并将其应用于流程工业当中。

2.2 此方面尚存问题

基于数据驱动的故障诊断研究中虽获得了不断地发展,所获得的理论成果和方法能够较快地应用于实际工业生产中。但在分析工业过程数据时,还有一些尚待解决的问题:

(1)数据质量

工业过程中的测量数据会受到各种噪声源的影响,往往导致数据不可靠。如果利用这样的数据来实现故障的识别,会使故障识别率大大降低。

(2)数据的强耦合、非线性

由于工业过程的行为状态由许多个变量共同作用的结果,它们之间具有很强的非线性或耦合关系。变量之间的关系用线性函数去近似有时不能得到很好的结果。

(3)可认知故障与不可认知故障判别

目前所述故障诊断方法,主要是对于可认知故障进行诊断判别。对于不可认知故障的诊断,还有待探索研究。

3 展望

随着科学技术的发展,为了进一步提高诊断性能,故障诊断新的方法与技术将不断出现。同时,基于数据驱动的故障诊断方法也将不断完善,进而取得更为广泛的应用。该领域还有一些方向需要进一步研究:

首先,各种故障诊断方法的融合。每一种故障诊断方法都有优点和不足,把基于数据驱动的故障诊断方法和基于知识的方法等结合起来是研究的发展方向。基于知识的方法(如专家系统、故障树、神经网络)有把推理结合起来的能力,适合于故障诊断。事实上,由于工业过程的复杂性,人的知识和决策是非常重要的,这方面是今后故障诊断研究努力的方向之一。

其次,诊断系统的通用性问题。目前每一种监控法都有其适用的条件,有的适用线性系统,有的适用非线性系统,还有的适用于变量具有非高斯分布的系统。但是对于一个具体的工业系统,实际情况是过程本身的特性不可能尽知。需要一种方法,能解决上述等情况并存过程的诊断问题。因此,研究开发集成算法是不错的发展方向。

再者,考虑故障诊断实时性。目前大多诊断都是离线诊断过程,对于有快速容错动作需求的诊断问题,需采用在线诊断方法,对于在线诊断的实时性问题有待研究。如何保证对所发生故障的原因作出快速的判别是研究者一直追求的效果。

最后,对不可认知故障的识别能力。目前的方法是对可认知的故障识别,对于不可认知的故障完全靠人来解决。如何结合先验知识对不可认知故障进行判别,使系统具有自学习能力,是将来故障诊断系统所具有功能的发展趋势。

4 结束语

本文阐述了工业过程故障诊断的意义和重要性,分析了故障诊断的一些常用理论和方法,介绍了基于数据驱动的故障诊断研究进展,指出存在的问题,并对此领域将来发展方向进行了展望。基于数据驱动的故障诊断技术在石油、化工等工业过程故障诊断中已有了应用,将来会有更多更完善的技术方法在实际工业过程中得到应用。

参考文献

[1]Sun W.Palazoglu A.,Romagnoli J.A.Detecting abnor-mal process trends by wavelet domain hidden Markov models[J].AIChE Journal,2003,49(l):140-150.

[2]Chiang,L.H.,Russell,E.L,Braatz,R.D.Fault Detection and Diagnosis in Industrial Systems.Hong Kong,Springer,2001.

[3]Chiang L.H.,Russell E.L.,Braatz R.D.Fault diagnosis in chemical processes using Fisher discriminant analysis,dis-criminant partial least squares,and principal component analysis[J].Chemometrics and intelligent laboratory,2000,50,243-252.

[4]陈耀,王海文,孙优贤.基于动态主元分析的统计过程监视[J].化工学报,2000,51:666-670.

[5]Chen,J.H.,Liao,C.M.Dynamic process fault monitoringbased on neural network and PCA.Journal of Process Control,2002,12(2):277-289.

[6]Westerhuis,J.A.,Kourti,T.,MacGregor,J.F.Analysis of multiblock and hierarchical PCA and PLS models.Journal of Chemometrics,1998,12(5):301-321.

[7]Lin,W.,Qian,Y.,Li,X.Non-linear dynamic principal component analysis for the online process monitoring and diag-nosis.Computers and Chemical Engineering,2000,24(2-7):423-429.

[8]Dong,D.,McAvoy,T.J.Nonlinear principal component analysis-based on principal curves and neural networks.Com-puters and Chemical Engineering,1996,20(1):65-78.

[9]Chen,Q.,Wynne,R.J.,Goulding,P.The application of principal component analysis and kernel density estimation to enhance process monitoring.Control Engineering Practice,2000,8(5):531-543.

[10]Chu,Y.,Qin,S.J.,Han,C.Fault detection and opera-tion mode identification based on pattern classification with variable selection.Industrial&Engineering Chemical Research,2004,43(7):1701-1710.

[11]Chiang,L.H.,Kotanchek,M.E.,Kordon,A.K.Fault di-agnosis based on Fisher discriminant analysis and support vector machines.Computers and Chemical Engineering,2004,28(8):1389-1401.

网络故障诊断综述 篇10

故障诊断技术是指不进行设备拆卸的情况下,通过相应的方法和技术手段,在设备运行过程中掌握其运行状态,确定是否发生故障并分析出发生故障的原因,预报故障未来的发展趋势[1]。故障诊断技术在各个工业领域都得到了国内外的充分关注,并取得了丰厚的研究成果。

自1957年第一颗人造地球卫星上天以来,全世界发射的航天器已经多达5000多颗。据统计,从1957年至1988年的30年间各国发生灾难性事故的卫星约140颗,造成了重大的经济损失[2]。近十几年来,随着我国发射的卫星越来越多,也出现了很多故障,针对航天器的故障诊断技术已经引起航天领域专家学者的重点关注。

1航天器故障诊断技术的研究现状

航天器作为光机电一体化仪器的设备,由于其规模大、复杂度高、航天器的资源和人工干预能力有限,且太空环境日趋恶劣并存在着大量的不确定性因素等,这些都对航天器的故障诊断技术提出了挑战难以进行有效维护,经常会出现系统异常运行甚至出现故障的情况。因此,航天器故障诊断技术对提高航天器的可靠性、安全性和有效性具有十分重要的作用,已经成为航天领域主要研究方向[3]。

美国和俄罗斯(前苏联)为代表的国家,在航天器故障诊断技术方面做了大量且深入的研究工作。美国国家航空航天局(NASA)从上个世纪七十年代以来便开始研究航天器的在轨故障诊断技术。经过几十年的发展,NASA利用建立的航天器故障诊断平台,对大量故障航天器进行了成功的诊断与维修,保证了航天器的可靠稳定运行,延长了航天器的使用寿命,除了保障航天器可靠稳定的运行外,故障诊断技术对于减少地面工作人员的工作量、航天员的培训时间以及发射与运行成本都具有重要意义。近几年美国投入大量的资金用于航天器系统故障诊断技术研究。尤其是在航天飞机方面,将飞行风险降低了50%,同时运行预算降低了1/3,而且还可能进一步降低[4,5]。

自上世纪70年代我国成功发射第一颗卫星以来,我国航天领域的技术人员便开始研究航天器故障诊断技术。但是一直以来,相关的研究所和日常管理部门没有建立专业的航天器故障诊断平台,主要依托某卫星测控中心组织实施,在技术上还局限于依靠人工手段对航天器进行在轨管理。航天器发生严重的故障后,需要组织航天领域相关专家和航天器研制人员到故障处置的现场一起进行分析,制定相应的维修方案,并对维修方案进行仿真验证确认后才能根据制定的维修方案对故障航天器进行维修,无法形成一个通用化的航天器故障诊断平台。直到2014年我国首个航天器在轨故障诊断与维修实验室才在西安某卫星测控基地宣告成立。

目前,航天器在轨故障诊断与维修问题,已经成为国际航天领域的热点之一。建立航天器在轨故障诊断与维修通用化平台已经成为各个国家进行航天器在轨管理发展的实际需要和必然趋势。

2航天器故障诊断的基本方法

故障诊断技术最早起源于美国[6]。作为一门学科进行系统研究从上世纪60年代的美国宇航局(NASA)开始,1961年美国开始实施阿波罗计划后出现了一系列的设备故障,促使美国海军研究室主持美国机械故障预防小组开始把故障诊断作为一种技术进行研究开发[7,8]。1971年,麻省理工学院的Beard发表的博士论文[9]和Mehra和Peschon发表在Automatica上的论文[10],创新性的提出了运用软件冗余代替硬件冗余的新思想,开启了故障诊断技术研究的开端。

根据系统采用的特征描述和决策方法的差异,形成了不同的故障诊断方法,应用于航天器故障诊断的方法有很多种,其中应用较多的有:基于模型的方法、基于信号处理的方法和基于人工智能的方法。

2.1基于模型的故障诊断方法

基于模型的故障诊断方法是提出最早、研究最为系统的一种方法。基本思想是运用软件冗余代替硬件冗余。基于模型的故障诊断方法分为基于参数估计的故障诊断方法和基于状态估计的故障诊断方法。

2.1.1基于参数估计的故障诊断方法

基于参数估计的故障诊断方法的基本思想是不需计算残差序列,而是根据模型参数及相应物理参数的变化量序列的统计特性来进行故障诊断,更利于故障的分离。因为被诊断对象的故障可以视为其过程参数的变化,而过程参数的变化又往往导致系统参数的变化[11]。1984年Iserman对基于参数佔计的故障诊断方法作出了完整的描述[12]。目前研究得较为广泛的有强跟踪滤波器方法和最小二乘法。

2.1.2基于状态估计的故障诊断方法

基于状态估计的故障诊断方法的基本思想是由于系统被控过程的状态直接反映出的是系统的状态,因此只需估计出系统的状态并结合适当的模型即可对被控对象进行故障诊断。这种方法首先利用系统的解析模型和可测信息,重构系统的被控过程,构造残差序列,残差序列中包含丰富的故障信息,再对残差进行分析处理,从而实现故障的检测与诊断[13]。主要有三种基本方法:Beard[9]首先提出故障诊断检测滤波器的方法;Mehra和Peschon[10]提出了基于Kalman滤波的方法;Massoumnia[14]提出的广义一致空间法。在实际应用中,由于系统越来越复杂,很难建立十分精确的数学模型。目前研究较为广泛的是将模型参考自适应的思想引入状态估计中,从而提高系统鲁棒性。

2.2基于信号处理的故障诊断方法

基于信号处理的故障诊断方法,通常是利用信号模型,如相关函数、频谱、自回归滑动平均、小波变换等,直接分析可测信号,提取诸如方差、幅值、频率等特征值,从而检测出故障,不需要精确的解析模型,有很强的适应性。

2.2.1基于输出信号处理的故障诊断法

基于输出信号处理的故障诊断法的基本思路是系统的输出(幅值、相位、频率等)和故障存在着一定的联系,可以通过数学的方法(频谱分析)进行描述。当发生故障时,可以通过系统的输出分析出故障发生的位置及其严重程度。常用的有:将时域信号变换至频域加以分析的方法称为频谱分析的频谱分析法;研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度的先关分析法等。

2.2.2基于小波变换的故障诊断法

小波变换属于时频分析的一种,是一种新型信号处理方法,是一种信号的时间-尺度(时间-频率)分析方法,具有多分辨率分析的特点,而且在时频两域都具有表征信号局部特征的能力,是一种窗口大小固定不变,但其形状可改变,时间窗和频率窗都可以改变的时频局部化分析方法。基本思路是首先对一系统的输入输出信号进行小波变换,利用该变换求出输入输出信号的奇异点。然后去除由于输入突变引起的极值点,则其余的极值点对应于系统的故障[15]。

目前国内已经有所研究应用的基于小波变换的故障诊断方法主要有三种:利用观测信号的奇异性进行故障诊断;利用观测信号频率结构的变化进行故障诊断;利用脉冲响应函数的小波变换进行故障诊断。基于小波变换的故障诊断方法对输入信号的要求低,对噪声的抑制能力强,灵敏度高,运算量适中,可以进行在线实时检测,在机械系统的故障诊断中取得了不少研究成果。

2.2.3基于时间序列分析的故障诊断法

基于时间序列分析的故障诊断法的基本思想是选取与故障直接相关的状态变量,建立时间序列过程模型,以模型参数作为特征矢量来判别故障的类型。过程模型参数与系统(设备)的内在特性和输入输出隐含着复杂的联系,在长期的设备运行实践中可以用统计的方法得出模型参数与系统典型故障之间的关系,作为故障识别的依据。这种方法可以在缺乏先验诊断知识的情况下,通过对机组运行过程数据序列的统计认识,逐步积累识别故障的能力,建立有效的诊断体系[16]。

2.3基于人工智能的故障诊断方法

基于人工智能的故障诊断方法是故障诊断领域的发展的重点,是现阶段应用最广泛,研究的最多的方向,不需要精确的模型,适用于不确定性的问题。下面介绍几种航天器故障诊断方面比较常用的方法。

2.3.1基于定性模型的故障诊断方法

基于定性模型的诊断方法是由人工智能领域学者提出的一类诊断方法。基于定性模型的故障诊断方法的不需要系统精确的数学模型。基本思想是根据系统组成元件与元件之间的连接(或参数间的依赖关系)建立诊断系统的模型;将过程特性的外部表现和人类专家对故障判断和处理的经验,通过抽象化方法直接建立各种过程变量与故障模式之间的定性模型,对系统进行推理,预测系统的定性行为,通过观测的系统实际行为与预期行为的差异,检测系统是否存在故障,并诊断故障的原因[17,18]。

在实际应用中,NASA开发的基于定性模型的诊断推理软件先后在深空一号、对地观测卫星EO-1、x-37飞船等实际型号中进行了科学验证或应用[19]。国内在航天领域基于定性模型的诊断技术主要在液体火箭发动机的故障诊断领域取得了一些研究成果。

2.3.2基于专家系统的故障诊断方法

专家系统是人工智能的一个重要分支,能够在一些特定的领域内模仿人类专家的推理能力,来解决复杂的实际问题。基于专家系统的故障诊断方法的基本思路是将某一领域长期的实践经验和大量的故障信息知识,模仿人类专家的推理方式,总结归纳成规则知识库使计算机能够识别,然后将需要诊断的实时的数据输入计算机的数据库中,专家系统利用已经归纳生成的知识库对实时数据进行分析和推理,从而推算出可能的故障[20],如图1所示。

使用专家系统进行故障诊断的方法在日常的工程应用中已经有了大量的实践,也较广泛的应用于航天器故障诊断领域,如:CLIPS、EXSYS、G2[21]等。

2.3.3基于数据挖掘的故障诊断方法

基于数据挖掘的故障诊断方法的核心思想是利用海量的历史数据进行处理从而获取系统的行为模型,通过结合先验知识可及时发现系统出现或者即将出现的故障,如图2所示。

人工神经网络(Artificial Neural Networks,ANN)能够有效地实现输入到输出的非线性映射,是数据挖掘最常用的技术之一。当系统为非线性系统,这类系统一般难以有效建立模型,因而用本身就是非线性映射的ANN来模拟难以建模的非线性系统恰好解决了这一难题[22]。

模糊技术:即利用模糊集理论对实际问题进行评判、决策、模式识别和聚类分析。适用于系统状态及故障状态具有不确定性,并可采用模糊集描述的情况[23]。其主要方法有四种:基于模糊模型的故障诊断方法,基于自适应模糊阈值的残差评价方法,基于模糊聚类的残差评价方法和基于模糊逻辑的残差评价方法。

在航天器故障诊断应用中,利用数据挖掘技术对历史测控数据进行规则挖掘,从海量的样本数据中获取故障诊断的规则,及时发现故障征兆并采取有效措施就可能避免航天器出现重大的故障。NASA领导下的Ames Research Center(ARC)[24]的Inductive Monitoring System(IMS)主要采用聚类的方式对数据进行自动状态分类。通过对哥伦比亚航天飞机失事前数据的分析,发现IMS能比航天飞机控制中心更早发现故障,并于09年用于国际空间站控制中心的ISS管理。

3航天器故障诊断技术的发展趋势

近年来,基于人工智能的航天器故障诊断方法已经成为主要的研究方向,尤其是基于数据挖掘的航天器故障诊断方法不需要建立对象的模型,依靠分析已经积累的海量历史数据,提取出其中的关联关系和趋势特征作为识别故障的依据。

航天器遥测数据包括了航天器运行和控制过程中的各种性能参数数据、状态分析数据、二次计算结果等多种状态数据,这些数据反应了航天器的运行状态。由于航天器系统复杂,参数众多,大多包括成千上万的传感器测量参数,这些参数在设备发生故障之前的一段时间可能就会有一定变化,如温度、压力等参数的异常变化,其也会导致测控过程中的一些其他数据发生异常变化。基于数据挖掘的航天器故障诊断的方法,通过以航天器的遥测数据为研究对象,构建航天器遥测数据的训练库和测试库,利用数据挖掘分类方法训练故障分类器,经测试库数据验证分类器的有效性后,生成对应的故障诊断规则,并利用历史数据对规则进行测试和优化。在故障诊断中,将设备实时的数据与的诊断规则和诊断知识一起代入诊断运算过程,得到故障是否存在、产生的原因和处理的方法。这种方法可从海量的数据中及时发现异常情况,并对异常情况进行预警、诊断并发现一些深层次的故障原因,并将故障重新输入训练库中,提高后续故障诊断的准确度和精度,是今后研究的一个重点。

4结束语

本文对故障诊断技术的现状进行了综述。重点介绍了泛应用于航天器的故障检测的基于模型、基于信号处理、基于人工智能的诊断方法。由于航天器系统的复杂性及其运行环境的特殊性,还有很多故障诊断的问题亟待解决,可以将各种方法进行融合,发挥各自的优点,不断用新的方法来探究。

摘要:对国内外航天器故障诊断技术的发展进行了回顾,总结了航天器故障诊断技术的基本方法,指出基于数据挖掘的航天器故障诊断方法是今后的发展趋势。

网络故障诊断综述 篇11

从实质上说,贝叶斯网络是一种概率网络,是在概率推理的基础上建立起来的图形化的网络系统。在这个系统中,贝叶斯公式发挥着十分重要的作用。概率推理则是为了解决各种不定性和不完整性问题而提出的,非常有效地解决了各种复杂设备中由于不确定性、不完整性或者关联性等引起的故障。因此,概率推理在贝叶斯网络中得到了广泛的应用。一般来说,贝叶斯网络是一种带有方向的无环网络,主要由各种节点及有向边组成。其中,节点代表的是各种随机的变量,而各个有向边则代表着节点之间的相互关系,其中有向边的方向是由总节点指向各个分支节点,关系强度大小用条件概率来表示。在整个概率推理过程中,节点可以表示任何形式的变量,如各种现象、意见等。因此,贝尔斯网络中可以一些从不完全或者不确定的信息中进行相应的推理。贝尔斯网络具有以下特点:第一,它是一种不定性的因果关联的模型,表示着各种变量之间的因果关系。第二,贝叶斯网络能够处理各种不确定性的问题,能够在条件有限的情况下解决各种问题。第三,贝叶斯网络将多种信息充分融合起来,同时还包括各种故障诊断和维修决策等。作为不确定信息处理的重要工具,贝叶斯网络已经在智能化的信息系统中得到了重要的应用,其应用的行业范围也在不断地扩大,涉及到各种医疗诊断、统计决策或者各种学习预测等领域。

2、基于贝叶斯网络的架空输电线路隐形故障诊断系统关键技术分析

由于贝叶斯网络系统优良的性能及功用,其被应用于社会生活的各个行业之中,其中在架空输电线路隐形故障诊断系统中应用的更为广泛。下面,笔者将对贝叶斯网络架空输电线路隐形故障诊断系统的关键技术进行深入地分析。

2.1架空输电线路预测数学模型分析

经过多年以来的发展和提升,输电线路的故障定位技术也在不断地完善。但就目前情况来看,由于电力系统的复杂性,加之影响系统故障定位的各种因素的多样性,故障定位技术的应用过程中还存在着一些问题。同时,我们必须意识到故障定位技术的应用基础就是输电线路数学模型。因此,要提高故障定位的精度,必须选择正确的输电线路模型。作为一种重要的电力元件,输电线路在电力系统的计算过程、电磁分析以及故障测距等工作领域发挥着十分重要的作用。就目前来说,输电线路的数学模型有很多种,包括各种简单的集中参数式的竖向模型,也包括各种复杂的分布性参数模型。具体来说,前者主要包括π型模型、多级π型模型以及R-L模型等。后者则主要包括各种无损模型、频率相关的模型以及无畸变的模型等。输电线路模型选择十分重要,将会对计算结果的精确性产生十分重要的影响。就我司来说,主要采用了IEC-61970/61968中定义的线路包(Wires)信息模型和IEC61968资产信息包作为基础,形成了相应的数学模型。当然,为了保证数学模型的准确性,提高计算结果的精确度,相关工作人员认真阅读并严格执行《输变电设备状态评价标准》的相关要求,在CIM规则的基础上添加了南方电网公司所制定的相关标准。例如,在评价分类方面,工作人员在CIM规则的基础上添加了状态评价包。该评价包包括几个层叠的组成部分: 第一个大部分是输电线路。而各个输电线路又是由不同的单元,如基础、杆塔等构成的。这些不同的单元下面涉及到各個不同的状态量,如结构位移、外漏等。通过该数据模型,我们可以及时地诊断出架空输电线路系统运行中的各种隐性故障,进而采取各种合理有效的措施。

2.2架空输电线路状态评价标准分析

根据设备运行的状态量对架空输电线路所造成的影响的程度大小,工作人员经将架空输电线路的状态评价标准分为四个等级,这四个等级分别对应不同的权重系数。判断出等级之后,工作人员就能对架空电路系统的运行状况有了更好地了解,能够及时发现各种隐性故障。而工作人员首先要做的就是对各个状态量进行综合全面地分析,并对设备的状态做出合理的评价。如果设备处于正常或者注意的状态,那么完全可以正常运行。但如果设备出现异常,则应该尽快检查和维修。如果设备运行严重异常,则应该停止使用,立即检查和维修。具体来说,架空输电线路的状态评价标准主要有三个:第一,线路单元评价标准。正如上面所提到的,线路单元可以分为基础、杆塔、绝缘子等。工作人员要认真检查这些线路单位的状态,并对这些单元的状态进行评估,作扣分处理,判断其是否属于正常、注意、异常或者严重问题状态。

2.3基于贝叶斯网络的架空输电线路的状态评估探讨

传统的故障检修方法执行定期维修的制度,这种制度存在着很大的不合理性。很多输电设备出现了重复停电的状态,造成了人力、物力资源的大量浪费,这也严重影响了电力设备的可靠性水平。而贝叶斯网络架空输电线路隐形故障评估系统,通过一系列的状态评估规章将各种变量代码化,形成各种可以度量的信息数据库,能够准确地了解输电设备的运行状态,提出最合理的维修策略。状态评估工作主要分为两大部分:线路单元评估和整体评估。首先,从线路单元评估方面来说,工作人员要充分考虑各个线路单元的状态,并对各个状态进行评估,作扣分处理。同时,要注意一点,在对某一输电线路中的同类设备进行状态评价时,不应对各个设备的状态量进行重复累加,而要以最严重的状态进行相应的扣分。如果评价过程中出现多个状态量变化的情况,且变化的原因及具体的部件无法明确时,工作人员应该进行相应的分析诊断,判断状态量异常的原因。其次,线路的整体评价是在单元评价的基础上发展起来的。如果单元评估为严重异常,则整个线路的整体评价也为严重异常。通过状态评估的相关结果,工作人员可以对设备发生故障的概率以及设备的风险等进行分析,并建立相应的更为完善的数据模型。当然,我司已经完成了相应的程序化验证工作,一些具有相应特征的数据库和计算模块已经建立起来,为之后的状态评估工作提供了有利的支持。在状态评估的过程中,我们必须注意一点,该方法中无法获得足够多的历史评价数据,其预测的精度可能会大有下降。对此,我们要做好以下两方面的工作:第一,加强沟通与交流,力求从更多的渠道获得更多的状态评价的历史数据;第二,进一步优化状态评价的输入接口或者相应的界面,允许工作人员自动或者手动输入相关信息。

3.总结

贝叶斯网络的架空输电线路隐形故障诊断系统的应用,给输电系统的正常运行提供了有利的保障,促进了我国电力行业的进一步发展。

网络故障诊断综述 篇12

1 故障诊断的基本问题

1.1 故障分类

一般而言,动态系统中故障的发生部分、时间、发生形式呈现出多样化。

按照发生部位的不同可分为:

1)元部件故障:指被控对象中的某些元部件甚至是子系统发生异常,使得整个系统不能正常完成即定的功能。

2)传感器故障:指控制回路中用于检测被测量的传感器发生卡死、恒增益变化或恒偏差而不能准确获取被测量信息,具体表现为对象变量的测量值与其实际值之间的差别。

3)执行器故障:指控制回路中用于检测被测量的传感器发生卡死、恒增益变化或恒偏差而不能正确执行控制命令,具体表现为执行器的输入命令和它的实际输出之间的差别。

按照时间特性的不同可分为:

1)突变故障:指参数值突然出现很大偏差,事先不可监测和预测的故障。

2)缓变故障:又称为软件故障,指参数随时间推移和环境的变化而缓慢变化的故障。

3)间隙故障:指由于老化、容差不足或接触不良引起的时隐时现的故障。

按照发生形式的不同分为:

1)加性故障:指作用在系统上的未知输入,在系统政党运行时为零。它的出现会导致系统输出发生独立于已知输入的改变。

2)乘性故障:指系统的某些参数的变化。它们能引起系统输出的变化,这些变化同时也受已知输入的影响。

1.2 故障诊断方法分类

故障诊断方法可以分为三大类[1]:基于解析模型的方法,基于定性模型知识的方法和基于过程历史数据的方法。后两类方法,例如有向图、故障树、专家系统、神经网络及主元分析等,在近年来发展很快,但以控制理论为基础的基于解析模型的方法仍然具有很重要的研究意义。基于系统动态数学模型的方法是通过将被诊断对象的可测信息和由模型表达的系统先验信息进行比较,以产生残差,并对残差进行分析和处理而实现故障诊断的技术。该类方法发展最早也最为深入,它需要建立被诊断对象的精确数学模型,优点是充分利用了系统内部的深层知识,利于系统的故障诊断。其中以基于观测器的状态估计方法研究最为广泛与成熟。

2 基于观测器的故障诊断技术

2.1 观测器的分类

观测器的引入主要基于实现状态反馈的需要。现代工业控制系统正快速的向精确化,智能化,综合化发展。这就要求准确掌握系统的状态过程。但是,状态作为系统内部变量组,不可能全部直接测量,或测量受各种因素的限制。因此,伴随着观测器的发展,为各种精确控制算法的实现提供了可能。观测器可按两种方式进行分类。

从功能角度,可把观测器分类为状态观测器和函数观测器两大类。状态观测器以重构被测系统状态为目标,取重构状态和被观测状态的渐近等价为等价指标。状态观测器的特点是,当时间趋向于无穷时即系统达到稳态时可使重构状态完全等同于被观测状态。函数观测器以重构被观测系统状态的函数如反馈线性函数为目标,将等价指标取为结构输出和被观测状态函数的渐近等价。函数观测器的特点是,当时间趋向于无穷时可使重构输出完全等同于被观测器状态函数。函数观测器的优点是在于维数上低于状态观测器,状态观测器优点是综合方法较为简单和成熟。

状态观测器按结构可分全维状态观测和降维状态观测器两种基本类型。维数等于被观测系统的状态的观测器称为全维观测器,维数小于被观测系统的状态的观测器称为降维观测器。降维观测器在结构上较全维观测器为简单,全维观测器在抗噪声影响上较降维观测器要优越。

3 滑模变结构观测器

3.1 滑模变结构理论概述

滑模变结构本质上是一类特殊的非线性控制。其非线性表现为控制的不连续性。这种控制策略与期货控制的不同在于系统的“结构”并不固定,而是可以在动态过程中,根据系统当前的状态(如偏差及其各阶导数等)有目的地不断变化,迫使系统按照预定的“滑动模态”的状态轨迹运动,所以又常称为变结构控制为滑动模态控制,即滑模变结构控制。由于滑动模态可以进行设计且与对象参数及扰动无关,这就使得变结构控制具有快速响应、对参数变化及扰动不灵敏、无需系统在线辨识、物理实现简单等优点。该方法的缺点在于当状态轨迹到达滑模面后,难于严格地沿着滑面向着平衡点滑动,而是在滑模面两侧来回穿越,从而产生颤动。

3.2 滑模变结构等值原理

在滑模控制中,当系统满足滑模成立条件时,即ss觶<0时,则滑模发生。当t→∞时,S与S觶→∞。此为变结构一个特殊现象,称为等值原理。

3.3 基于滑模变结构观测器故障诊断的研究现状

近年来,国内外对滑模变结构在故障诊断系统中应用已有一定的研究基础,得到了相当的重视,此类相关方法相继被提出。Sreedhar等对一类非线性系统,在所有状态变量可测基础上,提出了一种基于滑模观测器的故障诊断方法[2]。而Hermans等提出的滑模故障诊断方法中,当系统工作正常时,滑模观测器工作在滑动面上,其滑动残差保持零均值:当发生故障时,系统失去抖动特性,滑动模态被破坏,通过比较其残差和阀值即可得到故障信息[3]。Kok等提出了一种等效注入故障方法,可直接估算故障向量[4]。Edwards提出一种将传感器故障等效为执行器故障的变换方法,并以直流电机为对象,给出了设计实例[5]。Floquet等提出了一种滑模扰动观测器设计方法,通过对扰动和故障进行解耦,达到故障诊断目的[6]。Weitian等提出的方法中,对含未知输入扰动的系统,利用滑模技术对输出进行估计后进行故障诊断[7]。Yan等利用滑模观测器对故障进行鲁棒估计,并在此基础上实现了故障重构[8]。Chen等提出在系统中同时采用滑模变结构观测器和Luenberger观测器的方法[9],使得整个系统一方面对扰动有较强的鲁棒性,另一方面又对缓变故障保持敏感,从而可实现故障的早期检测。然而,由于采用的残差生成的方法进行故障检测与诊断,故障发生的早期,残差的阈值较小且易受干扰的影响,容易导致故障的误报或漏报。Tan等针对缓变形式的传感器故障,提出了一种故障重构的方法[10],首先将传感器故障通过一个稳定矩阵等效为执行器故障,再根据滑模变结构的等值原理重构故障。故障重构技术不但可以检测到故障的发生,还可以较好地估计出故障发生与发展的波形与幅值,即实现更为精确的故障诊断。但是在Tan的研究中只考虑了缓变故障的一阶导数为零的理想情况,且未考虑系统中不确定的扰动。

4 结束语

故障诊断技术是随着现代科学技术的发展而发展起来的一个新的领域,是系统安全性、可靠性的重要保障技术,直接关系到社会效益和经济效益。本文详细介绍了故障和故障诊断方法的分类,重点阐述了滑模变结构观测器的原理及其在故障诊断中的最新研究发展现状。

参考文献

[1]Venkatasubramanian V,Rengaswamy R,Yin K,et al.A review of process fault detection and diagnosis Part I:quantitative model-based methods[J].Computer&Chemical Engineering,2003,27(3):293-311.

[2]Sreedhar R,FemaHndez B,Masada G.Robust fault detection in nonlinear systems using sliding mode observers[C].Proceedings of the IEEE Conference on Control Applications,1993:715-721.

[3]Hermans F,Zarrop M.Sliding mode observers for robust sensor monitoring[C].proceedings of the13th IFAC World Congress,1996:211-216.

[4]Kok Yew Ng,Chee Pin Tan,Edwards C,et al.New results in robust actuator fault reconstruction for linear uncertain systems using sliding mode observers[J].Int.Journal of Robust and Nonlinear Control,2007,17:1294-1319.

[5]Edwards C,Chee Pin Tan.Sensor fault to lerant control using sliding mode observers[J].Control Engineering Practice,2006(14):897-908.

[6]Floquet T,Barbot J P,Perruquetti W,et al.Onthe robust fault detection via a sliding mode disturbance observer[J].Internationa Journal of Control,2004(10):622-629.

[7]Chen Weitian,Saif M.Sliding Mode Output Estimator Based Fault Detection,Isolation and Estimation for Systems with Unmatched Un-known Inputs[C].Proceedings of the2006IEEE International Conference on Control Applications,2006,4-6

[8]Xing Gang Yan,C Edwards.Nonlinear robust fault reconstruction and estimation using a sliding mode observer[J].Automatica,2007,43:1605-1614.

[9]Chen Wen,Chowdhury F N.Design of Sliding Mode Observers with Sensitivity to Ineipient Faults[C].16th IEEE International Conference on Control Applications,2007:795-800.

上一篇:完善司法制度下一篇:仔猪饲养管理技术