网络故障诊断(共11篇)
网络故障诊断 篇1
1 网络故障的分类
引起网络故障的因素有很多种, 总体可划分为硬件故障和软件故障两类, 以下是几种常见的硬件和软件故障。
1.1 硬件故障
1.1.1 设备自身故障:
如网卡质量不良或有故障;网卡和主板PCI插槽没插牢导致的接触不良;网卡和网线接口存在问题;网线接头制作不良;网线接头部位或中间线路部位有断线;集线器质量不良;集线器供电不良;集线器和网线的接口接触不良;交换机质量不良;交换机供电不良;交换机和网线的接口接触不良。
1.1.2 设备与设备间故障:
如网卡和网卡之间发生中断请求和I/O地址冲突;网卡和声卡之间发生中断请求和I/O地址冲突;网卡和显卡之间发生中断请求和I/O地址冲突。
以上硬件故障中最常见的就是网线和网卡故障。
1.2 软件故障
1.2.1 设备驱动程序故障:如驱动程序与操作系统不兼容;驱动程序之间的资源冲突;驱动程序与主板BIOS程序不兼容;设备驱动程序没有安装好引起设备不能正常工作。
1.2.2 网络协议故障:如缺少相关的网络协议;网络协议和网卡绑定不当;网络协议设置不当。
1.2.3 网络服务方面故障;如Windows操作系统中共享文件和打印机方面的服务, 即安装Microsoft文件和打印共享服务故障。
1.2.4 网络表示方面故障:用户计算机在网络中的网络标识设置不正确, 可能会导致用户之间不能相互访问。
1.2.5 其他故障:这些问题与用户设置无关, 但和用户的某种操作有关, 例如大量用户同时访问网络造成网络拥挤甚至网络阻塞。
由软件设置引起的网络故障中, 最常见的是TCP/IP协议中的IP地址设置不当导致网络不通, 其次是网络标识设置不当引起的相互间无法访问。
2 网络故障的排除过程
2.1 识别故障现象
排除网络故障前, 必须确切地知道网络中问题所在, 例如网络中资源无法共享或找不到其他计算机。成功排除故障的首要任务就是判断识别故障现象。
识别故障现象时, 应该向操作者询问以下几个问题: (1) 用户最后一次网络正常的时间。 (2) 当故障现象发生时, 有哪些进程正在运行。 (3) 该进程是否曾经正常运行过。 (4) 如运行过这个进程后, 计算机有哪些改变。
2.2 详细描述故障的现象
对故障现象的详细描述尤为重要。管理员应注意出错信息, 仔细操作出错的程序。在故障排除前, 首先要收集相关故障现象的信息, 注意故障现象的细节, 因为这会为缩小问题范围提供有利的信息。然后详细描述问题和故障现象, 并及时记录, 而无需急于下结论。
2.3 分析导致故障的原因
如信息无法查看, 管理员应当分析导致故障的原因有哪些, 如网络设备故障、连接故障、硬件故障等等。
2.4 测试并排除故障
测试每一个可能导致网络故障发生的因素, 排除故障原因, 缩小故障范围。测试工作往往需要进行多次, 只根据一次测试就断定某一区域的网络是运行是否正常是不够准确的。在测试过程中, 当发现一个问题后是否应该停止, 答案是否定的, 应将所有任务测试我完为止。
2.5 隔离错误
经过以上的操作后, 已经基本知道故障的部位, 对于电脑的错误, 可以开始检查该电脑网卡是否安装好、TCP/IP协议是否安装并设置正确、Web浏览器的连接设置是否得当等一切与已知故障现象有关的内容。
2.6 故障分析
对网络故障处理完成后, 为避免以后出现类似的故障, 需要总结导致发生故障的原因, 拟定相应的对策, 采取必要的措施, 制定严格的规章制度。
3 网络故障原因
引起网络故障的原因多种多样, 常见的网络故障有网络协议、网络连接性问题、配置文件选项方面的故障。
3.1 网络协议
网络协议负责网络内的计算机与网络设备间的正常通信。没有网络协议, 所有的硬件只不过是各自为政的单机, 不能实现资源共享, 从而失去了网络的意义。
3.2 配置文件和选项
服务器、计算机中配置选项和配置文件设置不正确。如服务器权限的设置不当, 会导致资源无法共享的故障。网卡配置不当, 会导致计算机无法连接的故障。
3.3 网络连接性
网络连接性是网络故障中常见因素。连通性的问题通常涉及到网卡、网线、跳线、信息插座、交换机、集线器、路由器等设备和通信介质。如果其中任何一个设备损坏, 都会导致网络连接的中断, 可以通过软件和硬件工具进行连通性的测试和验证。
4 结束语
计算机网络是一个错综复杂系统, 要想顺利地诊断并排除网络故障, 需要网络管理员具备一定的知识和经验。对计算机硬件、网络设备、网络技术和协议, 故障诊断与排除工具及命令都充分的了解。网络故障诊断工作非常繁杂, 引起网络故障的因素多种多样。文章对网络故障的分类及排除过程做了详细的介绍, 并总结了网络故障的原因。
参考文献
[1]宋文重.浅析网络故障的诊断与解决方法[J].硅谷, 2008 (3) .
[2]霍扬, 龚俭.计算机网络故障分析及维护研究[J].硅谷, 2008 (7) .
[3]房春玲, 范金玺, 等.浅谈计算机网络故障与维护[J].中国新技术新产品, 2009 (14) .
基于BP网络的电机故障诊断 篇2
摘要:介绍了BP神经网络以及电机故障诊断的发展和电动机故障诊断常见的技术方法,列举了电机故障征兆集。设计一个具有电机故障诊断功能的BP网络系统,给出了matlab关键程序和运行结果。
关键词:BP神经网络电机故障诊断
0引言
电机的正常工作对保证生产制造过程的正常进行意义非常重大。因此对电机故障的诊断要求十分迫切,通过对电机常见故障的诊断和分析,可以及早发现故障和预防故障的进一步恶化。随着芯片技术的发展及智能技术的应用,诊断技术已经进入了一个新的阶段,一种基于人工智能技术的诊断方法。该文用BP神经网络综合实现电机故障的诊断。
1BP神经网络
人工神经网络就是模拟人思维的第二种方式。这是一个非线性动力学系统,其特色在于信息的分布式存储和并行协同处理。虽然单个神经元的结构极其简单,功能有限,但大量神经元构成的网络系统所能实现的行为却是极其丰富多彩的。
BP(Back Propagation)网络是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP神经网络模型拓扑结构包括输入层(input)、隐层(hide layer)和输出层(outputlayer)。BP网络能学习和存贮大量的输入一输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。
BP算法理论具有依据可靠、推导过程严谨、精度较高、通用性较好等优点,但标准BP算法存在以下缺点:收敛速度缓慢,容易陷入局部极小值,难以确定隐层数和隐层节点个数。在实际应用中,BP算法很难胜任,因此出现了很多改进算法:①利用动量法改进BP算法:②自适应调整学习速率;⑧动量一自适应学习速率调整算法:④L—M学习规则。
2电机故障诊断
由于人为的因素,仅依靠日常的“听、摸、看”难免会造成一定的判断失误,一方面造成电机抱轴等严重事故的发生,另一方面又可能对状态较好的电机进行停车检修,如此不仅不能保证装置的平稳运行,同时还造成了检修费用的大量浪费。
故障诊断技术发展至今已经历了三个阶段第一阶段由于机器设备比较简单,故障诊断主要依靠专家或维修人员的感觉器官、个人经验及简单仪表就能胜任故障的诊断与排除工作;传感器技术、动态测试技术及信号分析技术的发展使得诊断技术进入了第二个阶段,并且在维修工程和可靠性工程中得到了广泛的应用;80年代初期,由于机器设备日趋复杂化、智能化及光机电一体化,传统的诊断技术已经不能适应了,随着计算机技术、人工智能技术特别是专家系统的发展,诊断技术进入第三个发展阶段一智能化阶段。
电机故障诊断,尤其是多个故障特征信号相互交织叠加时,很难仅凭肉眼进行判断识别,而人工神经网络具有独特的非线性映射、联想记忆、自适应与自学习以及良好的容错性等优点,十分适用于复杂电机系统的故障诊断。
各种类型的电机具有相同的基本原理,电机内部都有电路、磁路、绝缘和机械等独立而相互关联的系统,一般用于电动机故障诊断的技术方法有:①电流分析法。通过对电机电流幅值、波形的检测和频谱分析,诊断电机故障的原因和程度。例如通过检测交流电动机的电流,进行频谱分析来诊断电机是否存在转子绕组断条、气隙偏心、定子绕组故障、转子不平衡等缺陷。②振动诊断法。通过对电动机的振动检测,对信号进行各种处理和分析,诊断电机产生故障的原因和部位,并制定处理方案。⑧绝缘诊断。利用各种电气试验和特殊诊断技术,对电机的绝缘结构、工作性能和是否存在缺陷作出结论,并对绝缘剩余寿命作出预测。④温度诊断。用各种温度检测方法和红外测温技术,对电机各部分温度进行监测和故障诊断。⑤振声诊断技术。振声诊断技术是对诊断的对象同时采集振动信号和噪声信号,分别进行信号处理,然后综合诊断,因而可以大大提高诊断的准确率。
3系统总体方案
表1为该系统列出了5种常见的电机故障征兆集和,在集合中,“1”表示有征兆存在,“0”表示征兆不存在。
根据经验输出为电机的故障等级,范围从0~1表1的样本输入对应的样本输出如表2。
4软件实现
BP网络在Matlab上的仿真程序设计主要包括:输入层、隐含层、输出层及各层之间的传输函数几个方面。输入和输出样本分别为表1和表2。利用Matlab在模式识别方面采用采用自适应学习率BP算法计算机进行仿真。这里用到matalab神经网络工具箱中的一个非常实用的函数newff。newff函数需要4个输入参数。第一个参数是一个RX2的矩阵以定义R个输入向量的最小值和最大值。第二个参数是一个设定每层神经元个数的数组。第三个参数是包含每层用到的传递函数名称的细胞数组。最后一个参数是用到的训练函数的名称。
根据表1样本输入和表2样本输出,创建bp网络和定义训练函数,是为了方便而建立一个矩阵,用newff函数来训练BP网络。关键程序如下net=newff([0 1;0 1;0 1;0 1;0 1],[5 1]{logsig,pure-lin},trainlm);%这里要加入输出层的转移函数,一般是trainlm;net.trainParam.goal=0.001;net.trainPalm.epochs=5000;[net,tr]=train(net,p,t);%训练神经网络iw1=net.IW{1}:%输出训练后的权值和阈值:b1=net b{1};1w2=net LW{2}:b2=net.b{2};save net51 net。
5结束语
网络故障诊断关键技术 篇3
关键词:故障诊断,故障定位,专家系统,神经网络,贝叶斯网络
随着计算机和网络应用的深入,计算机网络已经成为现代社会必不可少的基础设施。然而,计算机网络是一个复杂的综合系统,网络故障不可避免,这就需要行之有效的网络故障诊断技术,来实现对网络故障的检测、定位并排除,确保网络的稳定和畅通。
传统的网络故障诊断主要是依据发生故障时的网络故障信息,通过专门的网络分析仪和网络操作系统中的故障诊断工具以及网络代理的轮循与告警等方法获取故障信息,然后根据故障信息,网络专家分析和判断来找出产生故障的原因。网络的故障诊断是一个典型的多层多类分类问题,通常采用分层诊断的方法[1],沿着OSI七层模型从物理层开始向上进行逐层诊断,直到网络恢复正常工作为止。
然而,随着网络规模的急剧扩大和结构的日趋复杂,传统的依靠网络专家以人工方式进行的故障诊断已经不能满足需要了。研究开发出一套具备准确的诊断以及分析处理复杂、不确定问题能力的智能故障诊断技术已成为当务之急,这也是现在网络故障管理领域研究的热点[2]。
1 网络故障诊断概述
通常网络故障诊断过程包括三个阶段[3]:
1)故障检测。故障检测是对网络系统的不正常信号进行处理的过程,这些不正常信号来源于网络组件的故障或功能失调。故障检测是用来确定故障源的一个重要手段。
2)故障定位,也称为故障隔离,或事件/告警关联。根据观察到的故障症状推理出故障所在的精确位置的过程,故障定位的核心部件是事件关联,即把与同一个源故障相关的告警进行分组。
3)故障测试,也称为故障确认。故障定位得到了系统失效的故障假设之后,需要进行进一步的测试来确认故障,然后进行恢复操作,如重启软件系统或更换失效的硬件组件等。
当前网络故障诊断的研究主要集中在故障诊断的第二阶段———故障定位,这是网络故障诊断的关键技术,也是网络故障诊断的难点所在[2,3,4]。
网络故障定位的核心技术是事件关联技术。其基本思想是通过关联多个事件为某单一概念事例来过滤不必要的或不相关的事件,为网络管理员提供事件信息更精简的视图,以准确、快速的识别故障源。
由于故障具有传播性,单个故障会产生大量的网络告警,在多个故障同时发生时,情况变得更加复杂。故障定位就是要在故障产生时,把告警事件进行关联,分离并推断出故障源的准确位置。但是网络故障定位的主要困难却是来自于得到的告警信息太多而不是信息的缺少。而且网络的不可靠性和不确定性,使故障定位变得更加复杂而困难。其主要表现在[4]:
1)故障证据可能是模糊的、不一致的和不完整的;
2)得到的系统知识可能包含不确定信息;
3)多个不相关的故障可能同时发生产生重叠的告警消息;
4)存在多个不同的故障假设能够解释观察到的故障症状;
5)在大型系统中,利用单个管理应用程序对系统进行故障定位以及对可用知识库进行维护在计算上通常是不可行的;
6)事件之间不仅存在因果关系,通常还存在时间相关性。
针对上述难点,主要的解决方法是引入人工智能技术,进行自动故障定位,以实现智能化的故障诊断。目前用于网络故障定位的人工智能技术主要有:专家系统、神经网络和贝叶斯网络等。
2 故障定位技术
2.1 基于专家系统的故障定位技术
故障诊断中应用最广泛的人工智能技术是专家系统,专家系统通过模仿人类专家在解决特定领域时的行为来解决问题。基于专家系统的故障定位技术根据故障诊断领域的专家知识和经验,通过模拟人类专家做出决策的过程,达到解决复杂系统故障诊断的目的。
专家系统由知识库、推理机、知识获取、解释界面等四部组成,其中知识库用来存放相关领域专家提供的专门知识。在故障检测诊断专家系统的知识库中,存储了某个对象的故障征兆、故障模式、故障成因、故障排除意见等内容,这些知识是诊断的基础。专家系统知识库的知识,可以是从经验中获得的表面知识,也可以是通过理解系统行为的工作原理而得到的深层知识。推理机的功能是根据一定的推理策略从知识库中选取有关的知识,对用户提供的证据进行推理,直到得出相应的结论为止。
根据专家系统所使用知识结构的不同,解决故障定位问题的技术可分为以下几种:
1)基于规则的推理技术
基于规则的推理(Rule-based Reason,RBR)是最简单的关联技术,己被用于HP Open View Element Management构架。通常,基于规则的系统有三个组成部分:(1)推理引擎,包含解决问题的策略;(2)知识库,包括与特定问题有关的规则,规则是指出在什么情况下采取什么措施;(3)工作存储区,包含需要处理的问题数据。
在RBR的事件关联系统中,知识库的专家知识是网络中的问题定义。工作存储区包括被监控网络的拓扑和状态信息,工作存储区用来识别网络是否出现不完善的状态。推理引擎根据知识库的信息,将当前的状态与规则的左侧相比较,查找出最相似的匹配,然后输出规则的右侧。
2)基于模型的推理技术
基于模型的推理(Model-based Reason,MBR)是现有网络故障管理系统中应用最广泛的一种技术。该方法充分利用现有的系统知识,为具体的现实系统建立对应的抽象系统模型,再根据系统模型对系统行为进行预测,并将预测的行为与观察到的系统实际行为进行比较,然后再对预测的行为和实际行为间的不一致进行诊断。在基于模型的推理系统中,系统模型一般都提供网络拓扑、部件故障和告警之间的条件关系等信息。
3)基于范例的推理技术
范例是指一段带有上下文信息的知识,该知识表达了推理机在达到其目标的过程中能起到关键作用的经验。基于范例的推理(Case-based Reason,CBR)根据过去的实际经验或经历,对现有的问题做出相应的决策。基于范例的推理技术的推理过程可以分为4个部分,分别为检索(Retrieve)、复用(Reuse)、修正(Revise)、保存(Retain),简称4R过程。其中Retrieve过程从范例库中检索与问题匹配度最大的范例,Reuse过程使用历史范例来解决所提出的问题,Revise过程在必要时修正提出的解决方案,Retain过程将新的解决方案作为一个新范例保存到范例库中。
2.2 基于神经网络的故障定位技术
神经网络能够处理复杂模型,具有联想、记忆、推理和抑制噪声能力,而且信息处理很快,能存储大量的知识。神经网络能够高效地辨识给定模式,具有自学习能力;神经网络能够通过联想能力处理不确定、不完整数据,因此神经网络很适合于用于解决故障诊断问题。神经网络只要输入的模式接近于训练样本,系统就能进行推理。神经网络克服了专家系统中如果规则没有完全匹配,则会退出专家系统的缺点。神经网络还可以运用遗传算法进行优化,提高神经网络的性能。
目前神经网络有两种诊断模式:
1)离线诊断:这种诊断模式将学习和系统运行分开。当系统出现故障时,把故障信息或现象输入神经网络,神经网络通过自组织和自学习,输出故障解决方案。
2)在线诊断:将神经网络和系统直接相连,让系统自动获得故障信息和现象,然后由神经网络内部进行自组织和自学习,把学习过程和运行过程合二为一。
文献[5]提出一种基于粗糙集神经网络的网络故障诊断算法,将知识系统技术应用于链路层故障诊断中,针对故障诊断问题的需要,构建一个故障诊断知识库;针对知识库中可能存在的知识规则冗余问题,提出基于粗糙集理论的知识库规则约简方案,降低知识规则的冗余度;由于诊断问题的实质是一种映射,将神经网络模型引入故障诊断系统,用一种前馈型网络来逼近这种映射关系,神经网络的学习样本来自于知识库中的知识规则,实现对网络故障的分类。
2.3 基于贝叶斯网络的故障定位技术
贝叶斯网络是处理不确定性问题的新方法,代替了人工智能和专家系统。利用贝叶斯网络进行告警关联是当前研究的一个热点[6],贝叶斯网络的一个很重要功能就是能根据概率理论在原因和结果之间进行不确定性推理。通过贝叶斯网络来分析通信网络中的告警相关性,可以克服告警时间的不确定性基于贝叶斯网络的故障诊断方法中,通过模拟被管理网络系统的主要组件间的因果关系使不确定性知识模型化。
贝叶斯网络可以定义为一个三元组(V,L,P),V是有向非循环图中的结点集,L是结点之间的因果链集,表示它们之间的因果关系,P是概率集,即P={p(υ|π(υ))|υ∈V},π(υ)是υ的父结点,表示一个变量对另一个变量的影响程度。V由故障集F={f1,f2,…,fm}和症状集S={s1,s2,…,sn}组成。P={p(si|fj)|si∈S,fj∈F,i=1,2,…,n,j=1,2,…,m}。这里,一个症状可能被多个故障引发,一个故障可能引发多个故障。假设模型是完备的,即,若用Fsi表示所有可能引起症状si的故障集合,如果Fsi中的故障都没发生,那么症状si一定不会出现,反之,如果出现症状si,那么Fsi中至少有一个故障发生。(下转第8677页)(上接第8669页)
2.4 故障定位技术分析
基于专家系统的故障诊断方法,知识的获取和知识库的构建比较困难,开发成本比较高。每种相关性分析方法在实际中都有应用,单纯地使用某一种关联方法构建的告警相关性分析工具经常会顾此失彼,最终使系统不是缺乏学习能力,就是逻辑推理能力不足,难以适应网络发展的需要。
基于神经网络的故障诊断方法中,对神经网络进行训练的工作量非常大。神经网络的适应性也比较差,不能自动适应网络环境的变化。基于粗糙集神经网络的故障诊断方法,将模糊控制技术和神经网络技术相结合,虽然结合了两者的优势,但实现起来就比较困难。
基于贝叶斯网络的故障诊断方法可用来对不确定和不完整信息中的将来可能发生的故障作出推理以提供有效的预测。尽管此方法具有许多优点,但是在实际的环境中获取先验知识比较困难,限制了其应用。而且随着网络的复杂度增加,贝叶斯网络本身的复杂度呈指数级数增加,所以其计算量非常大。基于贝叶斯网络的不确定性推理技术己被证明为NP难题。因此,使用贝叶斯网络进行网络故障定位的技术还有待于改进。
此外,除了上述网络故障定位技术,还有基于数据挖掘的网络故障定位技术、基于Petri网的网络故障定位技术和基于有限状态机的网络故障定位技术等方法。
3 小结
网络故障智能诊断和精确定位相当复杂的问题,靠单一技术很难圆满解决,只有多种技术的融合集成处理故障信息,才能实现高效而精确的网络故障定位。本文在研究网络故障诊断技术的基础上,重点对网络故障智能诊断核心技术———故障定位进行了深入的研究,介绍了基于专家系统、神经网络和贝叶斯网络的故障定位技术,为进一步深入研究高效智能故障诊断技术,最终实现网络故障的主动预防打下基础。
参考文献
[1]Greg Tomsho.网络维护和故障诊断指南站[M].晓苏,译.北京:清华大学出版社,2003.
[2]Breitbart Y,Garofalakis M,Jai B.Topology discovery in heterogeneous IP networks:the net inventory system[J].IEEE/ACM Transactionson Networking,2004,12(3):465-476.
[3]ANSI T1.215 OAM&P-Fault Management Messages for Interface between Operations Systems and Network Elements,1994.
[4]郑秋华.网络故障智能诊断关键技术研究[D].杭州:浙江大学,2007.
[5]杨勇.基于粗集的知识获取方法研究[D].南京:东南大学机械工程系,2000.
网络故障诊断的原则网络服务器 篇4
下一页123
网络与路由器概述
网络诊断是一门综合性技术,涉及网络技术的各个面。为方便下面的讨论,首先简单回顾一 下网络和路由器的基本概念。
计算机网络是由计算机集合加通信设施组成的系统,即利用各种通信手段,把地理上分散的 计算机连在一起,达到相互通信而且共享软件、硬件和数据等资源的系统。计算机网络按其 计算机分布范围通常被分为局域网和广域网。局域网覆盖地理范围较小,一般在数米到数十 公里之间。广域网覆盖地理范围较大,如校园、城市之间、乃至全球。计算机网络的发展, 导致网络之间各种形式的连接。采用统一协议实现不同网络的互连,使互联网络很容易得到 扩展。因特网就是用这种方式完成网络之间联结的网络。因特网采用TCP/IP协议作为通信协 议,将世界范围内计算机网络连接在一起,成为当今世界最大的和最流行的国际性网络。 为了完成计算机间的通信,把每部计算机互连的功能划分成定义明确的层次,规定了同层进 程通信的协议及相邻层之间的接口和服务,将这些层、同层进程通信的协议及相邻层之间的 接口统称为网络体系结构。国际标准化组织(ISO)提出的开放系统互连参考模型(OSI)是 当代计算机网络技术体系的核心。该模型将网络功能划分为7个层次:物理层、数据链路层 、网络层、传输层、会话层、表示层和应用层。
TCP/IP即传输控制协议和网间互联协议是一组网络协议。TCP/IP起源于美国ARPANET网, 发展至今已成为因特网使用的标准通信协议。使用TCP/IP能够使采用不同操作系统的计算机 以有序的方式交换数据。 路由器是一种网络设备,是用于网络连接、执行路由选择任务的专用计算机。路由器工作于 网络层,对信包转发,并具有过滤功能。路由器能够将使用不同技术的两个网络互连起来, 能够在多种类型的网络之间(局域网或广域网)建立网络连接。它将处在七层模型中的网络 层的信息,根据最快、最直接的路由原理从一个网络的网络层传输到另一个网络的网络层, 以达到最佳路由选择。同时在内部使用高档微处理器,用高速的内部总线连接适合各种网络 协议的接口卡。并具有多种网管功能,能监视与路由器相连接的一些网络设备和它们的配置 运行情况。
CISCO路由器是目前网络建设中使用最多的一种路由器,有多种档次、多种系列,目前常用 的当属2500系列,本文以2500系列为例讨论。2500系列路由器是固定接口的多协议路由器 ,支持CISCO IOS全部功能。根据特定的协议环境分为以下四种类型:固定配置的路由器( 2501)、带HUB口的路由器(2507)、摸块化的路由器(2514)和访问服务器(2511)。 它们结构简单、操作方便、易于配置和管理,是一种用于小规模局域网和广域网网络层中继 的路由设备,
CISCO IOS是CISCO所特有的互连网操作系统,所有的CISCO产品都运行IOS,IOS将它们 无缝连接在一起协同工作。给用户提供一个可支持任意硬件界面、任意链路层、网络层协议 的可扩展的开放型网络。IOS支持众多的协议,包括各种网络通信协议和路由协议等。 CISCO IOS已成为工业界网际网互联的事实标准。CISCO IOS提供几种不同的操作模式,每 一种模式提供一组相关的命令集、不同的操作权限和操作功能。基于安全目的,CISCO用户 界面中有两级访问权限:用户级和特权级。第一级访问允许查看路由状态,叫做用户EXEC 模式,又称为查看模式;第二级访问允许查看路由器配置、修改配置和运行调试命令,叫做 特权EXEC模式,又称为配置模式。在特权级中,按不同的配置内容,可进入不同的配置模 式,如全球配置模式、接口配置模式、线配置模式等。
网络故障诊断概述
网络故障诊断应该实现三方面的目的:确定网络的故障点,恢复网络的正常运行;发现网络 规划和配置中欠佳之处,改善和优化网络的性能;观察网络的运行状况,及时预测网络通信质量。 网络故障诊断以网络原理、网络配置和网络运行的知识为基础。从故障现象出发,以网络诊 断工具为手段获取诊断信息,确定网络故障点,查找问题的根源,排除故障,恢复网络正常 运行。 网络故障通常有以下几种可能:物理层中物理设备相互连接失败或者硬件及线路本身的问题 ;数据链路层的网络设备的接口配置问题;网络层网络协议配置或操作错误;传输层的设备 性能或通信拥塞问题;上三层CISCO IOS或网络应用程序错误。诊断网络故障的过程应该沿 着OSI七层模型从物理层开始向上进行。首先检查物理层,然后检查数据链路层,以此类推 ,设法确定通信失败的故障点,直到系统通信正常为止。 网络诊断可以使用包括局域网或广域网分析仪在内的多种工具: 路由器诊断命令;网络管理工具和其它故障诊断工具。CISCO提供的工具足以胜任排除绝大 多数网络故障。查看路由表,是解决网络故障开始的好地方。
ICMP的ping、trace命令和Cisco的show命令、debug命令是获取故障诊断有用信息的网络 工具。我们通常使用一个或多个命令收集相应的信息,在给定情况下,确定使用什么命令获 取所需要的信息。譬如,通过IP协议来测定设备是否可达到的常用方法是使用ping命令。 ping从源点向目标发出ICMP信息包,如果成功的话,返回的ping信息包就证实从源点到目标 之间所有物理层、数据链路层和网络层的功能都运行正常。
如何在互联网络运行后了解它的信息,了解网络是否正常运行,监视和了解网络在正常条件 下运行细节,了解出现故障的情况。监视那些内容呢?利用show interface命令可以非常容 易地获得待检查的每个接口的信息。另外show buffer命令提供定期显示缓冲区大小、用途及 使用状况等。Show proc命令和 show proc mem命令可用于跟踪处理器和内存的使用情况, 可以定期收集这些数据,在故障出现时,用于诊断参考。 网络故障以某种症状表现出来,故障症状包括一般性的(象用户不能接入某个服务器)和较 特殊的(如路由器不在路由表中)。对每一个症状使用特定的故障诊断工具和方法都能查找 出一个或多个故障原因。一般故障排除模式如下:
网络故障诊断 篇5
【关键词】计算机;网络故障;含义;诊断方法
【中图分类号】F224-39【文献标识码】A【文章编号】1672-5158(2013)07-0107-01
在21世纪,计算机已经作为一种基础的工作媒介和手段应用到社会的更各领域,其应用范围之广,影响力之大。本课题主要立足于社会发展的需要,着重探究了计算机网络故障诊断的方法,希望能优化计算机网络的使用,提高其工作效能,为社会发展提供便利。
1、计算机网络的含义解析
对于计算机网络故障的研究来说,必须以了解一些基本的概念为前提条件。首先是计算机网络,什么是计算机网络呢,目前对于计算机网络的定义还没有形成一个统一的概念,一般可以粗略的理解为相互连接的,实现资源和材料共享共用的、自治的计算机集合。其实指的就是由计算机集合加通信设施组成的系统,按其计算机分布范围可以分为局域网和广域网。对于计算机局域网来说,覆盖的范围相对较小,而广域网就覆盖的范围来说就显得宽泛。通过因特网的应用研究来说,事实已经充分说明如果是采用统一协议实现不同网络的互连,那就会产生组大的能量,互联网也会发展迅速,使其产生更大的社会效益和经济效益。但随着计算机技术的发展,出现了各种形式的网络之间的连接,这就在一定程度上限制了计算机网络技术的发展。
2、几种常见的计算机网络故障分析
21世纪作为知识大爆炸和信息化发展最快的时代,全球的互联网高速发展,计算机网络作为优化工作的重要媒介已经得到社会的普遍重视和关注。计算机网络带给我们带来便利和收益的同时,也出现了一些网络故障,这极大的影响了网络技术的应用和发展。对于计算机出现的网络故障,按照分类,一般分为物理故障与逻辑故障,也就是通常说的硬件故障与软件故障。前者主要是网卡、网线、Hub、交换机、路由器发生了问题而产生的故障,后者一般是说由于网络协议出现的问题问题或因为网络设备的配置原因而导致的网络异常或故障。对于计算机网络故障来说,一般表现的症状为:连通性故障,如电脑无法登录到服务器;电脑无法在网络内实现访问其他电脑上的资源等。病毒是目前计算机安全最大的威胁,能对计算机造成系统运行缓慢、重启、程序无法启动、异常和数据丢失等各种的损害。其分类主要有:引导区、文件、宏、脚本、蠕虫和木马病毒等。目前已知有8万多种,且每天不断有几十种新病毒问世。其传播路径主要有:可执行文件、office文档、电子邮件、浏览网页、即时通信工具、网络等,病毒的一大传播途径,就是Internet。潜伏在网络上的各种可下载程序中,如果你随意下载、随意打开,对于制造病毒者来说,可真是再好不过了。这些也会影响到网络的运行质量,也会导致网络故障的发生。
3、计算机网络故障的诊断方法探究
对其计算机出现的网络故障来说,有时确实难于避免,这时候面对出现的问题,我们必须冷静对待,按照科学的步骤和诊断方法来分析和解决网络故障问题。
3.1 分层诊断技术方面研究
3.1.1 故障的物理层方面探究
对于计算机出现的物理层网络障来说,主要表现在计算机各硬件设备的连接方式是否恰当;连接电缆是否正确;MODEM、CSU/DSU等设备的配置及操作是否正确。确定路由器端口物理连接是否完好的最佳方法是使用show interface命令,检查每个端口的状态,解释屏幕输出信息,查看端口状态、协议建立状态和EIA状态等。
3.1.2 数据链路层方面探究
数据链路层对于计算机网络来说意义重大,有了数据链路层就可以无序考虑物理层的特点而行使数据传输的工作。对于计算机网络出现的故障问题,有时候需要我们注意查找和排除数据链路层出现的问题,在这个问题处理的过程中,主要是分析和了解需路由器的配置,检查连接端口的共享同一数据链路层的封装情况。要求每对接口要和与其通信的其他设备有相同的封装。通过查看路由器的配置检查其封装,或者使用show命令查看相应接口的封装情况。
3.2 硬件诊断方面
3.2.1 串口故障的问题及对策
计算机出现的网络故障问题,在硬件的诊断时候,串口就是考虑的因素之一。
计算机的串口一般是指COM口,有的是9针,也有的是25针的接口,通常用于连接鼠标(串口)及通讯设备等。对于计算机串口故障的排查和查找问题,一般从show interface serial命令开始,分析它的屏幕输出报告内容,然后分析出现问题的原因并分析解决的对策。串口报告的开始提供了该接口状态和线路协议状态。在接口和线路协议都正常工作的前提下,虽然串口链路的基本数据传输资料建立起来了,但还有可能出现信息包的丢失和发送错误等异常问题。按照一般正常的情况分析,信息包不会丢失或者出现错误,但是潜在的问题也是在所难免的。如果信息包丢失有规律性增加,表明通过该接口传输的通信量超过接口所能处理的通信量。解决的办法是增加线路容量。查找其他原因发生的信息包丢失,查看show interface serial命令的输出报告中的输入输出保持队列的状态。当发现保持队列中信息包数量达到了信息的最大允许值,可以增加保持队列设置的大小。
3.2.2 以太接口的问题及对策
Ethernet是Xerox公司创建的局域网规范,使用CSMA/CD。其出现的主要故障是过量的使用带宽,过多的碰撞冲突,不兼容的幀类型使用等,除此之外还有其他一些原因。对于这个问题的分析可以利用show interface ethernet命令,对其具体问题具体分析,然后有的放矢采用针对性的措施给与解决。
在信息化高度发展的今天,越来越多的企业、单位开始组建自己的网络,其网络运行的质量和安全性直接影响到企业的效益和发展,为此,为了实现既定的社会利益和其他利益,我们必须加大对网络故障的排查,并做好相关的检修工作,然后针对性的解决网络故障存在的问题,以实现网络的优化运行和发展。
参考文献
[1] 王启.计算机网络故障诊断的智能化方法[J].信息与电脑,2012(8)
[2] 宋红军.计算机网络软硬件故障诊断方法研究[J].卷宗,2012(4)
[3] 李荣霞.浅谈计算机网络故障出现的原因及解决的方法研究[J].城市建设理论研究,2012(2)
[4] 马世军.计算机网络故障的原因及方法探究[J].计算机与网络, 2010(14)
[5] 李云山.计算机网络故障诊断与排除方法分析[J].城市建设理论研究,2010(9)
[6] 牛东涛.计算机企业网常见网络故障的诊断和排除[J].计算机光盘软件与应用,2010(7)
[7] 杨凯军.试论新形势下计算机网络安全存在的问题及对策探究[J].大观周刊 2010(3)
网络常见故障的分类诊断 篇6
1 物理类故障物理故障, 一般是指线路或设备出现物理类问题或说成硬件类问题
1.1 线路故障
在日常网络维护中, 线路故障的发生率是相当高的, 约占发生故障的70%。线路故障通常包括线路损坏及线路受到严重电磁干扰。排查方法:如果是短距离的范围内, 判断网线好坏简单的方法是将该网络线一端插入一台确定能够正常连入局域网的主机的RJ45插座内, 另一端插入确定正常的HUB端口, 然后从主机的一端Ping线路另一端的主机或路由器, 根据通断来判断即可。如果线路稍长, 或者网线不方便调动, 就用网线测试器测量网线的好坏。如果线路很长, 比如由邮电部门等供应商提供的, 就需通知线路提供商检查线路, 看是否线路中间被切断。
1.2 端口故障
端口故障通常包括插头松动和端口本身的物理故障。排查方法:此类故障通常会影响到与其直接相连的其他设备的信号灯。因为信号灯比较直观, 所以可以通过信号灯的状态大致判断出故障的发生范围和可能原因。也可以尝试使用其它端口看能否连接正常。
1.3 集线器或路由器故障
集线器或路由器故障在此是指物理损坏, 无法工作, 导致网络不通。排查方法:通常最简易的方法是替换排除法, 用通信正常的网线和主机来连接集线器 (或路由器) , 如能正常通信, 集线器或路由器正常;否则再转换集线器端口排查是端口故障还是集线器 (或路由器) 的故障;很多时候, 集线器 (或路由器) 的指示灯也能提示其是否有故障, 正常情况下对应端口的灯应为绿灯。如若始终不能正常通信, 则可认定是集线器或路由器故障。
1.4 主机物理故障网卡故障
笔者把其也归为主机物理故障, 因为网卡多装在主机内, 靠主机完成配置和通信, 即可以看作网络终端。此类故障通常包括网卡松动, 网卡物理故障, 主机的网卡插槽故障和主机本身故障。排查方法:主机本身故障在这里就不在赘述了, 在这里只介绍主机与网卡无法匹配工作的情况。对于网卡松动、主机的网卡插槽故障最好的解决办法是更换网卡插槽。对于网卡物理故障的情况, 如若上述更换插槽始终不能解决问题的话, 就拿到其他正常工作的主机上测试网卡, 如若仍无法工作, 可以认定是网卡物理损坏, 更换网卡即可。
2 逻辑类故障逻辑故障中的最常见情况是配置错误, 也就是指因为网络设备的配置错误而导致的网络异常或故障
2.1 路由器逻辑故障
路由器逻辑故障通常包括路由器端口参数设定有误, 路由器路由配置错误、路由器CPU利用率过高和路由器内存余量太小等。排查方法:路由器端口参数设定有误, 会导致找不到远端地址。用Ping命令或用Traceroute命令 (路由跟踪程序:在UNIX系统中, 我们称之为Traceroute;MS Windows中为Tracert) , 查看在远端地址哪个节点出现问题, 对该节点参数进行检查和修复。路由器路由配置错误, 会使路由循环或找不到远端地址。比如, 两个路由器直接连接, 这时应该让一台路由器的出口连接到另一路由器的入口, 而这台路由器的入口连接另一路由器的出口才行, 这时制作的网线就应该满足这一特性, 否则也会导致网络错误。该故障可以用Traceroute工具, 可以发现在Traceroute的结果中某一段之后, 两个IP地址循环出现。这时, 一般就是线路远端把端口路由又指向了线路的近端, 导致IP包在该线路上来回反复传递。解决路由循环的方法就是重新配置路由器端口的静态路由或动态路由, 把路由设置为正确配置, 就能恢复线路了。路由器CPU利用率过高和路由器内存余量太小, 导致网络服务的质量变差。比如路由器内存余量越小丢包率就会越高等。检测这种故障, 利用MIB变量浏览器较直观, 它收集路由器的路由表、端口流量数据、计费数据、路由器CPU的温度、负载以及路由器的内存余量等数据, 通常情况下网络管理系统有专门的管理进程, 不断地检测路由器的关键数据, 并及时给出报警。解决这种故障, 只有对路由器进行升级、扩大内存等, 或者重新规划网络拓扑结构。
2.2 一些重要进程或端口关闭
一些有关网络连接数据参数得重要进程或端口受系统或病毒影响而导致意外关闭。比如, 路由器的SNMP进程意外关闭, 这时网络管理系统将不能从路由器中采集到任何数据, 因此网络管理系统失去了对该路由器的控制。或者线路中断, 没有流量。排查方法:用Ping线路近端的端口看是否能Ping通, Ping不通时检查该端口是否处于down的状态, 若是说明该端口已经给关闭了, 因而导致故障。这时只需重新启动该端口, 就可以恢复线路的连通。
2.3 主机逻辑故障
主机逻辑故障所造成网络故障率是较高的, 通常包括网卡的驱动程序安装不当、网卡设备有冲突、主机的网络地址参数设置不当、主机网络协议或服务安装不当和主机安全性故障等。
2.3.1网卡的驱动程序安装不当网卡的驱动程序安装不当, 包括网卡驱动未安装或安装了错误的驱动出现不兼容, 都会导致网卡无法正常工作。
2.3.2网卡设备有冲突网卡设备与主机其它设备有冲突, 会导致网卡无法工作。
智能性网络故障诊断 篇7
随着国际互联网的飞速发展, 使用计算机用户越来越多, 网络出现的故障也随之频繁。据某高校网络管理中心不完全统计, 发生网络故障次数较多, 还不包括雷击和被病毒攻击而引起的网络崩溃。如何预防网络故障, 如何合理急时的处理这些网络问题, 这些问题的存在己成了高校或电信老大难问题, 高校或电信投入大量人力与物力来解决这些问题, 但成效不大。随着网络规模不断扩大, 客户急需自己开办自己局域网。何以是最好的解决方案呢?针对这些问题, 本文将决策支持系统引入网络故障诊断中。
IDSS在网络故障的应用现状这几年中, 企业1T部门主管肩负的责任发生了显著的变化:一方面公司网络的规模和复杂性成倍增长, 越来越多的新业务被移植到网络环境中来运行;另一方面公司内各业务部门以及外部用户也越来越依赖于网络来完成日常的业务处理和通信, 任何网络或服务中断甚至性能下降都会对企业业务造成严重影响。同时为适应市场经济的严酷竞争, 控制1T投资和运营成本也成为了IT部门主管需要考虑的课题。IDSS在网络管理系统 (网络故障诊断体系为子系统) 方面应用不广, 虽然网络管理将来会趋向于智能管理, 但是网络体系过于复杂繁琐, 没有一个很好IDSS来适应, 也只能在某一方面能达到一定效果。现阶段, 我国网络管理还处在粗放式的采购管理, 缺乏数据集成, 决策数据太少等情况中。本文章提出在网络故障的应用是适合网络构建和网络综合管理。
网络故障诊断体系的提出随着我国计算机不断普及, 我国上网的网民越来越多, 据2006年中国互联网络信息中心 (CN-NIC) 411调查: (l) 网民总人数为13700万人, 95%信度下的置信区间为【13362万人, 14038万人】。 (2) 按上网方式划分, 不同方式上网网民人数[数据出自于互联网络信息中心 (CN-NIC) ]专线上网网民人数2710万人拨号上网网民人数3900万人宽带上网网民人数9070万人手机上网网民数1700万人.上网计算机数:上网计算机总数为5940万台。在某高校一学期内, 网络维护统计:绝大多数都是重复维护计算机和设备, 特别是软件方面。为了提高设备效率, 减少维护量, 适应网民数量增大, 因此提出网络故障诊断体系 (网络管理诊断) 。
2、网络故障诊断体系
与传统的现场网络故障诊断与排除手段相比, 进行计算机网络管理 (网络故障诊断体系为子系统) 诊断有着巨大的优点, 但也不可避免地存在缺点。应该看到, 要进行计算机网络管理诊断是有着条件限制的。这个首要条件就是计算机整体或主干网能够正常启动、维护软件能够运行。在满足以上基本条件之后, 才有可能进行网络管理诊断。以下将对可能遇到的情况进行具体分析。网络故障诊断系统所维护的由计算机和交换机两大部分组成。计算机包括硬件和软件两大组成部分。所以, 当一个计算机网络不能按照要求运行时, 就存在了两种可性:计算机硬件故障和软件故障。因为只有在计算机网络管理诊断软件能够运行的情况下, 我们才有可能进行远程网络维护诊断, 故当所在计算机不能正常启动, 或者操作系统工作不正常的情况下, 我们可以指示操作管理人员通过更换计算机部分硬件或重新安装计算机操作系统及控制软件来解决问题。需要解决的重点问题是网络管理诊断软件所在计算机工作正常, 但诊断问题不时出现的情况。
2.1、建立数据模型
建立平等条件下的数据模型, 标出各个实体的键码, 那么这时的数据模型成为基于键码的数据模型。由于各个局域网有各自不同的库数据, 所得到的库就有所不同, 我以某高校的数据为例,
故障库:定义如下:Time_id, user_id, failure_phenomena failure_dispose, failure_id
IP地址库:定义如下:IP, port_IP, port_number, Vlan_id switch_id
规划模型库: (用户小型局域网) 定义如下:time_id, us-er_id case_model, case_special, case_scope,
IP与用户对应库:定义如下:IP, user, telephone_number user_address, failure_number, lan_id, failure_dispose
用户使用情况库:、宁义如下:user, uselan_no, port_id switch_id, down_port_no, port_act, port_lallure_dispose
知识库:定义如下:Computer_number, criterlon_measure area_nouse, computer_routlng, server_number, switch_number lan_request, lan_remark
2.2、结构化设计
结构化设计技术是一种面向流程的设计技术, 通过它我们分解成多个层次的规模较小、结构比较简单的模块, 通过分别实现这些模块的设计而最终实现整个系统。
模块是可以组合、分解和更换的单元, 是组成系统基本要素, 属性为:功能、逻辑和状态。
系统模块化分图中, 我们可以看出故障出现以前和以后可以做的事情, 能够做的事情等各种情况。因此网络故障诊断分为五个小单位:范围查询、实时监控、故障申报、处理情况、规划查询。
范围查询:提供给用户故障查询界面, 故障查询结果;
在线诊断:对在线的IP时进行定期的网络维护, 防止网络病毒蔓延使整个网络瘫痪;
离线诊断:提供用户使用电话或电脑进行网络离线诊断, 诊断数据将传入知识库分析;处理情况:对故障处理结果及时反应到网络上, 并说明其是人工还是自动维护故障;
规划查询:对用户组网, 规划自身内部网络, 提供最佳处理平台;问题。其结构解释如下:
2.3、数据流程分析
在数据流程说明中, 当用户使用的电脑出现故障或用户对某故障问题需要得到圆满的解答, 用户通过了电话或另一台未出故障电脑进行网上申报或查询工作, 当用户通过电话或电脑进入调用故障诊断体系时都首先进入知识库, 知识库对传入的消息和数据进行分析, 用户所提的问题求得最佳故障解, 形成故障树。在这里知识库还要进行如图所示的分解即:故障, 规划。如果是故障会分成自动维护, 人工维护。这两种维护都对用户作出响应。而规划所求得最佳拓朴结构也将会反馈给用户。如果用户当前为申报所使用的电脑也有漏洞或病毒那么所提交的问题和本身存在的风险进行知识库, 问题将如上所述, 风险将通过知识库而进行打补丁。由于用户与电脑存在这一对多关系, 即:一个用户可有多台电脑, 一台电脑对应一个IP (自身建立的局域网不包括在内) , n个IP或电脑对应一个规划。图中说明各库内中的关键字段之间对应关系。我们在处理网络故障和预防网络崩溃时, 面临多而繁故障点查询, 以及更换网络设备和器件, 故障点确定在图中成了关键性环节。模型库里面的数据是维护人员根据多年维护经验, 合理有效的维护方法的数据总汇, 我们大量利用网络资源使维护诊断更具自动化。如上所述提高各项目确立需求中的各项指标。
2.4、图形用户界面设计
进入主界面时, 我们会通过上面的菜单选择自己所需要项目, 如果你一进网络管理系统主界面就直接运行在线诊断这一项, 网络管理系统主界面的选择按钮可以选择直接运行。我们再看看菜单里面各项界面, 将不再列出来, 只介绍在线诊断和离线诊断两项。在线诊断:当点击菜单上的在线诊断时, 这里的在线诊断分终端诊断和配置诊断两种, 我们选中终端诊断时, 子界面的左边出现可能的诊断选项, 右边则是可以用自己语言描述问题情况。当再次点击终端诊断时, 我们就会触发故障源搜索算法方式, 搜索你需要的问题。
在线诊断可以对终端进行在线故障诊断和故障问题搜索。可以对上面的交换设备进行分析, 得出结果。还能对用户所提出的问题进行分析和搜索, 加工, 最后得到结果。
值得注意的是:我们在在线诊断时, 当出现大面积网络瘫痪时, 我们可以通过网络管理 (故障与规划体系为子系统) 主界面直接进行诊断并切断有问题的计算机。部分计算机的在线诊断诊断子界面将不会起主要作用, 也就是说在线诊断诊断子界面受到限制, 但可以通过网络管理主界面可以解除此类限制。
离线诊断:离线诊断与在线诊断类似, 只要是离线诊断会有离线传送, 传送的分类我们在离线诊断分类中已经讨论过了, 我们在这里将不再提及。离线诊断子界面中包括:网线故障诊断、计算机诊断、交换机诊断、路由器诊断、配置诊断, 还包括了提出问题1和提出问题2。当诊断结束后会出现结束界面, 结束界面包括离线诊断分类, 让用户以何种方式来存储结果, 包括如下选项:电子邮件 (Email) 传递、I P传递、直接传递三个选项。在在线诊断和离线诊断结束后, 我们可以到菜单处理情况里查看处理情况, 查询自己终端和设备情况, 这些情况汇总也成为数据库重要的一部分。
范围查询是将在线和离线两个选项合在一起进行, 范围查询特点在于不分硬件诊断和软件诊断, 不分在线诊断和离线诊断, 在模型库、知识库、用户库等各库中查询自身所需要的问题答案。规划查询是一种特殊查询, 它针对于用户需要建立自己局域网时, 面临规划问题而单独设立的规划查询子界面。它的运用不再是模型库而是规划库, 在规划库中查询最佳规划问题。别的界面因篇幅原因不再一一举例介绍, 但我们可以通过上面介绍可以大致了解到别的界面几乎和这两图相似, 本体系功能基本上体现在在线诊断和离线诊断两子界面上, 规划体系类似此方法和界面。
参考文献
[1]中国科学院计算技术研究所。智能决策支持系统[M].[2007.10-01].
[2]史忠植.智能科学[M]。北京:清华大学出版社, 2006:
[3]李卫红.加强高校公共应急管理工作努力建设平安和谐校园社区:教育部通报,
网络常见故障的分类诊断 篇8
1物理类故障
物理故障, 一般是指线路或设备出现物理类问题或说成硬件类问题。
1.1线路故障
在日常网络维护中, 线路故障的发生率是相当高的, 约占发生故障的70%。线路故障通常包括线路损坏及线路受到严重电磁干扰。
排查方法:如果是短距离的范围内, 判断网线好坏简单的方法是将该网络线一端插入一台确定能够正常连入局域网的主机的RJ45插座内, 另一端插入确定正常的HUB端口, 然后从主机的一端Ping线路另一端的主机或路由器, 根据通断来判断即可。如果线路稍长, 或者网线不方便调动, 就用网线测试器测量网线的好坏。如果线路很长, 比如由邮电部门等供应商提供的, 就需通知线路提供商检查线路, 看是否线路中间被切断。
对于是否存在严重电磁干扰的排查, 我们可以用屏蔽较强的屏蔽线在该段网路上进行通信测试, 如果通信正常, 则表明存在电磁干扰, 注意远离如高压电线等电磁场较强的物件。如果同样不正常, 则应排除线路故障而考虑其他原因。
1.2端口故障
端口故障通常包括插头松动和端口本身的物理故障。
排查方法:此类故障通常会影响到与其直接相连的其他设备的信号灯。因为信号灯比较直观, 所以可以通过信号灯的状态大致判断出故障的发生范围和可能原因。也可以尝试使用其它端口看能否连接正常。
1.3集线器或路由器故障
集线器或路由器故障在此是指物理损坏, 无法工作, 导致网络不通。
排查方法:通常最简易的方法是替换排除法, 用通信正常的网线和主机来连接集线器 (或路由器) , 如能正常通信, 集线器或路由器正常;否则再转换集线器端口排查是端口故障还是集线器 (或路由器) 的故障;很多时候, 集线器 (或路由器) 的指示灯也能提示其是否有故障, 正常情况下对应端口的灯应为绿灯。如若始终不能正常通信, 则可认定是集线器或路由器故障。
1.4主机物理故障
网卡故障, 笔者把其也归为主机物理故障, 因为网卡多装在主机内, 靠主机完成配置和通信, 即可以看作网络终端。此类故障通常包括网卡松动, 网卡物理故障, 主机的网卡插槽故障和主机本身故障。
排查方法:主机本身故障在这里就不在赘述了, 在这里只介绍主机与网卡无法匹配工作的情况。对于网卡松动、主机的网卡插槽故障最好的解决办法是更换网卡插槽。对于网卡物理故障的情况, 如若上述更换插槽始终不能解决问题的话, 就拿到其他正常工作的主机上测试网卡, 如若仍无法工作, 可以认定是网卡物理损坏, 更换网卡即可
2逻辑类故障
逻辑故障中的最常见情况是配置错误, 也就是指因为网络设备的配置错误而导致的网络异常或故障。
2.1路由器逻辑故障
路由器逻辑故障通常包括路由器端口参数设定有误, 路由器路由配置错误、路由器CPU利用率过高和路由器内存余量太小等。
排查方法:路由器端口参数设定有误, 会导致找不到远端地址。用Ping命令或用Traceroute命令 (路由跟踪程序:在UNIX系统中, 我们称之为Traceroute;MS Windows中为Tracert) , 查看在远端地址哪个节点出现问题, 对该节点参数进行检查和修复。
路由器路由配置错误, 会使路由循环或找不到远端地址。比如, 两个路由器直接连接, 这时应该让一台路由器的出口连接到另一路由器的入口, 而这台路由器的入口连接另一路由器的出口才行, 这时制作的网线就应该满足这一特性, 否则也会导致网络错误。该故障可以用Traceroute工具, 可以发现在Traceroute的结果中某一段之后, 两个IP地址循环出现。这时, 一般就是线路远端把端口路由又指向了线路的近端, 导致IP包在该线路上来回反复传递。解决路由循环的方法就是重新配置路由器端口的静态路由或动态路由, 把路由设置为正确配置, 就能恢复线路了。
路由器CPU利用率过高和路由器内存余量太小, 导致网络服务的质量变差。比如路由器内存余量越小丢包率就会越高等。检测这种故障, 利用MIB变量浏览器较直观, 它收集路由器的路由表、端口流量数据、计费数据、路由器CPU的温度、负载以及路由器的内存余量等数据, 通常情况下网络管理系统有专门的管理进程, 不断地检测路由器的关键数据, 并及时给出报警。解决这种故障, 只有对路由器进行升级、扩大内存等, 或者重新规划网络拓扑结构。
2.2一些重要进程或端口关闭
一些有关网络连接数据参数得重要进程或端口受系统或病毒影响而导致意外关闭。比如, 路由器的SNMP进程意外关闭, 这时网络管理系统将不能从路由器中采集到任何数据, 因此网络管理系统失去了对该路由器的控制。或者线路中断, 没有流量。
排查方法:用Ping线路近端的端口看是否能Ping通, Ping不通时检查该端口是否处于down的状态, 若是说明该端口已经给关闭了, 因而导致故障。这时只需重新启动该端口, 就可以恢复线路的连通。
2.3主机逻辑故障
主机逻辑故障所造成网络故障率是较高的, 通常包括网卡的驱动程序安装不当、网卡设备有冲突、主机的网络地址参数设置不当、主机网络协议或服务安装不当和主机安全性故障等。
1.网卡的驱动程序安装不当。网卡的驱动程序安装不当, 包括网卡驱动未安装或安装了错误的驱动出现不兼容, 都会导致网卡无法正常工作。
排查方法:在设备管理器窗口中, 检查网卡选项, 看是否驱动安装正常, 若网卡型号前标示出现“!”或“X”, 表明此时网卡无法正常工作。解决方法很简单, 只要找到正确的驱动程序重新安装即可。
2.网卡设备有冲突。网卡设备与主机其它设备有冲突, 会导致网卡无法工作。
排查方法:磁盘大多附有测试和设置网卡参数的程序, 分别查验网卡设置的接头类型、IRQ、I/O端口地址等参数。若有冲突, 只要重新设置 (有些必须调整跳线) , 或者更换网卡插槽, 让主机认为是新设备重新分配系统资源参数, 一般都能使网络恢复正常。
3.主机的网络地址参数设置不当。主机的网络地址参数设置不当是常见的主机逻辑故障。比如, 主机配置的IP地址与其他主机冲突, 或IP地址根本就不在于网范围内, 这将导致该主机不能连通。
排查方法:查看网络邻居属性中的连接属性窗口, 查看TCP/IP选项参数是否符合要求, 包括IP地址、子网掩码、网关和DNS参数, 进行修复。
4.主机网络协议或服务安装不当。主机网络协议或服务安装不当也会出现网络无法连通。主机安装的协议必须与网络上的其它主机相一致, 否则就会出现协议不匹配, 无法正常通信, 还有一些服务如“文件和打印机共享服务”, 不安装会使自身无法共享资源给其他用户, “网络客户端服务”, 不安装会使自身无法访问网络其他用户提供的共享资源。再比如E-mail服务器设置不当导致不能收发E-mail, 或者域名服务器设置不当将导致不能解析域名等。
排查方法:在网上邻居属性 (Windows98系统) 或在本地连接属性窗口查看所安装的协议是否与其他主机是相一致的, 如TCP/IP协议, NetBEUI协议和IPX/SPX兼容协议等。其次查看主机所提供的服务的相应服务程序是否已安装, 如果未安装或未选中, 请注意安装和选中之。注意有时需要重新启动电脑, 服务方可正常工作。
5.主机安全性故障。主机故障的另一种可能是主机安全故障。通常包括主机资源被盗、主机被黑客控制、主机系统不稳定等。
排查方法:主机资源被盗, 主机没有控制其上的finger, RPC, rlogin等服务。攻击者可以通过这些进程的正常服务或漏洞攻击该主机, 甚至得到管理员权限, 进而对磁盘所有内容有任意复制和修改的权限。还需注意的是, 不要轻易的共享本机硬盘, 因为这将导致恶意攻击者非法利用该主机的资源。
主机被黑客控制, 会导致主机不受操纵者控制。通常是由于主机被安置了后门程序所致。发现此类故障一般比较困难, 一般可以通过监视主机的流量、扫描主机端口和服务、安装防火墙和加补系统补丁来防止可能的漏洞。
主机系统不稳定, 往往也是由于黑客的恶意攻击, 或者主机感染病毒造成。通过杀毒软件进行查杀病毒, 排除病毒的可能。或重新安装操作系统, 并安装最新的操作系统的补丁程序和防火墙、防黑客软件和服务来防止可能的漏洞的产生所造成的恶性攻击。
3结束语
计算机网络技术发展迅速, 网络故障也十分复杂, 上述概括了常见的几类故障及其排查方法。针对具体的诊断技术, 总体来说是遵循先软后硬的原则, 但是具体情况要具体分析, 这些经验就需要您长期的积累了。如果你是网络管理人员, 在网络维护中的还需要注意以下几个方面:
第一, 建立完整的组网文档, 以供维护时查询。如系统需求分析报告、网络设计总体思路和方案、网路拓扑结构的规划、网络设备和网线的选择、网络的布线、网络的IP分配, 网络设备分布等等。
第二, 做好网络维护日志的良好习惯, 尤其是有一些发生概率低但危害大的故障和一些概率高的故障, 对每台机器都要作完备的维护文档, 以有利于以后故障的排查。这也是一种经验的积累。
第三, 提高网络安全防范意识, 提高口令的可靠性, 并为主机加装最新的操作系统的补丁程序和防火墙、防黑客程序等来防止可能出现的漏洞。
参考文献
[1]Greg Tomsho.网络维护和故障诊断指南[M].北京:清华大学出版, 2003.
网络故障诊断 篇9
信息化的迅速发展使得网络的规模和复杂度都在迅速的增大,网络管理的智能化成为迫切的需要。SNMP网络管理模型由于简单,易于实现等优点得到了广泛的使用。研究基于SNMP网络管理模型的网络管理具有实际而重要的意义。在网络故障管理方面,基本方法是接受SNMP-Trap的告警信息来确定网络的故障问题。但是由于网络的复杂性,一个故障可能会引起很多的告警,如何对这些告警信息进行处理,提供给网络管理员简单有效的提醒是一个值得研究的问题。
传统的告警产生方式是为MIB变量设置一个阈值,当超过阈值时,即产生报警,但是网络的动态特性使得阈值设置方法无法准确的反应网络的故障情况。国内外有很多工作利用统计方法对网络流量数据采用统计分析方法来判断是否异常,是否要产生告警。CS·Hood[1]通过分段把时间序列近似为段内平稳信号,然后又采用二元自回归模型拟合,对模型参数进行自适应性的GLR测试来判断流量是否异常。孙朝晖[2]等提出了用AAR模型来监测网络流量异常的方法,不需要对时间序列分片和单独拟合,可以直接处理获取的新数据,实现在线故障监测。本文参考该方法判断网络流量是否异常。文献[1]通过贝叶斯网络将监测到的MIB变量告警信息进行融合,最终通过路由器的异常情况给出对网络整体情况的预测。这种预测没有考虑到故障的传播特性等问题,也无法给网管员提供较为具体的故障信息。本文尝试先分别考虑各层协议的故障情况,然后再考虑低层协议对高层协议的影响。在此基础上,分层考虑故障在网络中的传播情况,依照网络的拓扑结构建构相应的贝叶斯网络。最后,对该模型进行了仿真,验证了方法的有效性。
1 网络管理协议SNMP
SNMP网络管理模型是为了管理TCP/IP网络提出来的,它的体系结构一般是非对称的,由管理站、代理、管理信息库(MIB)和通信协议SNMP构成。配置Manager实体的系统为管理站,配置Agent实体的系统被称为代理。管理站可以向代理下达操作命令访问代理所在系统的管理信息。
管理站和代理之间的共享管理信息由代理系统中的管理信息库MIB给出,各个代理系统中的被管对象的集合构成该系统的MIB。系统中所有的被管对象逻辑上被组织为一棵树,即MIB树。最基本和最重要的MIB的实例是MIB-Ⅱ,它分为11个组,除了cmot和dot3是预留外,其余9个组都有了定义,每个组描述系统的一个方面的信息。比如IP组,它包含IP协议中的各种参数信息,例如,有关IP层流量的一些计数器。如果IP协议的在运行中出现了故障,则会体现在相应的MIB变量中。可以根据MIB变量和协议之间的这种关系构建贝叶斯网络监测网络中某层的运行情况。
2 贝叶斯网络
贝叶斯网是一种系统地描述随机变量之间关系的语言。构造贝叶斯网的主要目的是进行概率推理,即计算一些事件发生的概率。要在一些随机变量之间进行推理,理论上只需要一个联合概率分布即可,但是联合概率分布的复杂度相对于变量个数成指数增长,所以当变量众多时不可行。贝叶斯网把概率分布分解成一系列相对简单的模块,大大降低了知识获取的难度和概率推理的复杂度,使得人们可以把概率论应用于大型问题[3]。
在贝叶斯网中,节点代表变量,节点之间的有向边代表两变量之间的条件概率关系。每个节点都附有一个概率分布,对于根节点X所附的是它的边缘分布,而非根节点所附的是条件概率分布P(X|π(X))。其中π(X),表示X的父节点。
贝叶斯网是联合概率分布的分解的一种表示。具体地,假设贝叶斯网络N中的变量为X1……Xn,那么把各变量所附的概率分布相乘就得到联合分布,即
如果把每个概率分布作为一个函数,用F表示N中所有概率分布函数的集合。在此类问题中,已知变量通常称为证据变量;需要计算其后验概率分布的变量称为查询变量。假设观测到了证据E=e,在F的各函数中,将各证据变量设为它们的观测值,得到另一组函数,记之为F′,则将这些函数相乘,即得P(Y,E=e),其中Y=XE,表示除去E之后X集合中剩余的变量。
设Q是所关心的查询变量的集合。从F′中逐个消去所有在Y中但不在Q中的变量,得到另一个函数集合,记之为F″,将F″的各函数相乘,可得P(Q,E=e),按照条件概率的定义,可进一步得到
其中P(E=e)=ΣQP(Q,E=e),这样就通过推理计算出所关心变量的后验概率。
如果构建了一个故障诊断的贝叶斯网络,那么这个问题就是,根据可以观察到的故障现象的取值,去计算关心但是无法直接观测到的部分故障的后验概率。
3 分层故障定位模型
本文以SNMP系统的MIB变量为基础构建了一个4层的故障诊断模型。数据处理部分对MIB数据采用自适应自回归模型处理,根据自回归模型参数的变化来判断是否产生了异常,进行MIB级别的告警。然后将MIB状态输入到协议故障判断部分,通过协议和MIB之间的贝叶斯网判断协议功能是否正常。将协议状态输入到协议间故障定位模块,通过不同协议之间构建的贝叶斯网推理故障的根源协议。在此基础上,确定了节点在某协议上的状态后,根据网络的拓扑结构,推理问题的根源在哪个节点上。模型结构图图1所示。
4 MIB变量特征提取
MIB变量大致可以分为两类,第一类就是在一定时间内不会改变的量,比如ipForwarding,表示是否作为IP网关。另一类是随时间动态改变的,比如IPInAddrErrors,它是一个计数器类型的变量,表示由于IP地址错被丢弃的输入数据报总数。
对于第一类而言,判断其异常与否只需要根据变量的值直接判断即可。比如ifOperStatus表示当前的接口状态(up(1),down(2),testing(3)),直接根据其值即可知道当前其状态是否异常。
对于第二类而言,则需要通过统计分析的方式去提取特征,才能做出判断。本文采用自适应自回归模型(AAR)来分析网络流量数据[2],进行MIB变量级异常检测。
对MIB变量M进行时间间隔为Δt的采样,获得的时间序列SM(N,Δt)是元素xi(i∈[1,N])的时间偏序集,N为序列长度。为任意序列定义p阶AAR模型,即
式中,ei是数学期望为0、方差为σe2的网络流量白噪声;i是当前样本序号。假定当前处在时刻t,那么因此参数aj是时间的函数。根据流量序列可以计算出相应的参数序列,减弱网络噪声的影响,用这个相对稳定的序列可描述流量序列的特性。定义t时刻的样本对应的AAR参数向量为
与式(3)对应,定义MIB变量M的样本构成向量为
采用时间序列SM(N,Δt)的观测样本拟合AAR模型,并通过其参数向量来描述系统特性的变化。时间序列SM(N,Δt)的样本i的噪声估计为
根据kalman过滤,相应的前馈向量为
此处T(i-1)表示样本(i-1)的相关矩阵,是一个p阶方阵,UC是更新系数,样本对应的AAR参数向量的估算值为
样本i的相关矩阵为
用上述几式构成的迭代算法即可拟合AAR模型,迭代过程可以在线完成。
向量A(i)表达了流量数据的状态变化,通过对其求二阶差分来反映其变化趋势,然后为了消除流量白噪声引起的尖峰,再使用时间平均法对差分结果进行平滑,最后可以根据序列值的变化来判断网络是否发生了变化。
5 节点贝叶斯网络建模
SNMP管理系统的管理站通过代理获得网络中各个节点的MIB信息(这里的节点是网络中配备有代理的主机,交换机,路由器等的统称)。在对MIB变量进行特征提取之后,已经可以进行MIB级的异常告警了,但是MIB所描述的信息仍具有很大的局限性,不能说明它所表示的协议层的功能正常情况,更难以说明整个网络的运行情况。贝叶斯网络能够通过概率关系描述各个MIB变量和其上层的协议之间的关系,并能根据已有的网络的先验概率和证据信息推理所关心节点的后验概率,适合于将多个MIB变量因素融合,获得一个协议层级的功能情况描述。
选网络接口层(MIB-II中的IF组)为例,其功能实现会影响相应组的MIB变量,因此可以以MIB树的结构作为贝叶斯网络的结构[1],如图2所示,而各个MIB变量之间的关系可以认为是近似相对独立的,这就符合了朴素贝叶斯网络的结构特点,由于其结构简单,可以使用多项式复杂度的Pearl信念传播算法,使得计算复杂度大大降低。
在通过MIB变量获得各协议的功能情况之后,考虑计算机网络按协议分层的特点,各层之间并不是完全独立的,每一层故障情况不仅依赖于本层功能的实现,还依赖于下一层所提供的服务,图3为计算机网络协议关系图。结合各协议之间的依赖关系,可以构造出节点层级的贝叶斯故障诊断模型[4]。层之间的的故障传播一般是低层影响高层,比如,网络接口层如果某个接口down,则IP层的数据报就无法到达,运输层的功能也就无从实现。考虑IF,IP,UDP三种协议之间的故障传播关系,可以构建出图4所示的贝叶斯网。通过协议之间的贝叶斯网络,可以对故障根源的协议层进行推理。
6 基于网络拓扑的贝叶斯网络
在考虑单个节点的故障定位问题的时候,考虑了故障在不同协议之间的传播关系,并没有考虑到故障在网络各节点间的传播问题。考虑图5所示通过路由器R连接到互连网的常见拓扑结构的网络。网络中的故障传播方向多数是从路由器到交换机,从交换机到主机,主机H1出现故障是由两种原因决定的,第一是其本身出现了故障,其二即上一层故障传播到主机H1。这样,对其构造故障传播图即先将网络拓扑转化为贝叶斯网络,然后再在除路由器R之外的每个节点上加一个表示本身故障的节点并指向该节点,如图6所示。由于路由器是网络层的中继,并没有运输层和应用层,这种依据网络拓扑构建的贝叶斯网络只适合于网络接口层和网际层。
上述建立的贝叶斯网络中,根节点的先验概率和有向边的条件概率可以根据历史数据统计获得,或者根据专家经验估计。在此基础上,还可以根据EM算法学习、更新网络参数。
7 实验仿真
采用MATLAB贝叶斯网络工具箱对本文中构建的几种贝叶斯网络进行了仿真实验。根据MIB树的结构,首先构建了如图2所示的两层的树状贝叶斯网络。根节点设为F,子节点为Mi,网络根节点的先验概率根据经验设为P(F)=[0.9 0.1],当F故障时的条件概率P(Mi=1|F=1)(i=1,2,…,n)在[0.75,1]之间服从均匀分布。先设定F=1,即F出故障,获得M1到Mn的故障概率。对Mi,生成一个[0,1]间服从均匀分布的随机数,如果小于其故障概率,则将Mi的状态设为1,即出现故障。在获得M1到Mn各节点的状态之后,将之作为观测结果,计算F节点的出现故障的概率。如果P(F=1|all M)>0.5,则认为F诊断结果为F出现故障。通过随机产生条件概率产生10种不同的贝叶斯网,对每个贝叶斯网选取不同MIB变量个数,每种情况仿真200次。计算平均故障诊断率如下图7所示。
节点级的贝叶斯网络和网络级贝叶斯网络的拓扑会随着选取协议的变化而不断变化,此处针对图5所示贝叶斯网络进行仿真。根节点故障概率设为0.1,条件概率设置如下表1所示。首先设置故障集R0,由R0产生一组可观察节点的征兆集S0,根据S0通过贝叶斯网络来推理,以表2所示几种故障情况为例,每种情况仿真500次,故障诊断正确率如表2所示。
8 结论
本文以广泛应用的SNMP网络管理模型为基础,首先构建了针对单个网络节点的分层的故障监测模型,然后考虑各层之间的故障传播关系,实现针对节点的故障根源定位,再考虑到故障在网络节点之间的传播模型,提出了依据网络的拓扑结构再对网络故障根源定位的贝叶斯网络模型。由于SNMP网管系统适用于各种异构网络,所以这种贝叶斯网络能适用于各种网络。
本文提出的贝叶斯网络可以应用更多的MIB组,考虑更多的协议进行推理。还可以拓展到更大型的网络,为骨干网络管理提供参考。而且,模型的尺度可以也可以更加精细。比如在构建基于网络拓扑的故障定位模型时,还有很多影响因素可以考虑。另外,文中考虑的网络拓扑比较简单,对于更加复杂的网络拓扑,故障传播情况更为复杂,还需要进一步研究。
摘要:本文以SNMP网络管理模型的管理信息库(MIB)为基础,在不同层次上构建了用于故障判别与定位的贝叶斯网络。对MIB变量采用自适应自回归(AAR)模型建模分析,构建与其相关协议之间的贝叶斯网络,推断协议功能是否发生异常。分析各个协议之间的功能依赖关系,构建协议间的贝叶斯网络,定位协议间的故障根源。考虑网络中故障传播构建了基于网络拓扑的贝叶斯网,定位故障根源节点。最后,对构建的模型进行了实验仿真,并分析了模型的优点和缺点。
关键词:网络故障,故障定位,贝叶斯网络
参考文献
[1]H ood C J.Proactive network fault detection[A].Sixteenth annual Joint Conference of the IEEE Computer and Communications Societies,Kobe,Japan,1997
[2]孙朝晖,张德运,孙钦东.异构网络环境中的自适应在线故障检测[J].西安交通大学学报,2004,38(4):409.
[3]张连文,郭海鹏.贝叶斯网引论[M].北京:科学出版社2006:85.
[4]谭林,胡谷雨,胥光辉,等.基于贝叶斯网络的计算机端到端服务故障诊断[J].海军工程大学学报,2005,17(5):5.
[5]郭军.网络管理[M].北京:北京邮电大学出版社,2007:105
网络故障诊断 篇10
摘要:针对风电机组故障信息耦合性、模糊性的不确定性特点,结合贝叶斯网络在处理不确定性问题上的优势,提出了风电机组故障诊断的贝叶斯网络方法,重点研究了该方法的两个关键问题,即风电机组故障诊断的贝叶斯网络建模和贝叶斯网络推理,构建了一种基于事故树分析方法的三层CME贝叶斯网络模型并解析了贝叶斯网络的故障推理过程,通过风电机组齿轮箱的故障诊断实例验证了上述模型的可行性和贝叶斯网络推理的有效性,研究成果对具有相关不确定性问题的机电设备故障诊断有借鉴意义。
关键词:风电机组;故障诊断;贝叶斯网络;推理
摘要:针对风电机组故障信息耦合性、模糊性的不确定性特点,结合贝叶斯网络在处理不确定性问题上的优势,提出了风电机组故障诊断的贝叶斯网络方法,重点研究了该方法的两个关键问题,即风电机组故障诊断的贝叶斯网络建模和贝叶斯网络推理,构建了一种基于事故树分析方法的三层CME贝叶斯网络模型并解析了贝叶斯网络的故障推理过程,通过风电机组齿轮箱的故障诊断实例验证了上述模型的可行性和贝叶斯网络推理的有效性,研究成果对具有相关不确定性问题的机电设备故障诊断有借鉴意义。
关键词:风电机组;故障诊断;贝叶斯网络;推理
摘要:针对风电机组故障信息耦合性、模糊性的不确定性特点,结合贝叶斯网络在处理不确定性问题上的优势,提出了风电机组故障诊断的贝叶斯网络方法,重点研究了该方法的两个关键问题,即风电机组故障诊断的贝叶斯网络建模和贝叶斯网络推理,构建了一种基于事故树分析方法的三层CME贝叶斯网络模型并解析了贝叶斯网络的故障推理过程,通过风电机组齿轮箱的故障诊断实例验证了上述模型的可行性和贝叶斯网络推理的有效性,研究成果对具有相关不确定性问题的机电设备故障诊断有借鉴意义。
网络常见故障的分类与诊断 篇11
一、物理类故障
物理类故障, 一般是指线路或设备出现物理类问题或硬件类问题。
(一) 线路故障
在日常网络维护中, 线路故障的发生率约占发生故障的70%。线路故障通常包括线路损坏及线路受到严重电磁干扰。
排查方法:如果是短距离的范围内, 判断网线好坏简单的方法是将该网络线一端插入一台确定能够正常连入局域网的主机的RJ45插座内, 另一端插入确定正常的HUB端口, 然后从主机的一端Ping线路另一端的主机或路由器, 根据通断来判断即可。如果线路稍长, 就用网线测试器测量网线的好坏。如果线路很长, 就需通知线路提供商检查线路, 看是否线路中间被切断。
对于是否存在严重电磁干扰的排查, 可以用屏蔽较强的屏蔽线在该段网路上进行通信测试, 如果通信正常, 则表明存在电磁干扰, 注意远离如高压电线等电磁场较强的物件。若仍不正常, 则应排除线路故障而考虑其他原因。
(二) 端口故障
端口故障通常包括插头松动和端口本身的物理故障。
排查方法:此类故障通常会影响到与其直接相连的其他设备的信号灯。因为信号灯比较直观, 所以可以通过信号灯的状态大致判断出故障的发生范围和可能原因。也可以尝试使用其它端口看能否连接正常。
(三) 集线器或路由器故障
该类故障是指物理损坏, 无法工作, 导致网络不通。
排查方法:最简易的方法是替换排除法, 用通信正常的网线和主机来连接集线器 (或路由器) 。
(四) 主机物理故障
网卡故障, 通常包括网卡松动, 网卡物理故障, 主机的网卡插槽故障和主机本身故障。
排查方法:在这里只介绍主机与网卡无法匹配工作的情况。对于网卡松动、主机的网卡插槽故障最好的解决办法是更换网卡插槽。对于网卡物理故障的情况, 如用上述方法不能解决问题的话, 就拿到其他正常工作的主机上测试网卡, 若仍无法工作, 可以认定是网卡物理损坏, 更换即可。
二、逻辑类故障
该类故障中最常见的情况是配置错误, 即因为网络设备的配置错误而导致的网络异常或故障。
(一) 路由器逻辑故障。
通常包括路由器端口参数设定有误, 路由器路由配置错误、路由器CPU利用率过高和路由器内存余量太小等。
排查方法:路由器端口参数设定有误, 会导致找不到远端地址。用Ping命令或用Traceroute命令查看在远端地址哪个节点出现问题, 对该节点参数进行检查和修复。
路由器路由配置错误, 会使路由循环找不到远端地址。解决路由循环的方法就是重新配置路由器端口的静态路由或动态路由, 把路由设置为正确配置, 就能恢复线路了。
路由器CPU利用率过高和路由器内存余量太小, 导致网络服务的质量变差。解决这种故障, 只能对路由器进行升级、扩大内存等, 或者重新规划网络拓扑结构。
(二) 一些重要进程或端口关闭
一些有关网络连接数据参数的重要进程或端口受系统或病毒影响而导致意外关闭。
排查方法:用Ping线路近端的端口看是否能Ping通, Ping不通时检查该端口是否处于down的状态, 若是说明该端口已经给关闭了, 因而导致故障。这时只需重新启动该端口, 即可恢复线路的连通。
(三) 主机逻辑故障。
通常包括网卡的驱动程序安装不当、网卡设备有冲突、主机的网络地址参数设置不当、主机网络协议或服务安装不当和主机安全性故障等。
1. 网卡的驱动程序安装不当。
排查方法:在设备管理器窗口中, 检查网卡选项, 看是否驱动安装正常, 若网卡型号前标示出现“!”或“X”, 表明此时网卡无法正常工作。解决方法是找到正确的驱动程序重新安装即可。
2. 网卡设备有冲突。
排查方法:磁盘大多附有测试和设置网卡参数的程序, 分别查验网卡设置的接头类型、IRQ、I/O端口地址等参数。若有冲突, 只要重新设置 (有些必须调整跳线) , 或者更换网卡插槽, 让主机认为是新设备重新分配系统资源参数, 一般都能使网络恢复正常。
3. 主机的网络地址参数设置不当。
排查方法:查看网络邻居属性中的连接属性窗口, 查看TCP/IP选项参数是否符合要求, 包括IP地址、子网掩码、网关和DNS参数, 进行修复。
4. 主机网络协议或服务安装不当。
排查方法:在网上邻居或在本地连接属性窗口查看所安装的协议是否与其他主机是相一致的。其次查看主机所提供的相应服务程序是否已安装, 如果未安装, 请注意安装。
5. 主机安全性故障。通常包括主机资源被盗、主机被黑客控制、主机系统不稳定等。
排查方法:主机资源被盗, 主机没有控制其上的finger, RPC, rlogin等服务。攻击者可以通过这些进程的正常服务或漏洞攻击该主机, 甚至得到管理员权限, 进而对磁盘所有内容有任意复制和修改的权限。
主机被黑客控制, 会导致主机不受操纵者控制。通常是由于主机被安置了后门程序所致。发现此类故障比较困难, 一般可以通过监视主机的流量、扫描主机端口和服务、安装防火墙和加补系统补丁来防止可能的漏洞。
主机系统不稳定, 往往也是由于黑客的恶意攻击, 或者主机感染病毒造成。通过杀毒软件进行查杀病毒, 排除病毒的可能。或重新安装操作系统, 并安装最新的操作系统补丁程序和防火墙、防黑客软件和服务来防止可能的漏洞产生所造成的恶性攻击。
三、结语
总之, 网络故障诊断技术是遵循先软后硬的原则, 但是具体情况要具体分析。如果你是网络管理人员, 在网络维护中的还需要注意以下几个方面:
第一, 建立完整的组网文档, 以供维护时查询。
第二, 做好网络维护日志的记载, 有利于以后故障排查。
第三, 提高网络安全防范意识, 提高口令的可靠性, 并为主机加装最新操作系统的补丁程序和防火墙、防黑客程序等来防止可能出现的漏洞。
参考文献
[1]Greg Tomsho.网络维护和故障诊断指南[M].北京:清华大学出版, 2003.
【网络故障诊断】推荐阅读:
网络故障诊断综述07-11
常见网络故障诊断解析07-16
网络故障分层诊断技术09-04
网络故障排查06-17
网络故障监测10-25
网络设备故障06-28
网络故障类型分析08-22
网络故障排除论文09-15
网络故障及安全09-16