告警数据

2024-12-03

告警数据(通用9篇)

告警数据 篇1

告警管理子系统是移动网络管理系统中的一个子系统, 它主要功能是从全省所有移动设备中采集各种与设备运行有关的告警数据, 经加工处理后产生各种告警统计分析报告, 同时也负责对全省所有移动设备的告警监视和分析, 为维护部门和管理部门提供信息, 指导网络工程规划和网络调整, 改善网络运行质量。

1. 告警管理子系统概要说明

由功能需求说明书确定功能分割与公共模块的提取结构, 如图1。子系统分为基本、呈现、处理、设置、知识库五个部分。

1.1 基本部分

负责接收告警数据并将其拆分、存储。负责过载处理。

1.2 呈现部分

负责对告警数据根据要求呈现, 给出用户友好的界面使用户很方便处理。

1.3 处理部分

负责声音告警、告警确认、派发工单。

1.4 设置部分

告警复位义:对网元类型、所属厂商、告警类型等进行复位义。系统按照可能原因、网元类别、网元识别码、原告警类型、告警级别、时间类型等条件及各种条件的组合来设置。告警级别分为严重告警、主要告警、次要告警、警告告警;告警级别定义对于厂家设备不同定义不同, 以实际数据为准。告警类别分为通讯告警、环境告警、设备告警、处理错误告警、服务质量告警。

告警过滤:网元类型、告警类型的过滤, 有告警对象、告警级别、过滤模式、确认模式四种设置模式。对某一地区内同一网元类型的所有对象过滤。并可以对同一网元类型的单个或多个告警信息过滤;对同一网元类型的所有对象过滤。

相关性的定义:合成告警条件的设置 (例:单位时间产生过多、产生的时间过长 (没有处理) ) 。

告警前转定义:前转方式、前转前提条件、对脚本的维护。

声音告警:声音的响应标准 (例:先等级后次序的原则) , 等级对应的声音设定。

日志:告警日志设置。

告警显示:告警排序设置:排序条件、升降等。告警字段设置:显示字段的先后顺序。

1.5 知识库

对知识库数据的查询、增加、修改、删除、导出提供友好的界面和便捷的接口。

2. 告警数据采集模块设计

2.1 告警原始数据采集量算法:

2.1.1 网元数据

告警原始数据是本地所有网元产生的告警信息在一段时间内的总和。因为告警的产生具有很大的随机性, 所以选取一个相对极限值。按每个网元每天产生1500次告警计算。每条告警信息一般是一百多byte, 按500byte计算。比如某地区网元数达到217个, 我们以220个网元为例计算, 据此估算告警数据的存储量需求。按用户要求, 原始数据存储六个月, 汇总数据存储十二个月。

告警原始数据总和=500B*1500*220*180=29.7G

注:500byte为每条告警信息占用量;

1500次告警为每网元每天告警次数;

220为全省网元数;

180天为六个月。

告警汇总数据总和=29.7/6*0.2*12=11.88G

注:29.7/6为每月的告警原始数据;

0.2为汇总数据与原始数据的压缩比;

12为12个月。

综上所述, 网管系统的存储介质采用RAID 0+1技术的冗余备份方式, 并预留一部分临时空间作为临时表存储, 数据库管理的加乘系数为1.8, 则该地区网管系统需要的硬盘存储量至少为:

2.1.2 网管中心与网元之间传输故障数据带宽计算:

每个网元每天发生告警数为随机数, 每个告警数据大约是几百字节, 在出现大规模告警的峰值情况, 因为告警信息要求实时传送, 所以FM数据对数据传输带宽的影响也很大。如上节计算, 每条告警数据约为500byte, 在某些严重告警出现时, 会发生很多与之相关的关联告警, 以出现100个关联告警为例, 如需要在30秒内传送出去, 则网络带宽需要为500*8*100/30»15kbps, 在链路中传输的数据加入传输开销比特, 网络带宽需为20kbps。

2.2 告警数据采集模块的详细设计

告警数据采集模块流程如图2:

下面主要从方式、接口及原始数据存储方式三个方面进行说明。

2.2.1 采集方式

我省网管系统对具备厂家操作维护中心 (OMC) 的地区, 通过操作维护中心 (OMC) 采集数据, 对没有操作维护中心的地区, 可采用直联网元的方式采集数据。对现有设备升级为智能网设备的网元或具有GPRS功能的网元通过原有设备所属OMC采集数据, 新增的智能网设备通过智能网功能管理域采集数据。

在现有条件下, 数据的采集可以有多种方式, 可能的方法包括:从GSM厂商的OMC数据库中采集数据;从GSM厂商的OMC文件中采集数据;从CMIP代理获取数据;从GSM厂商的MSC或BSC上采集数据;从一定功能管理域采集数据。

新增的SSP、SCP、SCE、SMP、SMAP、充值中心等智能网设备统一纳入智能网管理域, 由其提供数据接口到省网管系统。

其他方式:对于不能自动采集的数据, 可以通过手工输入来完成, 力保数据的全面性、准确性。

2.2.2 接口要求

根据集团公司的规范, 接口将采用Q3或CORBA接口, 但由于集团公司接口模型尚未确定, 因此Q3及CORBA接口暂时不能实现。一旦集团公司接口模型确定, 网管开发商及厂家均要实现Q3接口或CORBA接口。

对于现状, 各厂家根据自己的实际情况充分提供接口, 开放数据库和文件, 供采集层采集数据。对于文件型的数据, 必需提供FTP协议或相关协议, 以及文件说明, 字段说明。

对于数据库中的数据, 必需提供TCP/IP协议, 以便用ODBC连接数据库或其它相关协议, 同时对数据库中的表及关联关系和字段加以说明。

对于实时告警, 各厂家均要提供解决措施, 采取相关接口, 使实时告警能够前转到省网管系统。

2.2.3 原始数据存储方式

根据规范, 采集来的原始数据要统一保存在省网管的原始数据库中, 对于从OMC或网元采集来的数据库格式的表, 保存在省网管原始数据库时, 要求表的名称及字段名及类型仍保留原型, 对于采集上来的数据文件, 采集程序能够将其中的数据转换为数据库的表形式, 统一保存在省网管的原始数据库中。

辽宁移动网管系统在2002年3月15日开始在全省试, 采集到的数据在数据处理模块能得到及时地处理, 不会造成数据的堆积, 保证了系统的实时性。在功能上说, 目前的移动网络管理系统主要实现了对GSM900/1800网中网元 (MSC GMSC/HLR/BSC/BTS) 的管理功能。总体上说, 这样的网络管理系统只是实现了真正网管意义上的一些初级功能, 在现在移动业飞速发展的今天, 它面临着诸多问题和挑战。

摘要:本文对移动网管中的告警管理子系统要完成的功能进行简要说明, 按照层次式的思想对告警数据的采集层进行了分析, 并对数据采集模块给出了详细设计方案。

关键词:移动通信,告警管理,数据采集层

参考文献

[1]孙青卉, 王钧铭.移动通信技术[M].北京:机械工业出版社, 2009:7-38.

[2]孟洛明, 亓峰.现代网络管理技术[M].北京:北京邮电大学出版社, 2010:2-29.

[3]陈建亚.现代通信网监控与管理[M].北京:北京邮电大学出版社, 2010:2-48.

[4]陈德荣, 林家儒.数字移动通信系统[M].北京:北京邮电大学出版社, 2010:62-75.

[5]孟洛明.通信网网管系统建设中的基本问题、现状和发展[J].通信世界:电信网管专题, 2010 (7) :2-4.

[6]杨玉, 王文辉.网管系统在移动通信网络中的应用及问题[J].通信世界:电信网管专题, 2010 (7) :9-13.

网络故障告警关联技术的讨论 篇2

关键词:流程 网络故障管理 告警关联 矩阵 网络拓扑结构

網络复杂、牵涉的方面多,硬件的问题、软件的漏洞等等都可以引起网络的故障。对于硬件一般都是由架构网络的设备引起的网络故障,我们一般可以通过PING命令查看出来。

网络故障可以导致网络系统瘫痪或网络性能下降到不能接受的程度。故障管理是网络中可以实现的最为广泛的一种管理,它是网络管理的最基本功能。故障管理的目的在于保证网络的正常连接,并保证网络的高效可靠运行。

一、基本概念

故障管理是基本的网络管理功能,是网络管理功能中与故障检测、故障诊断和恢复等工作有关的部分,其目的是保证网络能够提供连续可靠的服务。

故障管理的重点和难点在于对故障的定位和诊断,定位准确,才能对报警信息进行相关性处理。通常网络故障产生的原因都比较复杂。在本文中会介绍几种具有代表性的故障管理告警关联技术,并通过对这些关联技术进行对比分析,从而完成对网络中所有节点动作状态的监控、故障记录的追踪、检查以及定位。

计算机网络服务发生意外中断是很常见的,这种意外中断在某些重要的时候可能会对社会或生产产生很大的影响。但是,与单个计算机系统不同的是,在大型计算机网络中,当发生失效故障时,往往不能轻易、具体地确定故障所在的准确位置,需要相关技术的支持。因此,需要有一个稳定的故障管理系统,科学地管理网络中发生的所有故障,并记录每个故障的产生及相关信息,最后确定并改正那些故障,保证网络能提供连续可靠的服务。

二、告警关联技术分析与对比

1.基于规则推理的告警关联

查找软件故障比较困难,最好使用规则分析仪。这是一种高档设备,它作为一个特殊工作站连接在网上,收集、显示和分析LAN上传输的数据,并将这些数据保存起来。该仪器解决了大量的网络查错问题。但必须要有高水平的专家才能评价其结果。

基于规则的系统推理机制是一个从识别到动作的循环过程,必须满足形成一个由所有规则所组成的冲突集,在网络发生冲突时,选择冲突集中最优匹配的规则来执行。这样重复执行一个过程,直到冲突解决为止。

此方法的优点在于其表达直观、表现灵活、便于推理、格式清晰、设计和检测方便、可进行模块化处理。缺点则是系统中规则的提取和维护比较困难,求解效率比较低,不具备自学的能力,不适用于求解复杂的系统等。

2.基于案例推理的告警关联

基于案例推理的基本思想是将过往解决问题的实际经验以案例的形式存储在案例库中,当遇到问题时,就到案例库中查找类似案例的成功解决方法,从而顺利解决问题。也可编写故障日志,形成故障信息记录库,并对故障日志进行分析。

完整的案例推理系统由以下五个部分组成:案例表示、案例获取、案例重用、案例修改和案例保留。

此方法的优点是在平时处理网络故障的过程中建立案例库比较便捷,案例存放比较简单,查找速度快,参考价值很大,可进行自我修订。缺点则是这种方法通用性不强,只适用于一些专门领域,而且处理网络故障的告警能力不足,影响了此方法的进一步发展。

3.基于模型推理的告警关联

在控制对象、任务与环境日益复杂的背景下,模型推理关联技术近年来已在过程系统的智能设计、规划和故障诊断等某些具体领域得以应用。使用冗余网络对象代替故障对象来提供临时的网络服务,如Windows NT或Windows 2000系统中使用备份域控制器替代主域控制器来提供身份验证的服务。

网络由许多被管对象组成,一个对象可以是一个网络、一个节点、一个物理媒体,也可以是协议层、软件进程或者虚拟电路等。根据不同的应用要求,可以获得不同的信息,从而建立不同的模型。每个模型之间可以通过自身的被管网元与其他模型之间进行通信,从而分析自身所处的网元是否发生网络故障。

这种方法的优点在于具备解决网络故障新问题的潜力,但是其不足之处是一旦超出模型所代表的网元范围,它的处理能力就显得很微弱,使得网络故障得不到及时解决。

4.基于数据挖掘的告警关联

数据挖掘是在海量数据中发现新模式的一种分析技术,它在解决告警关联分析问题时,首先通过大量历史告警信息的一些统计规律来发现告警关联规则,然后根据规则分析和预测网络中可能出现的故障。

将数据挖掘技术引入到告警关联中,目的是为了揭示出隐含在海量原始低层故障征兆信息后面有意义的知识和规则,从更全面的视角解释网络故障及性能问题,使网络管理者能快速地进行故障定位并进一步作出故障决策和

预测。

这种告警关联分析技术能够很好地适应网络的动态变化,从而将有效的历史告警数据集合起来,依靠挖掘工具确定告警关联规则。但是它只能反映局部范围的规律,而且需要和其他方法结合起来进行处理,才能获得较好效果。

5.基于代码方法的告警关联

代码方法的基本原理是对可能出现的网络故障进行预防,针对潜在的问题和表现这些问题的症状,建立关联矩阵,并对其进行问题定位。

使用代码方法进行告警关联大致分为四个步骤:为系统中的部件建立事件模型和传播模型;为所监控系统中可能存在的问题和它们的症状生成规范表示,也就是矩阵;通过一定的方法减少矩阵中的信息量,直到可以唯一标识问题,找到最小代码书;不断监测并通过代码书解码症状定位所发生的问题。

这种方法简单实用、适用范围较广、速度快、错误率低,但是自身适应性不够、独立性不强,需要人为过多参与。

三、结论

在大型计算机网络中发现故障时,我们往往不能确定故障所在的具体位置,这就需要故障管理提供逐步隔离和最后定位故障的一整套方法和工具。有时候,我们所发现的故障是随机性的,需要经过很长时间的跟踪和分析,才能找到其产生的原因。这就需要有一个故障管理系统,有多种分析网络故障的关联技术,科学地管理网络所发现的所有故障,具体记录每一个故障的产生,然后跟踪分析,直到最后确定并排除故障。

使用不同方法进行告警关联,有些已经应用到实际的产品中,有些还处在研究开发阶段。不同的告警关联方法各有其优点和不足,而且告警关联应用的目的和场合也不尽相同,因此,进行关联时所采用的方法也有所不同。总之,不同告警关联技术之间的优缺点可以互补,从而让用户可以自行选择合适的方法或者多种关联方法结合使用,对网络故障进行诊断和定位。

网络故障错综复杂,没有什么方法和产品能够保障网络永远稳定地运行。当我们遇到网络故障时,借助科学技术来分析网络系统,才能快速找到和解决网络故障,使我们的工作和生活不受影响,这才是最重要的。

参考文献:

[1]彭熙,李艳,肖德宝.网络故障管理中几种事件关联技术的分析与比较[J].计算机应用研究,2003(9).

集控中心告警数据处理技术和方法 篇3

随着变电站无人值班的实施,远动装置上送的告警信息量越来越大,重要的告警信号往往夹杂在大量的次要信号中一同传递上来,给监控工作带来极大的不便,甚至会造成重要信息的遗漏。为了解决这一问题,需要对告警数据进行分析处理。

告警数据处理的方法有多种[1,2,3,4]。目前,集控中心监控系统告警数据通常采用时序告警窗和基于图形浏览器的间隔光字牌来展示。

时序告警窗按照时间先后顺序显示告警信息,并可按开关变位、遥测越限、厂站工况、保护事件等分类浏览。其存在的不足有:①正常情况下,如果各种信号动作频繁,监控人员容易遗漏重要信号,延误处理;②事故情况下,信息大量上送,不停地翻滚显示,重要信号往往被大量次要信号淹没,监控人员很难抓住重点,进而影响事故的正确处理;③设备检修试验时产生大量无用试验信号,会扰乱监控人员的视线;④交接班时需要查看系统当时所有处于动作状态的保护信号,而告警窗口是一个历史的浏览界面,无法显示所有信号的实时信息;⑤只能按大类进行筛选浏览,不能按厂站、电压等级、间隔分层处理,不能按监控人员所处的责任区进行信号过滤,不能针对大类的信号(如保护事件)按重要等级再进行分类处理。

基于图形浏览器的间隔光字牌通常应用在变电站综合自动化系统和调度自动化系统中,但是对于一个集控中心监控系统,其存在以下不足:①保护、开关、刀闸信号量非常庞大,若将所有信号都绘制成图形,工作量巨大;②变电站改造频繁,采集信号量不断调整,光字牌也需要随之修改,由于图形固定排版,增加和修改不方便,维护工作量大;③由于信号分布在每一张间隔图中,无法列举整个监控系统当前所有变化的信号或者处于动作的保护信号,必须逐个间隔查看,使用不方便;④无法通过快速定位事件所在间隔了解整个间隔的情况,造成事件判断及处理的时间滞后。

针对上述分析的现状和不足,本文提出了以下几点集控中心告警数据处理技术和方法。

1 信号二维分类方法

结合集控中心的特点,将信号按纵向分层和横向分类相结合的二维分类方法进行划分。

纵向分层是指将信号按厂站、电压分区、间隔、一次设备进行划分。厂站对应变电站或发电厂,每个厂站由2个及以上电压分区构成,每一级电压为1个电压分区,包含1个或多个间隔,每个间隔由若干个一次设备构成。每个一次设备又包含多个信号。这一分层方法遵从IEC 61970标准的公共信息模型(CIM)。

横向分类是指将信号按其重要程度依次划分为事故类、告警类、变位类、提示类、设备状态类。事故类信号最为重要,包含保护动作信息、变电站事故总信号、间隔事故总信号等,监控人员应该密切关注。告警类信号包含一次设备和二次设备的失电、欠压、闭锁、告警、异常等,该类信号发生时,相关人员应密切关注以防势态恶化。变位类信号包含人工操作的断路器、接地刀闸、非接地刀闸的分合闸信号,该类信号是倒闸操作时要重点关注的信息。提示类信号包含各种提醒告知信号,如油泵启动、风机启动、充电信号等,该类信号除非在较短时间内多次动作和复归需要关注外,一般情况下不需进行处理。设备状态类信号包含自动化设备的工况信号,由厂站端自动化设备上传,一般是系统维护人员所关心的信号,但监控人员也应给予关注。综合这些状态因素可以判断由其上送信息的正确性和有效性。

信号按这种二维分类法分类后,就可按层次和重要程度进行选择或过滤。

2 信号过滤方法

监控系统中信号量大,但不是每一个信号都要告警,因此需要过滤:①要人为地筛选过滤;②由于调试或检修等原因,某些纵向层次的信号也需要过滤;③由于每个监控人员的监控范围和职责不同,信号需要按其责任区进行过滤;④信号的重要程度不同,其关注度也不同,需要按横向的分类进行过滤。信号过滤方法的流程如图1所示。

3 信号配置方法

信号的配置分为以下5个步骤进行:

1)通过遥测、遥信点表自动生成一次设备信息,自动关联其所属厂站和电压分区;

2)根据一次设备信息自动生成间隔,间隔的名称是所属厂站、电压分区、设备名称和编号的任意组合;

3)按纵向层次人工筛选信号,决定信号是否人工过滤;

4)配置信号的横向类型,通过特征字符串匹配将其按重要程度进行分类;

5)定义责任区范围,并配置监控人员所属责任区。

4 动态合成光字牌技术

采用信号二维分类、信号过滤和信号配置这3种信号处理方法,对每个需要告警的信号用一盏光字牌灯表示,通过灯的颜色和状态来动态反映信号的实际情况。光字牌界面自动生成,无需人工绘制。既可按纵向分层方式组织数据,厂站和间隔层的光字牌由其下普通信号光字牌合成表示,也可按横向分类进行过滤显示。

定义光字牌的显示值(颜色)有2种:①红色,代表信号值为1,如保护动作、开关合闸;②绿色,代表信号值为0,如保护复归、开关分闸。定义光字牌的显示状态有3种:①灰化,表示这个信号无效,如信号被封锁;②闪烁,表示信号发生了变化,还没有被确认,如保护由动作到复归或者由复归到动作;③固定不动,表示信号正常。

将光字牌分为2种类型:①普通光字牌,即单个遥信信号;②合成光字牌(如间隔、厂站),是由子光字牌经过某种算法动态合成而来,其中,合成“合成光字牌”的元素,称之为“子光字牌”,它可以是合成光字牌也可以是普通光字牌。

动态合成光字牌在合成前先去除无效(灰化)的子光字牌。合成光字牌状态如下:

Ι=i1i2in(1)

式中:I为合成光字牌是否有效;in为子光字牌是否有效,in=0表示无效,in=1表示有效;n=1,2,…;∨为逻辑或。

只要有1个子光字牌有效,则合成光字牌有效,否则合成光字牌无效。

动态合成光字牌有以下2种算法。

第1种算法如式(2)、式(3)所示。

S=s1s2sn(2)

式中:S为合成光字牌的状态;sn为子光字牌的状态,sn=0表示正常,sn=1表示闪烁;n=1,2,…。

只要有一个子光字牌的状态为闪烁,则合成光字牌闪烁,否则正常。

V=v1v2vn(3)

式中:V为合成光字牌的值;vn为子光字牌的值,vn=0表示复归,vn=1表示动作;n=1,2,…。

只要有一个子光字牌的值为1(红色),则合成光字牌的值为1(红色),否则为0(绿色)。

第2种算法如式(4)~式(6)所示。

S0(4)

无论子光字牌的值和状态怎样,合成光字牌的状态都是正常的。

Vb=s1s2sn(5)

式中:Vb为间隔层合成光字牌的值;sn为普通光字牌的状态,sn=0表示正常,sn=1表示闪烁;n=1,2,…。

只要有一个普通光字牌的状态为1(闪烁),则间隔层合成光字牌的值为1,否则为0。

V=v1v2vn(6)

式中:V为厂站层合成光字牌的值;vn为子光字牌的值,vn=0表示绿色,vn=1表示红色;n=1,2,…。

只要有一个子光字牌的值为1,则合成光字牌的值为1,否则为0。

这2种算法各有利弊,可以根据实际应用情况去选择。第1种算法,合成光字牌的值和状态能够真实反映子光字牌的实际情况,优点是直观,但是由于真实运行的系统在一个间隔或一个厂站中或多或少有保护遥信值是1的情况,所以合成光字牌半数以上是红色,另外,该算法要通过合成光字牌的闪烁来判断子光字牌的变化,长时间监盘,闪烁的信号会使人视觉上产生疲劳。第2种算法,优点是合成光字牌永远不会闪烁,一直是固定显示,长时间监盘不会让人视觉上产生疲劳,缺点是合成光字牌的颜色不是普通光字牌遥信值的真实反映,而是有无变化的反映,监控人员需要一个思维转换过程。

动态合成光字牌在监控系统的主界面上有一个称为导航光字牌的灯,全系统内只要有1个信号变化,则导航光字牌就会闪烁。点击导航光字牌出现厂站光字牌总览图,每个厂站对应着一盏灯。根据不同的算法,会出现不同的颜色和状态,如附录A图A1所示。依此类推,点击某个厂站,出现间隔光字牌。点击间隔光字牌,出现该间隔中的所有信号。

监控人员通过光字牌不仅可以快速逐层定位到一个告警信号,并进行信号确认,还可以查看某一信号的历史变化情况。这些操作都是按责任区进行的,监控人员只能在自己的责任区中操作。同一责任区中的信号只需确认一次,不同责任区中的确认互相不影响。

动态合成光字牌不仅可以按纵向分层浏览,还可按横向分类查看,甚至可以通过纵向加横向组合进行浏览。例如:可以在某一厂站下查看事故类的所有信号。另外,还可匹配字符串浏览(如匹配所有含101字符串的光字牌)、按光字牌值方式浏览(如只显示保护动作的光字牌)、按光字牌状态方式浏览(如只显示处于闪烁状态的光字牌)等。

5 分层告警技术

分层告警技术是在信号纵横向分类、过滤、配置的基础上,将原先按时间顺序显示的告警信息进行高级分析处理。分层告警窗口分9个页面显示:事故类、告警类、变位类、提示类、设备状态类、时序类、检修类、自定义类、未复归类。前5个是横向分类,后4个是前5类的特定组合。时序类按告警的先后顺序,显示所有开关变位、保护信息的告警;检修类是设备检修调试时产生的信息,其他窗口不再显示这些信息;自定义类是5类告警自由的组合,即挑选其中的1种或者多种进行显示;未复归类只显示系统中当前所有处于动作的保护信号。

分层告警窗如附录A图A2所示。当告警到来时,不仅在“时序”页面中显示,也在相应类型的页面中显示。监控人员可以通过选择左侧的树形目录,快速定位到一个厂站或一个间隔的所有信息,便于第一时间发现问题,并快速锁定事故范围。

分层告警按事件发生的先后顺序,以某个间隔第1个出现的信号为起始时间,此后一段时间内的所有信号,认为系同一原因触发,作为一个事件处理,这样有助于监控人员更好地把握事件的原因。事件与事件之间用不同的颜色明显区分。

分层告警还提供历史记录查询,按厂站、间隔、设备3个层次,选择查询某个历史时间段内的相应信息。保证监控人员可以查看到系统运行以来的所有告警情况。

当有事故发生信息量非常多时,告警窗口的内容会不断地翻滚,始终显示最新的事件,这很容易使人眼花缭乱。分层告警提供暂停滚动功能,使告警窗口固定在某一位置不动,便于监控人员查看。

分层告警也提供确认操作。确认后的信息,会打上红色的勾以示区别。

6 动态合成光字牌技术与分层告警技术的联系和区别

动态合成光字牌技术和分层告警技术是有机联系的,表现在以下几方面:①数据源相同,都来自变电站的信号;②分层分类的原则一致,都按纵向分层和横向分类的方法进行显示、屏蔽;③信号确认的机制一致,都需要权限验证,都会产生相应的告警和历史结果以备查询,一处确认另一处同时生效;④它们之间可以相互切换,如可通过一条文字性的信息快速查看该信息所属间隔的光字牌,也可通过某一间隔光字牌查看该间隔的所有告警。

它们的区别在于光字牌显示的是系统当前状态,是系统实时信息的反映,而分层告警窗显示的是系统已经发生的变化,是系统历史信息的反映。

7 应用情况

江苏海门市供电局的调度自动化和集控中心监控系统采用一体化平台设计,共享历史服务器和前置服务器。集控工作站采用专用100 Mbit/s光纤与调度主站相连。集控中心监视海门境内所辖的21个无人值班变电站,其中开关和刀闸遥信量有600多条,保护动作和告警的遥信量有6 000多条。当遇到雷暴天气时,常常会在告警窗中同时出现上百条保护动作和开关变位的告警,夏天气温高、负荷重时,也会出现许多过负荷的告警,如果再加上远动装置异常产生的装置告警和误遥信,值班人员就很难通过显示屏上的信息把握实际异常情况,许多重要的保护动作信息会被大量的次要信号淹没。

该供电局采用本文的动态合成光字牌和分层告警窗后,一旦有告警,值班人员就能快速地了解保护动作情况,方便地定位到所属间隔具体设备,大大减少搜索信息的时间,提高了值班人员的工作效率,加快了电网异常和事故的处理进程。值班人员对动作的信息进行确认,采取相应的措施,确认后将确认时间和人员等信息登录数据库,方便日后查询,有利于将责任落实到人,进一步规范和保障电力系统的安全运行。

附录见本刊网络版(http://aeps.sgepri.sgcc.com.cn/aeps/ch/index.aspx)。

参考文献

[1]葛敏辉,陈建民,盛豪奇,等.500kV集中监控系统保护信息分层分类规范与实现.华东电力,2008,36(1):26-30.GE Minhui,CHENJianmin,SHENG Haoqi,et al.Protection information classification for500kV centralized monitoring systems and its realization.East China Electric Power,2008,36(1):26-30.

[2]黄梅.能量管理系统在电网监控中的应用及探讨.江苏电机工程,2009,28(5):33-36.HUANG Mei.Application and discussion of EMS in power system monitoring.Jiangsu Electrical Engineering,2009,28(5):33-36.

[3]秦杰,马韬韬,郭创新.调度自动化设备状态在线报警系统的设计与应用.电力系统自动化,2009,33(6):95-98.QI N Jie,MA Taotao,GUO Chuangxin.Design and i mplementation of on-line state monitoring for power grid automation system.Automation of Electric Power Systems,2009,33(6):95-98.

[4]王本胜,陈文金.蒙阴供电公司综合自动化变电站报警信息分析及改进.电力系统自动化,2004,28(14):97-99.WANG Bensheng,CHEN Wenjin.The alarm message analysis and i mprovement for comprehensive automation system of substation in mengyin electric power company.Automation of Electric Power Systems,2004,28(14):97-99.

[5]李彬蔚.变电站综合自动化系统告警方式的改进.电力安全技术,2009,11(3):29-31.LI Binwei.The i mprovement of alarm method for comprehensive automation systemof Substation.Electric Safety Technology,2009,11(3):29-31.

告警数据 篇4

关键词:GSM系统;SDR基站;告警关联功能

中图分类号:TP311.52 文献标识码:A 文章编号:1674-7712 (2012) 06-0080-01

一、SDR基站的含义和优势

SDR基站是基于软件无线电技术设计和开发的基站系统。和传统基站相比,它最大的差异是在于它有相应的软件编辑和重新定义它的射频但愿,因此,智能化频谱分配和对多标准的支持完全可以实现。

二、GSM系统SDR基站告警关联的方法

(一)基于规则推理的告警关联。这种告警关联方法主要是在规则集合中列入所有特定于当前告警系统领域的告警知识,通过判定所有已经监测到的告警,并使用相应的推理规则来进行分类,把一个或者多个告警的发生符合某一个规则与否,来确定其具体的故障类型。

(二)基于案例推理的告警关联。这种告警关联方法主要是将以前发生过,但是现在已经得到解决的故障集中在一块,形成一个案例集合,当遇到新故障时,就去案例集合中对比相同的故障,再找到解决方案。

(三)基于人工操作获得网络方法的告警关联。这种告警关联方法主要是,发生故障时,网络设备上的告警信息被输入到神经网络,再通过神经网络输出到实际网络,在不断的输入输出调节神经元相互连接的权值来训练神经元的灵敏度。最后神经网络便可根据神经元连接处的权值来识别出特定的故障信息。

(四)其他方法。进行告警关联还可以运用很多方法来实现,如使用像基于依赖图、基于数据挖掘、基于模型、基于有限状态机、基于模糊逻辑和主动预测式关联等。

三、GSM系统SDR基站告警关联的实现技术

GSMSDR基站的告警关联采用的实现方法基于规则推理,告警关联的实现按功能可以分成以下两个部分:

(一)规则部分。TalmRulelnfo为告警关联关系规则结构体的意思表示,其数据结构定义为{{父告警码,父告警子码,检测周期},{子告警码,子告警子码,检测周期},对比函数指针},其中父告警的检测周期为父告警审核子告警上报的信息所用的时间;子告警的检测周期为收到父告警恢复信息后子告警调节自身恢复所用的时间。

在GSM的SDR基站软件系统中,首先由GSPS子系统的GCCALM模块通过观测现场的实际情况决策出告警关联的静态规则,即判定父子告警的告警码是否存在以及在对比函数中告警关联是否存在实际关系。然后GSPS的GCCALM模块接收平台操作维护(OAM)子系统提供的告警关联规则的注册接口,最后将告警关联规则通过接口注册给平台。

(二)实例部分。告警关联所发挥的作用主要体现在平台OAM子系统中的告警管理进程中。关联告警过滤标志(by Relation status)有关联过滤(RELATION_FILTER)、不过滤(RELATION_No_FILTER)、关联等待(RELATION_WAIT),三种设计状态:该标志处理时间为关联维护时。

警实例注册表也被牵涉到告警关联的处理,它的定位是告警关联的二级缓存,结构主要分为{告警码,实例链表},他不但存储了告警状态,而且把所有的关联规则实例指南都以一定义了,位父子告警实例若用该表则可以快速解决,从而避免频繁地去一一寻找告警位图。

在GSM告警关联规则被GCCALM模块成功纳入到平台告警管理进程中,当告警管理进程中出现新的消息时,经过以利写重新判定步骤。若没有把该告警消息丢弃,则把告警位图进行了维护和对告警应对做好相应的判定,之后的告警关联处理流程也将出现了,其主要分为告警上报和告警恢复:

1.若告警上报在新的告警消息处出现,首先要判定是否成功注册了告警关联,还需根据GCCALM注册的告警关联规则来定夺,若注册了则告警实例注册表中输入该告警。反之则将之前的告警消息按正常的上报程序上报,然后由后台LMT接受处理。

2.若告警恢复消息在新的告警消处出现时,首先要判定是否已经成功注册告警关联,还需根据GCCALM注册的告警关联规则来定夺。若注册了,则在所有的告警实例中找到该告警实例,然后把它删除。反之则将之前的告警恢复消息按正常的上报程序上报,然后由后台LMT接受处理。

四、应用实例

在没有在GSMSDR基站系统中出现告警关联时,通过手工方法把后台LMT上的UBPG单板复原,则上面的单板初始化告警被上报,此时由于UBPG单板处于开始状态,所以它不能与相对应的RRU进行相通。

情况1:子告警上报被关联,告警关联前后,告警及告警恢复的上报情况通过对比可知告警关联实现前,复位UBPG板,LMT上告警上报记录显示:UBPG单板首先上報单板初始化告警,之后相连RRU上报冗余告警。成功实现告警关联操作后,将UBPG板恢复原状,LMT上告警上报记录显示:最原始的告警由UBPG单板首先发出上报,IQcheckBlock告警和60ms丢失告警这类冗余告警不需要由RRU上报。

情况2:在出现了子告警的情况下,上报父告警后,子告警因父告警的出现而不能出现在显示屏上,告警记录显示:60ms丢失告警已在RRU上报之前完成上报,单板初始化告警已被与RRU相连的UBPG单板上报,告警恢复将通过RRU上的60ms丢失告警被上报。

情况3:父告警上报返回到原来状态时,父告警完成最大的检测周期后子告警将重新上报,告警记录显示:RRU上之前上报了60ms丢失告警,当UBPG单板上的单板初始化告警恢复之后,从告警告警恢复上报时间可以看出,一分钟之后,RRU上的60ms丢失告警重新上报。

五、结束语

GSM系统非常的强大而且内部系统交错复杂,其中,GSM网络中的移动通信基站在里面扮演者主要的角色,GSM网络的通信是否畅通,质量如何都与移动通信基站息息相关。。因此急切需要随时应对和管理故障/告警的上报的情况,通常,查找故障最主要的方法是查看告警,这样有利于基站的运行问题在最开始的状态就可以被现场的维护人员发现,并初步判定故障发生的原因,然后跟踪定位,检测测试,调换相应的设备等,能够很快很准的使移动站设备进入正常工作状态,也有利于对基站在特定的时间内进行维护。

参考文献:

[1]徐海龙.基于GSM系统的基站子系统(BSS)部分研究[J].科技广场,2010,9

[2]吕钱浩,姜文.中兴通讯:节能降耗构建绿色移动网络[J].通信世界,2007,45

告警数据 篇5

紫外告警技术是20世纪80年代末期国外出现的一种导弹来袭告警技术。紫外告警设备是飞机等作战平台用来对来袭导弹进行告警的一种光电探测设备, 它通过探测来袭导弹羽烟的紫外辐射来判断目标的威胁方向及程度, 实时发出警告信息。[1]由于紫外告警技术是保证飞机在存在“导弹威胁”情况下的一种能够保护自身安全的重要手段, 因此确保紫外告警设备工作正常, 是地面维护保障中的一项重要工作。机载紫外告警设备组成框图见图1。在飞机的地面通电检查过程中, 较容易出现“导弹逼近”的误告警现象, 经过故障排查及分析定位, 确定误告警问题基本是由两方面原因引起的, 一是设备自身故障所引起, 二是周围环境紫外干扰源引起。设备自身的故障本文不做深入讨论, 现只针对周围环境紫外干扰源引起的误告警现象进行原因分析。

二、故障原因分析

紫外告警设备工作在日盲波段, 在自然背景环境下虚警率极低, 因而在国内外大量装备, 但紫外告警设备在受复杂人工干扰源影响时会产生误告警, 在国内外型号装备中均有体现, 在美国和以色列的紫外告警设备均有相关的问题报道。此类误告警问题可以通过数据的采集积累、算法优化及与机上信息相关来逐步降低, 但是无法完全消除。

飞机地面通电的周围环境存在的紫外干扰源一般为电焊作业产生。电焊的紫外辐射在光谱上存在与导弹发动机尾焰特征波段相同的部分, 在时间上表现为持续时间长、幅度随时间变化剧烈的特点;在空间上变现为分布源较多, 对于实时性要求较高的告警设备极易构成与目标相同的特征。虽然设备软件算法进行了滤除设计, 但仍有部分电焊干扰因信号特征的相似性而不能被排除, 所以产生了误告警。

三、国内现状及国外的技术发展

紫外告警设备从技术体制上可分为第一代概略型以及第二代成像型, 其主要区别在于探测器。[2]国内飞机紫外告警设备研制较早, 原目标检测算法相对不完善。同时, 误告警问题当时在设备上未体现, 原目标检测算法虽然对背景干扰目标有一定的抑制能力, 但不能完全抑制。国外的相关文献曾报道过通过相关飞机的机上信息来降低紫外告警设备的误告警的方法。可称为紫外告警设备第三代的发展方向。

美国的MAW-200型紫外告警设备采用先进的传感器滤波技术, 每个传感器可以分别跟踪几个目标, 并把空间和时间数据传送给控制器, 然后与实时惯导数据进行综合处理, 以补偿飞机移动、方位和高度的影响。控制器使用导弹类型识别算法, 确保虚警率低。[3]

四、解决方法展望

如果国内的紫外告警设备也能将飞机的机上信息 (包括惯导、高空无线电高度表和轮载) 引入到机载紫外告警设备中, 将这些新获取的机上信息与原有的紫外图像信息进行信息融合相关处理, 达到消除飞机在地面时的误告警和降低飞机在空中时误告警的目的, 同时算法中再增加对紫外像增强管故障所引起固定亮点的检测和剔除, 避免设备因此故障而发生误告警。此外还要引入地速和轮载信息到无源光电干扰设备中, 杜绝飞机在地面误投放干扰弹的隐患, 提高飞机在空中投放干扰弹的安全性。此方案在硬件上无需改变什么, 保持原样即可。在软件上预计是要升级目标检测算法和综合处理器的解算软件。为加强综合处理器对投放干扰弹的管理, 紫外信号处理器将接收到的轮载信号、相对高度、地速等机上信息发送给无源光电干扰设备, 其中轮载信号可通过硬件信号送给电源滤波盒, 其余的机上信息均通过软件信号发送给综合处理器, 综合处理器可以依据上述信息进行干扰弹投弹的综合决策, 进一步确保飞机投放干扰弹的安全问题。

五、预期达到的目标

我们展望问题解决方案的目标是彻底消除飞机在地面时的误告警现象, 杜绝飞机在地面误投放干扰弹引起的安全隐患, 同时减少飞机在空中时的误告警现象, 提高飞机在空中投放干扰弹的安全性, 满足飞机的作战使用要求。

摘要:飞机紫外告警设备可在作用距离内对导弹威胁进行逼近告警, 同时将威胁告警信息通过系统总线传送给电子对抗系统, 并可在显示器上进行显示。但在地面通电检查中, 紫外告警设备容易出现“导弹逼近”的误告警现象, 当飞机装载干扰弹并将干扰弹投放工作方式设为“自动”时, 如果飞机接收到“导弹逼近”告警信号, 干扰弹将自动打出, 存在安全隐患。本文对问题发生的原因进行深入的分析、定位, 并且从工作原理入手, 展望相应的解决方法。

关键词:紫外告警,误告警,紫外干扰源

参考文献

[1]李炳军, 梁永辉.《紫外告警技术发展现状》.激光与红外, 2007年10月

[2]张洁.《紫外告警设备的组成及工作特点》.航天电子对抗, 2002 (5)

现代民机告警系统综述 篇6

1 告警系统的定义

目前对于警告系统的定义还没有统一的覆盖业界所有范围的标准。人为因素专家Amy R.Pritchett给出的告警系统的定义如下:“警告系统是一个能够监控、发现和通告将影响操作人员近期活动 (据操控人员或系统设计师预测) 情况的电子机械系统。”

根据不同的范围及定义, 还有告警、警告、警戒及警报等不同的词语, 为避免与告警级别中的警告级别产生混淆, 该文内对Warning System的理解均使用“告警系统”这一说法。“警告”一词用来表示Warning级别的告警, “警戒”一词用来表示Caution级别的告警, 用以区别。Alert一词也通常理解为告警, 用与上述告警系统定义相匹配。

2 告警系统的发展

在迄今为止告警系统的发展过程中, 主要经历了两个阶段和三种模式, 下面作以简单介绍。

20世纪70年代中期以前, 民用飞机警告技术的特点是:独立仪表多, 各种信息分散而杂乱;告警范围不完备, 通常只能进行设备故障的 警告而没 有周边环 境形势的 警告, 更不能给出处置建议或指导;警告设备技术水平低, 设备可靠性及系统安全性相对不高。

20世纪70年代中期以后, 随着电子技术的巨大 发展和多 种探测技 术应用到 航空领域, 安全警告 技术出现 了重大突 破, 这就是电 子飞机中 央监控系 统或发动 机指示机组 警告系统 、近地警告 系统 、空中交通警戒 与防撞系 统 、预警性风 切变警告等。现代飞机 安全警告 技术的特 点是 :告警信息集中, 集成化、综合化程度高;告警范围全 面 , 不仅孟包 括设备故 障告警和环 境形势告 警 , 还包括文 字说明 、建议、指导等;设备技术水平高, 可靠性及系统安全性 高; 误报警率 显著降低; 人机工效飞速改善;高度自动化, 降低驾驶员工作负荷。

根据不同的告警作用, 告警系统主要有以下三种模式, 从简单的探测到复杂的化解机制。

2 .1 信息探测告警

如图1所示, 信息探测告警是最基本的告警模式。告警监控系统在采集到飞机或环境信息后, 将信息进行逻辑判断, 与限值进行比较, 当超出限值规定的告警门限值后, 判断告警级别及类型, 启动告警, 再通过驾驶舱告警输出设备实现告警输出。通常的做法是将监控探测系统的输入信号也一并提供给飞行员, 使告警和系统信息相联系的展现给飞行员。

通常情况下告警限值的设定由两方面来源。一种是设计系统时界定好的限值, 例如最大运行速度/马赫数。另一种限值是由飞行员在 特定环境 下输入到 告警系统 内的, 如场高和V1、VR等。

2 .2 危险探测告警

如图2所示, 作为危险探测告警模式的使用, 当多系统或多信息输入告警系统时, 首先进入预备告警阶段, 能发现有信号超出告警限值, 危险存在, 但信号告警应该怎么表示或者是否需要表示, 告警系统对多信息进行综合评定, 给出危险评估, 与预置的特定环境的告警限值进行比较。这些告警可能会全部、部分或者没有任何一个最终提供给飞行员。例如音响告警系统里面的告警优先级, 被抑制掉的音响告警的告警环境可能还是一直存在, 但是综合评估多告警音响发生时, 有更高优先级别的告警音响需要发生, 那么低级比音响告警的危险评估相对降低, 被抑制不产生音响告警。

2 .3 危险化解装置

如图3所示。最先进、最复杂的安全系统不光要具有告警的能力, 还应该具有化解危险的能力。这样告警系统就可以引导飞行员将注意力放在解决告警的方法上。例如TCAS告警能够给出驾驶员爬升或下降的指令, 近地告警可以发出拉起的告警指令。危险化解多用于状态变化较多的危险环境, 对此类危险很难事先做好准确、细致的程序设定, 还需要综合飞机多系统的综合因素考虑。

这三种模式的发展遵循时间科技的发展规律, 但是因为有些告警系统不需很复杂的响应控制, 所以现代飞机基本上三种模式共存的形式。

3 告警系统的功能

告警系统 的主要用 于唤起飞 行员注意;说明事件性质;指导飞行员采取正确行动。

3.1 注意力获取

告警系统最普遍的也是研究最多的作用是注意力获取作用, 即告警系统试图将飞行员的注意力引导到需要他们识别、分析和解决的信号偏差上。一般情况下, 假设飞行员能仔细分析和深思熟虑, 他们可能根据经验或对现实情况的了解对警告系统忽略或置之不理。

告警系统注意力获取的作用给驾驶舱配备了飞 行机组无 法提供的 持续监控 能力。如果要求操纵人员连续监控一个信号, 很易于产生厌倦和疲劳, 告警系统的通过不同级别、多感官的自动持续监控将操纵人员人为因素造成的影响降低最低。同时, 告警系统尤其能辅助飞行机组发现许多情况, 例如信号稍有的变化、飞机机组抽样调查之间的突然、快速的信号变化, 揭示灾难性、危险性或不可逆转情况的信号, 以上这些不良情况导致的巨大人员和/或经济上的影响要求设计时必须对其进行专门的监控。

3.2 飞行干扰

警告系统 通常是被 认为是个 安全系统, 用来探测没有被飞行机组发现的事件。为了防止因为漏报而造成的人员或者经济上的巨大损失, 警告的临界值通常会设置在不可能有漏报发生的点上, 但是代价就是有极高的误报率。

基于种种原因, 误警告会变成一种干扰, 从而导致 飞行机组 不做回应 、延迟回应、关掉警告, 或对警告系统产生怀疑直至忽视正确警告。

3.3 问题的最终裁决

正如飞行机组可能对告警系统过分依赖而不去监控有些情况一样, 他们也可能会在警告发生前“发觉”将要发生的问题, 但是还会 将告警作 为问题发 生的最终 裁定。

3 . 4 解决方法的评价者

大部分告警系统被认为是在非理想情况下发生时发出告警。此外, 告警的消失还能作为问 题何时被 化解的衡 量工具来 使用, 即作为解决方案的评价者。

3.5 超负荷工作

告警系统通常要将飞行机组的注意力引导到问题上, 有事告警会给飞行机组增加过多的工作量并干扰驾驶任务, 有时只是生理上的超负荷。由于告警的突出性, 飞行员很难对其置之不理, 而且还可能把告警项目放 在更重要 的任务的 前面优先 处理, 取消原有的任务管理和计划。但是在减少超负荷方面, 这种方法的有效性没有得到完全证实。

告警系统还可以作为期望的提示、任务管理助手、程序启动者、指令装置等的功能, 这里不做详细叙述。

4 告警系统的两种分类

告警系统的分类可以有多种方式, 最主要也是最常见的形式是按照系统分类和按照告警表现形式分类两种。

按照系统划分告警系统的分类方法可能会根据机型不同而有所差异, 但是按照告警表现形式划分的结果通常情况下不会有太大的区别。在该文的其他章节的叙述中, 均为将两种分类形式结合表述。下面按照这两种最常见的告警系统分类方式进行介绍:

4 . 1 按照系统划分告警系统

随着电子技术的迅速发展, 现代中大型民用飞 机航空电 子系统已 经高度智 能化, 有很多重要系统因为自身告警较多且独立, 并且安全级别很高, 适宜于在自身系统的独立计算机实现告警处理及发生后, 通过音响及显示系统实施告警。这一类的告警系统有地形提示和警告系统TAWS、交通告警与防撞系统TCAS等。

还有一种最常见的告警称之为发动机指示与机组告警系统 (EICAS) , 即空客的电子飞机中央监控系统 (EACM) , 也是通常情况下讨论最多的告警系统之一。EICAS是通过在驾驶舱某一显示器 (通常为多功能飞行显示或者发动机信息显示器) 的特定区域内显示不同级别的告警信息和重要系统简图的形式, 达到告知飞行员各系统非正常或正常状态告警及飞机不良构型的目的。告警根据不同飞机型号可达到数百条之多, 基本上包括了飞机所有系统的故障信息, 状态信息和特定飞行阶段的错误构型信息。

地形提示和警告系统TAWS能够有效的控制可控飞行撞地事故 (CFIT) 的发生。地形提示和警告系统TAWS核心是TAWS计算机, 计算机中存储了各种警告方式的极限数据, 通过计划当前航线并参考地形高度数据、障碍物数据和机场数据信息从而提供预测地形报警。地形提示和警告系统提供基于无线电高度表、大气压高度表、下滑道偏离和飞行配置信息实时输入的反应型地形警告。如果出现危险情况, 地形提示和警告系统将给出视频和语音的报警来警告飞行员。地形提示和警告系统具有在仪表板上绘制显示地形上升图的功能。各种模式都附带仪表板上的清晰的语音和/或视频的信息。

交通告警与防撞系统 (TCAS) 旨在作为一种补充手段, 帮助驾驶员探测附近有无飞机, 并确定其作为一种空域感者的可能性。TCAS与空中交通管制应答机一起联合工作, 为飞机提供附近空域飞机的飞行情况, 预测飞机之间的潜在威胁, 在飞机之间可能出现冲突时给予驾驶员告警, 避免撞机事件的发生。

更多的系统则是采取通过中央警告系统来达到告警的目的。中央警告系统为飞机绝大多数的系统提供通用的告警平台。当某一系统功能失效或构型错误需要通过告警灯和告警语音告知驾驶员时, 中央警告系统通过逻辑判断控制音响警告, 实现驾驶舱音响告警的发出, 并且/或者通过逻辑控制驾驶舱指示各面板上按钮灯的点亮来告知驾驶员各飞机系统的当前状态。早期的中央警告系统有独立的告警计算机, 专门用来进行告警逻辑的运算、告警语音的发生和按钮灯的控制, 随着航空电子的发展, 系统集成化迅速, 现代客机的中央警告系统的运算单元通常情况下驻留在中央计算机内, 而音响发出功能通常由音频综合系统实现。

在中央警 告系统的 警告灯控 制功能中, 包括用于通用告警的主警告按钮灯和主警戒按钮灯, 用来在遮光罩等最显著位置指示警 告级别的 告警和警 戒级别的 告警。

最后还有一个重要的方式是在主飞行显示器 (PFD) 显示的空速、高度等信息的告警。当空速或者高度在包线附近或者以外时, PFD的空速指示器或者高度指示器发出相应的 告警指示 并且必要 时有语音 告警。

按照上述分类特举Boeing787的一例。

Boeing787飞机的告警系统 (Warning System) 包括以下部分:

发动机指示和机组告警系统 (EICAS)

空速告警

尾翼撞击探测系统

起飞和着陆构型警告系统

模式控制板 (Mode Control Panel, MCP) 选择高度告警

机组告警监控

空中交通告警和防撞系统 (TCAS)

风切变告警

近地告警系统 (GPWS)

4 . 2 按照告警类型划分

告警级别的 定义要根 据功能危 险分析中相 应功能丧 失的危害 来设定 , 根据AMC25.1322要求, 在不影响飞行, 干扰飞行员操纵的情况下, 要尽可能采取多感官的告警形式, 从听觉, 多视觉, 甚至触觉发出告警信息。驾驶舱主要采取的告警类型为音响告 警 , 视觉告警 和触觉告 警三类 。通常情况, 除了触觉告警不建议单独使用外, 其他两类 告警方式 可以单独 告警, 更多的是相 互配合使 用达到最 终告警的 目的。

4.3 音响告警

通过采用在驾驶舱扬声器和/或飞行员耳机中发出告警音响的方式告知飞行机组此刻的飞机状态或所处环境。音响告警通常情况分为三种, 即语音 (Voice) , 引起注意的谐音 (chime) 以及离散音响音调 (Tone) , 一般称为语音、谐音和音调。

语音告警: 部分警告级别的故障或非正常构型在触发后, 包括TAWS和TCAS, 驾驶舱能会有合成的人声语音, 告知机组提请注意。

谐音: 在绝大多数警告级别和警戒级别的告警 发生之前 会有谐音 用于引起 注意。

音调: 发出特殊音调表明飞机一种特定状态。比如AP接通, 水平安定面配平等。工业界通常认为谐音并伴有告警信息显示或者是一个语音告警信息提供警告的方式优于音调告警的方式, 所以强烈要求尽量减少使用音调告警。但是如果熟悉并且/或者习惯了需要用到特定的音调告警时, 应该把音调告警的个数限制在4个以内并且要满足国际标准。

4.4 视觉告警

驾驶员85%以上的信息均来自视觉感知, 视觉告警也是最为重要的告警方式之一。视觉告警能及时获得驾驶员的关注, 并且不太容易引起误解, 反映的信息量相对能比较大, 范围广。视觉告警主要包含告警灯、机组告警信息和显示器上告警。

视觉告警通过不同的颜色定义不同影响级别的告警信息。

4.5 触觉告警

在飞机发出失速告警时, 不光有语音和视觉告警, 还会有振杆告警。但触觉告警通常不建议单独使用。

5 不同类型告警的功能组成部件

当某一功能丧失引发的危险会导致灾难性后果时, 需要警告级别的告警产生;当某一功能丧失引发的危险会导致危险的后果时, 需要警戒级别的告警产生。

5.1 警告

对于警告用于实现的告警和信息功能告警系统功能组成部件必须包括:主视觉告警, 视觉信息, 主音响告警 (语音信息或特定的音调) 。

一般认为, 仅有少数告警中, 主视觉和主音响告警不是必须需要的。

5.2 警戒

对于警戒用于实现的告警和信息功能告警系统功能组成部件必须包括:主视觉告警, 视觉信息, 主音响告警 (语音警告或特定的音调) 。

5.3 提示

对于提示用于实现的告警和信息功能告警系统功能组成部件必须包括:视觉信息-提示信息可能设置在飞行机组希望周期性查看信息的区域。

6 适航规定中的颜色标准

适航条款要求:通常红色和琥珀色/黄色为告警功能保留。除了机组告警功能, 这些颜色必须被限制使用并且不能影响到机组告警。

对于离散的灯和指示器, 红色和琥珀色/黄色的使用必须被专门的限制。规章将应用于这些颜色在告警系统和非告警系统的使用, 包括在显示器和其他指示器上。特别说明的是一个显示器不一定是一个独立的硬件, 可能包括一个恰当的隔离出来的区域或功能专门显示非告警功能。在驾驶舱内限制红色和琥珀色/黄色使用的目的是为了使这些颜色提供对相应的危险等级相匹配相应的及时指示。

参考文献

[1]王有隆.略论国产大型飞机安全警告系统的设计[J].中国民航大学学报, 2008 (1) .

[2]李景春.飞机语音告警系统的研究[J].沈阳航空工业学院学报, 2003 (3) .

[3]刘连生.增强型近地警告系统的特性及实现[J].中国民航大学学报, 2007 (S1) .

[4]刘长华.电子式中央警告监控系统技术特点分析[J].中国民航飞行学院学报, 2004 (2) .

[5]陶云刚.飞机座舱综合告警系统[J].南京航空学院学报, 1990 (4) .

[6]ARP4102-4-flight deck alerting system.SAE.Aeros-spce Group.Europe Office, 2007.

变电站无线测温告警算法 篇7

在对变电站运行设备的监测中,温度是一个重要指标[1,2]。温度过高会导致金属和绝缘材料的机械强度、绝缘强度降低,使用寿命减少,甚至会引起电气设备发热故障,导致事故的发生[3,4]。在目前的变电站设备温度监测方法中,基于无线网络的变电站设备温度在线监测与告警系统(简称无线测温告警系统)采用全自动化运行方式,相比传统使用红外温度探测仪[5]或热成像仪的方法,节省了大量人力物力,且避免了需要定期监测的缺陷。该系统无需考虑布线问题,相比使用有线线路[6,7]的在线监测方法,减少了对变电站空间的占用。综合各方面考虑,无线测温告警系统将会被大范围推广。

但是,目前国内外对该类系统的研究集中于对系统整体架构搭建[8,9]和对数据获取的探索[10],缺乏利用所得温度数据对设备运行状态的分析和对设备潜在异常的告警处理。少数使用温度数据进行告警分析的研究[11],进行异常判断时往往只利用一个传感器的数据,告警阈值较固定,且告警等级仅有故障和正常2种,没有考虑传感器间的相互关系。

因此,本文提出了利用无线测温告警系统采集的设备温度数据,结合传感器之间的关系特征,对设备潜在故障及异常进行多类型、不同层次告警的5种算法,这对了解电力设备的运行状态,发现潜在故障,保障设备以及变电站的正常运行具有重要作用。本文所有的温度相关数据都采用摄氏温标。最后,本文使用上海青香变电站2011年实际运行数据对所述算法进行了验证。

1 无线测温告警系统概述

无线测温告警系统是基于无线网络的,用于测量、存储和查询变电站关键设备温度数据以及判断设备温度是否异常,并对潜在故障或者异常进行告警的变电站自动化系统[12,13]。本文所设计并实现的系统总体结构如图1所示。

无线传感器首先采集设备的温度数据,再通过低功耗个域网协议(ZigBee)无线网络传输至数据集中器无线数据接收端。在监控中心,前置采集服务通过串口总线与数据集中器串口端通信以获得数据,并将数据存储于实时数据库中;告警处理服务利用原始温度数据进行告警判断,并将告警信息存储于告警数据库中;一旦上述2个数据库有新的信息,即进行存储入历史数据库处理;数据查询服务和Web服务分别提供历史数据库中数据的查询和远程访问功能。其中,ZigBee规定的技术是一种近距离、低功耗且价位低的无线通信技术[14],符合变电站对设备温度测量的要求。考虑到变电站规模和运行环境,ZigBee无线传感器采用如图1所示的带有数据集中器的、基于总线型拓扑的混合型网络拓扑结构。

硬件上,无线传感器一般安装于变电站的关键或易于发热的设备上,典型的安装位置包括变压器接头、隔离开关动触头、高压电缆接头、高压开关柜动静触头、高压母线接头、电容器和低压电抗器引线接头等[15]。此外,考虑到对环境基值测量的要求,在室内和室外分别单独安置一个环境温度基值测量传感器。为了更清楚地描述传感器之间的位置关系,把安装于同一设备的所有传感器称为传感器组;把安装于同一设备并处于相同相位的多个传感器称为测点组。

2 告警处理分析

根据对无线传感器所在位置、相位以及传感器本身工作状态的分析,本文提出以下5种告警类型。

1)单一传感器告警

针对安装于关键设备处和易发热位置处的每个传感器进行告警。每个传感器根据历史数据和本身所在设备的属性,如设备发热程度、快慢,通过设备的电流大小,所处环境温度值等,都会有相应的安全运行阈值。一旦实时数据超过该阈值,即可以认为该设备进入潜在的不正常运行状态,需要进行告警处理。

具体地,采用单边上行的三级告警模式,告警等级分为高级、中级、低级告警3种,各对应一种告警阈值。判断时,通过对比当前温度与三级阈值,决定所处告警等级。一旦系统处于任意告警等级,当且仅当当前温度低于最低阈值3 ℃以上才能恢复至正常状态。

采用本告警可以更加准确地描述设备运行状态。单边上行以及正常态恢复阈值整定可偏低,使传感器尽量处于较高等级告警状态中,防止漏报。最后,针对设备温度处于某一阈值附近振荡的情况,可以防止系统连续多次发送冗余告警,减少系统存储和工作人员工作量。但是,如果阈值整定不当,可能会导致系统产生过多的低级告警误报。

2)测点组差异告警

针对测点组中传感器间温度数据的差异进行告警。安装于同一设备并处于相同相位的多个传感器的温度值如果相差过大,则可以认为该相出现异常。

具体采用滞环控制[16]模式,将测点组内每个传感器与其他传感器均值的差值与给定阈值进行比较,并且为了防止漏报,恢复正常的阈值比进入故障的阈值低。即触发告警的条件为:

|Τi-1Νji,1jΝΤj|Δup(1)

恢复正常的条件为:

{|Τi-1Νji,1jΝΤj|<ΔlowΔlow<Δup(2)

式中:N为测点组中传感器个数;TiTj分别为测点组中第i个和第j个传感器温度;Δup和Δlow分别为告警阈值和恢复阈值。

采用本告警,可以识别出测点组中传感器间的较大差异,以便及时发现隐患。由于动触头,如隔离开关的两侧触头,一般长期暴露在户外,容易发生老化、弹簧疲劳和锈蚀,会引起接触点压力减小、接触电阻增大和温度上升,最终可能烧坏刀闸,因而本告警适用于动触头两端。但是,同设备同相安装多个传感器也增加了系统的成本。

3)相序间差异告警

针对处于相同安装位置的不同相别的数据差异进行告警。正常情况下,相同安装位置上不同相间的温度应接近。而异常情况下,如单相或两相故障或工作不均衡时,三相相间电流都会有所差异。例如:单相异常时,故障相电流偏高;两相异常时,正常相电流偏低。电流的不平衡表征在设备运行状态上,则是三相温度的差异。

具体地,采用滞环控制模式,针对任意相,将该相温度与其他两相平均值的差值与给定阈值进行对比。触发告警的条件为:

{|Τi-Τm|ΔupΤm=Τj+Τk2i,j,k{A,B,C}ijk(3)

式中:Ti,Tj,Tk为A,B,C三相中某一相温度。

如果每相传感器数不为1,则首先求取每相数值的代数平均值,再进行上述判断。采用相序间告警,可以对相序间工作不平衡进行预警,及时发现设备单相或两相潜在的工作不平衡,甚至故障隐患。当然,由于每相都安装传感器也增加了系统成本。

4)传感器组告警

针对一个传感器组的所有传感器之间关系进行告警。处于同一设备的多个传感器,即使没有一个超过低级阈值,但是若整体全部接近低级阈值,则该设备也有可能出现过热问题。本告警类型即针对该情况。

定义每个传感器的温度值与阈值之比为该传感器的危险因子:

{δα,j=Τα,j+273tα,j+273α{A,B,C}1jΝ(4)

式中:δα,jα相第j个传感器的危险因子;阈值Tα,jtα,j分别为α相第j个传感器的温度和阈值。

同样地,采用滞环控制模式,仅列出触发告警的条件为:在所有传感器本身正常运行的条件下,

αjδα,jδup(5)

式中:δup为危险因子阈值。

本告警考虑处于相同设备的几个传感器之间的关系,为前面3种告警类型的补充。防止了上述特殊情况的发生,可以更早发现设备运行异常,以保护设备。

5)传感器自身异常告警

针对传感器本身的异常行为进行告警。传感器在运行过程中,可能因为电池电量不足、所在环境过于恶劣等原因导致自身工作异常,如长期显示0、数据异常大等。异常的传感器会导致大量误判,扰乱整个系统,因而系统需要及时切除该传感器。理想的情况是传感器一旦异常会自动发出异常信号,但是很多传感器都无法做到这点。因而,这里采用2种极端保守的方式,一旦传感器6 h都连续为0(前提为系统可以正常工作在零下温度区间)或者超过本设备上其他传感器最高值50 ℃,即认为该传感器发生自身异常,系统进行告警,并对该传感器进行切除。

3 各告警类型阈值的整定

传统告警系统中,通常采用固定阈值的方式,即避开状态正常运行的最大值,但由于温度数据随季节和昼夜更替变化较大,固定阈值会导致大量低温季节或夜间温度过高异常的漏报。为此,需要对上述4种类型进行分析,根据告警类型的特点,各自采用不同的阈值整定方法进行整定。本文提出如下的浮动阈值整定方式。

1)单一传感器告警

采用温度的绝对值进行判断,受温度本身变化特点影响大,因而需要进行阈值的浮动。本系统采用与环境基值线性相关的函数来整定阈值。此外,如果环境温度已经过高,那么设备阈值不可以再随环境温度值提高而继续增大,否则可能导致漏报,即设备温度超过自身承受范围也不告警。

按照上述分析,可以得到浮动阈值整定函数为:

te+ηl≤TBM,

{Τmin=te+ηlΤmid=te+ηmΤmax=te+ηu(6)

te+ηl>TBM,

{Τmin=ΤBΜ+ηlΤmid=ΤBΜ+ηmΤmax=ΤBΜ+ηu(7)

式中:Tmin,Tmid,Tmax分别为传感器的低级、中级和高级阈值;te为该传感器所在环境温度基值;TBM为设备可承受范围上限;ηl,ηm,ηu分别为不同设备的低级、中级、高级裕度参数,与设备性质和电流值大小有关系,在起初没有历史数据时一般分别取值为5,10,15 ℃。

2)测点组差异告警和相序间差异告警

使用的是温度数据差值,而不是绝对值。计算2个传感器之间差值时,由于用于作比较的传感器处于相同环境中,温度数据随季节和时间的变化近似抵消,因而可直接使用固定阈值进行整定。

3)传感器组告警

由于使用实时数据的热力学温度与低级阈值的热力学温度进行对比,因此,只需要低级阈值按上述方法进行整定即可,δup采用固定值。

4 数据模型的建立

按照上述第2节和第3节的分析,在进行具体算法研究之前,需要建立相应的数据模型,使用统一建模语言(UML)建立的数据模型如图2所示。

由图2可见,数据模型分为2级结构。

一级结构为传感器组和环境基值点模型。按照电力系统层级结构描述了传感器组所在位置,提高了数据查询速度,方便了数据的检索。同时,开放式的结构便于后续维护和扩展。环境基点模型的建立使每个传感器不必存储环境温度,避免了冗余。

二级结构的传感器模型首先描述了无限测温点的属性、所在相位、本相位编号、室内室外等;其次,出于浮动阈值的考虑,除了存储实时温度数据外,还存储了三级阈值数据,以方便单一传感器告警和传感器组告警对阈值的自整定;第三,为了后续扩展的需要,预留了对电气量的考虑,又由于对温度产生主要影响的电气量是电流,这里仅预留电流数据,方便后续系统中考虑电流,对阈值进行再整定;最后,为了防止阈值自动整定时出现异常以及满足人工对阈值松紧的要求,设置了专门的人工阈值导入位,以方便后续维护。

以上3种数据模型的结合充分考虑了各告警类型和浮动阈值对数据存储和查询的要求,具有全面性、通用性和可扩展性。

5 告警算法实现

本节针对5种告警类型,结合第4节的数据模型,提出相应的算法。系统算法的总体结构如图3所示。

针对已经提出的告警类型,本文提出如下对应的告警逻辑结构,如图4至图7所示。图5所示测点组差异告警逻辑结构仅针对测点组内传感器数不为1的情况。

6 无线测温告警系统的检验

本文提出的5种告警类型均在上海青浦区青香变电站成功运行。该系统包含关键设备处和易于发热设备处无线温度传感器共42个,环境基值点传感器室内、室外共2个。该系统运行10个月,每3 min进行一次数据的采集,数据采集、存储、查询以及各项报警正常。为了检验算法的可靠性,这里使用该变电站中 “220 kV电压”等级,“220 kV副母”间隔,“220 kV副母刀闸”设备上的6个传感器在2011年8月15日至21日间的数据进行检验。针对前4种告警类型,使用MATLAB对存储于Oracle数据库中的原始温度数据作图(测试时为了得到更多告警,阈值整定较正常运行时偏低)。单一传感器告警如图8所示。TBM取40 ℃,ηl取3.5 ℃,ηm取7.1 ℃,ηu取10.5 ℃。

由图8可以看出,固定阈值在环境温度偏低的条件下,无法对设备过热情况进行报警,因而造成漏报;在环境温度偏高的情况下,其会在全部时间下进行报警,造成误报。浮动阈值则使情形改善,其能根据环境变化自动调整阈值大小,准确地评估设备运行状况,比固定阈值更加准确地预报设备的温度异常。其他告警图见附录A图A1至图A3。测点组差异告警中,Δup和Δlow分别为2.5 ℃和1.5 ℃;相序差异告警中,Δup和Δlow分别为4 ℃和2 ℃。

具体4种告警类型异常次数统计如表1所示。

传感器自身异常告警没有给出,本段时间内并没有该类型告警。2011年12月,系统运行时由于当地气温较低,且系统本身串口通信没有设计负值温度的报文,导致传感器始终报0,系统对该现象进行了准确的告警,删除了坏点,使得工作人员发现该问题并进行更新。以上证明了传感器自身异常告警的可靠性。

7 结语

本文提出了利用变电站关键设备温度数据进行设备状态监测的5种告警方式和浮动阈值整定方式,并在实际系统中进行了验证。但是,在本系统对阈值的整定中没有考虑电流的影响,也没有参考历史数据。在未来的系统中,应该结合环境温度、电流数据、设备的运行状态等,计算得到更加准确的浮动阈值,并最终达到更加精确告警的目的。

附录见本刊网络版(http://aeps.sgepri.sgcc.com.cn/aeps/ch/index.aspx)。

摘要:目前,对无线测温系统的研究偏重系统的整体设计,缺乏利用所得温度数据对设备运行状态的分析和对设备潜在异常的告警处理。针对此现状,首先提出了5种利用温度数据进行告警的处理方式,并分析了每种告警方式的原理、作用和实现形式等;其次,结合各告警方式自身特点,提出了各自的阈值整定模式;之后,对其中2种告警方式提出采用浮动阈值模式进行阈值整定,规避了因采用固定温度阈值所导致的误报和漏报;最后,针对各告警方式提出了相应的算法,并在变电站现场成功运行,证明了告警方式及算法的可靠性。

直升机综合告警技术研究 篇8

直升机告警系统作为直升机的—部分, 主要用于反馈直升机系统故障、功能失效或出现的其他非正常条件等的警示, 提示飞行员采取相应的处置, 避免故障态下的不当处置损伤直升机甚至危及飞行安全。

通过直升机告警系统的一般构架, 对比阐述了综合告警的优点, 特别是在航电系统日益复杂的态势下, 综合告警相对传统的告警技术优势巨大。众所周知, 告警系统的负载程度与航电系统或直升机系统的复杂程度成正比。在现代直升机上, 系统分支细化, 其数量远大于早期飞机, 并且由于飞机系统变得更加复杂和先进, 故障管理和健康监控的需求在不断的增加。由于告警机制、系统和传感器数量的增加, 设计告警系统变得越来越困难, 从实际的经验来讲, 告警系统的复杂化, 在不断的挑战传统告警系统的构架, 告警信号之间的干扰时有出现。

目前我厂直升机告警系统普遍采用警告灯字幕的方式, 随着直升机系统复杂程度增加, 驾驶员需要关注的告警信息越来越多, 同时系统组件及机上安装越来越繁琐, 为了应对日趋复杂的直升机驾驶员与直升机告警信息交互界面, 需要深入研究直升机综合告警技术的特点及相关标准要求, 采用前沿的航空电子技术进行直升机综合告警技术革新。

2 告警系统构架

2.1 传统的告警构架

传统的告警系统主要由传感器、信号处理单元、警告灯 (或警告灯盒) 、音频信号发生器等组成。

2.2 现代综合告警构架

传统的综合告警组成复杂, 设备功能单一, 警告控制单元接收传感器探测的告警信号, 并分别转发给目视告警单元 (告警灯盒) 与音频告警子系统 (包括音频信号发生器, 音频信号处理单元, 耳机等) 。其系统各个子模块功能单一, 系统交联关系复杂。

综合告警的高集成度、高度综合化是发展的基本趋势。综合告警单元集目视告警单元 (告警灯盒) 、音频信号发生器, 音频信号处理单元等多种设备功能。

3 告警界面

3.1 传统的综合告警界面

传统目视告警界面主要以指示灯为主。

3.2 现代综合告警界面

现代综合告警界面, 系统探测到直升机的警告信息后, 在CAS页面反色显示告警信息, 并通过设置相应的操作开关, 来对系统显示的反色的警告信号进行确认, 确认后的告警信息变成常亮显示。

在没有确认的情况下, 如果直升机的告警信息消除, CAS页面显示的信息消除, 不再驱动CAS告警信息。

直升机综合告警技术实现了对直升机的告警信息的综合与优化, 借助现代直升机综合显示技术, 使直升机告警信息与直升机平台更好的融合, 极大简化驾驶员与直升机的交互界面, 提高直升机告警系统模块化程度, 使驾驶员与直升机的交互界面更为友好。

4 综合告警实现

直升机综合告警技术需综合直升机子系统的告警需求, 确定相关告警信号来源, 进一步制定告警及参数显示规则, 并将告警装置的接口与告警信号的格式进行协调兼容, 确保各个告警指示的准确、可靠。依据直升机综合告警相关标准及要求、界定直升机的告警信息的类别、明确直升机子系统告警需求, 制定告警控制显示规则, 形成可操作的系统设计方案、系统设计要求、规范等。具体如下:

确定直升机各系统的显示、告警参数与形式, 如发动机、燃油、液压、滑油、环境控制、灭火、飞行操纵、防冰和防雨、起落架、舱门、主旋翼传动等系统告警信息。

协调告警装置的接口与告警信号的格式。

按照告警控制规律关系, 进行综合告警设计。

4.1 告警信息包

告警信息包是综合告警系统实现的基础, 其内容应当包括, 告警信息内容, 信息的格式, 告警的等级, 显示的方式, 备份等基本信息。告警信息包依据直升机的实际告警需求来提出, 表1 为部分常用的警告级别的告警信息。

4.2 告警控制规律

依据告警信息对直升机的重要度等级来确定信息包信息的告警控制规律, 不同型号的直升机具有不同的控制规律, 这里仅提出以下通用的几类供参考:a.字符+ 音响;b.字符+ 音调;c.红色字符;d.琥珀色字符等, 注意模拟的声音的音频特性应当符合相关标准的要求, 以满足声音辨识度的要求。

结束语

从告警系统发展角度来看, 告警信息数量与直升机的先进程度是成比例的, 越先进的直升机其告警数量越多, 综合化程度越高, 人机界面更好, 我们有理由相信随着电子综合技术的发展, 未来直升机的告警信息将会包含甚至直升机健康管理等数据, 或者说这些系统会逐渐融合, 因此展开相关领域的技术研究, 对于提升飞机安全性, 交互性都具有十分重要的意义。

摘要:简述了直升机告警系统的架构。通过对比分析国内外各型号直升机的告警系统, 研究国内外先进直升机告警技术, 阐述了直升机告警系统未来综合化发展的设计思路与方法。

电信集中告警系统接口的实现 篇9

随着中国电信业的不断开放和变革,国内已形成了多家电信运营商的市场格局,市场竞争越来越激烈。以综合化集中维护为核心的维护模式,正是旨在建立面向市场的运行维护生产流程,依靠管理创新和技术进步走综合化、集中化维护之路。本地网集中告警系统的建设和完善是本地网综合化集中维护体系的第一步,是整个运行维护水平提升过程中一个最基础的重要的支撑系统。正是通过增强网络维护管理技术手段,将各专业联合作业,缓解网络监控人员数量少和各种操作管理系统众多的矛盾。利用系统监视网络运行情况,自动收集实时告警;利用资源信息系统进行业务关联,电子化流程管控系统快速传递并反馈管控信息,提高故障处理流程自动化程度,从而提高网络运行维护管理效率和水平。

2 本地网集中告警系统的提出和定位

通信网络集中告警系统功能涵盖了OSS资源管理与运营层面综合网管应用环境的“集中告警管理”和业务管理与运营层面业务故障管理中“综合业务(/客户)告警”功能。作为重要的后台支撑系统之一,通信网络集中告警系统和其他外部系统共同协作完成对业务保障的要求,系统必须拥有丰富强大的接口功能,提供开放、标准、规范的接口,除了和专业集中网管系统/厂商网管系统/网元的接口互连外,还和综合网络资源管理系统、前端系统、用户网管、服务保障系统、运维管理系统以及其他系统互连。

3 接口实现的难点

本地网集中告警系统是在包括传输、交换、数据、动力、计算机等现有各专业网管基础上,通过告警信息的采集、过滤、分析、处理,实现告警信息的全专业集中呈现及告警相关性分析,并为维护人员提供面向用户和业务的告警视图。由于集中告警系统直接面对庞大的的网络,不仅要兼顾着系统的可靠性和先进性,同时要具有开放性和可扩展性,在众多的接口中最重要的有以下两个方面:一是建立位于适配层面向全专业网络设备的统一接入平台,提供各类接口(属A类接口),对告警信息、性能信息进行采集、分析及规则管理。并采用统一的界面风格,采用一致的名词术语的操作界面,实现各专业网告警数据上报、告警的统一管理;二是与现有网络资源系统的接口,实现和资源管理系统数据动态接口(属B类接口)。集中告警系统需要的资源信息包括两大方面:一是集中告警系统需要资源系统的网络拓扑信息,以支持告警域内、跨域关联分析;二是与现有资源管理系统、集中告警系统、需要资源系统的资源业务客户信息,以支持告警定位、告警和业务客户关联。

4 接口实现难点的解决思路

4.1 搭建面向全专业网络设备的统一接入平台

统一接入平台位于系统中的适配层,它直接面向全专业网络设备,从专业网管或网元为系统提供实时动态数据、实时信息和实施平台,是本地网综合化集中告警系统实现对数据的综合分析和界面展现的基础。它不论从硬件对接,还是软件部署都是整个系统最为复杂的。在实际的建设中,普遍有两方面的难点:一是由于中国电信运营商拥有国内规模巨大、设备类型“最全面”的网络,同时存在不同时期建设、不同标准的各类设备,网元和网管系统纷繁复杂,要求各种设备进行改造升级,采用统一协议是不现实的,所以必须要求综合化集中告警系统去适应现有网络,进行综合接入存在比较大的难度。二是由于是全专业的集中,在日常运行维护中告警信息的种类、数量非常大,往往使监控人员同时面对大量告警列表,无法把精力集中在重要的告警上,也就很难快速精确定位到对应的告警信息,造成监控效率低下。同时,告警系统本身也消耗大量资源在告警的采集和呈现上,一般表现在监控人员在确认/删除告警、告警信息刷新和检索的速度感觉慢,也就是在告警系统上最基本功能———告警呈现方面不尽如人意。

对于上述问题,在系统建设时可以采用以下解决思路:

4.1.1 提供支持多种协议和接入方式的告警采集接口

告警数据采集模块需要完成对各网元管理系统、专业网管系统的数据采集工作。按照本地网综合化集中告警系统网络管理范围,在告警接口采集方面,归纳起来主要采用了数据库、CORBA、ASCII、SYSLOG及SNMP方式等。在实际系统建设时,我们除了要关注这几种接口的实现方式,即保证其可用性外,为了保证系统呈现的信息能及时、真实反映网络运行情况,还要重点解决其完整性问题。下面就这两大方面阐述各类接口实现思路:

1)数据库方式接口。实现方式:数据库接口方式主要是通过分析厂家网管数据库结构,在相关的告警表或历史告警表上创建触发器,并创建告警数据临时存放表,当厂家网管数据库中有数据入库或数据发生变化时,会将新的数据或变化的数据反应到临时告警数据存放表中,采集机会定时向厂家网管数据库中的临时告警存放表中取到数据,并转发给中心服务器数据库,当插入中心服务器成功后,会清除临时告警存放表中相应的数据。完整性保障:数据库接口获取数据的实现方式是轮询,存在轮询间隔(通常设置为一分钟),根据提供的轮询对象表的不同,分为三种情况:告警日志表、当前告警表和历史告警表。

2)Corba方式接口。其一,实现方式:Corba方式主要是利用被管理设备的网管服务器提供的Corba服务,接入步骤如下:调通网络,使采集机可以和网管机网络连通,由采集机编译厂家提供的idl接口文件。然后根据接口文件做适配器联接网管取得告警和配置信息;其二,完整性保障:CORBA是成熟的标准接口,协议本身提供保障。

3)ASCII接口方式。其一,实现方式:这种方式主要利用被采集方提供的Socket服务来取得需要的数据然后进行适配。格式化后转发至中心服务器数据库中。以斯凯文交换网管数据采集为例,接入步骤为:调通网络,使采集机和斯凯文网管提供的代理服务器连通;按照斯凯文提供的接口文件,建立到斯凯文代理服务器的socket连接;程序通过读取斯凯文代理服务器的告警信息分析告警数据;其二,完整性保障:TCP协议方式保证了网络连接的可靠性,发生接口中断时可感知。因此,选择使用TCP协议方式后需要附加的机制较少。

4)SYSLOG接口方式。其一,实现方式:网管系统将告警数据写入LOG文件,而综合化集中告警系统通过读取该LOG文件获得数据;其二,完整性保障:类似数据库方式,LOG文件也分为告警日志文件和当前告警文件两种情况。

5)SNMP接口方式。其一,实现方式:SNMP接口是采集方与被采集对象都遵守相同的格式来接收和发送数据;其二,完整性保障:SNMP为应用层协议,是TCP/IP协议族的一部分,作为成熟的标准协议,该方式本身提供了较强的保障。集中告警系统告警数据采集模块是一对多的关系,在日常运行中往往会受采集链路阻断、采集对象软件进程(数据库)异常等各种因素的干扰,导致告警采集、处理时出现非预期结果,所以该模块应具有处理各种非正常状态和事件的能力,即要提供告警信息采集的容错性,才能进一步保证集中告警系统的正常使用。

4.1.2 规范集中告警系统的告警处理规则解决告警数量大的问题

同时要满足集中告警系统能体现网络实时状态的要求,应在集中告警系统中规范集中告警系统的告警处理和告警分级别呈现的规则。具体实现思路为:首先,设立分层过滤机制;其次,在实现系统对告警的过滤后,实际网络运行当中,还会出现一定数量的有用告警信息的出现,大量消耗系统开销。

4.2 实现和资源管理系统数据动态接口

本地网集中告警系统进行告警关联分析,必定要和资源管理系统接口以获取相关资源信息、电路信息和用户信息,接口的实现有三种方法:非实时中间表、实时查询接口、嵌入式查询模块。

基于减少现有其他系统的改造,而且实际网络运行中,监控系统所需的资源信息的变更频度不会很高,所以将非实时中间表的接口方式作为两个系统的标准接口。非实时中间表的接口实现方式是:非实时、定期地将空间资源、设备资源、逻辑资源和业务资源的对应信息输出到接口中间表,集中告警系统可以根据定位的故障点和接口中间表来分析和定位告警对业务的影响。这种接口方式下,定义一套严格标准的中间表是至关重要的,我们以目前应用最多的传输专业资源数据为例,说明中间表所需的资源数据。设备资源:网元、插盘、端口;逻辑资源:段、传输系统;业务资源:传输电路、端口业务对应表、电路路由、电路变更表;空间资源:区域、局站、机房;基础数据:客户、工程信息等。它们在资源库的表名称和在中间表名称分别为:按照以上定义,资源系统输出资源数据到中间表前根据接口规范进行数据过滤,中间表数据和资源库中的资源数据并非完全一致。例如,输出到中间表的网元为资源库中的传输网元,而非资源库中的所有网元;输出到中间表的网元的信息也并非资源库中网元的所有字段信息,而是根据接口规范过滤的部分网元字段信息。在集中告警系统建设时,先配置相关的初始信息,再从资源管理系统提取所需数据。一次生成接口的中间表,接口正常运行后,就只在资源系统配置数据输出时间间隔等(一般在每天系统闲时)更新一遍数据;同步中间表中所有数据,集中告警系统所有数据均从中间表获得,而且是单向读取操作。

由于中间表是被动式更新,要求中间表接口机同步记录数据更新日志文件,用户可以通过集中告警系统查看接口状态和更新情况。同时集中告警系统还必须提供中间表的资源数据查询功能,便于进行数据一致性检查和同步检查。

有了与资源管理系统的接口,就能将来自各专业网的原始告警信息与相应的业务和客户信息关联,实现跨专业告警关联分析呈现功能,及时发现网络的根源故障,缩短网络故障的恢复时间。并能在此基础上通过客户等级、业务等级、各级大客户的服务方式与内容的分类,来管理和监控客户业务电路,使电信运营监控人员能够做到早发现、早处理,按照业务等级和超时预警级别的优先次序,保障业务电路达到业务差异化服务和SLA协议条款的要求。同时灵活地按照客户类型、业务等级提供客户障碍统计报表,帮助维护人员生成面向业务、面向客户的跨专业故障分析报告,实现客户业务故障的主动式管理。

5 结束语

本地网集中告警系统在OSS中的定位,决定了它要具有良好的系统扩展性,并能和其他综合网管应用互通,以形成统一的综合网管应用环境(平台)。所以系统能否高效、到位地发挥其功能很大程度取决于其他系统接口的实现,接口的重要性不亚于系统本身,必须在系统建设的同时按照规范进行细致的开发、配置,并不断完善。

摘要:文章从集中告警系统产生的背景和该系统在OSS中的定位入手,阐述集中告警系统与其他系统的关系,按照功能需求划分各类接口,并结合系统建设实际情况,选取两个重要接口提出具体解决思路。

关键词:集中告警系统,接口,解决思路

参考文献

[1]中国电信运维支撑系统(OSS)研究组.综合化集中告警功能规V0[1].2(本地网部分)[Z].2004(6).

[2]大唐电信.中国网通本地网资源管理系统用户手册[Z].2004(12).

上一篇:医院项目管理下一篇:诗歌实验