运维综合管理

2024-07-26

运维综合管理(精选10篇)

运维综合管理 篇1

0概述

电力综合数据网对电力系统高效运作有着不可预见的推动作用, 正如电力是国民发展的能源基础行业, 电力综合数据网管理也是架构信息化电力系统管理的基础平台。电力综合数据网虽然优点突出, 但弊端也是显而易见的。因此, 为推动电力系统高效、有序运行, 探讨电力综合数据网运维管理成为电动系统设备研究中必不可少的一部分。

1 电力综合数据网的特点

电力综合数据网由两个独立的数据网络构成———电力调度数据网和电力综合业务数据网。电力综合数据网络是为电力行业的信息化管理而服务的传输网络。主要具有以下三方面的特点:

1.1 网络覆盖广

随着电力企业设备管理水平的不断提高, 电力企业应用各类信息管理系统进行日常生产管理, 而综合数据网作为信息化业务的基础平台, 覆盖电力系统所有厂站、营业收费厅、办公楼等生产营业场所。

1.2 设备管理智能化

由于电力综合数据网的设备化管理, 管理人员通过设备性能参数的变化及时了解设备运行状态, 有故障发生时, 系统设备能够及时给出预警信号, 方便设备维护人员尽快做出相应的措施。

1.3 网络运维要求高

电力综合数据网对电力系统发展具有重要意义且优点突出, 但由于其承载了不同安全等级的信息系统业务, 网络安全性对于数据网的运行至关重要, 需要采取措施加强网络安全性。此外, 综合数据网全网规模庞大, 涉及范围大且不易轻易更改, 一旦内部人员的操作失误, 某一个小范围的变动都有可能引起全网瘫痪。因此, 电力综合数据网对网络安全机制、稳定性要求特别高。

2 影响综合数据网运维管理的因素

一个电力企业发展的基本原则是保证电力设备安全高效的运行。在规划管理的基础上, 充分运用现有的技术手段, 适当配置电力设备, 提高设备利用效率是电力企业发展的基本要求。基于以上的现状分析, 目前影响电力系统综合数据网运维管理开展的因素主要有以下三方面:

2.1 技术管理手段不强

随着电力企业的发展, 综合数据网网络覆盖范围不断扩大, 网络设备数量不断增多, 网络结构也越来越复杂, 各种不同类型的接入设备也越来越多, 网络流量不断增大, 网络行为也变得越来越复杂, 这些因素都导致综合数据网网络运维管理的难度和要求越来越高。而在实际管理过程中, 缺乏有效的技术手段支持, 仅靠有限的几个管理人员进行管理和维护, 管理工作非常繁重且困难。这严重影响电力数据网的既定效率。为了提高电力系统的运作效率, 加强电力数据网管理设备配置是必须的。如流量监控设备、网络设备操作审计设备的安装。

2.2 管理人员技术落后

电力综合数据网设备运行维护内容主要包括定期检测、故障处理、日常巡视和设备验收四类工作。要培养出全面的管理人才所需周期长, 从事电力综合数据网管理人员需要有较强的专业性及长时间的工作经验。管理人员由于掌握了电力系统中比较复杂、关键的技术, 在工作中发挥着比较重要的作用。若人员变动频繁, 不能保证管理人员整体业务水平的连续性。

2.3 数据信息分享平台欠缺

由于电力综合业务数据网承载了各类信息化业务, 日常运维中, 存在PC机、网络设备、安全防护系统、业务系统服务器等诸多维护界面, 需要协调与配合的部门较多, 网络维护部门应该将运行维护日常工作及任务流程化和自动化, 与其他相关系统用户实现部分管理信息共享。如XX电力企业通过统一信息平台, 实时发布最新综合数据网运行情况拓扑图, 并提供自助网络测试等功能, 进而为综合数据网运行维护提供透明化的整体网络运维管理。

3 综合数据网运维管理的发展前景

随着网络信息的不断发展, 电力行业也加强了网络信息化的建设力度。电力综合数据网主要依靠网络设备和网络架构的可靠性, 其高效管理以及安全运行是网络系统和业务系统正常运作的关键。目前, 由于综合数据网网络系统的结构复杂、规模庞大且承载业务种类多, 因此, 建设综合管理平台将是综合数据网发展大势所趋的方向。

3.1 加强技术管理手段

加强技术管理手段对提高综合数据网的运维管理效率至关重要。如部署网络流量监控设备能及时观察网络性能的好坏, 综合数据网网络流量的有效控制是确保网络稳定、高效运行的基础, 尤其是对综合数据网的设备互联端口进行流量监控, 能帮助判断网络故障及网络安全等状况。部署网络设备操作审计设备能加强网络设备管理的安全性, 可以实现网络设备动态登陆口令, 有效减少网络管理人员定期修改全网设备口令工作量, 提高工作效率的同时加强了网络系统的安全性, 而且还可以对全网网络设备操作行为进行监控和回放, 防止恶意修改, 协助误操作和故障分析。通过加强各种技术手段, 保证综合数据网络设备的正常运行, 一方面减少小故障引起连环事故的发生;另一方面减少设备大范围的损坏和维修次数, 同时也减少设备维护的费用。

3.2 加强综合数据网运维人员的素质培养

对电力综合数据网运维人员进行培训, 让他们具备熟练使用和维护系统的能力。由于电力通信系统装置的不断更新换代, 数据网运维人员继续学习也是非常重要的。但由于通信系统工作的特殊性, 运维人员工作一般任务繁重, 没有足够的时间进行后续培训和学习深造。因此, 电力系统相关机构应该做出适当的调整, 创造更多的培训和学习机会给运维人员, 提高他们的业务水平。特别是有新型设备更换时, 应组织一部分运维人员进行专项技术研讨和学习, 保证相关人员充分掌握该设备的原理、功能、特点以及运行过程中需要注意的事项等, 为设备稳定高效地运行做好充分的理论准备, 促进电力企业的发展。

3.3 加强信息共享措施

建设数据信息分享平台, 通过信息平台与网络管理系统建立链接, 实时发布综合数据网运行情况拓扑图, 各网络节点的用户可以随时登陆查看所在位置的网络运行情况。并在系统中向用户提供IP地址查询、MAC地址查询、网络稳定性测试、网速测试等功能, 通过上述措施加强与综合数据网用户的互动, 进而为综合数据网运行维护提供透明化的整体网络运维管理。

4 结论与展望

电力综合数据网为实现各类信息管理的高效化, 进一步提高电力系统可靠性提供了网络平台, 在变电站的运行中具有极其重要的作用。电力综合业务数据网是电力企业必不可少的保障手段, 是电力系统运行的关键, 该网络系统的完善度、先进性、安全性都直接关系着电力系统的运行。电力综合数据网运维管理并不单单需要理论知识, 还需要电力企业针对自身的特色, 采用有效的方法、配置适当的电力设备等, 及时掌握网络资源分享信息、业务流程、电力设备运用等实用信息, 以及设备运行状态、业务部署、数据综合处理等电力设备状态情况, 能够大大提升电力综合数据网的管理效率。只要我们正视电力综合数据网运维管理中出现的各种问题, 积极拟定改进措施并实施, 就能促进电力企业安全生产, 并进一步提高供电服务满意度, 适应社会对用电可靠性要求日益增高的形势。

参考文献

[1]卢江水.调度、变电与配电自动化系统关系的综述[J].北京电力技术, 2009 (02) .

[2]王修庞, 罗虎, 等.变电站集控运行管理模式探讨[J].继电器, 2008 (08) .

[3]高滨.电力系统主要电力设备状态检修策略研究[J].天津电力技术, 2002 (01) .

运维管理系统平台作用 篇2

关键词 :运维 标签 网络 信息

随着社会的网络信息化覆盖面越来越广,通信机房的设备越来越综合化、多样化,越来越多的远端机房的应用,机房的规模随之增大,面对大面积、远端的通信机房、众多的设备、大量的日志,传统的标签、书面记录、视频、网管系统的应用,传统的运维管理模式已经不能满足目前通信的实际需求,必须寻求一种现代化的软件来代替原有传统的运管模式,使得复杂、多样的运维管理能够简单化,从而提高故障处理、资料管理、数据查询、设备监管等工作效率。由此我们进行一些探索和尝试。

主要功能

1、站点导航

为使得长江沿线通信机房均能使用运维管理系统,软件考虑设计了站点导航功能,通过站点导航的图片,可以轻松地导航到长江沿线的各个机房,实时查看到机房内的资料,以及业务管理情况。

2、运维规范

任何工作都有其规章制度,规范、流程对于运维管理来说更为重要,如果期间出现差错,将会带来很大的损失。规范、流程应及时更新,在功能设计时,应该提供可更新、添加功能。其次,规范应能轻松进行查阅,当运维工作人员遇到紧急业务时,可快速查阅。

3、设备管理

通信机房,最重要的莫过于设备资料的管理,随着设备越来越多,通过原先的标签和文档来注明各种资料已经完全不能满足要求,一方面,资源不能很好地共享,经常出现设备资料只有固定的少数几个人掌握;另一方面,由于设备集成高,体积小,端口多且复杂,电路的来龙去脉比较繁杂;再则综合机房、远端机房温度偏高,随着时间的推移,端口标签经常会出现脱落现象,由此也给设备判断带来困难。

鉴于此,设备资料通过信息化管理更为合适,不仅能够解决上述困难,而且给运维工作人员减轻负担。

4、值班信息

值班信息主要功能是对机房日志资料的管理,通过包括值班记录和基础数据,值班记录是对值班信息的实时电子记录,实现用电子台帐来代替传统的文本台帐。利用电子台帐来进行管理运维日志后,可实现日志的数据库管理,可以轻松进行统计和查询,可方便实现月度、季度、年度或者任意时间段信息的统计,同时也提高值班记录的痕迹管理,加强了值班、维护人员的工作责任性和自觉性。

5、故障处理

维修记录主要实现设备维修的记录历史,各个设备有各指示灯对设备其运行状况、端口属性和特性指导作用,工作人员根据设备技术说明书、对其日常维护和故障处理经验,进行相应的记录,同时系统会自动统计该设备的出现故障的处理方式以及出现次数的多少,根据记录,当日后当再次出现故障时,可根据该系统功能模块进行逐一排查、比对,对其常见故障进行优先检测,从而提高故障的处理效率,缩短故障时间,减轻工作人员的负担。

系统展望

运维管理系统实现以上功能投入使用后将会大大提高运维机房的工作效率,但我们感觉到系统的功能要不断更新,不断适应现代化机房的发展需求,结合我们近期工作的情况,还探索要解决以下三个问题:

设备编码问题。目前通信机房的设备五花八门,新产品越来越多,如何对设备进行科学合理的分类,成为运维系统的一个非常重要的问题,面对沿江全线通信机房成千上万的设备,全部用设备名称加以区别显然不可行。必须通过科学的分类和编码手段进行标准编码。

通信机房的图形化管理。为让更多用户理解和熟练应用软件,界面必须友好、简洁。运维管理系统最能让工作人员快速上手的界面应该以图片导航的方式来实现,但图片实现相对较复杂而且不利于今后升级。

运维综合管理 篇3

“智能建筑”是一个不断发展的概念,它的内涵与外延都随着时代的进步而发展,提供“用户感知的智能建筑环境”是我们对这个概念的理解重点。在智能建筑的运维领域,运维工作尚处于初步探索阶段。随着大楼越建越高,越来越复杂,这就使建筑物对智能化的要求也越来越高,从而使得运维管理系统成为信息化不可缺少的重要组成部分。从长远来看,运维管理必须采用计算机信息技术管理手段,来进一步提高管理的质量和效率。

智能建筑综合运维管理平台是一个以互联网为基础,企业用户为目标,集呼叫中心、设备管理、运行监控、报警管理、能耗管理等功能模块为一体的综合性服务平台。该平台依托于快速发展的公众互联网络,基于云计算技术,通过“云”服务平台对分散、独立的企业建筑运维管理过程中产生的实时监控数据、音视频数据、管理数据、空间地理信息以及其他图纸、资料信息进行集中存储、集中处理、集中分析。

2国内外发展现状

2.1国内发展现状

随着现代通信技术、计算机技术、自动控制系统、图形图像显示技术的发展,建筑智能化程度大幅提高,建立整体、综合运维管理与服务体系已势在必行。目前智能建筑管理平台一般可以划分为三个层次,第一层次为子系统的纵向集成,目的在于各子系统具体功能的实现,如对BA子系统而言,制冷站、换热站、变配电系统等智能化设备需要与整体BA协同工作,以保证BA的正常工作。第二层次为横向集成,主要体现各子系统的联动和优化组合,在确立各子系统重要性的基础上,实现几个关键子系统的协调优化运行,报警联动控制等增值功能。第三层次为一体化运维管理,通过信息集成使得各应用系统之间以及系统、信息、组织、管理之间实现高度融合和协调运行,使得不同应用项目可以满足与建筑内的设备、办公、信息沟通、管理和服务的全面需要。

国内约有十余家系统集成商或专业智能化管理软件开发商在研发推广建筑智能化管理平台,国内市场上也出现了几个较为成功的系统平台,但多为单一的运行监控功能,强调智能化系统的堆砌,忽略用户的实际需求,其系统无建筑能耗统计分析以及建筑设备运维管理的功能,无法对智能建筑内所有设备的能耗、档案、运行、维护、保养进行管理。建筑机电设备的运行监控只有二维的组态图,一旦设备发生故障报警,在监控系统上无法及时发现故障设备的所在位置。虽然也有企业在推广功能单一的建筑信息管理系统或建筑物业管理系统,但一般皆为不同企业研发,难以在统一的综合运维管理平台上进行管理。此外,目前大多数产品采用单个工程研发、实施的方法,平台产品通用性较差。

2.2国外发展现状

国外的建筑智能化监控主要是以BA系统为核心的建筑物自动化与管理系统,具体做法是以楼宇自动化系统为平台,利用开发硬件网关技术将各系统进行互联,形式上为业主完成了一体化管理方案。但是由于受到基础软件平台的限制,许多功能无法实现,内容也受到很大的限制,不能很好地实现运维管理的目的。另外,由于目前楼宇自动化系统的通讯速率问题、网关协议的专用性问题,在使用效果、与未来新技术衔接上也存在着弊端。

3 平台现存问题分析

目前,公共建筑机电设备运行、维护和管理存在以下几个问题:

3.1 智能建筑信息化程度较低

重硬件、轻软件是当前智能建筑行业非常普遍的现象,很多客户还存在认识上的误区,认为买一大堆“高大上”的设备,企业运维管理的信息化系统自然就有了,企业信息化管理水平也就自然提高了。其实不然,现在大多数企业运维保障工作主要以人工纸本做记录,事件处置过程无法做到全程、实时掌控。事件从接收、分发、处置至用户反馈各个环节,都没有找到一种有效方法进行监督和管理,经常出现处置遗漏、虚报、瞒报等各类问题。

3.2 智能建筑运维管理机构臃肿

企业后勤管理有动力、总务、安保、保洁等部门,不同单位其后勤管理团队大小不一样,但在整个公司占有的比例都不小,小则几十个人,大则几百人,这些人员普遍年龄偏大,文化层次不高,越来越不适应企业运维管理,建筑运维管理机构越来越庞大,管理方式也越来越跟不上时代发展,越来越成为企业的沉重负担。

3.3 智能建筑运维管理成本居高不下

后勤人力资源、设备维修保养、设备升级更新、能源消耗等各方面成本,对一家企业来说,历年居高不下,而且随着环境的恶化、极端气候变化多端,这些成本呈现逐年攀升的趋势。其根本原因是员工的文化水平、管理思想、专业技术水平没有与时俱进,仍停留在十多年前的水平,尽管设备变得高档了,信息化程度变得更发达了,但是管理理念没有变化。所以,设备故障处理不及时、设备维修保养不善、设备运行调度管理不合理、节能降耗不落实,导致设备使用寿命缩短、建筑安全性降低、能源消耗大、环境污染加重等严重后果。为了改变这种现状,大多数企业的处理方式是设备更新换代,推陈出新,直接导致企业的运维管理成本越来越高。

4 平台架构及主要功能

应用GIS、3D、管控一体化等先进技术,基于云计算技术,通过“云”服务平台对建筑运维管理过程中产生的实时监控数据、音视频数据、管理数据、空间地理信息以及其他图纸、资料信息进行集中存储处理分析,将建筑能耗分户计量数据、建筑环境参数监测数据存储于实时数据库,以数据作为建筑能耗统计分析的基础,形成各类直观形象的柱状图、饼图或曲线图等,展现建筑能耗统计的可视化结果,从而达到智能建筑运维综合管理目的,实现节能降耗。

4.1 系统架构

智能建筑综合运维管理平台按照标准的SOA架构模式进行设计:

4.1.1 数据层

包括实时数据库、历史数据库、基础数据库、综合业务数据库、2D/3D空间数据库等。其中,从自动化监控设备采集到的实时数据,一部分通过专门的数据通讯协议,经过加解密操作后,直接与前端的HTML网页、GIS地图、三维模型、Flash组态等进行交互,实现远程管理与控制目的(仅限于按行业标准,远程可控的设备),同时,将实时运行信息保存到历史数据库,用于后期数据查询分析。另外,根据业务需要,一部分实时信息经过数据传输交换协议与综合业务数据库进行交互,便于运维管理。

4.1.2 业务支撑层

包括通用的组件和服务,如:安全服务、通讯服务、数据服务、流程服务、消息服务、文件服务等。

4.1.3 基础服务层

将智能建筑运维管理平台的各种功能模块,按照SOA标准封装成一个个的服务,如:设备档案管理服务、报警管理系统、自动化监控服务等,上层的业务管理系统只需将这些服务按照一定的规则进行调用、整合、连接,成为功能完整的业务管理系统。

4.1.4 业务层

将下层的基础服务按照用户的业务需求进行组装、整合、连接,包含的业务子系统有:运维监控管理、设备管理、报警管理、报表管理以及其他子系统。

4.1.5 UI层

充分利用网页开发技术、二维GIS技术、三维建模技术、Flash动画技术等,将系统的各种信息形象、直观、动态地展示出来,为系统带来良好的用户体验。

4.2 系统的主要功能

智能建筑综合运维管理平台应用系统包括运行监控系统、设备管理系统、巡检系统、报警管理系统、能耗管理系统、应急指挥系统、数据分析与辅助决策系统、客户服务系统。

4.2.1 运行监控系统

通过信息交换和共享,将智能建筑内若干个既相互独立又相互关联的系统,按照建筑智能化的要求,集成到一个带有实时数据库的、统一协调的运行监控平台,对各子系统设备的运行数据和运行状态进行高性能的实时监测、采集、整理、分析和储存,并对异常情况进行报警。

4.2.2 设备管理系统

设备管理系统将设备管理的各种工作要素有机地组成一体,把设备管理的组织体系、设备资产管理、设备运行和维护、备件管理等纳入一个优化的管理体系中,高效地建立设备完整的基础档案和技术档案,实现建筑设备从设备建档、设备安装调试,到设备运行监测、定期的维护保养,再到设备报警/故障维修,最后到设备报废的全生命周期管理,包括设备档案管理、故障维修管理、巡查养护管理、备品备件管理等功能。

4.2.3 巡检系统

巡检系统基于GIS地图、Web网络、移动端智能手机以及GPS定位技术为建筑后勤管理部门提供一套全流程、精细化、标准化的设备巡检业务管理模式,实现巡检、养护工作的高效执行和管理人员对整个巡检工作的统一监管。

4.2.4 报警管理系统

报警管理系统是定义、监控、确认、处理报警信息的一套管理系统,系统以报警信息定义、报警类别、报警级别为基础,分析处理不同的信息,明确每条报警信息的处理方式和信息通知发布方式。系统按照柔性化的设计原则,针对不同职能机构的岗位职责划分,灵活制定不同的报警处理流程。此外,系统可以智能地处理重复报警、误报等常规报警管理难于解决的问题。

4.2.5 能源管理系统

能源管理系统从能源计量规划到优化控制,实现建筑能源运行监控管理、建筑能耗统计分析、初级用能策略管理等功能,并在建筑能耗模拟分析的基础上,建立建筑用能策略管理、能源审计评估管理、能源优化控制管理平台。

4.2.6 应急指挥系统

当建筑内出现火灾、踩踏等突发性事件或发生地震、洪水等自然灾害时,应急指挥系统全面提供现场的图像、声音、人员、应急物资、应急预案等各类信息,并依据采集的信息对建筑内的设施进行统一调度,对人员进行统一指挥,实现反应灵敏、协调有序、运转高效的应急管理体制,具备风险评估、监测监控、预测预警、智能决策、综合协调、应急联动与总结评价等功能,从而最大限度地减少突发性公共事件造成的损失。

4.2.7 数据分析与决策辅助系统

数据分析与决策辅助系统是对数据的搜集、融合、挖掘和分析过程,将分析后的数据以动态、直观的多维报表、图形形式展现给用户,为用户决策提供数据依据,以保证建筑设备高效、安全、经济地运行。

4.2.8 客户服务系统

运维管理系统的信息门户网站、IP呼叫中心提供基于Web技术和系统应用集成技术的统一物业服务信息接口,用户可以通过多种联络媒体和物业服务部门进行交互,包括投诉、保修、建议、查询、申请等各项业务服务,同时为用户提供多渠道信息交流和反馈平台,提高公共服务质量。

5系统关键技术

5.1 基于云平台的运维管理

云服务平台是一个以互联网为基础,企业用户为目标,集呼叫中心、设备管理、运行监控、报警管理、能耗管理等功能模块于一体的综合性服务平台。该平台依托于快速发展的公众互联网络,基于云计算技术,通过云服务平台对分散、独立的企业建筑运维管理过程中产生的实时监控数据、音视频数据、管理数据、空间地理信息以及其他图纸、资料信息进行集中存储处理分析。

5.2 海量多源异构数据挖掘

海量多源异构数据挖掘是将智能建筑的各种业务数据进行归类、整理及深层次分析,以得出对决策有参考价值的知识,具体包括:

多源数据预处理:从来自不同运行系统的数据中提取出有用的数据,并按数据类型和有效性进行清理,以保证数据的准确性。此环节中,以异构数据源的识别与转换装箱,高速并发处理海量数据,高效准确的过滤引擎为研究重点。

海量数据仓库是决策支持系统和数据挖掘应用数据源的结构化数据环境。其关键技术点为统一、可扩展的元数据模型,海量数据的存取及数据安全。

数据挖掘使用诸如神经网络、规则归纳等技术,用来发现数据之间的关系,做出基于数据的推断。数据挖掘的关键点在于可动态配置的规则引擎、自我学习能力、数据捕捞过滤能力。

多源海量动态信息知识的发现和非规范知识的处理分析与演化,从多源异构、复杂内联和动态演化的角度构建新的知识发现策略与方法,对海量知识进行提炼、排疑、融合、重组等处理,结合信息的动态变化规律定性和定量地分析知识的演化规律。

5.3 分布式实时柔性计算

提供面向云计算和虚拟化架构的分布式多任务调度及并行处理模型,根据任务处理量和优先级自动增加、减少服务来满足实时性需求。当超大任务的计算复杂性超出单台服务器性能时,将任务按多维度拆分为细颗粒子任务,由多个服务实例并行处理。

5.4 物联数据服务模型

物联网底层实时信息的获取是构建智能建筑的根基,物联网信息来源、格式、去向各异,需要对物联信息进行分类采集、数据汇聚、传输、协议适配、节点管理等处理。物联数据服务模型对智能建筑感知层的多种数据来源进行识别和采集,并自动对同类信息进行分类汇聚、定向传输、协议适配,最终存入基础平台所构建的城市基础平台各类数据库中,为上层应用提供可靠的实时信息支撑。

6 结束语

智能建筑综合运维管理平台是在建筑运行的各种子系统的基础上,打通上层管理系统与底层控制子系统连接,形成一个建筑的核心和中枢神经系统。通过对建筑设备的全生命周期管理,对设备实时运行信息的管理,特别是对报警和故障信息产生、维修、复原的自动化处理,保证了建筑的健康和安全;通过对主要建筑设备的用能统计分析,用能预警,利用一定的控制和管理手段达到建筑节能目的;通过业主服务支持监督系统,受理业主的服务要求,接受业主的服务监督,为业主提供舒适、温馨、便捷、高效的工作和商业活动环境。

摘要:科学合理的智能建筑综合运维管理平台是解决智能建筑信息化程度低、智能建筑运维管理机构臃肿等问题的关键。本文对智能建筑综合运维管理平台系统架构、功能、关键技术等方面进行了深入研究,意在利用管控一体化、云计算等先进技术,建立智能建筑综合运维管理平台。

关键词:智能建筑,运维管理

参考文献

[1]胡硕兵.加强运维管理推动智能建筑产业发展[J].智能建筑.2007,第11期:P10-12

[2]胡硕兵.建筑智能化系统运维管理探讨[J].智能建筑.2010,第01期:P47-49

如何构建有效的IT运维管理 篇4

传统被动的、孤立的、分散的“救火队”式IT运维管理模式,让IT部门疲惫不堪。而且,随着公司业务模式的复杂化和多样化,更带来IT运营环境的复杂性和不确定性。在IT运维系统时,IT部门普遍面临多种新的复杂的情况和问题。主要有以下几个方面:

(1)运维人员被动救火,工作效率低下

在IT运维管理过程中, IT员工工作太被动,只有当事件已经发生并已造成业务影响时才能发现和着手处理。这种被动“救火”不但使IT服务人员终日忙碌,也使IT服务本身质量很难提高,导致IT和业务部门的满意度都不高等。

其中比较典型的例如IT部门响应服务需求时没有相应的时间记录工具,或者因为各种原因导致工作人员不愿使用工具记录工作情况,这样不仅不利于处理过程的跟踪,更不利于知识的积累和知识库的完善。

(2)流程规范不足,没有形成闭环跟踪

在运维流程方面,很多企业IT部门还一直处于原始的基础状态。例如在事件处理流程上,存在以下几种典型的问题:①没有明确的事件升级标准,例如满足怎样的条件后,事件必须从一线转到二线支持工程师,再转到三线研发工程师处理。②没有事件的有限级定义标准,没有建立优先级和解决时限的关联关系,从而不能保证事件解决的实效性和 IT 资源的有效利用。③事件产生后没有明确而唯一的责任人,从而缺乏对事件有效的监控和跟踪机制。④没有对事件统一的 IT 服务管理受理的界面,没有事件完整记录、没有及时反馈。

这些都使事件/服务请求处理过程中没有形成严格的闭环管理;没有建立明确的重大或紧急事件处理流程,从而不能保证在相应事件发生后有效及时地处理。对事件处理过程的记录比较分散,随意性很大,没有控制。更没有严格规范的流程政策和控制手段,使之存在太多的漏洞。整体运行维护情况不能够一目了然,无法清楚地知道各位员工的工作情况和工作状态,从而缺少对流程有效的监控和跟踪。

(3)缺乏运维技术工具

企业缺乏诸如事件监控和诊断工具等技术工具,事件不能在技术工具的支持下得到主动、快速处理。事件和工作任务在分派过程中没有相应的技术工具记录所有历史信息,不便于跟踪和分析;配置管理信息没有相关工具支持,不能为配置元素建立复杂的关系、状态等属性和提供相应查询功能。

总的来说,目前诸多企业在IT系统运维方面并没有高度重视,前期规划仅为解决短期IT建设问题。但随着企业规模的不断扩大,IT系统涉及的设备种类越来越多,对全系统的运营和维护管理提出了近乎苛刻的要求,而相对的则是IT运维的原始和落后的现状。

建立IT运维管理制度,关键在于规范

我们可以看出,在企业信息化发展到一定阶段,IT系统建设重点应该要从系统实施转向以应用运维提升为主,运维质量保障、安全机制变得重要起来,这时除了技术的保障以外,制度保障越显得重要。

作为CIO,建立完善的IT运维管理制度是最主要的工作内容,是企业信息化有效执行和监督的立足点。由此,CIO应首先是一位管理专家,其次才是技术专家。IT部门本身管理不好,就不可能为业务部门提供满意的IT服务,业务部门对IT部门的满意度就会低,满意度低又会影响IT投资及新项目的开展,使IT部门陷入困境。所以建立高效规范的IT运维管理机制,是CIO走向战略管理的第一步。对于IT部门来说,可从以下几个方面来进行IT运维制度化。

(1)转变运维观念,树立规范化意识。树立制度化的IT运维意识,才能在日常繁杂琐碎的工作中有效区分任务的优先级,将有限的资源投入到最能满足“客户”需要的工作中。

(2)建立事件处理流程,强化规范执行力度。首先需要建立故障和事件处理流程,利用表格工具等记录故障及其处理情况,以建立运维日志,并定期回顾从中辨识和发现问题的线索和根源。建立每种事件的规范化处理指南,减少运维操作的随意性,最大程度上降低故障发生的概率。

(3)设立ITIL(信息技术基础设施库)服务台,引入优先处理原则。设立服务台以确定服务要求和IT运维目标,ITIL指南要求企业定义服务台的关键流程,不仅仅定义流程是什么,还包括它们是如何运作的,还要指出每个流程对企业有什么影响和意义。应用ITIL中的IT服务台及服务级别协议思想,保证例行的事有相关责任人进行处理;有了服务级别协议,制定事件处理优先级次序,就可把事件再细分为例行事件和例外事件。

(4)最后要引入SLA管理。SLA(Service Level Agreement即服务水平协议),IT部门应该自发给自己负责管理的系统或者客户服务建立一个能够量化的运维目标,这样不仅能够务实地提高服务质量和管理水平,也能够在目标达成后作为团队工作改进的成绩得到肯定,提高IT人员的工作成就感。

参照ITIL建立成功运维管理体系的三要素

从IT运维的现状和发展趋势来看,ITIL已经成为推进IT运维体系建设和日常操作管理的首要标准和“最佳实践”参照。ITIL是起源于英国政府自身IT管理需求开发的标准。对照ITIL的九层评估模型,可以发现许多企业目前在人员、流程、技术等三个方面存在很多问题。也就是说,在进行IT运维管理时,要在这三个方面齐头并进才能从总体上提升IT运维服务管理。

(1)人员组织:在IT运维中人员因素应该是首要考虑的因素。因为ITIL的应用实际上是一个管理活动,特别依靠人的积极参与来完成。在管理过程中,可能涉及到人员的职能、利益、思维模式、工作方式等的转换,产生的误解、消极和阻力不容忽视。因此,除了在制度安排、企业文化方面的工作以外,更要积极采取多方面措施诱导和疏通,包括服务意识培训、ITIL运维技能培养、发展规划和激励等方式。

(2)管理流程:运维流程设计是ITIL实施核心之一,它必须结合现状,既不是现有管理流程的直接转述和电子化,也不是完全依照最佳实践的照搬拷贝。①流程是分阶段的目标定义、设计、固化、评价和改进过程。②ITIL作为IT部门内部管理的流程,存在和外部流程的接口整合衔接的问题,需要在运维流程设计和流程自动化处理等环节中妥善解决。另外,还应该充分了解:运维流程既有需要严格执行的僵化一面,也有面向效果灵活变通的一面。

(3)技术工具:管理工具是指在IT运维管理过程中能够借助的用来提高服务质量和效率的所有工具的总称。对于企业来说,要特别关注两类工具:①IT运维监控和诊断优化工具;②流程自动化工具。这里需要提醒的地方是,许多企业特别重视IT运维工具本身,而常常忽视了ITIL所倡导的通过流程等制度约束和引导,才能更好地发挥效益。因此,即使没有引入ITIL运维流程以及电子化平台,也应该建立并利用一些必要的运维纸质流程和制度,否则难以得到很好的应用。

结论

总之,CIO想在IT系统运维过程获得最佳的效果,不是单纯通过项目建设能够达到的,高效IT运维系统是需要一个持续改进、不断优化的长期过程,IT运维管理制度化也必不可少。(作者单位系中国海洋石油总公司)

参考文献:

【1】左天祖. 中国IT服务管理指南. 北京:北京大学出版社,2004.

【2】朱海林、方乐. IT服务—管理、控制与流程. 北京:机械工业出版社,2005.

【3】陆康明. 基于生命周期的IT服务管理研究. 上海:同济大学, 2008.

运维综合管理 篇5

2008年初, 随着国家电网公司SG186信息化建设的深入、业务系统的不断上线, 一方面提供信息服务的IT软硬件的种类与数量不断增加;另一方面, IT软硬件的运行情况和企业各部门业务的捆绑越来越紧密。IT软硬件承担的责任也越来越重, 对信息部门的全系统安全、运营和维护管理的要求越来越高, 迫切需要有信息系统的监管系统对其进行支撑。

当前信息系统运维工作所依赖的技术手段主要包括:综合网络管理系统、安全管理系统、桌面管理系统以及信息运维流程系统。这些系统在各网省及直属单位分散建设, 建设程度参差不齐, 已经无法满足日益提高的管理需求。存在以下问题亟待解决:

1) 缺乏建设规划, 导致运维系统各类功能分散、重复建设, 相互之间的集成工作滞后:通常的建设着眼于当前的管理需求, 存在部分功能重复、数据冗余存放等等问题;

2) 分析功能薄弱, 难以支撑分析型管理、智能型管理:分析统计功能建立在各自的数据上, 各个运维模块间没有数据的交互与共享, 无法提供跨模块、多层面的数据分析与决策支持, 无法支撑分析型管理与智能型管理;

3) 上述系统缺乏统一的图形平台以提供丰富的可视化管理手段:缺乏IT软硬件的图档管理, 各种单线图管理等;

4) 业务应用运行的监控和管理薄弱:综合网管系统对电力专业应用的监管还停留在对应用进程状态监视等初级监控的阶段, 缺乏对应用的全面主动监管;

5) 安全运行管理建设滞后:防火墙、入侵检测系统IDS等安全产品得到了广泛应用, 但相互之间缺乏协作, 无法保证安全事件的及时发现、分析和后续响应;

6) 桌面标准化管理建设滞后:目前公司各单位普遍存在桌面终端资产复杂、桌面应用复杂、桌面接入方式多样化、终端用户人员复杂的现象。桌面管理的建设只在部分网省开展, 且无标准, 无法应对大规模桌面管理的压力;

7) 无统一的管理制度与操作规程:公司各级均制定了运维相关的管理制度与操作规程, 但公司层面无统一的管理制度与操作规程, 导致各级运维管理操作存在差异, 不具可比性, 无法在公司层面统一管理与操作。

在公司原有运维技术手段建设成果的基础上, 建设覆盖全公司的综合运维监管系统。打破以往孤岛型系统建设模式, 逐步形成横向集成、上下贯通的运维管理技术支撑平台, 覆盖包含网络、主机、业务应用、安全设备、桌面终端等的完整IT基础架构及标准运维流程, 实现“实时监控、精益管理、闭环控制、分析规划”目标。同时以SG186的应用系统运行为监管重点, 保障应用系统连续、可靠、有效运行, 建立稳定、高效、灵活的信息系统运行和维护管理体系, 为公司信息系统正常运行提供有力的支撑, 提高信息系统运行效率, 提高服务质量, 降低运营的成本, 为实现公司的战略目标提供坚实的基础支撑。

1 技术架构

1.1 建设原则

1) 统一技术架构、插件式设计。统一技术架构是建设综合的信息运维监管平台的基础, 是改变目前管理工具和管理信息的孤岛状态的关键。统一技术架构是指各个功能模块需要具有开放的服务接口和数据标准, 满足系统对该功能模块的功能性和非功能性需求。

采用插件式设计, 摆脱单一产品的依赖, 同时降低系统的总体风险。因为在插件式设计下, 单一模块的缺陷或者故障将只能有限地影响其他模块的功能, 而不易造成总体系统的崩溃。同时, 也为系统的升级换代创造了有利的条件, 在时间和资金允许的情况下, 可以进行各个功能模块的功能增强或者升级, 甚至在模块内重新整合, 插件式的设计结构将使得系统越来越强壮。

2) 统一采集、数据与展现。对所有的运行、安全以及资产数据采集采用一次采集, 获取所需要的原始系统数据, 数据会直接进入统一管理信息数据库或者经过中间层的处理汇总到统一管理信息数据库。其后的数据处理和数据提供将由统一的数据服务层负责, 可以提供各个功能模块多次重复使用。

构建一个逻辑上一致的管理信息数据库, 对外提供标准和规范的数据服务。在此基础上建立统一的设备编码, 这个设备编码将以资产管理信息数据库为基准。通过多张映射表或者调和表和其他的实体数据库进行连接。以实现准确访问同一设备的各种信息, 并能准确进行故障定位。管理信息数据库为上层应用提供统一的数据服务。

充分借鉴电网EMS系统的特点并进行进一步提升, 建立统一的展示引擎, 通过访问统一的数据服务层, 提供界面一致、信息完备的管理信息展示, 实现科学决策, 主动预防, 将信息系统的趋势尽在掌握。

3) 扩展性与规范性。具备很好的开放性和对标准的支持能力, 支持各种主流平台、数据库和中间件等。同时, 采用模块化设计, 有良好的可扩展性和伸缩性, 便于今后的扩展和分步实施, 并配合信息运维监管功能的扩展与深入, 保护已有的投资。

统一标准和规范, 集中监控管理系统与其他应用系统之间采用开放的接口标准, 便于信息交换、信息共享和业务协同。

1.2 技术架构

依据建设原则, 构建层次化的技术架构:数据采集和分析层、统一信息库、数据总线与图形平台。总体架构如图1所示。

面对IT基础架构层, 数据采集和分析层利用综合网管、安全监管、桌面标准化管理等3类成熟产品模块实现对网络、主机、数据库、中间件、业务应用、安全设备、桌面终端的配置数据、运行性能数据、安全日志和告警数据的采集。通过规范采集目标, 确保各类数据一次性采集, 尤其避免常规系统建设中网管、安管之间重复的数据采集。各模块采集的数据通过规范的数据集成接口, 上送到自主研发的数据总线, 由其进行标准化处理, 并根据监控分析要求对数据计算处理, 转发并存储到统一信息库中, 同时为各基础采集模块及上层模块提供实时数据服务, 满足上层应用对各类数据的需求。

自主研发的统一信息库基于DMTF CIM标准, 并结合电力IT系统特点, 建立了适用于不同IT资源类型和不同IT业务应用的柔性资源模型, 以此模型及所创建的实例为核心, 通过数据总线所转发的数据实现了与各基础模块产品数据库之间的联邦和调和, 将各类资源的配置数据、性能数据、告警数据及统计数据、工单数据重新组合, 重构了以IT资源为核心的多维数据, 打破了各系统间数据孤岛。

统一信息库是系统的核心及关键, 保证了监控管理和流程管理的连贯性;突破了单纯以关键性能指标 (KPI, Key Performance Information) 监控运行的状况, 实现对被管设备从不同角度、不同层次的运行监控和运行分析。

从数据总线获取来自网络、主机、应用、桌面及综合的各类告警, 从而进行派单和处理, 并提供资产、知识库等管理功能, 使得网络管理小组、主机管理小组、桌面管理小组等不同管理人员具备相同的工作平台, 实现统一的协调调度和IT服务的规范考核。

最上层的图形平台通过提供基于Web的组态化图模一体的图形编辑工具, 为应用展示层提供底层的“所见即所得”的图形支持, 根据运维人员的个性化需求及不同运行监控的业务需求, 基于数据总线及统一信息库, 并充分利用页面集成技术, 提供了基于地域图、网络拓扑图、业务拓扑图、背面板图、3D机房图等的全方位、多层次、多视角的IT运维监控、管理界面。

2 功能与成效

2.1 系统功能

通过可视化、可配置的地区图、业务拓扑图、网络拓扑图、背面板图、3D机房图等, 对IT基础设施的软硬件资源进行管理, 实现网络拓扑自动发现、网络 (链路及端口) 流量监视和分析、主机运行状态和关键指标监控、数据库中间件运行状态和关键指标监控、业务模块的可用性监控、业务模块的应用深度监控、机房及机柜的状态监控等功能, 对主机、应用、安全设备的漏洞、安全事件及安全风险值实时监控, 对桌面终端的软硬件资源及安全接入进行监管, 并提供综合的事件分析、定位功能。通过固化的电子化流程, 规范安全运维日常工作, 提高运维效率, 提升服务水平, 最终保障网络、业务应用、终端的安全可靠运行和使用。具体功能框架如图2所示。

2.1.1 告警监管

告警监管的内容包括实时监视信息系统运行, 从发现告警到消除告警的全过程;包括实时告警、告警查询、统计分析、告警报表和告警规则配置等子功能模块。告警主要是指系统通过收集机房管理、网管、安管、桌面管理等模块的告警, 统一展示在告警列表上的信息, 是系统自动所获取的运行异常。告警可通过告警界面以声音、闪烁, 或邮件、E-mail、短信等方式, 通知负责实时监视的运维人员, 并进行处理。

2.1.2 性能监控

全面实时监管信息系统运行情况, 包括:业务监管、网络监管以及机房监管。

业务监管:监管包括ERP、营销、生产、门户在内的20多类业务系统的实时运行情况。通过运行情况与应用情况两类指标, 实时监管各应用的运行情况。

网络监管:实时监管网络拓扑结构, 网络设备运行情况, 端口及链路运行情况, VLAN情况, 主机、服务器的实时运行情况, 中间件、数据库的实施运行情况等等, 实现对信息网内不同厂商、多种类型设备的监控管理;实现对信息网上告警信息的定制、获取、处理和统计功能;实现对信息网上所有网络设备、主机、中间件、数据库及通用应用的性能数据的采集和统计功能;根据监测到的性能原始数据, 对信息系统运行状况、运行趋势等进行分析;提供灵活的报表定制功能, 针对电力企业特点定制开发报表。

机房监管:实时、精确、身临其境地实时监控机房状况。通过三维和多媒体视听技术的结合, 将常规无法看到、无法表现说明的产品结构技术功能以虚拟动态的形式表现出来。结合视频、动画、互动参与等表现技术, 生动、深入、直观地传达运维系统信息。监管效果见图3。

2.1.3 安全监管

为多种类型用户提供全网的安全信息和安全状态展示, 包括风险预警、告警事件、故障分析、策略发布、报表报告等数据分析和展示功能。自动资产采集, 探测网络中的资产及其资产之间的关联关系, 并自动生成资产库。以资产信息库的建立为基础, 实现信息资产、资产上的漏洞、资产面临的威胁以及相应风险的管理。

通过扫描装置或安全评估过程分析获得, 并对其进行管理。安全风险管理收集被管设备的各种漏洞和威胁, 并结合资产信息, 实现基于资源 (资产以及安全域) 、漏洞和威胁 (安全事件) 的风险计算分析。

2.1.4 桌面监管

桌面监管主要包括桌面资产管理、软件管理、补丁管理、安全管理。其中, 资产管理主要针对桌面终端详细的软、硬件资产现状及变更等进行管理;软件管理包括软件分发、配置管理、远程控制等;补丁管理包括操作系统的补丁报警及更新管理等;安全管理包括对病毒防范、安全准入、非法外联、安全评估、用户行为进行管理等, 从而支持对桌面终端完整的全生命周期管理。

2.1.5 运维服务

为信息运维人员提供电子化的日常工作流程管理工具, 并对服务情况进行监管, 包括对各类KPI的统计分析以及运维管理状态的监管。主要流程包括:事件管理流程、问题管理流程、变更管理流程、发布管理流程以及配置管理。

2.2 建设成效

通过为期1年半的研发与工程建设, 信息运维综合监管系统已经覆盖国家电网公司总部、30个网省公司、2个直属单位以及342个地市及二级单位。监管设备总数达46万台, 其中网络设备2万余台, 主机设备1万余台, 安全设备约1 000台, 桌面终端42万余台。

同时, 以应用系统运行监管为核心, 重点实现对国家电网公司900多个应用系统的运行及应用状况实时监控。截至目前, 已全面监管国家电网公司SG186工程的所有应用系统, 包括财务管理、营销管理、安全生产、协同办公、人力资源、物资管理、项目管理、综合管理、规划计划和其他业务等十大业务大类的30余个系统。已经接入业务系统的总量为900余个, 接入指标500余项, 每5分钟处理600万条消息, 每日业务指标数据量达400万条, 每天数据存储总量达200 M。成为国家电网公司所有下属单位的信息部门日常的运维工作的主要工具。

作为当前央企中建设覆盖范围最广、管理精细度最高、功能实现最完整的信息运维综合监管系统, 系统的建成为国家电网公司信息系统运行与维护提供了有力的支撑, 提高了运行效率, 提升了服务质量, 降低了运营的成本。

3 结语

SG-ERP以信息化助力坚强智能电网建设的过程中, 国家电网公司IT基础设备及业务应用的覆盖面将更广, IT系统的实用化程度将更深, IT设备及IT系统的相互集成度也将更高, 安全性要求也将进一步提升。

各运行单位的IT维护日益复杂, 安全性、审计和治理的要求日益增加, 依从性要求越来越严格, 从而对信息运维综合监管系统的功能和应用提出了更高的要求。因此, 需要在信息运维综合监管系统的基础上, 进一步深化应用, 使系统成为可靠、高效、经济运维的有利技术手段, 不断提升信息系统安全稳定运行的能力, 为信息系统运行保驾护航。

参考文献

运维综合管理 篇6

关键词:综合运维管理系统,系统特点,传输功能,智能管理

一、引言

在三网融合的趋势和背景下, 广电传输网络正面临前所未有的机遇和挑战, 确保广播电视节目安全优质, 是网络规模、承载能力、综合业务发展的基石和根本。目前各省市广电网络已基本建设完成覆盖全省MSTP/OTN骨干传输网和IP骨干数据交换的支撑网络及市/县传输网, 通过逐级干线传输网, 已基本实现数字电视广播信号全省范围内大部分地区的覆盖。

当前广电传输网络运维方面仍存在一定的不足。由多个环网组成的各省二级干线网, 途径全省多个地市, 有多个无人值守站, 甚至多个站点地处山区和丘陵地段, 交通不便, 资源调配不方便, 维护工作难度相当大;各市县网的网管不统一, 网络信息难以回传到省平台, 直接影响到了对市、县网的管理;网络资源繁多, 管理起来难度大, 尤其目前随着经济的快速发展, 大量施工造成的省干线光缆阻断次数逐渐增多, 线路维护工作量日益增大。

二、系统的特点

该系统由河北广电网络传输分公司技术人员和外部专业力量共同开发, 将动环监控、市县网统一监控、网络运维管理三大功能综合到一起, 系统功能贴近实际应用, 各种需求也是从实际工作需要提出, 非常适用于广电传输网运行管理。

(一) 1550nm市县传输网统一网管子系统方案突破传统, 提高了系统的时效性、可靠性。

系统采用分布式部署, 集中管理, 每个前端增加一台前置机, 总前端布放一台网管服务器, 每个前端前置机分别向下收集并存储自己区域内的设备参数信息, 向上与总前端服务器进行通信, 总前端服务器通过IP网络传至省中心监控平台, 解决了传统方案中只有一个总前端服务器而导致的时限延长的弊端。

(二) 动环监控子系统无人值守站监控信息传送方式经济简单, 稳定实用。

动环监控子系统采用在无人值守站内增加一台Modem, Modem将监控信息调制成56K数据, 通过OTN公务语音通道, 各自建站以轮询方式传送至省中心监控平台, 以最简单节约的方式解决了无人值守站没有传送通道信息难以传送的难题。

(三) 网络运维智能管理子系统通过将运维管理电子化, 改变了旧的运维工作运行模式, 推进了对运维管理新模式的探索。

系统采用模块化开发模式, 可根据网络实际情况进行扩容或更新, 同时通过登陆权限控制, 各模块功能只能由相关人员使用, 保证了各项工作和网络资源的安全性。

三、系统的架构

该系统包括三个功能模块:动力环境监控、1550nm传输系统统一网管、网络运维智能管理系统, 实现对网络的“集中监控、集中维护、集中管理”, 大大提升网络运营效率。功能模块组成如图1所示, 系统总体结构框架如图2所示。整套系统采用统一后台, LINUX操作系统、SQL数据库、TOMCAT中间件, 客户端采用WIN系列产品, 移动终端采用Android系统。开发平台为通用性、高效性、灵活性、可扩展性、平台移植性和安全性强的开放平台。能够广泛应用于个人PC、数据中心、移动电话和互联网, 且拥有全球相对大的开发者专业社群。整套系统中使用统一网络安全系统 (合理部署防火墙、防入侵、防病毒) , 解决了系统对外互联时安全问题。各功能模块展现使用统一多画面分割系统。系统对硬件需求相对较低。通信协议采用标准TCP/IP, 网管协议采用SNMP。

动环监控系统同时支持Client/Server和Browser/Server二种架构, 以确保与其他系统功能模块能够平稳对接及相关信息共享, 可以实现“SC-SS-SU”三级监管, 系统具有可兼容性、可扩展性、可稳定性等多种特点。与其它运营商动环系统不同的是对无人值守站的信息传送采用了通过OTN公务语音通道回传的经济简单但稳定的方式。该系统是基于标准C/S或B/S架构, 打破传统方案, 采用分布式部署方式, 以提高对全网信息的采集效率, 解决了传统方案中只有一个总前端服务器而导致的时延长的弊端。

网络运维智能管理子系统至少包含五个功能模块:智能库管模块、电子值班模块、干线网资源使用情况分析模块、故障处理流程监管模块以及故障处理知识库生成模块, 同时可预留扩展模块接口根据需要进行功能扩展。如图3所示。

四、系统的功能

(一) 1550nm市县传输系统统一网管子系统功能。

该系统的1550nm传输系统统一网管功能模块不但解决了市县网管存在的问题, 还实现了省中心平台对全省市县网的统一监看。该系统功能如下:

1. 告警管理。

实时展现相关告警信息, 信息正确性能够达到99.9%, 且时延小于4秒, 并能够提供告警信息的历史查询、确认、清除、导出等操作。

2. 实时监控。

系统能对站点光发射机、光接收机、光纤放大器、光切换开关等设备的光学设备指标进行实时监测。

3. 故障管理。

可以提供网络设备运行状态、快速发现并修复故障的诊查手段。对故障处理全程进行实时监管, 并最终汇总上报。

4.

配置管理和性能管理。

5. 显示功能。

提供大屏幕或显示终端对各类相关信息友好灵活的展现。

(二) 动环监控子系统功能。

随着各省广电网络的不断建设、改造、完善及相关业务的不断拓展, 网络结构正逐渐向多级化发展, 且相关站点多覆盖面广, 特别是无人值守站大量的建设, 其设备安全保障、运行维护, 需要大量人力、时间、资金, 运维人员与管理中心缺乏及时的信息沟通和协调, 往往造成运维不及时等众多弊端, 不能实现安全、高效、降低运行维护成本的目标。本系统能简单轻松地实现无人值守远程监控, 节省网络运营成本, 提高维护水平, 保证被监控对象的正常运行, 达到提高效率、减员增效的目的。

1. 监控功能。

如图4所示为河北广电网络某站点开关电源供电监视图。图4显示为某站开关电源工作情况, 外电、蓄电池组、整流模块工作参数均正常。供电系统是广电网络的心脏和动脉, 几乎每年都会发生由于供电系统故障导致电视业务中断的事例, 尤其是地处偏远的无人值守站, 此类事故更易发生。如果网络装有动环监控系统, 值班人员就会及时发现, 及时通知, 及时处理, 业务中断的情况就不会发生。

2. 告警功能。

无论监控系统控制台处于任何界面, 均能及时自动提示告警。

3. 配置管理功能。

可在中心或远程进行现场参数的配置及修改。

4.

报表管理功能和安全管理功能。

(三) 网络运维智能管理子系统功能。

广电传输网络不同于其它运营商, 尤其二级干线网, 发生线路阻断, 影响到的不是某个市某个县, 而是全省用户, 所以, 广电网络运维必须要求及时、准确、高效。该系统将网络运维电子化, 改变了旧的运维工作运行模式, 大大增强了网络运维能力。

机房值班运行记录电子化, 减少了值班人员工作量。故障处理流程电子化, 使无论身在何处的维护人员, 都可以第一时间接收到故障流程单, 完成自己的环节, 不会因为身在外地而影响故障流程的处理。故障处理流程完成后, 故障信息自动存储到系统, 系统可自动对相似或重复的处理汇总结论进行智能筛选存储, 形成知识库, 为运维管理提供分析依据和经验。

智能库管系统可对整个设备采购、到货入库、发货出库、设备使用地点、备件补充、设备返修状况、仪器仪表保存与校准等进行全程监管, 同时可与现网使用设备及板卡相关信息实现对应并拓扑展现, 对低值易耗品管理还可实现库存数量的实时提醒, 以便及时补充, 从而保证网络资源的充足与完好。系统可对干线网设备、电路、纤芯等资源状况, 进行人工或自动分析、汇总、存储及信息的调用与拓扑展现。

线路管理列表显示各中继段之间的公里数、光缆芯数、接头盒数等线路资源信息, 为线路维护提供便利。

五、系统的应用情况

系统现已在河北广电干线网投入运行, 且运行稳定。该系统的综合监控平台布放在省中心机房, 值班人员通过监视墙统一的展示屏幕和控制台上各专业网管, 实现对动环、市县网监控, 各部门相关人员根据自己的权限使用网络运维智能管理系统, 真正实现了对网络“集中监控、集中维护、集中管理”。

综合运维管理系统的应用, 带来的直接或间接经济效益和社会效益是不可估量的。该系统的应用保障了广电网络设备稳定运行和机房安全, 提高了劳动生产率和网络维护水平, 实现了机房从有人值守到无人值守和日常运维管理智能化, 知识库的长期积累也为网络运维提供了强有力的技术支持, 增强了公司的技术力量, 这些都给公司带来很大的经济效益。同时, 由于该系统提升了网络运营效率和市场支撑力度, 大大提高了有线数字电视用户的满意度。

参考文献

[1] .张海平, 李树哲, 刘延光.电子化运维在广电网络维护中的应用[A].第十四届全国有线电视技术研讨会论文集[C], 2012

[2] .蒋永平, 蒋秀军.面向广电网络运维的综合网管平台[J].有线电视技术, 2010, 2

运维综合管理 篇7

1 雷击对于110k V输电线路的危害

110k V的输电线路是电网输送中的核心,也是输送电力的关键环节,在电网的实际运行之中,110k V输电线路常见遭遇雷击而发生电网跳闸的原因与输电线路的绝缘物体、输电线路的设置合理性、雷击产生电流的强度及杆塔的电阻有着紧密的联系。在雷电发生的天气里,雷电会再接触到输电线路的杆塔及其他地方之后就会产生一定强度的雷电电流,这些电流一部分会通过输电线路的流入大地之中,如果输电线路的避雷措施不完善一部分电流就会影响输电线路的稳定运行。研究输电线路的雷击情况,可以通过测量输电线路的杆塔上面的避雷设备进行检测从而得到雷击产生的电流大小。在进行研究雷电击打输电线路时也可以进行模拟工作,然后选择合理的方式进行计算,并储存数据,为以后制定防雷击措施提供依据。雷电产生的电流不是一个固定的数值,而是一个动态的数值。雷电产生的电流大小与输电线路的地理位置及自然条件有着紧密的联系,因此对于110k V输电线路的建设选址应该结合当地的气象监测资料进行研究,仔细分析然后选择出合适的建设输电线路的位置,这样能够有效的避免输电线路遭遇雷击。

在110k V输电线路中常见到的雷击危害由两种,一种是雷电的绕击,另一种是雷电的反击。110k V的输电线路虽然安装了一定数量的避雷设备及避雷器件,具有一定的防雷击能力,但是雷电产生时却可以绕过这些避雷设备,从而加大都输电线路的雷击作用,从而导致输电线路的瘫痪或线路发生跳闸的现象。其实雷电绕击会与输电线路的杆塔的高度及导线的保护角度有着紧密的联系,这些元素会严重的影响雷电对于输电线路的绕击,并增加雷电绕击发生的概率。雷电的反击主要是雷电通过输电线路的杆塔及避雷设备,使得大量的雷电流入土地之中,但是输电线路的杆塔设计的不合理并且安方的位置也没有经过准确的测量,从而使得输电线路的杆塔的总高度上升,使得输电线路上面的电压变大,在遇到雷电的天气里会增加输电线路的跳闸次数。

2 防雷击措施

合理的防雷措施不仅能够提升输电线路的输电稳定性,还能够提升输电线路的安全性能。为了有效的避免输电线路遭遇雷击事件的发生,预防措施有以下几个。

第一,架空避雷线。当雷电发生时,雷电会直接击打输电线路,从而导致输电线路的稳定运行与安全运行,110k V的输电线路中通常会使用全线的避雷措施,这不仅能够有效的降低雷电的直击还能够分流雷产生的电流,有效的降低雷电流入大地的电流大小。减少了杆塔承受的电流大小,也有效的预防雷电电击事件的发生。

第二,降低输电线路的杆塔的电阻。在输电线路系统中杆塔由于自身具备的高度,使得杆塔遭遇的雷击事件发生率较高,尤其在遭遇雷电的反击,杆塔往往是最容易受到损坏的。减少杆塔的电阻大小能够有效的提升输电线路的综合耐雷击水平,从而最大程度的降低输电线路的跳闸事故的发生。

第三,输电线路上安装可以控制避雷设备。为了更高好的减少雷电的绕击对于输电线路的影响,在输电线路上安装一定数量的避雷设备能够有效的提升输电线路的防雷击水平。为了把输电线路雷击发生次数降低到最小,可以减小输电线路的保护角度,而可控的防雷击设备主要是根据输电线路的保护角度设置的,能够使得输电线路遭遇雷击的次数降低到最小。这种可控的防雷击设备能给控制输电线路防雷击的保护角度,扩展了输电线路防雷击的范围,并降低了输电线路发生雷击的概率,从而提升输电线路的整体防雷击水平,使得输电线路能够稳定的运行。

第四,架设地线。耦合地线通常叫做架空地线,在输电线路的常常会受到雷电的严重影响,尤其在输电线路的运行之中,雷击对于整个电网的危害最大。如果发现输电线路中存在经常遭遇雷击的位置,此时就可以在易受雷击的位置架设地线。通过地线对雷电电流的分流及耦合作用,并使得输电线路杆塔承受电流的能力达到平衡从而降低输电线路杆塔承受的压力,提升输电线路的防雷击水平,使得电网系统更加稳定的运行。

第五,安装具有自动功能的重合闸设备。雷电发生的时间较为短暂,降低输电线路杆塔承受压力的水平遭遇雷击也是瞬时的,降低输电线路杆塔承受压力的水平在遭遇到雷击之后机会出现跳闸的情况发生,但是线路形成闪络时候会自动的消除这些运行障碍,雷击并不会造成降低输电线路杆塔承受压力的水平永久性之的故障。所以为了提升输电线路供电可靠性能,应该在杆塔承受压力水平的设计时期让重合闸与输电线路保护装置相互的结合,制定出具备一定自动化功能的线路管理系统。当线路发生闪络或遭遇雷击时发生瞬间的跳闸之后应该能够自动的进行重合供电开关,进行稳定的供电,恢复整个电网的正常运行,从而把雷击事件对于输电线路的影响降到最低程度,使得整个输电线路的可靠性能显著提升。

3 总结

在110k V的输电线路中采取线路的综合防雷技术是防止线路遭遇雷击的最好方式。雷击对于输电线路的最大危害是雷电流,在制定防雷措施之前应该仔细研究与分析雷击对输电线路产生的影响并通过合理的、科学的计算方式进行计算,从而制定出有效的防雷击措施,降低输电线路遭遇的雷击事件发生次数。110k V的防雷工作应该贯穿在设计与施工的整个工程的各个阶段,在发生雷击次数多的地方安装一定数量的防雷设备。

参考文献

[1]王庆华.浅析输电线路中存在的问题及解决措施[J].中国电力,2015:67-72.

运维综合管理 篇8

1. 网络现状

采油四厂目前有光缆696.575千米, 租用307千米, 租用三条干路。网络机房8间;网络交换设备173台;服务器29台;网络覆盖58个点 (面) , 网络覆盖率达98%。

2. 网络综合监控运维管理系统建立的思路

建立网络信息网络设备监控管理系统, 以实现传统的被动应答故障处理方式向前瞻式监测管理方式的转变, 既要使网络中出现的危险和漏洞降到最低, 防范于未然;又要减轻我厂面临着巨大的运维压力, 降低信息管理的难度。因此, 整个系统以事件为核心, 将IT资源监控管理系统与流程管理系统有机地整合在一起。采用统一事件管理系统, 对整个系统内的所有事件进行收集、关联分析和处理。

通过统一的管理系统对管辖范围内IT对象的运行状况和系统性能进行实时的监控, 并以图形化的方式直观地展现出来。对于系统运行的异常表现及时报警, 提供故障自动修复功能;同时预设性能监控阀值, 以帮助在系统出现问题之前提前向管理人员发出预警。

3. 网络综合监控运维管理系统在我厂网络管理中的应用及效果

网络综合监控运维管理系统要对我厂信息网络平台内的网络设备、服务器、数据库、业务应用、机房环境进行综合管理。系统的构成层次从下至上为:物理网络层、系统层、应用层, 对所有这些资源进行监控和预警, 提高了管理员的工作效率;并且生成可视化的报表, 提供给管理人员查看, 方便了管理员对资源进行合理的规划。

3.1 模块化的系统管理平台, 增强了信息网络管理的集成度

系统所建立起来的管理平台对我厂的网络设备、服务器、数据库、安全产品、中间件、公共应用、机房环境、终端PC等进行全面的监控。系统支持组合监控功能, 可以对涉及我厂的各应用系统, 从可用性、系统资源占用和性能指标三个层面进行全面深入的监控管理, 从而增强了信息网络管理的集成度。

3.2 自动化的网络拓扑发现, 实现了网络信息获取的智能化

我中心之前绘制的网络拓扑图是管理员通过交换机命令逐级查找交换机设备, 然后通过viscio软件绘制而成的静态拓扑图, 展现的形式和内容极其单一, 只能为日常网络维护提供交换机ip地址和端口号等简单的信息, 不能实时显示网络设备信息及网络运行状态, 从而增加了管理员网络运维工作的难度。

该系统能自动发现网络设备, 生成全面、客观、真实的网络拓扑, 实时对网络拓扑进行更新、跟踪、管理, 并通过可视化、仪表化、智能化的导航管理模式, 让我中心管理员快捷、方便的了解网络中各种网络设备的运行状态, 并且提供的多样化、层次化展现拓扑图, 帮助管理员轻松的做好运维工作, 包括:

1) 发现结果显示:在拓扑图上集成展现设备类型、设备状态, 链路类型、链路状态、链路带宽流量、告警故障的展现;使用不同颜色、粗细、图标表示区别显示被管理对象的状态信息;

2) 提供快速查找和定位设备功能, 可以通过设备名称、IP地址、MAC地址等信息, 在拓扑图上准确定位设备, 并显示出此设备的网络连接信息;

3) 自动记录设备的所有活动情况, 如接入网络、设备迁移及上下线信息;

4) 便捷的浮动信息显示, 浮动显示各类设备和链路的关键信息。

3.3 可视化的网络故障监控, 提高了解决网络故障的效率

之前我中心管理员只能通过接到的故障上报电话来获得故障信息, 信息的单一性和不详实性, 导致处理故障耗时长、效率低, 造成运维工作的局限性、被动性。

该系统根据预先设定的运行监测参数持续地监测网络系统的各项运行参数, 跟踪网络拓扑的变化, 一旦网络发生故障或者拓扑发生变化就可以迅速的通过前台拓扑图反映出来, 在网络拓扑图上通过节点颜色或者一些小图标表现给管理员。同时将详细的信息传送给管理员, 为管理员发现和处理事件提供一定的信息支持, 使我中心管理员被动管理的局面根本性的转变为主动监控。我中心管理员可根据该提示及告警第一时间查找故障原因, 并迅速的制定解决方案, 大大提高了解决网络故障的效率。

3.4 实时性的网络性能监测, 提高了网络平稳运行的可控性

系统提供网络性能实时监测, 支持阀值告警功能。系统监测到网络设备、服务器的端口流量、丢包率、错包率、Ping延时和丢包、CPU利用率、内存利用率、磁盘利用率等运行参数超过预设阀值时, 能在拓扑图上根据用户定义阀值以醒目颜色显示, 提供对历史性能数据进行统计分析功能, 使我中心管理员可对异常信息进行实时跟踪, 从而找出原因, 并予以处理。

1) 链路性能分析——系统能够实时监测网络内指定网段的链路通断并进行详细的展现, 能帮助管理员对链路健康度进行评估, 分析出断路对网络造成的影响大小。

2) 设备性能告警——监测到网络设备的端口流量、Ping延时和丢包、CPU利用率、内存利用率、防火墙等网络安全设备的连接数、网络负载均衡设备正在处理的连接数、总连接数、正在处理的流量、总流量、地址池服务器状态等运行参数超过预设阀值时, 发出故障预警信息。

3.5 内嵌式的网络流量监控, 杜绝了出现网络瘫痪的可能性

内置的流量诊断分析工具提供了完善的流量分析和高级诊断解决方案, 通过直观的展现界面为管理员提供各方面的流量协议分析报告。

通过流量诊断分析, 我中心管理员可以快速诊断并发现网络变慢的原因, 辅助定位各类蠕虫、ARP病毒, 分析各类应用占用的网络资源, 多角度协助管理员分析用户网络流量行为, 并在发生流量异常的时候进行预警, 预防由于滥用网络带宽造成网络瘫痪。

3.6 细粒度的主机资源自动监控, 实现了网络设备管理的细致化

目前, 我厂共有服务器29台, 终端PC1100余台, 庞大的网络设备给我中心的网络运维带来很大的工作量。

该系统提供了全面、细颗粒度的主机监测指标, 例如CPU使用率、内存使用率、网卡状态、系统进程等, 并对Windows、UNIX、Linux等各种操作系统的主机的关键资源的自动监控, 帮助管理员及时发现故障和故障隐患。

3.7 多样性的报表统计, 提高了网络运行趋势的预见性

系统能根据设备的类型、时间信息动态定制报表;支持对一体化平台监控的所有IT资源的当前和历史运行情况进行查询、生成各种分析报表和图表, 如:网络运行统计、服务器运行统计、中间件/数据库运行统计、业务应用运行统计。

管理员通过系统提供的各种报表和视图, 大大了解IT资源的运行状况和运行趋势。

4. 结论

配网运维管理的现状及措施分析 篇9

【关键词】运维管理;带电作业;运检

前言

当前,随着社会发展的日新月异,配网架构日趋庞大、复杂。百姓生产、生活对供电质量的要求越来越高,对电网运行维护工作提出了更高的要求。特别是在国家电网公司“三集五大”后,配电运检专业工作性质由“被动抢修”向“主动运维”转变,工作职能由“优质服务”向“精益运维”过渡。电网运行维护工作日趋繁重,这就对配电运检工作提出了新的更高的要求。

一、配网运维现状分析

1)配网网架基础薄弱,自动化水平低,检测手段相对落后,配网点多、线长、面广,电网的运行维护工作任务十分艰巨。以往,与国外先进国家相比,我国在发电、输电、配电投资比率差异较大。近年来,随着配网资金的不断投入,配网运行状况得到了很大改善,但与主网相比,基础仍显太差,网架结构仍然十分薄弱,尤其是台区低压设备老旧问题日益突出,用电高峰时段低压故障频发,供电抢修工作愈加繁重。

2)百姓生产、生活用电激增负荷增长屡创新高。区域性、季节性负荷需求给配网供电能力、运行维护带来巨大压力。随着城镇化加快发展和人民生活水平的不断提高,社会电气化程度越来越高,部分高新技术,高附加值产业用户对电能质量的要求越来越高。整个社会对停电的承受能力越来越低,使配网安全稳定运行承受了巨大压力。

3)配电网运维管理模式相对滞后。在现在的配网管理模式下,只有等线路跳了,才知道设备出问题了,才去巡线、消缺,缺陷消除后,不认真分析原因,下次此类问题仍会发生,形成恶性循环,造成了巨大的人力、物力浪费及供电量的损失。

以上情况可以看出,当前配网基础较差,且配网在每年运维工作中可投入的人力、物力资源有限,网架薄弱,设备老化等问题无法马上解决,怎样改变以往陈旧的配网管理模式,调度广大职工工作积极性,内部挖掘潜力,全面提升配网运维水平就成了当前首要问题。

二、配网运维管理的具体措施

1)加强学习,提升员工综合素质。重视员工的自身学习,通过自学、集体讨论、会议等多种形式,提升全体员工的理论知识和专业水平,提升其发现问题,认识问题和解决问题的能力。具体做法是:①在培训范围上实现“三级管理”。针对配电专业职工队伍结构情况,具体问题具体分析,将参加培训人员分为三个部分,采取培训人员三级管理方法。第一层,公司内40周岁以下的员工。这些员工接受新知识新事物的能力较强,同时又具备相当的现场工作经验,有较大的发展空间。所以,本层级员工采取理论与现场并重的培训方式,重点提升本层级人员素质技能。第二层,40—55周岁的员工。这部分员工由于环境、年龄、学历等诸多因素,着重现场实践培训。第三层,55—60周岁的员工。由于年龄较大,接受能力有限,身体条件较差,但现场经验丰富,所以,本层级员工重点培训、熟悉现场的安全监护培训。②在培训内容上突出“两个重点”。一是重点项目:建议配电专业将近期重点培训项目定为电缆不停电作业技能培训和带电作业技能培训。带电作业和电缆不停电作业,能有效减少年停电时户数,提高配网供电可靠性,实现配网精益运维。二是重点人员:培训的重点培养人员定为配电部门领导及各班班组长。电力工作的专业性和特殊性,要求部门领导必须熟悉专业业务流程,并具备相当的现场工作经验和理论基础;同时各班班组长作为本班的技术带头人、工作领导者,更应该不断提升自身素质,做好带头示范作用。③在培训方式上注重两个结合。即新进员工培训与老员工培训相结合;部门内部培训与其他部门培训相结合。

2)完善方案,夯实安全基础。凡事预则立,不预则废。为将工作开展好,落实好,取得实效。工作开展前,提前制定完善的推荐方案。在方案的实施环节上要点线面兼顾(点,即把握好具体地点、时间节点;线,即合理细化每一项具体工作的实施步骤流程;面,即站在全年工作层面上统一考虑。)具体内容上要严、细、实兼备(严,即考核措施要严格;细,即注重从细小、细微处做起;实,即做实事,求实效)。

3)以点带面,用突出重点来带动全局。任何工作只有把握主要问题,才能达到“牵一发而动全身”的突破,起到“一子落而满盘活”的效果。在工作具体实施过程中,采用细化任务,责任到人的工作方式。将具体工作进一步细化分配到每一位员工,避免工作任务交叉重叠。例如 :在配变管理上,制定设备主人责任制,按班组分工及个人实际情况,责任到人,确保年度无一台配变烧毁;在故障抢修管理上,分区成立多支抢修队伍,确保及时赶赴现场恢复供电;在内部培训上,实行一对一帮扶等工作紧密结合。

4)市县联动,提升配网抢修能力。在配网运维工作中,重视推广配网带电作业,要求班组在条件允许的前提下,所有维护、抢修工作必须开展带电作业,以保证配网安全可靠供电。为切实提升带电作业水平,建立带电作业市县两级联动机制,一体化管理,在人员、车辆、设备等方面资源共享,不但提升了县、区配网运行水平,更为市区配网抢修储备了后备力量,一定程度上解决了配网抢修人手不足的问题。

三、取得成效

1)进一步夯实了安全生产基础。在日常工作中,通过结合专业工作实际情况,从思想根源入手,查摆问题,消除隐患,堵塞管理漏洞,有效提高了员工的安全责任意识,从真正意义上完成从“要我安全”到“我要安全”的转变。

2)進一步提高了配网的运维水平。在配网运维管理工作中,注重做到三点:重心下移、超前谋划、动态管理。把生产工作重心放在班组,放在一线;在工作开始前,要制定详细方案,明确责任,加强监督考核,注重超前谋划;在各项措施实施过程中,加强动态管理。根据工作方案,为每项工作制定里程碑计划,明确时间节点,定期召开分析总结会,分析情况,及时调整优化方案,巩固取得成果,确保配网运维水平得到了进一步的提升。

3)充分调动了职工的工作积极性。通过各种有效措施的实施,充分调动了职工的工作积极性,在快速抢修、重大节日、活动保电、电网运行、服务客户的各项工作中,广大职工能够克服种种困难,充分发扬特别能吃苦,特别能战斗,特别能忍耐的优良作风,圆满完成了上级安排的各项工作任务。

结语

综上,本文主要就配网运维管理的现状以及具体的措施进行分析。目前,由于我国经济发展以及生活质量的不断提高,对电力的需求量也在逐步加大,很大程度上促进了电力事业的发展。配网跟人们的生活息息相关,对于维护电网运行的安全、提升电能输送能力和效率等方面,起着非常重要的促进作用。加强对配网在运行维护管理方面的研究,是目前乃至未来很长一段时间人们内面临的一项十分重大而艰巨的任务。

参考文献

[1]配电网实用技术[M].中国水利水电出版社,2011.

PON网络综合运维解决方案探讨 篇10

随着“宽带中国”战略的实施, 以及“智慧城市”建设的全面展开, 国内PON网络规模越来越大, 目前用户覆盖规模已经过亿。有效维护如此庞大的网络, 达到保证网络质量、提高用户感知的目的, 对电信运营企业而言至关重要。本文对PON网络维护所面临的问题与维护案例等做了初步探讨。

2 PON网络维护面临的问题

与传统网络维护相比, PON网络维护面临的主要问题包括:

(1) 缺少综合化的维护管理模式。PON网络采用的PON技术是基于软交换、IP等的一种全新技术, 涉及传统网络维护的多个专业和部门。实现各运维专业间的融合及各维护部门间的协同, 建立综合化维护管理模式, 无疑是一个新课题。

(2) 维护人员素质亟待提高。新技术、新设备对维护人员的素质提出了更高的要求。

(3) PON网络基础资料难以保证。PON网络的维护主要集中在光交、终端和家庭网络上。根据前期维护经验, 工程刚完工时基本能够保持数据的准确, 但经过一段时间, 由于多种原因, 数据库的信息往往得不到及时更新, 难以与实际情况保持一致。资源不准确会严重影响业务的正常运营。

(4) 维护效率低下。PON网络中存在无源光网络, 在运营维护阶段, 无源网络的光纤标识、端口查找等操作完全依靠手工进行, 效率低下。

3 划分维护职责和界面

3.1 维护部门

PON网络的维护部门主要包括:网监中心、维护管控中心、网络维护中心、设备维护中心、线路维护中心和各区域经营部等。

(1) 网监中心主要负责城域网、本地网内所有PON设备的监控, 设备及线路故障派发、管理分析以及PON设备的技术支撑, 技术指导网络维护中心和设备维护中心;

(2) 维护管控中心主要负责派发ONU (光网络单元) 故障、用户故障、用户装机等工作, 同时负责服务质量管控、用户回访、满意度调查等工作;

(3) 网络维护中心主要负责OLT (光线路终端) 设备的管理、数据制作以及ONU设备的数据制作;

(4) 设备维护中心主要负责OLT的现场维护, 接受网监中心的OLT故障派单及技术指导;

(5) 线路维护中心主要负责PON网络光缆线路及分光器的维护和抢修, 接受网监中心线路及分光器的故障派单和技术指导;

(6) 各区域经营部主要负责本区域内ONU故障处理及维护、用户装机及故障处理。

3.2 维护管理模式

将PON网络的不同应用模式进行分类, 根据维护特点、应用模式对组织架构进行调整, 划分维护职责和界面, 发挥集中维护的优势, 达到维护职责明确、维护界面明晰的目的。对FTTH (光纤到户) 、FTTO (光纤到办公室) 、FTTB (光纤到楼) 三种模式的维护, 完全按照各部门的维护职责进行;对FTTC (光纤到路边) 模式的维护, 在市区因为规模较小且都是大客户, 所以ONU及客户终端维护都由设备维护中心人员负责, 农村用户则由区域经营部负责。

4 综合运维解决方案

分析PON网络的特点和运维需求, 提出有针对性的PON网络综合运维解决方案, 如图1所示。

对于FTTB和FTTC模式, 采用OAM+SNMP (运行、管理、维护和简单网络管理协议) 集中管理方式, OLT和ONU终端统一由EMS (EPON网元管理系统) 进行集中管理, EMS系统通过北向接口与宽带业务平台、语音业务平台、第三方NMS (网络管理系统) 平台对接。此网管组网构架是实现自动化业务发放的基础。

FTTH、FTTO模式与FTTB、FTTC模式的主要区别在于用户终端, 因此, 采用的管理方式主要针对不同的终端进行。对FTTH、FTTO模式的管理主要采用OAM (运行、管理和维护) 或者OAM+TR069 (运行、管理、维护加用户终端设备广域网管理协议) 方式, 即:既可以作为PON终端和OLT进行集中管理, 又可以作为数字用户终端和数字家庭网关一并通过终端管理系统进行集中管理。无论采用哪种方式, 业务发放方式都是一样的, 实现方式与FTTB、FTTC模式相同。

业务发放是网络运维的重要环节。在现有运营支撑系统的基础上, 基于PON网络的电子工单化业务发放方案的相关流程如图2所示。

利用现有CRM营业系统、97系统和工单系统, 保留现网相关系统之间的接口, 如工单系统与SHLR/SS的接口、工单系统与97系统的接口, 通过新增或完善工单系统与资源管理系统、EMS管理系统等的接口, 实现完善的全自动业务发放和电子工单处理, 加快业务受理周期, 同时减少业务受理难度和人工成本。

在PON网络运维和管理的总体解决方案中, 在细节方面进行了充分的人性化考虑, 主要体现在:

(1) 支持多种设备认证手段。支持MAC (多媒体接入控制) 地址、DID (设备编号) 等多种设备认证方式。其中, DID方案不但克服了MAC地址认证不利于网络规划和维护的缺点, 而且能根据DID编号对ONU类型、设备厂家、局向、设备物理位置、分光等信息进行灵活规划, 更加方便设备定位和维护。

(2) 设备即插即用功能。以设备DID认证为基础, 提前规划用户端设备认证规则, 在网管设备上提前进行数据批量预配置, 设备开通时, 只要线路通畅, 设备即插即用, 避免了设备更换所带来的数据配置麻烦。为安全起见, 一般用户端设备开通时, 开通现场应配置设备的DID。

(3) 远程操作功能。设备运行过程中可能出现设备吊死或端口吊死的情况, 一般需要派外线人员到现场复位处理, 费时费力。使用远程操作功能通过网管远程复位吊死设备, 无需派遣外线人员。

(4) 远程监控功能。PON接入侧设备基本处于无人职守状态, 设备运行状态和运行环境状态的实时监控非常重要。此网管系统能实时监控设备运行、环境温湿度、门禁、电池运行等状态。

(5) 端口定位功能。端口定位是网络安全维护的重要内容, 能起到用户反查、用户跟踪、业务防盗等作用。此方案全面支持PPPOE+ (点对点的以太网协议) 、DHCP OPTION82 (动态主机配置协议中继代理信息选项) 、VLANStacking (虚拟局域网栈) 等端口定位手段, 支持综合业务下的端口定位。

(6) 系列安全措施。此方案在流量控制、业务隔离、防攻击、管理员密码认证、故障预警、远程测试等方面也进行了全面考虑。

5 管理措施

(1) 工程管理。工程质量是维护质量的前提。方案针对PON工程的验收制定了详细流程, 明确了维护部门由网络部牵头, 网络维护中心对总体技术把关, 对网络的全程指标进行测试和验收, 相关部门对相关设备的安装工艺、竣工资料等进行把关。资源管理由维护管控中心牵头负责, 主要包括OLT、分光器、ONU相连接的光纤和相应的端口资料, 要求资源台账准确并随时更新。

(2) 业务开放管理。PON网络的业务开放由维护管控中心进行流程的发起。面向公众客户的业务由维护管控中心负责配置端口, 网络维护中心手工配置OLT、ONU数据, 由工维人员负责上门安装开通;面向政企的客户由维护管控中心派单, 由设备维护中心负责开通业务。

(3) 人员培训。将PON技术标准及典型故障案例汇编成册, 对维护人员加强培训。

(4) 制度和流程的完善。制定《小区巡检制度》、《维护抽查制度》、《业务开通流程》、《故障处理流程》等, 保证PON网络维护的正常开展。

6 结束语

PON网络的维护与管理, 主要依靠网管完成配置管理、故障管理、性能管理及安全管理。对PON网络运行维护体系的基本要求, 是集中、灵活、高效、低成本。只有实现集中化维护, 才能节约维护成本, 提高规范化水平和维护质量, 提高客户响应速度。

集中维护需要高效的运维支撑系统, 以实现运维过程的自动化和标准化。运维支撑系统应该覆盖从业务受理、派线到安装、测试、业务申告、故障排除、故障处理反馈、营账等多方面内容, 实现对终端设备 (包括ONU) 的自动配置和动态业务提供、软件/固件升级、状态和性能监控、故障诊断, 具有标准化程度高、安全性好、部署灵活、维护成本低等优点。

上一篇:留守小学生下一篇:人影作业点