运维建议(精选5篇)
运维建议 篇1
随着人民银行系统技术的不断发展和完善, 人民银行对于信息数据的要求由分散逐渐转为集中, 各个系统服务器的部署方式也逐渐从“总行—省分行—地级市中支”的三级模式上收为“总行—省分行”的两级部署模式, 甚至越来越多的重要信息系统只部署在总行一级, 不再需要在下级分支行进行部署。系统信息技术的提高理应促进技术运维能力的提高, 但笔者在日常运维中发现, 基层央行的技术运维能力似乎没有得到较大提升, 反而在某个方面, 特别是反应处理层面的能力明显弱化。这与近些年来, 科技管理对基层央行运维管理的理解存在偏差, 忽视了基层央行科技人员的运维培训以及基层央行科技人员缺少实战机会与运维经验有关。央行科技管理应注意当前基层科技运维存在的问题, 重新审视基层的系统运维, 加强运维能力培养, 从而使各级分支机构能更好地从事科技运维管理工作。
一、当前系统运维存在的问题分析
(一) 运维实战机会减少导致基层科技人员经验不足
早期的人民银行系统服务器多为“总行—省分行—地级市中支”三级部署, 基层央行有自己的本地服务器, 基层科技人员须认真学习并理解信息业务系统是如何搭建和解除故障的, 实践机会比较多, 因而积累的运维经验也比较丰富。但在旧系统服务器上收、新系统服务器不再部署在基层后, 基层科技人员无须搭建系统服务器, 也不需要熟悉系统的流程原理。系统出现故障后由于经验欠缺, 基层科技人员不能马上判断问题所在, 只能向上级行报告故障, 请求上级行帮助解决。
(二) 进行新系统推广时未在基层科技部门推广到位
数据集中后, 由于新系统服务器不再部署在基层, 上级行在进行系统推广时忽视了基层央行科技部门的作用, 很多信息业务系统上线也不再要求基层科技人员参与培训, 只要求基层业务人员参加培训, 基层科技人员对这些新系统根本不了解, 甚至是一无所知。有的新系统上线后未通知基层科技部门, 直至业务系统发生故障或者业务人员发生操作困难, 转向本地科技人员寻求帮助, 基层科技部门才知道有新的系统已经在相关部门上线运行。有的系统使用复杂或者客户端安装复杂, 如人事信息管理系统、养老保险统筹管理系统、金融统计监测管理信息系统等, 基层科技人员先前从未接触过相关系统及其资料, 缺乏相关背景知识和维护手册, 需要花费较多的精力摸索解决问题的方法, 造成了业务故障问题不能马上得到解决。
(三) 信息业务系统各自运维, 缺少统一的运维知识库
人民银行系统内部运行着上百个信息业务系统, 许多信息业务系统运行多年, 已经总结出一套属于本系统的问题故障情况和处理方法。但是, 这些有效的运维知识并没有向下传递, 基层科技部门持有的运维知识少, 信息不同步。原因主要有两点, 一是当前的运维知识多以单独的信息业务系统为主, 各自发放, 利用邮件系统逐级向下传递, 知识传递方式单一, 而基层科技部门接收的运维知识分散, 科技人员按岗位负责相应系统运维知识的收集, 整个部门没有形成运维知识的整合管理, 缺少统一的运维知识库;二是信息业务系统多, 运维知识更新快, 上级行也不可能每一次都把最新的运维知识用邮件发至基层科技部门。
(四) 联络方式单一, 缺乏有效的沟通渠道
数据集中后, 信息业务系统集中部署在全国数据中心或协同部署在省级数据中心。由于这些新系统服务器不在基层部署, 有时上级机构只留给基层业务人员一个业务操作手册以及单一的电话联系方式, 并没有建立起一个属于该系统的运维联络清单, 特别是各地分支机构的运维人员联络清单, 缺乏一个有效的沟通渠道。当基层业务人员发现系统故障寻求本地技术人员协助时, 基层科技人员往往打不通电话, 联系不到指定的总行运维人员, 也不知道该联系附近地区的哪些科技人员协助解决问题, 导致问题并不能及时反映并得到解决。
二、加强基层运维能力培养的建议
基层科技运维工作是央行科技管理最为日常的工作之一, 战斗在技术支持保障工作的一线, 它的工作好坏能间接反映当前央行的科技运维管理水平。央行科技管理应注意当前基层科技运维存在的问题, 加强基层央行运维能力培养, 从而促进基层央行运维水平的提高。
(一) 采用远程和现场相结合的方式组织培训
自全国电视会议系统推广应用后, 全国人行系统的培训基本上都以远程电视会议的形式进行培训。采用电视会议培训, 有利有弊。在有利方面, 一是可以节省人员出行的浪费, 从而可以组织更多的培训内容和会议;二是可以邀请到平时很难邀请的专家为全国基层人员进行授课, 扩大了基层人员的视野。不利的是, 电视会议缺乏面对面的交流, 特别是参与培训学员间的沟通变得困难, 难以达到畅所欲言的互动交流和信息沟通的目的。当前, 科技运维培训也存在这样的问题, 都是远程培训, 效果不是很理想。建议采用以远程培训为主, 现场培训为辅, 远程和现场相结合的方式组织培训。每年的运维培训活动中, 可以组织一至两次的现场运维培训, 对现场模拟故障进行处理演示, 为基层科技人员给出正确的指导, 还可以为此更新联络名单, 方便培训学员会后的相互探讨与交流。
(二) 重视基层央行科技部门维护新系统的作用
虽然基层科技部门在新系统推广应用的作用在弱化, 但作为一线基层技术保障部门, 他们的作用不容忽视。只有他们, 才能第一时间帮助业务部门去发现故障问题所在并给出正确的应急指引。基层科技部门不需要部署本地服务器, 也不需要参与新系统的业务培训, 但应该了解新系统的一些基本情况。在新系统推广应用时, 上级部门在向基层业务部门推广的同时, 也应将系统概况、系统用途、系统操作手册、系统运维手册、总分行技术联络人员等系统相关信息报送给基层科技部门。基层科技部门据此对新系统信息进行备案, 熟悉系统并对资料进行保存归档, 可以有效地协助基层业务部门应对业务故障出现的问题。
(三) 建立统一的运维知识库系统
在全国建立统一的运维知识库系统有利于运维知识的集合, 系统可以定期汇总更新全国系统中遇到的问题和处理方案, 保证运维知识库的有效性和实用性。同时, 运维知识库系统应该提供检索目录以及运维指引手册, 基层科技人员在遇到问题时可以通过知识库系统的运维指引手册或者检索目录进行检索, 找到所遇问题的解决办法, 提高基层科技人员应对故障的处理能力。
(四) 建立通畅的运维沟通渠道
仅建立统一的运维知识库系统是不够的。知识库在知识领域中属于显性知识, 而在运维中, 隐性知识也相当重要, 它主要来源于工作经历以及学习交流。在这方面, 基层科技人员之间的沟通逐渐减少, 不利于科技人员的隐性知识的积累。除了在全国建立统一的运维知识库系统外, 还应该搭建一个全国系统运维交流平台, 如论坛、微信群、QQ群等, 探讨和解决运维问题, 促进技术运维人员之间的学习交流, 也能维持技术运维人员之间的信息联络, 能够在需要帮助的时候及时给予同行援助之手。
运维建议 篇2
栾辉
摘要 污染源在线监测数据是污染减排工作的一项重要依据,是“三大体系”建设工作的技术保证,做好污染源在线监测系统的运维管理,是在线监测数据准确、有效的重要前提。本文从污染源在线监测系统国内外发展及应用现状,我国污染源在线监测系统建设发展历程,现目前存在问题及对策建议等4个方面进行论述,最终为污染源在线监测系统的运维管理提出合理化的建议。
关键词 污染源在线监测系统 运维管理 存在问题 建议
随着我国经济的快速发展,新的污染源种类不断涌现,传统的环境监测技术所采集到的数据是非连续的[1],很难真正的反应企业真实的污染物排放情况,传统的环境监测技术已无法满足现代环境保护管理的需要。建立一套科学有效的污染源在线监测系统,利用现代化的电子技术、通讯技术、软件技术,实现污染源监测的自动化,在实时性和准确性等方面实现对污染源的有效管理,既体现了作为现代环境保护管理一个新的发展方向,同时也有利于企业提升自身环境保护管理的水平,在提升经济效益的同时,提高社会效益。因此,加快污染源在线监测系统建设,提升系统运维管理水平,是做好现代环境保护管理的有效手段和重要保证之一。
一、国外污染源在线监测系统发展及应用情况
国外环境监测和污染源在线监测系统的建设和应用,从20世纪70年代就开始发展起来,在美国、英国、日本、荷兰等国家已有相当规模的广泛应用,并被纳入网络化的“环境评价体系”和“自然灾害防御体系”。一则可为综合评价环境质量提供基础性数据;二则可以通过污染源数据的传输至监控中心,为决策部门把握灾害的性质状态,从而制定灾害的防御和对策提供依据[2]。
美国的环境监测和污染源在线监测处于较高水平,在某种意义上来说,其一百年来的发展历程、做法和经验,在全世界范围都具有一定的代表性。美国的环境监测发展分为四个阶段:
1、初级阶段:19世纪后期到20世纪40年代末,50年中环境监测不断发展,但较为缓慢;
2、发展阶段:50年代~60年代,美国环境监测发展较快;
3、70年代是美国环境监测取得重大进展并向发达阶段全方位过渡的重要时期。
4、发达阶段:进入80年代,美国环境状况有了很大好转。
二、我国污染源在线监测系统建设及发展历程
我国污染源在线监测系统的建设,始于20世纪90年代末,1999年~2003年相继批准海南、吉林、黑龙江、福建、浙江、山东、安徽等省开展生态省建设工作,以此为契机,各省相应开展了污染源在线监测系统建设工作。
2004年9月,为提高环境保护管理工作水平和质量,在全国范围内,开始构建环境监控网络,建立国家层面的污染源污染物排放数据库,拉开了全国范围内的污染源在线监测系统建设工作的大幕。
2005年7月,为规范污染源在线监测系统的运维管理工作,国家环境保护总局颁布《污染源自动监控管理办法》(总局令第28号),办法中明确了重点污染源自动监控设施运维管理的主管部门及其职责。
2007年6月,《国务院关于印发节能减排综合性工作方案的通知》(国发[2007]15号)要求在全国范围内建立并完善污染物数据网上直报系统和减排措施的调度制度,要求对国控重点污染源实施联网在线自动监控,构建污染物排放三级立体监测体系。
2008年5月国家环境保护部下发《污染源自动监控设施运行管理办法》(环发[2008]6号)对原管理办法进行了更新修订,对污染源自动监控设施的运行提出了更高的要求,对其监督管理的责任主体及职责进行了进一步明确,同时各省、市、自治区按照管理办法的要求,结合本地区实际情况,制定了具体的实施细则,为污染源自动监控设施的运维管理提供了有效的政策依据。
2009年国家环境保护部依据国务院转批的《主要污染物总量减排监测办法》和《污染源自动监控管理办法》要求,制定《国家重点监控企业污染源自动监测数据有效性审核办法》(环发[2009]8号),其中明确了对国控企业污染源自动监测数据进行有效性审核的责任主体,有效性审核的办法,企业的责任及监督考核内容等。为自动监测数据的准确性及有效性审核提供了政策依据。
2012年以来污染源自动监控越来越受到重视,逐渐成为环境保护管理及排污收费的重要依据。在《国务院办公厅关于转发环境保护部“十二五”主要污染物总量减排考核办法的通知》(国办发[2013]4号)中第一次明确提出了污染源自动监测数据传输有效率必须达到75%,自行监测结果公布率80%和监督性监测结果公布率95%的要求;在《关于加强“十二五”主要污染物总量减排监测体系建设运行情况考核工作的通知》(环发[2013]98号)中对相关考核指标,特别是数据传输有效率必须达到75%的核算方法做出了明确说明。
三、我国污染源自动监测系统运维管理存在问题 经过二十多年的发展,我国污染源自动监测系统建设已取得较大的成绩,自动监测网络建设已初见成效,但仍存在以下问题:
1、部分地方或者企业对污染源自动监测系统建设和运维管理的重要性认识不足,自动监测设备安装后运行管理不到位,无法保证系统正常运行。
各级污染源自动监测网络建设一般是由国家提出总体要求,各级地方环境保护部门结合本地区特点,制定详细可行的实施细则,由企业进行具体落实。但是由于企业对污染源自动监控系统建设的重要性认识不足,自动监测系统的建设来自国家或地方环保考核的压力,缺乏足够的热情,导致系统在完成安装验收后,疏于管理,或者运行维护管理不规范,使系统运行无法达到预期效果,数据无法成为环境保护决策的依据。
2、企业自动监测设备未能严格按照国家相关标准与规范进行安装、运维以及质量控制,导致自动监测数据无法真实反映企业排污情况,亦或设备故障率高,运行效果差,上传数据准确性、有效性无法满足国家相关要求。
部分企业自动监测设备陈旧,甚至早期并未执行环保验收,存在自身设备和排污管道不规范的情况[3],自动监测设备安装点位不符合要求,设施运行环境条件及安装空间有限[4]。这些情况导致自动监测数据无法真实反映污染物排放情况;设备运行环境差,操作空间狭小,直接影响日常维护与标定工作质量,进而导致上传监测数据的代表性、准确性、有效性差,难以满足数据传输有效率75%的要求,无法为国家或地方环境保护管理提供有效的数据支持。
3、数据采集传输仪型号多,设备参数彼此不同,同一监测点多台数据采集传输仪共存,彼此信号互相干扰,导致上传数据不准确。
数据采集传输仪生产厂家众多,设备参数定义不规范,数据传输方式多种多样,导致出现数据漂移、数据包丢失现象。同一监测点多台数据采集传输仪共存,数据信号彼此干扰,导致上传数据不准确。部分监测点数据采集传输仪为地方环境保护部门安装,企业系统管理人员无查看权限,一旦出现数据漂移或者数据无法传输的情况,无法及时进行处理;另外,多台数据采集传输仪共存,造成资源浪费的同时,彼此间信号干扰,导致上传数据不准确[5]。
4、污染源自动监测系统运维管理费用无法有效保障,系统的监督监控作用无法得到有效体现。
污染源自动监测系统的建设及运维管理均需足够的资金支持,现目前除《排污费征收使用管理条例》中规定,由国家在每年的排污费中,提取一定比例设立污染源自动监测系统建设资金外,其他资金来源则由地方财政拨付或者企业自筹。由于资金保障不到位,系统建设及运维管理无法得到有效保障,系统的监督监控作用无法得到有效体现。
5、部分污染源自动监测系统操作人员未按国家相关规定操作,没有经过培训考核上岗[6],导致系统运维管理效率低,故障无法及时有效排除。
国家环境保护部相继出台了相关法律法规及标准规范和指导污染源自动监测系统的运维管理,但是由于各地区对自动监测系统的要求及监督考核不同,所以存在部分操作人员不能严格按照国家相关标准规范操作,更有甚者,未经国家或地方相关部门培训考核直接上岗,导致系统无法得到有效的运维管理,系统相关仪器设备发生故障无法得到有效排除,影响系统运行效率,上传数据异常。
6、缺乏对污染源自动监控设备运行状态有效的监控指标体系和数据质量保证指标体系,导致无法及时掌握设备运行状态以及上传数据质量[7]。
目前大部分已建污染源自动监控系统无对在线监测仪器设备运行状态进行有效监控的指标体系和数据质量保证指标体系,无法通过系统对仪器设备的运行状态和数据质量进行自动、实时监控,上传数据的实时性和有效性,无法得到有效保证。
7、第三方运营在管理模式、运营成本控制、自动监控设备的有效性审核及质量控制等方面还存在问题,导致第三方运营模式无法得到有效推广[8]。
按照目前第三方运营的管理模式,第三方运营经费由委托运营的企业支付,由于多数企业缺乏积极性,不愿委托或者运营经费不能及时足额到位;随着污染源自动监控设备种类的增加,导致设备技术复杂系数和备品备件的储备量增加,第三方运营成本也随之增加;在对第三方运营单位的量比评价方面,因污染源性质不同,设备品种较多,各地区管理要求也有区别,运行质量的控制缺乏系统的标准和规范,难以对其运行质量做出量比评价。
四、加强污染源自动监控系统运行维护管理的建议
污染源自动监控系统是提高环境管理水平的重要手段[9],自动监控系统的数据是污染减排工作的一个重要依据[10]。针对以上问题,做好污染源在线监测系统的运行维护管理工作,提出以下几点建议:
1、提高对污染源自动监控系统重要性的认识,赋予自动监控数据的合法地位。实施重点污染源在线监控,是进一步加强环境保护,落实科学发展观的需要,是落实主要污染物总量减排措施的重要依据[11]。为完善“十二五”主要污染物总量减排监测体系建设,圆满完成“十二五”主要污染物总量减排目标,实现以自动监控数据作为总量减排的核算依据,确立污染源自动监控作为总量减排依据的合法、有效地位,是圆满完成以上工作的重要前提。
2、各污染源自动监控系统运维单位,应严格按照国家相关法律法规以及技术规范要求,建立并完善管理体系,分清责任,做好系统的运行、维护、管理工作。
建立从中央到地方逐级管理体系,自上而下规范污染源自动监控系统的运维管理工作。通过企业自行整改及地方环境保护管理部门不定期的现场核查,规范自动监控设备的安装、运维、管理工作;依据国家相关标准和技术规范,做好仪器设备的定期维护与标定工作,使上传的自动监控数据具有较好的代表性、准确性和有效性,能成为主要污染物总量减排的合法依据。
3、污染源自动监控系统相关设备,特别是数据采集传输仪的采购、安装、运营由地方环境保护管理部门同意招标,资金由地方政府和企业按比例分别承担[6],同时,通过权限下放的方式,减少数据采集传输仪的安装数量,既可以减少资源浪费,同时也可以减少多台数据采集传输仪之间的相互干扰。
自动监控设备及数据采集传输仪由同一厂家提供并安装,既能够使设备的安装符合国家相关技术规范要求,又便于日后的管理与维护,对于同一监测点地方环境保护管理部门与企业自行安装数据采集传输仪共存的现象,建议保留地方环境保护管理部门安装的数据采集传输仪,但是在地方污染源自动监控系统中为企业用户配置用户及权限,满足企业对污染源自动监控数据的需求,同时可以避免因安装多台数据采集传输仪导致数据之间相互干扰的现象。
4、通过企业自筹及政府补贴的方式,足额保证污染源自动监控系统运维、管理相关费用,保证系统平稳、有效运行,提供有效自动监控数据。
现目前企业污染源自动监控设备的购置和运维管理经费保证方面存在的问题主要有:(1)部分企业对建设并运行管理好污染源自动监控系统重视程度不足,甚至存在抵触情绪;(2)部分企业因企业规模小,经济实力无力承担系统建设及运维管理的相关费用。这就要求在国控重点监控范围内的企业领导提高自身素质,必须高度重视环境保护管理工作,为自动监控系统的建设及争产刚运行提供必要的条件保证;对于相关经费筹集较为困难的企业,国家及地方政府应加强扶持力度,对于积极建设污染源自动监控系统,但经费不足的企业,应给予扶持,除每年在排污费中提取一定比例支持系统建设外,各地方政府还应结合自身情况,建立自动监控系统建设运行保障基金,并根据国家相关法律法规,制定详细的管理办法及考核细则,督促企业加大系统相关费用投入,并持续保证。
5、建立并完善污染源自动监控系统运维管理人员培训考核上岗制度,强化岗位责任,明确分工。
为能够及时了解并掌握国内外污染源自动监控系统建设发展的方向和动态,及时掌握先进管理技术和管理经验,国家环境保护部和中国环境监测总站应进一步加强系统建设和管理相关方面的培训,定期组织多层面、全方位的多元化系统建设建设、操作规范及管理方面的经验交流和人员培训,为建设先进行的污染源自动监控体系创造条件[11]。
6、建立并完善污染源自动监控设备运行状态的有效监控指标体系和数据质量保证指标体系,保证上传数据准确有效。
准确有效的污染源自动监控数据是主要污染物总量减排、达标排放、排污收费、环境统计、污染源监督管理工作的基,具有较高的代表性、完整性、准确性、精密性和可比性。为满足经济发展对污染源自动监控系统的需要,应继续加强对监测现场的质量控制,实验室比对监测过程的质量控制方法,利用环境监测指标之间的逻辑关系进行环境监测数据的有效性审核,以及数据有效性自动审核等方面的研究。
7、继续探讨优化第三方运营模式,控制运营成本,有效解决自动监控设备有效性审核及质量控制方面存在的问题,推广第三方运营模式。
应尽快制定第三方运营的管理制度和相关标准规范,明确各方职责、权利和义务。促进运营商主管能动性,提高自动监控设备的有效使用率,保障运营质量。做好第三方运营的经费保障工作,制定相应条例将运营经费纳入地方财政管理,使有限经费得到较合理的使用和监督,避免第三方运营单位与企业间因利益关系产生不正常的现象,提高第三方运营效率和污染源自动监控质量。统一区域安装的自动监控设备类型不应超过3类;环境保护管理部门应配合计量部门开展自动监控设备的强制检定工作,保证自动监控数据的有效性和溯源性,[8]不断提高自动监控设备的使用率和数据传输有效率,强化污染源自动监控系统第三方运营的生命力。
五、结语
按照“十二五”主要污染物总量减排监测体系建设的要求,地方环境保护管理部门及企业必须提高对污染源自动监控系统建设、运维管理的重视程度,加大自动监控系统相关投入力度。依据国家法律、法规及相关技术规范,制定本区域或本企业系统建设、运行维护管理的实施办法及考核细则,加强自动监控设备运行状态和数据质量控制方面的研究,保障系统平稳有效运行;做好第三方运营模式的探讨,及对第三方运营单位的监督管理工作,通过系统运营的市场化、规范化,使环境保护管理部门、企业、第三方运行单位实现“三赢”。参考文献:
运维建议 篇3
关键词:ITIL,IT运维管理,国内企业
近几年,国内企业均将建成世界(国际)一流的大型公司作为其发展目标, 这就需要与之匹配的信息系统平台作支撑。 自2000 年以来, 国内大型企业的信息化工作进入到一个快速的发展时期。 按照整体规划,国内大型企业已经实现了集中建设的目标,今后将继续推进系统深化应用,并实现集中化运维管理,这给传统模式的运维工作带来了巨大的挑战。 因此,亟需构建一套先进规范、运行高效的运维管理体系来满足提升管控能力的要求。
1IT运维管理发展趋势
1.1 向集中化管理转变
集中化管理是当前IT运维管理的发展趋势, 对主机设备、网络设备、存储设备、备份设备、数据库、中间件、应用软件、桌面系统等进行“集中监控、集中维护、集中管理”成为企业IT运维管理的必然选择。
1.2 注重与业务的融合
IT运维管理体系越来越注重与业务的融合, 正逐步向业务靠拢,IT部门正在由从一个纯技术中心逐步转向服务导向的中心,目标更是直指业务中心。 同时,以业务为中心,驱动IT系统的建设和运营管理,在提高IT效率的同时推动业务价值的形成。
1.3 以ITIL为最佳实践,指导运维工作
目前,ITIL作为当今IT运行服务管理的主要方法论已经被欧洲、美洲、澳洲、亚洲的很多企业采用,全球已经有1 万多家知名的公司在参考里面的方法管理自己的IT系统。 ITIL已被认为是世界IT服务管理领域的标准, 同时也使得ITIL在IT服务管理中应用越来越广泛。
1.4向自动化管理发展
目前,越来越多的企业开始运用专业化、标准化和流程化的手段,来实现运维工作的自动化管理。 通过自动化监控系统能及时发现故障隐患,将IT运维服务由“被动”变为“主动”,防患于未然。 例如,全天候自动检测与及时报警能够实现IT运维的“全天候无人值守”,大大降低IT运维人员的工作负担。 与此同时,通过自动化诊断能够最大限度地减少维修时间,提高服务质量。 因此,对于越来越复杂的IT运维来说,自动化管理是提升IT运维管理的过程,也是未来一个重要的发展趋势。
2国内企业IT运维管理现状
2.1 IT运维管理现状
随着信息化的逐渐深入,企业的应用系统日益复杂,特别是数据集中之后,业务对IT持续运行的需求日益强烈,同时保证系统7×24 正常运行也变得尤为重要。IT服务管理理念引进中国后,国内信息化的建设在参照了国际的流行趋势后,结合国内企业的现状进行运维管理体系的建设, 在一些企业取得了重大成就,并且国内企业充分结合ITIL最佳实践和企业的IT运维管理的现状,从整体上提升了IT系统的运维管理水平。
通过调研中石化、中海油、国家电网、中烟信息4 家企业的IT运维管理现状,从运维体系、流程、工具、团队4 个方面进行对比分析(见表1)。 从表1 案例来看,IT运维管理都借鉴ITIL国际标准建立了相关流程,并遵照实施,其共同之处体现在以下4 个方面:
从运维体系来看,中石化、中海油、国家电网、中烟信息均采用三级运维体系架构。
从运维流程来看, 服务交付域和服务控制域中涉及的事件、问题、变更、发布、配置5 个流程已得到全面应用,这5 个流程是快速响应和解决用户提报问题的关键流程,直接决定运维服务水平高低。通常与流程相关的关键绩效指标会在与客户签订的服务级别协议(SLA)中体现出来,之后这些指标会在内部团队和外部供应商之间进行分解,以保证服务的可靠性和可用性。
从运维工具来看,多采用与ITIL流程吻合度高、先进、应用广泛的运维管理平台,如SM7 和Remedy。 这些平台的应用,使运维人员和运维流程得到固化;同时,也使知识库的作用得到最大限度的发挥,运维服务能力得到不断提升。
从运维团队来看,出于信息安全的考虑,大多为内部支持队伍,且少有将全部运维工作外包出去。 这些内部支持队伍均取得ISO 20000 认证,或者运维相关资质如CCOE认证。
2.2 IT运维管理存在的问题
在现状分析的基础上,结合IT运维管理领域的发展趋势,可以看出国内企业在以下几个方面需要改进。
2.2.1 向集中化管理转变各企业的运维水平参差不齐,缺乏工具支持
目前各企业的运维管理水平也存在较大差距,有些企业已经初步建立了运维管理流程和工具,但在实际执行效果上并不尽如人意;更多企业的运维管理工作还处在不尽规范的状态,缺少相关的管理流程和工具,更多的是依靠运维人员的个人能力维系业务系统的运维管理。 另外,有些企业的信息系统运维工作缺乏有效工具的支持,运维流程效率的体现很大程度上依赖于适当工具的使用,包括监控系统去获取客观的数据,IT服务管理平台掌握对运维流程关键点的控制等。
2.2.2 系统建设与运维并举,运维管理环境和运维团队尚不稳定
目前从总体来看,国内企业的信息化还处在建设和运维并行的阶段,而且这种特点还将持续较长一段时间。 这种并行特点给统一和整合的IT运维管理体系的建设带来了环境和团队方面的挑战。
2.2.3 量化考核和评价机制需进一步完善
目前,国内企业的IT部门量化考核和评价机制还不完善,缺乏服务质量评价指标体系。 而为配合运维管理工作规范化的开展,应提前制定必要的管理制度、绩效衡量和质量评价体系等,这些内容是实现运维管理工作目标的必要手段。
3国内企业实施IT运维管理的对策建议
未来,运维管理模式的建设方向是一体化集中管控模式。 为此,国内企业在设计运维管理模式时,必须考虑组织特点和未来的发展方向,尤其要考虑,随着基础设施、应用的大集中模式的实现,未来国内企业会搭建以Iaa S、Paa S为主, 逐步尝试Saa S的私有云,集中化的运维管理模式必须能够支撑未来企业云环境的管理。
3.1 IT运维管理模式建议
借鉴IT运维管理发展趋势,结合国内企业的现状特点,建议IT运维管理以统一的技术工具平台为支撑, 遵照统一规范的运维流程执行,明确出人员角色,涵盖三级运维体系。 IT运维管理体系的建设涵盖组织模式、管理制度、管理流程、绩效考核、知识管理、技术支撑等内容。
3.1.1 组织模式
为了实现一体化集中管控的运维管理, 建议将运维管理机构、运维服务机构到后台支持团队3 个层次进行统一,按照业务设立统一的运维团队,为用户提供统一的IT运维服务。
3.1.2 制度规范
管理制度体系分为 “信息化运维管理办法”、“各服务管理流程序文件”、 各信息系统项目根据具体情况再制定实施细则和操作指南以及表单4 个层次(如图1 所示)。
3.1.3 管理流程
建立统一的服务管理流程,包括分别面向用户的服务支持流程,如事件、问题等流程。 以及面向客户服务交付流程,如容量管理、可用性管理等流程。
3.1.4 绩效考核
绩效考核从IT运维管理体系的目标出发,按照组织、流程和岗位角色分解, 形成 “IT运维组织KPI关键绩效指标—流程KPI—角色岗位KPI”3 层相互关联的绩效考核指标体系。
3.1.5 知识管理
整合知识资源,建立一套“统一、集中”的运维知识管理平台,以便为总部及所属企事业单位IT运维工作提供支持。
3.1.6 技术支撑
建立集中统一的运维管理平台,包括服务流程平台、监控平台、知识管理平台等。
3.2 提升IT运维管理水平的建议
3.2.1 各企业参照统一标准搭建运维管理体系
各企业运维管理体系采用急用先上的原则,将目前存在的问题最突出的内容、日常运维中最不可或缺的内容建设完成,按照系统搭建运维服务台, 建立统一的用户服务体系及内部管理体系,具备必要的运维管理能力,改变目前无流程、无工具或流程执行不到位的现状,初步搭建规范统一的运维管理体系。
3.2.2 配套运维管理工具,提升体系的执行效率和效果
通过运维工具可以实现对IT服务过程工作流程的精确管理,将人员和流程固化,实现运维人员、流程、技术的有机整合,实现常规及突发状态的应急管理,实现运行故障的提前预警。同时,从管理、制度和技术等角度出发,将系统运维工作相关信息、资源进行整理、分类,建立统一的、不断丰富、完善的运维知识库,为运维人员学习培训、信息共享提供方便,从而提升管理体系的执行效率和效果。
3.2.3 建立持续优化机制,确保体系高效运转
运维建议 篇4
智能变电站与传统变电站相比, 采用了大量新设备、新材料、新工艺, 信息数字化、控制网络化大量应用。以往传统纷乱冗杂的“蜘蛛网”布线没了, 取而代之的是一个个集成的智能控制柜。传统变电站采用的是控制电缆, 现在采用光缆之后, 节省了大量缆材, 可靠性和失真率比之前大大提升。变电站内所有智能设备都采用了统一的通信接口, 设备间形成了无缝对接。以往设备规约不同还需要采购规约转换器, 设备检修也复杂, 现在统一以后大大节约了成本和人力。
2 智能变电站运行现状
合理的电网结构是电力系统安全稳定运行的基础, 局部电网薄弱则是影响电网安全稳定的突出问题。近年来, 智能电网建设力度不断加强, 不断提升供电可靠性和电压合格率, 为能源的可靠供应以及地方的经济发展助力。智能变电站建设便是解决问题的关键一环。
3 日常运维工作中较为常见的问题
3.1 运行人员后备力量缺乏, 老化、断层问题突出。
随着新技术、新设备的应用, 部分人员对设备熟悉程度不够, 技术业务素质需要进一步提高。人员年龄结构偏大, 学历偏低, 能胜任正值工作的人较少, 已不适应日益强大的电网发展需要。
3.2 操作方式手段相对落后。
目前变电站一两次设备更新换代快、高科技技术含量高, 设备可靠性越来越高, 具备遥控操作功能的设备也越来越多, 各单位操作模式依然停留在以往的模式中, 全面遥控操作、程序化操作等操作模式较少。
3.3 现场工作细节不到位。
部分防误装置五防锁具没有防尘罩、编号为临时手写编号;变电站生活区、设备区废旧物资、退运设备、杂物等存在乱摆乱放现象;技改设备标识、二次标示不规范, 继电保护及安全自动装置屏处切换把手的详细操作步骤不详细, 现场定值单留存不全。
4 日常运维工作中一些做法
4.1 严肃工作计划管理, 强化人员责任管理
变电运维工区结合季节性特点和工作实际, 工区和运维班组开展“月有活动主题、周有工作重点、日有具体安排”的工作计划法。每月的活动主题, 既要符合上级要求, 也要紧密联系工作;每周工作重点既要围绕月活动主题, 又要求工区、管理人员和班组长应高度关注的工作;周计划要求全面细致, 涉及生产安全工作的, 还应有危险源点识别与预控措施, 每项任务落实到人, 具体到日。形成工区上下统筹安排、统一指挥, 明晰工作任务和措施的执行体系;明确各级人员的职责, 明确各级人员的工作计划和措施;对各项工作进展情况进行定时检查与考核。
4.2 推进科技创新管理
重视科技创新和科技成果应用工作。积极引导员工在平时工作中, 多观察、多思考, 想点子、出主意, 主动参与群众性科技创新活动。工区积极与有关科研单位和厂家合作, 共同谋求解决生产运行、生产安全等方面的技术难题, 请专业厂家对工区管辖的变电站设备进行精确测温, 并建立各变电站设备测温软件档案, 为掌握和跟踪设备热故障, 提供第一手资料;请专业厂家安装变电站智能钥匙管理系统, 用智能技术解决变电站钥匙多、管理不规范、有安全隐患的问题;请专业厂家对污染较重的变电站瓷瓶进行带电清洗, 解决设备污脏、停电难, 有效预防设备污闪的问题。
4.3 加强变电运维精益化管理
变电运维工作, 就是要坚持以设备缺陷管理为中心, 坚持以“两票三制”为抓手, 着力加强变电运维精益化管理。
1) 规范设备巡视检查工作
变电运维人员要按照“变电站现场巡视标准化作业指导书”要求, 开展巡视项目的标准化巡视检查, 巡视工作要到点到位, 巡视项目齐全无遗漏。每次巡视均应对照“变电站巡视标准化作业指导卡”。巡视中发现缺陷及异常时, 应准确分析、判断缺陷类别和原因, 及时汇报, 并做好相关记录。
2) 重视设备红外测温工作
变电运维人员要按照“红外测温标准化作业指导书”要求, 认真开展红外测温工作, 做到测温项目的齐全与完整。设备安全运行第一责任人除定期进行变电站设备红外测温外, 还要求与运维人员一起跟踪监测热故障设备, 定期上报监测结果, 直至设备热故障消除。请红外测温专业厂家, 对所有变电站进行红外精确测温, 并建立变电站设备红外测温软件档案, 为设备状态评估提供技术支持。
3) 严格变电站钥匙管理
责任事故警示我们, 变电站钥匙管理是否得力, 将直接影响人身, 对和设备安全。变电站大门、开关室、主控室、机构箱、端子箱、汇控箱、屏柜及各类切换开关等钥匙应集中存放在钥匙箱内中, 变电站常规钥匙由变电运维人员保管并纳入交接班内容;防误解锁钥匙由工区公布的防误专责人负责封存管理。检修或其它工作人员需借用钥匙, 变电运维班当值人员按要求认真履行借用手续;当防误装置及设备出现异常或特殊方式需要解锁操作时, 严格执行解锁程序, 并填写解锁钥匙使用记录, 解锁钥匙使用后应及时封存管理。
4) 严明“两票”执行纪律
操作票和工作票是变电运维人员和检修人员的“生命票”变电运维人员严明执行工区提炼并用PPT形式制作出来, 关于操作票的操作前、操作中、操作后“三检查、三核对”操作法和关于工作票的“十问五查”法, 尤其是操作票的“审查、唱票、复诵、打钩、检查”和工作票的“审查、安措落实、危险点交底、工作许可”等关键点要管控、在控。针对危险性、复杂性和难度较大的作业任务, 班长、专职、工区领导要认真制订方案, 协调人员力量, 做好充分准备, 并深入现场进行检查、指导、把关, 坚决杜绝人员伤亡、误操作事故的发生。
5) 严密作业现场安全管理
要加强工作现场的巡查, 重点检查现场安全措施有无被变更或破坏的情况, 发现问题时, 要及时纠正。要高度重视安监部、调控中心颁发的高危作业预警通知涉及的工作现场, 深入开展现场作业危险点的分析, 落实安全防范措施和管理人员到岗到位制度,
4.4 加强业务培训, 提高业务素质
提高人员业务素质, 适应不断更新的现代化装备, 我们先后采取了送出去学习、自己组织培训的方式来提升职工业务水平。如新调规培训、班组建设培训、主变模块操作培训、继电保护培训、双票管理培训、变电运行检修培训、二次回路安装培训、标准化作业双票管理补充规定培训等, 对新接触的设备我们高度重视其性能和使用方法, 邀请厂家人员现场手把, 提高人员业务素质。
结束语
要充分发挥智能站的性能优势, 有效提高智能变电站运维水平, 利用远程在线监测系统强化设备运维工作。要深入学习了解智能变电站的运维检修知识, 提高人员安全意识, 使专业人员更快适应大检修体系下的工作模式, 提高工作效率和质量, 为公司发展奠定良好基础。
运维建议 篇5
关键词:耐张线夹,断裂,故障分析,运维建议
耐张线夹主要用于将导线或者避雷线固定在非直线杆塔的耐张绝缘子串上, 既承受导线间或导线与绝缘子串之间的张力, 又要承受电气负荷, 是确保高压输电线路安全稳定运行的重要金具。目前由于电网老化、耐张线夹的施工或设计缺陷导致断线的事故时有发生, 对电网安全运行产生严重影响。本文分析了220k V石索线耐张线夹断裂的原因并提出了应对措施与建议, 对电力公司耐张线夹的运维和确保输电线路安全运行具有借鉴意义。
1线路概况及故障情况
220k V石索线于2001年10月17日带电运行, 线路全长32.367km, 共107基杆塔, 其中1#~100#塔导线型号为2×LGJ-185, 100#~107#塔导线型号为LGJQ-300, 地线型号为GJ-50。
2013年12月2日06时20分, 国网河南省郑州供电公司220千伏石索1、石203高频方向、高频闭锁距离零序保护动作跳闸, 重合成功, 石索2高频方向、高频闭锁距离零序保护动作跳闸, 重合成功。故障相A相, 测距石佛变6.65公里。
2巡视情况及处理
故障发生后, 巡视人员立即对220k V石索线全线进行故障巡视, 并根据索河变测距情况, 对测距范围内的12#-32#内的输电线路进行重点巡视。2013年12月08时40分巡视到28#-29#线下时, 发现石索线28#右相大号侧外线导线的帕尔普耐张预绞式耐张线夹连接处断裂, 导致导线弧垂降低, 急需要停电处理。2013年12月08时45分石索线停电抢修, 其它线段巡视无异常, 2013年12月15时15分, 处缺完毕, 送电正常。
220k V石索线28#~29#位于郑州北四环与西四环交叉口东北方向, 地处农田, 故障当天天气晴朗, 气温为2℃。
故障现场情况详见下图1所示:
3故障初步分析
220k V石索线28#是2007年大修更换的铁塔, 耐张线夹使用的帕尔普预绞式耐张线夹, 引流接续采用帕尔普的引流接续。自2010年起, 运维人员使用红外测温仪进行线路普测时就发现帕尔普预绞式耐张线夹和预绞式引流接续有发热的现象, 在2011年郑州公司220千伏II滨柳91#塔C相引流线, 采用帕尔普预绞丝接续, 在大负荷条件下发热导致引流线熔断, 引起线路跳闸。
针对预绞式耐张线夹发热引发的线路跳闸问题, 国网河南省电力公司多次组织技术分析及交流会, 聘请厂家、行业专家对事故原因进行分析, 主要从施工工艺、产品质量及材质等方面进行分析:
(1) 施工工艺原因:因仅郑州地区出现预绞丝发热问题, 各地市未见报告预绞丝发热问题, 施工工艺原因为故障原因主要怀疑因素。针对这一问题, 国网河南省电力公司2012年4月份, 邀请北京帕尔普预绞丝生产厂家来郑州对施工队伍进行培训。通过培训, 经验交流, 证实施工方法及施工工艺与厂家指导方法一致。
(2) 产品质量原因:经过查阅郑州供电公司输电线路档案, 所有使用的耐张线夹均有验收合格标志等, 物资为直接从厂家进货。
(3) 预绞丝材质及产品原理缺陷问题:由于厂家表示材质检测需寄往美国总部, 暂未对预绞丝材质进行检测。
初步分析认为预绞丝采用为钢材质, 而与导线接触为铝材质, 不同金属在电场作用下, 会发生电腐蚀, 随着使用时间的增长, 220k V石索线28#右相大号侧外线帕尔普预绞式耐张线夹逐渐老化, 导致预绞式耐张线夹发热进而引起断裂, 致使耐张线夹与绝缘子脱落, 引流线受力后弹起过程中对小号侧横担端均压环发电, 造成此次线路跳闸故障。
通过此次耐张线夹断裂导致线路跳闸故障, 暴露电力公司在耐张线夹运维方面存在以下问题:
(1) 对预绞丝的运维能力不足, 由于该产品从美国引进, 国内对其使用方法、维护手段、检测手段以及鉴定方法等方面存在不足。
(2) 针对使用帕尔普生产的预绞式耐张线夹多次发热引发跳闸的问题, 2013年郑州供电公司对60基有重要跨越线路上使用帕尔普生产的预绞式耐张线夹, 已经基本更换完毕, 还有492基杆塔还没有进行更换。若将上述预绞丝全部更换, 相当于将近十年来的线路改造工作全部更换, 其需要投入大量的人力、物力以及电网的停电配合。
(3) 对于未更换的预绞丝, 没有有效的实时监测手段。因预绞丝发热具有偶然性, 同一地点存在连续几天红外发热检测不一致情况。而目前暂无有效全面监控手段, 只能通过地毯式全面排查, 查找缺陷点。
4运维建议
鉴于近年来预绞丝越来越多的在我省输电线路应用, 但运行经验较少, 研究不够深入, 为避免预绞式耐张线夹发热进而引起断裂事故的发生, 现对预绞丝的使用建议如下:
(1) 对110千伏以上使用预绞丝的线路进行红外测温排查, 对存在发热隐患的预绞丝进行整改;
(2) 开展专题研究, 针对预绞丝及同类产品编制指导意见, 制定施工、验收、运维标准;
(3) 对于老旧线路 (导线表面氧化层较厚, 不易打磨的) 禁止耐张和引流使用预绞丝接续;抢修采用预绞丝时, 需根据线路情况选择性使用, 并严格施工工艺。
(4) 耐张线夹、跳线禁止使用预绞丝接续;重要线路和特殊地段要慎用预绞丝;工程验收时要特别加强对预绞丝的验收工作, 杜绝缠绕不紧密、有缝隙等现象。
(5) 加强对预绞丝及同类产品的检测, 增加红外测温频次, 发现缺陷立即进行整改;加强与调度的协作, 当使用预绞丝线路工作电流接近或超过导线最大载流量的75%时, 应立即组织红外测温检查。
5结论
本文以220k V石索线耐张线夹断裂引发跳闸为实例, 初步分析了其跳闸原因, 对目前省内采用的耐张线夹存在问题进行了剖析, 并对下步运维工作提出了相应的建议, 对耐张线夹的运维和确保输电线路安全运行具有一定的借鉴意义。
参考文献
[1]夏德森.耐张线夹在架空线路中的应用[J], 电力金具, 2008, 25 (1) :7-14.
[2]冯爱军, 金榕.影响导线压接握着力的因素分析[J], 电力建设, 2011, 32 (11) :85-88.
[3]周立波, 黄晓明, 包建强等.220k V输电线路耐张压接管钢芯拉断原因与防范[J].电世界, 2008 (10) 38-40.
[4]蔡向晖.500k V紧凑型线路耐张线夹断裂事故分析[J].华北电力技术, 2003 (3) 26-28.
[5]刘纯, 熊亮, 陈红冬等.500k V输电线路耐张线夹钢锚断裂分析[J].上海电力, 2010 (4) :26.
[6]张午阳, 李世勉, 周媛.一种输电线路耐张线夹失效断裂原因分析[J].重庆电力高等专科学校学报, 2013 (12) :47-49.
[7]胡加瑞, 谢亿, 刘纯, 陈红冬, 龙毅.输电线路耐张线夹典型缺陷探析[J].华北电力技术, 2013 (4) :34-37.