IT运维服务(共12篇)
IT运维服务 篇1
一份专业的I T运维服务报告能够向领导报告及时、准确、可靠的反应I T信息系统运行状况, 对I T基础架构和业务系统运行走势进行分析, 针对系统中存在的问题给出有建设性的指导意见, 引起公司领导对企业I T建设的关注, 经过升级和改进, 帮助运维部门更好的开展工作。
1 传统运维报告内容
传统的I T运维报告主要从基础设施状况、性能状况、信息安全状况、容量状况和业务连续性状况这5个方面进行分析。
I T基础设施包括系统软件平台和硬件基础设平台。系统软件平台主要包括操作系统、数据库、中间件;硬件基础设平台主要包括网络通讯平台和服务器系统平台以及存储系统平台。
性能状况主要是针对的业务系统, 通过选取具有代表性的功能模块, 进行性能评测, 得出当前系统的性能状况。在模块选取时一般选择系统日常运行中使用频率高的功能模块、容易产生相对大并发量的功能模块、涉及到的大数据量表操作的功能模块等。
信息安全状况涉及的技术与业务层面很广, 一般包括物理安全, 网络安全、操作系统安全、数据库安全、应用系统安全和安全策略等。
容量状况是通过定期地测量容量, 防止信息系统出现遇到带宽和存储能力不足的问题。一般包括网络带宽负载状况、存储的容量状况、主机系统负载情况和业务系统所能承载的吞吐量等。
业务连续性状况是指一个数据中心类应用为了维持其生存, 一旦发生突发事件或灾难后, 在其所规定的时间内必须恢复关键业务功能的强制性要求, 这就需要预先发现可能会影响企业关键业务能力和过程的所有事件, 采取相应的预防和处理策略, 以保证企业在事件发生时业务不被中断。这部分主要考虑容灾恢复技术, 具体包括数据容灾和应用容灾。
传统较为常见的运维报告内容有:
(1) 固定资产报告。
这包括了企业的I T设施的报告。例如企业服务器的数量, 新增和淘汰的资产, 发生变化的资产等。
(2) 软件运作报告。
这包括了企业的生产系统, I T通用系统的运作情况。例如本月操作系统、防病毒软件补丁更新情况, 具体涉及的服务器、P C数量;应用系统的使用情况, 是否发生错误, 错误处理时间、处理结果等。
(3) 网络行为报告。
这包括了网络行为的一些监控, 例如某个网站的访问率最高, 某个部门最喜欢运行某些软件, 网络流量占用高的员工等。
(4) 故障维修报告。
这包括运维人员工作内容, 例如每月处理了多少故障事件, 具体处理时间, 处理结果等。
2 围绕着ITIL的服务报告
ITIL中服务报告是IT部门与客户之间交流的书面工具, 可以分为定期和不定期两种形式。除了传统服务报告中提到的, 定期的服务报告还包括如每月的服务级别分析报告, 反映了服务质量的客观指标, 比如服务可用率、网络流量、突发事件数量、响应时间, 可作为服务费用分配的基础。不定期的服务报告往往由违反服务级别突发事件引起, 可以是对突发事件的分析, 也可以是对可能发生的服务级别违规事件的预警。
成功的服务报告有明确的目标客户, 由于不同客户关心的内容是不同的, 所要求的服务报告周期也不同, 所以应根据客户的需要定制报告。比如:业务操作人员关心运营中的问题、业务的进展, 而管理层更关心业务所面临的威胁、业务趋势的变化等。
有效的报告体系可确保服务管理人员信心十足地做好计划, 以可控的方式向客户提供满意的服务, 并以可持续发展的方式充分利用各种资源。如果没有“服务报告”来记录并衡量绩效与目标, 以及相关工作量之间的差距, 那么服务级别协议 (S L A) 对客户来说就是一纸空谈。
同时, 服务报告也是运维人员绩效考核的重要依据, I T服务报告可以详细、准确记录I T运维人员的工作量、工作效率, 以及工作评价。大大增加了管理的有效性, 提高了管理人员对运维人员评估的准确性。
3 IT运维报告注意事项
有效的运维服务报告应该具备以下特点:及时、清晰、可靠、简洁;同时, 满足报告接受者的需求。这类报告都具有很高的精确度, 因此可作为决策支持的有效工具。报告的表现形式应使接受者容易理解和吸收。在设计并产生报告之前, 需要考虑:
(1) 报告内容的完整性, 包括时间、事件、数量、相关人员、环境和总结等;
(2) 报告的时效性, 即生成报告的频率和有效期;
(3) 报告的接受者所关心的信息, 是否完整、准确;
(4) 报告中所使用的词语或算法是否易于接受者的理解。
此外, 各种网络、系统和应用等生成的原始的日志信息本身没有太大帮助, 而业务关键信息也可能淹没在大量原始数据中, 不被人发现。若想使生成的报告有效, 必须进行相应的关联分析, 生成报告的工具应该尽可能准确、智能;同时, 为了产生一个立即见效的视觉效果, 生成的报告用图表的形式表示和总结是很重要的, 如下图针对服务器的运维服务报告。
参考文献
[1]北京神舟泰岳软件股份有限公司.中国I T服务管理指导规范研究[M].北京邮电大学出版社, 2008.
[2]朱海林, 方乐, 梁晟, 等.I T服务管理、控制与流程[M].机械工业出版社, 2006.
[3]IT服务报告策略--实现IT服务管理的有效沟通[Z].
IT运维服务 篇2
福建移动业务支撑中心 数据中心IT运维外包
投标文件购买时间:
201x年XX月XX日
1、投标人资格要求
投标人必须提供有效资料证明符合如下投标资格要求:
1) 投标人必须为主营业务为IT服务的合法的独立法人,注册资金不少于(含)5000万人民币,不允许联合投标,营业执照复印件加盖公章有效;
2) 投标方获得覆盖体系为“计算机系统的运行维护、维修服务及相关活动”的ISO9001质量管理体系认证,且时间不低于五年,认证复印件加盖公章有效;
3) 投标人必须具有ISO0体系认证,认证复印件加盖公章有效;
4) 投标人必须具有ISO27001体系认证,认证复印件加盖公章有效;
5) 投标人必须具备7×24小时运行的服务中心提供电话及远程支持能力,并且接受用户实地考察;
6) 投标人必须具备资信等级为“AAA”的资信等级证书, 认证复印件加盖公章有效;
7) 投标人至少提供4个中国移动下属分公司的数据中心业务支撑系统的IT运维外包项目案例(当前依然在提供服务的案例),并接受用户现场考察;
8) 投标人至少提供5个超过100万的电信运营商IT系统运维外包项目经验,并且接受用户对最终用户的参观和实地考察,以及随时接受用户的合同审查;
9) 投标人需要有用于该项目服务的IT服务管理系统(ITSM平台),并且为该项目在现场独立安装设置及使用(不允许与其他客户共享使用);
10) 投标人ITIL认证人员必须大于3人,并且提供人员社保证明加盖公章有效;
11) 投标人至少1名IS20000运维体系专家认证(Certified ISO20000 Consultant),并且提供人员社保证明加盖公章有效;
12) 投标人至少1名ISO27001安全体系主审师(ISO27001 Certified ISO27001/17799 Leader Auditor),并且提供人员社保证明加盖公章有效;
2、服务范围
该项目IT运维外包服务主要包括业务支撑中心所有IT系统的服务器、存储系统、磁带库、数据库、中间件及数据备份系统的日常维护管理、系统调整、故障处理、性能调优、工程实施配合等相关工作。
1) 服务器包括HP、IBM、SUN等各种档次小型机服务器和PC服务器。
2) 存储系统包括EMC、HP、IBM、SUN、STK等各种档次磁盘阵列。
3) 磁带库系统包括STK、HP、ATL、IBM等企业级磁带库系统。
4) 中间件包括BEA TUXEDO交易中间件和BEA WEBLOGIC等中间件。
5) 数据备份系统包括VERITAS、HP、IBM、LEGATO等备份软件。
3、服务内容
1) 日常维护工作
(1) 日常维护是按照买方操作维护规程对IT系统平台软硬件进行日常检查,达到预防性维护的目的,尽量把系统故障消灭在萌芽状态,使系统可用性最大化。
(2) 进行IT系统平台定期(日、月、季度)巡检和健康检查,并填写相应的巡检记录。
(3) 进行IT系统例行维护工作,执行维护作业计划。
(4) 做好应用系统业务处理高峰期间系统监控和维护工作。
(5) 根据网管系统告警信息,主动处理和消除系统日志告警。
(6) 跟踪、评估系统运行状态和趋势,并提交相应的运行评估报告。
(7) 根据IT系统软硬件供应商发布的信息或系统评估结果,对IT系统平台进行软件更新、加载补丁等工作。
(8) 为买方设立用户档案和更新程序文档,加强系统的版本管理,便随时监控系统运行状况。
2) 系统调整工作
(1) 系统调整是根据日常维护、故障处理、系统优化等工作发现买方系统平台或应用的潜在风险,主动进行调整系统参数配置、系统架构调整或配合应用系统进行系统平台的配置调整等工作。
(2) 根据系统运行评估结果,卖方参与或独立制定系统调整计划。
(3) 根据买方要求,卖方落实执行经过讨论、评估的系统调整计划,调整计划完成后3个工作日内提交系统调整评估报告。
(4) 配合买方应用系统割接、上线,进行系统平台相关调整工作。
(5) 其他系统调整工作
3) 故障处理工作
(1) 故障处理是指严格按照买方系统故障处理流程,通过协同工作,对现场发生的系统故障及时作出判断,使系统故障能在最短的时间内得到解决。
(2) 故障处理过程主要包括系统平台故障定位、故障分析、制定故障修复方案、现场故障处理配合、提出改进措施等方面。
(3) 故障处理过程中如果发现是硬件故障,卖方需要代表卖方向卖方指定的维保服务供应商以卖方名义提出维保服务要求,并且协助维保服务供应商进行硬件故障备件的更换及直到故障恢复。
(4) 在故障处理完毕后,卖方1个工作日内提交故障处理工单;如果故障级别为严重、重大故障,必须在3个工作日内提交故障分析总结报告。
(5) 卖方在日常工作时间内要即时响应;节假日如有现场值班,即时响应;星期六、星期日和晚上非工作时间半小时内响应,1小时内赶到现场;如无现场值班,国定假日1小时内响应,4小时内赶到现场;
(6) 在代维服务期内,系统因卖方原因造成全部或部分不能正常运行时,卖方应在接到买方电话通知后48小时内为买方排除故障,2小时内系统恢复;对于因其他原因造成全部或部分不能正常运行时,卖方应在接到买方电话通知后在买卖双方商定的时间为买方排除故障。
(7) 如在服务期内,系统不能正常运行,卖方有责任对系统故障进行诊断。如诊断结果涉及到原厂或买卖双方商定确认的第三方设备及软件,卖方负责协助用户协调供货商解决第三方产品及软件的故障。
(8) 在服务期内如果出现非卖方原因的不可预料的系统瘫痪,卖方将尽力帮助买方在最短时间内对系统进行维护或恢复。
(9) 卖方将派技术人员与买方技术人员共同值班,处理各类业务问题和系统故障。
4) 性能调优工作
(1) 性能调优是对买方IT系统软硬件运行的现状和历史数据作综合性分析和归纳,提出运行的合理化改进优化建议,使IT系统发挥更大的效益。
(2) 卖方要做好IT系统平台性能监控、分析和跟踪,并提交评估报告和改进建议。
(3) 按照买方要求,落实系统调优方案;
(4) 配合应用系统进行系统调优等工作。
(5) 每月至少进行2项性能调优评估专题工作,每次性能调优评估涉及的软硬件总量不少于全部系统的四分之一或1套应用系统。
(6) 性能调优具体实施计划由买卖方协商确定或执行。
5) 项目实施配合工作
(1) 项目实施配合是卖方配合买方做好IT系统扩容工程实施的相关工作。
(2) 卖方参与项目实施方案论证,并提出技术改进建议。
(3) 卖方参与项目实施现场配合,协助买方做好项目参与各方的现场管理和监督。
(4) 卖方协助买方做好项目实施评估;
(5) 卖方协助买方进行现场随工配合和系统测试工作
4、服务考核
对于买方支付的全部服务费用,保留其中的10%作为质量监督款,用于进行服务质量考核后的费用支付。在服务结束后,根据双方认可的服务验收报告后卖方可按下述计算方式取得服务质量监督款。
服务质量监督款将在服务结束后,考核期测评总分小于95分时,且买方出具了双方认可的验收报告后支付,买方支付给卖方,计算方式为:实际支付款=服务质量监督款×(考核期测评总分-60)/35;考核期测评总分高于等于95分时,买方支付给卖方全额服务质量监督款;考核期测评总分低于等于60分时,买方将不支付质量监督款。
IT运维服务 篇3
2015年金明源主要做了三项重点工作,首先是服务的转型升级,在原有的技术服务团队的基础上引入标准化规范化的服务理念,依托自有的云雀运维云平台,提升服务质量,体现服务价值。第二是公司原有产品线的细分,确定集成服务、软件服务、运维服务为公司主营业务方向。第三是加强与产业创新联盟的合作共赢。2015年实现营业额6500万元,整体利润同比增长近10%。
目前,金明源主要服务项目包括:河南省财政惠民补贴资金管理一卡通、行政执法与刑事司法信息共享平台(简称两法衔接平台)、云雀运维云平台、智慧城市设计规划与建设等。金明源服务客户以政府部门、企事业单位为主,包括司法、财政、社保、邮政、银行、电力、运营商等。其中,两法衔接平台是借助于专用的加密网络,实现各行政执法机关与司法机关之间执法资源共享。目前,金明源已中标或运营河南省、湖北省、河北省、辽宁省、重庆市、西藏自治区等多个省市的两法衔接平台,在政府部门中赢得了良好的口碑。
与此同时,贾丹丹表示中小企业将成就更多万亿级的市场机会,中小企业也将成为公司接下来三年市场拓展的重点。
金明源制定了明确的五年发展规划:2016年为战略年,完成战略布局,确定集团化发展格局,将优势资源与优势团队重新组合;2017年为运营年,从项目建设商向模式运营商角色的转变,加强同曙光、奇虎360等机构在智慧城市、安全服务等方面的合作;2018年为数据年,从内控型管理公司向资本型运作公司的转变,引进战略资本,做实产业生态布局,启动上市计划;2019年为效益年,实现集团化企业发展战略,集团营收破十亿,成功包装出两家新三板上市子公司;2020年为品牌年,做到细分领域的第一,同时完成集团公司的综合营收水平进入全国百强。
资本投资是实现发展战略的主要一环。目前,金明源主要的工作是落实战略布局和引进资本合作伙伴。公司与专业创投公司对接,比如IDG、红杉资本以及省内的高科创投等。
贾丹丹表示金明源对于投资的态度是既保证企业发展的资金需求,又把财务风险控制在可控的范围,更好地促进企业良性发展。
2016年金明源的战略重点是从产品提供商向服务提供商的转变。首先,加强在全国检察院业务软件领域的投入,开发出关键科室的核心应用,丰富基于电子检务建设的产品体系。其次,客户向云雀运维体系的导入,全面推进云雀运维服务体系建设,实现闭环系统建设。第三,启动自主可控安全体系计划。
IT运维服务 篇4
当前, 国内已经步入“服务经济”的发展阶段, 以现代服务业为主导的现代产业体系也逐步建立起来。信息化在提升企业的运营效率和核心竞争力的同时, 也使企业对信息化的需求和依赖程度不断提高, 而IT运维服务作为现代服务业的重要组成部分, 为企业信息化提供了强大的支撑。因此, IT运维服务越来越受到各级政府和各类企业的重视。在IT运维服务业蓬勃发展的同时, IT运维服务的质量问题也引起了相关客户和服务提供商的关注。
笔者有幸参加了W公司所承接的广州市某信息中心网络平台与IT设备维护项目 (以下简称本项目) 的IT运维服务质量改进工作。在提供本项目的服务过程中, W公司收到了客户方领导层对服务质量的严重不满和投诉。笔者作为公司后端的IT服务管理咨询顾问, 受命启动专门针对本项目的IT运维服务质量改进项目 (以下简称本质量改进项目) , 着手改进其服务质量并提高客户满意度。本文将笔者在本质量改进项目中的主要实施方法和过程进行介绍和展现, 希望能够给同样关注IT运维服务质量的同行们一点启发和帮助。
1 对客户需求与服务现状的调研和分析
任何服务质量的改进都是源于对客户需求的高度关注和对服务现状的调研和分析[1]。笔者在介入本项目之初, 就将重点工作放在对客户需求的调查了解、以及对IT运维服务现状的调查与分析两个方面。
通过与客户方和前端一线服务团队的充分交流、以及对服务情况的现场调研, 并在此基础上进一步调阅和分析了本项目的招标文件、投标文件、项目合同书等关键资料, 笔者了解到W公司在IT运维服务提供过程中主要存在以下四个方面的不足, 需要进行重点质量改进, 以尽快提高用户的服务体验和客户满意度。
(1) 没有为客户提供针对三年服务期的一整套目标明确的工作计划和时间表;没有帮助客户理清和优化IT服务管理业务流程;在日常服务过程中没有认真落实IT资产管理办法, 没有为客户提供一套定制的IT资产管理系统软件并有效使用起来, 最终导致客户的IT资产失去应有的管理, 过去一年中IT资产数据基本没有与实际情况同步变更, 目前整个IT资产数据不全不实。 (2) 客户需要对全区电子政务网络提供系统化的诊断和保养, 解决目前该网络可靠性不高、上网速度慢的隐患, 这项工作一直没有开展;客户强调提供服务的应当是一个有技术梯度的专业网络团队, 而不仅仅是一名前端服务工程师。 (3) 提供服务的IT服务工程师技术能力不足, 一个故障要反复上门几次才能解决, 服务只能依赖于个别技能较好的服务工程师。 (4) 每月例会上客户提出的服务目标和要求尽快改进的重大问题基本无法实现, 计划和执行情况的检查工作没有开展, 用户的真实需求没有上传到公司, 造成公司的决策偏差。
上述四个方面的问题, 可以通过运维服务计划和实施方案、资产普查、IT资产管理系统软件的定制开发与应用、专业网络团队的诊断和保养、知识管理和业务培训、团队管理、问题管理、会议管理等方法分别予以解决。但是, 如果只是采取“头痛医头、脚痛医脚”的方法解决眼前的问题, 也很难真正解决客户在未来可能遇到的其它问题, 只有充分挖掘上述四个方面问题的根源, 从根本上解决导致这些问题的本质原因, 才能真正保证以后的服务能够充分满足客户的需求。因此, 笔者对造成上述问题的根本原因进行了分析, 发现这四个方面的问题, 主要来源于两个方面:一是W公司对客户需求的理解偏差和沟通不畅, 二是W公司没有一整套严格的标准化的IT运维服务规范和管理制度。由于沟通不畅和需求理解偏差, 所以客户的重点需求没有得到应有的重视和实现;由于缺乏标准化的IT运维服务规范和管理制度, 所以需求理解偏差没能及时发现和纠正、计划和检查没有开展、不能发挥团队能力。而这两个方面的最根本原因, 则是W公司没有真正建立科学的标准化的IT运维服务管理体系。因此, 笔者将本质量改进项目的工作重点放在IT运维服务管理体系建设方面。
2 质量改进项目的工作计划与项目启动
在明确了本质量改进项目的工作重点以后, 在着手开始质量改进工作之前, 首先要得到客户和W公司双方领导的确认, 以保证质量改进项目的工作能够真正实现对运维服务质量的改进目标。因此, 笔者在前期调研和分析基础上, 草拟了《运维服务质量改进工作计划书》, 在征求双方领导和运维服务团队负责人等主要项目干系人的意见并获得通过后, 召开了“运维服务质量改进工作项目启动会”。启动会上有客户方领导、W公司高层领导、运维服务团队负责人 (包括运维服务项目经理和W公司运维服务中心项目总监) 、运维服务质量改进项目负责人 (笔者) 和其他项目干系人到会参加。通过项目启动会的召开, 将本质量改进项目的项目目标和工作范围、项目组织结构 (如图1所示) 、主要项目团队成员和分工、项目工作内容和工作方式、项目进度计划等内容进行了讨论和确认, 从而正式将质量改进工作以项目化运作的方式确立下来, 并使本质量改进项目的目标和范围得到各方面的正式确认, 从而为质量改进工作的顺利开展创造了一个良好的工作环境和管理基础。
根据项目启动会上确定的质量改进工作计划书, 本质量改进项目的总体目标包括完善运维服务管理体系建设、IT资产与运维管理系统软件的定制开发、IT资产普查与资产数据库的建立和维护、网络诊断和优化及其整体解决方案的提供、加强对IT服务工程师的服务规范和服务技能的培训、进一步完善运维知识管理和知识库、对用户提供常用软件使用和常见故障处理的培训等七个方面。在这七个方面的总体目标中, 第一个目标“IT运维服务管理体系的建设”是重点, 其它六个目标在完成相应的工作任务后, 都要将其工作内容形成规范和制度, 并集成到IT运维服务管理体系中去, 从而保证W公司在今后的IT运维服务过程中、以及其他的IT运维服务项目中, 能够始终保持改进后的服务质量, 并使本项目的经验得以固化和重复使用。因此, 笔者将本质量改进项目的工作重点集中在“IT运维服务管理体系建设”这个目标上, 其他目标的实现则根据任务类型由其他项目干系人分工负责。例如, “IT资产与运维管理系统软件的定制开发”由W公司软件研发中心负责人负责完成;“IT资产普查与资产数据库的建立和维护”和“对用户提供常用软件使用和常见故障处理的培训”由运维服务项目经理负责完成;“网络诊断和优化及其整体解决方案的提供”由W公司运维服务中心二线专家团队负责、“加强对IT服务工程师的服务规范和服务技能的培训”和“进一步完善运维知识管理和知识库”由W公司运维服务中心后端的IT运维服务管理咨询团队负责。这样分工负责后, 质量改进项目的七个目标就得以落地执行。
3 IT运维服务管理的实施框架与体系建设
在IT运维服务管理体系建设工作中, 首先需要确定一个科学的IT运维服务管理实施框架。目前实施IT运维服务管理的较成熟和普遍的方法是ITIL最佳实践[2]和ISO20000国际标准。综合企业再造理论[3]、多层BPR实施体系结构[4]和技术管理咨询的PPT模型, IT运维服务管理的规划与实施, 需要从作业流程 (Process) 、组织架构 (People) 、管理与评估系统 (Management) 、IT技术和工具 (Technology&Tool) 、企业文化和观念 (Culture) 这五个方面进行考虑[5];一般情况下, 可以从前四个方面 (即PPMT实施框架) 实施IT运维服务管理, 然后逐渐向第五个方面 (即企业文化) 渗透 (如图2所示) 。因此, 在本质量改进项目的IT运维服务管理体系建设中, 笔者采用PPMT实施框架进行服务管理体系的设计和实施。
根据PPMT实施框架及项目需求, 本质量改进项目的IT运维服务管理体系建设的主要内容包括IT运维服务管理业务流程及其配套的数据表单和统计报表的设计、运维服务管理组织结构及其岗位职责的设计、运维服务规范和管理制度的建立、IT资产管理及运维服务管理系统软件的设计与开发等四个方面, 在完成上述四个方面的设计以后, 再将设计结果在IT运维服务项目过程中实施和应用。在设计和实施时, 均要遵守“作业流程→组织架构→管理与评估系统→技术和工具→企业文化”的先后顺序。
4 IT运维服务管理体系建设的具体内容
根据W公司与客户的项目合同及其招标文件要求和投标文件承诺, 在本质量改进项目中的IT运维服务管理体系建设可以从本项目的IT运维服务范围和服务方式与服务级别、运维体系框架和各服务管理工作流程、运维服务组织结构及岗位职责、相关服务规范和管理制度、相关数据表单的格式设计与填写说明、相关统计报表的格式设计与数据来源、IT资产管理和运维服务管理系统软件的需求分析与设计说明等七个方面进行展开。在这七个方面的设计过程中, 要兼顾考虑吸收本质量改进项目的另外六个目标在工作中形成的规范和制度, 将其经验和成果集成到IT运维服务管理体系中来。
4.1 IT运维服务范围和服务方式与服务级别一般是由招标文件的要求和投标文件的承诺所决定的, 然后再结合IT运维服务提供商 (例如W公司) 的管理水平和服务质量现状进行设计和规定。
4.2运维服务体系框架主要对所有的运维服务管理流程及其相互之间的关系进行总体规划和说明, 并通过服务管理流程关系图对各流程的前后衔接关系进行描述和说明;然后通过各服务管理工作流程的详细流程图对各工作流程在各种情况下的处理规则进行描述和说明。在本项目中的运维服务管理流程, 主要包括服务级别管理、IT资产管理、日常工作管理、常用服务流程、备件管理流程、桌面运维流程、网络运维流程、其他工作流程等八个方面, 每个方面又包括多个服务管理流程, 总共包括21种管理流程。究竟应当包括哪些流程, 应当根据具体运维服务项目的实际情况和客户需求, 结合ITIL最佳实践和ISO 20000标准进行梳理和设计。
4.3运维服务组织结构一般由IT运维服务提供商和客户双方参与本项目的人员组成, 一般可以分为一线、二线、后台支持、第三方支持等四个级别;运维服务项目经理一般介于一线和二线之间, 作为一线服务团队的管理者, 同时也是二线服务团队的成员之一。在确定了服务组织结构后, 再根据所设计的各运维服务管理流程的需要进行岗位分工, 再根据岗位分工确定各个岗位的职责;通常可以分为客户方管理人员、运维服务项目经理、服务台、服务工程师、配置管理员和服务助理等岗位或角色。
4.4相关服务规范和管理制度一般是指在IT运维服务管理流程以外、无法或不便于通过流程方式进行规范的管理制度和相关规定。它作为运维服务管理流程的有效补充, 使IT运维服务的提供过程实现进一步的科学化和标准化。在本项目中的相关服务规范和管理制度主要包括服务台工作规范、日常运维服务规范、网络运维服务规范、资产普查工作规范等方面。其中服务台工作规范又包括服务热线接听规范、故障判断技术规范、事件类别判断方法、事件优先级判断方法、服务单回访规范等;日常运维服务规范又包括上门维护服务规范、备件库管理规范、运维档案管理规范等;网络运维服务规范又包括网络设备日常维护规范、网络安全运维规范等;资产普查工作规范又包括普查工作组织架构、普查人员上门服务要求、普查准备工作、普查工作注意事项、普查数据检查标准、普查数据录入和统计规范等。具体应当包括哪些服务规范和管理制度, 也没有一定之规, 主要根据具体项目的实际情况和服务管理需要而制定, 制定者需要具备一定的项目管理、服务管理和质量管理的基本知识和经验。
4.5相关数据表单的格式设计主要是根据各运维服务管理流程的需要, 在某些服务管理流程的某些环节需要工作人员填写相应的数据表单, 则根据该环节和整个流程的需要、以及后期统计报表采集数据的需要进行表单内容和格式的设计。在本项目中的数据表单包括了常用数据表单、备件管理表单、桌面运维表单、网络运维表单、资产普查表单和其他表单等六大类。其中常用数据表单包括服务单、用户投诉处理单、收款服务单等;备件管理表单包括备件借用登记表、备件清单、备件出入库登记表等;桌面运维表单包括设备采购验收单、设备采购汇总表、设备采购明细表、资产报废登记表、资产报废意见书、供应商维修设备回执单、设备维修回执单、设备维修报价单、设备采购报价单、升级换件登记表、用户入网申请单等;网络运维表单包括网络故障报告、网络系统端口登记表、配线间钥匙借用登记表、网络巡检报告表等;资产普查表单包括资产登记表、资产普查汇总表、资产普查明细表、资产标签等;其他表单包括知识库表单、配置变更登记表、日报检查问题记录表等。
4.6相关统计报表的格式设计主要是根据IT运维服务管理的各种管理需要, 从各服务管理流程和相关数据表单及数据库等数据源中采集数据, 从而对需要生成的相关统计报表的格式和数据来源进行设计, 其主要目的是供运维服务团队的管理者和客户方管理人员了解运维服务状况, 并据此进行服务管理。在本项目中的统计报表主要包括服务单统计报表、故障报修统计报表、硬件故障统计报表、网络故障统计报表、软件故障统计报表、服务质量统计报表、资产统计报表、服务费用统计报表、运维服务周报和月报表等九大类, 在每个大类中又包括多种具体的统计报表, 共计有45种统计报表需要进行格式设计和说明。
4.7 IT资产管理和运维服务管理系统软件是对前述的服务管理流程、服务组织结构、服务规范和管理制度、数据表单、统计报表等内容的固化, 通过计算机软件系统的方式将其固化到计算机程序中, 从而保证这些管理规则的严格执行。因此, 对该系统软件的需求分析与设计应当在前述各个方面的设计基础上进行, 同时兼顾今后可能存在的变革, 并适当考虑软件系统的灵活性进行系统分析和设计。根据本项目的具体需求, 其IT资产管理和运维服务管理系统软件的功能模块主要包括个性化视图、事件管理、网络运维管理、资产管理、运维档案管理、厂商资料管理、知识库、统计分析报表、用户意见反馈、系统管理等。
5 项目实施结果与结论
笔者根据本文前述的实施方法和过程, 对本项目的运维服务质量进行化化和改进。由于本项目的服务质量对客户和W公司双方都有较大影响, 所以本质量改进项目得到了双方各级领导的重视和大力支持, 从而较顺利地完成了质量改进工作任务, 取得了预期的质量改进效果。
本质量改进项目的成功实施, 验证了笔者在实施过程中所应用的项目化管理和实施方法、PPMT运维服务管理实施框架、IT运维服务管理体系建设的主要内容等, 在IT运维服务管理及其质量改进中是行之有效的。IT服务管理体系的建立, 使服务提供商“建立起一套持续改进的机制, 使自己能不断地发现问题、解决问题”[1], 从而从根本上解决了服务质量问题。这对关注IT运维服务管理及其服务质量的其他同行们, 无论是客户还是服务提供商, 均具有一定的参考价值和借鉴意义。
参考文献
[1]戴颖达.质量管理实务教程[M].北京:科学出版社, 2009.
[2][荷兰]Jan van Bon.IT服务管理——基于ITIL的全球最佳实践[M].章斌, 译.北京:清华大学出版社, 2006.
[3]李福海.管理学新论[M].成都:四川大学出版社, 2002.
[4]陈禹六, 李清, 张锋.经营过程重构 (BPR) 与系统集成[M].北京:清华大学出版社、施普林格出版社, 2001.
IT运维服务 篇5
本文档中的信息如有更改,恕不另行通知。
本文档版权归北京金商祺软件有限公司所有,翻印必究。
未经北京金商祺软件有限公司书面许可,除非版权法允许,不准以任何形式对本文档进行复制、改编或翻译。
北京金商祺软件有限公司对本文档不作任何担保,包括但不限于适销性和特定用途适用性的隐含担保。北京金商祺软件有限公司对本手册中包含的错误以及与其功能或使用有关的直接、间接、特殊、偶发或者继发性损失不负任何责任。
质量保证
北京金商祺软件有限公司承诺若是在保修期间(自您收到软件之日起的三十天内)装载软件的介质确实出现质量问题,北京金商祺软件有限公司将负责更换相同类型的软件介质产品。北京金商祺软件有限公司保证,更换的软件介质,其品质完全相同。
可以从北京金商祺软件有限公司或其授权的销售与服务机构索取适用于您所购买的金商祺综合网管产品及更换部件的特定保修条款。
有限权利许可
本软件及附属产品,受到版权法的保护。北京金商祺软件有限公司拥有该软件最终所有权,您只要接受本许可协议,即可具有一定的使用权利。除非本许可证协议的补充协议有所修改,否则您使用本软件的权利和义务仅限如下:
(1)若在装载本软件的介质中只包含一个版本,则只能安装一套软件;若介质中包含该软件的多个版本,则只能安装和使用其中一个版本的副本。(2)对软件介质中装载的文件进行备份,或者复制到计算机硬盘中而将原始文件作为档案进行保存。
(3)未经北京金商祺软件有限公司官方书面允许,该软件介质不得转让。(4)不可以复制本软件附带的相关文档。
(5)不可以再次授权、出租、或出借本软件的任何部分。
(6)不可以通过反向工程、反编译、反汇编、修改、翻译和其他方法来试图获取该软件的源代码,或用该软件进行派生工作。
商标许可:
Sunny,是在中国的注册商标,为北京金商祺软件有限公司独家所有。北京金商祺软件有限公司对本文档中述及的其它公司的商标和产品名称不拥有任何专利权。
注意:
由于软件版本不同,所提供给您的软件版本中所包含的某些功能不一定与该手册的介绍完全相同。
北京金商祺软件有限公司仅允许您在接受协议许可中的各项条款的情况下,才可以使用本软件产品。请仔细阅读各项条款。目录
目录
法律声明....................................................................................................1 质量保证....................................................................................................1 有限权利许可............................................................................................1 商标许可:................................................................................................2 注意:.......................................................................................................2 目录....................................................................................................3 安装网首IT运维服务平台...............................................................1
硬件要求....................................................................................................1 安装过程....................................................................................................1 启动系统....................................................................................................4 资源列表............................................................................................8 系统设置............................................................................................9
个人信息............................................................................................9 授权管理..................................................................................................10 授权信息..........................................................................................10 申请授权..........................................................................................10 授权更新..........................................................................................11 角色管理..................................................................................................13 角色列表..........................................................................................13 添加角色..........................................................................................14 用户管理..................................................................................................14 用户列表..........................................................................................14 添加用户..........................................................................................16 菜单管理..................................................................................................16 菜单列表..........................................................................................16 添加菜单..........................................................................................18 权限管理..........................................................................................19 文件管理..........................................................................................19 分组管理..................................................................................................22 启用分组..........................................................................................22 用户组管理......................................................................................22 用户组对设备权限设置..................................................................23 设备对用户的权限设置..................................................................24 系统设置..................................................................................................24 SNMP参数设置...............................................................................24 网络时钟设置..................................................................................24 系统IP地址设置.............................................................................24 网络管理..........................................................................................25
网络设备..................................................................................................25 扫描设备..........................................................................................25 设备列表..........................................................................................27 IPV6三层设备列表.........................................................................32 批量修改..........................................................................................34 批量端口修改..................................................................................35 批量删除..........................................................................................35 厂商列表..........................................................................................36 设备类型列表..................................................................................37 导出交换机信息..............................................................................40 导出端口信息..................................................................................41 导入端口信息..................................................................................42 设备逻辑关系列表..........................................................................42 重复设备列表..................................................................................45 拓扑管理..................................................................................................46 无线AP管理...........................................................................................55 无线AP列表...................................................................................55 导出无线AP信息...........................................................................57 导入无线AP信息...........................................................................58 批量添加无线AP............................................................................59 查询服务..................................................................................................60 IP查询.............................................................................................60 MAC查询.........................................................................................60 房间查询..........................................................................................61 端口查询..........................................................................................62 IP与子网管理.........................................................................................62 全部IP地址段列表.........................................................................62 可用IP地址段列表.........................................................................63 子网信息列表..................................................................................64 IP地址使用情况..............................................................................64 扫描子网信息..................................................................................65 统计分析..................................................................................................65 端口利用率......................................................................................65 主机管理..........................................................................................67
扫描服务器..............................................................................................67 服务器列表..............................................................................................69 服务器连接信息......................................................................................71 批量修改..................................................................................................72 批量删除..................................................................................................73 导出服务器信息......................................................................................73 导入服务器信息......................................................................................74 导出服务信息..........................................................................................75 导入服务信息..........................................................................................76 服务器监控..............................................................................................76 内部监控..................................................................................................76 监控告警..........................................................................................84
网络异常关注..........................................................................................85 ARP使用排名..................................................................................85 子网IP使用排名.............................................................................86 IP频繁变化排名..............................................................................86 端口流量排名..................................................................................87 错包排名..........................................................................................88 告警管理..................................................................................................90 告警列表..........................................................................................90 告警发送设置..................................................................................90 邮件服务器设置..............................................................................91 短信服务器设置..............................................................................91 监控图管理..............................................................................................92 流量图管理......................................................................................92 查看流量图......................................................................................94 端口流量监控..................................................................................94 监控图列表......................................................................................95 端口实时监控..................................................................................96 自定义监控......................................................................................97 自定义监控设备类型......................................................................97 自定义监控设备属性......................................................................98 自定义监控设备..............................................................................99 在线用户列表..................................................................................99 历史用户列表................................................................................100 在线用户数量监控图....................................................................100 自定义绘图....................................................................................102 告警日志................................................................................................103 设备告警日志清理........................................................................103 日志保留时间设置........................................................................103 网络监控................................................................................................104 网络监控点列表............................................................................104 网络监控设置................................................................................105 运维管理........................................................................................106
维修记录................................................................................................106 设备维修记录................................................................................106 导入维修记录................................................................................107 导出维修记录................................................................................108 工作流程................................................................................................108 事件类型管理................................................................................108 自定义事件描述............................................................................109 增加事件........................................................................................109 完成事件........................................................................................109 配置备份................................................................................................110 交换机配置备份............................................................................110 知识库管理............................................................................................111 文章管理........................................................................................111 类别管理........................................................................................112 查看报表................................................................................................113 交换机CPU使用率.......................................................................113 交换机端口流量报表....................................................................114 全局流量监控报表........................................................................114 服务器监控报表............................................................................115 传感器温湿度报表........................................................................115 告警报表........................................................................................116 机房管理........................................................................................117
园区管理................................................................................................117 园区列表........................................................................................117 建筑物管理............................................................................................118 建筑物列表....................................................................................118 机房管理................................................................................................119 机房列表........................................................................................119 机房拓扑........................................................................................121 网络摄像机列表............................................................................122 视频监控中心列表........................................................................124 传感器列表....................................................................................125 机柜管理................................................................................................127 机柜列表........................................................................................127 机柜图............................................................................................130 配线架管理............................................................................................130 配线架列表....................................................................................130 导出配线架信息............................................................................132 导入配线架信息............................................................................132 网络日志........................................................................................134
网络日志................................................................................................135 历史日志下载................................................................................135 资产管理........................................................................................136
项目管理................................................................................................136 项目类型列表................................................................................136 项目列表........................................................................................137 合同管理................................................................................................138 合同列表........................................................................................138 资产管理................................................................................................139 资产类型列表................................................................................139 资产列表........................................................................................139 批量添加资产................................................................................140 批量添加资产编号........................................................................140 导入资产........................................................................................141 导出资产........................................................................................141 导入在线设备........................................................................................142 在线交换机列表............................................................................142 在线服务器列表............................................................................142 导入全部在线设备........................................................................142 FAQ..................................................................................................143
扫描设备................................................................................................143 拓扑图...................................................................................................143 服务器监控............................................................................................144 故障报警................................................................................................146 导入导出................................................................................................147 网首IT运维服务平台名词解释...................................................148
网首IT运维服务平台用户手册
安装网首IT运维服务平台
硬件要求
推荐配臵:独享服务器,64位,2G内存,硬盘空间20G。
安装过程
在安装系统之前,先进BIOS校准一下机器的时间。
将服务器设臵为光盘引导启动,将光盘放入光驱,启动服务器。
服务器将由网首IT运维服务平台安装光盘引导启动,开始安装过程。
安装光盘自动引导后,点击回车开始安装,进入安装位臵选择界面。网首IT运维服务平台用户手册
在“安装位臵选择”选项处,选择整个硬盘,确认后单击“Next”进入下一步。
系统将格式化硬盘,并进入自动安装过程,此后过程无需人工干预。网首IT运维服务平台用户手册
安装完成后系统提示“安装完成”。网首IT运维服务平台用户手册
取出光盘,单击“Reboot”按钮重新启动系统。
启动系统
启动系统后,由网首IT运维服务平台系统引导。网首IT运维服务平台用户手册
进入登陆界面。网首IT运维服务平台用户手册
用户名:root,密码:sunnybupt2008。首次使用配臵:
登陆后,在命令行模式输入setup进入配臵工具。选择“Network configuration”后,选择“Run Tool”运行配臵工具。
选择需要配臵的网卡设备,点击回车进入设臵界面。网首IT运维服务平台用户手册
配臵IP地址,子网掩码,网关等参数。
修改完成后保存退出,即配臵完毕。在命令行界面下重启网卡。
安装配臵完成,打开浏览器,在地址栏输入服务器IP即可登陆网首IT运维服务平台。网首IT运维服务平台用户手册
资源列表
通过设备视图、逻辑视图、服务器告警信息、交换机告警信息等显示系统总体情况。
设备视图显示管理的设备状况,包括服务器主机、三层设备、二层设备数量。点击链接即可查看服务器列表、三层设备列表以及二层设备列表。
逻辑视图显示拓扑管理状况,直观的显示拓扑名称、核心设备、设备数,点击查看即可查看所选的拓扑图。
服务器、交换机等各种告警信息显示当前设备告警情况。告警信息实时动态刷新。
若存在状态异常的设备,每隔三分钟,系统会发出报警音。点击“取消警报”,即可取消所选设备的声音告警,点击“恢复警报”即可恢复所选设备的声音告警。网首IT运维服务平台用户手册
系统设置
个人信息
所有用户默认密码为:1111。登陆后点击“系统设臵”菜单,修改个人信息。
1.修改身份信息和密码
填写新密码,真实姓名,手机号码及电子邮件地址,点击提交。网首IT运维服务平台用户手册
授权管理
授权信息
显示授权信息,包括授权方式(测试授权、正式授权)、使用单位、授权节点数量、使用节点数量、使用时间、服务期限、短信告警等。
申请授权
点击“下载授权申请文件”链接 网首IT运维服务平台用户手册
保存下载文件,将授权申请文件通过电子邮件发送到nms@nms.com。
我们将生成新的授权文件,并回馈给您。
授权更新
上传新的授权文件,提交后即可更新授权。
授权完后需要修改时间,有两种情况,如果服务器可以访问外网,可以在软件中添加一个网络时钟服务器地址,用户单位自己有的可以添加自己的,没有的,可以添加北邮的一个NTP服务器地址,ntp.bupt.edu.cn; 网首IT运维服务平台用户手册
不能出外网的就命令修改服务器时间。date 110210402011.30 ,命令后的格式为:月日时分年.秒。修改完回车就行。因为如果服务器时间和现实时间有差别的话,生成的流量图等曲线图可能会出现错误。网首IT运维服务平台用户手册
角色管理
角色列表
显示系统现有角色,列出各角色的角色名、父角色和描述。其中系统默认存在“系统管理员”。除“系统管理员”外所有角色均可删除,用户可以自己添加需要的角色。
删除角色:单击“删除”链接,系统提示用户再次确认。以下情况不能删除角色: 1.系统管理员,2.该角色有子角色存在,3.存在该角色属性的用户。网首IT运维服务平台用户手册
添加角色
根据需要填写角色名、角色描述,选择父角色,点击“提交”按钮,新角色即添加成功并在角色列表中显示。
用户管理
用户列表
显示系统现有用户(根据用户角色、用户名排列),列出各用户的用户名、角色、部门、真实姓名、手机和邮箱。其中系统默认存在sysadmin系统管理员,初始密码为“1111”。网首IT运维服务平台用户手册
系统管理员可以恢复用户密码、修改用户属性、删除用户。
恢复密码:单击恢复密码链接,将所选用户的密码臵为初始密码,即“1111”。
修改属性:单击“修改属性”链接,进入修改用户属性页面。选择需要的用户角色,点击“提交”按钮即修改成功。
删除用户:单击“删除”链接,系统提示用户再次确认。网首IT运维服务平台用户手册
添加用户
根据需要填写用户名、选择用户角色,点击“提交”按钮,新用户即添加成功并在用户列表中显示。新添加用户密码为初始密码“1111”。
菜单管理
菜单列表
显示系统现有菜单,包括一级菜单、二级菜单。系统列出菜单名称、菜单深度、父级菜单、默认(是否所有用户可见)、权重(控制菜单显示先后)、路径、权限等。网首IT运维服务平台用户手册
菜单修改:单击“修改”链接,进入菜单修改页面。
如果该菜单为一个实际页面链接,即路径一列不为空,则显示如下。
修改菜单名称、打开方式、父级菜单、路径、默认(是否所有用户可见)、权重等条目,点击“提交”按钮即可进行菜单修改。网首IT运维服务平台用户手册
如果该菜单仅为一个父级菜单名称,则显示如下。
修改菜单名称及权重,点击“提交”按钮即可进行菜单修改。
菜单删除:单击“删除”链接,系统提示用户再次确认。确认后即可删除所选菜单。
添加菜单
根据需要填写菜单名称、选择父级菜单(不选则默认为一级菜单)、权重(默认可留空),点击“提交”按钮即添加菜单成功。注意,新添加菜单下如果没有任何子菜单或没有给这个菜单赋予链接,则菜单不会显示。网首IT运维服务平台用户手册
权限管理
根据角色设臵菜单访问权限。
系统管理员默认具有全部权限。如图所示,管理员可以管理用户,但是不能管理角色,操作员则既不能管理用户也不能管理角色。不具有访问权限的菜单使用时将不会对用户列出。
修改访问权限,对相应的用户勾选相应的菜单,点击“提交”按钮即可完成。
文件管理
显示系统的文件列表,包括文件名、权限管理状态、菜单管理状态。从根目录开始,文件加为蓝色,未设臵访问权限的文件为黑色,已设臵访问权限并作为菜单的文件为红色,已设臵访问权限但未作为菜单的文件为绿色。网首IT运维服务平台用户手册
点击文件夹即可进入所选文件夹,查看其中的文件或文件夹。
单击“import”链接,进入import目录。单击“上一层”链接可回到上一层目录。网首IT运维服务平台用户手册
单击“添加”链接,进入所选文件的菜单添加页面。选择是否作为菜单,如果是则填写菜单名称,否则菜单名称一项留空。选择父级菜单,若作为一级菜单则选择无,作为二级菜单则选择相应的父级菜单;若不作为菜单则选择无。
选择是否默认给所有用户访问权限。
填写权重调整菜单显示位臵,不调整则可留空。点击提交按钮即设臵完成。
单击“编辑”链接,进入所选文件的权限编辑页面。可以给相应的角色设臵访问权限。网首IT运维服务平台用户手册
单击“删除”链接,系统再次提示用户确认。用户确认后即可删除所选文件的权限管理属性和菜单管理属性。
分组管理
启用分组
选择是否启用分组管理,不启用就选择关闭。
用户组管理
点击添加新组可以创建新的用户组。
创建完新组后,可以点击增减用户,把用户加到组里。网首IT运维服务平台用户手册
也可以删除用户组。
用户组对设备权限设置
也可以针对用户组来设臵权限。可以针对不同的设备给予用户组的权限,选择完权限,点击提交。网首IT运维服务平台用户手册
设备对用户的权限设置
单独的某一个设备可以给一个用户组权限,选择设备对用户组的权限设臵。指定设备,赋予权限后,点击提交。
系统设置
SNMP参数设置
设臵SNMP扫描时的参数,包括超时和重试次数。
网络时钟设置
设臵NTP时钟服务器,如果用户自己有自己的时钟服务器可添加进去。
系统IP地址设置
设臵网络运维服务器的IP地址以及网关、DNS等信息。网首IT运维服务平台用户手册
网络管理
网络设备
扫描设备
扫描指定地址段的设备到软件中,填写地址段的地址,如果只填写起始IP,就会只添加当前IP设备,填写地址段则会扫描这个段区间的设备。RCOM需要填写设备SNMP公共体的名称。设臵超时(默认为500毫秒,用户可根据实际网络状况自行设臵)。SNMP的版本如果知道的就选择相应的版本,一般比较老的设备是V1版本,新一点的选择V2。
选择完成后,点击开始扫描。
扫描完成后会显示下图: 网首IT运维服务平台用户手册
扫描结束后,系统提示“扫描完毕”。扫描获取的信息包括:设备IP、设备制造商、设备型号、设备描述名称(如果已设臵)、设备的Layer。扫描完成后,会自动添加到设备列表里。然后就可以创建拓扑图,计算拓扑。
点击修改,可以修改设备信息。1.修改是否开启IPV6、IPV6地址 2.修改品牌、型号
选择设备的品牌,系统会自动根据用户选择的品牌列出相应的型号。网首IT运维服务平台用户手册
3.修改设臵信息
填写设备描述、RCOM、WCOM、Layer、用户名、密码、Enable密码以及CPU告警阀值。4.修改备注信息
填写设备位臵、楼号、房间号。
设备列表
显示所有网络设备信息。包括IP地址、设备描述、厂商、设备类型、几层设备等信息。同时可以查看每台设备的端口信息、端口状态、连接关系,以及可以修改、删除设备信息。
点击“删除”,即可删除此种设备类型(但要保证所管理的设备中没有此型号的)。此外,并不建议用户删除系统自带的交换机类型。
点击“修改”,可以修改交换机类型信息。网首IT运维服务平台用户手册
系统也可以自动探测交换机类型,建议使用自动探测功能添加交换机类型。
1.端口信息
查看及修改设备端口信息。包括楼号、房间号、房间索引。同时支持单条和批量修改。录入信息后,在查询服务中查询IP、MAC、房间等信息可以对网络设备进行快速定位。
点击“删除”,可以删除所选端口。点击“添加端口”,可以手工添加设备端口。
填写端口索引、端口名称、带宽、端口类型、物理地址、楼号、房间号、房间索引。点击“提交”按钮。网首IT运维服务平台用户手册
2.端口状态
查看网络设备的端口(包括虚拟端口)状态,包括:端口、描述、管理状态(up/down,同时以绿/红标明)、带宽(灰色、紫色分别代表无连接、10M、100M、1000M、10000M)、MAC数(当前端口上的MAC信息和)、历史连接MAC、接口地址、连接设备地址、楼号、房间号。综合所有显示信息,管理员可以对设备的状态一目了然。
点击“查看即时信息”,系统对所选设备进行再次扫描,并显示实时状态。网首IT运维服务平台用户手册
点击管理状态中的“up/down”,可以打开/关闭端口(此操作需要有wcom的公共体名称),操作同时会列出当前端口上的MAC数,以及此端口的历史操作记录。其中绿色表示当前状态为UP,红色表示当前状态为DOWN。网首IT运维服务平台用户手册
点击MAC数中数字,即可列出当前端口的MAC信息。
网首IT运维服务平台用户手册
点击连接设备中的IP地址,即可列出所连接的设备信息。
IPV6三层设备列表
可以对IPV6地址的监控,使用的是IPV4和IPV6相结合,同时监控IPV6设备下面使用了多少地址,让管理人员能清楚的知道每个IPV6设备下的用户数量,便于管理。状态栏灯的状态表示当前设备的运行情况。
点击V6地址数下面的数字,可以详细列出这个设备下的用户V6地址、MAC和最后发现时间。
网首IT运维服务平台用户手册
点击“编辑IPV6功能”可以打开/关闭V6、修改V6地址、用户名、密码等信息。
网首IT运维服务平台用户手册
批量修改
可以批量的修改网络设备的RCOM、WCOM、cpu告警阀值、密码和Enable密码。
网首IT运维服务平台用户手册
批量端口修改
可以批量的修改端口属性,如想把VLAN端口改为物理接口。
批量删除
可以从设备列表里删除一个IP段,直接输入IP地址段即可,不用一个一个删除。
网首IT运维服务平台用户手册
厂商列表
可以添加、查看、修改和删除厂商信息。建议不要删除自带的厂商信息。对于有的比较老的设备,带的厂商关键字不同的,可以添加一个关键字进去。如神州数码原来系统自带的关键字是Digital China Networks,但设备不带这个关键字,只带DCS,就可以添加一个DCS进去,注意两个关键字之间用英文的逗号“,”隔开,这样下次扫描出这个设备的时候就能正确认到设备厂商。
点击察看类型自动跳转到设备类型列表里查看不同型号设备的关键字。
网首IT运维服务平台用户手册
如果不能识别的设备需要添加新厂商,比如有的防火墙、流控设备等设备。
设备类型列表
对于未知交换机类型,在所管理的设备中存在未知类型设备时使用。在设备类型列表中点击扫描交换机类型,输入IP地址、RCOM,选择SNMP版本,点击“提交”按钮,系统即可自动探测交换机类型,读取设备中的关键字,供管理员选择厂商和型号添加进去。
网首IT运维服务平台用户手册
然后根据实际情况选择好关键字,关键字一般选用能明确标识出这个设备型号的字符段,一般设备型号的关键字都选用字母带数字组成,如思科7200的关键字可以选用S7200,关键字可以是多个的,注意选择多个关键字时,需要用英文的逗号“,”分隔开,关键字一般是越长越好,越长才越能准确的标识出设备来,越长越不会和别的设备关键字冲突,但注意不能把一些设备自己的信息添加到关键字里去。然后选择厂商和型号,点击提交后就添加到数据库中了。
网首IT运维服务平台用户手册
用户可以手工添加网络设备,当需要添加特殊设备或是不可控的设备时,自动扫描无法获取信息,用户可以选择手工添加设备。
添加设备信息。1.选择品牌、型号
选择设备的品牌,系统会自动根据用户选择的品牌列出相应的型号。2.填写设臵信息
填写设备描述、RCOM、WCOM、Layer以及CPU告警阀值。3.填写备注信息
填写设备位臵、楼号、房间号、价格、购买时间、保修年限及厂商联系人,方便查询。
在设备列表里点击添加交换机。
网首IT运维服务平台用户手册
导出交换机信息
用户可以导出交换机的IP地址、厂商、型号、SNMP公共体名称(包括RCOM、WCOM)、几层设备、CPU告警阀值、描述以及楼号和房间号。
加强IT管控,提升IT运维水平 篇6
【关键词】信息化 量化 管理 流程
【中图分类号】G647【文献标识码】A【文章编号】1672-5158(2013)02-0349-02
近年来,大部分企业信息化建设已初具规模,信息化基础建设基本到位,信息系统渗透到企业生产经营的各个环节。在新的形势下,如何使信息系统更好、更稳定、更安全运行,提高管理效率,落实有效益的信息化,是企业信息化工作的迫切需求。要实现这一目标,必然要管理与服务相结合,要求企业建立以国际行业标准为依据的较为完善的IT管控体系,提升IT运维服务水平。
企业加强IT管控,目的就是建立一个类似“轮流分粥,分者后取”的规则,明确区分母公司与各子分公司(含控股)、业务部门与IT部门和IT部门内部各岗位的责任、权力、利益。责、权、利分清后,对IT部门的约束力、执行力等会有很大的提高,其中IT管控对于组织工作的健康有序开展起到了重要作用。
一、IT管控对于IT工作的重要意义
1.IT管控能保障IT组织的稳定
有效的IT管控对IT组织的控制最主要是职责分离、合理设岗。要求完善人员管理与控制,能清晰定义IT部门相关岗位,能明显一个人能同时给予多少相关权限,从而清楚规划IT部门必要的岗位人数,最大程度保障IT组织的稳定。
2.IT管控能确保IT工作的有序
IT管控必然要求将建立完善的IT流程体系,制定完备服务目录。信息化部门利用服务台统一接收各种流程输入的表单,根据服务级别协议(SLA)和操作级别协议(OLA),对相关需求或故障,安排不同的技术力量,进行针对性的解决,从而确保了IT工作的有序。
3.IT管控能促使IT工作强度的均匀
信息化日常运维工作量不均衡是因为有较多的突发事件,如信息基础设施故障和信息系统故障等。要使运维工作量比较均衡,就要降低突发事件概率,使忙的时间少下来。IT管控能就是要让“闲”的时间忙起来,要求IT部门各岗位在日常中加强监测,重视巡检,加固系统,防患于未然;同时加强学习和演练,提高处置各种事件的能力。这样,一旦发生突发事件,也可以有条不紊地进行处置,实现信息化日常运维工作的“削峰平谷”,强度均匀。
4.IT管控能确保IT风险的可控
IT风险主要包括IT技术风险和IT项目投资风险。随着业务系统访问、网络应用行为日益频繁,网络被攻击、数据被篡改、设备被入侵和信息被泄密等IT技术风险的压力也日益增大。IT管控提供管理程序、技术和保障措施,确保信息技术服务的可用性,能适当地防御不正当操作、蓄意攻击或自然灾害,并从这些故障中尽快恢复;确保拒绝未经授权的访问。IT管控体系要求IT项目投资必须事先经业务部门和IT部门共同把关,再报公司管理委员会决策,这样能确保IT项目既符合业务需求,又符合IT技术规范,降低了IT投资的风险。万物皆有规律,IT风险防范也是有规律可以把握,良好的IT管控能很好控制IT风险。
二、IT管控在企业信息化中的运用
从行业信息化发展战略出发,从企业自身发展战略出发,作为信息化建设到一定规模的企业,必然要求企业信息化建设的重点则从技术转向管理,要求信息化工作必须精益求精,加强管控,夯实基础,强化运作。
构建完整的IT管控体系是一项复杂的系统工程,涉及到人、硬件、软件,以及管理层面的IT服务管理、风险管理和成本管理多个方面。因此,必须从更高的角度,更宽的视野,更新的理念去构建有效的IT管控体系。
1.选择合适的IT管控模型
现今企业IT管控体系的国际标准,主要有COBIT、ITIL、ISO20000等,选择构建一个既满足企业的业务需要,又能够符合国际标准的IT管控体系,是信息化工作的成功保障。就如笔者,结合企业实际、IT部门现有实际运作流程和知识框架,选择以ITIL主要标准,采取联邦制IT决策方式作为笔者企业的IT管控模型。
(一)IT部门内部运作的管控
要建立制度化、流程化工作机制,精益求精,稳步推进。根据ITIL/ ITSM(IT服务管理)的标准,继续完善IT服务目录,对各子服务定义不同的SLA(服务级别协议),建立服务台,统一受理所有的流程输入,建立IT服务管理体系,体系应包含事件管理、问题管理、变更管理、配置管理、发布管理和服务级别管理。根据IT技术标准和行业具体技术规范要求,建立先进、稳定、安全的信息通讯技术基础设施(主要包括机房和信息化网络),并完善巡检、监控等基础设施管理机制。
(二)企业信息化运作的管控
首先是加强对信息化项目的管控,必须坚持统一性、系统性、规范性、安全性原则,必须坚持“事先技术把关,事中实施监督,事后运行维护”的原则。即项目涉及的IT部门的责任或义务的,IT部门必须管控到位。事先对项目立项相关技术规范进行把关,确保项目符合行业相关技术规范;事中对项目供应商(软件开发商)安装实施等服务进行严格监督,确保项目在技术上能顺利开展,保障设备(系统)能正常上线运行;事后必须将设备或系统运维维护好,确保设备(系统)安全、稳定运行。其次是加强对信息化资产的管控。加强对计算机设备调控,优化各终端计算机的配置。强化IT部门对软件资产的归口管理职能,坚决贯彻落实软件正版化相关要求,统一采购正版成品软件,规范信息系统的登记、领用、运维和报废。规范IT设备维修保养机制,延长IT设备使用寿命。第三是加强对信息系统用户的管控。建立操作上岗证机制,加强培训,提升其规范操作水平,采取检查监督等措施,促使其能正确操作,规范操作。
(三)信息安全的管控
信息安全管控体系是一项复杂的系统工程,必须采用系统工程的观点和方法,分析信息安全问题及具体措施。结合企业实际,就是要严格贯彻相关信息安全要求,做好信息化安全规划,业系统信息安全规划,建立覆盖日常维护,变更管理,安全监控的信息安全体系,将信息安全审计作为信息安全保障中的一项重要工作。建立三个长效保障机制:构建信息安全文化氛围、信息安全奖惩机制和内部信息安全审计机制,以确保信息安全管控能够有效长久运行。
2.利用合适先进工具软件强化IT管控
对信息化日常运作层的管控,必须利用合适先进的工具软件对信息化工作流程、设施和信息模型进行全面管控。引进先进的IT运维管理系统,建立IT服务管理监控平台,管理IT服务所涉及的各个流程,监控信息相关基础设施和中间件等。利用现有或将要购买的信息管理软件,如桌面管理和软件发布系统,综合网管系统,接入管理系统和数字认证(CA)等,建立信息系统综合管理系统,管理整个信息系统的设备、软件等资产,管理桌面、应用等功能单元的运行,以及管理整个设备网络和网络上接入的各种系统的正常运行。
追根溯源,建立有效的IT管控体系,最终目的是为了提升IT部门服务水平,提高用户的满意度,发展有效益的企业信息化。随着行业信息化的发展和实践的深入,新技术的不断应用,企业的信息化需求不断变化,IT部门只有建立基于企业治理上的IT管控体系,才能适应不断变化发展的信息化,为企业企业发展提供重要的信息支撑。
参考文献
[1] [荷兰]JanvanBon主编,章斌译:基于ITIL的IT服务管理基础篇[M].北京:清华大学出版社,2009.
[2] [荷兰]JanvanBon主编,刘向晖译:IT管理框架[M].北京:清华大学出版社,2009.
[3] 王仰富,刘继承:中国企业的IT治理之道[M].北京:清华大学出版社,2010.
[4] 王胜:IT治理—为企业带来革命性的变革[M].北京:经济科学出版社,2009.
IT运维服务 篇7
1. IT服务支持的管理流程
IT服务支持的管理流程主要是对ITIL在日常操作层面的部署进行体现。IT服务支持管理流程如图1所示。服务台是IT服务提供者和用户之间日常工作的单一联系点, 主要对服务请求进行处理和突发事件进行报告。服务台主要负责对用户提出的问题和服务请求进行解答, 它处于第一线。对于正常服务级别可以解决的问题, 服务台将快速进行响应, 主要任务就是负责恢复处理。突发事件就是针对那些不属于正常服务级别可以解决的问题, 此时服务台对其进行记录和跟踪, 转入突发事件管理流程处理。在进行事件管理流程处理时, 首先需要将事件分类, 判断该事件是否为已知错误原因的问题, 对该事件优先级的判断是由影响度和紧急度两个要素来决定的。将一线不能处理的事件迅速转到二线、三线进行技术支持, 最后将处理的结果转给一线, 由一线面对最终用户。
所谓变更管理就是指审批和控制那些需要对企业内部的设备、系统进行增、删、改等的行为。变更管理具有很多的优势功能, 例如, 它能够使变更对正在运行的系统产生负面影响最小化;它能够对变更进行影响评估;它能够保证变更具可追溯性等等。
发布管理的主要任务是确保首次进入一个企业的软、硬件设备运用到本单位的系统中获得成功。最简单的例子, 就是我们从网上下载了Windows XP的SP2补丁程序后, 首先要在测试电脑上进行安装, 观察打了补丁后的测试电脑有无出现异常, 最后才对公司内的电脑进行全面的操作系统补丁升级。其实, 发布管理与配置管理、变更管理联系更密切, 变更的实施, 很多时候是通过发布管理活动进行的。总而言之, 配置管理、变更管理以及发布管理关系密切, 应进行相互协调。
2. IT服务提供的管理流程
IT服务提供的管理流程主要是对ITIL在战术层面的部署进行体现。服务级别管理是服务提供管理流程的基础。服务级别管理是定义、协商、订约、检测和评审提供给客户的服务质量水准的流程。在服务级别协议中将有关所提供的服务和这些服务的质量水准记录下来。服务级别协议对服务双方各自的责任、权利和义务进行了规定, 是IT服务成功运作的重要保障。用户满意度的提高是服务级别协议的目的。服务级别管理通过服务级别协议定义面向客户的服务条款, 通过运行级别协议保证IT服务组织之间的协调工作关系, 通过支持合同确保客户和第三方供应商之间的技术支持。服务级别管理力争将所有对用户的服务质量的影响减到最小。服务级别管理是服务支持和服务交付的关键。财务管理是指负责预算和核算IT服务提供方提供IT服务所需的成本, 并向客户收取相应服务费用的管理流程。
如何应对IT服务遇到灾难时的恢复应急措施和计划就是所谓的持续性管理。持续性管理主要包括两部分内容, 即业务持续性管理和IT服务持续性管理。在发生服务故障后仍然能够提供预定级别的IT服务从而支持组织的业务持续运作的能力是IT服务持续性管理关注的焦点。一个平衡的风险措施的支持能够使IT服务持续性管理更加有效, 例如备份恢复措施和远程容灾系统等等, 配置管理流程中的数据来可以用来辅助对风险的预防。
可用性管理支持服务级别管理, 它能够使意外突发事件的数量得到最大程度的减少。可用性管理也是一种使资源、技术和方法得以适当拓展的流程管理。可用性管理是一个前瞻性的管理流程, IT服务的设计在可用性管理的条件下通过对业务和用户可用性需求的定位将其建立在真实需求的基础上, 从而使得IT服务运作中采用过度可用性的情况得以避免, 节省了IT服务的运作成本。
3. 结语
企业中IT运维服务管理的实施, 一方面, 可以使设备和系统维护的效率及平均无故障时间得以提高, 从而使技术力量缺乏的问题得到解决, 使维护责任和安全责任落到实处, 使企业信息部门的IT服务能力和IT服务水平得到大大提升;另一方面, 基于ITIL的IT运维服务管理在实现了IT部门服务质量提高的基础上, 也使得IT运维服务的成本得到了有效的降低。
摘要:随着企业信息化建设的日趋完善, 如何管理、控制和维护企业日益复杂的信息系统, 确保已建成信息系统的稳定运行, 充分发挥已有IT资源的使用效率, 为企业的业务发展提供有力的支撑和保障, 已成为企业在信息化发展进程中开始重点关注的问题。本文从IT服务支持的管理流程以及IT服务提供的管理流程这两个方面对IT运维服务管理进行了探析。
关键词:ITIL,IT,运维服务管理
参考文献
[1]谢鹏.基于ITIL的服务管理软件实施方法研究[D].复旦大学, 2009.
[2]蓝乐琴.浅析IT服务管理[J].价值工程, 2006, (10) .
[3]丛国栋, 张金隆.基于ITIL的中小IT企业服务管理模型研究[J].武汉理工大学学报 (信息与管理工程版) , 2003, (06) .
IT运维服务 篇8
安徽省电力公司 (以下简称安徽电力) 于2009年实现了SG186生产管理系统在各地市公司的全面推广应用工作, 为了满足生产管理系统在各地市公司的全面上线运行, 有效提供生产管理系统运维服务, 使其充分发挥系统功能及作用, 解决运维服务中的入口多、流程不统一等问题, 2010年初, 安徽电力将生产管理系统运维接入IT服务流程管理系统, 通过统一的信息服务平台, 实现了生产管理系统运维服务的规范化管理。
1 生产管理系统
生产管理系统是国家电网公司 (以下简称国网公司) 基于SG186蓝图, 统一规划设计、统一推广应用的生产新系统, 是按照国网公司“十一五”信息化建设实施指导意见的要求, 从电网生产客观实际出发, 在电网生产标准化建设的基础上, 建立以资产管理为核心, 覆盖国网公司总部、网省公司、地市公司3个层面、贯穿电网生产全过程的一体化生产管理信息平台, 实现了生产基础信息、运行信息、管理信息的纵向贯通、横向集成和资源共享, 提高了电网生产管理“四化”水平, 为促进公司发展再上新台阶提供生产管理支撑。
1.1 系统功能
基于国网公司生产业务应用标准化设计的SG186生产管理系统, 涉及的专业包括输电、变电、配电和综合管理四大部分, 其内容主要包括:设备台账管理、计划任务管理 (任务池、工作任务单、检修计划等) 、生产运行管理 (巡视管理、运行值班管理、缺陷管理、修试管理等) 、标准规范管理 (标准规范文档、设备型号库、国网公司下发的标准代码等) 、技改大修管理、技术监督管理以及生产报表管理等。
依据国网公司生产业务系统需求规范及概要设计书, 生产管理系统分为由五大中心及围绕五大中心分布的众多外围应用组成的有机体 (见图1) 。运行工作中心代表了整个电网生产管理的执行过程、工作内容及工作结果;设备中心代表了整个电网生产管理的核心对象、基本出发点和最终目标;计划任务中心代表了整个电网生产管理的工作方式和组织策划;标准中心代表了整个电网生产管理的规范化和标准化的力度与水平;评价中心代表了整个电网生产管理的评估监督和价值取向。
1.2 系统架构
生产管理系统集中在省公司部署, 采用B/S和C/S混合模式的多层架构系统, 分为数据层、应用服务层和应用表现层。
(1) 生产管理系统的数据层包含安全生产应用的业务模型和实例数据, 该部分数据主要由业务应用系统管理维护, 但其中部分数据, 如设备台账信息等也被图形应用系统共享和复用。生产管理系统的数据层还包含图形数据, 并可根据不同用户群对图形数据需求制定空间图形数据部署策略, 此部分数据主要由图形应用系统管理维护。数据层的总体设计原则是模型统一, 数据唯一, 切实避免数据冗余现象, 降低数据维护的工作量和复杂度。
(2) 生产管理系统的服务层主要由业务应用系统服务和图形应用系统服务构成, 采用面向服务架构为表现层或第三方系统提供业务应用和图形应用服务。业务应用系统包含代理服务、虚拟文件服务、基础业务服务、工作流服务、报表服务、消息服务、任务调度服务、专业应用服务 (包括两票应用等专题服务) 等;图形应用系统包含矢量图形包服务, SVG图表服务, 电网建模服务、专题图服务、查询定位服务、拓扑分析服务、空间分析服务等GIS相关服务功能。业务应用系统和图形应用系统均通过统一应用平台中的通用数据访问组件与底层数据库进行交互。
(3) 生产管理系统的表现层分为C/S和B/S模式。C/S客户端主要由系统管理员和专职人员使用, 基于统一的客户端插件框架, 可实现业务模型维护、操作票和工作票相关定义、电网图形编辑等高级应用功能。非地理图形编辑应用的C/S客户端无需配置数据库客户端软件, 只需初次安装应用平台客户端, 能以HTTP/SOCKET通信方式访问远程应用服务, 并可自动升级。B/S客户端为绝大多数的最终用户提供了日常工作所需的数据/表单填写、流程处理、统计查询、业务分析、图形浏览等人机交互界面, 实现绝大多数业务应用功能。
2 IT服务流程管理
IT服务流程管理是一套IT部门用来规划、涉及、实施和运维高质量IT服务的标准方法, 它能协助IT部门建立以IT服务为导向的IT运作, 是企业IT部门至关重要的核心能力, 是信息技术部门与用户之间新型关系的基础。IT服务流程管理涵盖事件管理、问题管理、配置管理、变更管理和发布管理5个核心管理流程 (见图2) 。
(1) 事件管理:信息系统异常。包括:用户服务请求、巡检发现的异常以及监控系统自动报警等, 重点强调事件解决的速度。
(2) 问题管理:引发一个或多个事件的未知因素, 重点强调问题解决的质量。
(3) 配置管理:保存系统所有配置项的相关信息, 包括配置项之间的相互关系。配置项包括所有软件、硬件和各种文档、服务、服务器、环境、设备、系统软件、应用软件、程序及其补丁等内容。
(4) 变更管理:用于详细记录服务和集成架构中配置项的变更请求表单。
(5) 发布管理:新的或变更的配置项的集合被测试并导入到新的生产环境中, 系统的上线就是一种典型发布。
3 生产管理系统运维
3.1 运维目标
运维服务是支撑生产管理系统7×24h的正常运行, 快速适应生产业务发展变化的关键, 对运维服务的科学管理是提高运维服务效力与效率的重要保障。对于生产管理系统这样一个复杂、庞大的业务应用系统来说, 从需求分析、设计、开发、部署、运营到优化的每个过程都离不开运维服务, 运维服务的缺失或质量较差, 将直接影响生产管理系统的正常运行和服务水平, 因此, 需要加强对生产管理系统运维服务的管理, 确保运维服务及时、到位, 能够支撑生产管理系统的正常运行。生产管理系统的运维服务需要多方的密切配合、分工合作, 从系统运维管理部门的角度看, 运维服务管理应满足遵循以下原则:
(1) 集中管理原则:加强对生产业务个性化需求和变更的集中管理, 保证标准化设计成果顺利推广及应用;
(2) 分工合作原则:明确业务部门与信息部门间的工作界面和工作流程, 各负其责, 密切协作, 保证生产管理系统的正常运行;
(3) 流程化原则:运维中发现、解决的问题要反作用于系统的开发完善, 加强对运维服务流程不断优化, 提高运维服务质量和水平;
(4) 本地化原则:为了提高响应速度, 运维服务应尽可能在本地提供, 但服务质量要集中监控。
3.2 运维内容
运维内容是为达到运维目标所需做的相关工作, 主要分业务层面的服务及技术层面的服务。业务层面的服务内容包括业务功能新增及变更维护、日常业务操作支持、主数据新增及变更维护等。技术层面的服务内容包括用户与权限维护、客户端维护以及服务器、数据库、中间件的日常运维等。
3.3 运维准备
为了熟练运用IT服务流程管理系统运维生产管理系统, 充分做好生产管理系统运维准备工作, 一方面组织对服务台进行生产管理系统架构、功能及模块等方面的基础培训, 使其熟悉生产管理系统;另一方面对生产管理系统运维人员进行IT服务流程管理系统应用的培训, 以便熟练掌握IT服务流程管理系统应用;同时梳理了IT服务流程管理系统生产组中的事件类别, 将事件细分为操作事件、业务事件、用户处理、系统管理、数据问题、新需求、程序BUG七大类, 为系统的应用做好数据初始化准备工作。
3.4 运维流程
通过梳理生产管理系统运维中的重点工作, 设计生产管理系统运维流程, 指导生产管理系统运维管理水平的提升。在生产管理系统运维过程中涉及到的所有的运维服务流程, 都是通过信息服务台发起的。
运维过程中最常见的是事件的处理, 日常监控中发现的告警或故障信息以及来自客户的服务请求信息触发事件管理流程。事件由信息服务台统一进行受理, 首先由信息服务台数据录入人员将事件录入到IT服务流程管理系统中, 并根据事件信息填写事件的紧急度等信息, 事件录入完毕后转一线工程师处理, 一线工程师收到事件处理通知后, 登录IT服务流程管理系统查看事件信息, 及时联系事件请求人处理事件, 并填写处理内容及结果。对处理结束的事件, 由信息服务台统一进行用户满意度回访。当事件无法解决, 或已解决未找到根本原因以及重大事件无论是否得到解决都应升级为问题, 引发问题管理流程, 同时配置管理为事件处理提供基础信息。
在实际的生产管理系统运维中, 为提高运维效率, 保障系统运维服务的规范性, 制定了相关的管理办法, 包括用户及权限管理办法、主数据管理办法等。
4 结语
基于IT服务流程管理系统的生产管理系统运维, 在安徽电力生产系统运维管理中发挥了一定的作用, 通过统一的服务入口, 规范的服务流程, 提高了生产管理系统运维效率, 为生产管理系统的深化应用奠定了基础。
摘要:生产管理系统是国家电网公司信息化建设的重点, 生产管理系统的运维是系统高效运行的有力保障。只有实现了生产管理系统的有效运维管理, 才能发挥系统的功能及作用。IT服务流程管理的核心原则和出发点是为信息系统用户提供高效的服务。在TI服务流程管理的基础上, 利用统一的信息系统服务流程, 为信息系统运维管理提供统一平台。
IT运维服务 篇9
中化集团是国有重要骨干企业, 世界500强位列前茅, 是中国四大国家石油公司之一, 业务涉及能源、农业、化工、地产、金融五大领域。
面临问题
1.用户服务存在的问题
随着用户数量的不断增长, 缺乏统一的受理平台来记录所有用户请求, 导致无法满足日常服务需求。所有工单处理没有区别, 全部由一线运维人员根据自己的经验进行解答, 一线运维人员之间在经验和个人素质等方面存在个体差异, 没有规范的解答标准也没有服务级别的区分, 导致解决问题效率降低, 用户满意度差;缺乏有效的知识库系统, 降低了问题解答的效率和解答问题口径的一致性;缺乏通知提醒功能, 导致技术员无法快速响应与处理工单。
2.数据中心运维存在的问题
数据中心运维服务的主要内容是受理和解决对支撑应用系统运行的各类软硬件设施进行运维的过程中遇到的各类问题, 运维对象包括数据中心的基础设施、基础服务、各类硬件 (小型机、服务器、网络设备、安全设备等) 、系统软件、数据库、中间件等。目前运维服务受理途径仅仅是普通的电话交流, 没有相应的服务平台和配套的服务流程进行支撑。因此, 应用系统的运维服务需要一个更加高效、更加强大的服务平台从人员、流程、技术等多方面对应用系统的运维服务工作起到更为有效的支撑作用。
解决方案
中化集团经过测试多款产品后, 终于确定选择卓豪ITSM软件Service Desk Plus作为运维管理平台。用户通过统一的接入点接入, 并通过电话 (与Avaya呼叫中心系统集成) 、邮件、网站等多种途径受理信息化系统软硬件在使用过程中遇到的各类事件和问题的请求。
请求提交后由服务台根据请求的内容、性质及涉及的信息系统和模块 (从配置管理数据库中调用) 填写工单并转入相应处理流程, 处理完毕反馈给服务台并由服务台关闭请求。通过这种体系化的运维服务平台, 不仅提高了各类运维服务请求的解决效率, 同时流程控制每一个运维服务请求均形成有效闭环, 切实提高了用户对服务申告的满意度。
此外, 利用CMDB实现对两千多个资产及关联关系的管理, 并为IT服务流程提供基础数据。借助知识库, 记录和积累常见问题的解决方法, 大大提高了运维的效率。
客户评价
IT运维服务 篇10
中国疾病预防控制中心 (以下简称中国CDC) , 作为实施国家级疾病预防控制与公共卫生技术管理和服务的公益事业单位, 是我国公共卫生体系的一个重要部分。
2003年以来, 中国CDC建立了以传染病疫情报告和突发公共卫生事件为核心的网络信息平台, 实现了基于B/S模式和J2EE三层架构的实时在线传染病个案网络直报系统, 该系统覆盖全国100%各级疾控机构、96%县级以上医疗机构和82%乡镇卫生院, 并为中国CDC在新址园区的信息化建设奠定了基础。但是中国CDC目前还处于初级的IT运维管理状态, 在组织结构、管理规范、管理流程和技术支撑方面还没有构建一个综合的IT运维管理体系。对网络、设备、系统、用户等的管理和服务是分散的、不关联的, 没有实现数据、信息和知识库的共享, 没有实现规范化和流程化, 因此, 管理和服务是粗粒度、低效率的, 这种管理模式将越来越难以适应中心信息化的发展要求。
2 运维管理系统设计原则
中国CDC的IT运维管理系统需遵循ITIL最佳实践理念, 结合中国CDC实际IT运维管理需求, 充分利用成熟的开放式、平台化的监控管理工具, 定制开发并建立集成化的管理信息系统平台, 满足一体化的IT运维管理与服务。
中国CDC的IT运维管理系统对中国CDC的信息系统进行全方位的监控和运维管理。因此, 它必须是一个具有高处理效率、高可靠性、配置灵活、界面统一、易于操作的实时信息处理系统。该软件的系统设计、应用设计和实施应遵循如下原则:
2.1 先进性
参考全球IT管理业界公认的指导性框架ITIL (Information Technical Infrastructure Library) 服务管理体系, 规范业务支撑网运行管理和操作, 采用先进的规范化IT管理模式, 建设一流的维护管理流程。
2.2 实用性
在不对应用系统带来较大的负荷下, 在不影响正常使用的情况下, 针对现有的复杂IT系统, 实现监控与运维管理, 并结合中国CDC的实际管理情况, 逐步实现以运维流程管理贯穿整个运维管理过程, 最终实现所有业务支撑系统的统一监控、统一管理、统一维护, 为实现服务管理奠定基础。根据系统采集的数据, 进行趋势分析, 预测将出现的问题及发生的时间 (如CPU、内存、IO、文件系统、表空间、端口流量) , 并在出现问题之前解决问题, 从而避免故障的发生。
2.3 高效性
值班人员操作简捷, 运维人员处理快捷, 管理人员管理直接。当系统出现故障时, 可能会有几十个乃至上百个告警信息, 众多的告警让值班人员无从顾及。因此, 在发出告警信息前需要对告警信息进行合并、过滤、定制, 并提供初步的故障分析手段。提供简单快捷的操作方式, 以及以简单、有效的方式通知运维人员或管理人员。运维人员借助于运维支撑系统, 能进行快速故障定位, 快速寻求帮助, 从而达到快速解决故障的目的, 管理人员可随时了解系统的运行状况, 促进运维人员高效工作, 对流程进行优化调整, 提高管理水平。
2.4 扩展性
监控、安全与运维管理, 是一个渐进的过程, 随着业务、管理的发展, 系统应支持以快速灵活的配置方式, 将其管理范围扩充到整个网络上, 逐步发展成为信息化综合运维支撑系统。
2.5 阶段性
在整个中国CDC的IT运维管理系统的不断演进与实施中, 首先满足最紧急、最重要的应用需求, 先实现业务量大、故障率高的运维支撑系统监控, 先实现各运维支撑系统的集中管理, 再实现管理层面从IT基础设施、基础软件、应用软件到业务的逐步完善。
3 IT服务运维管理系统的建设内容
3.1 集成相关的监控技术或工具, 实现IT基础设施的监控、监测与预警
建立集中统一的监控管理平台, 充分利用开放式、平台化监控技术或成熟工具与网络管理技术, 实现对网络相关设备、机房动力环境、应用系统的监控、监测与预警管理。实现安全事件的统一监控管理, 建立统一的故障预警预测管理平台并通过统一用户界面集中展现, 支持设备故障的主动发现和问题解决。
3.2 集成开发IT运维管理信息系统
根据管理用户的角色、功能权限的管理需求, 建立相关功能的管理维度和粒度, 并通过统一用户权限管理系统集中管理。利用成熟的管理平台或工具集成开发IT运维管理信息系统, 实现系统配置及日志管理、监控系统接口配置管理、数据统计查询、数据统计分析与自动生成监测报表、预警配置与推送等功能, 实现统一的运维信息展示。
3.3 建设集成化IT服务管理平台
结合中国CDC实际IT运维管理需求, 遵循ITIL最佳实践理念, 设计IT服务与管理的相关流程、规范和运行模式。并与中国CDC同步建设的协同办公平台统一用户管理的统一集成应用。
4 展示方式
集中监控展现平台对IT基础设施监控数据进行多角度集中展现, 它以监控到的性能和告警数据为基础, 从业务、系统、机房等各个视角来了解系统的运行状态和存在的问题。在展现方式上, 应结合报表、视图等各种手段。在展现设置上, 应该可以自行指定要查看的图表显示类型、时间属性、界面分组等各种特性并能相互关联, 在展现风格上支持FLASH风格展示报表。其中包括:
4.1 IT资源监控展示
4.1.1 提供机房、机柜导航图, 与机房环境系统能够实现集成整合现有机房监控软件, 能够集成展示机房温度、湿度、漏水、电源、空调、门禁等动力环境系统的监控功能;能够集成展示网络、主机、存储、安全、数据库、中间件等各IT基础设施的监控指标及设施的基本运行状况、事件报警及基本的预处理情况, 能及时发现IT资源的异常情况, 并能够将报警数据进行逻辑关联整合。
4.1.2 建立信息中心机房环境和设备的二维、三维模拟视图 (基于WEB的) 将信息中心各类资源的运行状态直观地显示在机房视图上, 并建立相应的关联。
4.1.3 建立监控指标的可视化仪表盘, 集成展现相关信息。
4.2 网络拓扑展示
将网络通过按照地域、部门等划分成多个相对较小的子网实现分级管理、提供远程管理工具辅助用户对整个网络进行监控和管理。支持网络拓扑图基于浏览器的展现, 通过浏览器的方式监测网络的运行情况, WEB拓扑图通过3-N级的方式展现网络拓扑、设备状态、端口状态。用户可以通过浏览器访问, 通过浏览器来查看网络运行的情况。
4.3 业务视图展示
能够以重要业务为中心, 提供重要业务系统的组成和拓扑图, 显示从服务器到前置到客户端的业务服务视图, 拓扑图支持有向关联, 表明资源间业务依赖关系。当系统资源 (如服务器、网络等) 发生故障时, 能快速定位受影响的业务与故障根源, 评估分析业务对用户的影响度, 并支持在业务服务视图上直接查看故障信息, 在业务服务视图上判断和解决问题。业务应用运行展现从业务应用人员角度出发, 按照业务之间的关联关系, 以直观的业务系统关联展示方式, 进行统一展现, 从而使管理员能够在一瞥之间监测整个IT运行环境。
4.4 告警信息展示
提供统一事件管理来解决分割管理的数据融合问题, 通过以告警事件为导向, 提供了清晰的、集中的事件管理。可以让管理人员对整个IT环境的各种硬件和软件系统的实时事件信息收集, 对各类事件信息进行过滤、压缩、归并等相关性分析与处理, 智能化压缩处理海量告警事件, 分析出真正的问题所在, 实时呈现出完整的事件信息, 并将这些信息分发给负责服务监视的操作管理员。要求能够实时呈现所有的网络、系统、应用、告警信息, 包含告警的时间、告警源、告警类型、告警描述、当前处理情况等, 支持工单创建, 可直接进入工单管理。
4.5 监测图表展示
要求能够实现标准报表的生成、查询功能, 显示每天的运行情况一览表和各个系统的运行情况信息, 对各种网络系统、主机、应用系统等各种指标进行日周月年等多种时段的统计分析, 提供多种趋势、比较、排名、分布、连通率、主页及关键业务存活率等报表。提供多种图形方式 (包括曲线图、直方图和饼图等) 的呈现。
4.6 分布式级联展现
支持分布式级联管理功能, 支持今后扩展, 能够实现国家疾控中心到省级疾控中心的级联管理模式。
5 结论
IT运维服务 篇11
建设IT运维体系不仅使信息系统为企业发展提供强有力的支撑,而且为行业决策提供了准确数据的保障,进而推动行业持续、快速发展。本文以“行业决策管理系统”运维单位建立规范运维体系的尝试与探索为例,阐释了烟草IT运维体系建设的基本思路。
二十一世纪以来,烟草行业信息化建设在以信息化带动工业化、以工业化促进信息化的战略指引下,按照“统一标准、统一平台、统一数据、统一网络”的方针,逐步实现系统集成、资源整合、信息共享的总体要求,全面启动数字烟草建设,有效地推动了行业的规范管理,行业信息化工作围绕应用系统建设取得了实质性进展。
电子政务与电子商务齐头并进
目前,烟草行业已经建立了以办公自动化为主要内容的行业电子政务体系,建成有“公文传输、公文流转、档案管理、门户网站”基本功能的办公自动化系统。
同时,“行业卷烟生产经营决策管理系统”(以下简称“决策管理系统”)的重点工程也已完成,初步实现了全行业卷烟生产经营数据的实时自动生成,有效保障了行业生产经营决策和宏观调控的科学性、及时性。该项目采用了物流数码跟踪技术,将卷烟生产计划管理与生产过程结合起来,通过“计划取码、物流跟踪、到货确认”这样一个流程,实现对行业生产经营的日跟踪、旬分析、月调控,有效地保障了卷烟生产经营基础数据采集和管理的准确性、及时性,实现数据采集自动化;形成了行业统一的数据交换与传输体系、标准体系、数据中心及应用集成平台,为行业信息化的集成与整合提供手段,也为行业现代化物流建设奠定了一定的基础。
国家烟草专卖局开发应用的专卖证件管理系统、统计和财务报表系统、卷烟工业基础软件、卷烟销售基础软件、烟叶基础软件等以及行业各单位自行开发建设的管理信息系统(MIS)、企业资源计划(ERP)、办公自动化(OA)、业务流程再造(BPR)、制造执行系统(MES)、供应链管理(SCM)、客户关系管理(CRM)、现代集成制造系统(CIMS)等,为行业数据中心的建立积累了大量的信息资源,奠定了一定的基础。
此外,烟草行业的电子商务系统也已初具规模。2003年,烟草行业取消了现场交易模式,一律在网上进行交易。随着行业卷烟交易方式的改革,行业内卷烟、烟叶和卷烟辅料等均在网上交易,完成了省内卷烟交易统一平台的建设工作。同时,以信息技术为手段的卷烟销售网络建设水平不断提高,有力地推进了传统商业向以“电话订货、网上配货、电子结算、现代物流”为主要特征的现代流通的转变。
这些信息系统的建设与使用,促进了卷烟生产、销售、物流等核心业务的发展,已与各项业务的开展紧密结合在一起,成为各企业业务发展的重要支撑。
IT运维问题多
信息化建设的迅猛发展对IT运维工作产生了大量需求,而后者发展的速度一直跟不上信息化建设的步伐。在2005年以前,行业的IT运维工作缺少统一管理、规范运作,存在多方面的问题。
首先,针对行业统一推广系统没有统一的、完整的、规范的运维管理规范与要求。各企业、各部门各自为政,虽然都按照各自实际情况建立了一些规章制度,但不完整,没有包含日常运维工作的方方面面,导致运维的效果参差不齐,难以发挥行业统一推广系统的功能效用。
其次,运维职责与流程不清晰。使用部门认为运维应该由建设部门负责,而建设部门认为系统已交付使用部门应用了,后期的工作应由使用部门自己负责,运维的职责不甚清晰,容易产生相互推诿的现象;此外,即使分清了职责,运维工作也没有一个规范的流程,同一项工作每个人的处理流程与方式都不相同,导致运维效率低下,会导致使用部门的积极性大为降低。
再次,没有支持运维管理体系落地的工具。基本上是通过纸质表格或邮件进行流程的控制,有的甚至没有任何痕迹化的记录;这导致对IT环境的监控和运维管理的手段不健全,缺乏对行业统一推广系统运行状况的统计分析和总结报表等。在实际运作过程中容易出现各种问题,且无法追溯造成问题的具体环节,这实际上使运维工作面临巨大的风险。
鉴于以上运维现状,行业的信息系统前些年运行情况和预期目标有较大的差异,有些系统的运行效率普遍不高,甚至系统废弃不用,成本效益低,制约了信息系统对业务的支撑效能。
具体需求 具体分析
IT运维管理的作用是使系统得到最充足的运行、效益得到最大的发挥。信息部门工作重点就是保障业务的连续性、系统的稳定性、数据的准确性。各企业、各部门对运维的要求集中在四个方面。
保障系统稳定:保障各信息系统平稳、高效运行,使业务能够顺利开展。确保系统不中断、不瘫痪是对运维工作的核心要求,这就需要开展主动预防性维护,如监控、巡检、评估、业务连续性分析等。
保障数据质量:数据是系统中的关键信息,也是业务开展情况的直接反映,保证数据完整、准确是运维的另一个重要目标。这就需要对数据采集、数据交换、数据上报、数据处理、数据传输、数据展现等各环节进行层层校验与控制,对相关环节的参与人员进行全面、系统的培训,从程序、人员、流程各方面进行规范以降低数据出错概率。
保障数据安全:行业业务数据都是各企业的核心数据,一旦泄露将会给企业带来无法弥补的损失,因此确保数据不泄露、保障信息安全是运维的另一重要需求。
确保恢复效率:若出现突发事件需要在第一时间发现异常、在最短的时间内恢复系统并解决问题,将故障对业务的影响降至最低,这是对运维的事后处理要求。
简言之,业务部门对运维的要求是:系统不瘫、数据不丢、流程不乱;而其中的流程不乱若能保障,则反过来就可确保系统不瘫、数据不丢,因此,如何保证程序不乱即规范运维是运维的重中之重。行业的IT运维工作,需要以流程规范为主,以监控和安全接入为辅,以智能操作为手段,以运维分析为方法,以提升运维质量为目的,最终提高企业整体运维管理水平。
技术、管理、运维,缺一不可
技术、管理和运维是烟草行业信息化建设的三大重点,三者缺一不可。行业信息系统的稳健和可持续运行,离不开行业规范的IT运维。
所谓规范的运维管理体系,就是运维的组织健全、制度完善、内容明确、流程清晰、标准统一、平台先进、质量可靠、考核有据,由面向设备转向面向服务,由分散式转向集中式运维,由救火式转向管家式主动服务,由粗放式管理转向科学化、规范化、自动化、信息化管理。
规范IT运维,对整个行业来说具有重大的意义。它能切实提高各企业与用户对信息系统使用的积极性与效率,使系统在行业核心业务环节产生预期的效果,促进烟草行业又好又快发展。企业的财务、生产、营销、采购、物流等各环节都离不开信息系统的支撑,规范的IT运维能够确保这些系统稳定、高效运行,从而保障这些核心业务的顺利开展,间接推动行业各项业务发展。
规范IT运维工作,使重点系统、重点项目的建设无后顾之忧,减少了规划审批时间;在系统建设完成交付使用后,规范运维则能够发挥系统应有的效能,并能以“需求为导向”,不断拓展和延伸系统的功能,深入推进重点信息化项目的迅速发展。这种对重点系统、重点项目的良性促进作用,能够形成示范效应,不断推进信息化深入发展,有效促进信息化与烟草产业深度融合。
此外,贯标工作是行业规范化、标准化发展的重要一步,近年来各类信息化标准也不断涌现。IT运维作为信息化建设的重要部分,其贯标工作一直得到高度关注。通过规范IT运维的实践,摸索适应烟草行业的IT运维服务标准,则有利于整个行业运维水平的提升。
借鉴行业内外IT运维建设方面的成功经验,在建设过程中,还需综合考虑以下几个方面问题:
首先,在建设适合企业自身的IT运维管理体系时,应综合考虑企业所处的环境,包括烟草行业政策环境、运维需求情况、企业自身的财力、技术实力以及当前的组织机构和人力资源情况等,并借鉴ITIL与ISO20000的精髓,建立以人员、组织机构、方针与目标、管理流程、管理手册和文档、技术工具融为一体的运维管理体系,并以“运维管理方法论”作为其内驱力,推动整个体系可持续发展。
其次,运维管理体系的方针与目标来源于运维需求,应从业务需求出发,对业务流程进行分析和需求调研,流程设计应考虑烟草特色和企业的业务实际,分清重点和难点,排定优先级别,一般先选择能快速见效的流程。不要试图马上做所有的事情,毕竟IT运维管理是一个长期的过程,是不断体现价值的自我完善和发展的过程。常用的实施方法有:从被动到主动、从简单到复杂、从客户到自我。
再次,体系的流程活动设计要服从于流程的总体目标,确保流程运转通畅;要关注到流程活动的落地,尤其是角色匹配与对应;流程要分布设计、分布建设,流程要文档化;流程要考虑到持续改进,以满足服务水平的提升要求,适应需求的不断变化;在可能的情况下,应简化流程而不是使流程更复杂,以确保体系建立有利于运维服务效率的提高。
IT运维服务 篇12
随着国内企业IT系统规模持续扩大, 业务应用的不断增加, 服务用户对象的日益增多, IT运维管理人员逐渐面临着三大难题:
◆设备和业务种类繁多, 各类资料信息分散, 导致位于一线的信息系统监控员感知故障的速度晚于信息系统用户, 且故障发生后缺乏对信息系统的整体把控;而后台管理人员也往往因为信息系统性能数据和故障数据的匮乏而缺少对系统运行健康度的了解。
◆核心机房分布于企业内部多个地点, 部署范围广泛, 设备繁杂, 对于大批量网络设备、主机服务器、应用系统没有一个统一的监控平台, 不能制定统一的故障预警管理策略, 故障预警效率低, 业务恢复时间慢;
◆对关键业务系统的运行健康程度缺乏评估手段和预警措施, 只能被动等待问题发生, 无法提前采取技术手段和管理手段规避问题。
在此背景下, 一线监控人员数量多但是经验不足, 后台运维工程师经验丰富但是数量少, 这些矛盾促使企业需要开发和部署一套一体化的IT运维监控和服务预警平台, 协助企业以自动化的手段完成信息系统的监测和维护。
1 平台建设目标
1.1 建立健全企业IT运行监测指标体系
首先, 平台的主要目标是加大对企业内部各遗留及专有监控系统的整合力度, 提高IT运控中心对企业内其他分支机构IT系统管理、检测和把控能力, 建立并完善IT系统监控、IT运行事件响应、IT系统故障处理、IT健康度报告、IT运行问题跟踪和反馈机制, 引入自动化IT运维管理工具, 从而在企业内部建立健全运行管理控制能力, 实现IT健康度和业务连续性治理。
在此基础上, 进一步优化监控策略, 实现对设备及服务项全面、细粒度的监测, 预警和管理, 主要包含以下方面:
1) 打造多平台环境下安全稳定高效的检测代理及检测工具;
2) 在实现对各类业务系统、硬件和网络设备、机房环境等实时检测的基础上, 对核心应用系统再次梳理, 完善核心系统的全流程监控, 根据性能数据进行预警, 并将性能数据和故障数据引入事件管理平台进行后续治理, 以可视化的方式向运维人员提供一览式的IT服务健康状况视图;
3) 构建集成监控平台, 对平台的检测插件、检测机制、预警算法、视图展现等监控资源进行统一管理, 实现大屏集中式告警, 便于后台管理人员直观地看到系统整体健康程度;通过视图的灵活组合可以快速定位故障点, 结合知识库缩短处理时间。
1.2 完善企业业务监测指标体系, 保障业务连续性
随着企业信息化的发展, IT技术已经从业务支持逐步走向与业务的融合, 并成为企业稳健运营和发展的支柱。企业内部很多业务流程都已经在IT部门的支持下实现了流程的再造和优化, 提炼并制定了相应的流程图、流程文件及流程运作机制。但是目前我们对于企业内部业务风险的管控尚处在初步阶段。各类业务流程依然面临着来自内部和外部的各种业务风险。例如内部业务风险主要来自于员工和服务商对信息系统的不当应用, 如非授权操作或误操作;外部业务风险主要来自于外部的不安全事件, 如黑客攻击、机房环境变化等。对应用系统进行业务监控, 能够及时识别业务风险, 有效进行相应的主动规避操作, 避免造成损失。
多年的运维经验告诉我们, IT基础设施的故障仅占IT系统总故障的20%, 而各类业务系统故障占到IT系统总故障的60%-80%, 业务系统的每一个微小的故障都可能会导致业务的重大损失。因此我们需要从基础设施层、应用系统层、业务运行层三个维度搭建监控管理体系, 全面掌握业务系统情况。通过搭建专业化的业务监控平台, 部署各类业务流程监控视图, 及时、准确的发现、定位系统故障、业务异常, 防范业务风险, 从而为业务稳定开展保驾护航。
1.3 管理业务容量
通过业务监控平台可以密切监控业务系统性能, 包括系统的业务处理量、处理性能、各资源使用状况等, 通过对系统资源瓶颈的分析, 可以降低或提高业务系统容量;通过工作负载的分析, 调整业务交易时间, 减少高峰负载, 实现最佳投资。我们通过监控系统, 可以全面了解业务发展状况, 不同区域增长情况, 不同业务提升速度, 密切关注企业核心业务数据, 将单一、零散的业务数据形成趋势图形, 以图形为支撑, 主动分析、合理预测, 科学规划, 统计总结出对信息系统管理, 企业核心业务管理, 容量管理和问题管理有用的信息, 为管理者提供全方位的IT管理信息。
2 平台架构
2.1 平台技术架构
运维平台能够对各类计算机设备、网络设备、安全产品、应用系统等IT设备运行状况和各种网上行为进行集中监控, 对各类设备进行全面集中的统一管理, 及时发现各类异常情况、快速定位各类事件故障并自动形成“工单”, 再分派到相关部门进行处理的一个运维业务信息管理系统。使信息中心的运维工作由被动变主动, 并大大降低了运维人员的工作强度, 具备良好的延展性, 如下图所示:
如上图所示, 一体化运维监控及服务预警平台的系统整体框架由下及上划分为3层:数据采集层 (采集层) 、数据处理层 (处理层) 和数据使用层 (展现层) 。此外, 通过平台的管理控制台, 在各个层面都能够对平台进行全方位的配置管理。
2.1.1 采集层
采集层主要负责采集信息系统的性能数据和故障数据, 通过在信息系统服务器上部署Agent, 或者通过SNMP协议采集等多种方式与外围系统对接, 获取所述基础数据。采集层被动地接收平台服务器发出的采集指令, 执行相关的信息采集插件, 将采集到的数据放入队列和数据库中, 便于后续的分析和数据挖掘。
2.1.2 处理层
数据处理层根据不同监控对象的自身特点和运维管理需要, 灵活定制相应的性能指标集, 定义所述性能指标集中每个指标的测量范围、数据来源、计算方法、预警阈值、测量频度参数, 通过实时和历史性能图表, 进行监测、分析和确定系统性能瓶颈, 若超过预警阈值的状况, 及时通知运维人员处理解决。
2.1.3 展现层
展现层分IT系统全局视图、系统健康度巡检报表、检测数据查询三个部分。全局视图可以展现实时监视告警情况, 利用巡检报表, 系统管理员可以分析系统性能状况, 并记录进事件管理平台。上述综合展示通过业务视图、逻辑拓扑、重要设备、告警统计个不同视图, 将运维管理工作所关注的内容有序、实时、全面地呈现出IT系统资源和业务系统的整体运行状况。
2.2 平台功能架构
一体化IT运维监控模型基于松耦合体系架构, 采取灵活模块化组装、云计算灵活部署结构, 实现“监控、管理、管控”三个方面协同处理过程, 其功能架构如下:
统一访问门户通过一次登录, 即可对所有的平台功能进行操作, 针对不同的登录用户, 可以提供专门的个人桌面和辅助工具。
监测台可以定义服务视图, 将性能, 流量, 报表, 拓扑等系统管理所关心的信息在不同样式的视图上集中体现出来。
运行服务平台以IT管理流程为核心, , 对运维的主要工作进行规范化的管理, 并实现设备维修、值班的管理。
统一事件管理平台能够提供统一的企业级网络事件管理。通过从各种网络设备和管理平台收集网络事件信息, 并进行必要的分析和自动化处理工作。
集成数据网管系统, 提供数据网管标准接口以供信息交互, 完成事件的统一管理, 使网络和系统中的各种资源得到更加高效的利用和综合管理。
系统管理提供对服务器、存储设备、操作系统、数据库、中间件、网站的综合管理, 实现系统故障告警管理、系统性能管理、拓扑与配置管理。
接收来自防火墙、入侵检测、端口扫描等安全系统的告警, 并将这些告警实时呈现给信息网络安全部门, 以采取进一步的响应动作, 保障网络系统的正常运行。并对网络流量进行监听和分析。
3 结论
IT系统一体化运维监控及服务预警平台包含了性能监控、故障监控、决策分析、数据挖掘以及关键业务流程监控等多种功能, 在此基础上通过数据分析技术, 建立智能、高效、易用、实用、灵活的面向业务流程的全方位、多层次的IT运维智能决策支持系统。作为一种新型的、经过验证的、卓有成成效的自动化IT运维工具, 有助于提升国内内企业信息管理的效率。
参考文献
[1]宋应湃, 汪林林, 数据挖掘技术在IT基础设施监控中的应用[J], 计算机科学, 2007, 34 (5) , P205-207.
[2]张晓利, 贺国光, 陆化普.基于K-邻域非参数回归短时交通流预测方法[J].系统工程学报, 2009, 24 (2) :178-183.
[3]陶洋, 黄涛, 唐毅, 基于主机负载的任务执行时间预测研究[J], 计算机应用, 2009, 29 (19) , P2617-2623
[4]郭躬德, 王晖, David Bellz, 时间序列数据分析与预处理[J], 小型微型计算机系统, 2003, 24 (12) , P2228-2232
【IT运维服务】推荐阅读:
IT桌面运维服务具体工作介绍01-17
运维服务简介07-03
运维服务能力体系07-17
运维服务调查问卷01-19
itsm运维服务流程08-03
系统运维服务方案08-15
IT服务管理06-19
IT服务外包12-01
运维服务系统用户手册08-17
运维项目维护服务方案12-20