ITIL服务

2024-08-14

ITIL服务(精选11篇)

ITIL服务 篇1

1引言

通信网络通常经历建设、维护/优化、报废的生命周期,在目前大规模网络建设已经基本完成的情况下,不管是对于运营商还是依赖于运营商生存的各个网络建设和维护的企业(下称:网络维护商),维护和优化显得尤其重要。

随着竞争压力的日益严重,越来越多的运营商开始专注自己基于价值链环节的核心业务,并通过各种手段控制运营成本,以期进一步提升企业赢利能力,在竞争加剧的市场环境中获胜,所以,将网络维护外包给专业的企业是一种必然的选择。

本文将对代维服务的现状、问题和发展趋势进行分析,并提出基于ITIL的初步的解决方案。

1.1现状及问题

1.1.1现状

代维业务从业务层面来说包括两部分:

第一部分是设备维护层面(设备维护、故障处理):已经开始全面代维。

第二部分是业务支撑层面(网络优化、业务开通与保障):未全面开始代维。

也就是说,目前运营商主要将设备维护层面交给网络维护商。

从国内外运营商现状来看:

(1)中国电信:在全国拥有9万人的运维队伍,目前正在积极寻求社会企业通信网络维护服务外包业务。可能的趋势:成立专业服务公司,人员分流,妥善安置庞大的运维队伍。

(2)中国移动/联通:通过专业网络维护商提供网络维护外包服务,尚处于设备维护层面。在广东移动,该市场由设备供应商(高端)以及专业通信工程公司(低端)占有:在其他省,该市场基本上是由设备供应上占有。

(3)和记电讯:由NEC维护(网络运营和维护、无线规划、现场安装和设备管理、网络质量和可靠性管理)

(4)意大利H3G集团:由爱立信维护(1.5亿欧元)

(5)巴西telemar由西门子维护(全面接管)

基于这一点,我们发现,运营商将逐渐地将运营之外的事情交给专业的网络维护商,而将专注于自己的核心业务。

1.1.2问题

目前,在运营商所放开的代维业务中,主要存在以下问题:

(1)大部分网络运营商和网络维护商尚未意识到代维将成为以后的业务重点,所以运营商方面所愿意付出的费用,网络维护商方面的投入来讲都远远不足;

(2)缺乏代维服务标准:责权利不分,难以实施;

(3)网络维护商成本,质量的控制能力不足。

这几点是互相关联的,应该说第3点是结果,而前两点是原因,没有规模效应,没有服务标准,代维业务就不会有可控的成本和质量。

所以,我们提出的解决方案就是希望能够通过引入业界的标准,来对代维服务进行规范,而业界对于服务的标准,最合适的莫过于ITIL。

1.2基于ITIL的解决方案

1.2.1 ITIL简介

ITIL是IT Infrastructure Library的简称,ITIL是:

(1)英国商务办公室从20世纪80年代开始开发的一套IT管理方法;

(2)已成为事实上的行业标准,并以其为中心在全球形成了完整的产业;

(3)任何单位和个人都可免费使用的“公共框架”;

(4)实际上是一系列由所谓“最佳实践”(Best Practice)形成的集合。

ITIL不是:

(1)硬件

(2)软件

(3)一个可以直接使用的标准

总的来说,ITIL致力于建立一系列完全的、一致的、连贯的最佳实践规范,以提高IT服务管理质量,并推动采用IT技术提高业务有效性。

业务管理(Business Perspective):服务需求管理

在提供服务的时候,首先应该考虑业务需求,根据业务需求来确定服务需求;

服务管理

(1)服务管理模块是ITIL的核心模块;

(2) ITIL把服务管理活动归纳为10个核心流程和一些辅助流程,然后利用这些流程进行有关服务管理工作;

(3)一共包括十大流程和一项服务台职能。

安全管理

(1) 1999年新增到ITIL中;

(2)目标是保护IT基础架构,使其避免未经授权的使用;

(3)为确定安全需求、制定安全政策和策略以及处理安全事故提供全面指导;

(4)侧重从政策、策略和方法的角度指导如何进行安全管理。

对于ITIL最核心的服务管理来说,主要包括:

其中,服务支持是对于被服务对象来说的一些具体服务内容,而服务提供是对于服务的管理,其中的服务支持流程图。

服务支持流程中,有一个服务台的概念,是所有服务的入口,直接面向被服务的对象,由服务台传递服务的请求到各个管理域中,并由服务台返回。

而其他例如事件管理、问题管理、变更管理、发布管理、配置管理等等,则是提供的具体服务。

服务提供管理里面最核心的概念主要是服务级别管理(SLM),在这里,服务被分成等级提供,类似商品销售,而网络维护商的主要核心竞争力也可以体现在这里。

1.2.2 ITIL应用于代维服务

下面我们将探讨ITIL如何应用于代维服务,这里不会对ITIL的每一个内容与代维相对应,而是针对最重要的几个方面,例如管理模式的变化、服务台、事件、问题、SLM等进行重点的展开。

管理模式改变

传统的代维业务管理模式无非两种,一种是项目式的,一种是职能式的,各有优劣:

而基于ITIL的代维服务是面向服务的,所以在管理模式上有很大的区别

通过图4、图5的对比,我们发现有几点变化

(1)面向客户的角色变化:对于客户(运营商)来说,面向的是网络维护商的服务台,接口是统一的,不存在哪一个客户之分,提供标准统一的接口,同时在服务台可以预处理大量的非确认的信息(包括客户情绪、信息混乱造成的误会、误报等),降低后台服务的压力。

(2)面向维护的角色变换:对于维护人员人员来说,面对的是具体的问题描述,所要作的是对具体问题的解决。

在服务台中,我们需要考虑的几个方面如图6。

服务台提供24小时的服务,是面向客户的唯一界面,服务台的主要目标是协调客户(用户)和IT部门之间的关系,为服务运作提供支持,从而提高客户的满意度。

作为与用户联系的“前台”,服务台首先对来自用户的服务请求进行初步处理。

当它预计无法在满足服务级别的前提下有效处理这些请求,或是这些请求本身就是它所无法解决的时候,它就将这部分请求转交给二线支持或三线支持来处理。

服务台的主要作用包括:

(1)响应用户呼叫。即对于用户发出的错误报告、服务请求、变更请求等事件进行记录和处理。这是服务台的最主要工作。

(2)提供信息。服务台是为用户提供服务信息的主要来源,一般可以采用布告栏、Email、屏幕消息、电话通知等方式为用户提供有关错误、故障或新增服务等方面的信息。

(3)客户需求管理和客户关系管理。服务台不仅仅是客户请求响应中心,同时也是客户关系管理中心。因此服务提供方应采取必要的措施和使用适当的技术对服务台进行有效的管理,从而使服务台可以准确迅速地了解客户的需求,改善客户体验,提高客户满意度。这些措施和技术包括结构化询问技术、详细了解客户和跟踪客户、维护客户数据库和在客户中推广服务台等。

(4)供应商联络。在服务运作出现故障或因客户提出新的服务请求而需进行有关变更时,服务台通常需要负责与供应商进行联络以维修或替换有关的软硬件组件。

(5)日常运作管理。服务台承担的日常运作管理任务包括值班统计、查勤等。

(6)网络基础架构监控。利用相关工具对网络基础

架构的运作情况进行监控,一旦检测到故障已经发生或即将发生,就应立即评估这种故障对关键设备可能产生的影响,并在必要时将检测到的故障报告事件管理部门。

图7是一个事件管理的例子(紧急通信故障处理),针对事件管理,我们应该考虑的方面。

事件(Incident)是指引起或有可能引起服务中断或服务质量下降的不符合IT服务标准操作的活动。这里所指的事件不仅包括软硬件故障,还包括服务请求,例如状态查询、重置口令、数据库导出等。

当多个事件需要同时处理时,必须根据事件所造成的影响、事故的紧急程度、解决事件的难易程度等因素确定事件处理的优先级。

如果在协议约定的时间内一线支持无法解决事件,就需要更多的支持人员介入,这称作事件升级(Incident Escalation)

我们自己要定义在网络代维工作中存在哪几类事件,对这些类型的事件分别给于不同的优先级,以及定义不同的事件升级流程、操作流程。

通常来说,我们的事件管理的流程如图9。

代维业务的问题管理

问题管理与事件管理都是针对事件而为用户提供支持的服务管理流程。但两者的目标是不同的,如果说事件管理流程是“治标”的流程,那么问题管理则致力于“治本”。如下三大目标:

(1)将由网络基础架构中的错误引起的事件和问题对业务的影响减少到最低程度;

(2)查明事件或问题产生的根本原因,制定解决方案和防止事故再次发生的预防措施;

(3)实施主动问题管理,在事件发生之前发现和解决可能导致事件产生的问题。

问题管理的一般流程:

举例说明,如专题网优就是一个问题管理的内容,我们需要考虑的如图11。

代维业务的服务级别管理

服务级别管理是(SLM)为签订服务级别协议(SLAs)而进行的计划、草拟、协商、监控和报告以及签订服务级别协议后对服务品质的评价等一系列活动所组成的一个服务管理。

从某种程度上讲,服务级别管理的主要任务是在服务质量需求和供给以及客户满意和服务成本之间寻求求一个合理的平衡。

对于代维业务来讲,首先需要的是定制服务的级别,就像我们在饭店中看到的菜单,不同的服务,不同的指标,有不同的级别,当然,也对应不同的服务价格。

SLA的标准制定流程如下:

而目前,代维服务并没有SLM的概念,所以造成的问题很多,客户认为,既然是服务,当然是无止境的趋向于完美,而网络维护商认为,服务的质量当然取决于成本,如果有SLM,那么服务的承诺、内容都很明晰,不再有此类的认识误差。

图14描述了从服务承诺到SLA的演变:

基于ITIL的代维服务的意义

(1)统一的客户接口

由于服务台的设置,对客户的接口也是统一的,在客户感知方面,有比较积极的影响,另外,统一的客户接口,使得服务台人员容易对客户做一些管理工作,而代维工作对于后台代维人员来说,变成了比较单一的面向问题的工作,真正做到专业专注,有利于分工和知识积累。

(2)服务标准化

我们来对比工厂的生产、传统的代维服务,基于ITIL的代维服务三者之间的情况。

可以看出,基于ITIL的代维服务,将实现三个目标

①服务标准化;

②成本降低;

③服务质量提高。

(3)服务指标量化和差异化

在SLM中,我们要求与客户签订SLAs,在不同的SLAs中,我们提供了不同的服务标准,也就是说,我们将服务指标量化,从而实现了:

①考核指标量化;

②差异化的服务提供。

参考文献

[1]《现代IT服务管理:基于ITIL的最佳实践》--曹汉平等--清华大学出版社(ISBN:730210818)

[2] OGC—《ITIL V3 Service Operation》

ITIL服务 篇2

【中文摘要】当今社会企业对IT技术的不断应用,企业方方面面的业务对IT技术的依赖越来越深.随着IT技术的飞速发展,使企业IT系统越来越来越复杂.服务器、交换机、路由器、数据库、应用系统分布于公司的各个部门,他们组成了庞大的企业应用系统,企业IT系统越来越多,网络、设备和产品越来越复杂,业务越来越依赖于稳定可靠的系统运行,公司内部和外部用户对IT部门的支持服务和协调管理也提出了更高的要求。这是企业IT组织迫切需要解决的问题。通过研究发现,随着信息化建设的推进,为了让凝聚了巨大人力物力投入的信息基础设施发挥出其效益,保障整个信息系统从组织内部各个层面都能够平稳可靠运行,尤其需要有一个可从整体上对包括IP网络,存储,安全等组件在内的IT基础设施环境进行综合管理的平台,由于信息系统是一个包括了众多软件,硬件技术,涉及多厂家产品,而且随着信息建设的深入和持续优化和发展,在当前的IT管理组织的运维体系下,往往存在以下现象:比如对不同的技术采用不同的专业人员进行管理;或者是缺乏某个方面的专业技术积累,即使长期培养的某方面技术维护能力容易因为人员的流动而难以保持;运维经验在管理人员之间难以得到交流和共享;或者难以通过有效简洁的手段及时得知复杂的网络和应用系统的运行状态;缺少一个易于理解和实施的体系,以整个单位的核心绩效为导向,来决策IT工作的改进方向,并通过量化,图形化,体系化的方式加以评估。本文以实际开发为实例,结合ITIL的理念,研究一个基于ITIL运维管理服务的运维管理系统的功能.实现对IT环境中各类基础设施的监控,包含有网络、系统、安全设备、数据库、中间件、业务系统、存储设备和机房环境等系统的监控管理,实现IT基础设施的集中式监控管理等功能,做到“有故障、早发现、早解决”的建设思路。对监控对象提供基于“性能基线”的阀值告警机制,通过根据一段时间的运行参数采集,系统自动掌握信息系统在“忙时”和“闲时”的负荷情况,自动生成性能负荷基线,在超过(或低于)基线一定比例(如60%)为告警阀值,实现性能与故障监控的智能化,显著降低告警的误报比例,在为管理员提供了工具的同时,也提供了相应的运维经验。从而协助企业实现基于ITIL的流程框架、运维管理的自动化、规范化和流程化。

【英文摘要】Nowadays, with the increasing application of IT technology, every aspects of the business operation rely on IT technology.AS the rapid development of IT technology, the IT system of business becomes more and more complicated.Servers, switches, routers, databases, and application systems located in every departments of company.They formed a large business application system.With the increasing number of business IT system, network, equipment and product become more and more complex, and business is increasingly dependent on stable and reliable system operation.These lead to a high requirement for the IT department’s support and cooperation

from the inside and outside of the company.This is the most urgent problem need to be tackled by the IT department.Through research, we found that, with the advance of information technology, in order to make the information infrastructure to play its effectiveness, to make sure that the entire information system can stably and reliably operate on every level of the organization, we especially need an integrated management platform, which allow us to control the environment of IT infrastructure, including IP networking, storage and security.Information system includes a lot of software and hardware.With the development and optimization of information construction, today’s IT management is tend to have the following phenomena: different technology asks for different experts to manage;lacking of some expert accumulation, even if long-term education, the turnover of the employees makes it hard to maintain;hard to share the operation and maintenance experience among managers;hardly through a simply method to notice the operation status of the network and application system;lack of an easy to understand and implement the system, which we can use to decide the direction of the IT work, and to appraise through quantitative, graphic, systematic way.In this paper, depended on an actual development, combined with

the concept of ITIL, we worked out a maintenance and operation management system that based on ITIL.We can monitor the IT environment of every infrastructure, including network, system, security equipment, database, middleware, business system, storage equipment and computer room environment.This can realize the concentrated monitoring of the IT environment.Based on the monitoring object’s“performance baseline”, we can set the threshold alarm mechanism.Through date collection, system will automatically get the load conditions, and generate performance load baseline, set the baseline over(or below)some ratio as the alarm threshold, to achieve the intellectually monitoring of performance and fault, which can reduce of the false alarm.This not only provides a tool for administrators, but also provides the corresponding Operation and maintenance experience.By doing this, we can help the business to achieve automation, standardization and streamlining of operation and maintenance of the management, based on ITIL.【关键词】ITIL 网管 运维 告警 监控

【英文关键词】ITIL network operation and maintenance alarm monitor 【目录】开发应用ITIL理念的运维系统

摘要

4-5ABSTRACT5-6第一章 引言10-151.1 ITSM 1.3 IT 第二章 2.1.1 背景及简介11运维管理的研究目标系统技术及需求研究信息技术成熟度模型161719-2021-3023-2424-2527-2930-6030-373738

1.2 国内外ITSM 的现状11-131315-2115-16

1.4 本文的组织13-152.1 评估方法15-16

2.1.2 IT 运维能力成熟度模型

2.3 PDCA 实施方法

2.5 系统构成特点第三章 系统概要设计3.1.1 部署架构设计

3.1.3 逻辑架构设计3.3 功能模块设计第四章 系统详细设计4.2 流程管理设计4.3.1 指标描述4.3.3 数据存储描述

4.4.1 4.4.3 4.5 4.5.2 接4.5.4 流程第五章 系统5.2 实现监2.2 规划方法16-172.4 需求功能定义17-192.6 本章小结20-213.1 总体设计21-253.1.2 物理架构设计243.2 系统架构25-273.4 本章小结29-304.1 系统界面设计304.3 数据库设计37-384.3.2 Instance 描述37-384.4 基于ITIL 理念的运维系统设计38-52

4.4.2 系统配置设计46-484.4.4 安全管理设计49-524.5.1 用户接口程序52-534.5.3 事件报警接口

4.6 本章小结5.1 监控界面实现

56-5859-6060-61报警设计细节38-46事件管理设计48-49接口设计52-59口描述53-56系统工单接口58-59功能实现60-71

控连接61-63警63-65理67-6970-71况7171-7273-7474

5.3 功能模块实现63-705.3.2 服务台事故管理65-675.3.4 报表管理69-70

5.3.1 事件告5.3.3 配置管

5.4 本章小结

6.1 软件测试概第六章 系统测试与分析71-746.2 测试计划716.4 测试用例72-73

6.3 测试环境搭建

6.5 测试结果与分析

7.1 工作总结第七章 总结与发展趋势74-767.2 系统不足74-75

ITIL服务 篇3

近日,在计世资讯最新发布的《2009年中国ITSM咨询市场研究报告》中,上海翰纬信息管理咨询有限公司(简称翰纬咨询)当选国内最优ITSM(IT服务管理)咨询和培训服务厂商。

据了解,翰纬咨询成立于2004年1月,是中国最早从事IT管理咨询的机构之一。“此次获得‘国内最优ITSM咨询和培训服务厂商’殊荣,标志着翰纬咨询在ITSM业界的专业性已经得到认同,而ITIL(信息技术基础设施库)在国内的发展也进入了一个上升时期。”IT服务行业资深专家、上海翰纬信息管理咨询有限公司副总经理刘亿舟表示。

刘亿舟告诉记者,ITIL概念自2000年引入中国之初,发展颇为缓慢。这是因为“ITIL本身还不是一个真正的标准,而是一个指导框架,可以遵守也可以不遵守”。

因此,刘亿舟认为,要使ITIL落地,首先要制定标准。“像ISO2000,中国企业遵循这个标准的目的是为了说明服务质量更好,这是一种信号传递。所以,先制定IT服务管理方面的标准,才可以让企业更好地遵循ITIL。”

据了解,目前全球市场上,出现了各种各样的IT服务管理方法,而在工业和信息化部软件服务业司主导下,我国也提出了制订IT服务国家标准的计划。刘亿舟表示: “翰纬咨询作为IT服务管理标准小组的组长成员参与了标准的制定,如今标准草案已经取得了很大进展。”

ITIL助推IT服务质量的提升 篇4

首先,需要建立合理的流程。通过对纵向的技术管理的整理,形成典型的流程,这些流程是供IT部门内部使用的。再对流程进行打包形成特定的IT服务提供给业务用户。过去,信息技术被当作是一系列具体的工具,去支持具体的业务流程。而现在,关键的业务流程很高的依赖集成于IT,两者在本质上是不可分的。对于IT人员的要求变得更加广泛,也更加苛刻;尽管现有系统的性能、可靠性、成本效益仍然是关键,但远远不够;IT服务提供者也需要提供高适应性、可预见的、可扩展的、一致的、和可控的IT流程,紧密的同业务流程相匹配。因此信息部门的首要职责就是建立完善的IT服务流程,为业务部门提供全方位的业务服务。流程的设计可以从简单入手,在成功实施简单流程自动化后,再进行复杂的管理流程。流程的设计需要结合现状,现有流程的直接电子化转换、完美流程的拷贝都是不可取的。流程的设计需要克服传统组织形式和管理方法在效率和灵活性方面的不足,目标明确,岗位明确,接口明确,逻辑清楚、完整、严谨。需经过全面深入调研,提高流程可行性。制作流程,关键在可行性。

其次,工具的使用同样重要。管理工具是指在IT服务管理过程中能够借助的用来提高服务质量和效率的工具的总称。通过管理工具,可以实现信息部门和业务部门的紧密结合。在IT服务管理实施的过程中,需要关注两类工具:一个是IT监控和诊断优化工具,另一个是流程自动化工具。使用IT监控工具,提供对网络、主机、操作系统、存储设备、数据库、中间件及应用软件等IT资源的全面管理,通过报表统计、系统运行情况分析等反馈为运维人员提供综合分析和量化数据,进而提出性能优化的建议,更好地提高IT服务水平。在引入运维监控工具时应该考虑到几个方面:首先是资源消耗小;其次是不影响现有系统的稳定性并且自身也要具有良好的稳定性;最后管理的颗粒度确实能够解决实际的问题。在使用管理工具的同时,注重流程等制度的约束和引导,这样才能更好的发挥效益,否则难以得到很好的应用。另外,需要关注工具之间的联动和信息整合,尽早进行统一规划,建立规范性要求。

再次,对于大量信息的合理使用也是实施ITIL的关键。在实施的过程中,会产生大量的信息,包括IT本身的、流程的、人员的、业务部门反馈的意见等。应该做好这些信息的筛选、积累和应用工作,保证信息的及时性、准确性。对于这些信息的合理应用,有助于进一步提高IT服务质量和满意度。收集信息的途径是多方面的,一方面通过运维监控系统和流程协同管理平台产生运行质量报告;另一方面通过建立服务反馈制度、认同服务满意度调查、举行运行质量分析例会等发现IT和流程潜在的问题,从而推进服务管理走向科学化。

ITIL服务 篇5

标签: itil 运维 it服务管理 信息系统 流程

摘要:

医院信息系统的规模日益庞大,复杂程度也越来越高,传统的、作坊式的医院IT运维模式已不适应时代的发展。改变原有被动处理问题的工作方式,建立主动服务的管理体系是IT服务组织发展的必然趋势。本文结合作者的实际工作经历,围绕着ITIL实施的核心要素:人员、流程和工具,对传统医院IT运维模式的弊端进行了分析,记述了基于ITIL理念对医院IT部门进行改造、建立全新IT服务体系的方法和步骤,最后对实施效果进行了总结。关键词: ITIL、IT运维 正文:

一、前言

随着医院信息化建设逐年深入,医院信息系统的规模日益庞大,复杂程度也越来越高。医疗业务在享受信息系统提供便利的同时,对信息系统的依赖度也越来越高。信息系统故障不但可能导致医疗业务的中断,甚至有造成医疗事故的可能。IT部门在日常运维工作中遇到的问题也越来越多样化,涵盖了从软件到硬件、从服务器到桌面PC机、从网络管理到机房管理、以及信息系统安全等方方面面。因为故障原因复杂,又缺乏有效地IT运维管理方法,不能及时解决问题,常会引起用户的不满。所以如何有效的管理IT资源,保障信息系统的可靠运行,提高用户的满意度,是医院IT部门必须面对的问题。

二、传统的医院IT运维模式的弊端

传统的医院IT运维模式是在信息系统功能单

一、规模较小的环境下形成的,IT部门的员工就像“救火队员”一样被动的处理故障,常常存在如下弊端:

1、分工不清

“信息中心的电话没人愿意接,谁接电话谁倒霉。”这是一个医院IT圈里流传很广的段子,也是许多医院IT部门的真实写照。因为电话里多半是这里或那里又有故障报修,无论是硬件故障、网络不通、还是软件宕机,对于用户来说都是“电脑坏了”,故障描述不清,而解决起来也是千头万绪,搞不好就要花上半天的时间。大家都忙着做项目,运维工作貌似都要管,其实就是都不管,多一事不如少一事,接电话就成了烫手的山芋。

2、人员短缺

信息中心的工作繁杂且琐碎,大家除了有新项目要推进,每天处理日常故障还要花上很多时间。IT部门是医院的辅助部门,又是成本中心,既非主营业务,又不直接产生效益,琐碎的工作无法量化,就很难在人员录用上得到上级领导的支持。随着信息系统一个接一个的上线,IT设备也越来越多,但人员还是那几个。不但工作压力越来越大,工作价值还得不到认可,人员短缺问题严重制约了信息化的持续发展。

3、重建设轻运维 由于医院信息化建设逐年深入,业务部门对信息化建设的需求十分迫切,支持新的信息系统上线投用通常是医院IT部门工作的重点。而上线后的系统运维工作通常仍由原项目实施人员兼顾。在这种运维模式下,一是解决问题完全依赖工程师个人经验,对问题发生的原因、处理过程,排查分析都没有记录,不但没有避免同类事件再次发生的机制,甚至在同类事件再次发生时,也无法为其他工程师提供解决问题的参照依据;二是没有监督和跟踪机制,在繁杂的日常工作中,比较困难的问题常常经过几次转手之后就被束之高阁、不了了之了。

4、系统变更风险大

信息系统运行过程中仍需随着业务的变化做出调整与修改,既包括软件功能的完善,服务器数据库的调优,也包括新增网点、添置新的IT设备。在缺少配置信息和文档管理的情况下,规模较小的系统,问题还容易控制和解决。随着系统越来越复杂,集成度越来越高,任何一点小的调整都可能牵一发而动全身,造成整个信息系统体系的不稳定。工程师们常说“本来改了个小问题,没想到改出个大毛病”“需求不改是等死,改了就是找死”

5、IT部门没有IT系统

医院的财务部门有收费管理系统、临床部门有医护工作站,检查检验科室有LIS、PACS,然而在IT部门不遗余力的推动医院信息化建设的同时,自身却还停留在“口耳相传”的作坊时代:IT设备报警靠人工巡检、运维工作量无法统计、人员能力没有考核依据、纸质配置文档常与实际不符、无法形成有效的知识传承等,常被医院IT部门员工们戏称为“灯下黑”。

由上可见,传统的医院IT运维模式已无法支持日益庞大的医院信息系统。结果就是上线的信息系统越多,出现的问题就越多,解决问题越来越困难,用户满意度越来越差。

三、建立基于ITIL理念的IT服务管理体系

ITIL(Information Technology Infrastructure Library,信息技术基础架构库)是英国中央计算机和电信局CCTA于80年代中期开发的一套针对IT行业的服务管理标准库[1],其核心是通过服务台和10大管理流程,支持IT基础架构和组织业务的持续运作,通过主动的IT服务管理,保证IT资源的有效利用和业务运作的高可用性、高持续性和高安全性。ITIL是公认的IT服务管理的最佳实践,在世界范围内被广泛应用。

ITIL实施的三要素是人员、流程和工具。10大管理流程包括:事件管理、问题管理、配置管理、变更管理、发布管理、服务级别管理、持续性管理、可用性管理、能力管理、财务管理,涵盖了IT服务中的各种场景。人员不仅仅指IT运维人员,还包括管理层和最终用户,强调人的能力、意识和执行力是决定项目成败的关键。工具是指将ITIL流程落地的软件系统,通过IT服务管理软件可以使流程的处理步骤更清晰、提高人员的执行力;除此之外,该软件还应包括IT运行监控系统,将IT设备的运行状况纳入IT服务管理。

围绕这三个核心要素,根据院区实际情况,我们按照以下思路进行了ITIL实施:

1、以甲方为主的IT运维人员外包

由于医院是事业单位,人员录用受编制限制,人员短缺的问题就只能借助外部力量解决了。人员外包虽然有机制灵活、人员技术能力强的好处,但外包人员只是按甲方要求提供被动的服务,缺少对组织的了解和认同感,还需要甲方进行主动管理。因此,我们确立了以甲方为主的外包策略,制定了“与业务关系紧密的岗位不外包”、“只外包工作,不外包责任”的方针,要求外包厂商与原有IT部门工程师按AB角配置,即在各个专业上都有甲乙双方工程师共同工作:甲方工程师以管理为主,侧重方案审核和沟通协调;乙方以解决具体技术问题为主,若现场工程师不能解决,协调二线专家解决。按此原则,经过公开招标,最终与某知名IT服务厂商签订了合同,在网络、主机和桌面运维方面进行了人员外包。

2、从服务台开始的ITIL流程实施策略

服务台是整个IT运维体系的核心节点,是用户与IT部门联系的统一门户,所以我们首先设立了统一的IT技术支持电话,在全院范围内进行了“IT报障打XXXX电话,由服务台统一跟踪解决”的宣教,还将IT技术支持电话制作成标签,贴到每一台客户端计算机上,以便用户拨打。

在工作职责上,要求服务台人员按照《IT技术支持电话接听规范》进行电话应答,首先做“过滤器”,对问题进行初步判断,并尝试自己解决问题;再做“路由器”,不能解决的再转到二线;最后做“司令部”,全体人员均须听从服务台指令,服务台当值人员具有绝对权威,可根据自己的判断要求二线工程师优先处理运维事件。桌面运维岗位由初级工程师担任,负责处理现场问题。服务台岗位与桌面运维岗位不定期轮岗,以保证服务台人员了解现场情况,并具有解决具体问题的能力。二线岗位由资深工程师担任,分为应用系统、网络、主机等不同专业方向。对于服务台和桌面工程师不能解决的问题,由二线工程师跟进研究,并给出解决方案。

3、以事件管理和问题管理为流程驱动

在ITIL的10个管理流程中,事件管理和问题管理是与服务台关系最密切的,所有的用户故障报修都通过这两个流程进行处理的。事件管理的目标是帮助用户快速恢复业务,为此我们设定了24小时的默认处理时限,若事件不能在规定的时间内处理完成,就需要升级为问题,重点关注解决。事件处理实行首问负责制,第一个接到用户报修的人,即使将事件派转出去了,也必须一直跟进该事件单,直至关闭。

问题管理的目标是找到事件发生的潜在原因,我们通过每周工作例会的方式,对尚未解决的问题进行多专业会诊,明确责任人和预计解决时间,每周跟进,直到问题处理完毕。对于重点问题,我们还会通过OA系统向相关用户通报进展,以获得用户的理解和支持。

4、以流程的建立和制度的落实来降低风险。

既然信息系统变更是信息系统生命周期中不可避免的环节,那么通过规范化IT管理可以将IT运维过程中系统变更的风险降到最低。配置管理是IT运维管理的数据基础。其核心是建立CMDB(Configuration Management Database,配置管理数据库),我们将原来分散在各个项目手中、手工管理的资源,统一录入了数据库,既方便运维人员查阅,又能保证信息及时更新。

在此基础上,我们制定了一系列的制度和流程,保证所有的变更操作都在可控范围内进行。如:所有服务器操作要求“方案先订、试验回退、通知用户、双人执行、操作记录、检查应用”,所有软件升级要求事先提出申请,按照《软件发布及变更操作指导书》进行,保证每次软件升级都经过了充分的测试,并当发生问题时可以回退。

5、通过工具软件落地流程的执行

ITIL的实施不但需要流程的设计,还需要工具软件来落地,为此我们采购了一套ITSM(IT Services Management,IT服务管理)管理软件,IT部门也借助信息系统提高了工作效率。

首先实施了IT运行监控系统,将机房环境、网络、服务器、数据库、客户端都纳入了IT运行监控体系,既减轻了信息中心运维人员的巡检压力,又可实时及时全面的掌握信息系统各个环节的运行状况。然后开始逐步上线IT服务管理系统,针对运维团队规模较小,紧急事件多的现状,进行了如下调整:一是在工单填写项目上进行了精简,只要描述清楚“什么人、在什么地方、报修什么问题、如何解决”即可,多设置选择项,少做填空,既提高填写速度,又便于后期统计分析。二是简化工单流转流程,事件执行不做事前审批,而在完成后由事件经理进行审核;紧急事件可不填写工单立即处理,但应在24小时内补填工单,记录事件处理过程。

四、效果与思考

通过以上的工作,我院的IT运维工作正逐步走上正轨。通过统一的技术支持电话,大家从繁杂的日常事务中解放了出来;通过明确的分工,使每个人的专长得到了发挥;通过有效的工作组织,IT部门不再单兵作战,更多的依靠团队合作解决问题;更重要的是,通过流程的落实,实现了闭环管理,从而在制度上保障了信息系统可靠性。然而我们也意识到,ITIL的落实不是一蹴而就的,特别是对于中小规模的IT组织而言,更不能教条的照搬ITIL的全部流程,而应根据自己工作中遇到的问题,有选择的实施某些流程或者流程中的某些部分。比如我们在事件处理流程中就减少了大量的审批环节,而进行事后审查。这样既保证了闭环管理,又提高了工作效率。

在ITIL实施的过程中,改变了大家原有的工作习惯,总会让人有些不适应,这不但需要实施的技巧,更需要逐步磨合完善;通过一段时间的积累,在ITSM系统中已经积累了大量的事件和问题的处理记录,通过对这些数据进行分析,不但可以考核每个运维人员工作量,还可以将个体的经验汇总为知识库,建立学习型组织,从而实现知识的有效传承。

ITIL服务 篇6

“金保工程”运维管理的现状和挑战

“金保工程”是利用先进的信息技术,以中央、省、市三级网络为依托,支持劳动和社会保障业务经办、公共服务、基金监管和宏观决策等核心应用,覆盖全国的统一的劳动和社会保障电子政务工程。目前,金保工程一期建设工作已基本完成,全国共建立地市级以下统一的数据中心270多个,部、省、市三级联网的地市达到319个,已批准发行社会保障卡2亿张,实际持卡人数1亿人。

(一)“金保工程”运维管理的基本现状是:

1.地方在实际业务中高度自治,运维管理处于典型的分散状态。

2.地市、县的运维工作大多由集成商、开发商进行支持,没有系统化的运维管理。

3.信息化部门目前的支持与管理流程需要调整,以满足人力资源和社会保障核心业务的要求(如生产、交换、决策和公共服务等)。

4.各地信息化部门负责直属机关的运维工作,对数据共享与交换的集中管理有限。

5.目前信息化部门存在的地市分布式运维方式,无法满足人力资源和社会保障业务体系化的发展需求与“金保工程”对数据的集成与共享的管理要求。

(二)“金保工程”运维管理面临的挑战是:

1.信息化管理部门如何与业务部门有效对话。

2.如何建立数据中心运维管理体系以提供高效支持。

3.信息系统如何加强对业务发展的适应力。

4.如何建立并实现有效集中管理以满足核心业务需求。

5.如何加强信息口对业务的系统化支持。

6.如何加强信息化部门的协同力。

7.如何提高信息化部门的管理水平。

8.信息化部门如何帮助业务创新。

从以上分析可以看出各地“金保工程”运维管理还存在很多急需解决的问题。随着各地“金保工程”二期建设工作逐步推进,人力资源和社会保障信息系统多数已正式运行并进入维护阶段,而且人力资源和社会保障信息化管理部门在地位提升的同时,也意味着要承担更大的责任,即提高人力资源和社会保障的业务运作效率,降低业务流程的运作成本。为做好“金保工程”运维管理工作,各地人力资源和社会保障部门需要尽快规划,運用ITIL理论,以ITIL三个流程两个库为建设重点,采取必要的措施,解决“金保工程”运维管理中存在的问题。

以ITIL的三个流程和两个库为建设重点

ITIL的三个流程和两个库是事件管理流程、问题管理流程、变更管理流程,知识库和配置库。

1.事件管理流程

所谓事件,是指任何不符合服务的标准操作且已经引起或可能引起服务中断和服务质量下降的现象。事件管理流程通过对事件的相关环节进行规范,从事件的记录开始,经过分类和初步支持、调查与诊断、解决和恢复,直到与客户确认后事件的关闭,流程中的各个环节前后相连,流转有序,并规定每一环节处理的最长时限。通过事件记录员、事件分析员以及事件经理等角色的明确,责任到人。从而达到在发生事件后,能在最短的时间内解决并恢复客户中断的服务,提高客户满意度。

2.问题管理流程

问题管理流程的目标就是通过一系列规范的环节,找到问题的根源,并形成解决方案。从问题的检测与记录开始,经过对问题的分类和分派、调查和诊断,直到问题的最终关闭。各环节连续清晰,环节角色分工明确,从而实现在发现问题后,能够迅速地找到问题的根源,形成解决方案,为最终解决问题打下基础。

3.变更管理流程

变更流程是指需要对系统的软件或硬件进行变更,其流程如下:开单→风险评估→审核→审批→构建(设计、开发)→测试、实施→实施审核→实施→关闭。各环节紧密相连,易于控制,保证变更的高效有序。

4.知识库

知识库,顾名思义,就是为达到积累知识的目的,将事件、问题和变更的经验都总结到这个库里。一线工程师利用知识库帮助用户解决问题,如果发现知识库里没有相关的知识条目,就需要把这个新内容增加到知识库中。一线工程师详细记录出现故障主机的时间、故障现象、处理措施、主机的使用者,经过长期积累,可以针对经常出故障的主机用户进行分析,确定其操作行为特征,并提出相应的建议或处理措施。

5.配置库

配置库,主要是记录系统软硬件配置信息。在行业范围内不管是硬件,还是软件,配置库记录得越详细,给维护人员提供的信息就越准确。此外,不光是配置信息本身,关联信息也要在配置库里体现出来,譬如它的父或子分别是什么。可以说,配置库是事件、问题、变更管理流程的基础。

运用ITIL理论需要采取的措施

第一,建立三级运维架构,优化运维人力配置。通过人力资源的整合与配置,形成一线客服、二线支持、三线研发的人员梯队结构,更好地适应决策管理系统运维工作的开展。一线客服承担着ITIL理论中“服务台”的角色,受理服务请求,提供一线帮助,并对提出的各种情况进行处理; 二线即系统运维部门作为核心团队负责运行维护和管理工作,支持提供专业技术更强的技术支持服务,深入研究疑难事件和问题,对网络、数据库、中间件、应用、安全等进行主动运维,并解决信息服务台转交的请求,在必要时协调供应商、开发商等外部资源或者在提供现场服务的情况下及时到现场排忧解难; 供应商、开发商作为三线支持,支持运维中心二线不能解决的问题。采用分级管理的工作模式,通过一、二、三线之间的明确分工和紧密配合,形成较为合理的运维人力配置,提高了人力资源和社会保障系统运维服务效率和质量,并降低了运维服务总体成本。

第二,制定、规范、落实运维制度和流程。建立运维流程项目组、运维监控项目组和灾备系统项目组,完成包括网络管理、中间件管理、数据库管理、用户管理、机房管理、事件管理、安全管理以及外包公司管理等共计29个运维制度和流程,建立“培训-实施-报告-检查-回顾/审计”的流程实施和完善机制;引入运维责任事故通报和外包公司经济责任追究制度,提高人力资源和社会保障部门和外包公司技术人员安全防范意识,强化外包公司的管理;组织实施集中运维监控系统和集中监控室,实现对复杂IT系统的全面监控。运维服务管理系统规范运维工作流程,包括事件管理流程、问题管理流程、变更管理流程,并形成知识库和配置库,将日常维护管理工作明确化,保证人力资源和社会保障IT系统的稳定性、可靠性和用户的满意度,为人力资源和社会保障事业提供可靠、高效、安全的IT服务。

第三,建设集中运维监控系统。集中监控平台可以实现信息系统基础设施和应用的全面监控。监控平台实现提前预警,变“救火队”为主动运维,信息系统运行维护的效率大幅度提升。

第四,打造过硬的运维团队。为保证运维服务“业务不中断、数据不丢失”这一目标的实现,人力资源和社会保障部门需要组建一支技术过硬、综合素质较高的专业运维队伍并实施科学管理,从人力资源上给予充分保障。在配置运维人员时,采用AB角的方式,充分克服单点故障可能带来的风险,实现人力资源的互为备份。此外,人力资源和社会保障部门借助社会化培训、绩效考核、激励机制三个方面不断优化人员配置,做到“感情留人、待遇留人、制度留人”,提高技术人员的待遇,并为其创造锻炼成长的环境,逐步造就了一支专家型队伍。

第五,加强落实执行管理

在人力资源整合与优化的基础上,人力资源和社会保障应通过ITIL项目的建设使运维流程得以逐步规范,使每个运维工作中的事件、问题和变更等都能责任到人,并得到足够的关注和后续跟踪,提高运维工作的质量和效率。

人力资源和社会保障运维团队应对现有的流程模式进一步深入研究细节,逐步制定各细节环节的业务规范,并落实执行,通过定期的工作检查和业务考核,牢抓运维工作的落实执行,使运维工作的各项规范制度真正落到实处。

ITIL服务 篇7

信息技术基础构架库(Information Technology Infra- structure Library,ITIL)为IT服务管理实践提供了一个客观、严谨、可量化的标准和规范,IT部门和用户可以根据自身能力和需求,参考ITIL框架的6个主要模块(即业务管理、服务管理、ICT基础架构管理、IT服务管理规划与实施、应用管理和安全管理),来规划和制定其IT基础架构及服务管理。ITIL已经在全球IT服务管理领域得到广泛认同和支持,无论各公司的理念和解决方案有多大差异,但目标都是一致的,即将IT与业务相结合,以业务为核心搭建和管理IT系统[2]。

对网络管理中心来说,构建基于ITIL的网络运维服务管理系统,可提供灵活的、流程化、规范化的IT服务管理,可保障网络安全稳定可靠,提高用户满意度和维护人员的工作效率。将ITIL理论引入网络运维服务管理,不但能适应业务系统迅速发展要求,优化人员、流程、设备等要素资源配置,而且可以推进管理方式由被动急救向自动监测预警转变,运维模式由技术型向服务型转变。所以, 实施ITIL的最大意义在于网络管理效能提升。

1传统网络运维服务管理的局限性

传统的网络运维服务管理缺乏一套高效的运维机制和运维技术工具,服务管理被动、孤立。运维人员往往在故障出现后才采取相应的补救措施,造成运维服务满意度不高。因此运维管理模式智能化、自动化和数据共享是网络运维管理需要解决的问题。结合实际工作经验,传统的网络运维管理存在以下局限:

(1)网络服务效率不高。日常设备维护管理工作随着服务器数量的增加逐渐繁杂。在维护过程中,不同的网络问题需要不同的技术人员处理,运维人员的操作流程各异,服务质量参差不齐;处理问题的经验无法分享,工作效率不高。由于维护缺少层次,造成维护作业不能标准化, 更无法对配置数据库(含系统硬件、操作系统、数据库、应用程序等)进行协同预警和管理。

(2)网络管理功能单一。网络管理对象主要是路由器、交换机、防火墙、服务器、终端等,其更多地体现的是 “监控”功能,对硬件、软件、服务、基础设施等实施控制的功能不足。

(3)网管系统结构不合理。一般的局域网管理采用平台式管理结构,目的仅限于监控网络设备和收集数据,不能自由设定、灵活配制,经常要在后台修改数据,甚至要改程序。随着网络设备的增加,网络管理响应时间越来越长,一旦管理程序超出平台处理能力,平台本身就成为管理瓶颈。

(4)网管系统兼容性不好。在网络管理领域,传统的网管系统基于不同操作系统的网络管理软件,它和操作系统的性能紧密相连。操作系统的细微变化,版本升级换代,都有可能引起网管系统软件加载运行失败。在特殊领域,现有的网络管理协议,例如SNMP、CMIP等不适合对特殊网络进行管理[7]。

2系统架构

网络运维服务管理系统基于C/S模式设计,将网络运行、网络事件、网络监控、资源配置管理等网络服务细化成前后关联的工序单元,结合网络应用、网络运维、性能分析和故障响应处理等管理流程,将传统的粗放型网络管理引向精细化流程网络管理体系。系统架构如图1所示。

该系统主要分成为5个模块,网络监控管理模块、应用服务管理模块、网络资源规划管理模块、事件性能分析模块、故障响应管理模块。

2.1网络监控管理模块

其功能是实施设备运行性能和网络流量管理。可对全网设备进行状态检测,展现某一时间段的流量、流向总览试图,能用颜色区分链接通断状态。该模块包括3个部分:1性能监控。实时了解网络联通性和拓扑变化,监测路由器、交换机、主机、小型机、工作站、存储平台、磁盘阵列设备、磁带库等设备,提供CPU利用率、内存、磁盘占用、CPU、风扇转速、内部温(湿)度等参数。监测各类网络设备指标参数,包括端口流量、丢包率、利用率、发送速率等网络指标,定时采集数据,自动生产性能报表,以网络运行视图、应用逻辑视图展现;2网络运维服务的监控。对网络技术人员对网络进行维护、故障排查、故障处理结果等信息进行采集;3阈值监控。提供阈值管理和阈值告警,通过阈值检查开关,控制阈值检查告警,并对其进行修改、应答;4基础设施监控。采取集中式监控结构,通过各类传感器监控电流、电压等电能参数和温湿度、二氧化碳等环境指标,将漏水监测、烟雾和红外传感器、突发火情以及非法人员进入等情况,在事发区域发出声光报警信号, 并发送至管理中心,同时根据需要自动切断支路电源,或自动启动空调及排风系统。

2.2应用服务管理模块

其功能是实施业务服务管理。可对网络服务器、主机客户端上部署的数据库、操作系统、中间件以及业务应用系统进行集中监测。在自动统计业务用户网络地址、业务类型信息的基础上,对登录用户网络行为进行动态监控, 分析不同时间段业务流量分布,评估业务运维状态;对重要信息内容、敏感关键词等进行统计分析。

2.3网络资源规划管理模块

其功能是实施网络拓扑和资源配置管理。以拓扑视图方式展现资源,可以布设网络信息中心、地区接入中心、 维护控制设备、网络电路,设置设备链接端口、互联地址。对所有网络设备、端口服务、网管终端、文电终端及各类应用服务等资源,能生成网络设备(链路)规划表、信息资源及应用服务配置表,通过简单配置、调整,方便进行整个系统的变更过程管理。

2.4事件性能分析模块

其功能是实施数据进行处理和分析。对重点控制域内海量数据快速统计、整理,并分析有关数据,进行统计、 分类、过滤、计算、融合、转换和定位,对网络性能状况作出判断,产生性能报表,直观反映分析结果。另一方面,采用模糊评估分析,通过指标量和权重设定,对网络故障趋势、 网络运维隐患提供相对准确的定位,为验证、监控、故障处理提供信息保障。

2.5故障响应管理模块

通过对运维知识库的管理,产生各类报表,提供系统故障预测报告。实施应急快速维修辅助决策,实现专家系统维修辅助、计算机辅助故障诊断与维修、网络远程维修等功能。利用运维知识库存储运维管理制度与流程、运维管理经验、故障解决方案及相关知识,达到知识共享的目的。

3结语

管理是一门艺术,因为它没有确定的模式,只要严格遵循,就可以产生同样的效果,ITIL也是如此[4]。 虽然ITIL包含了IT管理的最佳实践总结,但从本质上讲,它其实只是一系列可执行的事件列表[2]。当网络运维服务管理系统填充ITIL流程框架时,会给一套出符合网络管理中心网络维护需求的系统,解决系统运行维护难度大、 业务管理繁杂、服务响应效率低等问题。一个好的IT管理问题解决方案,需要流程、人员和技术三大要素的有机结合。但技术只保证了服务的质量和效率,标准流程则负责监控IT服务的运行状况,而人员素质则关系到服务质量的高低[3]。因此,深刻理解ITIL的核心理念,从业务和技术发展要求出发,需将网络管理标准化、流程化、精细化,推进管理方式由被动急救到自动监测提前预测转变, 由技术导向型向业务服务型转变。

摘要:信息技术基础构架库作为IT部门服务水平一个客观考评依据和标准,可以为IT服务管理业务运作提供更好的系统支持。网络管理部门可根据自身业务需求,定义服务水平的不同等级,利用信息技术基础构架库提高网络管理能力和运行效率。结合网络管理中心工作实际情况,探讨网络运维管理过程中存在的问题,提出基于信息技术基础构架库的网络运维服务管理系统设计及构建思路。

ITIL服务 篇8

关键词:ITIL,IT服务管理,质量管理

随着信息化在高校的不断深入发展, 信息化技术已经成为支撑高校管理的最强大工具, 是提升高校教研核心竞争力的重要手段之一。与高校信息化建设规模的日益壮大同步而来的是各类信息化软硬件数量上的急速增加, 以及信息系统用户数量的持续增长。如何维护好日益增多的信息系统、硬件设备, 保证信息系统顺畅地运行, 及时解决出现的问题和故障, 为高校的教研提供良好的服务是有效支撑高校管理和正常运行的关键所在。本文通过建立IT服务管理体系来解决此问题, 为信息化用户提供更高效满意的管理和服务。

1 高校IT服务管理存在的问题

学校正处在新一代数字化校园的建设当中, 软硬件的增加、新系统的上线、系统整合等等, 都会为信息化的建设带来困难、提出问题, 而学校往往通过引进新技术来解决这些问题, 却忽视了信息化的服务和流程管理, 这都会引起新问题的出现, 而这些问题的出现在于学校缺乏有效的IT服务管理, 造成了信息化建设和运维的瓶颈。

目前, 学校IT服务管理存在的问题可以归结为以下几点:

1.1 信息化建设缺少统一的战略规划

信息化各业务子系统之间缺乏统一的管理平台, 各业务系统之间都相对比较独立, 由使用部门对系统进行管理和维护, 各业务系统之间数据共享率较低, 数据之间的逻辑关系被割裂, 系统之间缺乏内在规律, 难以形成完整统一的运维体系。

1.2 IT运维管理机制还够健全

第一, 运维人员没有建立以用户为中心的服务意识;第二, 各运维组织之间界限定义不清, 运维人员的职责分工不明;第三, 没有建立起运维指标数据;第四, 运维管理没有形成流程化、规范化的管控模式;第五, 运维模式单一, 单靠个人被动运维的模式已经难以满足目前的发展;第六, 缺少运维管理工具, 运维数据及知识的记录和共享效果较差, 无法支撑系统故障从提报到完成的全过程追踪和监控管理。

1.3 IT服务管理缺少数据的支撑

以信息化为支撑的业务范围越来越广, 需要对IT基础架构设施进行具体的配置, 对其运行状态、故障、性能进行了集中监控, 及时发现故障并报警, 同时对运行性能历史数据进行深入、定量分析, 并提供各种中长期运行趋势和运维报表, 及早发现问题, 为IT运维人员提供运维数据支撑, 而目前还没有形成此方面的数据库。

从上述的问题不难发现, 当前, 在学校信息化的建设过程中, 信息化工作的焦点已经不再是技术是否先进, 其焦点逐渐转移到如何对信息技术资源进行有效的规划、组织、协调和控制等等。

2 IT服务管理与ITIL

2.1 IT服务管理

IT服务管理 (ITSM) 是对IT服务的管理, 是一套通过服务级别协议来保证IT服务质量的协同流程, 以流程为基础, 以客户为中心, 注重服务品质和服务成本的平衡, IT服务管理将IT作为支持组织业务目标实现的一种支持性服务, 强调以合理的成本提高IT服务的品质和客户的满意度。

2.2 ITIL

ITIL即IT基础架构库 (Information Technology Infrastructure Library, ITIL) , 由英国中央计算机和电信局在20世纪80年代末制订, 主要适用于IT服务管理 (ITSM) , 它为IT服务管理提供了一组全面和一致的最佳实践。

ITIL自提出以来已有多个版本, 目前的ITIL版本包括了六大模块, 十个核心流程, 一项管理职能, 即服务台。ITIL作为IT服务管理领域的实践标准, 得到了广泛的认同, 目前全球已经有1万多家知名公司在参考其方法来管理自己的IT系统。在教育行业中ITIL目前在已经有了一定的发展, 如国外的悉尼大学、普林斯顿大学等, 而国内的个别高校, 如清华大学、中山大学、复旦大学等也已开始尝试和探索。清华大学自2005年引入ITIL管理思想以来, 建立了服务台, 为用户提供统一的服务结构, 建立相关的ITIL流程;中山大学从2006起开始实施ITIL, 涉及了ITIL的多个流程, 并建立了呼叫中心, 形成了多线运维支持, 建立了绩效考核机制;复旦大学于2004年开始筹建运维服务中心, 从技术、人员、流程三个方面进行了体系的建设, 成立了专业的服务团队、制定统一的服务流程及服务标准、建立服务管理平台;ITIL在高校的应用极大减轻了运维人员的压力, 提高了运维人员的服务水平和运维效率。

3 IT服务管理体系的构建内容

目前, 高校的IT服务管理还处在初级阶段, 实施ITIL的最主要的需求在于为高校构建一套完整的IT运维管理体系, 无论从组织人员、管理流程还是技术工具方面, 能够从整体结构上达到有机结合, 因此可将建设内容分为以下三个方面:

3.1 运维团队建设

定义详细、高效、可量化的运维管理岗位职责、技能要求, 以及与现有岗位的匹配策略, 设立跨职能的运维角色, 将运维人员划分为服务台、一线、二线、三线人员, 同时设定各流程经理等管理角色, 形成IT运维管理的矩阵式组织管理。

3.2 运维流程建设

包括服务台建立, 实现任务接收与反馈的统一接口;配置管理数据库建立, 整理配置管理数据库的基本分类及属性;IT服务管理流程建立:包括事件管理、问题管理、配置管理、变更管理、发布管理等服务支持流程, 又由于学校正在实施新一代数字化校园项目, 根据实际需求引入了质量管理理念, 建立了质量信息反馈流程, 使在新建项目中遇到的问题得到了及时反馈;服务报告流程建立, 提升了业务服务意识;运维知识库建立, 支持运维人员分享经验, 方便知识检索;IT运维管理绩效考核指标建立:明确各流程的目标、负责人、绩效考核指标, 实现日常工作和流程的匹配框架, 使得所有流程能够体现和落实到日常的具体工作中, 确保流程运行的有效落地;IT服务管理流程的可操作性规范的建立, 流程的落地需提供必要指导指南, 来指导日常具体工作。

运维支撑平台:在运维流程建立完成的基础上, 根据需求引入可行的软件平台, 实现流程的电子化运转, 从而达到对各类系统故障的有效记录、分派、跟踪、解决和监控, 实现了对运维过程中综合处理和集中管理, 为体系的落地执行提供支持保障。

4 基于ITIL的高校IT服务管理设计

4.1 组织结构设计

IT服务管理以流程为导向, 客户为中心的IT管理方法, 因此流程设计是ITSM实施的重要部分, 然而流程的设计和工具的使用都离不开人员, 因此流程的实施过程中必须考虑人员的组织结构。引入ITIL规范后, 将传统的人员组织“职能式”进行了调整, 将人员融入到服务中去, 更好的为客户服务。

根据ITIL的规范和高校的实际业务情况, 可将IT服务人员分为5个层次:即服务台人员、一线人员、二线人员、三线人员和流程经理。服务台作为IT部门与客户的唯一窗口, 用于快速响应客户的请求, 同时对已解决的事件或问题等进行回访, 服务台人员的职责为对客户的请求进行准确的反应, 这包括对自己可解决的事件或问题等进行解决, 不能解决的事件或问题等要准确的找到此运维业务的一线人员, 同时对解决的事件和问题等向用户反馈, 并对事件或问题等进行回访、关闭。一线人员, 处理绝大部分的事件或问题, 必要时上门服务。二线人员, 对一线人员提供专业的技术支持, 提供事件或问题的解决意见。三线人员, 主要指软件的供应商等外部资源, 提供比二线更为专业的技术, 对客户的新需求、新业务等提供必要的解决方案。流程经理, 负责具体流程的运转、改进, 对重大事件或问题协调内外部资源, 及时解决重大事件或问题, 并提供解决意见。

由于高校用人方面的约束, 建立5层人员服务体系需要协调各方面资源, 同时一个运维人员也可承担多个角色, 其中高校的信息化中心为高校信息化运维的核心力量, 负责监督、改进流程, 提供技术支持。服务台主要由在校学生助管团队组成, 配以一名信息化工作人员作为值班长组成服务台, 负责服务请求、服务处理、分派任务、服务关闭、用户回访等;一线运维人员则由各学院的二级计算机管理员和部分信息化人员担当, 负责对服务台分派的任务进行处理, 必要时可提供上门服务, 对不能处理的任务要及时升级到二线运维人员;二线运维人员则由信息化工作人员、外部公司驻厂实施和维护人员组成;对一线升级的任务进行处理, 对不能处理的任务要及时联系供应商, 提供技术支持, 对不能联系的供应商要及时上报流程经理, 协调各方面资源处理任务;三线运维人员由供应商的技术人员组成, 对高校的IT运维提供技术支持;流程经理则由各业务领导组成, 负责各流程的监督和资源协调等。

4.2 服务台和流程的建立

建立运维服务台。服务台是客户和信息化部门的中心联系点, 是IT运维管理人员和客户访问交流的唯一界面。它通过一个集中和专职的服务联系点促进业务流程与服务管理基础构架的集成。它是协调客户和信息化部门之间联系的桌面平台。

事件管理是服务台通过被动响应或主动预防的方式记录、分类并安排运维人员处理事件并监督事件处理过程直至事件解决的管理流程。

问题管理是指运维人员调查分析事件的根本原因, 制定解决方案并防止事件再次发生的管理流程。问题与事件管理的不同之处在于事件管理强调的是恢复速度, 是“治标”, 而问题管理强调的是找出问题根源, 是“治本”。

配置管理是信息化部门将现有的IT软硬件资源进行梳理, 并将相关信息录入到配置数据库中, 其目的是提供IT基础构架的逻辑模型, 方便维护和管理, 同时支持其他运维管理流程的运作, 特别是变更管理和发布管理。

变更管理是对整个变更进行控制的管理流程, 它要求在最短的中断时间内完成某一业务的变更, 将所导致的业务中断影响减少到最低, 它由变更申请人发起, 各系统的业务专家出具实施方法、标准和步骤, 由变更实施人根据方法和步骤实施, 流程经理负责对整个过程的监控, 最后由提出人进行验证。

发布管理是又称软件控制与分发, 其目的是将测试无误的软硬件版本发布到目的地点, 它受变更管理影响, 由变更管理流程控制。

质量信息反馈管理是指在信息化建设过程中对不可用事件的回馈管理流程, 它要求质量管理者协同供方对出现的质量问题提出解决方案并按方案进行处理, 降低事件所造成的负面影响。

5 结束语

本文通过对某高校信息化部门的研究, 深入分析了高校在IT运维管理中存在的问题, 参照了ITIL框架, 建立了基于ITIL的高校IT服务体系, 制定了相关流程, 根据实际需求, 引入了质量管理理念, 建立了质量信息反馈流程, 体系建立后为高校的IT运维带来了极大方便, 使高校的IT运维工作变得有序、可监控、降低了人力成本, 实现了业务流程化, 规范化、精细化, 提升高校IT运维管理工作。

参考文献

[1]钟艳华.ITIL在校园信息与网络服务的应用研究[J].科技资讯, 2008 (18) :27-28.

[2]王革明, 肖琳.基于ITIL的校园网运维服务体系设计与实践[J].西北大学学报 (自然科学版) , 2010, 40 (6) :983-986.

[3]孙强, 左天祖, 刘伟.IT服务管理:概念、理解与实施[M].北京:机械工业出版社, 2004.

[4]OGC.Best Pratice-Service Support[J].London:Stationery Office, 2000.

[5]孟占永, 张华, 袁东.ITIL高校IT运维服务管理中的应用[J].河南科技, 2012.

[6]胡彬彬.基于ITIL的IT服务管理中服务台的设计与实现[D].北京:北京邮电大学, 2006.

[7]伍宁军.IT服务管理中国化实践研究[D].北京:北京邮电大学, 2006.

[8]李少波, 商尔从, 张永强.信息技术服务帮助台的使用、职责与在高校中的实践[J].实验技术与管理, 2008.

[9]李淑娟, 赵泽宇.信息化校园应用的运维监控保障研究[J].实验技术与管理, 2008.

[10]左天祖.中国IT服务管理指南[M].北京:北京大学出版社, 2004.

[11]胡丹, 胡海亭.应用型高校实践教学质量信息反馈体系的探索[J].中国电力教育, 2013.

ITIL服务 篇9

所谓IT是Information Technology (信息技术) 的简称, 随着科学技术的不断发展, 信息技术的应用范围也在发生着不断变化, 伴随着服务管理理念的出现, IT服务管理也逐渐成为了可能。IT服务管理模式是一种为了提高IT服务质量水平的模式, 它积极融合了时间管理、问题管理、网络管理、变更管理等多方面内容的综合性非常强的系统模式。其核心思想就是IT组织, 它是以提供高质量水准服务为主的服务模式。因此基于ITIL的企业的IT服务管理也必然是坚持以客户作为中心, 以提供高质量水准、低成本的优质服务作为主要目标。通过实施专门的IT服务管理, 不仅可以为企业的管理带来重要应用价值, 同时也可以使得企业的的利益得到更多的保障。

2 基于ITIL的企业IT服务管理模式设计

2.1 系统框架

在企业管理的过程中, 实行IT服务管理, 其主要目的就是为了进一步提高企业的IT服务水平, 更好的提高企业的业务能力, 以此来满足日益多样化的业务需求。而在对于系统进行设计之前, 首要的还是了解和确定IT服务管理系统的基本系统框架, 并能够确定每一个系统模块的位置。正常情况下, 系统框架的架构图如图1所示。

IT服务管理系统的多数模块都是根据ITIL的功能需求进行设计的, 比如系统框架中的服务台。问题管理、变更管理等模块都是系统功能的需要, 为了更好的保证管理模式和系统的完整性, 除了这些基本模块和功能以外, 还应该包括邮件系统模块、网络化管理模块以及数据库管理模块, 这些虽然是辅助模块, 但是对于系统的稳定性和安全性却具有十分重要的作用。对于IT服务管理系统来说, 监控系统和Web浏览器是系统的主要数据来源, 这些数据来源既包括监控系统直接监测到的事件, 同时也包括系统内部的各种服务请求和事件请求。系统中的邮件系统模块主要功能是协助技术人员对于系统进行完善和事件的处理, 及时对于事件的处理进度进行更新和提醒。网络管理模块除了可以支持系统在离线模式下工作以外, 还可以对于数据进行网络传输, 提高系统的安全性能和高效性能,

2.2 系统的整体流程设计

在确定了系统和模式的基本框架之后, 紧接着就是对于系统的整体流程进行设计。但是在对系统进行整体流程设计之前, 还需要明确一个问题及时系统的处理信号是由哪里发出的?监控模块以及用户的直接请求是系统进行处理状态的重要信号。

监控模块发出的请求信号, 首先是要需要技术员进行判断, 判断其是否是系统错误发生的错误启示, 如果是系统发出错误信号, 那么就需要启动系统中的变更管理模块进行变更。而如果不是, 那么在设计时就应该设计相应的应对措施或是处理方案, 但是如果不能满足基本的处理需求, 还需要更加高级的技术人员根据SLA协议进行处理。而对于用户直接提交的请求信号, 服务台接收这些请求信号后会作出相应的处理反应, 同时也可以直接进行请求的派发, 但是如果用户请求不能被服务台直接处理的话, 那么就会再按照监控模块的处理程序进行处理。

2.3 数据库设计

对于IT服务管理系统来说, 数据库是其运行的重要重要基础, 因此数据库设计也是其重要组成部分。从系统的运行需要来看, 系统的数据库管理应该包括常量数据管理子系统、用户及各级技术员数据管理子系统和权限角色数据管理子系统等等。他们其中就包含了很多的数据分析和信息统计子模块。

对于常量表的设计, 首先要明确其主要目的, 它主要用于管理系统常量信息的统计, 常量表包括各个监控项的阀值、email设置以及权限角色设计等等系统常量的设计, 其中的监控项的阀值要涵盖系统的内存使用情况、数据库运行情况等等方面。用户的相关数据库表主要是应用在各级技术员信息、角色、权限、组别等相关信息进行管理方面, 在表格中这些相关要素都应该得到显现, 并能够进行保存和上传。当然需要设计的数据库表格还有很多, 在这里就不再进行一一描述。

3 结束语

随着IT服务管理的理念逐渐深入人心, 人们对IT服务管理的认识和理解越来越深入, 同时, ITIL也在不断完善IT服务管理的标准流程, 作为IT服务管理的最佳体验, ITIL能为企业带来了丰厚的商业价值。但基于技术的局限性, 目前只有很少的企业才可以建立具有独立性的IT服务管理体系, 应用方面还比较局限。尽管如此, 我们也应该坚信, 在信息技术不断发展的今天, 这种基于ITIL下的IT服务管理模式和系统也会得到进一步的完善和发展, 同时也会更好的促进企业的发展。

摘要:高新技术的不断创新与发展以及社会主义市场的不断繁荣, 使得市场竞争趋势不断加剧, 市场经济的发展模式也在发生在深刻的变化。在激励的竞争环境下, 服务行业逐渐兴起, 并在经济发展中充当着重要的角色, 过去简单的价格竞争和产品竞争也在会逐渐演变为服务方面的竞争。在这种背景下, 企业也应该转变发展和管理模式, 积极努力形成富具自身特色的IT服务管理模式已经成为企业发展的重要内容。本文也将从IT服务管理的基本论述出发, 对于ITIL基础上的IT服务管理模式进行了分析和研究, 希望给读者一定的启示。

关键词:ITIL,IT服务管理,模式分析

参考文献

[1]蒋中华.基于ITIL的企业级IT服务管理体系的设计与实现[D].复旦大学, 2008.

[2]胡彬彬.基于ITIL的IT服务管理中服务台的设计与实现[D].北京邮电大学, 2006.

ITIL服务 篇10

统一高效的IT服务管理体系是高校信息化建设和管理根本保障之一。在IT服务管理体系实施过程中,如何保障IT投资、提升师生用户的满意度、适应信息化建设新的发展要求,不同的高校有成功的经验,也有实施未如预期的教训。服务台作为IT服务管理体系中一项特殊的管理职能,发挥着联系用户和信息化部门及信息化部门内部信息收集、分配和交换的枢纽作用。对服务台建设的深入研究,有助于IT服务管理体系的建设完善,从而促进高校信息化运维管理走向标准化和规范化。本文根据高校IT服务台的建设及管理实践,着重分析一些应该注意的新问题,以期引起大家的思考。

1 目前服务台建设存在的主要问题

按照ITIL(Information Technology Infrastructure Library)的定义,服务台是一个职能单位,负责受理各种故障事件,通过各种途径报告基础设施发生的事件,其业务处理流程连接事件处理流程、问题处理流程、变更处理模块、知识库管理流程和服务级别管理流程等,使整个IT服务的生命周期管理形成闭环。

考察现在很多高校的IT服务台的建设和管理,还处于比较初级的IT运维管理阶段,在组织结构、管理规范、管理流程和技术支撑等方面,还没有对网络、设备、系统、用户等的管理和服务构建一个统一管理体系,缺乏数据、信息、知识库的共享,缺乏自动化监测的工具及手段,管理和服务效率较低,问题表现在以下几方面:①IT业务不断增加,有些业务还彼此交叉,但支持业务的部门不同,形成分散独立的服务局面,服务流程和规范各不相同,给用户带来不便;②对参与IT服务管理的服务台工作人员、其他业务支持人员、外包人员等各类角色缺乏统一管理,对服务的工作量和绩效难以量化考核,管理力度不够;③对用户的各类IT服务请求缺乏一站式窗口来受理,用户体验不佳;④缺少有效的管理工具和手段,形成服务真空,虽然有提交服务报告,但对数据的真实性、有效性和完整性缺少监控的手段,故障管理不能做到事前预防、主动管理,事后难以追踪和分析。

2 服务台建设的目标及实施建议

IT服务台的建设目标:通过设置面向用户的单一服务窗口,使用统一、规范的服务流程,以及先进的自动化管理监控工具,有效地整合外包服务资源,确保服务质量,提高整体IT服务水平。参考IT管理三元素“人员、流程和工具”,为服务台的建设和实施提供了思路,下面也从这三方面入手分析实践中的若干值得重视的问题。

2.1 人员建设问题

IT服务台建设能否顺利,制度体系建设是关键。在目前高校运维队伍中,涉及运维的人员有信息化部门工作人员、有二级单位运维工作人员、有其他IT业务工作人员还有外包人员等。组织应根据IT服务的特点、工作量、工作性质统管调配服务台人员,加以规范。在实施中,首先是梳理全部业务类型,并在系统中建立业务类型、角色、工作人员的组织架构表,指定对应业务的工作人员为一个工作组,确定工作组的负责人,根据ITIL的要求将全体人员赋予不少于一个的角色。从学校管理的角度,设置服务台/事件管理的一级支持工作人员为一级角色,将技术支持人员分成二级支持或三级支持人员。流程角色中还需要设置事件流程经理和服务台经理这两个角色:事件流程经理着重于处理事件管理工单系统的全生命周期流转,而服务台经理的工作更多是和CIO及其他IT服务部门沟通协调,整合管理数据。外包人员可根据需要分类到流程中的某级人员。

2.2 流程建设问题

在ITIL中已经提供了流程建设思路和实施标准,但在实践过程中,存在一些问题,集中起来就是“业务不能在单一窗口受理,没有主动管理工具不能及时响应用户请求,服务请求类事务办理滞后,管理数据简单不够完整”。为解决以上问题,必须为IT服务流程制定规范,来适应高校日益复杂的信息化运维环境。下面几项子系统的建设对流程完善和优化很有帮助。

2.2.1 统一服务门户

实现单点登录的意义:首先,设置统一的服务台以后,用户不管遇到什么问题,都可以从服务台这个单一接口找到可以受理问题或请求的人,服务台工作人员根据已经设置好的事件类型及优先级别分派给对应的工作人员及时去处理;此外,可以把共享数据中心或信息门户和服务台集成,服务台在受理用户请求时能自动获取用户的基础信息,在派发工单时可以减少手工操作,提高工作效率,保证用户信息的安全。最后,通过业务梳理整理出服务目录,对业务部门内部目录是规范和责任,对用户告知IT业务的范围。

2.2.2 事件管理工单系统建设

第一,事件工单始于服务台创建,终止于服务台关闭。服务台是进入服务支持的第一环节,在事件工单流转的全生命周期(事件的识别、分类、记录、定级、初步处理、分派、上报、跟踪、反馈和关闭)进行管理。服务台需要建立故障和事件处理跟踪流程,记录故障及其处理情况,建立运维日志,并定期回顾从中辨识和发现问题的线索和根源。同时,用户还应随时追踪该故障请求的处理状态。IT运维人员需在指定时间内完成流程所规定的工作,建立首问负责等制度,保障流程规范得到执行。

第二,用户请求业务流程也归属事件流程。将需要多名员工合作、环节较多的业务梳理出来,整合进事件管理模块,设计针对某项业务的工单类型,提醒员工收集业务所需的用户完整信息。工单一旦提交生成后,会自动发送至相关负责业务的员工各自的待处理业务列表,员工可自行登录系统查看并处理业务;服务台也提供详细的流程流转图,提供管理员查看工单处理情况,督促各环节节点上的员工及时处理业务,确保在指定时间内完成所有业务。通过这种改进,使得并行业务处理过程更为透明。

2.2.3 自动化运维建设

第一,IT运维最终目的是保障系统的畅通运行,设备是运维管理的根基。服务台可以纳入监控工具,把各种底层设备的监控信息集中到管理员的工作台,将运维对象清晰化、视图化,呈现业务的使用情况、健康情况等。使用自动化监控等工具,并与IT流程关联,在适当条件下自动会触发相关事件以及事先定义好的流程。熟练使用自动化工具,有助于实现故障或问题主动处理和集中管理,避免人数较少的服务台人员忙于“救火”。

第二,当IT服务工作量日益庞大,后台运维数据的实时收集和精准分析,对IT服务管理者实现运维主动管理尤为重要。服务仪表盘模块是常规IT服务管理工具的重要功能补充,其主要功能是实时收集服务数据,按系统权限针对IT管理者、IT业务工作人员不同对象,按照信息类型进行醒目展现。IT服务管理者可全方位了解即时的服务进展状况及服务水平的完成情况,为快速决策和主动运维提供了辅助支撑,从而对提升了用户的满意度、改善运维服务效率、降低服务成本。

2.2.4 移动服务台建设

学校信息化建设的迅速发展,使服务台建设面临新机遇和挑战,其中移动智能终端在高校普及,提出了移动服务台的需求。经过调研,学校部门可着手将服务台功能延伸到微信中。例如:用户可以通过微信报修,查询处理状态或知识库信息;对IT服务人员,可以在微信客户端收到监控告警通知,并自动生成事件工单;对于IT管理人员,可以通过微信版的服务仪表盘查看各类统计数据等,这些移植可使工作流程更加顺畅,提升用户体验满意度。

3 结语

本文通过梳理IT服务台建设中的问题,提出人员整合、统一接口、快速调配和集中管理的解决思路。各高校可根据自身特点,建立良好的服务台系统,不仅可对自身的业务流程实行有效管理,保障服务部门的工作效率,还能通过子系统配套建设使IT服务管理平台更加完善,适应信息化复杂环境的挑战。

参考文献

[1]孙强,左天祖,刘伟.IT服务管理:概念、理解与实施[M].北京:机械工业出版社,2006.

[2]戚丽,蒋东兴,袁芳,等.高校运维服务体系的研究和实践[J].实验技术与管理,2008(7).

ITIL服务 篇11

电子政务系统生命周期包括系统规划、系统建设和系统运行维护三个阶段, 其中运维阶段在生命周期中占了约80%的时间, 同时约80%的效益是在运维阶段体现的。大量统计分析表明, IT系统出现故障的原因中, 只有20%源自技术或产品 (包括硬软件、网络、电力故障及天灾等) , 而80%是管理方面的问题。此前各级政府的电子政务重点投向了系统建设, 对运维的理解仅限于技术维护工作, 导致对运维阶段的资源投入不足。虽然在运维上逐步实行了机房管理、机房安全、机房值班等日常管理制度, 但很多运维工作仍然采取低效的粗放分散式管理手段, 运维人员常常依靠个人经验被动应对出现的故障, 从故障发生前、处理中、事后的各个阶段都没有一整套规范化作业流程, 缺乏运维工作绩效考核标准, 运维技术长期处于较低水准, 导致系统运行质量不高, 服务延误、中断的情况时有发生, 对政府管理和公共服务造成很大影响。如何使规模庞大复杂的电子政务系统长期稳定、可靠、安全地运行, 这对运维工作提出了严峻挑战。

ITIL (信息技术基础设施库) 是英国政府部门为提高自身IT资源的使用效率和管理水平, 在总结各级政府单位和先进企业IT服务管理最佳实践的基础上逐渐形成的一套客观、严谨、可量化的标准体系。ITIL事实上已经成为IT服务管理 (ITSM) 领域的首要标准, 它和电子政务运维有着天然的联系。将ITIL这种创新管理理念引入我国电子政务运维服务管理体系, 对切实提高电子政务运行质量和应用效果具有重大意义。

一、ITIL体系架构

(一) ITIL简述

1986年英国政府中央计算机和电信局 (C—TA, 后来并入英国商务部OGC) 实施名为“政府信息技术基础设施管理方法论 (GITMM) ”的研究项目, 目标是根据各个行业在IT管理方面的最佳实践中总结归纳出一套规范化的、可量化的IT资源使用的管理方法, 以提高IT资源的利用率和服务质量, 项目的最终成果就是ITILv1版。OGC将ITIL v1逐渐扩充成为庞大的ITSM方法论知识体系, 并于1999年发布了ITILv2版。2001年英国标准协会 (BSI) 正式发布基于ITIL的ITSM英国国家标准BS15000。2005年12月, 国际标准化组织 (ISO) 和国际电工委员会 (IEC) 正式发布以BS15000作为蓝本的第一个ITSM国际标准ISO/IEC20000。OGC在整合了v1和v2版的精华并融入了当前ITSM的最佳实践后, 于2007年5月正式发布了ITILv3版。

目前应用最成熟的ITILv2版的体系架构如图1所示, 包括服务管理、IT服务管理规划和实施、业务管理、应用管理、IT基础设施管理、安全管理等六大模块。

服务管理模块是ITIL的核心模块, 它把IT管理活动梳理归纳为服务支持和服务提供两组流程及一些辅助流程。服务支持流程组属于基础性的运营级 (或称操作级) 管理流程, 包括一个服务台职能和事件管理、问题管理、配置管理、变更管理、发布管理5个流程。服务提供流程组属于提高性的战术级管理流程, 包括服务级别管理、IT服务财务管理、IT服务持续性管理、可用性管理、能力管理5个流程。

(二) 运营级的服务支持流程

服务支持流程主要面向IT基础设施和应用系统, 用于规范IT服务的“前端”, 负责日常服务工作中对各种故障和问题的处理, 侧重于对客户的技术支持和设施维护, 目的是使客户有一个稳定运行的IT环境。

运营级管理流程把服务台作为与外部联系的单一入口, 以配置管理的核心———配置管理数据库 (CMDB) 为中心把事件管理、问题管理、变更管理及发布管理作为节点构成一个管理闭环。

在ITILv2中, “服务请求”是指IT服务提供者与客户前期已经协商好、需要提供给用户的服务, 属于标准操作。“事件”是指在某一服务中不属于标准操作且已经导致或可能导致该项服务中断或服务质量下降的任何事情, 它往往是临时发生的, 具有突发性。“问题”是指导致一起或多起事件的潜在原因。事件是表征, 问题才是本质。事件的发生并不一定就表明IT系统存在问题, 而问题也不一定要等事件发生后才能发现。

服务台是IT服务管理的核心功能, 所有服务支持流程都要通过服务台为客户提供单点联系, 接受客户服务请求和故障报告、IT基础设施和应用系统的故障报警, 为客户提供一线技术支持, 回复客户的相关问题和需求, 协调客户与二线或三线支持之间关系, 全程监控服务请求和事件处理进展状态并向客户报告。

事件管理流程目标是采取应急措施或临时修复方案使被中断或受影响IT服务尽快恢复正常运行, 尽量减少对业务的负面影响。它的特点是以尽快解决突发事件为目的, 属于“被动”、“治标”行为。若事件反复出现或属于重大事件, 则必须提交给问题管理流程。

问题管理流程的目标是深入分析问题存在的根本原因, 提供有效解决方案解决问题避免类似事件再次发生。实施主动问题管理, 在事件发生前发现和解决问题。它具有“预防”、“主动”、“治本”的特点。

配置管理处于服务管理的中心位置, CMDB是实施配置管理的基础, CMDB中最基本的信息单元是配置项, 包含了IT基础设施、应用系统等IT资源所有精确信息。配置管理通过识别和确认配置项, 记录和报告配置项的状态、变更情况、版本信息及配置项之间关系信息, 控制配置项访问权限, 验证配置项的正确性和完整性等活动为其他管理流程的执行提供支持。

变更管理流程使用标准化的变更控制过程处理对IT基础设施和应用系统所做的变更, 目标是以对服务最小的干扰实现有益的变更。变更控制过程使用标准的方法和步骤:提出变更请求、评估变更的风险和影响以及业务收益、批准或拒绝变更请求、尽快实施已获批准的变更、验证变更是否已正确实施。

发布管理流程负责对IT基础设施和应用系统的规划、设计、构建、配置、测试, 以便为实际运行环境提供一系列的发布组件, 并将新的或变更的组件迁移部署到运行环境中, 目标是保证正确的组件被发布以及运行环境的完整性。

变更管理和发布管理均需要对CMDB的相关配置项进行更新, 它们与配置管理是紧密结合的。

(三) 战术级的服务提供流程

服务提供流程, 主要用于规范IT服务的“后端”, 负责定制IT服务, 规范IT服务应达到的工作目标、服务水平和服务质量, 目的是解决IT服务的规划、设计、实现、持续性问题, 并优化IT服务的成本绩效。

服务级别管理主要负责与客户协商就所要提供的IT服务的类型和质量水平, 签订服务级别协议 (SLA) , 并确保协议得以执行。此外, IT服务提供商还需与内部人员签订运营级别协议 (OLA) , 与外部供应商签订支持合同 (UC) 。OLA与UC用来支持实现SLA中的服务级别。服务级别管理还监控并报告服务级别, 定期进行评审以便改进, 确保服务级别协议的更新和持续有效。

IT服务财务管理负责为IT服务提供者对所提供的IT服务编制预算和核算服务运营成本, 并向客户收取相应服务费用, 目标是如何经济节约地提供IT服务, 合理平衡服务质量、成本、客户需求三方关系。主要包括预算编制、会计核算和服务计费三个子流程, 产生的预算和核算信息可为服务级别管理、IT服务持续性管理、能力管理等流程提供决策依据。

IT服务持续性管理负责灾难预防、增强IT基础设施的恢复能力和容错能力, 它需要在灾难发生后有足够的技术、资金和管理资源来确保应用系统运行所需的IT基础设施和IT服务在限定时间内得到恢复, 保证服务的持续性。

能力管理负责在当前和未来的业务需求和运营成本的双重约束下, 适时部署相应IT资源, 提升服务能力以确保服务品质满足约定的服务级别目标的要求, 同时使组织的IT资源发挥最大效能并与运营需求相匹配, 主要包括业务能力管理、服务能力管理、资源能力管理三个子流程。

可用性管理是通过前瞻性分析客户的可用性需求, 使用适当的资源、技术和方法优化IT基础设施和应用系统的可用性, 设计适当措施将突发事件发生频率降到最低, 从而确保以合理的成本达成服务级别协议的可用性目标。

(四) ITIL应用的六大要素

实施ITIL需要综合人员、流程、技术三大方面因素, 还可进一步细分为六个要素。

1.领导力:主管领导的支持, 可在资源投入、组织架构整合、部门间协同方面发挥重要作用。负责ITIL运作的执行团队主管和核心骨干能够领导和激励整个团队积极推进工作。

2.组织文化:全员参与ITIL培训, 培养服务意识, 逐渐把“以客户为中心、以流程为导向、提供高质量低成本服务”的ITIL理念变成一种组织文化。

3. 人员组织包括合理设置职能部门的组织架构、人员的角色和职责及技能要求、人员绩效考核标准等。

4. 流程是为实现一个特定目标按照既定的方法进行一系列有序活动的过程, 一个完整的流程包含目标、范围、输入 (处理的对象) 、输出 (期望的结果) 、活动 (执行的动作) 、角色 (流程负责人、流程经理、流程执行人) 和职责、关键绩效指标KPI、与其他流程之间接口、激活条件等基本元素。

5. 工具对于实现ITIL具有非常重要的作用, 能够提高服务质量和效率, 主要包括IT系统运行监控和诊断优化工具、流程自动化工具两类。监控工具的监控对象是IT基础设施和应用系统, 流程化工具是对各项管理流程的电子化实现。

6.信息:对ITIL运作中产生和积累的大量信息进行分析, 发现潜在问题, 持续改进服务质量和提升客户满意度。

二、基于 ITIL 的电子政务 IT 运维服务管理体系

运维管理组织架构和角色及职责设置、运维服务管理流程、运维服务支撑系统、运维服务管理对象 (IT资源、IT用户、供应商等) 、提供的运维服务等五个要件构成了完整的IT运维服务管理体系。在基于ITIL的电子政务IT运维服务管理体系中, IT运维服务提供者与政府客户的IT运维服务管理部门 (政府信息化办公室) 签署服务级别协议, 运维服务团队中各司其职的运维人员通过执行符合ITIL规范的服务管理流程和使用信息化支撑工具为IT用户提供针对电子政务系统 (IT资源, 包括IT基础设施和应用系统) 的运维服务, 确保电子政务系统正常稳定、安全可靠、高效经济地运行。

根据IT运维服务提供者和政府客户之间是否存在组织上隶属关系, 运维服务管理模式有自主模式、完全外包模式和介于前两者之间的混合模式。如果IT运维服务提供者是政府内部IT部门, 则属于自主运维;若IT运维服务全部由外部提供商负责, 则属于完全外包模式;既有自主也有外包的属于混合模式。

我国的政府部门和大多数企业的组织架构一般都是按照职能进行纵向的部门和岗位划分, 而在ITIL应用实践却是按照流程进行横向划分, 是彻底按照ITIL规范重组还是按照实际情况适度调整, 这需要根据运维管理模式、领导支持度等多方面情况综合衡量。这个问题也是ITIL在我国落地应用的难点之一。

从IT运维服务提供者的视角看, 运维人员在管理流程的角色设置有流程负责人、流程经理、流程执行人。流程负责人对特定的流程负责, 权责涵盖了整个流程的生命周期, 在流程设计、确定流程目标和关键绩效指标、宏观上监控流程的执行、评估流程实际达到的目标和运行绩效、对流程持续改进优化、与其他流程的协同等方面负起全责, 通常由IT运维服务提供者的业务主管担任。流程经理的职责是全程督导、协调和监控流程的执行, 确保其正常运转, 通常由IT运维服务团队的主管和技术骨干担任。流程执行人的职责是按照既定规范执行预定动作, 由具备相应专业技能的运维人员担任, 他们可以是来自IT运维服务提供者内部组织, 也可以来自软硬件系统供应商、电子政务应用系统开发商和集成商等外部组织。

IT运维服务支撑系统是开放式集成软件平台, 一方面, 把IT运维服务提供者制定的符合ITIL规范的服务管理流程实现信息化处理, 可以更高效地向IT用户提供高质量IT运维服务, 同时实现对整个IT运维服务的监督、评估和绩效考核;另一方面, 支撑系统能够对所有IT资源进行管理和实时运行监控。

ITIL是IT服务管理的标准框架, 它只告诉我们要做些什么 (What) , 而没有告诉如何去做 (How) 。要真正实现ITIL在电子政务IT运维服务管理体系的落地, 首先必须与客户进行现场访谈, 分析现状, 并与最佳实践进行差距分析, 进而确定合理的目标和达到目标的实施路径, 进行人员组织架构、流程、技术支撑系统的规划和设计, 上线运行, 持续对每个流程和整个体系的运行绩效进行回顾评审, 进而优化改进, 这个过程不断循环往复。

三、电子政务运维服务管理体系中服务管理流程的具体实现

笔者长期从事电子政务系统运维工作, 所在单位是XX市政府电子政务系统的运维外包服务商, 逐步分阶段初步构建基于ITILv2的电子政务运维服务管理体系。第一阶段首先实现了服务台职能、事件管理、问题管理、变更管理、配置管理、知识管理和对部分IT基础设施和应用系统的分散监控。第二阶段全部实现了完整的服务支持流程以及运行管理、供应商管理, 同时进一步完善、优化、整合管理流程和工具, 对重要IT基础设施和核心应用系统实现了集中监控。规划将在第三阶段实现所有的服务提供流程, 采用运维服务开放式集成管理平台。

笔者曾参与了该外包项目前期规划阶段的客户服务需求捕获、服务管理流程梳理和设计等部分工作, 现作为运维团队主管。在不改变原组织架构前提下经单位领导授权, 笔者通过角色—职责分配矩阵将原来属于基础设施维护组、应用系统支持组、网络维护组、系统维护组、安全管理支持组等职能部门的人员映射到运维服务管理流程的角色中, 并赋予相应责任, 同时一些重要角色设置了A、B角。单位分管领导是所有流程的负责人, 笔者负责该市政府电子政务系统的日常运维服务管理工作, 担任事件管理、问题管理和变更管理的流程经理, 同时兼任变更顾问委员会 (CAB) 副主管, 参与重要变更审批工作。

XX市政府与作为外包商的单位通过在电子政务运维服务体系中实施ITIL, 大大地提高了运维服务水平, 客户满意度获得很大提升, 同时降低了运营成本, 外包商公司也实现商誉大幅增值, 实现了双赢。

下面从运维外包商视角论述两个关键的服务支持流程的设计实践。

(一) 服务台职能 /事件管理流程

所有服务支持流程都通过服务台为客户提供单点联系, 服务台设值班经理1名, 热线人员2名。服务台人员负责记录并受理客户的服务请求、故障报告、咨询、投诉和技术人员定期巡检发现的系统故障以及运行监控系统报警, 回复客户的相关问题, 进行初级支持, 或派单给合适技术人员为客户提供一线支持服务, 在事件升级后协调客户与二线或三线支持之间联系, 全程监控服务请求和事件处理进展状态并向客户报告。服务台职能与事件管理流程集成在一起。

事件管理流程目标是尽快恢复被中断或受影响IT服务, 主要执行活动包括:事件的检测识别、记录、分类、优先级排序、初步支持、事件的调查和诊断、事件的解决和恢复以及事件的关闭。事件管理流程概略设计样例如图6所示。

事件管理流程运行阶段的角色设置分为:

事件经理:由笔者本人担任, 负责全程监控和协调每个事件的执行, 特别是事件升级、重大事件处理等与流程运行绩效密切相关的活动, 确保服务质量, 满足与客户约定的要求;对执行人员实施绩效考核;主持重大事件的事后回顾评审会议, 参与定期的流程回顾会议, 把流程执行中存在的不足和改进建议向事件管理流程负责人报告, 以便以后改进优化;定期撰写事件管理分析报告。

一线支持人员:包括机房值班人员、部分专业维护组成员, 负责日常处理大量相对简单、重复出现的事件和服务请求。

二线支持人员:由资深技术专家领衔的专业维护团队组成, 负责处理复杂度较高或一线支持无法解决的事件。

三线支持人员:由来自软硬件系统供应商、电子政务应用系统开发商和集成商的技术人员担任, 负责处理与这些供应商产品或服务相关的事件。

(二) 问题管理流程

问题管理流程目标是深入分析导致事件发生的根本原因, 提供有效解决方案解决存在的问题, 避免类似事件再次发生, 或是在事件发生前发现和解决问题。执行的主要活动有:问题的识别、记录、分类、优先级排序, 问题的调查和诊断、问题的解决以及问题的关闭等活动。问题管理流程概略设计样例如图7所示。

问题管理流程运行阶段的角色设置分为:

问题经理:由笔者担任, 负责协调问题管理活动的日常执行和流程中的工作调度, 将提交来的问题进一步识别、审核和分类, 根据问题紧迫性和影响程度确定优先级, 根据技能和工作负荷把问题分派给合适的问题专家小组处理, 并为其调配必要的资源;监控已分派问题队列, 特别关注重大问题和需升级问题;监督流程执行确保遵循相应标准和步骤;对执行人员实施绩效考核;主持重大问题的事后回顾评审会议, 参与定期的流程回顾会议, 把执行中存在的不足和改进建议向问题管理流程负责人报告, 以利改进优化;定期撰写问题管理统计分析报告。

问题专家:由资深技术专家领衔的专业维护团队组成, 负责问题的调查和诊断, 找出问题产生的根本原因, 提出解决方案或规避措施并实施。

四、结 语

ITIL是管理科学在信息技术中的应用, 它从复杂的IT管理活动中梳理出各种IT组织所共有的最佳实践, 然后将之流程化、规范化、标准化, 从而形成一个完整的IT服务管理方法论知识体系和全球标准。但ITIL要在电子政务运维服务管理体系中成功落地, 仍然不是一片坦途。通过总结以往亲身实践的成功经验和不足, 笔者梳理出成功应用ITIL有如下关键因素需要重点关注:

(一) 主管领导的支持

领导的支持至关重要, 包括客户主管部门领导、运维服务提供商单位的领导和运维团队主管。

(二) 运维团队组织架构

合理设置组织架构、角色和职责及技能要求。

(三) 运维团队组织文化

全员参与, 把“以客户为中心、以流程为导向、提供高质量服务”的ITIL理念变成深入人心的组织文化。

(四) 先期培训, 整体规划, 计划适度, 符合实际, 逐步推进

提前进行客户和运维团队人员培训;仔细梳理客户真正业务需求, 制定ITIL实施计划时不能贪多求全、全盘套用各个管理流程;在设计流程时不能脱离实际、盲目照搬, 要考虑与现行合理的管理制度的兼容性;采用先局部后整体、由点及面逐步分阶段推进的方式。

(五) 建立考核机制, 推行激励措施

实施过程中要建立量化的绩效考核机制, 对每个运维团队成员、每个流程以及整个运维体系评估其运行绩效, 推行激励措施。关键绩效指标制定按SMART原则, 即关键绩效指标应是:“具体的 (S) ”、“可度量的 (M) ”、“可实现的 (A) ”、“现实的 (R) ”、“有截止时间的 (T) ”。

(六) 持续优化和改进

把ITIL应用到电子政务运维服务管理体系, 目的是为客户提供高质量服务, 这个体系本质上是质量管理体系, 可以运用质量管理的PDCA思想 (P—计划、D—执行、C—检查、A—改进) , 在电子政务系统生命周期内循环不断对流程进行持续优化, 提高运行绩效, 降低运营成本, 进而提升服务质量和客户满意度。

(七) 知识的积累沉淀

对运维中已获解决的事件和问题的处理方案及管理实践经验进行总结形成知识库, 运维团队共享, 提高运维人员技术水平, 少走弯路, 更有效支撑其他服务管理流程的运行, 提高运行绩效。

(八) 选择适合自己实际的 ITIL 管理平台软件对成功实现ITIL的落地

应选择模块化、可定制、可二次开发的集成化运维服务管理支撑平台, 实现流程运转的信息化和IT基础设施及应用系统的集中自动监控, 这将显著提高工作效率, 凸显实施ITIL所带来的优势。从全球电子政务的现状和发展趋势来看, ITIL已事实上成为推进运维服务管理体系建设的首要标准。当前我国电子政务工作重心正逐步从大规模的系统建设转向深化应用、提升应用效益的系统运维阶段, 必须转变观念, 从单纯的技术维护思维转向服务管理思维, 把运维工作转到“为客户提供高质量的IT服务”的服务视角上来, 加快把ITIL标准应用到建设集约统一、高效规范的电子政务运维服务管理体系的步伐, 提升电子政务系统运行质量, 对各级政府加速向服务型政府转型具有重大促进作用。

参考文献

[1] (荷兰) Jan van Bon.IT服务管理:基于ITIL的全球最佳实践[M].章斌, 译.北京:清华大学出版社, 2006.

[2] (荷兰) Jan van Bon.IT服务管理国际标准体系:ISO/IEC20000[M].钱峰, 译.北京:清华大学出版社, 2009.

[3]陈宏峰, 刘亿舟.中国IT服务管理指南 (第二版) :理论篇[M].北京:北京大学出版社, 2012.

[4]程栋, 刘亿舟.中国IT服务管理指南 (第二版) :实践篇[M].北京:北京大学出版社, 2012.

[5]ITGov中国IT治理研究中心.中国电子政务运维管理现状与发展趋势[Z].2008, (11) .

[6]北京市信息化协会.北京市电子政务IT运维服务支撑系统规范V1.0[Z].2008, (10) .

[7]郭巍.基于ITIL的电子政务IT运维服务支持流程的设计与实现[D].北京邮电大学硕士论文, 2010.

上一篇:阳光永驻心间下一篇:血液系统作用