数据运维

2024-08-20

数据运维(通用12篇)

数据运维 篇1

近年来, 最高人民法院以“大数据、大规格、大服务”理念为指导, 通过云计算、大数据、互联网+等科技手段, 以司法大数据的智能应用服务审判执行、服务审判管理进而服务人民群众。十三五以来, 各级领导高度重视数据信息化建设发展, 要求加强统筹协调, 利用数据治理技术、整合数据资源、提高数据质量、保障数据安全、提升数据利用率, 进一步实现法院数据管理的科学化和规范化。

1 数据运维的内容

审判数据是法院最重要的的信息化资产, 更是法院数据中心的核心基石。数据运维工作与传统的信息化运维工作不同, 随着审判业务系统的深入应用, 数据中心的运维保障和数据管理将是数据运维工作的重心。数据中心是一个数据加工厂, 数据处理环节较多, 且各个环节紧密相关, 运行保障的工作量非常大。

1.1 数据中心运维

(1) 保障辖区法院数据完整、及时、准确的上传至数据中心。

(2) 保障辖区法院数据的全面性、完整性、有效性, 辖区上下级法院之间、本地数据中心与省级平台之间数据的一致性。

(3) 对辖区法院数据的采集、导出、发送、传输、接收、管理及展现等全过程进行监控, 保障数据处理全过程及时性、准确性。

(4) 根据需要进行数据的查询、统计、运算、处理、分析, 形成数据分析报告并发布, 满足辖区法院的数据应用业务需求。

(5) 对辖区法院数据的安全风险进行评估分析和预防, 制定数据备份策略并实施, 及时恢复因故障受损的数据, 保障数据的安全可用。

(6) 对辖区法院数据库系统进行巡检监控、故障处理、性能调优等, 保障系统的可用性、稳定性。

1.2 数据管理维护

(1) 对辖区法院数据汇聚和一致性运行保障和管理, 确保数据完整、及时、准确汇聚至高院审判案件库。

(2) 对审判库与数据中心法标库间的一致性、审判库与最高院数据集中管理平台库间的数据一致性进行管理和维护。

(3) 数据质量管理和保障, 针对上级法院下发的最新数据质检规则进行不合格案件改进, 进一步提高数据准确性。

(4) 按数据分析要求, 针对文书数据质量做进一步的完善和提升。

(5) 对司法统计报表的准确性验证, 进行数据质量的检查和改进工作。

2 数据运维流程

2.1 数据运维服务流程

运维服务流程帮助审判人员迅速解决各类事件。运维流程始于用户请求、平台监控及工程师巡检, 结束于经过用户满意度确认的解决。故数据运维服务流程应着重把握以下四点:

(1) 数据工程师对接收到的问题进行初步分析, 根据信息情况进行分类, 标识事件的紧急度、影响度和优先级。判定服务事件为故障类事件, 如果故障的紧急度、影响度和优先级高, 则直接提升给高级数据工程师处置;判定服务事件为一般故障类事件, 则查看知识库对事件解决方案进行匹配, 无解决方案则展开对事件进行调查与分析, 尝试解决, 并根据实际情况决定是否要升级为问题。

(2) 超过时限无法解决则提升给高级数据工程师进行处理, 高级数据工程师调查并诊断事件, 并根据实际情况决定是否要升级为问题;若判定为数据中心问题, 则提升给高级研发工程师对问题进行修复处理。

(3) 服务事件解决完成后, 记录详细的分析、诊断过程和解决方案, 并通知用户问题解决, 关闭事件并选择性更新知识库和提起新问题。

(4) 服务事件的全生命周期对整个事件处理过程进行监控。

2.2 数据运维业务流程

数据运维业务流程帮助审判人员梳理整个数据运维流转过程, 以业务为导向全流程监控数据运维过程。总共分成四大阶段:

(1) 数据汇聚, 完成辖区法院数据汇聚、数据检查、数据导出、数据传输、数据接收、数据导入六大服务。

(2) 对采集到的辖区法院数据进行质检分析, 数据质检过程包括数据质检、排查分析、数据矫正三大项服务, 并遵循找出问题、分析问题、改进问题数据的闭环处理流程, 不断提升数据质量, 为审判业务分析提供高质量的数据基础。

(3) 数据ETL加工过程, 包括数据抽取、数据清洗、数据装载、数据转换四大项服务。ETL是构建数据仓库的重要一环, 用户从数据源抽取出所需的数据, 经过数据清洗, 最终按照预先定义好的数据仓库模型, 将数据加载到数据仓库中去。

(4) 数据报表展现过程, 包括司法统计数据展现、数据准确性核查、问题排查、数据矫正四大项服务。

3 数据安全管理

数据安全管理就是要保障辖区法院数据的保密性、安全性、完整性而进行的一系列管理和技术服务, 其主要包括:应用安全服务、数据安全服务、安全管理服务。

3.1 应用安全服务

应用安全服务主要包括对辖区法院的审判业务管理系统进行安全评测、风险评估、防护加固、安全整改, 确保系统应用安全, 审判工作顺利进行。

3.2 数据安全服务

数据安全服务主要是对辖区法院的审判业务管理系统中的数据流转各环节的安全监控、审计、加密、数据库安全防护等, 确保数据和信息安全。

3.3 安全管理服务

安全管理服务包括通过制定安全策略、安全规划、安全制度规范、安全要求等, 以保障信息安全的管理服务。

通过数据安全管理, 优化信息安全管理体系, 提高数据安全管理能力, 促进信息安全工作的持续改进。

4 数据运维保障措施

数据运维与信息化系统运维相比, 对人员专业文化程度和技能要求更高, 需要配备专业的数据运维队伍, 建立健全数据运维工作机制, 制订和完善相关技术标准、工作制度、流程和规范, 更需要做好数据运维工作的经费预算。

4.1 数据运维人员

建立专业的数据运维团队, 保障数据管理质量, 带来新的价值和成效。数据运维人员应具备相应的技术和业务能力, 包括数据库维护技术、数据处理及数据分析技术、法院业务知识、法标相关知识、大数据管理理论方法等, 根据数据管理服务需求, 设置不同的管理服务岗位, 承担不同的数据运维工作, 保障法院审判业务管理系统可靠、安全、正常运行。

4.2 建立工作机制

数据运维工作应建立相应的工作制度、流程及规范。包括巡检监控制度及规范、数据汇聚工作流程、数据质量问题处理流程、数据质量报告制度、数据库维护规范、数据备份制度及规范、数据安全应急预案等。

4.3 运维经费保障

目前我市辖区法院审判业务管理系统稳定运行, 每天生成大量的审判数据, 审判数据实时传输到最高院的数据集中管理平台。数据的汇聚、安全和传输需要数据运维人员做大量的工作。由于工作的特殊性, 对数据运维人员的业务技能要求相当高, 需要配备专业的数据运维团队, 这就需要中级法院结合本院信息化建设规模, 数据运维需求、内容和级别等做好数据运维经费预算和申报工作, 保障整个审判业务数据的安全汇聚和传输。

5 结束语

法院的数据运维对保障法院审判业务管理系统正常运行至关重要。信息化运维非常重要, 但数据运维更是重中之重, 业务系统运行越久, 审判业务数据越多, 运维越复杂。因此, 实现人民法院信息化3.0版的转型升级, 必须高度重视法院信息化数据运维管理, 建立专业运维团队, 增加经费投入, 为司法工作业务领域提供智能化支撑。

参考文献

[1]顾大伟, 郭建兵, 黄伟.数据中心建设与管理指南[M].北京:电子工业出版社, 2010.

[2]吴刚.加强对大数据的安全管理[N].人民邮电报, 2016.

[3]冯海军.浅析数据中心的运维管理现状及对策[J].中国新联通, 2013.

数据运维 篇2

郑州向心力通信技术股份有限公司

二零一八年 1 机房运维管理前期准备 1.1 管理目标

机房基础设施运维团队应与业主管理层、IT部门、相关业务部门共同讨论确定运维管理目标。制定目标时,应综合考虑机房所支持的应用的可用性要求、机房基础设施设施的等级、容量等因素。目标宜包括可用性目标、能效目标、可以用服务等级协议(SLA)的形式呈现。不同应用的可用性目标的机房,可设定不同等级的机房基础设施的运维管理目标。1.2 参与数据中心建设过程

机房运维团队应充分了解自己将要管理的场地基础设施。对于新建机房,应尽早参与机房基础设施的建设过程,以便将运维阶段的需求在规划、设计、建造、安装和调试等过程中得到充分的考虑;同时为后期做好运维工作打下基础。1.2.1 应参与规划设计

机房的规划设计是一个谨慎和严谨的过程,需要所有参与机房建设的相关方共同完成,才能确保规划和设计的有效性、实用性等要求。其中,基础设施运维团队应提出运维要求,从运维经验、实际运维难度、提高运维可易性等方面对规划和设计过程进行配合。1.2.2 应参与相关供应商遴选

机房基础设施运维团队应参与机房基础设施设备供应商选择的全过程,及时地了解各种产品及服务的品牌、型号、规格等关键参数,使之更能满足运维的要求。并就在安装、调试过程中的注意事项等提出建议,还需要对后续的设备保修等服务提出要求。1.2.3 应参与建造管理

机房的基础设施运维团队应积极参与机房基础设施的建造工作,并协助做好建设项目的项目管理工作,着重关注工程建造中如材料的使用、工序、建造过程等工作,重点关注隐蔽工程的安装工艺和质量。机房基础设施运维团队应充分了解施工过程中的工艺。对于新建数据中心,从施工质量和日后运维方便性出发,尽早发现施工过程的问题,及时纠正,方便日后运维和节省日后整改成本。1.3 测试验证

机房基础设施投产前的测试验证是确保机房基础设施满足设计要求和运行要求的关键环节。1.3.1 时间和预算

机房的业主应设立测试验证专项预算,预算应包括外部测试验证服务提供商的相关费用,以及在测试验证阶段产生的电费、水费、油费等相关费用。应制定测试验证的工期规划,以更准确地预测机房基础设施交付投产的日期。1.3.2 测试验证参与方

项目建设管理部门可作为测试验证工作的主体责任单位;运维管理部门可作为测试验证工作的主体审核单位;第三方测试服务商可作为测试验证的实施单位及整体组织工作的协调单位。但运维管理部门应要求测试服务商预先提供测试方案,在运维管理部门审核后方可进行。机房基础设施运维团队可参与测试验证工作,在此过程中熟悉设施和设备,可建立相关运维技术文档库,为后期的运维工作做好准备。

机房关键设备提供商及工程总包商,应积极配合测试验证工作,应在供应商合同中对此项有明确要求。1.3.3 测试验证内容

验证应覆盖所有关键子系统和设备应具备的功能和关键的操作程序,确保满足设计要求,必要时可做故障情景模拟来检验。

测试验证中发现设计或者建设阶段的问题,应该在报告中充分体现;可以改造的部分,应要求建设单位进行改造;不能改造或暂时不需改造部分,应作为风险点在运维过程中予以特别的重视,并制定相关预案。

1.3.4 设施健康评估

当接手已在运行的机房基础设施的运维工作前,运维团队应对设施的情况进行健康评估,了解潜在风险点,其中能够改造的部分,应该申请予以优化改造。不能改造的部分,应该作为风险点在运维中予以特别的重视,并制定相关预案。1.4 技术文档

完整并准确的技术文档是后期运行、维护、维修、故障诊断、优化改造的基础。运维团队在开展运维工作前,应从施工单位得到场地基础设施的全套相关文档,包括但不限于:机房的规划设计资料及竣工图纸、全套设备的清单及相关操作文档和保修保养资料、机房自动操作系统的逻辑图及说明文档、监控系统的点表、验收测试文档、机房所在建筑的建筑设计资料、竣工图纸。整体文档应在限定时限内进入运维管理知识库,并按照质量管理的原理和要求设定文档的起草、变更、审核、批准、保存、分发等职责权限。1.5 管理边界

为了明确管理责任,机房基础设施运维团队应将可能影响机房基础设施运维目标达成的外界因素整合成管理边界报告,提交业主管理层并组织研讨,形成明确的决策,制定完整的协调沟通机制及权责界限。这些因素包括但不限于:不归本部门负责,但可能对于本部门有重大影响的供电、供水、供暖、制冷、消防、安防、监控、运营商线路接入等系统。安全管理和质量管理建议 2.1 人员安全

机房基础设施运维团队要编制正式的机房生产环境(工作场所)的安全方针,设定严格的安全生产规范;并根据安全方针制定有效的、明确的安全计划,来教授和培训安全原则、危险识别、纠正缺陷和控制风险。并加强对于该部分规范的合规度的培训、考试和审核检查,以确保机房运维人员的人身安全。相关安全生产规范主要包括:

●机房生产环境安全管理规范; ●机房基础设施各系统安全管理手册; ●机房基础设施涉及安全的应急预案; ●机房基础设施管理过程涉及的技术方案中的安全管理策略。机房基础设施中与电气相关的工作存在着固有危险。设施运维团队应当创建一份正式电气安全计划,以最小化所有工作人员受到电气伤害的风险,确保现场电气系统达到相关法规标准。电气安全计划中的条款应规定电气工作人员在有资质和具备合理安全工作流程的前提下才能进行操作,并应利用防护设备和其他控制手段,如上锁挂牌设备。此计划的创建旨在防止员工受到电击、烧伤、电弧和其他潜在电气安全隐患,同时要求其遵守法规标准。

相关国家、行业规程包括但不限于:

●GB 26860电力安全工作规程 发电厂和变电站电气部分; ●DL 408 电业安全工作规程。2.2 物理环境安全

应了解周边社会环境信息,评估潜在的安全风险并制定预案。这些信息宜包含但不限于:周边交通路况、医院、供油站、消防站、变电站、供水、供电、供气、网络通信线路等。可建立周边社会环境管理资料库。

应了解机房所在地的历史自然灾害情况。包含但不限于GB50174 及TIA-942中提到的所有评估机房选址的外部因素,并制定相应的管理预案。

应建立并执行严格的机房设备、人员、车辆进出管理制度。应设立不同安全区等级(参考ISO27001信息安全管理中的物理安全控制)并制定访客管理制度,用以有效管理访客。2.3 质量管理

在机房基础设施运维过程中建立完善的质量管理体系,是保障以上机房基础设施运维趋于卓越的重要因素和手段。机房基础设施运维团队的所有关键工作应包括以下的质量管理要素: 2.3.1 质量保证

●过程制定; ●程序制定; ●过程审核和批准; ●过程和程序培训。2.3.2 质量控制

●事件回顾; ●质量检查和检验; ●定期质量审核。2.3.3 质量改进

●故障分析; ●经验教训; ●优化及创新计划。人员管理建议 3.1 组织及人员 3.1.1 组织架构

机房运维团队应有清晰的组织架构,同时对各岗位有明确的岗位职责说明并在计算机化维护管理系统(CMMS)中实现权责匹配,同步更新。中大型数据中心场地基础设施运维团队中除现场负责人外,可按照工作内容分设以下几个主要职能岗位:

●运维巡检团队

主要职责:对基础设备设施进行巡检,担任值班工作,第一时间发现故障或问题,并作为管理程序的执行者。

●技术管理团队

主要职责:对机房基础设施提供运维技术支持,解决技术问题,承担机房基础设施一般性的优化改造工程的项目管理工作,宜包括电气、空调、弱电等系统的技术人员。

● 物理环境安全管理团队

主要职责:对物理环境安全进行管理,进行安全巡检等工作。3.1.2 人员配制

机房基础设施运维人员的配备应根据运维管理目标或SLA来确定。中高等级的机房,可按照7X24的运行要求配置运维人员。上岗人员应具备国家要求的相应资格证书。应在运维管理程序中明确规定资质等级与操作权限的一致性。

高等级以及具有一定规模的机房,每个班组应配备具有电力、暖通、弱电专业能力的运维人员,以达到“即时应急响应”的工作状态。等级相对低的机房,每个班需要至少配备一人,达到“即时报警”的工作状态。

运维团队的关键岗位应有人员备份和储备。机房基础设施运维管理团队的关键管理人员或关键岗位人员在正常运维工作开展中应采用A、B 角色配置,日常工作中应注意角色的分配和工作的配合。其它岗位人员宜建立良好的循环机制,人员可进行岗位轮换和交叉培训,使所有人员掌握全面的基础知识。3.1.3 绩效管理

为了提高机房运维人员的技术技能、职业素养和提倡团队合作精神,专业地、高效率地运行和维护机房基础设施,有必要建立人员的关键绩效指标,定期对所有人员的短期和长期绩效进行评估,奖优罚劣,推动整个运维团队技术和素质的发展和改进。3.1.4 人员管理制度

为了保障机房基础设施运维团队的创新性、稳定性、持续性,应通过建立合理的人员管理制度,约束人员的工作态度、行为规范,提高人员的工作热情、工作效率和执行力,激发人员正面影响,使团队一直保有活力来共同努力达成服务等级协议的要求,运维团队应该建立运维人员的各项管理制度。这些管理制度应该主要包含(但不限于):

●《日常活动管理制度》; ●《人员安全操作制度》;

●《运维人员基本素质养成管理制度》; ●《安全运行奖惩制度》; ●《节能运行奖惩制度》; ●《技术创新奖励制度》; ●《人员晋升制度》; ●《人才储备制度》; 3.2 培训及认证

3.2.1 员工培训及资格认证计划

对于机房基础设施运维团队新员工应进行完整及严格的培训,以确保其尽快具备岗位需要之知识及能力。培训内容应包括机房基础设施的所有系统的工作原理、操作流程、应急预案、以及管理制度等。

对于所有运维人员宜设定以知识更新、技能提高为目标的培训及认证计划。宜要求运维人员不断提升理论知识,以便于在缺乏操作程序的应急状态下进行正确的处置。

可借助行业第三方专业培训及职业技能鉴定平台,积极开展运维人员任职资格的评定工作。3.2.2 历史事件分析学习

运维团队应将机房基础设施历史事件的总结分析作为培训的重要素材,进行全员培训;对于新员工应在上岗前予以培训,以避免相同的事件再次发生。3.2.3 组织学习

运维团队管理者应积极参与行业交流,了解行业最佳的运维管理实践,并从行业故障案例中总结经验,做好自身整改。3.3 运维外包服务商

3.3.1 基础设施运维外包服务商的选择

机房基础设施属于关键性设施,选择外包运维团队时应考察其机房基础设施的运维服务的资质、能力和经验。如机房作为商业物业的一部分整体外包运维,应要求外包运维机构针对机房基础设施设施部分设立专门的有机房基础设施运维经验的团队,并严格按机房基础设施的运维规程规范执行。3.3.2 运维外包服务商的管理

对于外包服务商的员工的管理原则应该参照运维团队内部员工同等要求,相关人员只有在进行培训并得到相关的认证后才能从事相关的工作。

外包服务商需要严格遵循数机房基础设施既定的操作流程和安全守则。

机房基础设施运维管理的最终责任承担者是机房管理者,责任无法外包。因此,机房应保留运维核心管理人员,对于外包团队的工作进行审核、监督和绩效评估管理。设施管理建议 4.1 资产数据库

数据中心应建立完整及实时更新的资产数据库。数据库应包括所有关键基础设施设备的清单,还应记录设备设施的运行情况、事件情况、变更情况、维护保养频次等信息。

资产数据库应最少包括以下信息: 资产ID:每个资产的唯一标识号

种 类:一级分类(如电气、制冷、消防系统)子 类:二级分类(如 UPS、电池、PDU等)描 述:资产的文字说明 制 造:资产的制造厂家 型 号:制造厂家的产品型号 规 格:资产的规格或者标称值 位 置:位置 ID(房间或区域)购 买 人:资产维护的负责人 序 列 号:制造厂家的序列号 安装日期:资产的投产日期 保修期限:保修到期的日期 更 换:预计的资产更换日期 维护频次:年检、季检、月检等 4.2 预防性维护 4.2.1 预防性维护计划

预防性维护是为了延长设备的使用寿命和减少设备故障的概率而进行的有计划的维护。其目的是通过定期检查和保养,使设备的某些缺陷或隐患在变得更严重之前被发现。

运维团队应根据系统设备情况与供应商进行沟通,按照供应商的建议提前制定、季度、月度预防性维护计划。各专业运维人员需按照各设备系统特性、维护流程及规范,及时、完整地落实维护工作,并形成客观实际的记录和报告予以存档。运维团队还应定期对设备的运行状态数据进行统计和趋势量化分析,对于异常的趋势,做出报警及相关预案。预防性维护包括并不限于以下系统设备或内容: ●冷水机组、精密空调; ●UPS,开关、和发电机组; ●消防系统和监控系统检验; ●蓄电池放电测试;

●配电装置(高低压配电装置)的绝缘性定期试验; ●二次保护定值实验;

●每年雨季之前进行的数据中心防雷接地装置测试等。4.2.2 工单管理

运维团队应建立预防性维护及保养的工单管理系统,工单应列出工作内容、完成相应工作需要的工具及备件、工作预计完成的时间、工作负责人等信息。

计算机化维护管理系统应该对每份工单从产生到完成进行全程的跟踪。4.3 操作流程

机房基础设施的所有操作,均应事先制定详细的操作流程,经过审核后存档并在后期运行阶段严格执行。4.3.1 维护作业程序MOP 对机房关键基础设施设备的每次维护、维修、安装操作,都应事先制定一份MOP。可要求设备供应商提供MOP的建议,但对于MOP最终确认审核的责任在于运维团队,批准责任在于运维管理团队。4.3.2 标准操作流程SOP 所有关键基础设施设备在各种情况下都能执行的常用操作都应制定标准操作流程SOP。例如手动启动发电机组的操作流程,或将UPS转换到旁路的操作流程等。4.3.3 应急操作流程EOP 应急操作流程适用于有可能发生的严重故障情况。以下为部分严重故障的例子:

●一路市电供电时中断; ●双路市电供电时同时中断; ●单个精密空调时故障停机; ●全部精密空调都故障停机; ●单台UPS时故障停机。4.4 工具及备件管理

运维团队应根据资产分类清单及其分类制定最低备件库存清单并及时补充备件。

测试分析仪器仪表方面可配备进行电气性能参数测试、电池测试、接地电阻测试、绝缘性能测试、设备运行温度测试、风速测试、环境温度测试、噪音测试等的仪器仪表。仪器仪表应该定期校准。

应制定相关规定对操作工具、仪器仪表实行人员负责制或者交接班负责制等管理制度。备件和工具应定期进行盘点。4.5 供应商管理

应该按照机房基础设施运维的资质、以往的经验、业界的口碑等因素,以注重预防性和预测性维护和提高可用性的相同标准来选择合格的供应商。

所有供应商到达机房执行维护程序之前,应通过机房相关规程的培训,获得机房运维团队和运维管理层的批准。在执行维护活动的过程中要严格遵循操作流程。操作时需由运维团队的人员陪同并监督记录流程的执行情况。

供应商的每次机房维护活动都应该提交现场服务报告并存档。运维团队应该建立供应商的绩效评估方案,并定期对供应商进行绩效评估。应设立供应商管理文档,记录所有供应商的联系方式、服务承诺(SLA)、工作范围、针对设施的培训和认证情况等信息。4.6 生命周期管理

应基于设施设备的合理生命周期,结合风险评估,制定设备维护、升级或更换的计划及预算,及时报告给运维管理部门。

风险评估主要评估内容包括: ●资产重要性识别; ●资产威胁识别; ●资产脆弱性识别; ●风险值的计算;

●在评估更换设备的方案时,可综合考虑原有设备的维护费用以及新设备在能效方面的改进,做好综合投资回报分析;

●对于冗余设备宜设立轮换运行机制,以延长整体设备的生命周期。

4.7 运维管理系统 机房可建立自动化维护管理系统(MMS),集中实现资产管理、维护调度、信息安全、文档管理、工单管理的职能并记录所有的运维工作任务及完成情况。运行管理建议 5.1 运行管理制度

机房基础设施运维团队应建立并严格执行运行管理制度,包括:5.1.1 巡检相关管理制度

●日常巡视巡检管理制度; ●值班管理制度; ●交接班管理制度; ●通知矩阵。

5.1.2 工作流程相关管理制度

●工单处理流程; ●例会制度;

●工作总结报告制度(日、周、月、季、年总结报告);●交付管理规范;

●运维质量管理办法文档管理制度; ●工具备件管理制度。5.1.3 安全相关管理制度

●机房出入管理制度; ●机房现场管理制度;

●机房卫生管理制度; ●信息安全相关管理制度。5.1.4 故障处理管理制度

●设备操作管理制度; ●设备故障处理流程; ●应急准备和应急响应流程; ●维护作业计划管理制度; ●故障隐患跟踪反馈管理制度; ●紧急事件汇报流程。5.1.5 经营相关管理制度

●员工行为规范; ●考勤管理制度; ●人员管理考核制度。

5.2 设施监控、巡检、及交接班管理

应配备环境、动力、安防等监控系统以便于运维人员及时了解设施各系统及设备的运行状态和及时发现异常情况。

应规定相应的运行人员对设施运行状态的巡视频次、巡视工作内容及规范。

运行人员交接班时应对当班执行的操作、变更及观察到的任何异常数据或现象进行交接和签收。5.3 机房清洁管理

应划定保洁区域,定期做好机房保洁工作,保证地板及地板下的无尘状态。重要区域进行保洁工作时应有运维人员现场监督和指导。5.4 标签标识管理

应建立针对数据中心场地基础设施设备和物理环境完整的、清晰的标签标识管理系统。应至少包括:

●设备标识:包括设备名称、型号、编号、资产编号等; ●线缆标识:包括起始端信息、终止端信息、设备名称等; ●警示标识:如“设备已带电/危险”、“禁止合闸”、“禁止分闸”等;

●物理环境标识:如位置标识、区域标识等;

●系统图展板标识:如电气、暖通、消防、弱电系统图展板。这类标识便于运维人员清晰、快捷地掌握区域及整个数据中心系统的配电、制冷、消防、弱电的原理及关键点位。5.5 变更管理

任何对于设施运行状态的变更应进行预先的风险分析,并基于风险等级,设定相应级别的事前审核流程。在变更方案及变更时间窗口确认后,应进行相应范围的告知。变更结束后,应向相应范围部门通报变更结果。5.6 事件管理

应制定事件管理流程,明确不同等级事件下相应的处理流程。5.6.1 事件等级定义

一般事件:任何没有达到机房设计和运行标准的异常事件; 严重事件:任何没有达到机房设计、运行标准的事件,且对提供的服务造成中断的事件;

重大事件:任何没有达到机房设计、运行标准的事件,且对提供的服务造成中断,且影响范围大的事件。5.6.2 事件升级

当事件暂时无法排除,需要逐级报告,进入事件升级流程。如遇特殊情况,与直接主管联系不上时,可越级向上一级主管报告。

5.7 应急响应

5.7.1 设施应急预案演练

运维团队应针对应急操作流程EOP进行定期的演练工作,主要包括:

●沙盘演练:参与演练的运维人员集合,并分别口述在发生紧急情况下自身所应承担的职责及将会执行的方案及步骤;

●跑位演练:参与演练的人员跑位到模拟故障现场,模拟处理故障,参与人员应清晰地说出故障的处理方案及步骤。

应急演练的演练原则是:尽量接近真实情况,在条件允许的情况下尽量真实地处理故障。在运行中的一些特定场景下也可以进行应急演练,如发电机带载实验等。5.7.2 人员安全应急流程

机房基础设施运维团队应针对影响运维人员健康的人身事故制定应急流程并定期演练。应急流程可包括设置现场急救包以及联系当地医疗急救机构的方式等。5.8 容量管理

容量管理可包括但不限于以下方面: 5.8.1 空间容量

●IT设备摆放空间; ●基础设备设施摆放空间; ●综合布线线路空间,配线架管理。5.8.2 能力容量

●电力供应容量; ●空调供应容量; ●综合布线信息点容量; ●互联网接入容量。

设施运维团队应与IT 部门定期沟通,动态了解IT需求的预测,并通报设施容量的使用情况。可制定3个月至36个月周期的IT需求及设施可用容量两者的对比分析表。

当机房基础设施不能满足IT增长的需求时,应提前制定并上报扩容或者新建机房的计划。5.9 能效管理 5.9.1 能效监测

机房基础设施运维团队应了解并记录机房在不同工况及不同外界气候条件下的电力使用效率 PUE 的变化情况,从中发现趋势,以不断优化运行方案。5.9.2 了解IT设备运行特征 机房基础设施运维人员应具备一定的IT设备相关知识,了解服务器、网络、存储等设备的运行特点和功耗情况。还应了解客户或用户的业务基本情况,了解IT 设备的运行峰谷期。

应与客户或用户相关部门做好沟通,针对高密度IT负载的部署做出预测,并制定相关应对方案。5.9.3 管理气流组织

应封堵设施建筑所有可能的漏风口,维持设施的正压。应疏导设施内气流的流向、封堵所有可能的漏风口、对机柜内所有空闲U位安装盲板、关闭不必要的出风口、保证冷空气的最佳使用效率。

5.9.4 运行阈值设定

应基于安全性及运行效率的综合考虑,建立运行阈值设定指南,设置监控报警阈值、空调回风温度等。5.10 预算管理

运维团队应做好运维财务预算,上报主管领导及财务部门,并做好预算必要性的沟通解释工作。

预算应包括但不限于以下内容: ●基于SLA的人力预算; ●备件及工具、仪器采购费用; ●应急维护材料费用;

融合时代的运维+应用 篇3

经过多年以技术、产品、解决方案为核心的IT基础设施建设,企业数据中心形成了孤岛式的应用模式。一个新应用就需要部署一套新的计算、存储、网络设施,部署的过程也需要长达几个星期甚至几个月的时间。在部署完成之后,应用之间往往相互隔绝、无法互通。即使是在一个应用已经超载,另一个应用空闲的时候资源也无法调配。这严重影响了企业的创新能力与竞争力的提升,成为企业发现新商机的障碍。2009年底发布的一项报告显示。如今企业的IT预算中只有34%明确用于业务创新,这正是因为lT泛滥现象迅速蔓延一数据中心的技术设备堆积如山,70%的IT预算都用于现有lT设备的维护和运营。

孤岛模式催生融合基础设施

融合架构帮助IT部门打破根据单个应用考虑IT基础设施的传统思维模式,建立起以服务为中心的IT思考新模式。在惠普最新的融合基础设施中,就实现了从最底层的智能电站网,到虚拟资源池,再到弹性网络结构等全部基础设施的虚拟化与池化。

根据这一概念建设的数据中心,就如同应用之间打通血脉,可以相互支撑、相互协调,使企业的整体IT架构更具弹性,为业务的快速发展提供可能。许多企业在经历了数据中心成本不断增加、创新效能却不能明显跟进的痛苦之后,都开始考虑打破原有的孤岛模式,实现以服务为中心的融合架构。

推出增强型融合基础设施运维、应用管理服务,实现融合效能最大化

融合基础设施充分利用现有的技术投资,消除数据中心的技术设备冗积问题,化繁为简。通过统一的管理,所有资产都成为资源池的一部分,能够分割、组合、变化,动态适应任何业务、负载或应用的需求。这些资源的使用也经过优化,帮助企业提高利用率,降低使用能耗和成本。而令融合基础设施得到不断优化,充分发挥其强大功能的正是架设在融合基础设施之上的融合基础设施运维与应用管理。最近,惠普技术服务事业部还携手惠酱软件及解决方案事业部,宣布推出增强型的融合基础设施运维、应用管理服务,以通过惠普强大的服务能力和领先的软硬件平台,帮助客户实现更优的业务成效。

惠普运维管理服务犹如一条无形的纽带,把不同的电源管理起来,形成智能电站网,把不同服务器上的计算、存储能力融合起来,形成虚拟资源池,把路由器、交换机联系起来,构成无需硬件变化就能按需划分的弹性网络。

在孤岛式数据中心里,应用管理是一件非常耗时费力的工作,软件的补丁、更新往往需要人工完成,增加了出错的机会。在融合架构数据中心里,惠普应用管理软件轻松实现了应用的全生命周期的管理,从规划、开发、测试、发布、更新、维护直到终结都由软件自动化地全程监管。在包括应用组合服务、卓越质量服务、持续优化服务在内的惠普应用管理服务的帮助下,用户可以根据需求调整资源,提高工作效率,保持服务连续性,并缩短业务盈利时间。

除此之外,无论客户决定全面转型至融合基础设施结构还是对现有投资进行逐步改良,惠普均可提供逐步推进的全生命周期支持。这其中包括:惠普融合基础设施愿景研讨会,惠普融合基础设施概念验证,惠普融合基础设施规划服务,惠普融合基础设施设计与实施服务、融合基础设施转型咨询、云技术和架构设计服务、融合基础设施实施服务、应用质量优化服务、融合基础设施运营服务和业务应用运营服务。

应用管理护航业务成效

融合基础架构的一个基本的理念是资源池,即通过虚拟化等方式把软件、硬件等基础设施融合为资源池,根据业务应用的要求快速供应,并在应用结束的时候快速回收。对于像操作系统、数据库平台这样的应用软件,它显著地节省了许可证的费用,也节省了部署和安装的时间与精力。但另一方面,这种共享、重复使用的模式也带来了一个问题,即应用软件的缺陷和问题也将影响多个业务程序,增加了风险。同时,随着应用的复杂程度增加,业务程序之间相互依存的关系也越来越紧密,一个业务程序项目或团队的功能、性能和安全问题很有可能影响到整个企业的IT服务提供。

为了保证业务应用的正常、高效,惠普还特别提供了完整的应用生命周期管理解决方案,它确保业务与IT更好地协调与配合,实现投资回报最大化与良好的业务成效。例如,企业在完成核心开发任务的时候,惠普就提供了多元化的开发工具集成,如模块化、版本控制系统等,并为异构开发环境提供支持。

首先,该应用管理覆盖了完整的应用生命周期。它把IT的效果与业务战略结合在一起,通过正规化的流程把业务战略与IT规划结合在一起,IT建设的每个阶段都实现战略目标紧密联系。

第二,加强战略控制点。战略控制点即为数不多的几个能够对业务成效产生重大影响的点。在这些点上,惠普解决方案中心能够给出适当的工具,引导应用生命周期满足业务目标的需求,实现IT的灵活性。

第三,业务为先。在应用现代化的过程中,IT的最大挑战在于如何让IT实现更大的业务成效,让IT与业务的方向保持一致。惠普的解决方案能够以最显著的方式管理控制点,同时保持与领先解决方案的开发理念及工具保持兼容。

第四,缩短上市时间。IT的灵活性体现在如何找到并部署能够尽快在业务上体现价值的业务程序。惠普的解决方案基于模块化理念,帮助IT部门先解决最紧迫的问题,并在部署多个应用的时候体现出价值。另外,惠普的应用生命周期管理解决方案的客户还可以象订购服务一样挑选软件,这样企业就无需投入任何基础建设。

第五,高品质的传统。惠普在提供软件解决方案帮助IT企业解决棘手问题的方面,已经有差不多20年的历史。惠普已经成为高质量自动化软件、应用性能验证、分布式性能、可用性管理及网络管理的领先者。

运维管理与硬件紧密配合,为企业数据中心融合各种资源并按需灵活调用提供了技术保障。应用管理则为业务应用提供全生命周期的服务,使得企业数据中心中运行的各种应用都能保持最佳的效能,并交付出预期的效果。两者结合,成为融合基础设施在企业IT部门发挥核心作用的“软实力”的重要组成部分。

借用中国惠普有限公司副总裁,企业业务集团软件及解决方案事业部大中

华区总经理谢少毅的一句话作为总结,“企业需要高度自动化的技术环境,根据业务侧重点的变化迅速转型,成为共享服务和云计算的基础,有了融合基础设施结构,我们能与客户一起,从之前面对各自独立的服务器、存储及网络孤岛,转变为统一解决人员、流程和技术的问题。”

凤凰科技全面布局中国市场

凤凰科技(Phoenjx Technologfes Ltd)日前宣布聘任吴惠瑜女士为全球副总裁暨大中华区总经理兼亚太营运中心董事主席,整合协调业务、研发、工程、人事等相关部门

另一方面,凤凰科技也将借助吴女士在嵌入式市场经验,任命她担任全球嵌入式平台营销业务总经理,持续开拓后势看涨的嵌入式市场。此人事案于4月12日起正式生效。

凤凰科技执行长Tom Lacey在今年三月上任后,在第一时间就进行了全球客户满意度调查,并在多次造访客户与员工深谈后,更加看重大中华区的业务需求与研发动能,因此决定聘任拥有20年以上丰富产业经验的吴惠瑜女士担任此地区最高主管,并进入全球营运团队核心,以便总公司能在最短的时间内响应当地的客户需求与市场变化。这种新的营运模式打破了以往地区分公司必须遵从美国总公司规定的传统,且将大中华地区主管纳入管理核心的人事布局,也再次显示出公司对于吴女士的重视。

用友BQ商业智能平台

日前,用友华表在继2009年底收购广州尚南科技公司后,正式发布其BQ商业智能平台,这也成为其进军商业智能(BI)领域的又一重要里程碑。

用友的BI产品之所以取名BO,其英文全称(Busihess Ouotient),译成商业智慧、BQ源于IQ/EO,代表企业的商业指数和商业素质,具体表现为企业商业敏感能力、商业创新能力,执行能力,经营管理能力。而用友B0商业智能平台的关键价值是将企业现有的数据和资源转化为知识和信息应用,帮助企业做出明智的业务经营决策。

BO作为公共BI技术平台,承担着很多关键任务。首先,在产品完善的前提下要支持好集团所有业务部门,辅助他们基于自身的平台发展BI营销;其次是开展用友体系外的市场。和国际厂商及一些经销商合作,发展ISV、SI再次是整合管理软件经销商、代理商、与产业链伙伴紧密合作。”苗峰认为,与国外BI产品相比,BQ具有更适合中国用户,有较高性价比,并且能够快速交付,用户学习成本低等优势。

红旗inMini拓展移动互联网市场

3月31日,中科红旗软件技术有限公司正式推出最新的移动互联网操作系统红旗inMini尚巧版。其便携性,个性化,订制性以及友好的操控性将为消费者带来完美的用户体验,为消费者提供高效、稳当、可靠的移动网络冲浪的同时,也涵盖了时下流行的“炫酷”时尚元素

红旗inMini尚巧版操作系统贴合时尚、轻巧概念,基于开源平台MeeGo,融合了Linux最新开源技术成果,可以应用于多种移动互联网设备,如:上网本、云端设备等。inMini尚巧版在视觉和操控方面都体现出独具特色的设计思想,无论是MeeGo系统平台自身的性能优势。还是X—Windows界面的清新风格。或是精准集成的应用软件,都让用户有理由相信这就是移动互联网设备的最佳搭档。

LSI荣获华为最佳技术支持奖

LSI公司日前宣布荣获由世界领先的电信设备制造商华为公司颁发的2009年度最佳技术支持奖。最佳支持奖是华为颁发给具有杰出技术支持能力,并为推动华为成功作出重大贡献的供应商奖项。

基于BIM的运维数据构建研究 篇4

国内的一些学者对BIM进行了多项研究,但主要仍以设计、施工阶段为主,而且整体处于探索期。距离BIM全生命周期的核心理念有较大差距,尤其是从施工到运维阶段依然存在较明显的“信息孤岛”现象。

综合国内外研究情况,BIM在国外的研究应用已经从设计施工阶段深入到了运维管理中,并主要集中在由设计和施工信息模型中提取运维管理所需的各种空间信息和设备信息。国内的研究还是处于起步阶段,已有的文献资料中缺乏对运维数据构建方法的研究。因此,加快对运维数据构建以及信息模型数字化集成交付的研究将具有十分重要的意义。

2运维阶段BIM模型的关键要素

建筑物进入运营维护阶段后面临更多新的需求,以实现对资源进行有效管理及建筑物的增值,但BIM数据根据其每个阶段的应用场景的不同,各有其关键的要素和特征。由于运维阶段更加注重空间、系统拓扑以及运维数据的关联,所以BIM模型数据在运维阶段数据的提取和模型视图的应用更加凸显[1]。BIM数据在运维阶段关键要素如下。

1)设施对象

在运维系统管理中,设施是任何可能用于被管理的对象,此对象与BIM模型中的模型对象紧密关联但又并非一一映射关系,而是组合与分解的关系[2]。因此,在运维阶段直接应用由施工阶段创建的BIM模型不经过二次加工以及运维平台二次组织的情况下,难以直接应用。

2)空间对象

目前,BIM软件与协同工作平台并没有原生的“空间”对象概念,因此必须经过对模型和数据结构进行优化。

3)属性数据

运维管理平台应用必须首先对模型中的属性数据进行提取、组织和再利用。属性数据属于原生数据,只有可以快速、准确地查看与检索属性数据,BIM的价值在运维阶段才能得以实现。

4)实时运维数据

通过BIM模型与BA系统的结合,可以实时产生运维管理数据。实时运维数据涉及外部环境、温度、湿度、能耗等,是运维阶段进行经济效益分析、物业资产管理、空间预测以及对未来设施进行整体规划的重要依据。

5)视图

BIM的可视化特征是其在运维阶段发挥价值最关键的因素之一,通过BIM模型更加直观和精确地定位构件所在位置,调阅相关信息,可以极大提高运营管理的效率。

6)元数据

运维阶段仅仅依靠属性数据、实时运维数据、视图数据仍然无法满足运维管理的需求,还必需大量的外部数据作为支撑,以结构化的方式处理外部的非结构化的元性数据。

7)系统结构

运维系统中需要对接大量的外部数据,同时设施、空间等基础对象需经过合理的组织,才可应用于运维过程中,所以其编码体系及标准尤为重要。信息分类与编码的目的是将事物按属性或特征加以区分,并依据相互间的关系将它们组织起来。经过分类编码后,系统外部的数据可以兼容到体系中,更全面地描述对象的信息,更方便地在模型中组织和检索信息,因此系统结构是运维平台数据组织的核心[3]。

3 BIM数据重组及运维数据构建

基于BIM模型数据在运维管理中的成功实践,BIM数据的重组及运维数据的构建按照流程分为3个过程(见图1):BIM模型二次,即基于运营管理业务的需求兼顾模型交互平台本身的功能,对施工交付的BIM模型进行初步优化以满足下一程序的需求;创建基础BIM运维模型;在基础运维模型的基础上创建低耦合度的模型即运维BIM模型,降低不同阶段建立的数据间的依赖程度以最终满足运维的需求,其模型如下。

1)BIM模型二次

模型优化主要是根据运维需求重组BIM模型,建立系统拓扑关系,划分空间以及组织对象,以支持后续转换与应用。同时,为了满足后期的运维管理的使用,定义数据访问接口的操作。通过其数据访问接口对数据进行增减、删除以及查询等操作,可以屏蔽底层数据存储方式的差异,提供一致的数据存储环境,为后续与外部系统的数据对接提供支持[4]。

根据运维运维需求针对BIM模型中的不同系统和不同区域建立合理的视图,从而解决在整个BIM模型的视图下定位和查看相关设备的精度不够和空间不清晰的难题。

属性优化的目的是根据运营维护与管理的需求添加必要的属性数据,BIM模型含有大量的原生数据,但同时也需要大量的外部数据即元数据的支持,它是必不可少的一个过程。

系统分类需要根据CBIMS技术标准中信息语义标准,即分类编码和数据字典的方法论和主题框架模型,以科学的方法对建筑概念进行归纳、定义、标识与关系梳理,对BIM模型中系统进行分类,通过参数共享、视图标识,建立轻量化BIM模型,为BIM信息的利用以及轻量化后的BIM模型的高效组织提供条件。

2)基础运维模型

模型二次后得到大量几何数据体。由于BIM模型中的构件对象与运维管理中的设施对象并非一一映射的关系,几何数据体可以作为运维设施对象重组的最小粒度,极大地提升后续优化的效率;原生BIM模型中的视图经过模型二次后被转化为视点,但在转过过程中只有三维视图可以自动转化为视点,二维视图无法直接转换,必须经过DWF桥接处理才能实现视点的查看并且与三维视图形成逻辑相关。基于轻量化的BIM模型通过选用合理的“选择树结构”,可以将对象自身携带的一些物理信息转化成基本属性,并通过结合选择集,重新建立和优化模型组织结构。

3)运维模型创建

基础BIM运维模型经过重新组合几何信息,设定运维对象,导入和建立运维对象参数,指定和关联视点和位置信息,建立符合运维需求的系统结构以及拓扑关系等步骤之后,可以生成运维BIM模型。通过运维管理平台对建筑设施对象进行编码和组织,将属性数据与运维数据进行无缝对接,使得BIM数据彼此逻辑关联,以实现数据的双向交互与信息的反馈,在此基础上建立适合运维管理需求的系统结构树,并对相应的设备系统指定基础参数,设定合理的视图对象。

4结束语

根据运维BIM过程模型,通过运维数据的构建,依托基于BIM模型数据现代运维管理平台,经过BIM模型二次、基础BIM运维模型、运维BIM模型3个环节,对施工阶段传递到运维阶段的BIM数据进行优化与重组,借助分类编码体系以图形化的方式将不同的数据源进行集成、分类,建立一个低耦合度的运维BIM模型,可以解决目前普遍存在的施工BIM模型应用到运维阶段效率低下难题。随着运维平台的不断完善,效率将会不断提升,极大提高运维的效率和质量。

参考文献

[1]Foms-Samso F,Bogus SM,Migliaccio GC.Use of building information modeling(BIM)in facilities management[C].Ottwawa,Canada,2011:1815-1824.

[2]YU K,Froese T,Grobler F.A development framework for data models for computerintegrtated facilities management[J].Automation in construction,2000,9(2):145-167

[3]Hassanain M A,Froese TM,Vanier D J.Development of a maintenance management model based on IAI standards[J].Artificial Intelligence in Engineering,2001,15(2):177-193.

大数据运维工程师的职责精选 篇5

1、负责银行各类应用系统的运维标准制定和运维管理等工作;

2、负责银行各类应用系统的运行情况及相关技术的整理、分析和总结等工作;

3、负责银行各类应用系统的应用监控、应用运维体系工具的建设和维护工作;

4、负责银行各类应用系统的自动化脚本编写和测试工作。

招聘要求:

1、全日制一本以及以上学历,理工类专业;

2、具备2年及以上应用系统运维或应用系统开发经验,有银行应用系统运维或开发经验者优先;

3、具备较强的文档编写、英语文档阅读能力;

4、具备良好的沟通表达能力和团队合作精神,具有较强的工作责任心和主动性;

5、至少具备以下二项技能:

(1)熟悉银行应用系统体系架构、应用运维标准化流程;

(2)熟悉AIX、LInux操作系统相关运维工作,具备熟练的SHELL脚本编程能力;

(3)熟悉应用软件持续集成和持续发布交付项目的整体流程,熟悉Jenkins、Nexus等相关Devops工具;

(4)熟练使用容器平台相关技术,有容器平台管理工作、应用容器打包的相关经验;

法院运维体系框架研究 篇6

IT运维服务到了外包的时候了。但是,如何界定IT运维服务,包括哪些内容,如何规范服务,达到预期效果?北京高级人民法院在几年前就开始探讨IT运维外包,从实践中摸索出一套理论框架,具有代表性。

本栏目将连续刊登此框架研究的精华。本文为第一部分,介绍如何选择运维模式、流程和运维的职责。下期将刊登IT运维服务的流程。

北京法院信息系统中运行的是一个个案件内容,一幅幅庭审实况,一条条内网信息,它们的实时性很强,对稳定性要求很高。信息系统的运行维护工作非常重要。做好信息系统的运维工作,需要建立一套按照一定的思维逻辑组织起来相互关联的信息化运维管理体系框架。

那么,什么是与信息化运维管理相关的逻辑关系?将工作经验知识化、将专业知识标准化、将工作标准流程化、将操作流程规范化,是信息化运维管理体系框架的核心内容。北京法院体系框架建设经过五年持续探索逐渐形成十个主题部分,设计思路以信息化运行管理规则为主线,在关键流程节点嵌入严谨的管理方法,工作节点之间具有逻辑思维关系,将这个逻辑关系贯穿信息化运维管理全过程,形成了基本的北京法院信息化运维管理体系框架。体系框架突出可操作性,重点突出了信息化运维精细化管理的工作理念。

1.选择运维模式

如何科学选择运维模式,首先需要定义运维工作的职责与任务。狭义上的运维可以理解為“被动式”服务,其工作特征是:当设备出现故障后方才实施维修工作,并不包括业务应用服务和信息内容服务工作,也谈不到信息技术与业务工作融合问题。

研究认为,广义上解释“运维”应该理解为“主动式”服务,工作特征是:对信息系统可能出现的故障,主动做到事前处置、消除隐患,原则上不得出现运行故障,在确保信息系统安全、稳定运行的同时,以主动服务业务应用,提供内容服务为工作职责;以促进信息技术与业务工作深度融合,不断推进信息资源广泛共享,通过信息化手段实现“提高工作效率,降低诉讼成本,方便人民群众”的根本目的。

信息化运维服务外包有两种主要模式,为部分工作服务外包和全服务外包两种方式。前者基于资产类基础设施运维范围,属于被动式的服务,适应于信息应用相对简单,信息内容规模较小的情况。后者为主动式服务,运维职责涵盖了信息系统运行维护以及提供内容服务的全部工作任务。

北京市高级法院选择后者的原因是:信息化应用已步入了成熟期,审判信息系统规模庞大,涵盖全市80个局域网资源共享,涉及2270个应用模块,业务模块之间耦合非常紧密,硬件之间形成“集群联动”的运行规则,软件彼此达到“协同运行”的工作程式,信息技术与审判业务之间关系日趋密切,迫使信息化运维管理工作,必须由技术驱动向服务业务驱动的转变,运维工作必须支撑和服务业务应用,以主动提供内容服务为工作目标。被动式与主动式两者服务的区别在于前者主要是利用了运维人力资源,后者并用运维公司的人力资源和智力资源。

2.公开招标

对信息化运维工作的管理主要包括两个方面,一是建立运维项目全过程监督管理机制,二是建立运维项目实施过程绩效管理机制。首先,是建立运维项目全过程监督管理机制。法院属于行政经费支出的预算单位,健全信息化运维项目内部管理监督机制,从项目需求分析、预算申报、项目评审、编制标书、招标采购、合同签署、费用支付、绩效管理、项目考核等环节,建立职责清晰、相互制约、彼此监督、协同工作的管理工作流程,十分重要。

信息化运维服务外包项目性质不同于其他建设或采购项目竣工具有交付物,运维服务外包属于提供技术和智力方面的服务,项目竣工提交文档资料,基本没有其他交付物。实际上,在项目到期支付运维费后是得不到任何可见资产的。我们从花什么钱,办什么事的角度,审视财政投资绩效,对于运维技术管理部门来讲绝对是挑战课题。实践中,首要工作是健全监督管理机制,确定预算单位内部不同职能部门对信息化运维管理工作职责范围,本着要钱不能直接管钱,管钱不能直接用钱,用钱不能直接要钱的基本思路,建立完善了政府投资项目全过程公开监督管理的工作机制。

其次,是建立运维项目实施过程绩效管理机制。预算单位使用财政投资的大额运维资金项目必须履行公开招标程序。根据业务工作实际需求,选择适宜的服务外包模式,编制标书是运维技术管理部门的工作内容。编制标书工作可以看作是预算单位对技术部门工作能力的考试题。标书内容应该从全业务、全流程的视角,全面描述运维工作的职责和任务,资产多少?功能多少?信息内容由哪来?到哪去?服务协议如何定义,绩效管理如何考量,运维费用如何计算等等,类似问题必须详细描述清楚。实践中,招标文件技术需求部分使用了3.8万字描述,这是向社会公开提出的法院运维服务外包工作需求,将这些具体工作要求和详细费用预算,通过公开透明的招标形式向社会公布,这种做法也应该成为“阳光项目”的典范。

3.明确运维职责

对复杂运维流程需要建立层级管理制度来保障,以便在运维服务全过程中做到任务清晰,职责分明。实践中,由运维中标单位项目经理组成运维管理委员会,自治管理日常运维工作。从接受运维任务至完成任务根据不同工作职能,一般分为三个管理层级。一是决策层由预算单位技术部门相关人员组成,二是管理层由运维管理委员会组成,三是执行层也是服务工作组,由各个中标单位的管理人员和技术人员组成。服务台承担问题受理和层级之间信息交互等工作任务。

技术部门位于运维工作战略决策层,推荐运维管理委员会主任人选,并赋予行使运维工作中管理决策职能;运维委员会主任推荐服务台台长人选,服务台长组织服务组行使执行层工作职能。

通过服务台实现一站式服务理念,服务台24小时人工坐席服务,通过69800电话受理来自全市三级法院七千法官的电话、传真、邮件、短信、即时消息等类型的服务请求,对受理的信息进行记录、分类、分发,平均在30秒内可以向服务组下达工作指令,对重大事件同时向责任单位和主管部门进行汇报和反馈。负责跟踪、监督任务完成情况并录入运维管理知识库,服务台具有文档管理、短信平台、电子邮箱以及工作录音等服务工具和问题记录系统,实现对运维全过程的记录、检索、回复、跟踪、报告、总结、沟通等规范管理。

决策层:一般是预算单位在内部设置的信息技术管理部门,人员基本由正式编制人员构成。对上级主管领导负责,其主要工作任务就是保障信息系统能够安全、稳定、持续为业务工作提供信息内容服务。但随着信息技术不断发展,信息服务需求不断拓宽,系统不断建设应用随之攀升,但是技术人员受到编制等问题的制约,不能随着信息化规模的扩大而增加。因此,信息化运维服务外包产业应运而生,既然将部分工作外包,就必须对外包工作进行管理,单位技术部门自然成为了运维服务外包工作的管理主体,位于三级管理的首层。作为运维工作管理的主体,在职责分工上承担着运维核心管理工作和业务需求转化管理工作。

管理层:是由公开招标产生的运维服务外包项目中标方总包和各分包单位的项目经理共同组成。其性质属于服务外包公司的自治机构,直接对决策层负责,主要工作任务是对运维全过程中实施各种监督管理职能。主要负责:服务考核类、标准流程类、专业检查类、规范监督类、制度实施类、绩效管理类等。负责向执行层下达工作指令。

执行层:由总包和分包单位全体工作人员组成。统一接受运维管理委员会的工作指令,对运维工作要求主动做到事前处置、消除隐患,保障系统安全稳定运行,清晰业务流与信息流之间的作用关系,满足信息持续有效得到应用的基本工作要求。在工作流程中接受绩效管理单位的监督,接受运维管理委员会下设运维服务台统一的工作调度和指令。

实践中,在招标编制中还包括绩效管理单位,负责项目实施过程中监督管理工作,类似于建设项目中的工程监理。在信息化运维管理层面形成了由信息技术部门和运维管理委员会以及绩效管理单位三方之间相互监督,彼此制约的运行工作机制。

作者介绍:

大数据时代运维管理面临的挑战 篇7

我们知道, 服务器集群环境不但提供了服务器的高可用性, 还延长了应用系统的运行时间。在内存不足、CPU负载偏高或者虚拟机遇到较高I/O压力时, 运维人员可以主动采取风险回避, 将VM从一个主机迁移到另外一个主机。如果是一个单机, 就面临着业务受阻的风险, 而在虚拟机集群环境中, 则可以通过迁移到其他主机直到问题解决。不只如此, 服务器集群还具有反应性容错的优点, 集群中的主机监控着所有VM的活动, 当一个节点失效时, 失效节点的负载就会被指派到另外一个替代的主机上。如果需要较长时间解决失效主机的故障, 只要替代它的健康主机有足够的资源, VM就会正常工作。

服务器集群的这些优点与它配置的复杂性是密不可分的。IT运维管理需要顺应虚拟机的灵活性, 虚拟机的迁移和扩容增加了配置管理的难度。配置的复杂性可能是集群最大的弱点, 建立集群框架、管理主机间的连通性、配置共享存储都不是简单的任务, 涉及到组织内部多个团队。运维人员也许不担心其复杂度的增加, 但这些在很大程度上都是技术性的工作, 复杂度的增加可能会导致遗漏某些东西而影响系统的稳定性。

二、虚拟化技术带来的不适应性

过去任何一台服务器上运行的数据库一目了然, 服务器连接的交换机和存储阵列一清二楚, 但自从动态数据中心采用虚拟化技术之后, 这种关系随之改变。业务系统可以位于服务器集群中的任何计算机节点上, 也可以利用任何存储设备的存储空间, 这造成了IT运维管理无的放矢。配置管理和性能监控是IT运维管理的重要内容, 只有知道IT环境里有什么, 才能做好控制、维护和提高运行效率。IT运维管理需随着技术架构的调整而改变。管理人员需要对虚拟网络、数据存储、虚拟机、ESX/ESXi主机数量、集群对象提供一种与之配套的运维管理工具, 通过管理工具, 实现对集群、虚拟机等状态的监控。这些监控关系到集群的健康运行, 以及对潜在问题的及时发现与干预。另外, 集群状态的监控和统计, 为我们合理管理调优集群提供了数据参考, 更大限度地提升整体利用率, 防范出现虚拟机密度过大或者利用率不足的问题。

三、硬件与应用的故障

硬件故障和应用故障同样是运维管理所面临的问题。服务器死机、硬盘损坏、电源、内存、交换机都有可能使服务停止, 糟糕的设计还有可能造成一台服务器的死机, 导致大面积服务停止的局面, 直接对用户拒绝响应。管理人员需要提供冗余机制来规避这种风险, 给系统工程师提供足够宽裕的时间。

四、训练有素的运作团队

浅析电力综合数据网运维管理 篇8

电力综合数据网对电力系统高效运作有着不可预见的推动作用, 正如电力是国民发展的能源基础行业, 电力综合数据网管理也是架构信息化电力系统管理的基础平台。电力综合数据网虽然优点突出, 但弊端也是显而易见的。因此, 为推动电力系统高效、有序运行, 探讨电力综合数据网运维管理成为电动系统设备研究中必不可少的一部分。

1 电力综合数据网的特点

电力综合数据网由两个独立的数据网络构成———电力调度数据网和电力综合业务数据网。电力综合数据网络是为电力行业的信息化管理而服务的传输网络。主要具有以下三方面的特点:

1.1 网络覆盖广

随着电力企业设备管理水平的不断提高, 电力企业应用各类信息管理系统进行日常生产管理, 而综合数据网作为信息化业务的基础平台, 覆盖电力系统所有厂站、营业收费厅、办公楼等生产营业场所。

1.2 设备管理智能化

由于电力综合数据网的设备化管理, 管理人员通过设备性能参数的变化及时了解设备运行状态, 有故障发生时, 系统设备能够及时给出预警信号, 方便设备维护人员尽快做出相应的措施。

1.3 网络运维要求高

电力综合数据网对电力系统发展具有重要意义且优点突出, 但由于其承载了不同安全等级的信息系统业务, 网络安全性对于数据网的运行至关重要, 需要采取措施加强网络安全性。此外, 综合数据网全网规模庞大, 涉及范围大且不易轻易更改, 一旦内部人员的操作失误, 某一个小范围的变动都有可能引起全网瘫痪。因此, 电力综合数据网对网络安全机制、稳定性要求特别高。

2 影响综合数据网运维管理的因素

一个电力企业发展的基本原则是保证电力设备安全高效的运行。在规划管理的基础上, 充分运用现有的技术手段, 适当配置电力设备, 提高设备利用效率是电力企业发展的基本要求。基于以上的现状分析, 目前影响电力系统综合数据网运维管理开展的因素主要有以下三方面:

2.1 技术管理手段不强

随着电力企业的发展, 综合数据网网络覆盖范围不断扩大, 网络设备数量不断增多, 网络结构也越来越复杂, 各种不同类型的接入设备也越来越多, 网络流量不断增大, 网络行为也变得越来越复杂, 这些因素都导致综合数据网网络运维管理的难度和要求越来越高。而在实际管理过程中, 缺乏有效的技术手段支持, 仅靠有限的几个管理人员进行管理和维护, 管理工作非常繁重且困难。这严重影响电力数据网的既定效率。为了提高电力系统的运作效率, 加强电力数据网管理设备配置是必须的。如流量监控设备、网络设备操作审计设备的安装。

2.2 管理人员技术落后

电力综合数据网设备运行维护内容主要包括定期检测、故障处理、日常巡视和设备验收四类工作。要培养出全面的管理人才所需周期长, 从事电力综合数据网管理人员需要有较强的专业性及长时间的工作经验。管理人员由于掌握了电力系统中比较复杂、关键的技术, 在工作中发挥着比较重要的作用。若人员变动频繁, 不能保证管理人员整体业务水平的连续性。

2.3 数据信息分享平台欠缺

由于电力综合业务数据网承载了各类信息化业务, 日常运维中, 存在PC机、网络设备、安全防护系统、业务系统服务器等诸多维护界面, 需要协调与配合的部门较多, 网络维护部门应该将运行维护日常工作及任务流程化和自动化, 与其他相关系统用户实现部分管理信息共享。如XX电力企业通过统一信息平台, 实时发布最新综合数据网运行情况拓扑图, 并提供自助网络测试等功能, 进而为综合数据网运行维护提供透明化的整体网络运维管理。

3 综合数据网运维管理的发展前景

随着网络信息的不断发展, 电力行业也加强了网络信息化的建设力度。电力综合数据网主要依靠网络设备和网络架构的可靠性, 其高效管理以及安全运行是网络系统和业务系统正常运作的关键。目前, 由于综合数据网网络系统的结构复杂、规模庞大且承载业务种类多, 因此, 建设综合管理平台将是综合数据网发展大势所趋的方向。

3.1 加强技术管理手段

加强技术管理手段对提高综合数据网的运维管理效率至关重要。如部署网络流量监控设备能及时观察网络性能的好坏, 综合数据网网络流量的有效控制是确保网络稳定、高效运行的基础, 尤其是对综合数据网的设备互联端口进行流量监控, 能帮助判断网络故障及网络安全等状况。部署网络设备操作审计设备能加强网络设备管理的安全性, 可以实现网络设备动态登陆口令, 有效减少网络管理人员定期修改全网设备口令工作量, 提高工作效率的同时加强了网络系统的安全性, 而且还可以对全网网络设备操作行为进行监控和回放, 防止恶意修改, 协助误操作和故障分析。通过加强各种技术手段, 保证综合数据网络设备的正常运行, 一方面减少小故障引起连环事故的发生;另一方面减少设备大范围的损坏和维修次数, 同时也减少设备维护的费用。

3.2 加强综合数据网运维人员的素质培养

对电力综合数据网运维人员进行培训, 让他们具备熟练使用和维护系统的能力。由于电力通信系统装置的不断更新换代, 数据网运维人员继续学习也是非常重要的。但由于通信系统工作的特殊性, 运维人员工作一般任务繁重, 没有足够的时间进行后续培训和学习深造。因此, 电力系统相关机构应该做出适当的调整, 创造更多的培训和学习机会给运维人员, 提高他们的业务水平。特别是有新型设备更换时, 应组织一部分运维人员进行专项技术研讨和学习, 保证相关人员充分掌握该设备的原理、功能、特点以及运行过程中需要注意的事项等, 为设备稳定高效地运行做好充分的理论准备, 促进电力企业的发展。

3.3 加强信息共享措施

建设数据信息分享平台, 通过信息平台与网络管理系统建立链接, 实时发布综合数据网运行情况拓扑图, 各网络节点的用户可以随时登陆查看所在位置的网络运行情况。并在系统中向用户提供IP地址查询、MAC地址查询、网络稳定性测试、网速测试等功能, 通过上述措施加强与综合数据网用户的互动, 进而为综合数据网运行维护提供透明化的整体网络运维管理。

4 结论与展望

电力综合数据网为实现各类信息管理的高效化, 进一步提高电力系统可靠性提供了网络平台, 在变电站的运行中具有极其重要的作用。电力综合业务数据网是电力企业必不可少的保障手段, 是电力系统运行的关键, 该网络系统的完善度、先进性、安全性都直接关系着电力系统的运行。电力综合数据网运维管理并不单单需要理论知识, 还需要电力企业针对自身的特色, 采用有效的方法、配置适当的电力设备等, 及时掌握网络资源分享信息、业务流程、电力设备运用等实用信息, 以及设备运行状态、业务部署、数据综合处理等电力设备状态情况, 能够大大提升电力综合数据网的管理效率。只要我们正视电力综合数据网运维管理中出现的各种问题, 积极拟定改进措施并实施, 就能促进电力企业安全生产, 并进一步提高供电服务满意度, 适应社会对用电可靠性要求日益增高的形势。

参考文献

[1]卢江水.调度、变电与配电自动化系统关系的综述[J].北京电力技术, 2009 (02) .

[2]王修庞, 罗虎, 等.变电站集控运行管理模式探讨[J].继电器, 2008 (08) .

数据中心IT运维审计体系研究 篇9

随着数据中心安全防护体系的不断完善,来自外部的网络攻击等安全事件造成的危害变得有限,更多、更严重的威胁则来自于内部。据国家计算机网络应急技术处理协调中心的调查结果显示大约76%的网络安全威胁来自于内部,其危害程度远远超过黑客攻击及病毒造成的损失,而这些威胁绝大部分与内部各种网络访问行为有关。

数据中心建设运营初期,信息系统资源较少,少量人员即可完成相关运行维护工作,风险尚处于可控阶段。随着技术的不断发展,大型集中式数据中心逐步建立,信息系统规模越来越大,提供服务越来越多,安全运行要求越来越高,运维人员的构成越来越复杂,随之而来的是不断增长的运维风险。

运维人员通常具有系统的高级权限,在数据中心的安全运行中处于核心地位,很多企业为了降低运维成本,采用部分或全部运维外包的方式,委托第三方运维团队参与数据中心日常运维工作,在这种情况下对运维人员的操作行为管理犹为重要。然而,很多企业还没有建立有效的运维审计体系,缺乏必要的运维审计手段,由运维人员产生的安全案例已处于逐渐上升的趋势。

1 IT运维风险分析

新形势下,数据中心面临着日益复杂的运维环境,运维责任和挑战愈来愈大,影响数据中心安全运维的风险主要存在于以下几方面。

1)运维人员构成复杂。大型数据中心的运维队伍中普通存在内部运维人员、第三方常驻运维人员、第三方临时运维人员等多种角色,管理较为松散。内部运维人员一般具有系统的超级管理员权限,长期以来对内部运维人员的操作行为一直处于难管理的状态,对第三方运维人员的管理同样存在这样的问题,多种运维角色的同时存在,很难对各类运维人员权限进行精细化控制。

2)运维人员操作不合规。信息系统具有结构复杂、变更频度高、技术难度大、实现技术多样化等特点,在传统的运维管理模式下,由于缺乏有效的监管,运维人员普遍存在随意操作、越权操作、不按流程操作、变更操作范围等不合规的操作行为。

3)账号共享安全隐患。基于传统的运维管理模式,无论内部还是外部运维人员,都是直接采用系统账号登录目标系统进行操作,随着信息系统规模的扩大和运维人员的增加,运维人员与系统账号之间的交叉关系越来越复杂,在单个系统账号被多名运维人员所共享的模式下,系统账号不具有唯一性,如果发生误操作或者恶意操作,将很难追查到责任人。

4)缺少取证举证手段。信息系统自身的日志审计功能无法全面记录运维人员的操作行为,无法第一时间发现并阻止违规的操作行为,难以追溯到不合规的操作源头,更无法对违规操作行为进行还原和复现,很难为相关事件的取证举证提供充分的依据。

2 IT运维风险对策新思路

面对传统运维模式带来的风险,必须借鉴先进的IT审计理念[1],设计以预防、消除或减少潜在风险为目标的安全运维架构,构建以IT服务管理为基础[2],以对运维人员操作管控为重点的IT运维审计管理体系,并建设相应的IT运维审计系统,从管理和技术2个层面化解IT运维风险。

IT运维审计体系的核心是建立以运维人员为中心的内控体系,即实现运维人员与目标系统的逻辑分离,构建“运维人员→主账号(集中运维账号)→授权→从账号(目标系统账号)→目标系统”的管理架构。在此架构下,通过基于唯一身份标识的集中运维账号与访问控制策略,实现集中精细化运维操作管控与审计。该体系涵盖IT服务管理、集中运维管理、访问控制管理、合规审计管理4个部分,图1描述了该体系各部分间的递进关系。

1)IT服务管理。建立规范的运维操作标准化流程[3],强化操作工单审批制度,实现工单账号与运维账号相统一,实现工单审批与运维账号授权相统一。

2)集中运维管理。实现对运维人员账号的统一管理,为每个运维人员分配独立的运维账号,并建立运维人员账号与目标系统账号的授权与关联机制,实现对服务器、网络设备、安全设备等信息资产的统一管理[4]。

3)访问控制管理。坚持权限最小化原则,设置不同运维账号对不同系统的访问权限,设置不同运维账号允许的登录IP地址、操作命令等规则,实现对运维操作的细粒度访问控制管理,避免可能存在的越权访问。

4)合规审计管理。实现对运维人员操作行为的全程监控和记录,对违规操作进行阻断和报警,建立操作回放审计机制,满足安全运维合规性审计要求。

3 IT运维审计管理模型

利用先进的管理和技术手段,将贯穿IT运维全过程的人员、设备、账号、操作等要素进行有机整合,建设涵盖运维人员、IT资产、操作管理等多层面的IT运维审计管理模型,为IT运维审计体系提供科学合理的全局视图,在体系化审计框架下开展IT运维工作,实现对IT运维全过程的可控、能控、在控。

在“运维人员→主账号(集中运维账号)→授权→从账号(目标系统账号)→目标系统”的管理架构下,依据IT运维全过程的各要素特征,建立多维IT运维审计管理模型,划分为运维人员、IT资产和操作管理3个维度,并为各维度设计了相应的属性,图2为多维IT运维审计管理模型。在此模型基础上,研究各维度间的依赖关系,设计科学的审计规则,形成切实有效的IT运维审计工作体系。

1)运维人员维度(X)。运维人员既是数据中心安全运行的保障,同时又是数据中心安全运行的潜在风险,其在数据中心的安全运行中处于核心地位,根据IT运维的特点,将运维账号、运维IP地址、时间和操作行为定义为该维度的4个关键属性。

运维账号(X1):指运维人员的集中运维账号,运维人员通过集中运维账号对目标系统进行操作,该属性用以标识运维人员身份的唯一性和不可抵赖性。

运维IP地址(X2):指运维人员使用的客户端地址,该属性用以标识运维人员发起操作的IP地址。

时间(X3):指运维人员进行操作的时间窗口,该属性用以标识运维人员发起操作的开始时间和结束时间。

操作行为(X4):指运维人员在目标系统上进行的运维操作,该属性用以标识运维人员发起的各类操作命令。

2)IT资产维度(Y)。IT资产是支撑数据中心稳定运行的所有信息资源的总称,是数据中心的核心价值所在,同时也是数据中心的运维对象,根据运维对象的特点,将主设备、IP地址、服务和数据定义为该维度的4个关键属性。

主设备(Y1):指服务器、交换机、防火墙等物理设备,主设备是数据中心信息系统的载体,该属性用以标识承载信息系统的各物理设备的名称。

服务(Y2):指主设备上运行的数据库、中间件、路由协议等各类服务,该属性用以标识信息系统服务的类型和名称。

IP地址(Y3):指信息系统对应的IP地址,该属性用以标识信息系统对外提供服务所使用的IP地址。

数据(Y4):指信息系统上存储的各类数据,该属性用以标识信息系统中的业务数据、配置文件、系统日志等对象。

3)操作管理维度(Z)。操作管理的目的是要达到对IT运维风险事前规划预防,事中实时监控、违规行为阻断响应,事后合规审计、操作行为追踪回放的效果,根据操作管理事前、事中、事后3个阶段的特点,将权限控制、实时监控、危险阻断、操作回放定义为该维度的4个关键属性。

权限控制(Z1):指对运维人员可操作的IT资产进行权限控制的管理规则,该属性用以标识运维人员可访问IT资产的权限列表。

实时监控(Z2):指对运维人员操作行为进行实时监控的管理规则,该属性用以标识对运维人员操作行为进行的实时监控。

违规阻断(Z3):指对运维人员违规操作行为进行及时阻断的管理规则,该属性用以标识对运维人员违规操作行为进行的阻断响应。

操作回放(Z4):指对运维人员操作行为进行回放、审计的管理规则,该属性用以标识对运维人员操作行为的合规审计及调查取证。

运维人员维度和IT资产维度较为全面地反映了IT运维全过程各要素间的关联关系,将2个维度的属性进行关联形成4×4的矩阵,该矩阵可全面记录数据中心IT运维的全过程,操作管理维度是在4×4矩阵的基础上,通过权限控制、实时监控、危险阻断、操作回放的管理规则,以4×4×4的立体矩阵形式实现对IT运维管控的全生命周期描述(见图3)。

如要对某运维人员在某时间段对某主设备进行的运维操作进行合规性审计,则该立体矩阵中的{X1Y1Z4,X3Y1Z4}2个元素即可满足对这一审计需求的描述,此外通过选取该立体矩阵中的相应元素组合即可实现对不同IT运维审计需求的描述。

4 IT运维审计的实现

目前IT运维审计系统广泛采用了堡垒机技术[5],针对数据中心运维环境中的rdp、telnet、ssh、http等运维协议,堡垒机通过代理的形式对目标IT资产上运行的服务协议进行发布,通过调整防火墙访问控制策略等手段使堡垒机作为运维操作的唯一入口,运维人员在进行维护操作时首先登录到运维操作审计系统,系统根据运维人员的账号权限,提供该运维人员所能访问的IT资产列表。

运维审计堡垒机采用物理旁路、逻辑串联的部署模式(见图4),该部署模式不需要调整任何网络架构,不会对数据中心的数据流向、带宽等产生负面影响,也不需要在IT资产上安装任何代理程序,图4中的红色线条代表运维人员登录过程的数据流向,蓝色线条代表运维过程的数据流向,从数据流向可以看出所有的运维操作行为均在堡垒机审计系统的监控范围之内,运维审计系统根据预先设置好的审计规则,自动捕获运维过程中的相关数据并进行保存。

5 结语

本文在对数据中心面临的运维风险进行全面分析和总结的基础上,提出了以对运维人员的操作管控为重点的IT运维审计管理体系,该体系涵盖了IT服务管理、集中运维管理、访问控制管理、合规审计管理4个部分,为IT运维审计体系提供了科学合理的全局视图,并在此基础上提出了多维IT运维审计模型,以立体矩阵的形式实现了对IT运维管控的全生命周期描述,对促进数据中心IT运维审计体系建设具有积极的指导意义。

摘要:为了最大限度防范数据中心大集中背景下的运维风险,有效提升数据中心的安全运维水平,必须引入先进的管理和技术手段,建立涵盖运维事前、事中、事后全过程的IT运维审计体系,构建以对运维人员操作管控为重点的IT运维审计架构,加强对数据中心运维的全生命周期管理,更好地发挥信息化对企业发展的战略支撑作用。

关键词:数据中心,运维风险,运维审计,体系

参考文献

[1]于海霞.我国IT审计面对的挑战[J].中国管理信息化,2011,7(11):14.

[2]陈春华,梁奂.全业务电信运营商的IT服务管理实践探讨[J].电信科学,2011,56(3):119.

[3]王广平,张富贵,马杰文.有效管控IT运维风险[J].金融电子化,2010,18(2):93.

[4]杨杰.信息安全审计的应用研究[J].计算机安全,2010,10(10):19-20.

变电站运维基础数据资料浅析 篇10

1 设备台账

设备台账资料是所有台账的基础。滑县电业管理公司设备台账2011年开始建立, 经过几年的不断规范, 目前已趋于完善。在此之前, 公司尽管也有设备的相关参数, 但是不完整, 比如对于双抽头电流互感器, 只有运行抽头的变流比, 没有备用抽头的变流比, 并且设备参数一直没有系统地进行维护, 造成设备更换后数据没有及时更新。2009年后, 随着用电负荷的快速增长, 设备开始大规模地进行改造和大修, 台账的不完整和不准确这一问题开始凸显。例如:根据设备技改大修技术要求, 某种型号的设备不满足安全运行需要, 需要进行改造, 或者某种设备达到规定的运行周期, 必须进行更换和大修, 但因为没有准确的设备台账, 无法提供准确的设备改造大修依据。此外, 在日常缺陷处理中, 台账的缺失也会造成很多问题, 比如:某线路报过流, 检修人员带着互感器去更换, 到现场拆线时才发现原互感器是双变比, 通过调整抽头就可以解决, 浪费了人力物力;又比如:主变压器有载调压分接开关故障, 需要厂家配合检修, 但因无法按厂家要求提供有载调压分接开关型号和出厂编号, 厂家无法及时准确地判断故障情况。诸此种种, 都表明了设备台账在设备运维管理中的重要性。

因此, 在2011年, 滑县电业管理公司下决心在秋季预防性试验期间, 对全公司变电设备进行统计。为了保证统计的完整性和准确度, 专门下发了设备台账统计要求, 并制定了台账表格模板, 其中特别强调:①一次台账统计以小类设备为单位, 尤其是室内开关柜, 应按内部设备单元对断路器、隔离开关等进行逐项填写;②对电流互感器、电压互感器存在多变比和多准确度等级的情况, 应把各抽头数据统计完整;③主要设备的附属设备参数, 如有载调压分接开关、断路器操作机构等, 同样应按格式统计清楚;④二次设备按保护模块和装置进行统计;⑤每项设备需附配套照片, 设备参数和照片一一对应。

历经近2个月的时间, 全部设备台账统计完毕, 为了保证今后设备台账的实时更新, 滑县电业管理公司下发了变电设备台账运维管理要求。要求对于新建变电站, 设备台账应作为验收投运建设单位移交的必需资料, 否则运维部不予组织验收投运;对于技改大修和日常设备更换, 设备投运前运行单位必须提交更新后的设备台账, 方可进行验收投运工作。通过上述管理措施, 有力地保证了设备台账的准确性和实时更新。

2 负荷台账

滑县是河南省农业大县, 全年峰谷差非常明显, 平时负荷较小, 但在农业灌溉和迎峰度夏、度冬期间, 负荷增长非常迅速, 经常造成严重的过负荷现象。2013年之前, 滑县电业管理公司没有建立系统的负荷统计台账, 给变电运维管理造成了很多不利影响:①对于主变压器的过负荷情况缺少提前预判, 往往过负荷以后才发现, 无法提前采取措施;②由于负荷台账的缺失, 运维检修部也无法根据全年的负荷情况校验各种电气设备及导线、母排的额定电流是否存在不匹配现象, 并根据校验结果制定技改措施, 往往造成负荷高峰期间设备因载流量不足而出现发热现象。随着用电负荷的增长越来越快, 更加凸显了掌握负荷情况的重要性。为此, 2013年, 在各生产部门的要求之下, 调度中心开始对每日负荷进行统计, 统计内容包括每日各站最高、最低负荷, 35及10 k V线路每日最高负荷, 并将统计结果发给各生产部门, 运维检修部以此为基础, 逐步建立了负荷台账。负荷台账的建立为运维检修部的变电运维管理工作带来极大的便利。

3 缺陷台账

一直以来, 滑县电业管理公司是以缺陷流程单作为缺陷上报的依据, 运行人员发现缺陷后以缺陷流程单进行上报, 根据缺陷的危急、严重、一般情况, 运维部和检修工区安排进行缺陷处理。2012年以后, 运维部修正了缺陷管理办法, 增加了缺陷回执单, 缺陷每月汇总, 制定了重点缺陷登记制度, 共同形成了缺陷台账, 用于指导日常运维管理。其中, 缺陷回执使缺陷处理形成了闭环, 便于管理人员及时了解缺陷的处理结果;缺陷汇总便于对以往的缺陷情况进行查阅核对;重点缺陷登记则对经常发生的缺陷、反复处理仍无法消除的缺陷进行登记跟踪, 并组织各部门开展缺陷分析, 探讨处理方案, 根据轻重缓急列入年度技改大修计划。通过落实上述措施, 不但促进了日常缺陷的处理, 也为项目储备和年度技改大修计划的制定提供了依据。

4 备品备件台账

2013年以来, 随着省公司物资集约化管理的深入, 对县公司物资管理提出了新的要求。过去, 因为设备台账未完全建立, 对家底没有摸清, 进行物资储备往往具有盲目性, 很多都是根据缺陷情况进行采购, 某些物资因采购过多往往会造成积压, 但是有些覆盖不到的设备突然出现问题因为没有备件又不能及时更换。随着物资集约化管理的深入, 物资计划性加强, 过去那种有问题就临时采购的方式越来越不适应目前的管理要求, 建立物资备件台账的重要性开始凸显。

随着滑县电业管理公司设备台账和缺陷台账的逐渐完善, 为物资备件台账的建立打下了良好的基础。经过运维部与物资部门的沟通协调, 应急物资仓库也开始建立, 并确定了如下管理原则:一是应急物资仓库仅用于应急物资备件, 其他物资不准和应急物资混合放置;二是物资备件定额, 以设备台账和缺陷台账作为依据, 确定物资类别和每类的数量, 定额原则以重点缺陷为主, 设备全面覆盖 (但对35 k V主变压器、断路器等整台金额超过5万元以上的不进行物资储备) , 数量分类控制;三是实行“出一进一”的原则, 即消耗一台, 随即补充一台。2013年5月, 滑县电业管理公司应急物资仓库正式建立, 应急物资制度也开始正式实施, 并在随后的实践中, 逐渐地进行了完善, 至今未发生因缺少物资备件而影响抢修的事件, 保证了突发应急缺陷的及时处理。

5 技术资料台账

刘建:从小老板到运维“署长” 篇11

在他的特有的工作方法带动下,大兴法院的信息化逐步成为北京地区的标杆。

刘建的桌面杂乱无章,左边是一沓文件,右边堆着一些资料,中间是香烟、空调遥控器、键盘、鼠标、耳机和车钥匙。烟灰缸里插满了烟头。桌前是42英寸的监视器,旁边有14英寸的小显示器,这是典型IT技术人员的办公桌。

“我和别人不一样,17岁在中关村租柜台,当老板,年收入二三十万元,20岁考上了公务员。”刘建说。他现在是北京大兴区人民法院信息技术室主任,该部门有三名专职人员,15名外包运营人员。这些活跃的年轻人自建QQ群,名为“大兴运维总署”,刘建顺理成章地被称呼为“署长”。

大兴法院承担了北京高级人民法院(下简称北京高法院)第二期、第三期的信息化试点。试点的信息系统在大兴法院应用成熟之后,在北京法院系统内全面铺开,大兴法院的信息化试点承担着以点带面的标杆性作用。

刘建为什么从商人变成信息化主管,如何承载职业要求?他有什么方法,承担起大兴法院的标杆性试点工作?

17岁的小老板

刘建当了三年IT小老板,为日后的职业生涯埋下伏笔。

“17岁那年,我从职高一年级休学,在中关村黄庄的配套市场打工,倒卖计算机配件,无非是CPU、主板、硬盘等。过了半年,有一些关系后,自己租了半个柜台,代理海洋、Chips主板,倒腾装机。”刘建兴奋地回忆当时场景,说中关村配件市场生意火爆,需求旺盛,利润空间大,一块倍速的光驱进价700元,卖1200元: “一个月赚一两万元都是少的。”

“我学历低,刚入行时啥也不懂,四处请教人。”刘建的运气不错,在代理柏德电脑时,北京物理楼有一位老教授告诉他如何在“村内”做生意。刘建聪明好学,虚心请教,渐渐入行,生意越做越火。这个职高学历的老板忙不过来,索性找帮手,大多是人民大学、北京大学的毕业生。

在这两三年中,刘建做了不少大单子,如北京大兴区第一、二职业高中,石化和一些街道办的攒机单。时至今日,刘建分析自己的优势说: “当时不到20岁,年龄小,长相也小,和用户打交道时,他们都觉得我不容易,套用现在的话来说,我是‘倚小卖小’。”每次在打单时,刘建踏实耐心,少说话,多做事,腿脚勤快,嘴甜,不断喊着“谢谢叔叔阿姨”,单子渐渐多起来,刘建也琢磨出不少做生意的道理。

转眼到了1996年,中关村的暴利日子一去不返。专业媒体开始大版面刊登配件报价,用户往往拿着媒体的报价单来攒机。中关村又新开了几家大型电脑市场,增加了上千家小柜台,竞争愈发激烈。PC市场也走到了单机时代和网络时代的分叉口。这时,刘建觉得攒机的生意不能再做下去了,他转让了柜台,去了建筑公司做办公室秘书,思考着人生的下一步。

“在接单时认识不少机关的人,觉得可以去机关工作,丰富自己的人生经验。”刘建抱着这个想法报考公务员。他父母都在机关工作,很支持这种想法。学历低,不差钱的刘建开始备战考试。

1997年,中国面向社会公开招考第一批公务员,高中学历即可报名。刘建清楚地记得当时的题目: “前面是50道反应题,后面是50分的申论。比较幸运的,我猜中申论题目——什么是建设具有中国特色的社会主义,整整写满一页纸。”这种幸运加上聪明,他的总成绩是67.5分,超过了60分的分数线,最后被调配到了大兴法院。

那一年,刘建不满21岁。

基础工作

1997年,大兴还属于北京市的郊县,法院还叫大兴县人民法院,有六个派出法庭。刘建被分配到最远的派出法庭做书记员,那里骑车5分钟就能到河北省。当时没有信息化概念,通信也不发达。上级单位派发了几台IBMP133的电脑,法院就当宝贝供着,偶尔开机,也不过当打字机用。

书记员的工作是记录庭审,送达和整理归档。刘建除了基础业务之外,还做过内勤。这种经历有三四年时间,让他彻底了解了法院的基础业务,这为他日后的工作打下了基础。

刘建懂电脑市场,为单位和个人跑前跑后买配件、攒电脑、做日常维护、安装软件和查杀病毒等。由于这种联系,他和大兴法院好几个派出法院来往密切,关系良好,这增加了他日后的协调能力,又为信息化工作打下另一个基础。

不过,“知道自己没学历”,刘建在基层工作的几年时间内,又自学专业知识,拿到了法律和计算机专业本科毕业证。

2000年,刘建调回大兴法院本部,负责通信业务。“这段经历让我了解了运营商之间的关系,以及通信方面的技术知识。”这一工作又经历了四年时间。

2001年,大兴由县变为区,大兴县人民法院也变为大兴区人民法院。2003年底,大兴法院开工建设新办公楼。2004年7月18日,新大楼启用。

这一次,刘建全面负责信息化建设。

“当时考虑并不周全,机房面积只有50平方米。”刘建说,此次兴建的机房,计划满足五年内的业务需求,硬件配套设施完善,包括一台小型计算机、四台服务器、一台三层交换机、UPS和防火墙等设备。

由于只有刘建一个人负责机房,为了保障质量和赶工期,刘建吃住都在法院内。“当时,在机房的机柜间搭了一张床,困了就睡一会。并且由于新楼建成后的经费问题,派出法庭的系统也要建设,我每天都在钻洞、走线、做水晶头、安装槽板,完全就是一个技术工人。”刘建忙碌了几个月,每天穿梭在法院与派出法庭间,一个人将所有派出法庭的网络安装和调试好,有时候还让太太一起帮忙:“现在想想,蛮有成就感。”

直到现在,刘建对整栋大楼的网线作用和物理位置仍了如指掌: “只有我一个人清楚这些线怎么走的,法院现在的运维团队工程师还会偶尔问我。”刘建打开机柜后门展示时,自豪地说道。只见机柜后面的交换机内排布着错综复杂,不同走向的网线。不过,这些网线上附有五颜六色的标签,上面标注作用,这也是刘建一张张贴上去的。

二期试点

2004年,中国法院系统的信息化蓬勃发展。

这一年,北京高法院开始加大信息化建设,以“四个统一”为建设方针,经过仔细调研将信息化第二期的试点工作放在了大兴法院。在这之前,“做信息化时,我经常和上级沟通,提出了不少想法,思考法院的信息化该怎么做,如何提高庭审效率,满足和当事人的需求,为领导决策所服务等等。”刘建懂得业务知识,又和基层人员熟悉,了解法官的想法和业务需求。他有针对性地提出了对信息化建设的看法,得到了上级的认可。

为什么将信息化试点放在了大兴?

刘建如今分析说,试点工程对审判业务的影响很大。有些大法院为了不影响日常开庭,不愿意试点。有些小法院硬件环境差,业务量不足,不具有典型性,不能试点。而大兴法院处于中游水平,硬件条件还过得去,业务量饱和,关键是法院领导对信息化工作非常重视,加之自已对信息化工作有一套思路,认识清晰,确实希望能够通过信息化缓解业务压力,所以,综合这些因素,二期试点最终放在了大兴法院。

同时,从经济条件说,比大兴法院有钱的法院比比皆是,比大兴法院穷的地方也不少。假如信息化工作在大兴法院试点成功,应用较好,必定会促进上游法院的信息化建设,也将带动下游法院的信息化发展。

可以说,北京高法院有意将大兴法院树立为信息化的标杆,这一期试点的重点有庭审刻录系统、庭审视频高清系统、远程立案系统和IPTV系统等。

“试点其实是苦活。”刘建说,大兴法院的信息化试点工作做得很辛苦,他最长时工作了五天五夜: “我是白天、夜晚轮轴转。白天不能影响庭审业务,不能走线、打孔,所以后台软件公司找我调试机器,安装软件、测试路由顺畅。到了晚上,综合布线的公司又要找我,问我穿孔的位置怎么打,布线是否影响美观等。”刘建负责二期试点的工作,又是一个人面对五家IT公司。在连轴转工作了五天五夜之后,刘建一口气睡了一天半。

2007年9月18日,北京法院信息化成果展示会在大兴法院召开。参加的单位有最高人民法院领导、北京各区县法院的一把手、北京财务局领导和北京信息办主任等。这是北京法院信息化建设里程碑式的一个会议,从此以后,北京法院系统的信息化逐步建设,成为全国最先进的地区。

针对二期试点的成功,北京高法院专给大兴法院写了一封感谢信,贴在了法院的大门前。

二期试点,刘建功不可没。

CIO的能力

因为二期试点的成功,2009年,北京法院信息化的三期试点也放在了大兴法院。三期试点工程包括3500万元的软件,细分为民事、商事、立案等大大小小100多个系统。

为了做好三期的试点工作,刘建鼓动所有人员为系统挑错,意见被采用的有奖。部门间还进行试用比赛等。在这些激励措施下,基层审判人员积极参与。

针对三期试点工程,大兴法院提出的改进意见不少于1500条。

有些意见很小,却符合人性化: “比如警示符号修改成图形并有颜色,立即能吸引人的注意力。”这些小意见代表了大兴法院对试点系统的关注程度。有一名审判长还专门写了1500字的意见书,仔细谈了对试点系统的看法,这让刘建很感动。

三期试点结束之后,大兴法院的信息化又上了一个台阶。大兴法院的庭审系统也在不断升级,由原来高院建设的6个视音频点位增加到26个。刘建指着桌前的大屏幕说,大兴法院共有26块这样的屏幕,放在了院长、中层领导和审判长的办公室。领导们可随时查看庭审情况,保障了庭审业务的公开透明。在建的新大楼中,也将有一间专业的视频机房。

刘建说: “我们IT部门的工作就是要让信息化渗透到法院系统的每一个毛细血管中、每一个环节中,让每名工作人员从上班到下班都离不开信息化。信息化设备和软件如果建而不用,不与业务磨合,就是浪费。”

刘建认为: “一般的信息中心主管不应该叫CIO,法院系统的信息主管倒有点像CIO。作为法院的CIO应该从法律的产生、当事人诉讼、庭审、上诉、归档、公网利用到最后的信息清除,整个信息流程中考虑问题。他应该从工作中发现、利用、整合和深度挖掘信息,而不只是管理一些信息化设备和系统。CIO要对信息流程明确,思路清晰,可以从各个业务环节中找到信息化与审判业务的契合点。所以,能够真正成为一名优秀的CIO就必须具备业务精通、技术全面、思路清晰、协调能力强这四个方面的能力。”

规范制度

为了推动信息化的规范化,大兴法院将信息化纳入考核内容当中,设立了不少规章制度。像计算机网络和机房的使用、计算机的管理和书记员的信息化工作等,全部纳入到大兴法院的规章制度中。

2009年,大兴法院成立了技术室,包括刘建在内,一共三人。大兴法院IT人员不够,他们率先学习北京高法院的做法,采用信息化服务外包的形式。至此,大兴法院的信息化工作人员增加到15人。

为了管理好团队,刘建制定了《大兴法院信息系统工作管理规程汇编》,包括42大项、80多小项的详细规定,涵盖了信息化运维的所有环节。比较严格的是按照生产型企业标准执行的6S规范(6S指整理、整顿、清扫、清洁、素养和安全)。6S规范具体到垃圾桶怎么摆放,是否在黄线之内; 语言规范到该说什么,不能说什么等。有了这些约束措施,大兴信息化的外包服务团队就有了良好的精神面貌,是一个随时都能拉得出去的IT团队。

曾经有运维团队的工作人员因为说了一句“这个问题我不清楚,还是找我们领导吧。”刘建就按规定对该员工罚款500元。刘建说,罚款不是目的,而是为了规范服务的质量和标准,具备良好形象。当然,这罚款也返还给了运维团队,让他们奖励优秀员工。

在他看来,IT团队重要的是服务、形象和质量保障。“服务”表现在IT团队的响应时间、能否及时解决问题,做到随时随地贴心服务上,并且在服务过程中不能让服务对象对信息化有抵触。“形象”是指IT部门要让法院对其有信心和信任感。如果IT部门不具备一个良好的形象,没有精神和活力,领导又怎么信任并给于支持呢?最后是“质量保障”,这是IT团队的基本功。善于钻研业务应该是IT人员的基本特点,这也是6S严格规范的。

采访手记

成为CIO的奥秘

刘建个头不高,面相和蔼,对人热情。他说,别人经常以为他才20多岁。为什么看起来很小,因为性格很乐观,用他的话说: “自已想成为一个良好氛围和环境的创造者,而不是这个环境的杀手。”

比如说,刘建管理了15名IT人员。但这些员工没有称呼他为“刘主任”而是“刘哥”。自从他把QQ群命名为“大兴运维总署”之后,他们又称呼他为“署长”。刘“署长”也和IT员工一样,在QQ群里聊工作,偶尔八卦一下。

刘建还喜欢写博客,经常在博客中谈工作和周围同事。在采访中,他打开最近的几篇博客解释说,这一篇博客为什么写,出于什么目的; 另外一篇博客又为什么写,目的是什么。

他认为,要和IT团队打成一片,才能让团队有凝聚力。凡事都应身先士卒,不管工作多晚,都要做到自己是最后一个离开的人。加班时也要让大家在一个愉悦的环境中工作。甚至有一段工作不太紧张的时候,有员工说“好久没加班了”,其潜台词就是大兴IT团队有一个良好的工作氛围。并且,每逢员工过生日,刘建和团队总是集体活动,项目内容也是大多数年轻人喜欢的: K歌、聚餐、游玩。

当然,刘建说,团队氛围好,但制定的规章制度也不能违背。如果有违背的,该如何执行又不让员工反感呢?刘建专门去请教老师,学习管理团队方面的知识。他举例说,比如这边刚宣布对某员工处罚几百元钱,那边自己又笑呵呵地对其他员工说: “某人要用处罚的钱请我们吃饭了。”这就是刘建的管理技巧,善于管理而不能适得其反。

从刘建的经历来看,他从商,懂得了商人的心理,了解采购; 他从事法院基层业务三四年,熟悉业务知识; 他和审判人员打成一片,锻炼出协调能力; 他一步步搞起信息化,培养出技术功底; 有了这些综合背景之后,才让刘建做信息化工作游刃有余。

现在刘建又在学习管理,这将会把他带到新的高度。(文/吴玉征)

背景资料

大兴区人民法院为北京市基层人民法院,前身为大兴县人民法庭,建立于1949年5月。大兴法院下设刑事审判庭、民事、行政审判庭、执行庭等12个职能部门,并下设黄村、红星等六个人民法庭。全院现共有在编干警199 人。2009年,全院共受理以及审(执)结各类案件近20万件。

CIO语录:

作为法院的CIO应该从整个信息流程上考虑问题,他应该从工作中发现、利用、整合和深度挖掘信息,而不只是管理一些信息化设备和系统。他要对信息流程明确,思路清晰,可以从各个业务环节中找到信息化与审判业务的契合点。

CIO观点:

“真正成为一名优秀的CIO必须具备业务精通、技术全面、思路清晰、协调能力强这四个方面的能力,并且善于管理IT团队。IT团队最重要的是服务、形象和质量保障。”

征集优秀CIO

数据中心运维管理现状及策略探讨 篇12

1 数据中心运维管理的主要内容

数据中心运维管理的主要内容包含四个部分, 其一是数据中心信息系统的运维管理, 数据中心的信息系统主要包括前置综合系统、综合业务系统、人力资源系统、数据集中统计管理系统、外联系统、资金结算、监管系统等多项数据信息系统以及数据中心的多种计算机网络服务器。其二是数据中心存储管理, 存储管理主要是指有离线、近线、远线组成的三级数据中心存储系统。其三是数据中心机房的网络管理。其四是数据中心网络环境管理, 对数据中心的硬件软件以及机房环境进行管理, 运维对象包括消防系统、入侵监测系统、精密空调、视频监控、环境监控、门禁系统、电力设备系统、机房环境监测等。

数据中心运维管理的主要任务是配置管理、变更管理、故障管理、监控管理以及资源管理。

配置管理主要是指对数据中心的核心系统、核心设备以及机房环境等配置相应的档案库, 提高数据中心的运维管理水平, 充分调动管理人员的工作积极性和主动性。

变更管理主要是指根据数据中心的业务需求和运维管理需求, 对网络配置、存储资源、软件系统、硬件设备、机房环境, 调整业务数据, 升级和更换参数配置。

故障管理主要是指数据中心对相关单位反映的问题和运维管理中出现的问题, 及时进行处理和解决。

监控管理是指对网络系统的运行性能和运行状况、存储系统、信息系统、主机设备、机房环境等进行实时监控, 定期进行巡检和维护, 全面掌握系统运行情况和运行趋势。

资源管理是指对数据中心的网络资源、存储资源、主机资源以及环境资源进行管理规划, 优化资源配置, 根据不同的需求及时调整资源配置, 提高数据中心资源利用率。

2 数据中心运维管理的现状

2.1 信息资源配置滞后

近年来, 我国经济快速发展, 各个领域各个行业都取得了显著的成就, 但目前数据中心的运维管理技术已经不能满足各个行业缩短业务发展周期的需求, 限制了很多企业的创新和发展, 数据中心的信息资源配置滞后, 严重影响了数据中心信息系统的运行, 也给数据中心运维管理带来一定的难度。

2.2 运维管理技术落后

随着各个领域各个行业业务数量和种类的不断增加, 数据中心信息系统越来越复杂, 数据中心信息系统的运维管理难度越来越大, 数据中心运维管理面临着巨大的挑战。近年来, 信息系统的软件和硬件都趋于集成化, 对数据中心运维管理的能力提出了新的要求, 需要不断提高运维管理水平, 满足社会的需求。

2.3 数据中心运维管理水平需要进一步提高

随着计算机网络技术的快速发展, 电子信息技术被广泛应用于各个行业对于数据中心信息系统有着很大的需求, 但是当前我国数据中心的运维管理水平还不足满足各个行业服务要求, 数据中心需要进一步提高运维管理能力和水平。

3 提高数据中心运维管理能力的有效策略

在我国社会主义市场经济的推动下, 给信息化发展带来了很大的挑战, 不断提高数据中心运维管理水平是建设数据中心信息系统的根本要求。

3.1 提高运维管理人员的综合素质

管理人员是数据中心运维管理的关键核心, 只有不断提高运维管理人员的综合素质, 才能不断提升数据中心运维管理的水平。可以通过多种形式, 鼓励管理人员学习更多的运维管理知识, 提高自身的运维操作技能, 充分调动工作人员的积极性和主动性。结合社会发展的需求, 结合相关要求, 开展数据中心运维管理的系统化、专业化培训, 重视网络运维技术的学习, 激励管理人员自主学习和探究数据中心的信息系统建设, 使管理人员充分了解数据中心的运维管理要求, 重视管理人员的能力训练, 熟练掌握基本的系统维护和操作技能。

3.2 加强对业务环境的了解和分析

为了不断提高数据中心运维管理的能力和水平, 必须加强对业务环境的了解和分析, 健全运维管理机制, 提高决策能力。及时了解和研究业务环境, 首先需要找出数据中心信息系统和业务环境之间的关联因素, 深入分析业务环境对信息系统的影响。其次, 仔细分析业务环境的变化内容, 全面调查金融服务内容, 研究业务发展趋势。最后, 正确分析业务环境影响因素, 评估业务环境的风险, 提高数据中心运维管理的水平。

3.3 加强业务管理工作

掌握技术方面和管理方面的业务发展情况, 首先做好对业务内容进行调查, 完成信息收集整理工作, 科学统计收集的数据信息, 结合业务环境的发展趋势和变化, 通过不断地研究和调查, 优化配置企业的人力、物力和财力资源, 降低运行成本, 提高经济效益。

3.4 引进先进的信息科学技术

数据中心要积极引进先进的信息科学技术, 不断提高运维管理水平。做好业务系统与信息系统的结合, 利用先进的管理技术, 不断完善数据中心系统, 构建以客户和服务为中心的运维管理体系, 加强运维管理的技术维护, 制定规范的运维管理制度, 提高数据中心运维管理水平。

4 结束语

随着各个行业企业金融业务数量和种类的越来越多, 当前的数据中心运维管理水平已经不能不能满足社会的发展需求, 因此深入分析和研究当前数据中心运维管理的现状, 积极采取相应措施, 提升数据中心的运维管理能力, 充分发挥运维管理的作用和意义, 推动信息化新发展。

摘要:近年来, 我国的科学技术快速发展, 数据中心也成为各个领域很多行业的核心机构, 但是目前数据中心运维管理水平较低, 不能很好地适应和满足计算机网络技术的发展需求。本文分析了数据中心运维管理的主要内容和数据中心运维管理的现状, 阐述了提高数据中心运维管理能力的有效策略。

关键词:数据中心,运维管理,现状,策略

参考文献

[1]韦琛江, 谷和启.浅析企业级数据中心运维管理[J].信息系统工程, 2013, 08:66-67.

[2]冯海军.浅析数据中心的运维管理现状及对策[J].中国新通信, 2013, 21:55.

上一篇:铁路信息工程设计下一篇:几何算法