容灾中心

2024-05-11

容灾中心(精选11篇)

容灾中心 篇1

1 引言

随着医院信息化建设的深入,医院信息系统的数据安全成为各医院网管人员最关心的问题。医院信息系统经过多年运行,业务数据大量积累,尤其是图像传输与归档系统(PACS)的持续运行,数据量呈爆炸式增长,这会让一些准备不充分的医院信息部门面对海量数据束手无策,一味地增加存储容量或是靠手工备份与恢复成为信息管理者和数据库管理员的噩梦,而医院信息系统需要每周24 h×7不间断运行,任何安全问题都可能是致命的[1]。那么如何设计数据中心架构,如何构建容灾中心就成为医院信息安全管理工作的重中之重,下文即以我院数据中心成功搭建容灾架构的应用案例来阐述以上问题。

2 数据中心及容灾中心的架构设计

2.1 架构示意图(见图1)

2.2 服务器架构

生产服务器群:由IBM PC服务器若干台组成,医院信息系统(简称HIS)服务器由Oracle 10g R2 RAC模式构成双机系统,实现了数据库应用负载均衡[2],其他系统的服务器双机模式可根据应用性质不同,采用不同的双机模式。应用服务器或数据库服务器双机运行方式主要解决单台服务器硬件故障问题。实践证明,可实现负载均衡的双机架构是最佳的双机模式[3,4]。

容灾服务器群:容灾服务器一般不需要双机运行,但如果生产端采用了Oracle-RAC负载均衡模式,容灾服务器也需要设置RAC模式运行,而如果生产端服务器采用传统的双机模式时,例如双机热备模式,则只需要一台容灾服务器即可达到容灾效果。容灾服务器可以配置较大的内存,在操作系统和应用服务不冲突的情况下每台服务器可挂载多个生产系统以节约成本。本例中所有PC服务器配置2~4颗四核CPU,16~32 GB内存。服务器使用的数据库及相关业务数据(图像、病案文档等)均存放在存储阵列相应的区域,并通过光纤交换机(冗余、SAN架构)与存储设备连接。

2.3 存储架构

生产端存储(或称主存储),一般采用性能较佳、存储容量适中的存储设备。本例采用的是EMC CX4-480存储,8 TB裸容量。对于一个1 000~3 000张床位的医院来说,该档次的存储无论速度、稳定性、带宽或是容量,均可满足全院的满负荷应用,并可在线存储3~6个月业务数据。多个应用系统服务器分别访问主存储预先划分好的区域。容灾存储可采用性能稍低于主存储的存储设备以节约容灾成本,本例采用EMC CX4-120存储,容量和配置方式与主存储相同。主存储和容灾存储之间通过光纤网络实现数据同步镜像复制。主存储端若出现严重的硬件故障或生产中心发生灾难性事故,容灾存储中可完整保留所有数据。归档存储,过期历史数据无疑是医院信息系统中数据量最大的部分,这部分数据的存储方式多种多样,常见的是在线的光盘塔、磁带库、廉价存储阵列,以及离线的光盘和磁带等方式,这些方式要么安全性较差,要么在线访问存在严重的时间延迟或空间障碍[5],近年来,存储系统的归档模式开始应用并有全面替代传统归档方式的势头,本系统架构中采用了业界顶级的EMC-Centera归档存储,数据安全性及在线访问性能得到了全面的保证,并更好地诠释了病历档案的法规遵从理念。

2.4 应用容灾

以上架构搭建完成之后,最重要的一步是实现应用容灾,本例中利用廉价的PC服务器在容灾存储上实现类似生产中心的配置和连接方式,将数据库服务及文件型应用服务按实际应用环境需求进行安装,并使之处于待用状态,一旦生产端硬件系统局部或完全瘫痪,可根据需要部分或全部激活相关的容灾服务器及容灾存储上的数据及数据库,为客户端提供应用服务,确保各类信息应用的可持续性。切换方式建议手工切换,切换前需确认生产中心部分或全部相关硬件彻底瘫痪,短期无法恢复时方可切换。以上方法实现应用容灾需要进行统筹考虑,兼顾操作系统的兼容性,数据库版本的一致性以及生产服务器端双机模式的组建方式,以更小的成本实现多个生产系统的应用容灾,为医院提供更全面的信息安全保障。我们在建设中发现,如果生产系统采用了Oracle-RAC模式,则在容灾服务器端也必须采用同一版本下的RAC模式,但一般医院通常采用的服务器主备模式、双机热备或基于操作系统的负载均衡模式则在容灾中心配备容灾服务器时只需要单台类似环境的PC服务器即可实现相应系统的容灾切换。针对不同应用(如HIS、LIS、PACS、PIS、PASS等系统)都需要在存储中设立不同的逻辑区域以方便实现单一系统的容灾切换。实际操作中,一般要提前进行容灾整体切换及单一系统切换的模拟演练,需要多次成功切换并记录详细步骤,以备应急使用。

2.5 实时应用容灾

近年来,由于数据库技术的发展,出现了实时应用容灾,这种容灾方式由于技术壁垒较高,目前只有甲骨文公司技术比较成熟,例如中国海关总署采用了Oracle Goden Gate TDM系统实现了北京、广州数据库服务、数据备份双中心的模式,定期切换中心(2 000 km的距离,达到数据一致并切换成功只需要3 min),互为备份,为维护硬件和灾难恢复带来了极大的便利,低成本地提高了安全性的同时,实现了持续运行、停机不停服务的高效运转。更为典型的运行模式是实现双生产中心即双活(Active-to-Active),利用上述数据库功能模块还可实现生产中心和灾备中心同时运行,互为备份,2个中心的数据库之间还可以实现负载均衡,不仅保障了数据和应用安全还解决了异地双生产中心的工作负载,极大地提高了应用的可持续。由于属于较新的技术,我们暂时还没有采用这种模式,但实时应用容灾是数据应用安全的最高级别保障模式,也是下一步努力的方向,以上介绍的容灾架构只要再搭载Oracle Goden Gate TDM软件应用,在灾备存储上增加一个数据库区域划分,即可在数据库层面逐一实现实时应用容灾,实现“双活”,不必再为切换问题、恢复问题、停机维护问题所困扰,该方案目前正在进行设计,以探索在医院信息环境中的实际应用,并追求最高的性价比。

2.6 容灾机制

通过以上基本架构的实施,安全方面既实现了数据级(镜像存储)容灾,又基本实现了应用容灾。如图1所示,容灾中心在异地搭建,主要由容灾服务器及容灾存储构成。数据中心属于医院的生产中心,主存储中所有业务数据通过光缆,实时镜像复制到容灾存储,一旦发生灾难性事故,数据传输中断,远在异地的容灾中心即可考虑随时启用,容灾中心服务器预装了所有的应用服务、数据库服务功能,并与容灾存储保持连接,通过激活容灾服务器各项服务功能,修改相应网络配置,即可实现容灾的完整切换,及时挂载所有生产数据,保障医院各项业务不间断运行。为防止不必要的切换,以上切换过程需要在决策人员决定放弃原数据中心的抢修情况下指示系统管理员手工进行切换,才可按需启用容灾系统。待发生故障的数据中心完全恢复后,需要一系列切换动作恢复原有架构的运行模式。

2.7 历史数据归档与数据备份

数据中心与容灾中心设计无法回避历史数据归档与过期数据备份问题,尤其是医院PACS历史数据量十分庞大,实现低成本的应用容灾可以先不考虑过期历史数据问题,但主存储的数据库文件及近线数据(主存储中在线、近线数据保持3个月以上)一定要实时镜像复制到容灾存储中,切换到应用容灾系统后,一般需要3个月的完整历史数据即可保障医院各项业务不间断运行,在数据中心完全恢复之前可根据恢复时间长短决定是否启用历史数据归档存储设备(见图1)与容灾服务器的连接模式,以确保容灾中心独立工作情况下,能够使用长期历史数据。日常数据管理中,长期历史数据有各种备份模式,特别重要的是离线备份模式,主要是确保几十年的数据要有妥善的保存方案,碰到严重灾害时,这些历史数据还需要逐年恢复。另外,数据备份系统也要考虑容灾切换问题,确保容灾存储和容灾服务器启用后,可按容灾中心启用后的数据备份计划进行备份。

3 讨论

医院信息系统的容灾主要是2个级别的容灾:一是数据级容灾,以保全数据为主要追求目标;二是应用级容灾,以不间断运行为主要追求目标。

一般从成本角度考虑,数据级容灾成本低,容易实现,数据的安全性有保障,如果灾难发生导致的瘫痪时间不长、故障容易修复则对业务工作影响不大;缺点是医院相关生产业务将可能短期内完全或大面积瘫痪,无法进行业务处理,必须等待数据中心灾难修复完成后方可继续运行。

应用级容灾则需要较大的投入、更为严密的设计,技术要求比较高。需要配备更完整的硬件冗余环境,且软件的配置方面也有更严格的要求[6],设计时需要从服务器的各类应用服务、多套数据库服务、网络架构设计、容灾切换机制、完整恢复机制等多个方面加以考虑以确保出现故障时容灾系统能够不间断的自动或手动完成切换,并努力实现多中心负载均衡的系统运行方式,从而使客户端处理业务时几乎感觉不到后台自动切换过程或故障造成的业务停顿。

本文介绍的实施方案,实际上处于2个级别之间,该方案在实现难度和成本控制方面有较大的优势,成本方面主要在原数据级容灾方案的基础上增加数台容灾专用PC服务器。本架构与理想化的应用级容灾架构所不同的是,切换到容灾系统需要提前准备,现场作出决策,尽量手工切换。出现灾难性事故时,从决定切换到完成至少需要0.5 h。该容灾系统必须配备完整的应急预案来施行容灾切换。正常运行状态下,各容灾服务器则处于备用状态,不能轻易激活其数据库应用。因此,其局限性和使用方法需要认真考量,确保应用安全。

4 结论

医院业务要求一周24 h×7不间断运行,并且年度无故障运行时间不低于99.5%,患者的电子病历档案必须实现异地容灾防止丢失,要想持续多年达到这样的要求,必须有完善的备份机制和容灾机制[7],除了传统的备份手段和数据保护机制,应该尽一切可能早日实现应用级容灾,确保医院信息系统稳定顺畅运行,为医院带来切实的社会效益和经济效益,也最终保障了患者的救治工作不再因信息系统意外中断而受到影响。

参考文献

[1]徐兴勇,左儒发.医院信息系统的数据安全与实时备份[J].重庆医学,2009,38(21):2 664-2 665.

[2]姜文,胡顺福.实现医院信息系统高可用性设计[J].中国医疗器械杂志,2008,32(1):62-63,67.

[3]李力,王虹.国内外网络安全问题现状及相关建议[J].医疗卫生装备,2009,30(5):108-109.

[4]翁盛鑫,程少平,黄影.“军卫一号”HIS的高可靠性体系结构设计与比较[J].医疗卫生装备,2009,30(1):53-54.

[5]杨栋,苏小刚.电子病历归档系统研究[J].医疗卫生装备,2009,30(1):44-46.

[6]赵锦.医院信息系统的安全防范[J].医疗卫生装备,2009,30(3):57,85.

[7]陈晓苏,林植.肖道举基于策略的网络安全防护系统框架研究[J].计算机工程与科学,2007,29(6):7-9.

容灾中心 篇2

一、项目背景

随着计算机技术的快速发展,每个企业都在大量的使用计算机处理自己的核心数据,这些数据往往是企业生产经营必不可少的部分。依赖这些数据的计算机系统的停机往往会造成企业生产经营活动的停顿,给企业造成巨大的损失。所以,可以说,这些数据是企业的生命核心。企业的IT管理员为了保证生产经营活动的持续运行,不断的加强对系统和数据的保护,如使用基于双机的高可用技术,磁盘阵列系统的RAID技术等。然而,人们依然无法回避由于磁盘故障,人为失误,应用程序的逻辑错误,自然灾害等原因带来的系统停机或者数据丢失。所以,数据备份作为数据保护的最后一道屏障,必不可少。

二、功能介绍

实时保护:连续捕获、实时备份数据变化,全过程保护数据安全。实现真正的持续性数据保护(CDP),无需设置任何备份时间点,居国内外同类产品领先地位。

完善备份:同一软件可实现“数据库双机热备+接管”、“本地实时灾备”、“异地实时灾备”,全方位保证数据库安全。

任意回退:可按任意操作步数或时间点进行数据回退。主数据库遭到破坏时,备份数据库可将主数据库回退到损坏前最后时刻的状态,且能保证事件的完整性。快速恢复:主数据库或表损坏,从站自动检测,提示回退的步数。恢复1个G数据库在3-5分钟。

增量备份:只备份变化部分,在保障备份数据安全的同时减少备份的工作量。

错峰机制: 在系统负荷极大时暂停备份以免系统瘫痪,当系统负荷下降时备份暂停期间的数据,并重新开始实时备份。

低耗资源:对主数据库压力小,系统采用消息机制,只有灾数据库发生变化时才触发,只传数据库的变化部分,不同于文件拷贝,和数据表的轮询。

操作简单:自主开发设计,着重考虑国内用户使用习惯,安装、设置非常简单。

维护方便:启动或连接中断后重连时,自动校验主从站数据,保证数据准确。

加密传输:底层通讯采用自主研发的通讯平台,所有数据都是用加密数据包进行数据交换,充分保证数据安全。

高性价比:在各项性能领先的同时,价格远远优于国外软件。当选择不接管的热容灾备份方式时,从站可采用低档Server或高稳定性的PC(有足够的存储空间即 2

可),从而实现极低的总体成本。

通用性好:不对数据库中的应用做任何修改。与数据库中表的结构无关,且无任何限制。对数据库备份完整:如TABLES(表)、DIAGRAMS(关系图)、VIEWS(视图)、USERS(用户)、ROLES、RULES等。

三、解决方案优点

能够实现双数据库的实时同步,能够保证双份数据库的实时一致性,如果主生产数据库失败,备数据库库服务器随时可启用为主数据库服务器。不再需要介质恢复的过程。

多节点存储冗余体系

热备方案要求最少有双份数据库,不但心生产数据库崩溃,磁盘硬件崩溃,而造成数据库不可用问题.多份数据源才是真正的冗余体系,真正消除了数据库系统管理人员为存储单点故障的后顾之忧!不存在物理介质恢复时间问题

因为双数据库的实时同步,保证双份数据库的一致性,如果主生产数据库失败,备数据库库服务器随时可启用为主数据库服务器.不存在介质恢复时间.这与双机热备比较,完全消除掉备份恢复这一个过程。

同步时间完全实时

主数据库与从数据库可以做到实时同步,消除了备份软件中的间隔备份丢失数问题.同时提供了完全不丢失数据模式和丢失秒内业务数据校正方式。

解决了数据误删除恢复问题

与HA,CDP软件比较,当数据库管理人员遇到意外误删除求助,热备系统可以提供事务级别的按步数或者时间点的回退动作,确定记录,恢复记录.不需要像传统备份软件为了一个记录而恢复整个数据库。

数据库异地容灾问题

完全支持异地数据同步,支持断点续传,数据一致性校验。

四、解决方案

(一)1、备份方案

(一)示意图:容灾标准版(一主一从)

备份方案:

说明:

1:在1号Server系统中安装,设置成主站。2:在2号Server上安装,设置成从站

3:正常运行后,2号Server能够实时备份1号Serve中的数据库的数据 4:在1号Server宕机的情况下,2号Serve能接管主服务器的IP和机器名,对外提供所有的服务,保证业务不间断

5:当1号Server修复后,能快速将2号Server上数据恢复到1号Server中。

能实现的效果及主要功能:

1)将主服务器上的数据实时智能的备份到从站备份服务器里

2)如果数据库遭到病毒破坏或者误删除可用数据回退进行解决;回复的任意时间点的数据

3)主站宕机或者磁盘柜损坏,备份服务器可接管主站服务器对外服务,保证客户端的正常运行

2、备份方案

(二)示意图:容灾(一主两从)版本

S2备份服务器S1主数据库服务器 终端 S3备份服务器办公楼 XX楼

说明:

1)2)3)4)主站服务器(S1)安装标准版软件设置成主站;

从站备份服务器(S2)安装标准版软件设置成从站1,作为备份服务器1; 从站备份服务器(S3)安装M标准版软件设置成从站2,作为备份服务器2; 正常运行后,从S1能够同时实时备份主站或磁盘柜中的数据库数据到S2、S3;

能实现的效果及主要功能: 5)在S1或磁盘柜损坏的情况下,S2能接管S1对外提供服务,保证客户端的正常运行,当S2亦出现意外事故时,S3能接管S2对外提供服务,保证客户端的正常运行;

6)当主机房损坏设备完全修复后,能快速将S2或者S3上数据恢复到S1存储中。3)将数据中心的SQL数据库中的数据实时的备份到从站服务器中; 4)如果数据库遭到病毒破坏或者误删除可用数据回退进行解决; 5)如果主站宕机或者磁盘柜损坏,备份服务器可接管主站服务器对外服务,保证客户端的正常运行。

3.方案

(三)方案示意图:集群版(两主一丛)

针对双机磁盘柜的异地容灾:

主数据服务器双机环境 磁盘柜 终端 双机 集群 备份服务器1号2号 实时备份 数据回退 接管 异地容灾 3号server

说明:

1、在1、2号server组成的集群系统中安装 FOR CLUSTER版设置成主站;

2、在3号server上安装 FOR CLUSTER版设置成从站;

3、正常运行后,3号server能够实时备份集群磁盘柜中的数据库数据;

4、在集群中的1、2号机器同时宕机或磁盘柜损坏的情况下,3号server能接管集群对外提供服务,保证客户端的正常运行;

5、当主数据服务器被损坏设备修复后,能快速将3号server上数据恢复到集群存储中。

能实现的效果及主要功能:

1)避免了双机集群的磁盘柜的单点故障,有双份数据安全。2)数据库遭到病毒破坏或者误删除可用数据回退进行解决;

3)主站同时或者磁盘柜损坏,备份服务器可接管主站服务器对外服务,保证客户端的正常运行。

4.方案

(四)方案示意图:集中备份(多对一)

数据服务器 业务数据 办公server备份中心 办公数据 业务server1号2号财务server实时热备接管回退管理server异地备份集中备份XX server 管理数据 3号X号 XX数据

说明:

1、在各个主数据服务器系统中安装,设置成主站;

2、在备份中心的备份服务器上安装,设置成从站;

3、正常运行后,备份中心能实时备份数据服务器的数据库数据;

4.任一主服务器的数据丢失后,都可以从备份服务器迅速的给主服务器恢复数据。

能实现的效果及主要功能:

1.可以把各个业务服务器数据库的数据实时智能的备份到数据中心的服务器里,当任何一个主业务服务器的数据丢失时,都可以从数据中心的服务器里进行快速的恢复。

5.方案

(五)方案示意图:集中备份(本地做一对一,异地做多对一)

说明:

1:在各主服务器SERVER 1-N中安装设置成主站,在SERVER1’ –SERVERN’中安装设置从站,主从站通过数据库保镖进行实时备份,当本SERVER 1-N出现问题后,对应的SERVER1’ –SERVERN’可以进行接管或恢复。

2:SERVER作为集中备份服务器,将SERVER 1-N中的数据实时集中备份到SERVER内,即使本地数据丢失,也可以从数据中心取回。

能实现的效果及主要功能:

1.可以实现本地的数据实时备份和接管,当主服务器出现宕机时,可以迅速的用备份服务器接管主机提供对外的服务,保证业务不间断。

2.当主服务器本地出现意外灾难,数据全部丢失后,可以通过远程的中心服务器恢复数据,保证了数据的安全。

五、容灾容灾备份系统能实现的效果和功能

1.能实现对主服务器上的数据库里的数据进行实时智能的备份,保证了数据的安全,一旦出现数据丢失或破坏,可以迅速的从备份机上把数据恢复回来。第一次做个全备份,把数据全部备份到备份机上,以后每次只做增量备份,把变化的数据做实时的备份,节省了备份空间,提高了备份效率。在备份时对服务器的性能没有影响。

2.当主服务器出现意外宕机时,备份机可以立刻接管主服务器的IP,提供对外的所有服务,保证了核心业务连续性,可以提供365天7*24小时的业务不间断的保护。

3.整个备份系统具有高容灾性和可扩展性,以后随着数据量的增加也可以增加磁盘阵列等。

容灾的前世今生 篇3

欲用其妙必先知其道

亚里士多德有言,“If you would understand anything, observe its beginning and its development.”意即:如果你想明白一件事情的话,就要观察他的开始和以及他的发展过程。正如国语有言,“欲用其妙,必先知其道”。

所以,对于纠结于各种容灾定义的大家来说,首先需要做的应该是追本溯源地了解一下到底什么是容灾,有怎样的一个发展过程,在这个发展过程中又有哪些经久不变的追求,接下来就让我们一起来梳理一下容灾的前世今生。

什么是容灾

面对应接不暇的容灾介绍和定义,其实用户真正关心的只有两点:首先,是否可以保证数据不丢失;其次,是否可以保证应用不间断。在我们的IT应用中,也接触到一些可能是解决这些问题的应用,比如双机高可用方案就是解决应用不间断的问题。但真正意义上的容灾,必须具备同时保证数据不丢失和应用不间断的能力,这也是容灾的最基本的目标。

在这里很容易出现另一个困惑,一提到容灾,就会提到备份、快照、镜像、CDP和双机等等名词,它们跟容灾有怎样的关系呢?或者它们是不是就是容灾呢?

备份的主要实现方式是将数据从原位置移到目标端,形成可任意恢复的时间点。一切不以恢复为目的的备份都是耍流氓,所以,备份仅仅是用来保证数据不丢失的一种技术手段,让用户在关键时刻能够拥有可以恢复的数据,并不是一种应用。另外,像快照也是在原介质上根据某一时间创建一个照片,镜像则是建立实时的对等的版本,以保证意外情况下的数据可恢复性。对于应用来说,大家可能认为双机是可以保证应用不间断的,但是双机有一个非常明显的缺陷,就是不能保证数据不丢失,因此它仅仅是一个高可用的方案,并不能作为普及容灾的一种通用型方案。

所以,无论是备份也好,快照也好,CDP也好,双机等等,他们都是容灾的一部分,属于容灾的范畴,是实现容灾的技术手段,因为它们只能解决一部分问题,真正的能做到普及容灾的方案应该是一套完整的方案。

那么,到底什么是容灾呢?

容灾严格来说主要包含三个部分,分别为数据容灾、应用容灾和业务容灾。但是对于我们用户来说,绝大部分只需要关注两个部分,第一部分是数据容灾,第二部分是应用容灾,并且分别包括本地和异地的部署方式。其中数据容灾解决的是数据不丢失的问题,而应用容灾解决的是数据不丢失以及应用不间断的问题。

容灾的前世今生

只要有计算机技术,只要有数据,只要考虑数据安全问题,容灾就是不可避免的话题,在五六十年代就已经凸现原型的容灾,在这几十年来,又是如何诞生并发展起来的呢?

纵观容灾的整个发展过程,就会发现,从最初发展到最近的90年代,当备份方案使用不起身价高昂的磁盘备份介质时,均是以磁带备份为主,那要做异地容灾该如何办?惟有采取异地磁带托管的方式。所以,也随之出现了磁带托管业务的繁荣局面。在中高端的存储磁盘阵列出来后,逐步出现了通过磁盘镜像技术实现实时复制效果的方案,但因为成本过高,应用范围非常有限。因而在90年代,备份技术一成不变,一直波澜不惊的以磁带备份为主。

到了00年代,备份还是以磁带为主,但在这时发现磁带在性能和管理方面的瓶颈越来越明显,所以为了突出更强劲的性能、更好的管理等,磁带库技术应运而生,并且逐渐成为主流,但是因为磁带介质本身无法避免的一些硬伤,比如它在备份过程中管理的复杂性,而最主要的是磁带介质数据长期保存的可靠性不高,90年代的一个调查数据表明,47%的磁带备份数据的无法恢复,这就是磁带介质最大的硬伤。

一切不以恢复为目的的备份都是耍流氓,如果备份的数据无法恢复,那备份的意义就不复存在。所以基于磁带备份这样一种遗憾,00年代诞生了一种非常重要的技术——SATA磁盘技术。SATA 磁盘技术的诞生不仅仅意味着性能的提高,更意味着容量的提高,意即单位GB的成本越来越低了。有了这样一种新的应用,就有人开始思考,如何用磁盘替代磁带,但是因为主流的备份软件都是以磁带为核心的,并不支持磁盘,所以这是一个各路英雄都感到棘手的问题。

乱世出英雄,IBM在03年时基于这样的应用需求,发明了一种新的技术 ——VTL虚拟磁带库,旨在把磁盘当做磁带用的同时,还可用好用户环境现有的备份软件。VTL的横空出世虽然没有对备份方案做出实质性的改变,但却做了一个非常好的铺垫,就是开始把磁盘应用于备份方案,这是容灾非常重要的一个转折点。

磁盘一旦用于备份,即刻显著拉动磁盘的需求,磁盘成本逐渐下降,而随着广泛的应用,磁盘技术的革新得到进一步优化。随着磁盘的异军突起,就会发现在备份领域,磁盘介质有一个很重要的特性在虚拟带库里面是没有应用起来的——磁盘的随机访问特性,因为磁带不是随机访问的,所以虚拟带库将磁盘虚拟成带库后,就牺牲了磁盘这个最大的特性,所以,VTL的技术特性绝大部分仍然跟磁带一致,唯一改变的就是用了一个更可靠的介质。

需求催生应用,这个时候,业界就开始思考如何更好的使用磁盘。

在应用磁盘备份的过程中,第一个阶段就有一个非常重大的技术突破出来,那就是CDP技术。前面提到,容灾首先要解决的问题是数据不丢失,而无论是磁带备份,还是虚拟磁带库,都有一个很大的硬伤,即数据丢失量大。因为它们不能实现随机写,所以它在做数据布局的时候,不能实时的不停的写和更改,这也就意味着它一定存在一个备份窗口,也就是说数据不可能不丢失。所以当应用磁盘备份后,首先要解决的问题便是备份窗口带来的数据丢失,解决这个问题的技术就是CDP持续数据保护技术。然后又相应地出现了解决应用不间断的高可用技术。

但是,我们会发现,CDP和高可用技术是分开的,即备份是备份,双机是双机。因而,业界会普遍面临一个问题 ——一套系统里,要么解决了数据不丢失的问题,要么解决了应用不间断的问题,没有合二为一的方案。但用户的需求实实在在的摆在那里,容灾一定要上,因为不只是数据不丢失的需求,还要保证应用不间断。

所以,到了现在,慢慢出现了一种新的主流技术——一体化容灾,将如CDP、Realtime、Deduplication等技术合在一起,如赛门铁克的NBU,EMC的BSR部门,爱数的爱数备份容灾家族产品系列,目的都是一个,就是突出一体化容灾,这也是目前乃至未来容灾方案发展的趋势。

性能与管理30年来一直不变的追求

从上面的分析我们可以看出,容灾的整个发展过程,基本上是非常鉴定地围绕两个目标在追求——第一个就是更好的性能,第二个就是更好的管理。而且这两个目标也是用户在选择容灾的时候,需要考虑的两个指标。

在性能方面,从磁带到磁带库,到CDP,再到应用容灾,都是为了实现更小的RPO和RTO。

在管理方面,最开始的80、90年代,用户只需针对单个系统做备份即可,所以备份软件的鼻祖都是从UNIX发家的。但随着服务器和应用的增多,就会逐渐变成以Master Server和Media Server为架构的备份系统,于是,大家需要通过购买服务器(Sever)、操作系统(OS)备份软件(Backup Software),甚至加上存储硬件(Storage)来完成一套完整方案的部署,这也就是4S方案,一定要这样做吗?其实,现在已经有很多很好的技术可以突破这个传统的4S方案了。在08年的时候,市场上以爱数为首出现了一套新技术——一体化备份系统,意即将传统4S方案的步骤一步到位,集成化的实现,将管理的复杂度降至最低。而现在,几乎所有的备份厂家都已经开始推一体化的备份系统,包括赛门铁克、EMC等等。

前面提到,备份只是容灾的一部分,因为它只是一种技术实现手段,并不能覆盖所有的技术方案。但容灾要解决的是两个问题,一个是数据不丢失,一个是应用不间断。一体化备份解决了数据不丢失的问题后,另一个问题的出路又在哪里?很明显,就是既能保证数据不丢失又能保证应用不间断的真正的容灾——一体化容灾。

一体化容灾的出现就是极限吗?在管理上解决了所有问题吗?

这里我们就会发现,它还有一个漏洞,一套容灾系统它只是解决容灾需要解决的性能问题,但并没有将容灾整体的管理起来,这也就脱离了它真正的核心——为了实现企业经营目标而用容灾。所以,随着一体化容灾的出现,接下来会有一个更主流的容灾管理模型出来,那就是基于法规遵从的一体化容灾,能够将企业管理的价值目标和容灾管理的技术目标有效结合起来,有效推动容灾最广泛的普及。

容灾,可以仰望,不可企及?

容灾中心 篇4

随着国家电网公司信息化建设“SG186工程”的推进,信息管理体系在企业生产、经营、管理等方面体现出越来越深的影响力。为了维护企业IT信息系统的健康稳定发展,建设容灾系统是保障公司业务可持续性发展行之有效的方法。

1 建设容灾系统的必要性

1)国家电网公司有着广阔的经营范围,外界环境状况错综复杂,容灾系统的建设可以有效防范风险、减少损失,提高业务连续性和可用性,增强信息管理系统应对各种变化的能力

2)容灾系统建设是国家电网公司全面风险管理体系的重要基石。由于信息系统发生灾难的损失不可估量,因此建设容灾系统可以提升对国家电网公司信息系统保障能力。

3)当国家电网公司所属单位的信息系统面临大规模灾难或不可预料的意外事件时,容灾中心仍然可以持续性地对国家、社会和内部用户提供所需要的服务,履行所承担的国家职能,降低和规避日常运营的风险,因此容灾系统的建设对于国家电网公司是非常重要和必要的。

4)建立容灾系统是企业保持业务连续运作和长期可持续发展的需要;是企业加强风险管理,提高市场竞争力的重要手段;是行业监管的需要,是保证国家安全、人民利益、社会稳定和经济发展的需要。

2 容灾系统的建设目标

容灾系统建设的总体目标是:建设世界先进、国际一流的集中式信息系统容灾中心,确保在发生灾难时,企业关键数据能得到完整保护,信息系统可以快速恢复,保证公司业务的连续运行。

为满足国家电网公司业务集约化发展的需要,结合国内外数据中心的建设经验,按照容灾系统建设的“统一规划、同步建设”原则,在北京、上海、西安分别建设集中式数据级和应用级容灾中心,国家电网公司各省市单位按就近原则接入共享。分别通过这3个中心,实现数据级容灾和应用级容灾,并在未来发展到全公司集中式数据中心级容灾。

3 容灾中心基础设施的建设需求

容灾中心基础设施的建设需求如表1所示。

4 容灾中心的战略定位

国家电网公司未来3个容灾中心(北京、上海、西安)的发展将分为数据级容灾阶段、应用级容灾阶段和数据中心阶段3个阶段。

各阶段容灾机制对数据中心的要求各不相同。数据级容灾对设备的要求最低,主要包括磁介质的在线或离线存储,其目标是实现数据级别的保护;应用级容灾要求服务器的应用系统冗余运行,其目标是实现应用级别的保护;数据中心级容灾要求建立在线共享的服务器及存储,多个数据中心同时在线冗余运行,其目标是集中数据。

容灾中心发展的3个阶段的架构描述如表2所示。

在这3个阶段中,各数据中心在基础架构方面所要实现的阶段性工作目标具体如下。

1)在数据级容灾阶段。容灾中心建立统一的存储平台,实现“一备多”的数据保护。企业级存储设备采用存储级容灾技术,实现“1备4”模式;部分中低端存储设备采用虚拟化级容灾技术,实现“1备3”模式;所有应用系统同时采用远程备份复制技术进行远程数据备份(如磁带备份)。容灾中心配置管理及数据验证服务器。

2)应用级容灾阶段。容灾中心延用数据级容灾阶段数据复制方案,并且根据生产环境配置服务器及配套软件,实现应用的切换。

3)数据中心阶段。容灾中心建立集中式数据存储平台并实现3个容灾中心之间的数据同步,并建立集中式共享的应用计算平台。

5 上海容灾中心建设的应对策略

上海容灾中心作为国家电网公司3个容灾中心之一,在未来国家电网信息系统发展、演变的3个阶段中,都将起到至关重要的作用。

在上海容灾中心的建设需求中,不仅要满足当前数据级容灾的要求,还要考虑满足在未来演变成集团应用数据中心的要求,在建设理念、基础设施、网络架构、安全运行维护等方面都要具有前瞻性、先进性。为此,在项目建设初期就确立了以下应对策略。

5.1 确定项目建设理念

数据中心基础设施建设(Infrastructure)是多种工程技术与管理技术相结合的系统工程,随着相关的研究开发、规范标准、系统结构、功能应用、产品特性、材料工艺以及管理要求等诸多方面的衍变与发展,涉及数据中心基础设施建设的技术演变与发展趋势呈现多维多态特性,由此形成了新一代数据中心基础设施“安全、高效、绿色”的建设理念。

在建设过程中,严格遵守GB50174—2008《电子信息系统机房设计规范》国家A级机房建设规范。同时,引用国际TIA942 Tier-4标准和ISO 27001的要求来指导建设工作,使整个项目既符合国家的标准和规范(确保故障容错,提供99.995%以上的可用性),又能顺应国际先进的数据中心建设理念。

5.2 控制总体拥有成本

容灾中心基础设施建设的总体成本(TCO)指从建设期到运营期的总体成本,包括设施建设成本,设备系统成本,软件系统成本,维修维护成本,日常运营成本,人力资源成本。

现在国内外数据中心基础设施建设中的日常运营成本(主要是能耗成本)占总体成本的比例逐年上升,因此必须重新审视数据中心基础设施建设的先期设计的合理性与适用性,即关注与考虑如何在建设期和运营期,降低数据中心基础设施建设的总体成本,以提高基础设施的整体经济效用比。

5.3 注重运行安全节能

容灾中心基础设施建设涉及到设备环境与人为环境的双重安全问题,必须有效地避免和抑制自然灾害、设备故障、系统错误以及人为有意和无意的破坏和过失。上海容灾中心采用主动防御和综合防范的手段,以及管理与技术并重的措施,可有效地确保数据中心的数据信息数据处理系统网络系统、基础设施的整体安全。

建筑节能、系统合理、绿色照明等原则是国家十一五计划所明确的重点节能要求。容灾中心的建筑结构和护围会影响数据机房传热和风导,直接和间接地损耗着能源;机房设备(IT设备、空调、照明)的长期连续运行,消耗着大量的能源。因此,在相关建设中采用了大量节能措施,诸如:机房维护结构保温、楼宇设备自动监控系统、智能照明控制系统、冷水机组变频控制、有源滤波技术、机房冷池技术等。

6 结语

面对近年来自然灾害频发的新形势,国家电网公司建设集中式信息系统容灾中心是确保国家电网公司一体化企业级信息系统安全、可靠、稳定运行的重要保障,也是国家电网公司信息系统建设迈上新台阶的基础设施保障。

国家电网公司上海容灾中心的建设,在确定安全、高效、绿色理念的基础上,全面开展容灾中心建设及应用级容灾关键技术的研究工作,努力体现控制建设总体成本,注重运行的安全节能,以符合国家电网公司对容灾中心的要求。

摘要:建设集中式信息系统容灾中心是确保国家电网公司信息系统安全、可靠、稳定运行的重要保障。分析了建设容灾中心的必要性和建设目标,介绍了容灾中心的基础设施的建设要求以及战略定位。最后讨论了国家电网公司上海容灾中心建设的应对策略。

关键词:容灾中心,信息系统,数据中心

参考文献

建立企业容灾备份机制 篇5

【摘 要】数据库的备份是一个长期的过程,而恢复只在发生事故后进行,恢复程度的好坏很大程度上依赖于备份的情况。随着办公自动化和电子商务的飞速发展,国内越来越多的企业已经意识到存储信息的重要性,正处于从数据分散存储向集中存储转变的过程,开始投资搭建存储系统,但许多企业还没有意识到容灾备份是信息存储的一个重要环节。本文从容灾备份的概念、必要性、预先考虑的因素、容灾备份等级、容灾方案的选择等几方面论述了如何建立企业容灾备份机制。

【关键词】企业 容灾 备份

【中图分类号】TM732【文献标识码】A【文章编号】1672-5158(2013)02-0409-02

数据备份,实际上就是给企业重要的数据买保险。当你了解到国内各大数据恢复公司每天都会应对使用者捧来的一大堆需要急救的硬盘,了解到企业工厂数万元用以专业数据备份设备的投入,了解到美国关于9.11后90%公司在发生灾难性数据丢失后在两年内倒闭的报告,你就会知道企业数据容灾有多么的重要了。

一、容灾备份的概念

广义上讲,灾难恢复计划的实施包括日常维护、灾难恢复、恢复后三个阶段。在日常工作中,日事业单位要按照计划和分工,认真及时地开展系统维护与相关记录工作,包括硬件巡检、数据备份、为软件打补丁、病毒查杀、资料收集与管理,等等。对出现故障的如硬件,要及时修复。对关键设备,要规划、装备必要的冗余设备,以备不时只需。

容灾备份是通过特定的容灾机制,在各种灾难损害发生后,仍然能够最大限度地保障提供正常应用服务的信息系统。容灾备份可以分为数据备份和应用备份。数据备份需要保证用户数据的完整性、可靠性和一致性。而对于提供实时服务的信息系统,用户的服务请求在灾难中可能会中断,应用备份却能提供不间断的应用服务,让客户的服务请求能够继续运行,保证信息系统提供的服务完整、可靠、一致。

数据备份是容灾系统的基础,也是容灾系统能够正常工作的保障;应用备份则是容灾系统的建设目标,它必须建立在可靠的数据备份的基础之上,通过应用系统、网络系统等各种资源之间的良好协调来实现。一个完整的容灾备份系统包括本地数据备份、远程数据复制和异地备份中心。当然并不是所有的企业都需要这样一个系统,只有对不可中断的关键业务才有必要建立容灾备份中心。而小型企业通过建立NAS或SAN的离线数据备份和人为的数据转移就可以达到很好的容灾备份效果。

二、灾备工作注意要点

灾难恢复的目的是保证业务的延续性,为了达到这个目的,必须保证业务相关数据的完整性、可用性等,因此其解决方案应包括一套标准的多层次数据保护方案,可以在不同的产品和平台上实施。制定方案需注意以下几点:

1、明确优先权:当使用相对廉价的第二、第三级存储就可以满足需要时,采用昂贵的第一级存储就是一种浪费。所以有必要评估数据的存储需要,然后判断哪些信息确实需要持续备份,并保持可用性。

2、建立快速、准确的恢复能力。企业必须具备快速、及时地将关键数据恢复至某一特定时间点的能力,实现这一能力需要三个层次的保护:CDP、快照和完整备份。

3、经常测试数据恢复状况。如果复制的数据无法恢复,那么备份系统没有任何价值,但是,这种情况却经常发生。灾难恢复系统的无中断测试应该在首要和次要场所有规律地执行(每天、每周、而不是每季、每年)。这些测试应该在系统联机时进行,在不影响用户和流程的情况下备份任何变更。

4、巩固和复制。备份数据中心是最低的要求,然而,在今天分布式和移动式的办公环境中,仅仅有这些还不够,必须考虑远程数据,他们也应该有规律地备份到主数据中心。因为,所有场所的数据都应该被保护,而将数据远程复制至总数据中心将更便利、更安全。

5、远程复制,重复使用分支结构。将一个或多个远程分支结构作为灾难恢复场地,并将主数据中心的数据复制到该地点是一项明智之举。当然,企业也可以选择合作伙伴的场地和设施,但可能需要通过加大带宽或使用WAN优化应用来完成完整复制。灾难恢复成本可能很高,因此,重复使用分支机构对灾难恢复来说可能更明智。

三、灾难备份等级的确定

1.确立灾难备份恢复目标

企业在设计容灾方案时,应充分考虑投资因素,即灾难恢复方案的投资一定要小于灾难本身带来的经济损失,灾难备份等级确定的出发点体现在三个指标:数据恢复点目标、恢复时间目标、网络恢复目标。

数据恢复点目标:灾难发生后,恢复运转时数据丢失的可容忍程度;

恢复时间目标:灾难发生后,需要恢复的紧迫性也就是多久能够恢复的问题

网络恢复目标:灾难发生后,工作网点什么时候才能通过备份网络与数据中心重新恢复通信的指标。

企业核心流程由于灾难发生而无法正常运行时对企业的损失可能是可以量化的,也可能是无形的损失,企业灾备方案制定者必须在认真研究应用系统的业务需求后通过对可量化和不可量化损失的综合考虑,得出灾难受损的可容忍度以及损失的决策依据。

2.依据恢复目标确定灾备等级

2005年4月,国务院信息化工作办公室下发《重要信息系统灾难恢复指南》,指南将灾难恢复划分为6个等级:

第一级基本支持

第二级备用场地支持

第三级电子传输和部分设备支持

第四级电子传输及完整设备支持

第五级实时数据传输及完整设备支持

第六级数据零丢失和远程集群支持

每个灾难恢复等级都有以下管理要素的相应要求(详细内容可查阅国家规范《重要信息系统灾难恢复指南》):数据备份系统、备用数据处理系统、备用网络系统、备用基础设施、技术支持、运行维护支持、灾难恢复预案。

四、灾备方案的选择与比较

灾难备份等级确定之后,即可以开始灾难备份方案的研究和确定。当前国际流行的灾备方案主要包括以下几种:

基于存储设备的灾备方案:方案基本思路是备份中心配置与生产中心完全相同的存储设备,通过相关的控制软件在两则的存储设备上实现数据的同步镜像,保证数据的一致;此种备份方式是通过存储系统与主机系统分隔而实现的,因此可应用到多种系统平台上,使一种开放性的体系结构。

基于操作系统的灾备方案:方案基本思路是通过安装在生产中心操作系统上的灾备软件,对其操作系统的指令进行监控,并利用预定的数据操作模式完成数据的备份操作。此种备份方式可以使用第三方软件提供灾难备份功能,并能够适应各个厂家的存储硬件设备。

基于数据库的灾备方案:方案基本思路是在灾备中心建立与生产中心对等的数据库,生产中心数据库在产生数据库日志的同时,自动将日志文件传输到在被中心数据库,并将日志文件运行于该数据库,从而保证生产中心数据库和灾备数据库的数据一致性。

基于应用系统的灾备方案:方案基本思路是对待处理的业务数据,通过网络分别传输至生产中心和灾备中心进行处理,保证在灾难发生后,系统能够继续处理业务,并实现各节点间数据的一致。

五、结束语

医院双活数据容灾中心的建设探索 篇6

1、系统现状

医院数据中心历史配置如下:2009年随着信息化建设的深入, 医院的核心业务系统HIS、PACS等数据库已经建成2台服务器+2台磁盘阵列柜的系统架构, 为保障医院业务信息系统的正常运转发挥了重要作用。

1.1、HIS系统采用2台SUN小型机 (Solaris操作系统) +2台EMC CX4-240磁盘阵列柜 (9块300G硬盘, 6块600G硬盘) 利用Symantec Storage Foundation+Oracle RAC方式实现双机双柜的运行模式 (不同楼宇的机房) 。

1.2、PACS系统采用4台DELL R910 (Redhat Linux操作系统) +2台HDS 2300磁盘阵列柜, 2台数据库服务器采用Symantec Storage Foundation+Oracle RAC方式实现双机双柜的运行模式, 2台应用服务器采用Symantec Storage Foundation+集群方式实现双机双柜的运行模式 (同一楼宇的机房) 。

2、存在的问题

2.1、现有的HIS服务器Sun T5240小机已经运行5年整快到产品生命周期, 设备已经过了保修期。HIS系统的EMC CX4-240存储已经快到产品生命周期, 设备已经过保修期。

2.2、除了HIS、PACS具有双机热备其他二级应用系统都是采用单机运行, 存在单点故障风险。

2.3、医院每增加一个业务应用的时候就需要增加1套服务器, 例如将来有20个应用系统那么整个数据中心就需要20台服务器, 造成硬件资源极大的浪费。

2.4、现有的PACS系统虽然有采用的双机双柜, 但是PACS的所有服务器、存储硬件都是放置在同一中心机房, 没有形成实际的双中心。

2.5、现有的备份系统只有针对HIS系统进行备份, 其他PACS、财务等系统没有进行集中统一备份。

2.6、现有的容灾架构只有两个数据中心实现热备功能, 对重要的HIS、PACS数据库的只建立了双机双柜, 能实现硬件级故障恢复对于软件系统的故障还无法恢复, 还有很多二级应用系统仅运行在中心机房, 备用机房还无法完全独立接管中心机房。

3、双活数据中心建设方案:

基于以上存在的问题, 我们深知医院信息管理系统的正常运行离不开高可用的硬件支撑平台, 为确保医院信息管理系统安全稳定高效运行。2015年8月对原有的硬件平台进行升级, 根据未来五年的需求进行架构设计, 数据库主机沿用原有稳定的RISC小型机架构、选用ORACLE最新款小型机确保业务吞吐量、采用闪存盘、高速SAS盘、中速SAS盘分层存储结构, 提高存储IO效率。选用EMC VPLEX实现楼栋间的异地容灾, 并采用一体化备份机做定期策略备份。

规划方案系统部署在中心机房和备用机房实现双活数据中心。实现以上系统的业务应用高可靠性, 即系统无单故障点, 不会因为服务器、系统、网络、存储甚至某一机房电源故障而导致业务系统无法正常运行。结合目前医院的实际情况和新系统测试情况, 对现有已经过了产品生命周期的设备进行更新, 同时结合云计算技术建设高可用的数据中心 (采用基于虚拟存储和虚拟服务器集群的高可用解决方案) 。

根据医院业务系统的现状特性及需求, 服务器及存储系统采用如下架构:

如上图所示, 新中心机房和旧中心机房实现双活数据中心, 两个中心机房所有设备都是1:1对等的, 两个中心机房具有独立承担运行所有业务系统, 双活数据中心可以实现硬件级故障容灾。双活数据中心和容灾备份中心建设方案如下:

3.1异地容灾和基于服务器虚拟化的容灾

我院新建了中心机房, 位于医院的不同楼宇, 将原有机房作为异地容灾机房, 新增2套Oracle T5-2 Sparc小机作为HIS数据库服务器 (新中心机房和原中心机房各放1台, 采用相同配置) , 配置2个16核3.6 GHz SPARC T5处理器、256GB内存、3个300G SAS硬盘 (2个RAID1, 1个热备) ;通过光纤实现高速的数据传输, 在主服务器发生故障或遇到灾难时由备用服务器接管主服务器, 最大程度保证灾难发生时数据库服务器的可用性;非核心业务服务器虚拟化建设:利旧现有服务器, 扩容CPU及内存, 搭建生产中心服务器虚拟化平台, Vmware虚拟化软件和Symantec Application HA实现系统级HA和应用级HA;配置2台高性能的X86服务器作为数据中心虚拟化的运算资源。

3.2、双活存储容灾

新增2套EMC VNX 5600作为HIS数据库共享存储 (新中心机房和旧中心机房各放1台) , 配置7个200G SSD硬盘 (SSD也叫闪存盘, 最显著优势就是速度, 采用FLASH内存的SSD具备相当高的数据安全性, 并且在噪音、便携性等方面都有硬盘所无法媲美的优势) , 18个600G SAS 10K硬盘, 4个8GB FC端口;48GCache;配合EMC VPLEX双活系统和虚拟化平台功能, 实现生产中心和容灾中心两台EMC VNX5600之间的数据同步及内存镜像, 使得虚拟化平台上所有业务系统可以在两个双活中心之间进行无缝切换, 即任何一台EMC VNX5600出现硬件故障或者虚拟平台的物理服务器出现故障, 都不会造成业务中断, 保障业务的持续运行能力。

4、结论

随着医院信息化的发展, 医院各部门对信息系统有高度的依赖性, 更加要求信息系统的高可用性。双活数据中心架构设计是整个容灾建设方案的重点, 其核心组件是EMC VPLEX存储虚拟化引擎, 也是EMC的一项独特技术。构建基于虚拟化技术的双活数据中心之后, 当一个数据中心内的服务器、存储甚至整个数据中心发生故障时, 业务应用可以无缝切换到另一个数据中心, 业务保持在线, 实现了数据中心级别的高可用。应用2个VPLEX存储网关做到两数据中心为双活架构, 将2个数据中心打通成1个虚拟的数据中心, 应用系统和数据在2个数据中心可同时被访问, 对核心业务可进行并发的IO读写操作, 而且可根据需要应用和数据可在不同数据中心间自由在线迁移, 实现自动的负载均衡和应用级别无中断, 将完全保证关键业务应用系统的完整性、可用性和连续性, RPO/RTO趋近于零。虚拟化技术是云计算时代的核心技术。而存储虚拟化技术作为未来一段时间发展的主流, 可以用于解决信息系统存储设备复杂多样、操作系统复杂及对容灾级别要求较高的难题。借助基于存储虚拟化技术的存储网关, 分别在2个数据中心内部署存储虚拟化网关引擎, 对各数据中心进行存储虚拟化整合, 可实现对数据中心的统一调度和管理以及相关的维护工作。基于存储虚拟化网关双活数据中心容灾设计方案彻底颠覆了传统数据中心“一主一备”的容灾设计方案思路, 在满足业务连续性需求的前提下, 最大限度地实现了资源的充分利用, 节省用户IT基础设施的投资建设成本。一种技术只能减少或防止某些类型灾难的影响, 完整、高可靠的系统设计方案, 必须包括多种技术手段的组合, 方能完全保证数据的安全和业务高可用持续运行。

摘要:目的:满足医院对于信息系统的高可用性要求。方法:实现生产中心和容灾中心两台存储之间的数据同步及内存镜像, 使得虚拟化平台上所有业务系统可以在两个双活中心之间进行无缝切换, 即任何一台存储出现硬件故障或者虚拟平台的物理服务器出现故障, 都不会造成业务中断, 保障业务的持续运行能力。结果:探索出了一套具有高稳定性、高安全性和可持续运行的医院双活数据中心容灾建设模式。结论:在实践中取得良好效果。

关键词:双活数据中心容灾模式,高可用性,可持续运行

参考文献

[1]汪兆来, 基于存储虚拟化技术的双活数据中心医院信息系统容灾平台研究与设计, 中国医学装备2015年9月第12卷第9期

[2]杨永福、黄黎明、尤超、巩清源、李先锋, 医院双活数据中心容灾模式建设的探索与实践, 中国数字医学2015年第10卷第8期

容灾中心 篇7

一、供配电系统改造的基本原则

容灾中心供配电系统改造设计应执行国家和行业相关标准、规范, 并采取适当技术措施来满足容灾中心用电负荷密度高、供电可靠性要求高等特性, 满足应急供电不低于12小时。同时, 设计还应遵循分区、分级的原则保证所有设备按照自身标准要求运行, 并将供电故障影响面控制在尽可能小的范围。

二、用电负荷

1) UPS负荷。数据中心所有机柜设备和主楼监控及应急照明采用UPS供电, 总负荷80KW。机柜供电应采用两路UPS, 并注意三相平衡。2) 直流电负荷。通信中心所有设备采用直流供电, 总负荷5KW。大部分设备双电源, 需接入两路供电。3) 变配电负荷。变配电负荷主要包括:UPS (输入) 、直流电 (输入) 、办公区域用电、机房空调、机房照明及建筑电气设备。总负荷200KW。

三、供电电源

1) 市电电源。市电电源使用原有两路供电, 一路为6KV矿自供电 (主用) , 另一路为10KV供电局电。两路供电分别采用6/0.4KV和10/0.4KV直降变电方式。2) 自备应急电源。容灾中心总负载达到200KW, 考虑后期扩容需求, 自备应急电源采用康明斯300KVA柴油发电机组。

四、变配电系统

1) 高压配电系统。采用放射式配电, 两路市电电源配电线路分开敷设, 变压器至配电柜配电线路同路由不能分开, 采用无卤低烟阻燃型、耐火型电缆。2) 低压配电系统。两路市电电源的低压配电系统采用单母线分段方式, 为保障供电可靠性要求两路市电能够自动切换, 市电与油机电也能自动切换。对于UPS输入、整流柜输入采用放射式双回路配电, 两路电源在负荷设备输入端采用PC级自动转换开关实现自动切换。

其供电系统结构示意图如图1所示:

动力供电总回路分为:机房空调专用回路;办公区普通空调专用回路;市电照明专用回路;机房市电维修回路;消防系统主机专用回路。

五、UPS

1) UPS配置。根据数据中心设备计算出总负载80KW, 考虑到以后的升级需求, 配置2台模块化在线式UPS系统, 按照双母线供电模式 (一用一备) , UPS单台主机容量为150KVA。2) UPS供电总回路。1.小型机柜专用回路、备用回路;2.服务器设备专用回路、备用回路;3.网络交换机柜专用回路、备用回路;4.安防系统专用回路、备用回路;5.动力监控机房专用回路;6.应急照明专用回路;7.机房备用照明专用回路;8.PC维护终端专用回路;9.通信机房专用回路、备用回路。3) UPS蓄电池。从总负载和数据中心供电安全考虑, 为每台UPS配备2组蓄电池, 每组蓄电池为32节12V 1000AH单体蓄电池。

六、直流供电

(一) 整流柜及直流分配屏配置。所有直流设备功率5KW, 输入电流在100A以内;按蓄电池均充系数0.1计算均充电流160A;整流柜配置8个50A整流模块, 蓄电池输入和直流输出配置250A熔断器;直流分配屏输入配置160A熔断器, 输出配置6个100A熔断器、6个63A熔断器、10个32A空气开关、10个16A空气开关。 (二) 直流供电总回路。1.程控交换机专用回路、备用回路;2.传输设备专用回路、备用回路;3.宽带设备机柜专用回路、备用回路;4.视频系统设备机柜专用回路、备用回路;5.动环监控系统设备机柜专用回路、备用回路。 (三) 蓄电池。从通信中心直流供电安全考虑, 为整流柜配备2组蓄电池, 每组蓄电池为24节2V 800AH单体蓄电池。

七、防雷与接地

1、防雷。在引入机房电源总输入处分别加装一套防雷箱, 其通流容量为100KA, 残压≤2.5KV, 响应时间<25ns, 作为机房两路电源系统第一级防雷保护措施。在市电控制配电柜总开关输出端加装三相五线制增强型防雷器, 防雷模块通流容量为60KA, 残压≤2000V, 响应时间<25ns, 作为机房电源系统的第二级防雷保护措施。在UPS的输出端分别安装三相五线制电源防雷器, 模块通流容量为40KA, 残压≤1600V, 响应时间<25ns, 作为机房电源系统的第三级防雷保护措施。在机房路由器、交换机、服务器、层交换等重要网络节点, 分别加装网络信号防雷器。2、接地。机房接地系统采取单点接地并采取等电位措施。机房的地线系统由交流工作接地、安全工作接地, 直流工作接地和防雷接地组成。交流工作接地, 接地电阻不应大于4Ω;安全工作接地, 接地电阻不应大于4Ω;直流工作接地, 接地电阻不应大于1Ω;防雷接地, 应按现行国家标准《建筑防雷设计规范》执行。

八、结束语

通过此次供电系统改造, 在两路市电停电不启动柴油发电机供电的情况下, 数据中心能继续工作4小时, 通信中心能继续工作10个小时。油机房常备储油400升, 能为容灾中心提供10小时的后备电源, 完全符合容灾中心应急供电不低于12小时要求。

参考文献

[1]《电子信息系统机房设计规范》 (GB50174-2008)

容灾中心 篇8

1 上海容灾中心建设中存在的难点问题

上海容灾中心分地下一层,地上四层,建筑面积为28 124 m2。其中地下一层为设备机房,地上为计算机机房、精密空调机房及配套设备机房等,三层设置应急指挥中心。在工程建设中的主要难点如下。

1)容灾中心设备众多,包括空调设备、电气设备、水泵等共1 228台;机电系统复杂,包含9个暖通系统、12个给排水系统,18个电气专业系统,但空间有限(楼层高度为5.5 m,梁底高度为4.53 m,走道吊顶按照3.0 m设计,管道安装的空间仅为1.53 m),用传统的二维CAD进行设计,会不可避免地存在设备、管线、结构之间的碰撞冲突。

2)工期非常紧。工程于2010年3月25日开工,但由于上海特殊的软土地基,在处理基坑围护方面就花费了2个月的时间。从2010年5月26日土方开挖,到当年12月底完成土建及设备安装,实际工期仅有7个月。

3)工程量难以快速准确统计。常规需要参考设计单位和施工单位提供的概预算数据,但因工程规模大、系统复杂、工期紧,业主需要更详实的工程结算依据。

4)难以提供安全稳定的机房环境。上海容灾中心在运行中作为一个数据中心,建筑设备和机房配套设备设施的效率降低或者故障,都会对电力数据的存储、交换业务带来严重影响。

2 BIM技术概述

BIM技术是工程建设行业重要的信息化应用技术,具有三维可视化真实建模、自动碰撞检查、快速准确的工程量统计、动态施工模拟等优点,具体如下。

1) BIM以三维数字技术为基础,在计算机中建立一座虚拟的建筑模型,并为模型提供完整的建筑工程信息库,通过富含信息的模型可最大可能地去模拟建筑物在真实世界中的状态和变化。

2) BIM可通过三维方式来检查工程中可能遇到的各类管线碰撞问题,能在施工开始前发现并消除这些碰撞,可大大减少施工过程中因碰撞问题而引起的人工、材料的浪费及工期的延误。

3) BIM中包含的工程信息可以对工程量进行快速、准确地统计,使业主和施工管理人员可以高效、准确地获取各类工程量信息,避免人工统计带来的误差和争议。

4) BIM可以直观地模拟施工进度计划和施工组织设计,通过4D施工模拟,可对整个施工过程的计划安排和难点进行控制,从而优化施工计划关键路径或施工组织重要节点,以保证复杂条件下施工现场组织有序,减少安全隐患。

从应用程度上看,国外(尤其是欧美、韩国、日本)已将BIM技术应用在建筑工程的设计阶段、施工阶段以及建成后的维护和管理阶段。目前国内已有包括北京奥运会奥运村空间规划及物资管理信息系统、世博会国家电网企业馆等一批较为成功的BIM技术应用案例。上海作为国内BIM技术应用最活跃的地区之一,目前主要由设计院主导在建筑设计阶段应用BIM技术,而由业主主导的在工程施工、运行维护阶段的BIM应用才刚刚起步。

3 BIM技术在上海容灾中心施工的应用

3.1 BIM的建立和维护

通过BIM技术为上海容灾中心搭建了建筑、结构、机电、消防、水、暖、电等专业的全真模型,如上海容灾中心的(建筑+结构+机电)模型如图1所示,消防泵房管道模型如图2所示。在施工开始前,通过虚拟漫游感受建筑未来建成后的效果,查看空间是否满足要求、设备布置是否合理。在施工结束前,可根据设计修改和现场实际完工情况修改来调整BIM,使模型能够反映真实的工程完成情况。

为了保证建立的BIM与施工情况一致,每日有专人进行现场拍摄,并在BIM中与现场进行比对。通过整理上海容灾中心的每日施工变更,并反映在BIM当中,实现对BIM的维护。上海容灾中心的轴网K-8轴的BIM图与现场图分别如图3、图4所示。

3.2 自动碰撞检查

利用BIM的三维可视化特点,在施工开始前通过检查建筑设备及管线的碰撞,发现了原始设计中2 000多处存在碰撞的错误。在模型中检查出碰撞点后,经过分析、归类、整理,出具碰撞检测报告,将产生碰撞的位置进行专业分类,并在施工前将碰撞错误全部消除,这大大减少了因碰撞问题而引起的施工后的现场返工,以及由此产生的人工、材料的浪费,以及工期的延误。

3.3 施工模拟进度控制

通过BIM的4D模拟,模拟出各个阶段各专业的施工区域、人流路线、材料堆放位置,设备吊装的路径及避让区域,优化了施工组织工序,对工作面上的交叉施工实现了高质量的预先模拟和进度控制。如在地下一层机房机电施工中,水、暖、电3个专业同时施工,通过BIM的4D模拟,找出最合理的工作区域和工作路径,拓展了工作面,有效地提高了施工效率。

3.4 安全控制

通过BIM可视化环境建立各种施工操作和过程的动态模拟,对所采取的安全措施或施工方案进行预演、调整和比选,编制了《塔式起重机拆卸施工方案》、《施工升降机专项施工方案》等20多种施工组织方案,从而获得安全、经济、合理的施工方案,有力地保证了施工安全。设备吊装是上海容灾中心施工过程中危险性较大的环节,利用BIM模拟了设备吊装的垂直运输和水平运输,并将模拟结果作为编制施工方案的依据,提高了对施工安全隐患的预见性,保障了施工安全。

3.5 工程量动态统计

借助BIM中的工程信息,计算机可自动对各种构件的数量进行高效和精确的统计。由此生成准确的材料清单,为上海容灾中心项目管理团队快速评估工程变更引起的成本变化带来极大便利,有效地避免了传统工程建设过程中由于人工统计工程量而带来的误差和引起的争议。此外,工程量动态统计结合该工程项目的进度计划,帮助业主及施工总包制定出更加准确的原材料供应计划。

3.6 竣工验收

在上海容灾中心施工过程中,将管线空间布置信息完全输入到BIM中,在项目结束时完成真实的竣工BIM。当在运行维护阶段需要查看建筑物的信息时,不再需要进入到建筑物内部查看,只需查看竣工BIM,即可找到所需要的信息。上海容灾中心的竣工BIM图如图5所示。

4 BIM在上海容灾中心运行维护阶段的应用

1)机房配套设备建模。在施工阶段BIM竣工模型的基础上,增加容灾中心各类机房配图设备模型。将容灾中心的建筑设备和机房配套设备加以有效整合,保证此类信息唯一、准确和三维可视化。

2) BIM与监控关联。通过BIM整合数据中心环境监控系统的反馈数据,实现对容灾中心建筑物理环境、建筑设备和机房配套设备故障的三维定位,以及相应的解决方案分类提示。

3)节能控制。通过实施水流监控,以电能管理系统采集实时的电流、电压数据绘制能量消耗图,以达到节能减排目的。

4) BIM与消防报警系统联动。通过消防报警、烟感探测数据,在BIM中模拟出实时逃生安全路径。

5 应用效果

BIM技术在上海容灾中心工程中带来的应用效果,主要包括进度控制、质量控制、经济效益3个部分。

1)进度控制。上海容灾中心工程中,通过对BIM技术的综合应用,在施工前发现并消除了2 000多处碰撞错误,有效地减少了施工现场可能因为这些碰撞错误而引起的工程延误甚至工程返工,变被动响应为主动控制,极大地保证了项目管理团队对施工进度的整体控制;此外通过BIM优化施工组织顺序和流程,制订了更合理的施工进度计划,减少了交叉施工带来的安全隐患。例如,通过以上措施,使机电安装不仅提前了8 d进场施工,而且空调工程的安装由原来71 d降低到58 d;电力消防工程由原来78 d降低到60 d。因为BIM在进度控制方面的应用,上海容灾中心工程的施工计划由9个月缩短为7个月。

2)质量控制。上海容灾中心通过施工前期BIM的展现和模拟,重新回顾了各专业所有的设计图纸,及时发现设计隐患,提高了设计的准确性;通过直观的BIM三维虚拟漫游,提高了项目管理团队对工程信息的掌控能力,提升了决策的准确度;由于碰撞错误的及时消除,避免了传统管理模式下,此类工程经常遇到的多次拆改现象,避免设备和管线的人为损伤,不仅保证了施工的质量,而且也延长了设备及管线的使用寿命。

3)经济效益。通过BIM在施工前发现并消除的碰撞错误,为上海容灾中心工程节约设备、管线拆改费等直接收益达362.9万元,同时由于4D施工模拟技术的应用为工程节约管理费用达105万元。

6 结语

1) BIM技术在上海容灾中心施工、运行维护阶段的应用,大大提高此类建筑工程项目的集成化、信息化管理水平。在控制项目成本、缩短施工工期,提高建筑质量的同时,为工程项目管理带来更安全、更低碳的管理手段。

2)通过在该工程项目中BIM技术的应用和研究,将为国家电网公司未来建设和管理工程项目中,利用先进的信息化技术、科学的管理手段带来全新的解决方案和管理思路。

摘要:上海容灾中心工程是国内首次由业主主导,将建筑信息模型(BIM)技术应用于大型数据中心全生命周期工程建设的实施案例。讨论了上海容灾中心建设中存在的难点问题,分析了BIM技术三维可视化真实建模、自动碰撞检查、快速准确的工程量统计、动态施工模拟等优点。上海容灾中心在施工阶段和运行维护阶段应用BIM技术,保证了施工高质量的管理效益,提高了工程设计、施工和运行维护的效率。

关键词:上海容灾中心,三维可视化真实建模,自动碰撞检查,建筑信息模型技术

参考文献

容灾中心 篇9

如何保障这些系统的全天候运行, 已经成为医疗信息工作者的工作重点和难点。泰州市人民医院在信息化建设过程中, 对信息系统建设也提出了高要求。笔者亲自参与了泰州人民医院信息化建设和规划, 在此, 以笔者所在的泰州市人民医院为例, 探讨一下如何利用存储虚拟化技术来实现医院数据中心的容灾路径。

1 医院数据中心容灾现状

目前医院实现医院容灾的传统方式一般有如下几种:

1) 数据备份。备份是容灾的基础, 备份本身也可以看作是一种容灾方式, 但起到的作用很小, 只能做到最基本的保护, 所以远远达不到要求。2) 双机热备。双机热备一般是用两台主机来做互相热备的架构, 是较早出现的容灾方式, 但因为两台服务器共享一个存储上的数据, 一旦存储损坏就造成两台服务器都不可用, 就会造成容灾失败;而且, 通过纯软件来切换的话存在误切换的可能, 就会造成信息系统的停顿不可用。3) 双机双存储。就是基于双机热备方案上额外增加了一套存储系统, 类似于双机热备但系统更稳健, 实现了应用层切换和底层数据不间断复制, 但因为两台存储一般都在同一个机房, 一旦发生机房灾难, 整个数据中心还是不可用。

目前大部分医院或多或少都在采取以上的传统容灾方式, 这些解决方案只解决了一部分容灾要求。随着医院的发展, 尤其是医院两个或多个院区的出现, 使得传统方案又无法满足医院数据中心容灾的需要。

泰州市人民医院信息化起步较早, 建设了完善的信息应用系统, 随着医疗业务的快速发展, 泰州人民医院现有南北两个院区, 我们计划建设横跨两个院区的双数据中心, 如何利用先进的计算机技术来实现两个院区数据中心的容灾是迫切需要解决的问题。

2 医院数据中心容灾方案

近年来虚拟化技术浪潮已经逐渐席卷整个医疗卫生行业, 给医疗的信息化带来巨大的有益改变。结合虚拟化技术原理, 我们认为通过存储虚拟化技术, 能够解决我们想建设两个院区数据中心容灾数据中心的问题。

存储虚拟化技术可以做到:1) 本地存储双活:虚拟化存储设备通过镜像虚拟卷提供给应用系统访问, 而在后端, 镜像虚拟卷将数据写入两台独立的存储系统中, 存储虚拟化系统可以在提供可接入存储设备可访问的同时, 从而来轻松达到数据本地保护目标[2]。2) 存储系统利旧:设备在提供存储访问功能的同时, 还可以方便地对容量进行横向扩展, 如果某台设备容量出现空间不足的状况时, 能通过本身构造虚拟卷, 将多台存储系统的空间组成一个卷给应用系统使用, 达到资源的更合理分配和优化。3) 存储虚拟化设备与虚拟化平台的集成:设备可提供本地融合和分布式融合, 该功能可以支持一个数据中心内或横跨多个数据中心的协同工作, 使得技术工程师可以不受地域的限制, 在实现基础的虚拟化数据中心之后, 后期可以发展为新一代的云数据中心。

借助高级漂移功能, 虚拟机可以能够从不同数据中心进行无中断移动, 整个过程对用户透明, 存储虚拟化设备负责数据的漂移, 虚拟化软件负责业务应用漂移, 大大增加业务系统的可用性以及系统资源的利用率, 基本实现“IT即服务”的高级形态[3]。根据存储虚拟化的原理, 我们采用了医院存储虚拟化技术来改造我们的数据中心, 确保当单个系统或整个数据中心出现故障时, 尽可能多的降低数据丢失量 (即RPO=0) , 尽可能快的复原业务系统 (RTO接近零) , 大大提升了数据中心的整体服务水平。

令人欣慰的是, 在实际项目建设应用过程中, 我们感到实施存储虚拟化带来了如下变化:1) 成功建设了应用层的容灾数据中心。利用虚拟化设备可以为不同品牌和类型存储设备提供物理volume支持镜像, 这样在后台设备发生问题时既能够有一份完备的数据, 也能够不让终端应用受到停机困扰, 保障了医院信息系统数据中心的正常运行。2) 存储数据优化。在异构品牌类型存储设备和不同性能硬盘之间, 数据可以任意迁移, 这样我们可以将访问量较大的热点数据从性能较低的SATA硬盘转移到性能卓越的闪存盘上[4], 或者转移到整体能力更强的存储设备上去, 从而提升整体应用的性能。3) 存储系统性能大幅提升。医院7 年前购置的存储设备已经老化, 我们在存储虚拟化设备上特别配置了上百G缓存, 这样就极大提升了老存储的性能, 整体性能也得到了提高, 也把老设备很好的加以利用起来, 不至于造成浪费。

3 结束语

我们在实践中采用存储虚拟化技术进行两院区容灾数据中心的搭建, 实现了应用系统统一访问生产中心和容灾中心的存储系统, 从而保证了数据中心的整体高可用。用虚拟化技术来实现数据中心的容灾, 给泰州人民医院带来四大方面的好处:1) 业务连续性大大提高。由于不需要灾难切换, 使RTO趋近于零;2) 提升了主数据站点和容灾数据站点的整体使用率, 整体拥有成本得到了大幅度的减少;3) 物理机房空间得到了大幅度的节约, 耗能也得以大幅度减少;4) 整体数据中心结构得到了极大简化, 非常方便管理。

从数据中心的发展及特征来看, 泰州人民医院的数据中心未来可以很方便的发展成为真正的云数据中心。同时, 我们也看到医院信息化变化的速度是飞快的, IT新技术的出现也是层出不穷, 只有不断学习新知识, 将新的、成熟的解决方案应用到医院信息化建设中, 才能满足医院业务不断发展的需要。

摘要:医院业务不断发展, 对医院信息化提出了更高要求, 医院信息系统数据中心对医院稳定运营至关重要, 如何保障数据中心的高可用, 是医院信息系统数据中心的首要任务。本文介绍了存储虚拟化技术的相关功能特点, 并运用存储虚拟化技术来实现医院信息系统数据中心容灾方案。

关键词:存储虚拟化技术,医院,数据中心,容灾,方案

参考文献

[1]赵立川.运用存储虚拟化技术提高医院数据管理水平[J].中国医药指南, 2014, (19) :375-377.

[2]谭生龙.存储虚拟化技术的研究[J].微计算机应用, 2010, (1) :33-38.

[3]吴松, 金海.存储虚拟化研究[J].小型微型计算机系统, 2003, (4) :728-732.

中小企业数据备份、容灾走向融合 篇10

IDC大中华区总裁郭昕认为,未来的所有产业都将具备IT基因,决策框架的基础在于信息化。而信息化很大程度上依赖于企业数据,数据信息将越来越重要,相应地,企业对灾备方案的重视程度也越来越高。去年,艺龙宕机事件可能大多数人还印象深刻,因为灾备方案的缺失,硬件故障致使整个系统宕机,长时间无法恢复,所有业务被迫停止,26个小时之内,直接经济损失近15万元,而由于业务中断而对客户造成的潜在影响根本无法用数字去衡量。

灾备方案的缺失并不只是艺龙一家企业,诸多的中小企业均存在类似情况。由于成本和技术等因素,传统的备份方案或者只能够备份数据,或者只能够备份系统,还有的是只针对应用程序的备份,而灾难恢复往往又需要另外的专门软件,这就造成了资源的浪费并增加了管理的复杂性中小企业。据2012年国际调研公司Ponemon Institute发布的《Acronis全球灾难恢复指数》显示,全球仍有32%的中小企业采用3种或3种以上的备份、容灾解决方案。无独有偶,笔者最近在与某备份厂商的交谈中,谈到国内中小企业的这种现象,在其所接触的客户当中甚至有同时使用10种备份、容灾解决方案的。

众所周知,备份的目的在于恢复,而最困难的地方也是恢复。然而十余种的灾备解决方案,并没有增强中小企业在遭遇业务中断时数据成功恢复的信心。由于要从“四分五裂”的备份环境中恢复数据非常复杂,中小企业迫切希望能够拥有兼容物理、虚拟以及云端环境的“超级恢复平台”,而针对这种需求,厂商则需要集成更多的技术,以降低传统灾备方式需要恢复时的复杂性。

面对灾难发生时,企业通常有备份,但却不能及时还原的情况,一些备份方案供应商提出了灾备融合这一理念,如戴尔所推出的以“流动数据架构”为核心的智能数据管理解决方案实际上已经有一丝“存储备份容灾一体”的雏形;而中小企业市场似乎更“前卫”一些,国产备份硬件厂商爱数提出了“备份容灾一体化”口号,美国备份软件厂商Acronis 2011年新推出的Acronis Backup & Recovery 11(简称ABR 11)则更是直接将备份与容灾管理界面一体化,用户可对备份和容灾进行统一管理。

戴尔以流动数据架构为核心的智能数据管理通过智能发现“冷”“热”数据,并将其分层存储在不同介质的存储层。这个分层不仅停留在存储领域,而延伸到了数据备份、归档领域,通过与戴尔的其他产品相结合而实现了存储备份容灾一体的整体解决方案。当然戴尔智能数据管理解决方案主要还是以存储为主,兼具数据灾备领域,通过主存储与异地恢复、备份、归档以及云的无缝对接,使得企业数据可在主存储、备份及容灾系统之间快速“流动”。

在这方面不止戴尔一家,包括惠普、EMC等厂商均加强了在存储、灾备方面的整合,包括服务器、网络以及存储灾备的融合基础架构整体解决方案方兴未艾,简化管理、智能化、自动化必然是整个IT行业的大势所趋。

然而,受困于成本因素,中小企业只能对以硬件为基础的灾备一体解决方案 “望洋兴叹”。在这种情况下,其开始考虑使用软件来对数据进行备份,以确保业务中断后可迅速恢复,例如慷孚公司所推出的Simpana 软件和Acronis公司的ABR 11,——单个解决方案中均包括了许多不同功能的模块,中小企业可根据自己的实际需求灵活添加功能模块,类似于云计算中的“按需付费”。

此外, 中小企业通常只针对企业中较为重要的数据(如数据库、电子邮件等)等进行备份,而不对操作系统以及应用程序进行备份。一旦故障产生,需要迁移到新的服务器(物理机或虚拟机)时,首先要做的事情并不是恢复,而是装机、配置环境。当新的服务器采购回来之后,安装操作系统和应用需要多长的时间?如果是虚拟环境的话,配置好一台虚机到能正常使用需要多长时间?

当大量的时间都被花费在了配置系统上面时恢复业务的时间自然会顺延,而这也是中小企业最容易忽视的地方。如何在符合预算的情况下,最快地对业务进行恢复?一种针对中小企业实际环境的特有解决方案由此产生,即对操作系统和应用程序数据类型(包括文档、邮件、数据库等)进行有机整合,形成一个统一的备份机制。在恢复时,一次性对备份机进行整机恢复,这样就使得中小企业在可承受的损失范围内,尽可能地对业务进行快速恢复。

如Acronis公司的Acronis Backup & Recovery 11即是采用的这种备份机制,其通过对最底层的磁盘数据进行备份,一次性对包括操作系统、应用程序数据库甚至电子邮件或独立应用程序项目进行备份,一旦故障发生,就可迅速对故障机进行整机恢复,这样就可大幅缩短由于机器故障所引发的业务中断时间。

同时,虚拟化技术的普及增加了企业灾备解决方案的复杂度,也对灾备技术提出了新的挑战。虚拟化是大势所趋,解决虚拟环境下的灾备问题势在必行,为此,诸多厂商发布了专门针对虚拟环境的备份产品,如昆腾面向企业入门级市场推出的vmPRO 4600系列产品。其通过软件与硬件相结合的形式,针对Vmware环境中的备份、恢复和灾难恢复保护提供一体化解决方案,以简化虚拟环境中的灾备管理。而针对物理与虚拟的混合环境灾备,则需要借助第三方备份软件。

与此同时,另一些厂商则有着不同的看法,他们更倾向于将虚机备份整合到已有产品中以简化管理。如Acronis的ABR 11,虚机与物理机备份均采用相同的备份机制,并让备份可在物理机与虚拟机、虚拟机与虚拟机之间迅速切换。针对中小企业的实际环境,ABR 11还提供物理机到物理机的“异机还原”,当故障发生,可迅速将备份恢复在另外一台硬件与故障机不同的物理机上。这样既可应对新的备份需求,又能简化管理,对中小企业而言,似乎更具实践意义。

总结:

容灾备份系统研究 篇11

关键词:备份,数据,容灾系统,高可靠性

随着信息化进程的加快,电子商务和电子政务逐渐成为社会经济的重要组成部分。信息已经成为社会最有价值的资产。将业务建立在信息系统上的企事业单位开始重视信息的安全性。如何能有效的保存和管理这些信息,使之能够预防各种突如其来的人为破坏或者自然灾难,保证系统7×24小时不间断的安全有效运行,己经成为政府机关和企事业单位的首要问题。由于影响信息安全的因素是多方面的,因此需要采用不同的技术手段来解决,容灾就是其中一种非常重要的手段。

容灾是一个范畴比较广泛的概念,从广义上讲,任何提高系统可靠性与可用性的努力都可称之为容灾。从狭义的角度,容灾是通过在异地建立和维护一个备份存储系统,利用地理上的分离来保证系统和数据对灾难性事件的抵御能力。当灾难发生时,如何能够在尽可能短时间内使系统正常运行,保证数据尽可能少丢失,都是容灾技术研究的内容。

1 备份与容灾的区别与联系

数据备份是数据容灾的基础,其目的是在系统崩溃时能够快速的恢复数据。容灾不是简单的备份,真正的数据容灾就是要避免传统备份的先天不足,能在灾难发生时,全面、及时地恢复整个系统。

数据备份是将某个特定时间点的完整、统一的数据或状态保存下来,并不能够保证数据的实时性。一旦灾难发生,数据备份只能保证在一定时间内将数据恢复到某个时间点上的正确状态。在恢复过程中,数据是不可用的。恢复完成后,数据也不能恢复到灾难发生时的正确状态,而只能是灾难之前一段时间的正确状态。而数据容灾的关键在于保护数据的在线状态,保证数据在发生灾难时能从容灾中心及时恢复并且不间断向外提供服务,实时保护数据,从而实现更高的可用性。

备份与容灾是存储领域极其重要的两个部分,二者也有着紧密的联系。首先,在备份与容灾中都有数据保护工作。备份大多采用磁带方式,性能低,成本低;容灾采用磁盘方式进行数据保护,数据随时在线,性能高,成本高。其次,备份是存储领域的一个基础,在一个完整的容灾方案中必然包括备份的部分。同时备份还是容灾方案的有效补充,因为容灾方案中的数据始终在线,因此存储有完全被破坏的可能,而备份提供了额外的一道防线,即使在线数据丢失也可以从备份数据中恢复。

2 容灾系统的分级

大体上讲,容灾系统可以分为三个级别:数据级别、应用级别以及业务级别。

数据级容灾是在异地建立一个数据容灾系统,该系统实时复制本地应用服务产生的数据,当本地数据因为灾难而无法存取时,应用服务可以通过异地数据容灾中心来继续存取数据。如图1所示。异地数据容灾中心的数据从理论上来讲应该是本地生产数据的完全实时复制,但是在实际应用中,由于传输路径的延时等原因,异地数据容灾中心所保存的数据一般比本地数据稍微滞后,但是数据应该是一致的、可用的。

数据级别容灾较为基础,其关注点在于数据。其中,较低级别的数据容灾方案仅需利用磁带库和管理软件就能实现数据异地备份,达到容灾的功效;而较高级别的数据容灾方案则是依靠数据复制工具,例如卷复制软件,或者存储系统的硬件控制器,实现数据的远程复制。数据级别灾难恢复时间较长,仍然存在风险,尽管用户原有数据没有丢失,但是应用会被中断,用户业务也被迫停止。

应用级容灾是建立在数据容灾的基础之上,在异地容灾中心建立一套完整的和本地应用服务系统相当的应用系统,当本地发生灾难时,异地容灾系统检测到灾难的发生,进行应用切换,由异地容灾系统向外提供服务。应用容灾是完整的容灾解决方案,实现了应用级的远程容灾,真正实现了系统和数据的高可用性。应用容灾系统不仅要复制数据,还需要网络、主机、应用、IP等各资源之间的协调。对于提供实时服务的信息系统,用户的应用服务请求在灾难发生时会中断。应用级容灾系统能够在保证用户数据的完整性、可靠性、安全性和一致性的前提下,提供不间断的应用服务,在灾难发生时进行实时切换,确保业务的连续性。

数据级容灾和应用级容灾都是在IT范畴之内的,然而对于正常业务而言,仅IT系统的保障还是不够的。有些用户需要构建最高级别的业务级容灾。业务级容灾的大部分内容是非IT系统,比如电话、办公地点等。当一场大的灾难发生时,用户原有的办公场所都会受到破坏,用户除了需要原有的数据、原有的应用系统,更需要工作人员在一个备份的工作场所能够正常地开展业务。由于容灾所承担的是用户最关键的核心业务,其重要作用勿庸置疑,容灾本身的复杂性也是十分明显的,这就决定了容灾成为一项系统工程。

3 容灾系统的实现方式

3.1 基于主机的容灾

通过在主机上安装软件实现数据在服务器之间的复制。这种方式对存储系统没有限制,支持异构存储系统,不需要增加硬件,同时可以在服务器层增加应用远程切换功能软件,从而构成完整的应用级灾备方案。但这种方式对软件要求高,生产中心和灾备中心的每一台应用服务器上都需要安装专门的软件,随着服务器数目的增加,成本也线性增加。同时存储目标数据的逻辑卷不能被业务系统直接使用。由于需要在服务器上运行软件,对服务器兼容性和性能也会有所影响。

3.2 基于存储设备的容灾

通过存储控制器实现的设备级数据远程镜像或复制,是传统灾备中最高效最可靠的方式。基于存储设备的容灾与服务器平台无关,远程复制由生产中心和灾备中心的存储系统完成,对应用服务器完全透明。设备往往采用的是一些专用的设备和通信方式,安装维护都比较复杂。由于两个中心之间必须有专用的网络连接作为数据通道,使得该系统对通信线路的要求较高,初期成本非常昂贵。

3.3 基于网络级的容灾

主要是指基于虚拟化存储技术的灾备。这种方式无需在应用服务器上安装任何软件,远程复制过程不会对应用服务器产生影响。存储设备可以完全异构,不同厂商不同接口的阵列可以混合使用,而且完全不用考虑现有的存储设备是否支持远程数据灾备,大大降低了方案复杂程度和实施难度。但是数据的写入必须由虚拟化数据管理产品进行转发。

3.4 评估标准

容灾系统的评估指标与业务系统的数据可恢复性密切相关。通常用RPO(Recovery Point Objective)、RTO(Recovery Time Objective)两个技术指标来衡量和评价一个容灾系统。RPO即数据恢复点目标,指的是企业在一次灾难中,所能容忍的数据丢失量。RTO即恢复时间目标,指的是所能容忍的业务停止服务的最长时间,也就是从灾难发生到业务系统恢复服务功能所需要的最短时间周期。RPO针对的是数据丢失,而RTO针对的是服务丢失,二者没有必然的关联性。RTO和RPO的确定必须在进行风险分析和业务影响分析后根据不同的业务需求确定。对于不同企业的同一种业务,RTO和RPO的需求也会有所不同。

此外,设计容灾系统还需要考虑选择容灾备份中心地点。数据库容灾要保证备份数据库的一致性。最好能够在对系统无干扰前提下,对备份数据库进行实时检验。

4 结束语

容灾系统的建立,提供了高可靠的数据保护环境,降低灾难发生造成的损失,提高系统的安全性和可恢复性。容灾系统并不是在设计完成后就不必再管理的项目,它不仅仅是技术,更是一项工程。测试和维护是保证系统高可靠性与可用性的有力途径。目前,很多国内企业特别是一些中小型企业,已经建立了容灾系统,但是长时间没有任何灾难发生,于是放松了警惕,没有定期进行维护和测试。一旦灾难发生,后悔莫及。相反,一些跨国公司在这点上仍能一如既往地定期对容灾系统进行评估和恢复演习。

参考文献

[1]聂元铭,曾志,黄燕宏.计算机数据修复与维护[M].北京:科学出版社,2006.

[2]Roopendra Jeet Sandhu著.张瑞萍等译.信息灾难恢复规划[M].北京:清华大学出版社,2004.

上一篇:选题改革下一篇:教学考试方法改革