容灾解决方案

2024-10-21

容灾解决方案（精选12篇）

容灾解决方案篇1

随着医院信息化的不断发展,医院的日常业务对计算机系统的依赖和要求也在不断的提高,仍然依靠无效的人工流程手段和磁带进行数据保护和数据备份已经不能满足当前信息化建设和数据安全储存的要求了,能够实时备份数据,当主机房受到自然灾难以及计算机系统软、硬件的人为操作错误等人为灾难时所造成的数据丢失,容灾机房的容灾备份系统能实时地接替运行业务所需,这样既保证医院的数据安全,也不影响医院业务的正常进行[2]。

1 容灾备份系统

容灾备份系统就是为计算机信息系统提供的一个能应付各种灾难的系统。当计算机系统在遭受如火灾、水灾、地震、战争等不可抗拒的自然灾难以及计算机犯罪、计算机病毒、掉电、网络/通信失败、硬件/软件的人为操作错误等人为灾难时,容灾备份系统将保证用户数据的安全性(数据容灾),甚至还能提供数据零丢失、不间断的应用服务(应用容灾)[1]。

2 容灾备份的原理及分类

建立容灾备份系统就是以最小的代价保护应用数据的完整性与安全性,在灾难发生后尽快恢复系统运行,减少业务停顿时间,尽可能不中断或不影响业务的正常进行,并让灾难对企业造成的损失降到最低。也就是说,无论两个系统相隔多远,当一个数据中心出现问题时,另一个数据中心就能迅速接替运行,同时既要保证业务数据的完整性,又要保证关键业务的连续性。

建立容灾的原理是在相隔较远的地方分别建立两个数据中心,它们都处于工作状态,并进行相互数据备份。当某个数据中心发生灾难时,另一个数据中心接替其工作任务。这种级别的备份根据实际要求和投入资金的多少,又可分为两种:(1)两个数据中心之间只限于关键数据的相互备份;(2)两个数据中心之间互为镜像,即零数据丢失等。零数据丢失是目前要求最高的一种容灾备份方式,它要求不管什么灾难发生,系统都能保证数据的安全。所以,它需要配置复杂的管理软件和专用的硬件设备,需要投资相对而言是最大的,但恢复速度也是最快的[3]。

3 容灾备份系统的解决方案

在建立容灾备份系统时会涉及到多种技术,如:SAN或NAS技术、远程镜像技术、基于IP的SAN的互连技术、快照技术等。

目前可以跨越LAN、MAN和WAN,成本低、可扩展性好、具有广阔的发展前景的容灾备份技术就是多种基于IP的SAN的远程数据容灾备份技术。它们是利用基于IP的SAN的互连协议,将主数据中心SAN中的信息通过现有的TCP/IP网络,远程复制到备援中心SAN中。当备援中心存储的数据量过大时,可利用快照技术将其备份到磁带库或光盘库中。从而保证数据的安全和业务的连续性的。

中心机房和容灾备份机房就是利用了这一原理同时结合Symantec软件(Symantec容灾软件是业界比较流行的软件产品,能够保证客户的生产环境高速可靠有效的运行。既可以实现本地机房的双机双柜架构,也可以实现远端机房的应用级容灾。)来实现中心机房和容灾机房的数据替换,来确保本院信息系统的数据安全和业务的不间断运行。具体的方案实施原理如图1所示。

中心机房中,每台主机分别使用一块光纤卡与一台SAN交换机相连接,存储的每个控制器分别使用一块光纤模块与一台SAN交换机相连接,产生红蓝两条冗余链路,当其中任何一条链路出现故障时,比如存储的一个控制器故障或者其中一台光纤交换机故障,都不会影响主机对存储的访问。

容灾备份机房中,每台主机使用一块光纤卡与SAN交换机相连接,存储的每个控制器使用一块光纤模块与SAN交换机相连接,产生绿色链路。

两台存储分别置于两个机房中,使用Symantec容灾软件配置为镜像关系,当中心机房出现故障时(例如中心机房全部断电),应用将全部切换至灾备机房,确保应用正常工作,不影响医院的业务正常运行。

4 容灾备份系统存在的问题及发展前景

虽然容灾备份系统一直备受各个使用计算机系统行业的关注,但是根据调查显示,大多数公司并没有对自己的企业IT做好充足的容灾准备。IDG研究服务的调查结果显示,42%的受调查企业仍没有部署现代化的容灾备份的解决方案,这些企业中有23%的大型企业,48%的中小型企业和27%的微型企业依然依靠无效的手段流程和磁带进行数据保护和数据备份。尽管之前这些企业都曾遭受过数据丢失和IT中断。很多公司并不把这些策略作为优先项目来实施。

因为企业IT预算的减少和对容灾备份系统重要性认识不足的驱动,很多企业把数据保护和容灾备份系统只当成企业数据的保险。当今的数据中心,一般都是24*7的不间断服务。因为IT的中断可能给生产力带来67%损失,其中包含27%声誉损害,而因数据丢失带来的财务损失不可估量。

随着越来越多地企业因为采用虚拟化的磁带备份所需的时间和成本的巨大,不断经历IT中断和重要数据丢失的惨痛教训后,使得很多企业看到了快速的数据恢复和IT服务的必要性。提高了对容灾备份系统重要性的认识,转变了对容灾备份系统的传统观念,许多企业已经开始或实现了转向基于多种基于IP的SAN的远程数据容灾备份技术的解决方案。专家表示企业必须保持警觉,部署消除意外损失的自动化解决方案,用高可用性、自动化系统的系统进行数据备份对数据实施保护,确保企业数据的安全和业务的正常运行[4]。

参考文献

[1]张红.医院信息化背景下数据容灾的对策[J].医疗装备,2011,24(3):37-39.

[2]ChadL,Michael H.Components of disaster-tolerant comput-ing:analysis of disaster recovery,IT application downtime an-dexecutive visibility[J].International Journal of Business In-formation Systems,2008,3(3):317-331.

[3]郝乐.数据容灾技术研究.电子科技,2011,24(3):20-21.

[4]何鹏,吴青.医院信息系统数据远程容灾方案设计分析[J].中外医疗,2010,(13):150-151.

容灾解决方案篇2

1.1数据备份的主要方式

目前比较实用的的数据备份方式可分为本地备份异地保存、远程磁带库与光盘库、远程关键数据+定期备份、远程数据库复制、网络数据镜像、远程镜像磁盘等六种。

（1）本地备份异地保存

是指按一定的时间间隔（如一天）将系统某一时刻的数据备份到磁带、磁盘、光盘等介质上，然后及时地传递到远离运行中心的、安全的地方保存起来。

（2）远程磁带库、光盘库

是指通过网络将数据传送到远离生产中心的磁带库或光盘库系统。本方式要求在生产系统与磁带库或光盘库系统之间建立通信线路。（3）远程关键数据+定期备份

本方式定期备份全部数据，同时生产系统实时向备份系统传送数据库日志或应用系统交易流水等关键数据。（4）远程数据库复制

生产系统相分离的备份系统上建立生产系统上重要数据库的一个镜像拷贝，通过通信线路将生产系统的数据库日志传送到备份系统，使备份系统的数据库与生产系统的数据库数据变化保持同步。（5）网络数据镜像

是指对生产系统的数据库数据和重要的数据与目标文件进行监控与跟踪，并将对这些数据及目标文件的操作日志通过网络实时传送到备份系统，备份系统则根据操作日志对磁盘中数据进行更新，以保证生产系统与备份系统数据同步。（6）远程镜像磁盘

利用高速光纤通信线路和特殊的磁盘控制技术将镜像磁盘安放到远离生产系统的地方，镜像磁盘的数据与主磁盘数据以实时同步或实时异步方式保持一致。磁盘镜像可备份所有类型的数据。

1.2备份拓扑网络结构

广州市第八人民医院具有两个不同地点的中心机房（即东风东路院区中心机房和嘉禾院区中心机房），在这基础上是可以构建一个异地容灾的数据备份系统，以确保本单位的系统正常运营及对关键业务数据进行有效地保护，以下设计方案仅提供参考。

东风东院区数据中心

windows

linux

嘉禾院区数据中心

Windows

linux

本方案中，我们采用EMC的CDP保护技术来实现数据的连续保护和容灾系统。1.在东风东院区数据中心部署一台EMC 480统一存储平台，配置一个大容量光纤磁盘存储设备，作为整个系统数据集中存储平台。

2.在嘉禾院区数据中心部署一台EMC 480统一存储系统，配置一个大容量光纤磁盘存储设备，作为整个平台的灾备存储平台。

3.两地各部署两台EMC RecoverPoint/SE RPA，采用CLR技术，即CDP（持续数据保护）+CRR（持续远程复制），实现并发的本地和远程数据保护。

4.在东风东院区数据中心本地采用EMC RecoverPoint/SE CDP（持续数据保护）技术实现本地的数据保护。5.两地采用EMC RecoverPoint/SE CRR（持续远程复制）技术，实现远程的数据保护。由于两地之间专线的带宽有限，可以采用EMC Recoverpoint/SE异步复制技术，将东风东院区数据中心EMC480上的数据定时复制到嘉禾院区数据中心。根据带宽的大小，如果后期专线带宽有所增加，RecoverPoint会自动切换同步、异步、快照时间点三种复制方式，尽最大可能保证数据的零丢失。

1.3本地数据数据保护（CDP）设计

如上图所示，当服务器对生产卷有写命令操作时，存储系统将需要写入的数据写入到存储的同时，利用CLARIION拆分器(Spliter)将写命令同时传送一份到RPA上，RPA收到写命令返回写成功给服务器，同时将数据连同时间戳、应用事件、或标签等一并写入日志卷，RPA再根据日志卷信息分布地将数据写入复制卷。1.4远程数据复制过程（CRR）设计

如上图所示，当服务器对生产卷有写命令操作时，存储系统将需要写入的数据写入到存储的同时，利用CLARIION拆分器(Spliter)将写命令同时传送一份到RPA上，RPA收到写命令返回写成功给服务器，经过RPA处理（对数据进行压缩，压缩率可以达到15倍左右），通过专线网络将数据传送到嘉禾院区数据中心的RecoverPoint设备处，形成历史快照后，再写入到嘉禾院区中心的的EMC 480磁盘阵列系统中，保持与东风东院区数据中心EMC 480阵列上的数据一致性。

1.5数据恢复过程设计

本地恢复：在本地如发生服务器故障、数据损坏、软件错误、病毒和最终用户错误等常见问题造成的数据丢失，利用本地的CDP即可快速恢复到任意时间点的数据。

异地恢复：我们建议在嘉禾院区数据中心配置与东风东院区本地系统相同的应用服务器做为备用，一旦东风东院区本地数据中心灾难发生，由于数据已经传送到嘉禾院区数据中心，我们直接将数据附加到已配置好的灾备服务器上，配置好网络路由等细节，即可启动应用，恢复原业务系统。

RecoverPoint/SE不经过主机不影响主机性能，无须安装任何软件，完全完全独立的运行。通过IP 网络，搭建数据容灾架构，延长了容灾的距离，充分利用现有资源，完成数据的容灾保护，为保障数据的高安全性和可靠性打下良好基础。1.6 RecoverPoint/SE容灾方案技术优势

RecoverPoint/SE采用了独创的领先技术，是一个先进的企业级灾难恢复解决方案。该方案以相对低廉的造价提供完善的数据保护，RecoverPoint的结构是基于SAN和IP之间的支持双向数据复制的智能化独立设备，并可以在任意距离上为异构服务器环境提供数据复制。该方案具有以下特点：

1.带宽节约和数据压缩 2.利用IP网络进行数据复制 3.支持超长距离的数据复制 4.支持基于策略的数据复制 5.能够恢复到任意时间点 6.支持双向的数据复制

7.支持灵活的容灾数据中心的检查和批处理 8.长距离的“同步”解决方案

9.通过综合的手段，降低总体拥有成本

具体技术优势如下描述：带宽节约和数据压缩

RecoverPoint/SE采用了智慧型的“带宽约减”技术，使得系统对带宽的需求达到了空前降低。这就可以在现有的网络带宽环境下提供最高程度的数据复制，这一点最大幅度地降低了对WAN需求的成本，尤其是基于远距离的数据复制。通过storage-aware和application-aware算法技术，可以达到高效的数据压缩能力（可达到15：1的压缩比），从而降低对传输带宽的需求，这一点是传统的数据压缩技术所无法比拟的。

任意时间点的应用程序数据保护

RecoverPoint/SE 允许通过选择特定于时间或特定于应用程序的智能书签将应用程序数据恢复到任意时间点。选定时间点的应用程序数据可以进行即时访问，并且立即可供主机读取和写入。还可以在设定数量的已分配存储中使用快照整合来实现更长的保留期，使客户能够在线维护更多数据以便恢复，而不引入额外的存储成本。RecoverPoint/SE 还允许在不中断复制过程的情况下对复制的数据进行读/ 写访问。在恢复时，该功能允许测试几个时间点的数据，以便确定最佳恢复点。该功能也可用于减轻备份负担、允许进行实时应用程序开发和测试、支持按需恢复、迁移数据及其他许多有价值的数据处理。

RecoverPoint/SE 可保护来自 Microsoft、Oracle、SAP®、VMware® 等的常见应用程序。它还支持应用程序一致性恢复点（使用 Virtual Data Interface for SQL Server 或 Volume Shadow CopyService for Exchange 等 Microsoft 要求的 API），从而让这些环境实现供应商支持的恢复。

确保数据的一致性

RecoverPoint保证在任何可能的故障或灾难中对企业数据进行一致性的复制。当前的许多产品无法确保数据在“多次同步”或“重复性灾难”发生的情况下保持数据的一致性。RecoverPoint可以确保在任何时间，甚至在异构存储和服务器的环境下仍然保持数据一致性。

策略化的数据复制

RecoverPoint提供了全面的数据复制机制，同时提供同步、异步以及时间点复制。复制过程按照用户的策略自动管理，并动态调整复制过程，按照可用带宽、每个应用的工作量来为每个应用达到一定的数据复制要求，从而在复杂或异构环境中极大地简化了数据和灾难恢复的管理难度。

比如，针对数据保护要求比较苛刻的应用，我们可以为其定义一种“最小延迟”的复制策略。这样，系统会利用所有可用的带宽资源来实现主从节点之间数据复制。另外，我们也可以为非关键业务定制“最小带宽”的复制策略，使得系统利用尽可能少的带宽资源，实现关键数据和相对非关键数据的不同策略处理。

远距离的同步保护

RecoverPoint提供了数据的同步保护级别，对应用性能无影响，距离无限，同时对存储设备无需额外的花费。该特有功能解决了当前方案对距离限制的问题，并实现了对区域性灾难的完整的实时数据保护，同时不会降低应用性能。

双向的数据复制能力

RecoverPoint提供了双向的数据复制能力，因此能够使主数据中心和容灾中心互为保护。例如，大型公司在不同的地方拥有分公司，各分公司都具有数据中心，都有应用数据需要保护，此时，可以互相将自己的数据复制到对方的数据中心，而共同使用同一套容灾基础设施和软件。

从节点的数据处理

RecoverPoint支持从节点数据的直接读取和写入操作，而无需预先从主节点产生拷贝。系统支持故障切换和数据回滚的能力，降低管理和操作成本。

始终可用和无限扩展性

RecoverPoint支持高可用集群技术，是Active-Active模式的独立体系，这样可以保持系统始终可用，并可以无限扩展。

整体成本优势

RecoverPoint提供了强大的数据保护功能，但是在整体成本上远远低于当前方案。同时，异构存储的支持、带宽的降低、软件、结构及操作维护等等都为用户提供了更为节约的解决之道。

便于管理

RecoverPoint支持NDMP管理协议，便于在其他应用或再开发中加以集成。同时RecoverPoint具有丰富的故障报告机制，图形化的界面使得管理更加便利。

容灾的前世今生篇3

欲用其妙必先知其道

亚里士多德有言，“If you would understand anything, observe its beginning and its development.”意即：如果你想明白一件事情的话，就要观察他的开始和以及他的发展过程。正如国语有言，“欲用其妙，必先知其道”。

所以，对于纠结于各种容灾定义的大家来说，首先需要做的应该是追本溯源地了解一下到底什么是容灾，有怎样的一个发展过程，在这个发展过程中又有哪些经久不变的追求，接下来就让我们一起来梳理一下容灾的前世今生。

什么是容灾

面对应接不暇的容灾介绍和定义，其实用户真正关心的只有两点：首先，是否可以保证数据不丢失；其次，是否可以保证应用不间断。在我们的IT应用中，也接触到一些可能是解决这些问题的应用，比如双机高可用方案就是解决应用不间断的问题。但真正意义上的容灾，必须具备同时保证数据不丢失和应用不间断的能力，这也是容灾的最基本的目标。

在这里很容易出现另一个困惑，一提到容灾，就会提到备份、快照、镜像、CDP和双机等等名词，它们跟容灾有怎样的关系呢？或者它们是不是就是容灾呢？

备份的主要实现方式是将数据从原位置移到目标端，形成可任意恢复的时间点。一切不以恢复为目的的备份都是耍流氓，所以，备份仅仅是用来保证数据不丢失的一种技术手段，让用户在关键时刻能够拥有可以恢复的数据，并不是一种应用。另外，像快照也是在原介质上根据某一时间创建一个照片，镜像则是建立实时的对等的版本，以保证意外情况下的数据可恢复性。对于应用来说，大家可能认为双机是可以保证应用不间断的，但是双机有一个非常明显的缺陷，就是不能保证数据不丢失，因此它仅仅是一个高可用的方案，并不能作为普及容灾的一种通用型方案。

所以，无论是备份也好，快照也好，CDP也好，双机等等，他们都是容灾的一部分，属于容灾的范畴，是实现容灾的技术手段，因为它们只能解决一部分问题，真正的能做到普及容灾的方案应该是一套完整的方案。

那么，到底什么是容灾呢？

容灾严格来说主要包含三个部分，分别为数据容灾、应用容灾和业务容灾。但是对于我们用户来说，绝大部分只需要关注两个部分，第一部分是数据容灾，第二部分是应用容灾，并且分别包括本地和异地的部署方式。其中数据容灾解决的是数据不丢失的问题，而应用容灾解决的是数据不丢失以及应用不间断的问题。

容灾的前世今生

只要有计算机技术，只要有数据，只要考虑数据安全问题，容灾就是不可避免的话题，在五六十年代就已经凸现原型的容灾，在这几十年来，又是如何诞生并发展起来的呢？

纵观容灾的整个发展过程，就会发现，从最初发展到最近的90年代，当备份方案使用不起身价高昂的磁盘备份介质时，均是以磁带备份为主，那要做异地容灾该如何办？惟有采取异地磁带托管的方式。所以，也随之出现了磁带托管业务的繁荣局面。在中高端的存储磁盘阵列出来后，逐步出现了通过磁盘镜像技术实现实时复制效果的方案，但因为成本过高，应用范围非常有限。因而在90年代，备份技术一成不变，一直波澜不惊的以磁带备份为主。

到了00年代，备份还是以磁带为主，但在这时发现磁带在性能和管理方面的瓶颈越来越明显，所以为了突出更强劲的性能、更好的管理等，磁带库技术应运而生，并且逐渐成为主流，但是因为磁带介质本身无法避免的一些硬伤，比如它在备份过程中管理的复杂性，而最主要的是磁带介质数据长期保存的可靠性不高，90年代的一个调查数据表明，47%的磁带备份数据的无法恢复，这就是磁带介质最大的硬伤。

一切不以恢复为目的的备份都是耍流氓，如果备份的数据无法恢复，那备份的意义就不复存在。所以基于磁带备份这样一种遗憾，00年代诞生了一种非常重要的技术——SATA磁盘技术。SATA 磁盘技术的诞生不仅仅意味着性能的提高，更意味着容量的提高，意即单位GB的成本越来越低了。有了这样一种新的应用，就有人开始思考，如何用磁盘替代磁带，但是因为主流的备份软件都是以磁带为核心的，并不支持磁盘，所以这是一个各路英雄都感到棘手的问题。

乱世出英雄，IBM在03年时基于这样的应用需求，发明了一种新的技术 ——VTL虚拟磁带库，旨在把磁盘当做磁带用的同时，还可用好用户环境现有的备份软件。VTL的横空出世虽然没有对备份方案做出实质性的改变，但却做了一个非常好的铺垫，就是开始把磁盘应用于备份方案，这是容灾非常重要的一个转折点。

磁盘一旦用于备份，即刻显著拉动磁盘的需求，磁盘成本逐渐下降，而随着广泛的应用，磁盘技术的革新得到进一步优化。随着磁盘的异军突起，就会发现在备份领域，磁盘介质有一个很重要的特性在虚拟带库里面是没有应用起来的——磁盘的随机访问特性，因为磁带不是随机访问的，所以虚拟带库将磁盘虚拟成带库后，就牺牲了磁盘这个最大的特性，所以，VTL的技术特性绝大部分仍然跟磁带一致，唯一改变的就是用了一个更可靠的介质。

需求催生应用，这个时候，业界就开始思考如何更好的使用磁盘。

在应用磁盘备份的过程中，第一个阶段就有一个非常重大的技术突破出来，那就是CDP技术。前面提到，容灾首先要解决的问题是数据不丢失，而无论是磁带备份，还是虚拟磁带库，都有一个很大的硬伤，即数据丢失量大。因为它们不能实现随机写，所以它在做数据布局的时候，不能实时的不停的写和更改，这也就意味着它一定存在一个备份窗口，也就是说数据不可能不丢失。所以当应用磁盘备份后，首先要解决的问题便是备份窗口带来的数据丢失，解决这个问题的技术就是CDP持续数据保护技术。然后又相应地出现了解决应用不间断的高可用技术。

但是，我们会发现，CDP和高可用技术是分开的，即备份是备份，双机是双机。因而，业界会普遍面临一个问题 ——一套系统里，要么解决了数据不丢失的问题，要么解决了应用不间断的问题，没有合二为一的方案。但用户的需求实实在在的摆在那里，容灾一定要上，因为不只是数据不丢失的需求，还要保证应用不间断。

所以，到了现在，慢慢出现了一种新的主流技术——一体化容灾，将如CDP、Realtime、Deduplication等技术合在一起，如赛门铁克的NBU，EMC的BSR部门，爱数的爱数备份容灾家族产品系列，目的都是一个，就是突出一体化容灾，这也是目前乃至未来容灾方案发展的趋势。

性能与管理30年来一直不变的追求

从上面的分析我们可以看出，容灾的整个发展过程，基本上是非常鉴定地围绕两个目标在追求——第一个就是更好的性能，第二个就是更好的管理。而且这两个目标也是用户在选择容灾的时候，需要考虑的两个指标。

在性能方面，从磁带到磁带库，到CDP，再到应用容灾，都是为了实现更小的RPO和RTO。

在管理方面，最开始的80、90年代，用户只需针对单个系统做备份即可，所以备份软件的鼻祖都是从UNIX发家的。但随着服务器和应用的增多，就会逐渐变成以Master Server和Media Server为架构的备份系统，于是，大家需要通过购买服务器（Sever）、操作系统（OS）备份软件（Backup Software），甚至加上存储硬件（Storage）来完成一套完整方案的部署，这也就是4S方案，一定要这样做吗？其实，现在已经有很多很好的技术可以突破这个传统的4S方案了。在08年的时候，市场上以爱数为首出现了一套新技术——一体化备份系统，意即将传统4S方案的步骤一步到位，集成化的实现，将管理的复杂度降至最低。而现在，几乎所有的备份厂家都已经开始推一体化的备份系统，包括赛门铁克、EMC等等。

前面提到，备份只是容灾的一部分，因为它只是一种技术实现手段，并不能覆盖所有的技术方案。但容灾要解决的是两个问题，一个是数据不丢失，一个是应用不间断。一体化备份解决了数据不丢失的问题后，另一个问题的出路又在哪里？很明显，就是既能保证数据不丢失又能保证应用不间断的真正的容灾——一体化容灾。

一体化容灾的出现就是极限吗？在管理上解决了所有问题吗？

这里我们就会发现，它还有一个漏洞，一套容灾系统它只是解决容灾需要解决的性能问题，但并没有将容灾整体的管理起来，这也就脱离了它真正的核心——为了实现企业经营目标而用容灾。所以，随着一体化容灾的出现，接下来会有一个更主流的容灾管理模型出来，那就是基于法规遵从的一体化容灾，能够将企业管理的价值目标和容灾管理的技术目标有效结合起来，有效推动容灾最广泛的普及。

容灾，可以仰望，不可企及？

容灾解决方案篇4

灾难备份和灾难恢复是降低灾难发生的损失、保证系统连续运行的重要措施[1].

Oracle Data Guard是Oracle公司基于数据库级别的容灾解决方案[4],可以提供企业的关键业务在灾难发生时的应对能力和恢复能力,通过尽可能快速的、全面恢复企业的业务运作,将因灾难造成的损失降低到最小程度[2]。

ORACLE Data Guard日益成为通讯行业建立容灾的必要手段。但建立容灾完毕后,容灾监控却是一个比较难解决的问题,由于容灾系统不经常使用,容灾系统健壮与否直接影响容灾可切换性,所以对容灾系统监控做到作业计划中,定期地检查容灾的可用性,是必须要解决的一个课题,本文就oracle容灾的监控及各进程重要性做了初步总结。

1 ORACLE Data Guard进程结构

Data Guard使用Oracle数据库的几个进程来实现灾难恢复和高可用性所必需的自动化[3]。

在主数据库上,Oracle Data Guard使用日志写入器进程(LGWR)或归档器进程(ARCH)收集事务重做数据,并将其传输到备用数据库中;使用获取存档日志进程(FAL)提供一个客户服务器机制,用于在主数据库和备用数据库之间出现通信中断之后将存档日志发送到备用数据库中,以实现自动填充间隔和重新同步。

在备用数据库上,Oracle Data Guard使用远程文件服务器(RFS)进程从主数据库接收重做记录;使用管理恢复进程(MRP)将重做信息应用到物理备用数据库中。

2 Data Guard运行状态监控及重要程度

2.1 监控Data Guard进程

在监控系统中如果配置了Data Guard,则要根据它是生产环境还是容灾环境来选择监控项目。

2.1.1 检查系统中有哪些运行中的实例:

执行ps–ef|grep smon|grep–v ASM,返回结果:

这里表示,系统中有两个实例在运行,分别是stb_new和ora11g。

2.1.2 对每个实例,分别进行以下判断:

根据每个实例所属的操作系统用户,登录到相应的实例中,执行以下命令:

SQL>select data base_role from v$data base;

如果返回的结果是STANDBY,那么说明该实例是容灾实例,需要做后面容灾环境的监控项目。

如果返回的结果是PRIMARY,那么还需要继续执行以下步骤以确定它是否是配置了Data Guard的生产环境。

2.1.3 确定配置的日志传输是否正确:

执行以下命令:

两个语句都是返回1,那么说明该实例是配置了Data Guard的生产环境,需要对它做后面生产环境的监控。

2.2 生产环境的监控

当下面的监控项都正常时,才能说明DG状态是正常的。

2.2.1 LNS进程状态

执行以下命令,如果有进程返回,说明LNS进程正常:#ps–ef|grep lns|grep实例名

继续,再检查告警日志文件,如果存在以下任何一行,则说明有错误:

处理建议:

检查生产环境中用于容灾复制的监听是否正常,容灾实例状态是否正常。

2.2.2 日志传输情况

监控方法:

可配置参数:日志gap的个数(最小值为1,默认值为10)、日志gap的小时数(最小为1小时,默认为12小时)

下面的命令如果有返回数据,则说明返回的inst_id节点上存在未传输到容灾环境的归档日志个数大于10个,或者最早未被传输的日志的时间与当前时间相比超过了12小时:

后果或影响:

归档日志未及时传输到容灾端,会导致生产端不能正确地清理自己的归档日志,导致归档目录可用率越来越低,生产实例被hang的风险加大。而且容灾环境与生产环境越来越不同步了。

处理建议:

检查生产环境、容灾环境中用于容灾复制的监听是否正常,容灾实例状态是否正常。

2.3 容灾环境的监控

2.3.1 MRP进程

监控方法:

在容灾端执行以下命令,如果可以返回一行数据(返回值为1)说明MRP进程是正常的:

处理建议:

执行ps–ef|grep mrp命令,如果没有mrp进程存在,那么执行以下命令启动MRP进程:

SQL>alter database recover managed standby database using current logfile disconnect from session;

如果已经有MRP进程了,那么需要人工介入,根据告警日志情况处理。

3 结语

Oracle Data Guard容灾所具有的优点,具有很好的高安全性,对性能的影响非常小。当数据库机器出现故障时,只需要数分钟就可以使数据库照常运行,数据的丢失率几乎为零,但前提条件是容灾系统运行正常,笔者通过以上手段,结合通讯行业的自动作业计划和派单规则,很容易地监控到所用的容灾系统是否处于正常运行状态。

参考文献

[1]张艳,李舟军,何德全.灾难备份和恢复技术的现状与发展[J].计算机工程与科学,2005,27(2)

[2]龚艳,张世钱.用Oracle9i Data Guard构建系统容灾[J].计算机应用与软件,2006(10)

[3]容灾白皮书[M].IBM中国信息支持中心,2004

容灾系统方案及数据备份技术篇5

近几年，大量数据灾难如911事件，黑客服务器攻击等，使得数据安全问题更加迫切。容灾已经成为信息数据中心建设的热门课题，很多容灾技术也快速地发展起来。在容灾行业，有一个常识是，灾难一旦发生，如何尽量降低灾难给企业带来的负面影响是需要高度重视的一个问题。同样，企业在遭受来自互联网的“灾难”时，首先需要做的就是迅速建立起事故响应机制，尽早恢复日常的信息服务。不过，这需要企业在进行信息化的过程中做好未雨绸缪的容灾备份工作，做好了准备，才能有事情发生时的从容应对。

在容灾技术中通过容灾备份可以很好地解决系统的安全稳定运行要求。容灾备份是通过特定的容灾机制，在各种灾难损害发生后，仍然能够最大限度地保障提供正常应用服务的信息系统。容灾备份可以分为数据备份和应用备份。数据备份需要保证用户数据的完整性、可靠性和一致性。对于提供实时服务的信息系统，在用户的服务请求在灾难中中断时，应用备份可以提供不问断的应用服务，让客户的服务请求能够继续运行，保证信息系统提供的服务完整、可靠、一致。数据备份是容灾系统的基础，也足容灾系统能够正常工作的保障；应用备份则是容灾系统的建设目标，它必须建立在可靠的数据备份的基础之上，通过应用系统、网络系统等各种资源之间的良好协调来实现。

根据IBM公司SHARE78标准，容灾技术可以分为7个层次，从无任何容灾备份措施，到将备份的磁带存储在异地，再刮建立应用系统实时切换的异地容灾备份中心，数据和应用的恢复时间从数天到几个小时甚至几秒。一个完整的容灾备份系统包括本地数据备份、远程数据复制和异地备份中心。当然，并不是所有的企业都需要这样一个系统，只有对不可中断的关键业务才有必要建立容灾备份中心。而小型企业通过建立NAS或SAN的离线数据备份和人为的数据转移就可以达到很好的容灾备份效果。

1、容灾方案的分类

目前有很多种容灾技术，分类也比较复杂。但总体上可以区分为离线式容灾（冷容灾）和在线容灾（热容灾）两种类型。

所谓的离线式容灾主要依靠备份技术来实现。其重要步骤是将数据通过备份系统备份到磁带上面，而后将磁带运送到异地保存管理。这种方式主要由备份软件来实现备份和磁带的管理，除了磁带的运送和存放外，其他步骤可实现自动化管理。整个方案的部署和管理比较简单，相应的投资也较少。但缺点也比较明显：由于采用磁带存放数据，所以数据恢复较慢，而且备份窗口内的数据都会丢失，实时性比较差。对于资金受限、对数据恢复的RTO和RPO要求较低的用户可以选择这种方式。

在线式容灾要求生产中心和灾备中心f同时工作，生产中心和灾备中心之间有传输链路连接。数据自生产中心实时复制传送到灾备中心。在此基础上，可以在应用层进行集群管理，当生产中心遭受灾难、出现故障时，可由灾备中心自动接管并继续提供服务。应用层的管理一般由专门的软件来实现，可以代替管理员实现自动管理。由上面分析可见，实现在线容灾的关键是数据的复制。数据的复制有多种实现方式，各有利弊。由于在线容灾可以实现数据的实时复制，因此，数据恢复的RTO和RPO都可以满足用户的高要求。因此，数据重要性很高的用户都应选择这种方式，比如金融行业的用户。但要实现这种方式的容灾必须有很高的投入。

2、容灾系统的体系架构

从容灾抗毁系统技术的不同实现层次角度来看，一个实用的容灾抗毁系统的体系结构是影响系统工作效能的重要方面。一个典型的容灾系统的体系架构如图所示。

2.1本地容灾技术

本地数据保护可以保证在一些本地的灾难发生的情况下，尽快地恢复业务数据，保证业务的正常运行。本地容灾技术分为数据容灾和服务容灾。

本地数据容灾从技术上主要可分为：磁盘保护技术、快照数据保护技术、磁带/磁盘数据备份技术。本地服务容灾从实现技术上主要可分为：双机热备和本地集群技术。本地数据容灾通过对本地数据进行定时的备份手段，当系统发生故障和人为错误时，可以将备份数据恢复，从而保证了本地数据的安全性。当然系统服务的暂时停顿不可避免。单纯的数据容灾已不能满足人们对关键业务不间断提供服务的需求，因此，服务容灾目前成为应用热点。本地服务容灾通过配置多机环境，达到提高信息系统的高可用性，抗御单点故障的目的。一旦系统发生局部的故障和人为错误，比如，操作系统故障、网络故障、掉电等，本地服务容灾系统可以在用户不可觉察的最短时间内迅速接替故障系统，使系统应用继续运行，确保系统服务的连续性。本地服务容灾典型的实现方式是采用双机热备技术。这种方式是指采用两台服务器进行冗余容错，将两台服务器分为主从服务器，在正常情况下，主服务器提供服务，从服务器保持和主服务器的一致。当主服务器出现故障时，从服务器立即接替主服务器的工作，从而使得一台服务器出现故障不会造成整个系统的崩溃。实际应用时，也可以采用两台服务器互为热备。该项技术的最新发展是采用本地集群技术，即完成多机相互镜像，负载均衡，应用切换功能，保障关键业务的高可用性。本地容灾的局限性本地容灾可以避免服务器单点故障对信息系统的打击，提高系统的高可用性。但是，当发生区域性、毁灭性的灾难时，如火灾、爆炸、地震、水灾、战争、雷击等，单纯的本地容灾无法保障系统的高可用性，导致正常业务无法进行、重要数据丢失、破坏，造成的损失将不可估量。因此，全面的异地容灾保护解决方案应运而生。异地系统容灾通过物理距离将生产中心与容灾中心绝对隔离开，这样可以预防区域性、毁灭性的灾难。

2.2异地容灾技术

本地数据备份是容灾系统建设的前提基础，而通过对重要业务的远程异地容灾技术，从而增强数据中心的区域性抗打击能力，保障数据安全及业务系统连续性，才能真正实现一个安全的关键业务信息系统。异地容灾技术按上述体系结构分为3个层次数据容灾技术、网络容灾技术、服务容灾技术。

2.2.1远程数据客灾技术

远程数据容灾是指通过将本地数据在线备份到远离本地的异地数据系统保存，当灾难发生后，可以通过数据重构，来达到抵御区域性、毁灭性灾难，保护业务数据的目的。但关键业务服务的暂时停顿不可避免。远程数据容灾技术可以分为如下几类：（1）远程磁带数据容灾技术；（2）基于智能存储系统的数据容灾技术，（3）基于服务器卷的数据容灾技术；（4）基于文件系统的数据容灾技术；（5）基于数据库的数据容灾技术。

2.2.2网络容灾技术

随着网络的飞速发展，越来越多的用户将这一网络作为提供协同工作、电子商务、教育和休闲娱乐的一条便捷途径。如何防止业务中断或者在中断不可避免时将业务的损失降至最低成为一个关键问题，因此，网络的可生存性成为网络设计中必须考虑的一个方面。网络生存性是指网络在遭受各种故障，如通信人为故障和客观因素导致的通信事故等时，仍能维持可接受的业务质量的能力。按照网络生存性性能工作组的定义，网络生存性包括两个方面：（1）网络出现故障的情况下，通过各种恢复技术，来维持或恢复网络服务使性能达到可接受的程度。（2）网络通过应用预防技术，从故障中减轻或预防服务失效。提高网络可生存性的相关方案，有基于底层光网络的技术，也有基于IP层的技术以及这些技术的融合。常见的网络容灾技术有全光网络可生存技术、SDH网络可生存技术、IP层网络可生存技术。

2.2.3服务容灾技术

一个全面的容灾抗毁系统不仅仅是提供数据级、网络级的保护，它的一个重要功能就是为了保证信息系统的连续运行，也即保证业务的高可用性，并向用户提供不间断的、可靠的服务。为了实现这个功能，当发生灾难时，需要将生产中心的业务转移到容灾中心去运行，这就是服务容灾技术要解决的问题。服务容灾的另一个目的是保证服务的自动无缝迁移，让用户感觉不出提供服务的主体发生了变化。

正常情况下，系统的各种应用运行在生产中心的信息系统上，生产中心数据阔步或异步地实时复制到容灾中心，数据同时存放在生产中心和容灾中心的存储系统中。当生产巾心由于断电、火灾甚至地震等灾难无法正常工作时，则将业务处理、网络通信线路切换至容灾中心，保证业务的连续运行。因此，应用级容灾需要建立一个同生产系统相一致的生产中心备份系统。在没有发生灾难的情况F，由生产中心对外提供服务，容灾中心则实时跟踪生产中心的处理，同时备份生产中心的相关信息，确保在灾难发生时，能将信息服务功能切换到容灾中心，实现生产中心的功能，抵御灾难。服务级容灾足在数据级容灾的基础上，增加对整个服务的备份，使得投资较高，要求提供业务连续性的应用平台，数据、传输线路、基础设施等所有环节的容灾备份，实现的技术要求高，难度大。因此，一般用于对、也务连续性要求很高的系统中，如金融银行系统、电信营业帐务系统等。

目前，己经出现多种与服务容灾相关的技术，包括失效检测技术、服务迁移技术。其中有代表性的失效检测技术有心跳技术，主要的服务迁移技术包括基于DNS的服务迁移技术、基于IP重定向的服务迁移、基于集群的服务迁移。

3、数据备份实现技术

3.1服务器层的数据复制

在生产中心和灾备中心的服务器上安装专用的数据复制软件，以实现远程复制功能。两中心间必须有网络连接作为数据通道。可以在服务器层增加应用远程切换功能软件，从而构成完整的应用级容灾方案。这种数据复制方式相对投入较少，主要是软件的采购成本；兼容性较好，可以兼容不同品牌的服务器和存储设备，较适合硬件组成复杂的用户。但这种方式要在服务器上运行软件，会影响服务器性能。

3.2交换机层的数据复制

存储交换机技术的发展使交换机可以实现更多的功能。很多原来由服务器和存储变现的功能现在也可在交换机层实现，比如存储虚拟化。同样，现在有些厂家的交换机产品已经可以实现复制功能。在生产中心和灾备中心都要部署这种交换机，并在交换机之间通过专用链路连接起来。由于交换机可以管理和复制的数据是存放在存赌层内的，因此，用户需要将生产数据都存储在交换机所连接的存储没备中，这样就可以实现交换机对数据的管理和复制。目前使用这种技术的产品还不是很多，成熟性还有待提高，具有这种功能的交换机价格也相对较高，所以采用这种方案的用户比较少。

3.3存储层的数据复制

现在的存储设备经过多年的发展已经十分成熟，特别足中高端产品，一般都具有先进的数据管理功能。远程数据复制功能几乎是现有中高端产品的必备功能。要实现数据的复制需要在生产中心和灾备中心都部署一套这样的存储系统，数据复制功能由存储系统实现。如果距离比较近（几十公里之内），之间的链路可由两中心的存储交换机通过光纤直接连接；如果距离在200公里内，可通过增加DWDM等设备直接进行光纤连接l超过200公里，则可增加存储路由器进行协议转换途径WAN或Internet实现连接。因此，从理论上可实现无限制连接。在存储层实现数据复制功能足很成熟的技术，而且对应用服务器的性能基本没有影响。在应用层增加远程集群软件后就可以实现自动灾难切换的整体容灾解决方案。目前，这种容灾方案稳定性高、对服务器性能基本无影响，是容灾方案的主流选择。

4、结束语

建立企业容灾备份机制篇6

【摘要】数据库的备份是一个长期的过程，而恢复只在发生事故后进行，恢复程度的好坏很大程度上依赖于备份的情况。随着办公自动化和电子商务的飞速发展，国内越来越多的企业已经意识到存储信息的重要性，正处于从数据分散存储向集中存储转变的过程，开始投资搭建存储系统，但许多企业还没有意识到容灾备份是信息存储的一个重要环节。本文从容灾备份的概念、必要性、预先考虑的因素、容灾备份等级、容灾方案的选择等几方面论述了如何建立企业容灾备份机制。

【关键词】企业容灾备份

【中图分类号】TM732【文献标识码】A【文章编号】1672-5158（2013）02-0409-02

数据备份，实际上就是给企业重要的数据买保险。当你了解到国内各大数据恢复公司每天都会应对使用者捧来的一大堆需要急救的硬盘，了解到企业工厂数万元用以专业数据备份设备的投入，了解到美国关于9.11后90%公司在发生灾难性数据丢失后在两年内倒闭的报告，你就会知道企业数据容灾有多么的重要了。

一、容灾备份的概念

广义上讲，灾难恢复计划的实施包括日常维护、灾难恢复、恢复后三个阶段。在日常工作中，日事业单位要按照计划和分工，认真及时地开展系统维护与相关记录工作，包括硬件巡检、数据备份、为软件打补丁、病毒查杀、资料收集与管理，等等。对出现故障的如硬件，要及时修复。对关键设备，要规划、装备必要的冗余设备，以备不时只需。

容灾备份是通过特定的容灾机制，在各种灾难损害发生后，仍然能够最大限度地保障提供正常应用服务的信息系统。容灾备份可以分为数据备份和应用备份。数据备份需要保证用户数据的完整性、可靠性和一致性。而对于提供实时服务的信息系统，用户的服务请求在灾难中可能会中断，应用备份却能提供不间断的应用服务，让客户的服务请求能够继续运行，保证信息系统提供的服务完整、可靠、一致。

数据备份是容灾系统的基础，也是容灾系统能够正常工作的保障；应用备份则是容灾系统的建设目标，它必须建立在可靠的数据备份的基础之上，通过应用系统、网络系统等各种资源之间的良好协调来实现。一个完整的容灾备份系统包括本地数据备份、远程数据复制和异地备份中心。当然并不是所有的企业都需要这样一个系统，只有对不可中断的关键业务才有必要建立容灾备份中心。而小型企业通过建立NAS或SAN的离线数据备份和人为的数据转移就可以达到很好的容灾备份效果。

二、灾备工作注意要点

灾难恢复的目的是保证业务的延续性，为了达到这个目的，必须保证业务相关数据的完整性、可用性等，因此其解决方案应包括一套标准的多层次数据保护方案，可以在不同的产品和平台上实施。制定方案需注意以下几点：

1、明确优先权：当使用相对廉价的第二、第三级存储就可以满足需要时，采用昂贵的第一级存储就是一种浪费。所以有必要评估数据的存储需要，然后判断哪些信息确实需要持续备份，并保持可用性。

2、建立快速、准确的恢复能力。企业必须具备快速、及时地将关键数据恢复至某一特定时间点的能力，实现这一能力需要三个层次的保护：CDP、快照和完整备份。

3、经常测试数据恢复状况。如果复制的数据无法恢复，那么备份系统没有任何价值，但是，这种情况却经常发生。灾难恢复系统的无中断测试应该在首要和次要场所有规律地执行（每天、每周、而不是每季、每年）。这些测试应该在系统联机时进行，在不影响用户和流程的情况下备份任何变更。

4、巩固和复制。备份数据中心是最低的要求，然而，在今天分布式和移动式的办公环境中，仅仅有这些还不够，必须考虑远程数据，他们也应该有规律地备份到主数据中心。因为，所有场所的数据都应该被保护，而将数据远程复制至总数据中心将更便利、更安全。

5、远程复制，重复使用分支结构。将一个或多个远程分支结构作为灾难恢复场地，并将主数据中心的数据复制到该地点是一项明智之举。当然，企业也可以选择合作伙伴的场地和设施，但可能需要通过加大带宽或使用WAN优化应用来完成完整复制。灾难恢复成本可能很高，因此，重复使用分支机构对灾难恢复来说可能更明智。

三、灾难备份等级的确定

1.确立灾难备份恢复目标

企业在设计容灾方案时，应充分考虑投资因素，即灾难恢复方案的投资一定要小于灾难本身带来的经济损失，灾难备份等级确定的出发点体现在三个指标：数据恢复点目标、恢复时间目标、网络恢复目标。

数据恢复点目标：灾难发生后，恢复运转时数据丢失的可容忍程度；

恢复时间目标：灾难发生后，需要恢复的紧迫性也就是多久能够恢复的问题

网络恢复目标：灾难发生后，工作网点什么时候才能通过备份网络与数据中心重新恢复通信的指标。

企业核心流程由于灾难发生而无法正常运行时对企业的损失可能是可以量化的，也可能是无形的损失，企业灾备方案制定者必须在认真研究应用系统的业务需求后通过对可量化和不可量化损失的综合考虑，得出灾难受损的可容忍度以及损失的决策依据。

2.依据恢复目标确定灾备等级

2005年4月，国务院信息化工作办公室下发《重要信息系统灾难恢复指南》，指南将灾难恢复划分为6个等级：

第一级基本支持

第二级备用场地支持

第三级电子传输和部分设备支持

第四级电子传输及完整设备支持

第五级实时数据传输及完整设备支持

第六级数据零丢失和远程集群支持

每个灾难恢复等级都有以下管理要素的相应要求（详细内容可查阅国家规范《重要信息系统灾难恢复指南》）：数据备份系统、备用数据处理系统、备用网络系统、备用基础设施、技术支持、运行维护支持、灾难恢复预案。

四、灾备方案的选择与比较

灾难备份等级确定之后，即可以开始灾难备份方案的研究和确定。当前国际流行的灾备方案主要包括以下几种：

基于存储设备的灾备方案：方案基本思路是备份中心配置与生产中心完全相同的存储设备，通过相关的控制软件在两则的存储设备上实现数据的同步镜像，保证数据的一致；此种备份方式是通过存储系统与主机系统分隔而实现的，因此可应用到多种系统平台上，使一种开放性的体系结构。

基于操作系统的灾备方案：方案基本思路是通过安装在生产中心操作系统上的灾备软件，对其操作系统的指令进行监控，并利用预定的数据操作模式完成数据的备份操作。此种备份方式可以使用第三方软件提供灾难备份功能，并能够适应各个厂家的存储硬件设备。

基于数据库的灾备方案：方案基本思路是在灾备中心建立与生产中心对等的数据库，生产中心数据库在产生数据库日志的同时，自动将日志文件传输到在被中心数据库，并将日志文件运行于该数据库，从而保证生产中心数据库和灾备数据库的数据一致性。

基于应用系统的灾备方案：方案基本思路是对待处理的业务数据，通过网络分别传输至生产中心和灾备中心进行处理，保证在灾难发生后，系统能够继续处理业务，并实现各节点间数据的一致。

五、结束语

三级综合医院的容灾系统方案探索篇7

随着医疗机构信息化建设的不断深入发展各级医疗机构相继建立起医院信息管理系统 (HIS) 。医院信息管理系统对现代化医院的日常运作起着至关重要的作用。医院日常运作的每个步骤都离不开信息管理系统:具体到每位就诊病人的挂号、就诊、住院、收费、查询;重要到财务部门的计费、统计;深入到医院管理层的统计、数据分析、监管、决策等等, 都无法脱离信息管理系统而进行, 换言之, 信息管理系统需要全年365天、全天24小时不间断运行。因此, HIS系统的安全、连续运行显得非常重要, 尤其是对三级综合医院而言。因为三级综合医院的高峰期业务并发量大、产生海量数据, 一旦信息管理系统出现影响正常运行的严重故障, 会令医院业务处于瘫痪状态。因此, 探索一种行之有效的容灾系统管理方案有其实际应用意义。鉴于容灾系统一般分为狭义的本地性的数据容灾及远程的系统容灾, 因此, 声明本文探索的容灾系统主要以狭义上的容灾系统为主, 即数据容灾系统。

2. 概念

容灾系统, 是指提供给计算机信息系统的一种应付灾难的特殊环境。当信息系统在遭受影响到系统正常运行的灾难时, 容灾系统将启动保护用户数据的安全机制, 更高级的容灾系统, 还能提供不间断的应用服务。因此, 容灾系统可看作是数据存储备份的最高形式。

在医院管理系统中, 容灾就是借助科技方法、控制方法, 还有所有能够享有的控制资源, 推动部分非常重要的信息、控制重要信息的方法、重要的工作, 从意外出现之后能够最大限度的保持正常的环节。医院信息系统容灾目的, 除了希望维持信息完整性, 同时应推动关键工作能够顺利开展。当医院管理信息系统出现严重故障时, 仍然可以不中止或在极短时间内给关键工作奠定坚实的基础, 另外要最大限度防止关键信息出现遗漏, 推动关键工作顺利开展。

3. 设计关注要点

容灾系统的设计需考虑以下要点[1]:

3.1 Recovery time objective也就是恢复时间目标, 通常叫做RTO

意外情况出现之后, 信息系统在时间方面的明确标准。RPO主要为了防止信息遗漏, 也就是系统接受遗漏的数据量越小, RPO的值越小。

3.2 Recover point objective也就是恢复点目标, 通常叫做RPO

意外情况出现之后, 系统还有信息一定要达到相应标准, RTO针对的是服务丢失, 即系统服务的紧迫性要求越高, RTO的值越小。

3.3 Resumption重续

灾难务份中心替代主中心, 推动重要工作顺利进行的环节。

3.4 Return回退Restoration复原

信息系统由灾难备份中心再次循环至主中心的运行的过程。

4. 设计和实现

医院管理信息系统主要围绕计算机资源、传输资源还有存储资源进行经营。计算机资源也就是计算机服务器还有业务处理服务器;传输资源也就是网络还有网络交换设备;存储资源主要表示不同的信息保管装置。医院信息控制系统关键将上述不同方面当作工作中心开展的。

4.1 针对计算资源的保护

一般容灾保护关键借助了服务器群集技术有效的开展。习惯上将医院管理信息系统结构划分成三层:即表示层、业务逻辑层和数据访问层。

数据库服务器主要安装在数据访问层, 主要借助了双机热备方式。这类手段通常能够从A、B两台数据库服务器得到合理的采纳, 能够借助互备方式、主从方式、并行方式等不同的交互方式。系统运行时, A、B服务器开始对外提供服务, 此时A、B会设置成比较普通的IP地址, 随之能够把服务请求转交到A、B之内。在这个过程中, 服务器能够借助心跳线科学合理的监督其他服务器实际运行现状。在A出现故障时, B则按照心跳具体现状进行审核, 同时开展转变, 提供相应的服务, 上述环节能够通过分钟级计算确切阶段中有效开展, 能够避免给业务产生阻碍。将保管装置共享当作前提, 所以A、B服务器所控制的为一致的信息, 通过双机还有集群软件开展综合控制。借助之前提到的服务器群及方式, 在计算机资源出现意外情况之后, 可以从确切阶段中保持正常工作, 推动关键工作能够顺利进行。

从表示层还有业务逻辑层范围之内, 关键装置是应用服务器还有页面服务器。上述装置仅仅能够进行应用服务还有用户访问界面, 不需保存数据, 因此需配置多台服务器来均衡负载运行, 而无需使用共享存储设备。这样设计可以避免单点失效, 更好地实现容灾, 同时也保证了服务器实际工作效率, 保证访问水平。

在服务器出现意外情况之后, UPS通过相应的处理能够科学合理的解决突发问题。UPS冗余并联可恢复多种UPS设备其自身的灾难。当主机故障停机, 系统将会瞬间自动选择另一台UPS作为从机实际经营活动, 能够真正做到连贯供电。

4.2 针对传输资源的保护

RTO通常能够借助传输资源有效维持真正做到, 主要涵盖了虚拟路由技术还有双链路冗余、负载均衡科技。虚拟路由技术呢非常典型的为虚拟路由冗余协议, 也就是VRRP, 能够借助依次从医院信息管理系统服务器还有普遍采纳的协同工作路由器一起营造产生虚拟路由器同时正常工作。虚拟路由器能够实际展示在安排相应的IP地址还有MAC地址逻辑路由器。这一组路由器同时兼具两种功能:主控功能还有备份功能, 往往通过相应的路由器开展相应的管理, 不过仅仅能够包括一个路由器。VRRP协议能够借助选择策略科学合理的判断主控功能, 能够通过ARP对信息进行相应的处理。另外另外的路由器往往保持待命功能, 假如主控路由器产生意外情况, 那么备份路由器即在几秒钟内转变为成主路由器。由于这种切换方式瞬间完成, 并且无需更改IP地址及MAC地址, 因此能使医院信息管理系统的用户非常的明确。

此类科学有效的网络规划能够有效做到备份还有负载均衡等不同功能。另外要求A、B路由器一起从不同组内进行备份:给组1中的A路由器设定IP地址;给组2中的B路由器设定IP地址。给客户端1的默认网关设定为路由器A;给客户端2、客户端3的默认网关设定为路由器B。通过上述方式, 不但能够有效的分散负载还有网络流量, 同时可以保证网络自身安全水平。同时, 能够有效借助高新科技降低冗余水平。

4.3 针对存储资源的保护

存储资源通常情况下关键开展存储信息这一作用, 所以从数据库服务器群统一往往借助双链路双控制器冗余的存储阵列, 另外能够借助镜像方式开展相应的处理。因此虽然从共享存储中的任一盘阵离线, 仍然能够不间断提供服务。

同时建议利用CDP连续数据保护技术在信息方面开展相应的存储和保管。这一科技能够及时发现所有信息做出的调整, 也能够在备份对象中开展相应的调整, 在某些情况下能够推动时间点保持正常。硬盘环节同样能够安排RAID容错报错和具有热拔插功能的方式, 假如硬盘出现问题, 则必须对硬盘进行替换, 系统依旧可以顺利工作, 避免中断或关机。

5. 容灾系统的维护和管理

由于采用以上方式制定的信息管理系统容灾方案能够科学合理的提高数据自身安全性水平, 由于这个容灾系统平时额保养还有控制同样变的非常关键。信息控制机构日常要按阶段在机房中开展相应的检察, 能够按阶段检验所有的工作日志;在操作系统、数据库、服务器还有存储硬件监视软件、路由交换设备等等, 管理员应定期分析系统的运转状态。严格管理操作系统以及数据库的用户和口令, 及时删除作废的帐户, 定期更改旧口令, 及时更新杀毒软件病毒库。值得注意意的是:如数据库系统和数据文件等应当避免被杀毒软件扫描的目录和文件要及时设置到杀毒软件白名单, 以免杀毒软件出现意外情况能够给服务器造成非常恶劣的影响, 某些情况下将导致系统崩溃。按阶段开展排练, 及时发现容灾方案从出现不同意外情况的机率。

科学合理的平时控制手段能够尽可能的降低出现意外情况的可能性, 有效的防止意外情况出现, 科学合理的环节系统恢复负担。

参考文献

承德电力通信网容灾建设方案思考篇8

为保障通信网承载业务信息的可靠、高效传输, 提高通信网络在自然灾害和突发事件时的业务支撑和保障能力, 开展电力通信容灾系统建设。电力通信网络容灾建设指为满足公司电网备用调度体系和信息灾备体系建设的需要, 在现有通信网基础上, 结合落实“十二五”通信网规划, 对承德供电公司通信网络结构、通道组织、设备配置等, 进行必要的改造、调整和完善, 构建承德供电公司通信网络第二汇聚点, 构建逐级双汇聚、双上联的高可靠通信网络容灾体系架构, 确保在主调节点失效情况下电网调度数据、调度电话、信息化数据等通信业务及对通信网的管控能力不受影响。

1. 容灾建设的要求

1.1 基本要求

(1) 安全性、可靠性

当主要汇集节点失效后, 相关电网调度及企业管理信息化业务仍能保证安全可靠上传和下传。即必须确保独立性, 第二汇集节点对下及对上的正常通信不依赖于主要汇集节点。

(2) 整体性、统一性

地 (县) 公司形成完整的方案, 确保上下整体衔接。 (3) 经济性、实用性

充分利用公司系统现有通信网络, 加强资源整合优化, 严格控制造价, 所需费用原则上在本级通信“十二五”规划投资总额内优化调整、统筹安排。强调简洁实用, 针对实际需要解决问题, 提出务实的解决方案, 杜绝张冠李戴和铺张浪费。

1.2 具体要求

1) 地、县二级通信网设立第二个汇聚点, 在第一汇聚点 (主调) 失效的情况下, 第二汇聚点无需通过第一汇聚点仍可实现对各调度对象 (数据、语音、通信设备状态信息) 的可靠采集。

2) 上级网络的汇聚点, 只需连接到下一级网络的2个汇聚点, 无需深入到各调度对象信息采集点。

3) 各级网络逐级双汇聚, 下一级网络的2个汇聚点与上一级网络的2个汇聚点之间双交叉、双连接。

4) 同级网络2个汇聚点之间亦相连, 便于平时数据备份、管理等。

2. 传输网现状及存在问题

2.1 传输网现状

承德电力通信网在35kV以上变电站及营业网点配备光传输设备, 220kV变电站配备调度交换机、调度数据网设备, 110kV以上变电站配备综合数据网设备, 各县分公司与地区公司实现行政交换机联网。

承德地区光传输系统形成了“220 kV干线成环, 110kV成网”的电力光纤通信传输网。微波传输系统主要提供承德供电公司到华北局的空中传输通道, 西地站、袁庄站和煤岭沟站到局中心站部分业务的备用通道。承德地属山区, 大部分末端变电站只有一条线路, 不具备第二条光缆路由, 多数110kV变电站配备单套光设备, 因此需要载波通道作为调度电话和远动信息的备用通道。只有一部卫星电话, 作为应急通信使用。

2.2 存在的主要问题

地 (县) 级通信网没有第二汇集点, 所有信息通道汇集到县调和地调, 集控站信息也是从县调和地调引入。在第一汇集点 (主调) 失效的情况下, 不能实现对调度对象的信息 (数据、语音、通信设备状态信息等) 的可靠采集。更没有必要的传输设备、调度电话交换设备、数据网设备、通信监控及网络管理设备等。

县级电网调度体系信息通道一般只到县调, 没有上传至承担其备调功能的地级调度中心。

地 (县) 公司数据中心不具备第二出口, 当地 (县) 公司数据中心出现严重失效, 地 (县) 公司本部及其下属单位用户不能通过本单位信息网络第二出口访问信息中心业务资源。

地、县级网络没有逐级双汇集, 下一级网络的两个汇集点与上一级网络的两个汇集点之间双交叉、双连接。

3. 容灾建设方案

3.1 传输网

3.1.1 第二汇聚点选取

根据国家电网公司的指导意见, 环状或网状结构的通信网可选择拓扑中的某个枢纽节点作为第二汇聚点。第二汇聚点应优先考虑光缆资源丰富、便于同其他通信节点相连和汇集业务、可直接连接至上级通信网、与第一汇聚点保持适当距离

的站点。承德供电公司地级第二汇集点选在某220kV站, 是电网的重要节点, 供电可靠性高, 交通便利且距地调有一定距离, 是规划中10G光传输设备环路的一个节点业务容易实现互联互通。光缆资源丰富, 与承德县、兴隆县、滦平县、丰宁县、隆化县第二汇集点有光缆直连, 距离不超过60公里, 与宽城、平泉、围场第二汇集点距不超过120公里。通道组织迂回路由多, 到备调 (省调) 的通信路由组织更灵活、更可靠。该站传输容量充足, 扩展能力强, 利于网络结构调整。该站具备建设第二汇聚机房的外部环境和内部条件, 拥有充足的扩容空间和足够的电源容量。

县级第二汇集点选在县城内220kV站, 是县域电源的中心, 光缆汇集中心, 组网结构简单, 较容易实现, 通信机房环境较好, 投资较少。

3.1.2 网架结构

承德供电公司通信网络骨架随电网同步建设, 要实现地、县级网络没有逐级双汇集, 下一级网络的两个汇集点与上一级网络的两个汇集点之间双交叉、双连接十分困难, 相当多光缆只是单链路, 单路径, 而且有相当多关键路径光缆富余芯数不超过6芯, 目前, 只能做到设备的双连接, 路径只能随主网络的完善而改善。

3.1.3 通道组织

电力通信网主干通道采用SDH 2.5G通道。各县调直接连接到区调, 县域第二汇集点直接连到地区第二汇集点, 链路带宽622M。220kV站分别连接到区调和地区第二汇集点, 采用SDH 2.5G通道, 110kV站通道就近连接到220kV站, 采用SDH 622M通道, 35kV站通道分别连接到县调和县域第二汇集点, 采用SDH 155M通道。

3.2 业务网

传输网县级两个汇集点到地级两个汇集点之间形成了双路由, 其它业务网依托在传输网之上, 所以能够实现在第一中心严重失效时, 能顺畅、安全的将信息汇聚并传输至第二中心及上级网络。

3.2.1 调度数据网

220kV站、110kV站分别连接到区调和地区第二汇集点, 采用2*2M通道。35KV站通道分别连接到县调和集控站, 采用2M通道。

3.2.2 调度交换网

在县调和县域第二汇集点配置调度交换机。县分公司系统和220kV系统调度交换机分别接入区调或地区第二汇集点, 每一点对上一级有双路由。采用2M通道。110kV系统接入220kV站调度交换机, 35kV系统接入县调和县域第二汇集点调度交换机。

3.2.3 综合数据网

220kV站分别连接到区调和地区第二汇集点, 采用GE通道。110kV站就近接入县调和县域第二汇集点35kV站就近接入110kV站。

3.3 网管系统建设方案

为保证承德电力通信系统在中心通信站失效时, 第二汇聚点仍能对承德电网通信专用网内的所有通信设备进行正常的管理, 需要在第二汇聚点建立一套备用综合网管系统, 各传输网的网管终端将第二汇聚点的网元作为网关接入于网内。由于第二汇聚点的网管数据需要与中心通信站点的网管数据实时同步, 因此现有网络的网管宜采用异地双机热备份系统。在县地两级调度和第二汇集点设县地两级通信网管系统, 县级网管系统传输到地级调度和第二汇集点。

4. 结束语

为满足承德地区电网备用调度体系和信息灾备体系建设的需求, 文章提供了一种在现有通信网基础上, 对承德电力通信网络结构、通道组织、设备配置等进行必要的改造、调整和完善的方案。本建设方案依据承德市备调建设计划, 内容涵盖承德电力通信网络第二汇聚点的选址和建设。同时, 本方案包括为满足省、地、县通信网络容灾需求所必须的地区光传输网、调度交换网、综合数据网、通信网管的优化和改造, 各类业务的通道组织, 相关设备配置等。

通过该工程项目的实施, 构建了承德电力通信网络第二汇聚点, 实现了地区通信网的逐级双汇聚、双上联的高可靠容灾体系结构, 确保了在主调节点失效情况下电网调度数据、调度电话、信息化数据等通信业务及对通信网的管控能力不受影响, 为承德地区电力通信网的安全保障提供了行之有效的解决方法。

摘要：文章分析了容灾建设的要求, 介绍了承德电力通信传输网容灾系统的建设方案, 并着重对地骨干网容灾建设思路进行了详述, 为今后通信网建设提供了参考建议。

关键词：电力通信,容灾,传输网

参考文献

[1]国家电网公司.国家电网公司“十二五”电网规划[R].2010.

硬盘播出系统故障浅析和容灾方案篇9

1、硬盘播出系统概述

随着计算机技术的发展与应用, 在多媒体领域的应用也日益广泛。视频和音频等媒体信息都以文件的形式储存在硬盘中。这种产品有个名称, 叫硬盘播出系统。

2、播出系统故障与应对

硬盘播出系统长时间的使用, 必然会导致各种故障的出现。在实践中, 发现有软件问题引起的故障, 也有硬件问题引起的故障。现举以下两种故障现象进行分析与应对, 并提出容灾方案。

2.1 系统管理服务器无法启动

(1) 故障现象分析:系统管理服务器无自检一直显示黑屏。黑屏故障一般是显示器损坏、主板损坏、显卡损坏、接触不良、电源损坏、CPU损坏、零部件温度过高等几个方面所致。

(2) 应对方法:首先, 重新接过了一下显卡线发现故障依旧。然后, 把系统管理服务器的系统硬盘拆下来, 因为架构网络的时候用的都是同一型号的主机, 所以装在播出服务器备机上, 开机发现正常。为了快速解决问题不影响制播传送, 临时把播出服务器备机做为系统管理服务器使用, 故障解决。最后, 通过检测已坏的系统管理服务器, 发现是因为主机主板损坏而引起的黑屏。

2.2 数据库日志文件增长影响数据读取

(1) 故障分析:数据库记录了大量重要数据。数据文件是由主文件和日志文件一起组成的, 数据文件中记录的是有效的应用系统数据。而日志文件则是数据库厂家从有效的数据恢复角度考虑创建的冗余数据文件, 正是由于日志文件的快速增长才导致了应用数据库的急速膨胀, 影响系统数据的读取。

(2) 应对方法:首先, 对数据库备份后进行压缩但效果不明显。其次, 检查数据库的每张数据表, 发现引起数据库超大的数据表为“BROADTONGJI”, 其记录数达到8000万条, 立即对该数据表进行清理, 删除, 但日志文件依然增长。又重新安装了数据库, 并导入了相应的基础数据。但这样做引起了数据库里的内部冲突, 导致广告段无法保存修改。最终, 只好恢复原有的数据库, 保证系统的稳定性。我们要求厂家对数据库进行检测。

3、提出容灾方案

我们不仅要平时做好技术维护工作, 延长系统的使用寿命, 还要避免单点故障的发生, 需进一步深度思考。做为一名广播电视从业者, 我们应该认识到播出系统容灾的必要性, 特别是数据库安全与否直接影响着全系统的安全, 我们应当把建设一个安全的容灾数据库系统提到日程中来。下面我们来探讨一下以Windows体统为平台的稳定而又高性价比的容灾解决方案。

容灾, 指的是保护用户的应用和数据不受故障、灾难影响, 确保持续使用。容灾从应用上来说, 分为:在线实时容灾和离线容灾;从距离上分为:本地容灾和异地容灾。因此, 得到了一下四种方式:本地离线容灾、本地在线容灾、异地离线容灾、异地在线容灾。从容灾效果上来说, 这四种方式的容灾效果是由低到高。在实际的应用中, 我们可以根据自己的硬件环境、需要选择不同的方案。在这里我想说的是在线式SQL2000数据库容灾系统的构建。

EMC AutoStart在Windows平台上的容灾解决方案比较全面, 它采用双机镜像的形式实现数据库1:1备份, 具有智能化数据平台管理机制, 当系统中一台数据服务器出现故障时, 会自动唤醒另一台数据服务器对系统进行接管, 保证用户数据系统在很短的时间内收复正常工作, 系统正常工作时, 两台数据服务器为主备关系, 当用户向主数据服务器写入数据时, EMC AutoStart自动实现数据镜像到备数据服务器, 实现数据双备份, 让用户以极小的成本实现完美的容灾效果, 是Windows平台的SQL数据库较好的容灾方案。如下图1所示。

其工作过程如下:

(1) 在两台数据服务器上安装EMC AutoStart软件, 主备数据服务器选择及数据库之间的数据镜像工作由该软件完成。 (2) EMC AutoStart自动检测两台数据服务器工作状态, 一但异常, 将产生错误日志, 以供用户查看。 (3) 当主数据服务器出现故障, 自动将备数据服务器接管, 转成主数据服务器工作。 (4) 当原坏的的数据服务器修复后, 可通过EMC AutoStart将其转成备数据服务器, 并自动将数据镜像到其中。

4、结语

安全播出是广播电视的生命, 也是电视台技术工作的重点。保证硬盘播出系统正常运行是长期而艰巨的任务。我们必须根据实际情况不断学习、摸索, 登上更高的台阶去驾驭它们。相信硬盘播出系统的安全问题必然越来越重要, 值得我们关注。

摘要：随着国家加快推进电信网、广播电视网和互联网三网融合, 从根本上推动了传统媒体的技术变革不断加快, 新媒体新技术日新月异, 这给从事广播电视事业的技术人员提供了广阔的想象空间和施展才能的舞台。进一步提高电视节目播出质量, 保障安全优质播出, 是电视技术工作者必须关注的问题。本文就对播出系统运行中出现的故障进行分析并提出容灾方案。

关键词：三网融合,硬盘播出系统,容灾

参考文献

[1]广播电视安全播出管理规定电视中心专业实施细则.国家广播电视安全播出调度中心, 2010.

容灾解决方案篇10

GSM移动通信网络经过多年快速发展, 网络规模不断扩大, 用户对网络质量要求不断增高, GSM移动通信网络承担的社会责任也越来越大。网络对MSC server的容量合理配置及话务合理分配提出了更高的要求、网络安全、下一代网络的演进等, 所有这些都成为运营商亟待解决的问题。正是针对这些需求, 在软交换大规模的投入使用之际, 通信业界推出MSC POOL功能, 其最大优势在于网络容灾能力, 同时不仅充分结合简化网络扩容、合理分配话务的特点, 还可以优化网络资源。

二、MSCPOOL概述

2.1MSC POOL概念

MSC池即MSC Pool, 是一组若干MSC可以构成一个MSC池, MSC池服务的区域称为MSC池区, 即MSC Pool area。从无线侧RNC/BSC的角度看, 如果一个或多个RNC/BSC从属于某一个MSC池, 那么这些RNC/BSC的所有的业务区即构成MSC池区, 池区内的用户由MSC池中的MSC共同服务。

MSC POOL (A/IU FLEX) 解决方案本质上是移动性管理的增强功能, 它通过在接入层设备 (BSC/RNC) 和核心网设备 (MSC/VLR) 之间部署路由功能实体, 达到终端寻址绑定到特定核心网节点设备的能力。该路由功能实体可以部署在接入侧设备;也可以部署在核心网设备。

2.2MSC POOL容灾

MSC Pool的一大优势就是其容灾能力。Pool池区内的业务负荷分担处理机制使MSC Pool组网具备了MSC级的容灾能力。

2.2.1附着容灾

当MSC Pool中某MSC故障失效时, 注册在该MSC中的用户发起的位置更新业务会被NNSF采用负荷分担算法路由到Pool内其他有效的MSC中 (新MSC) , 在该新MSC下完成位置更新流程, 新MSC直接对MS位置更新, 同时分配含有本局NRI的TMSI给MS。这样MS就附着到Pool内其他有效的MSC上了。

2.2.2主叫容灾

当MSC Pool中某MSC故障失效时, 注册在该MSC中的用户发起的主叫业务会被NNSF采用负荷分担算法路由到Pool内其他有效的MSC中 (新MSC) , 从而实现主叫容灾, 其过程如下:MS在周期性位置更新定时器到时前没有发起主被叫业务, 在周期性位置更新定时器到时后, 主动发起周期性位置更新。NNSF采用负荷分担算法路由到Pool内其他有效的MSC中, 在该新MSC下完成位置更新流程。后续的用户主叫业务自然从该新MSC发起, 屏蔽了原故障MSC, 实现主叫容灾。

2.2.3被叫容灾

上述的负荷分担算法无法实现对被叫业务的容灾, 其原因是MSC Pool内某MSC故障后, HLR将无法发送PRN消息发送到该MSC, 此时注册在该故障MSC中的用户无法做被叫。只有等待注册在该故障MSC中的用户主动做了位置更新或做了主叫从而注册到MSC Pool内其他有效的MSC后, 才能够做被叫。

三、MSC POOL容灾实现方案

3.1组网解决方案

(1) MGW级容灾在A口为TDM承载时可以通过BSC双连MGW做MINI-A-FLEX组网实现; (2) MGW级容灾在A口为IP承载时可以通过BSC通过IP承载网全连MGW做A-FLEX组网实现; (3) SERVER级容灾, 需要保证POOL内各个SERVER的容量不能超设计容量的66%; (4) 端口级容灾, A口电路若是采用TDM, 则需要有33%的冗余;A口若是采用IP方式组网, 则需要IP带宽有50%冗余。

组网示意图, 如下:

3.2容灾数据解决方案

MSC POOL容灾有两种方案:链式备份, 集中备份。

考虑到集中备份需要新建一套备份SERVER, 增加了成本投入, 故选择链式备份。链式备份就是POOL内SERVER依次连环备份, 每个SERVER都做主用SERV-ER的同时也做另外一个SERVER的备份SERVER。

链式备份容灾解决方案: (1) SERVER间的备份通道通过IP承载网; (2) 主叫容灾通过隐式位置更新实现, 无需数据配置; (3) 被叫容灾需要STP和HLR能够把发到故障SERVER的信令消息发送的其备份SERVER上。STP和HLR需要和主备SERVER都开通信令, 并通过信令路由优先级区分到主备SERVER的信令路由, 以到主用SERVER为第一信令路由, 到备用SERVER为第二信令路由。考虑到STP之间有C链过桥链路, STP需要配置非对称备份路由优先级方式进行信令的容灾备份。

3.3容灾实施验证方案

3.3.1容灾测试改造原则

(1) 需要尽可能减少对现网的影响和对现网的改造量。 (2) 容灾能够自动完成SERVER切换或少量人工干预SERVER切换。

3.3.2测试预期

(1) 在MSC POOL内的某SERVER A宕机后, 在SERVER A下的用户能够正常进行业务, 即SERVER A下用户能在第一次做主叫或者做被叫都能正常接通, 但接续时长要比正常情况下略长。 (2) 测试时准备多部终端, 做多次业务测试都能正常完成。 (3) 测试需要在一个周期性位置更新时间内完成, 否则用户在做位置更新时会由NNSF分发到其他SERVER上, 无法验证宕机时一次主叫恢复和一次被叫恢复。

3.3.3测试实施步骤

总体上分为个步骤: (1) 步骤1, 数据准备。 (1) MSC POOL内SERVER完成链式备份数据加载; (2) STP、本地HLR按照非对称信令路由优先级方式配置信令容灾路由数据; (2) 步骤2, 模拟宕机。在SERVER宕机时其到外界信令网元都会中断, 这里就是通过信令中断模拟SERVER宕机。需要将目标SERVER到周边各个信令网元的信令链路全部去激活, 周边信令网元到宕机SERVER信令点不可达。 (3) 步骤3, 容灾效果验证。 (1) 前提:测试号码都需要预先在目标SERVER上注册。 (2) 按照预先准备的测试表进行业务验证, 保证测试号码能正常做主被叫业务和短信业务。 (4) 步骤4, 宕机恢复。 (1) 在目标SERVER宕机测试后, 其下面所带的用户会自动分发附着到POOL内的其他SERVER上。当目标宕机SERVER恢复信令链路后, 需要将POOL内的所有用户均匀分布在各个SERVER上, 保证MSC POOL内SERVER负荷均衡。 (2) 由于宕机期间, 用户会自动附着到POOL内其他SERVER, 这段期间若是在营帐系统修改用户属性则更新到新SERVER上。在恢复后若是用户返回原宕机SERVER则用户数据没有同步更新, 此时需要重启VLR使用户重新位置更新并同步用户属性。 (3) 在宕机恢复后需要观察话务统计检查恢复情况。

四、结束语

MSC POOL对比传统本地网MSC独立端局, 具有诸多优势:池内各个MSC间负荷分担, 可实现资源共享, 提升整个核心网资源利用率, 节省设备投资;MSC POOL组网可显著减少局间切换, 提高网络质量, 增进用户感知;MSC POOL组网可减少局间位置更新, 减少了C/D接口信令流量, 提供了MSC的容量增益;MSC POOL实现了网络的容灾备份, 在池内某MSC故障的情况下, 能自动无缝容灾到池区其他正常MSC上, 基本可做的用户无感知容灾。

参考文献

[1]《3GPP TS 23.236 V6.2.0 (2005-12) “Intra-domain connection of Radio Access Network (RAN) nodes to multiple Core Network (CN) nodes”》

[2]《3GPP TS 25.331 V5.13.0“Radio Resource Control (RRC) ”》

[3]《3GPP TS 25.413 V5.9.0 Technical Specification Group Radio Access Network;UTRAN Iu interface RANAP signaling》

容灾解决方案篇11

本报讯在日前由爱数软件有限公司举办的云计算大会上，其高端备份容灾一体化新品TxCloud云柜正式亮相。TxCloud云柜是一款专门为满足大数据环境下数据备份容灾需求推出的新产品，主要面向大中型数据中心，为之提供一体化备份容灾云计算解决方案。这款采用标准42U一体化机柜式的服务器，集硬件平台和软件平台于一体，选用1U机架式服务器架构，重达850公斤。TxCloud云柜采用了统一的云计算体系架构，在资源池化、法规遵从以及节能环保等方面都有技术突破。

CA Technologies践行自上而下构建云平台

本报讯 CA Technologies 日前宣布公司被IDC评为全球云系统管理软件市场份额两大领导者之一。近年来，通过持续的研发和并购，CA Technologies不仅成为云计算平台管理技术供应商，而且成为云平台技术的提供商，特别是新推出的CA AppLogic 3.0更是受到市场欢迎。值得一提的是，与其他厂商不同，CA Technologies倡导的是自上而下的云平台构建方式，即根据应用的需求来搭建云平台。CA Technologies大中国区总经理孙志伟表示，这一方式能大幅降低云平台的部署成本、极大地缩短部署时间，真正做到从业务出发，实现更高的业务灵活性。

三星福韵系列显示器亮相

本报讯日前，显示器对外发布了三星福韵系列显示器。三星福韵显示器包括B360、B560两个系列。三星福韵显示器采用了中国风的红色、金色以及“福”字纹路等设计。同期，三星还推出了具备“智联技术(MHL)”的显示器B550，智能手机用户可以通过miniUSB接口直联三星B550显示器进行高清视频播放。

华硕推出3D液晶显示器

本报讯日前，华硕电脑在京举行VG278H 3D显示器发布会，宣布推出旗下首款27英寸全高清3D液晶显示器，这也是全球首款搭载英伟达 3D Vision 第二代技术标准的3D液晶显示器——VG278H。通过最新加入的“3D LightBoost”技术，华硕VG278H可将3D图像的亮度提高到传统3D显示器的两倍。VG278H还搭配了第二代主动快闪式立体眼镜，视域更宽广。

Novell Open Enterprise Server 11发布

本报讯 Novell 近日宣布推出 Novell Open Enterprise Server 11。最新版本在 SUSE Linux Enterprise Server 11 SP1 上构建，为客户提供更多灵活性和选择。Novell Open Enterprise Server 11 简化并精简文件管理和打印网络，使客户能够利用现有投资帮助降低成本并提升最终用户的生产力。

希捷发布新一代高速固态混合硬盘

容灾解决方案篇12

随着医院信息化建设的日趋成熟，医院信息系统已经成为医院的基本设施，HIS、LIS、RIS以及PACS等众多内容丰富、功能强大的应用软件，逐渐成为医院信息技术的核心。这些应用系统中的数据越来越多，数据价值也越来越大，数据丢失或系统停机造成的损失是用户不能接受的。如何有效保障及构架最有效率的医院信息系统体系，实现高效、各系统紧密配合的一体化医疗信息系统，以便提供安全有效的数据与信息的快速访问和利用成为医疗行业数据存储的主要发展趋势。尽管目前信息系统的可靠性随着技术发展日益提高，但是由于洪水、地震等天灾人祸和软硬件故障等仍可轻易的摧毁医疗机构赖以生存的信息系统。因此，医院对信息系统的持续稳定，即业务持续性和系统稳定性提出了非常苛刻的要求。如何控制和规避风险，就需要在建设实施医疗信息系统的同时，制定恰当的数据备份和容灾方案来保证信息系统连续运行和数据的高可用性。

1 容灾系统设计

1.1 系统设计

容灾是一个系统工程，它包括支持用户业务的方方面面。而容灾对于信息系统而言，就是提供一个能防止用户业务系统遭受各种灾难影响破坏的计算机系统。容灾系统是通过在异地建立和维护一个备份存储系统，利用地理上的分离来保证系统和数据对灾难性事件的抵御能力[1]。容灾是解决业务的连续性的问题，所实现的是在数据和系统遭到破坏的时候，能够在最短时间把业务在远程或者同程进行恢复。

根据容灾系统对灾难的抵抗程度，可分为数据容灾和应用容灾。数据容灾是指建立一个异地的数据系统，该系统是对本地系统关键应用数据实时复制。当出现灾难时，可由异地系统迅速接替本地系统而保证业务的连续性。应用容灾比数据容灾层次更高，即在异地建立一套完整的、与本地数据系统相当的备份应用系统（可以同本地应用系统互为备份，也可与本地应用系统共同工作）。在灾难出现后，远程应用系统迅速接管或承担本地应用系统的业务运行[1]。

实现容灾技术是建立容灾备份系统最为重要的因素之一，它决定了数据备份与数据容灾系统应用的成败。目前我院采用的是"2+1"模式的群集技术，即两台服务器连接一台磁盘阵列。这种结构是为了在两台服务器之间共享数据。但是，单台磁盘阵列往往成了核心系统的一个单点故障，一旦磁盘阵列发生故障，则整个系统将发生停机，对于7X24h营业的医院来说，这种意外停机是绝对无法忍受的。另外还有一个异地备份数据库，这个备份数据库处于脱机状态，而且不是实时备份，这就无法保障数据库事务的一致性。在面临灾难时，当网络上的切换完成后，还可能面对数据库系统不能正常启动，为医院信息系统的恢复带来了不确定性因素，影响了系统的高可用性。上述传统的双机备份模式已经不能适应系统安全管理的要求，新的容灾系统的搭建迫在眉睫。

设计一个容灾备份系统，需要考虑多方面的因素，如备份/恢复数据量大小、应用数据中心和备分数据中心之间的距离和数据传输方式、灾难发生时所要求的恢复速度、备援中心的管理及投入资金等。

医院信息系统需要确保业务24*7h在线运行，灾备系统的建设不应修改现有系统的结构，否则可能产生对现有系统状态的破坏或增加不稳定因素，导致今后系统维护难度增加，又不希望投资规模过于庞大。经过对目前市场上灾难恢复解决方案的分析研究与对比，结合本院现有信息系统的体系架构，决定采用基于实时的连续性数据保护技术，即CDP技术的容灾解决方案。

1.2 CDP技术

CDP是一种数据的连续时间点的保护技术，是一种在不影响主要数据运行的前提下，可以实现持续捕捉或跟踪目标数据所发生的任何改变，并且能够恢复到此前任意时间点的方法。CDP解决方案为旁路的解决方案，无需对现有系统进行更改，不迁移、不改变现有的数据结构，只需将CDP接入到现有的IP或光纤交换机上，通过安装在应用主机的客户端软件将数据持续地保护到CDP设备中，达到快速部署的目的。

CDP在技术上把备份技术和容灾做了一个结合。它是一种精细化多点跟踪技术。通过实时连续的复制，将系统和数据进行实时的捕捉。

CDP技术侧重点不仅仅是在于备份，更重要的一点是瞬间恢复，CDP的无缝恢复技术能够实现一定业务连续性指标，这是传统的备份技术所不具备的。现在的容灾体系当中，RPO和RTO成为了最重要的两项指标。RPO指的是在故障发生之后，希望数据保存的时间点指标，RPO越小表明数据丢失越小。CDP技术能够确定RPO指标，可以按照用户的要求，恢复到指定的时间点，能够提供不同类型的数据保护机制和系统保护机制。

2 容灾备份系统架构图

医院信息系统数据中心的容灾系统是集磁盘镜像、持续备份与远程容灾于一体的综合数据保护方案，系统架构如图1所示：

在生产中心配置一台CDP数据保护器连接到现有的生产数据库服务器上，这一连接不影响生产数据的原有路径，不影响原有的磁盘阵列连接。

在网络中心所在机房部署CDP数据持续保护系统，将生产中心的数据以旁路的方式连续抓取到CDP管理器上，CDP管理器自带存储。

在网络中心所在机房的每台应用服务器上配置DiskSafe的复制软件，实时抓取I/O数据，实现向CDP管理器的复制。

对于微软集群系统的数据库服务器，需要部署集群环境的代理；SQL数据库服务器需要配置SQL数据库的代理。

生产中心的CDP数据保护器配置256份快照/生产卷的快照模块（TimeMark），实现多历史点保护。TimeMark快照机制可以轻松、快速地实现数据库数据、文件数据、系统数据等各种数据类型的时间点即时恢复。

生产中心的CDP数据保护器将提取的生产镜像盘通过复制机制实时复制到远程容灾中心。

远程容灾中心设立一台CDP数据保护器，连接到容灾中心的磁盘阵列上，与生产中心实现数据的传送。容灾中心的CDP数据保护器同样配置256份快照/生产卷的快照模块（TimeMark），实现多历史点在容灾中心的保护。

4 总结

信息系统容灾体系采用CDP解决方案后，医院的数据备份策略变得很灵活，可以随时找出历史时间点的资料，利用历史快照快速的模拟出生产系统，并在虚拟机上运行。基于CDP技术的数据备份与容灾系统不仅仅完善了医院的数据保护工作，还大大简化了数据管理、数据备份、灾难恢复三大工作的流程和时间。通过简洁明了的管理工具，为医院制定了灵活多变的备份策略、安全可靠的恢复测试计划，保证了快速准确的恢复效果。

参考文献

【容灾解决方案】推荐阅读：

某政府容灾备份方案09-14

政府网站异地容灾方案06-17

容灾中心05-11

数据容灾08-24

备份与容灾10-12

容灾备份中心论文05-28

方案解决09-04

解决故障方案05-11

防雷解决方案05-16

油藏解决方案06-08