灾难恢复

2024-06-17

灾难恢复（精选10篇）

灾难恢复篇1

近年来, 自然灾害频繁发生, 各种系统瘫痪事件不断出现, 给灾难恢复体系建设带来巨大挑战。中国的灾难恢复市场在此环境下获得快速发展, 但存在的问题仍然比较突出, 主要表现在:灾难备份中心选址过于集中, 使风险高度集中, 未能体现“平战结合”的灾备建设原则;缺乏统筹规划, 未能基于实际需求确定灾备建设等级, 灾备建设投资浪费势头进一步加剧, 自建比例过大, 水平参差不齐, 造成资源浪费。

云计算的出现, 给灾备行业带来一个与传统方式截然不同的途径, 灾难恢复行业由此迎来新的发展机遇。

灾备模式的转变

云计算具备资源分布式部署和资源跨区域协同工作的特点。在灾备领域, 传统的“一主两备”模式将逐步淡出视野, 取而代之的是新的灾备模式, 即“多个数据中心跨区域部署、互联, 计算和存储资源分布式整合调度, 应用负载平衡, 同时在线, 互为备份”, 而支撑业务持续性运营的管理和应急预案也将随之调整。

中国信息安全测评中心主任吴世忠认为, 云计算的核心思想, 就是将大量用网络连接的计算资源进行统一管理和调度, 构成一个计算资源池, 向用户提供按需服务。云计算可以减少政府所拥有数据中心之间的应用数量, 加快数据中心整合的步伐, 构建一个成本和风险更低、更专业化、服务范围更广、更灵活的灾难恢复体系。

随着云计算技术的发展, 利用虚拟化技术和云技术的平台基本可以实现灾备与生产之间的无缝平滑切换, 通过一些云计算手段和技术架构, 可以把灾备中心、测试中心、生产中心等IT资源更紧密有机地整合起来, 为灾备建设带来新的更好的模式。

负载平衡方案

近来, 云服务提供商利用负载平衡的方法代替冷热数据中心处理数据中心灾难恢复的趋势正在日益增长。私有云的部署, 需要特别考虑其数据中心灾难恢复的需求与负载平衡, 保证即使一家数据中心遭受灾难, 其他数据中心仍能正常运作, 尽管其运营能力可能会有所下降。

但即便如此, 仍然存在挑战。跟踪一款应用程序在各种基础设施的配置是很困难的。每一款应用程序都会创建服务器名称, 选择开放的IP地址、DNS地址域名映射, 定义物理和虚拟服务器, 创建防火墙规则, 定义SAN与NAS配置, 实现负载平衡规则, 定义数据库集群。

一款应用程序的所有元素都存在于每一个环境, 如开发环境、测试环境及生产环境。许多应用程序的配置均由多个网络应用程序维护。维护应用程序并不集中, 因此元数据应用程序配置也不集中。更糟的是管理的改变是基于产品实施时间的紧迫性, 如SAN子系统, 这没有反映在变化管理系统中。因此, 数据往往是过时的。

如果有一款工具能够将配置在一家数据中心的负载平衡复制到另一家数据中心, 这是最好的。配置需要单独的服务器的名称、新的IP地址。其可以将模型的对称性应用到其他数据中心, 同时, 如果其他数据中心失败, 则提供必要的基础设施。但考虑到所有可配置产品的有效置换, 创建一个工具或向导将是很困难的。

所以, 基础设施的配置元数据的集中是至关重要的。没有集中的参数和部署应用程序的版本, 其配套设施将随时间的推移而变小。小型配置的变化可能导致数据中心首级和次级的负载平衡问题。如果没有配置数据的版本, 当变化导致即时操作失误时, 要使数据中心重新恢复到稳定状态可能非常困难。

企业应该有一个政策, 规定只测试产品的配置, 如虚拟机的内核软件或操作系统的版本可在数据中心内部署。只有特定版本的防火墙硬件可以部署在不同的数据中心。此外, 还存在缺乏选择的问题, 如各种基础设施组件只有单一来源的软件或硬件。如果硬件或软件有一个共同的缺陷, 则可能会导致多个数据中心的戏剧性失败。

总之, 企业可以通过部署在负载平衡架构的应用程序来解决灾难恢复的问题。但是, 这并不能防止人为的错误, 特别是配置错误。企业可以转向认证的零组件, 如特定的虚拟机或负载平衡器, 以避免由于一个未经测试的配置或缺乏配置元数据的版本造成损害。配置元数据需要存储在一个集中的方式和版本中, 使应用程序可以回落到一个值得信赖的配置, 以防出现错误。

云计算部署模式

目前国内银行业快速发展, 市场竞争日趋激烈, 成本不断攀升, 客户需求愈发趋向复杂。云计算作为一种全新的业务模式, 其独特能力有助于推动国内银行业业务模式的创新, 并改变其营销模式。

然而, 云计算技术并不是万能的。对于一些企业来说, 有些基于云的灾难恢复工具可能不是最好的选择, 甚至是错误的选择。因此, 制定符合企业战略的云计算部署模式就显得很有必要。

一般云环境中的模式指的是安装、配置和整合操作的封装, 而无论企业最终使用的是哪种模式, 将中间件架构或中间件应用当做其整个生命周期中单独的原子单位, 可以降低管理和操作的成本, 提升敏捷度。

以去年I B M发布的产品Workload Deployer为例, 该产品的一个基本要素是云计算部署模式。从V3.0开始, 企业可以用虚拟系统模式或者虚拟应用模式进行云部署。那么究竟使用哪种模式进行部署呢?说到底, 要以适用企业自身为标准, 否则技术再好的部署也无法发挥其最大效益。

首先, 要了解虚拟系统模式和虚拟应用模式之间的差异;此后企业需要弄清这种差异对自己具有怎样的意义, 看是以中间件架构为核心的虚拟系统模式, 还是以应用为核心的虚拟应用模式更适合自己。这是一个没有标准答案的选择, 企业只能根据自己的实际情况, 了解云部署所需的功能及自己所期望达到的用户体验来作出选择。

灾难恢复篇2

一、灾难的定义

灾难分为自然灾害和非自然灾害。

自然灾害是指由火灾、地震等引发的一系列灾害直接导致公司的业务中断、电力故障、网络故障等。

非自然灾害是指人为的造成的如服务器断电、软件错误、人为故意破坏、恶意代码、木马植入、恐怖袭击等。

二、灾难恢复项目小组的制定和职能

1.管理组：统筹规划，指挥各小组按照既定计划进行执行。2.部门恢复组：负责制定各部门情况制定应急备案，确定各部门数据和财产的保护方式并执行保护，确定各部门数据的恢复方式并执行恢复。

3.计算机恢复组：负责对全公司范围内的计算机故障进行排除、恢复范围包括系统、必备办公软件。

4.损坏评估组：负责对公司损失的重要数据、财务进行总体评估。并针对相应损失的财产进行汇总并结合拥有的保险进行申报。5.安全组：负责灾难发生后的人员、数据、财务的安全进行保护。并制定相应的安全策略。

6.设备支持组：负责对公司服务器、网络设备、交换机的故障进行排除，制定相应解决重建方案。

7、数据恢复组：负责对公司各平台数据进行恢复，并制定相应数据恢复方案。

8、市场和客户关系组：负责对外进行信息发布、制定相应应急措施应对客户疑问等。各小组共同职能： a）负责计划的执行

b）与其它组之间进行信息交流，监督计划的测试和执行 c）所有或是某一个成员可能领导特定的组 d）协调恢复过程

e）评估灾难，执行恢复计划，联系组长 f）监控并记录恢复的过程

三、灾难恢复流程

（一）自然灾害引起的灾难恢复流程

由自然灾害引起的灾难往往影响较大，可能会直接导致一些基础设施的无法使用，甚至会对导致人员减少。因此对于自然灾害引发的灾难恢复流程相对特殊且繁琐。1.数据抢救

灾难发生时，需在保证人身安全的情况优先对公司的重要数据进行抢救，抢救的范围主要包括：记录公司重要信息的文件、资料，存储公司重要数据的磁带，存放重要数据的硬盘、服务器。此过程需由安全组进行统筹指挥，按照既定的计划执行，各组成员、公司员工必须服从安全组的统一调度和指挥。2.损坏评估及启动应预案

灾难发生后各小组需根据情况汇报损失情况给损坏评估组，损坏评估组根据汇总信息进行消息告知披露。披露损坏信息包括: a）公司重要生产、监视测量、办公设备 b）拥有在可以执行计划之内的关键性功能的员工 c）保存公司重要数据的介质 d）网络、通讯设备

各小组人员根据披露的损坏信息情况进行应急预案启动，如选举临时领导、使用备份服务器、备份通讯设备进行替代等。3.业务恢复计划

业务恢复计划需要多个小组支持与配合，总体可划分为以下几个阶段: a）IT基础设施恢复阶段：

此阶段主要的目标是将对于保存数据的基础设施、业务系统所在的主机、公司网络架构进行恢复。首先须根据损失评估小组给出的报告分析可继续利用的IT基础设施，如供电设施、交换机、服务器、防火墙等。若有损坏不可用的设备，需及时同代理商进行沟通借用或新购相应设备。此阶段由设备支持组执行。

b）系统恢复阶段：

系统恢复主要针对关键应用主机，如Rasd-server、IBM、Center-server、BJTCT。为节约时间需同时针对各个服务器系统进行快速恢复。此阶段由数据恢复组执行。

c）网络恢复阶段：网络恢复阶段的主要针对以下几点进行：

 关键商业应用系统的内部局域网和网络设备的支持  外部广域网和电信服务

 待恢复系统和终端用户（公司同事）间的通讯此阶段由数据恢复组同设备支持组共同执行。d）业务平台恢复阶段：

在此阶段的恢复工作主要围绕日常工作常用的业务平台进行，常用的业务平台主要为：Winmail、Change、Doors、Synergy、OA、ERP等。平台恢复的工作分为两个部分：

 业务系统数据恢复  业务系统重搭建  业务系统数据导入业务系统数据恢复：

数据恢复小组首先须对业务系统的数据进行恢复，需要寻找相应的恢复设备完成此操作，目前我们主要利用磁带机和可正常工作的主机进行数据恢复工作。需要将抢救出的磁带和硬盘接连在对应设备上恢复出数据。

业务系统重搭建：

为提高业务恢复效率，数据恢复小组成员需分工协作，共同完成业务系统的重搭建工作，由于一些业务系统的特殊性，需尽快与相应平台的供应商接口人取得联系，并申请临时可用的加密狗、许可文件等。各个平台负责人需对自己管理的平台在短时间内进行重搭建。

业务系统数据导入：

数据恢复小组成员需根据导出的数据结合自己管理的业务平台进行数据导入，并测试可行性。再导入成功并可使用后及时同个小组成员负责人进行通知。

（二）非自然灾害引起的灾难恢复流程

非自然灾害引起的灾难恢复通常破坏较小，但是风险程度仍不可忽视，如电力故障导致的关键业务系统无法运行同样会给我们的公司带来一定的影响。但由于破坏程度的不同，我们将引入业务持续计划（BCP）这样一个概念。

业务持续计划是为了防止正常业务行为的中断而被建立的计划。当面对由于人为造成的故障或灾难以及由此造成的财产损和正常业务不能正常使用时，BCP主要被设计用来保护关键业务步骤。BCP是最小化对于业务的干扰效果和使业务能恢复正常运行的计划。

RTO（Recovery Time Object）恢复时间是指EIA部门同公司签订的故障响应恢复时间，如确保在1小时内排除故障，使业务系统重新恢复工作。

RPO(Recovery Point Objective)恢复点目标，该指标规定在灾难发生后，公司所能够容忍的数据丢失量，该指标由EIA部门同公司签订。

对于RTO和RPO目标的实现，需要人力、物力的支持，因此对于高效，最小化的BCP指标，往往也会花费大量的财力资源。在执行业务持续计划的同时，由于造成的灾难和破坏性并不严重，因此可直接进入业务平台恢复阶段。

一．日常备份检查

1.日常服务主机按时定期做备份，分为两类:

主机备份:主机备份应在每周，确认服务运行正常后，制定备份计划和类型，并指定备份时间应为网络最空闲时。在自动执行计划后，应确认备份是否完整，是否有错误

数据备份：数据备份应做每日备份，确定需要备份的数据库，制定每日备份和备份类型。每日，数据库管理人员应对前一日的备份，进行检查，确认备份是否成功完整。

2.日常备份检查

日常备份检查应由网络部主管人员不定期或定期指定检查，查看备份时间是否符合备份规定，备份文件是否完整，存放是否规整。

3.备份空间检查

日常由网络管理人员检查备份空间是否充足，如空间紧张，应提前把距离最远的备份文件，存放至指定存储介质中，网络部管理人员应对存储介质存放进行检查，查看存放空间是否达到防潮防磁，并对存储介质进行封存灾难恢复制度：

1.灾难级别划分

A类：计算机软硬件故障

发生概率：对于企业，发生可能性最大。由于设备长时间运行，升级硬件所造成。状况有（服务停止，正常业务不能办理）

B类：人为操作故障

发生概率：日常工作中员工对于本部门的资源进行更新或维护，由于不正当操纵或误操纵造成文件损坏或丢失。状况有（个别部门文件丢失，使得部门正常办公受到阻碍）

C类：资源不足引起的计划性停机

发生概率：由于操纵系统软件或硬件资源不足所造成的系统；服务宕机，造成的数据丢失或损坏。状况有（服务器无法正常提供服务，重启后无效，需要转移服务，升级维修服务器）

2.相对应级别的处臵方法

当发生时。应先报告网络维护人员，由灾难鉴定小组进行灾难鉴定，确定灾难级别，上报灾难小组组长，并对灾难发生时间，解决方法，恢复时间进行记录。

2.1 发生A类灾难时，灾难鉴定人员确定灾难级别后，上报灾难恢复组组长，确定恢复方案，排除硬件原因，在主机正常启动后，检查缺失的文件或不能正常启动的服务，上报灾难组组长，并准备备份文件，进行恢复。进行恢复后，由恢复后检查人员检查主机是否恢复正常服务，文件是否完整且可以被正常访问，检查无误后。上报灾难恢复小组组长，并对灾难恢复的过程进行记录。

2.2 发生B类灾难时，灾难发现人应及时上报网络部及灾难恢复小组组长，明确丢失的文件，确定文件丢失原因，并对丢失原因和责任人进行记录。由丢失文件部门提出书面“恢复文件申请”，由灾难鉴定确定丢失文件，在灾难恢复小组组长批准后，准备备份文件恢复。恢复后，由丢失文件所在部门进行确认。

2.3 当发生C类灾难，由灾难鉴定人员确定主机故障，并上报灾难恢复小组组长：

2.3.1 确认为主机操纵系统故障或硬件资源不足所引起宕机时，先确认该主机是否为应用服务器（如是应用服务器，应先断开该主机的网络连接），如有需要，应及时转移服务，由其他服务器代为承接业务。故障主机再进行维修。

灾难恢复,你有信心吗? 篇3

该调研以11个与备份及灾难恢复准备、能力和实务操作相关的问题为基础，根据所得到的综合答案为每个国家或地区排名。IT管理人员可以利用这些问题来评估企业基于以下方面的灾难恢复信心度：引进新技术的能力和主动性、对其程序和策略的信心度、主管支持度和预算/资源、宕机后快速恢复的能力。

全球整体信心提升

近几年，灾难频生，面对随时可能降临的灾难，作为一家企业的CIO，你是否想过，当企业的IT系统在灾难来临、轰然倒塌之后，你还能将其恢复吗？你需要多长时间恢复？

有调查显示，在遭遇了严重的数据遗失后，很少能有企业在没有完整备份与灾难恢复策略的情况下幸存。因此，企业需要重新评估备份及灾难恢复策略，为可能发生的最坏情况做打算，制定相应的计划，并准备应对意外情况的发生。

在Acronis所做的调查中发现，当前一个典型的中小企业，其内部管理着100台以上的服务器、台式机和手提电脑，且每年产生的全新数据高达40TB，所要保护的数据量十分庞大。

不过，调查显示，全球企业对其备份和灾难恢复的信心在过去12个月中提高了 14%。而信心增长的显著原因是由于企业拥有足够的资源（工具与环境），并采取了正确的技术来应对灾难的发生。但仍有32%的企业担心其备份与灾难恢复系统会在事故发生时不能正常运作，而34%的企业则认为他们会因此而遭受相当长时间的停机。对于备份与灾难恢复系统而言，2/5的受访者表示，最大的问题仍是预算和资源不足，这是阻碍成功实现灾难恢复的主要原因。

在指数排行榜上，全球平均指数为1,14，排在首位的是德国，指数为2.1。印度的表现非常抢眼，以1.21的指数成为榜单的第九名。

中国企业信心不足

在此次调研中，Acronis首次将中国列为调研对象。不过，调查结果显示，面对灾难事件后的数据和IT系统恢复，大多数中国的中小企业信心不足，与世界先进国家差距明显，其平均信心指数仅为0.17，位居18个国家中的倒数第五。

调查显示，当严重灾难或事件发生时，有43%的中国企业担心其备份与灾难恢复系统不能正常运作，仅有36%的中国企业认为自己能从容应对备份和灾难恢复问题，近半数企业（48%）表示担心由此引发长时间的停机。这些数字表明了为什么中国企业的总体信心指数较低。

在调查中，对于备份和灾难恢复方面所面临的最大挑战，有31%的中国企业认为，由于此前并没有数据丢失的糟糕经历，因此，企业的最大困扰来自对备份和灾难恢复的重要性认识不够，另外，企业高管的支持力度不够也制约了企业对灾备的重视、投入和应用。

对于国内中小企业的灾难恢复信心不足，记者认为，首先，由于我国灾难恢复的相关规定大多是针对一些大中型企业中的关键业务，而对中小企业并无强制性要求；其次，即使企业构建了灾难恢复系统，也有相当部分的企业从没有进行过实际演练，试问，没有经过实际演练过的灾难恢复系统，有谁能保证当灾难来临时，它一定能万无一失地恢复运行？而所谓的信心又从何而来呢？

不过，调查显示，国内中小企业对虚拟化应用持非常乐观的态度，有51%的中国企业认为2012年将有超过半数的生产服务器会实现虚拟化，同时，对于虚拟机备份，采取每天备份和使用一种备份解决方案的比例分别高达40%和53%，超过全球平均水平。

数据的存储备份及灾难恢复技术篇4

一、数据的安全分类和备份要求

对数据进行分类保护是计算机信息系统实施安全等级保护的基本原则。按照数据的价值划分类别, 对不同类别的数据, 应实施不同的安全等级保护, 而对不同安全等级的数据进行备份, 要求也不能相同。其数据分类和对应的安全等级备份要求如下:

一是公开数据。该类是公开发布的数据, 需要进行完整性保护, 应按第一级用户自主保护级的要求进行安全设计, 数据进行常规备份。二是一般数据。该类数据具有一般使用价值, 需要进行一定保护。该类数据的破坏和泄露, 将会带来一定的损失, 应按第二级, 即指导保护级的要求进行安全设计, 数据进行定时重点备份。三是重要数据。该类数据具有重要价值或机密程度, 需要进行重点保护, 应按照第三级, 即监督保护级的要求进行安全设计, 数据应进行冗余备份 (一式两份) 。四是关键数据。该类数据具有很高使用价值或机密程度, 需要进行特别保护, 应按第四级, 即强制保护级的要求进行安全设计, 数据应进行冗余备份并异地存放。五是核心数据。该类数据具有最高使用价值或机密程度, 需要进行绝对保护, 应按专控保护级的要求进行设计, 数据的备份按一式多份并异地存放的原则实施。

二、数据备份方式的选择

数据备份的含义是:为防止系统出现操作失误或系统故障导致数据丢失, 而将整个系统数据或部分重要数据集合打包, 从应用主机的硬盘或阵列中复制到其他的存储介质的过程。目前, 数据备份大致可以分为三种方式, 即标准备份、增量备份和差分备份。标准备份是对整个计算机系统进行完全备份, 包括系统和数据。当发生数据丢失的灾难时, 将灾难发生之前的备份还原就可以恢复丢失的数据;增量备份是对上一次备份后增加的和修改过的数据进行备份;差分备份是对上一次标准备份之后新增加和修改过的数据进行备份。

目前, 多数系统进行数据备份时均是在后台进行, 所以, 备份时间的长短对应用系统的影响不大, 我们应根据单位存储介质的容量和系统的具体情况, 来选择合适的备份方式。

三、数据备份系统的选择

沿用至今的计算机备份技术有磁带、磁盘镜像、光盘、双机热备份、冗余阵列等。近年来, 在数据地理分散化新需求的推动下, 又出现了网络连接存储和存储区域网络存储备份技术。

传统的存储模式是直接将存储设备连接到服务器上, 它的缺点是当存储容量迅速增加时, 这种方式很难扩展。另外, 当服务器出现异常时, 将会导致数据的丢失。为了提高数据备份的效率和可靠性, IT界又开发了双机热备份系统, 它的出现适应了网络化的发展。当前, 网络操作系统正在成为主要的信息处理平台, 网络上的海量信息造成存储量的倍增, 因此, 通过网络进行数据备份已成为数据备份的主要手段。

双机热备份系统工作原理是:数据备份由专门的数据备份软件来实现, 系统应用切换一般也由专门的软件来控制。这种软件使用远程动态监测功能, 通过专线监测系统主机运行状况, 实时或定时通过网络进行数据信息备份。

企业信息系统可配置双服务器系统, 一台为运行服务器 (主) , 另一台为备服务器, 当主服务器提供的服务不作用时, 备服务器将接替主服务器工作并重新启动系统, 当主服务器恢复时, 可以采用手动或自动方式切换到主服务器工作。备份服务器不仅能承担主服务器的工作, 同时还可以执行其他应用程序工作。因此, 一台配备充分的主机可同时作为某一服务的主服务器和另一服务的备份服务器使用, 即两台服务器互为备份。企业信息系统可采用双机共享磁盘阵列技术 (建议采用TOYOU的Net Stor9000S系列磁盘阵列柜) , 在RAID5冗余技术基础上, 运行高可靠性软件 (建议采用Veritas阵列服务器管理软件) 构成高可用性数据库双机系统。双机容错软件通过RAID盘、芯跳 (heart beat) 网线对对方运行情况进行监控, 确保服务器的正常运行。

双机热备份系统基本工作机制如下图所示:

网络连接存储设备一般由硬件、软件及存储设备等多个部分构成, 独立封装在一个工控机壳内, 连接到现有的网络上, 作为网络共享盘提供数据和文件服务, 通过网络连接存储管理软件, 存储设备上的数据可以自动进行备份, 而当存储设备出现故障时, 自动进行切换和恢复工作。

存储区域网络则是通过特定的互连方式连接若干存储服务器组成一个单独的数据网络域, 提供更便捷的数据存储服务。该方式易于集成, 并可扩充, 能提高数据的可用性及网络使用的性能。利用存储区域网络, 不仅可以提供更大容量的存储数据, 而且地域上也可分散、缓解大量数据传输对网络速度的要求与影响。

随着信息技术尤其是存储技术的发展, 数据备份技术与设备也在不断进步, 采用虚拟存储技术、数据迁移技术、LAN free技术、I P存储技术的新产品渐渐浮出水面。因此, 设计数据备份系统方案可供选择的产品越来越多。企业应从实际需求出发, 综合考虑系统的性价比, 设计出适合本企业的数据备份方案。此外, 在数据备份方案的硬件系统设计时, 应重点考虑以下性能:一是存储介质的容量;二是存储介质的费用;三是系统的备份速度;四是数据的易保管性;五是硬件的可维护性。

在选择备份系统的管理软件时, 应重点考虑以下几点:一是软件界面的可操作性和易用性;二是软件的备份管理策略;三是软件的可靠性;四是软件对系统性能的影响;五是软件的可扩充性;六是软件的费用和后续技术支持。

四、数据备份的管理策略

在信息安全领域, 核心是人, 其次是管理, 第三是技术。组织者通过制度进行管理, 管理内容则通过技术来实现, 从而达到安全的要求。数据备份也是如此, 有了先进的数据备份系统并不一定就能达到预期的目标, 各企业还应制定详细、明确的数据备份管理策略, 如组织、人员、制度和法规等。制度中应包括以下五项内容:一是建立数据备份岗位责任制, 定编定人;二是人员的培训、教育;三是任务、责任的明确;四是备份数据核查;五是认真记录备份日志。在备份系统运行后, 应严格按照制度进行日常备份, 并记入日志。

五、数据的灾难恢复措施

灾难恢复技术也称业务连续性技术, 是目前在发达国家十分流行的IT技术。它能够为重要的计算机系统提供在断电、火灾等各种意外事故发生, 甚至在如洪水、地震等严重自然灾害发生时, 保持持续运行的能力。企业信息系统是企业正常运行的重要保证, 因此, 对企业计算机系统必须采用灾难恢复技术予以保护。

数据备份的最终目的就是灾难恢复, 一旦系统遭到攻击或因自然因素导致数据的破坏或丢失, 灾难恢复可以最大程度恢复系统, 保证系统的可用性。灾难恢复最重要的是建立异地存储备份中心, 同时, 在制定灾难恢复策略时应考虑以下几个因素:一是保护完整的系统配置文档;二是根据业务需要决定数据异地存储的频率;三是保护关键业务的服务器。

灾难恢复措施在整个数据备份策略中占有相当重要的地位, 因为它关系到系统在经历灾难后能否迅速恢复。灾难恢复措施包括:灾难预防制度和灾难演练制度。

灾难预防制度:为了预防灾难的发生, 需要做灾难恢复备份。企业信息系统在数据实现大集中的节点上, 应采用网络连接存储或存储区域网络备份技术进行灾难恢复备份系统建设, 在紧急情况下, 它会自动恢复系统的重要信息。

灾难演练制度:要保证灾难恢复的可靠性, 只进行备份系统的建设是不够的, 还要进行灾难恢复演练。各企业可以利用淘汰的计算机或多余的存储介质进行灾难模拟, 以熟练灾难恢复的操作过程, 检验在用的存储备份系统运行是否正常和备份的数据是否可靠。

灾难恢复拥有完整的备份方案, 并严格执行制定的备份策略, 当企业信息系统遭遇突如其来的灾难时, 它可以应付自如。

为业务连续性及灾难恢复铺平道路篇5

共享存储使灾难

恢复成为可能

首先,我们要了解一下业务连续性与灾难恢复的区别。灾难恢复是指遭到大规模硬件故障或破坏、设施故障及/或区域性的自然灾难后,重新建立IT服务。灾难恢复能力是按照重新建立服务所用的时间和数据丢失的数量来衡量的。业务连续性是指在上述这些情况下,继续正常运营的能力,基本上没有什么停机时间。

成本合理的共享存储是中小企业向实现灾难恢复迈出的第一大步。当数据存储在服务器内的磁盘上时,数据的可靠性和扩展性完全取决于服务器本身,例如主板发生了故障,数据就无法访问,哪怕硬盘是好好的,数据也访问不了。存储局域网(SAN)和网络附加存储(NAS)设备把存储从服务器独立出来,提高了可靠性、灵活性和易管理性。

最新一代的SAN和NAS设备具有快照和复制功能,这是最有效的灾难恢复策略的两大核心功能。快照可以在某个时间点捕捉存储系统的状态,而复制用于把一个存储系统的状态拷贝到另一个存储系统。如果与服务器镜像软件结合使用,这些快照和复制工具可以在替换的硬件上恢复正常运行。

不过还是面临两个重大的挑战:提前很短时间获得服务器硬件并非总是易事;即使借助最新的镜像工具,可能也需要相同的硬件,而相同硬件可能不再可用。位于灾难恢复站点的匹配硬件能够解决这两个问题,但是在大多数情况下,这并不是一种成本合理的选择。

虚拟化消除了对硬件的依赖

服务器虚拟化技术改变了规则。举例说,它改善了镜像软件。虚拟机作为文件被完全封装起来,然后这层软件(虚拟机管理程序)让这些虚拟机可以在任何硬件上重新启动。这就消除了对硬件的依赖性,有可能使用数量较少的灾难恢复物理服务器来支持生产系统,从而让更多的企业买得起一个或多个适当的备用物理主机。实际上,由于服务器虚拟化让整合成为可能,主站点的备用物理主机经常是空闲的。

虚拟机管理和站点恢复工具提供了一种途径,可以指示虚拟机迁移到异地位置。在异地位置,这些虚拟机几分钟或几小时内就可以重新启动,而不是像以前那样需要好几天或好几个星期。有了虚拟化,就可以建立起更具弹性的生产架构——服务器很容易在物理主机之间迁移,共享存储解决方案提供了可用性高达99.999%的企业级功能,快照提供了多个时间点恢复点——这就意味着有望减少必须使用灾难恢复策略的情形。不过确实需要使用灾难恢复策略时,中小企业能避免给业务带来重大危害、导致重大经济损失的停运时间。

尽管业务连续性和灾难恢复是使用虚拟化技术的一个充足理由,但让IT主管们高兴的是虚拟化还有其他诸多优点。

虚拟化虽然提供了企业梦寐以求的业务连续性和灾难恢复,但是它还是有一定难度。现在市面上有一大批虚拟化厂商和平台,并非所有解决方案都是一样的。要想选择最佳的解决方案,需要的不仅仅是查看功能和优点列表。

应该与这样的解决方案提供商进行合作:能够全面理解用户当前的环境、需求和目标,全面了解用户在恢复时间目标和恢复点目标方面的服务级别协议。应用环境中的数据和应用类型,哪个最有效,是SAN、NAS还是支持两者的系统?应当考虑适应未来增长的灵活性,避免劳民伤财的叉车式升级(forklift upgrade)。

一旦值得信赖的顾问公司知道了这一切,它就能详细规划合适的架构,推荐能满足要求的最合适的厂商设备。成功实施还要求在这过程中,将专业知识传授给用户中的IT人员。毕竟一旦实施完毕,用户就要使用这个解决方案了。哪怕这一切都做到了,还是会出现问题,所以要确保很容易联系到提供商,以便得到售后服务。

链接

应用案例

设想一下这种环境:日益老化的服务器堆在一间拥挤不堪的服务器机房里,机房一直在为高效冷却而努力,所有不同服务器上各自运行着相应的应用程序。这就是美国东北三角洲牙科服务机构(Northeast Delta Dental)在实施最佳服务器和存储虚拟化解决方案之前所面临的真实情况。

东北三角洲牙科服务机构不但建立了具有弹性的生产架构,达到了其在业务连续性和灾难恢复方面的目标,还大幅减少了电力和冷却成本,并简化了整套IT基础设施的管理。

通过快照而不是通过磁带来恢复数据是个快速而简单的过程。对东北三角洲牙科服务机构的IT经理Dan Kaplan来说,能够使用这种解决方案来测试灾难恢复非常重要—他们能够在工作时间,进行全面的非干扰性的故障切换试验。此外,Kaplan还喜欢根据需要灵活添加服务器,这为IT部门和开发人员节省了时间。

简讯

昆腾DXi4500

支持重复数据删除

本报讯昆腾公司日前宣布其DXi4500全系列磁盘备份设备上市。DXi4500系列包括DXi4510和DXi4520,两款设备均带有非破坏性重复数据删除技术备份软件包,为中小企业和分支机构用户提供简单且高性价比的备份解决方案。这两款DXi4500设备均包含所有DXi软件许可,内置重复数据删除和复制功能,支持VMware环境的备份软件。为了帮助中小企业在有限的资源下更好地实现备份,DXi4500系列可将备份性能提升2～3倍。另外,这套设备还提供了高重复数据删除率来降低因为需要不断扩大磁盘备份容量而增加的成本。同时,重复数据删除提供了更低成本的数据迁移,大大降低了介质管理和容灾中异地数据传输的难度和开销。DXi4500系列采用简单的NAS界面,使重复数据删除的部署和操作更加简单,受到中小企业用户的极大欢迎。DXi4510有效容量为2TB,DXi4520为4TB。DXi4500其吞吐率为每小时400GB,并带有RAID 6保护,支持最多节省99%网络带宽消耗的加密和压缩复制流。

QLogic助力

世界杯足球赛事的播出

灾难恢复篇6

一、进行电子档案安全评价的必要性

电子档案管理中一个十分重要的问题就是安全管理, 档案的安全是档案工作的生命线。识别自身信息系统所面临的风险是解决电子档案安全的首要问题, 保障电子档案如何不被外部因素和内部因素影响, 是一个至关重要的问题。由于电子档案是通过计算机进行操作、传输、存贮等处理方式而形成的档案, 信息技术在档案管理中的广泛应用, 提高了档案工作的效率, 扩大了档案的社会影响力, 可以实现档案信息资源共享、远程查询利用, 与传统纸质档案相比有着许多不同的优越特性。但是, 由于电子档案具有对系统的依赖性、信息的可共享性、信息的不稳定性等特点, 容易受到各方面因素的影响;设备因素如计算机病毒、电力故障、通信故障;人为因素如网络入侵、人为失误等情况的影响, 这些都容易给电子档案的安全带来威胁。在电子档案管理系统中, 采用科学有效的模型和方法对自身信息系统所面临的风险及这些风险可能带来的安全威胁与影响的程度进行评估, 然后进行全面的充分的分析与评价, 才能分析出存在的各种威胁, 正确把握内部信息系统的安全状况, 才能针对高风险的威胁采取行之有效的安全措施, 从而建成坚固的电子档案信息安全管理体系, 提高电子档案管理系统的安全水平。

二、电子档案安全保护主要评价内容分析

1. 实体安全保护, 是指存储档案信息的库房、计算

机设备等电子档案信息载体的安全, 系统服务及时、系统设备硬件和相关设施运行正常, 对于各种灾害、故障要采用充分的预防措施, 保证系统的实体硬件不受自然和人为的破坏。实体安全主要包括:环境安全、设备安全、载体安全。具体为存储档案信息的库房、计算机机房等档案存储载体的安全保管、防盗、防毁、防霉;防震、防火灾、防水灾、防电磁信息辐射泄漏等。

2. 网络安全保护, 是针对计算机网络及其节点面临

的威胁和网络的脆弱性而采取的防护措施。由于电子档案利用网络传输越来越普及, 电子档案信息的优越性就表现在它能实时通过网络畅通地提供给在线异地用户使用, 而网络作为一种信息流通渠道, 它的防卫能力和抗攻击能力较弱。因此, 网络安全成为保障用户真实有效地利用电子档案信息的关键所在, 网络安全保护也因此而产生。网络安全评价涉及实体安全、软件安全、操作系统安全、网络数据安全等方面内容;对计算机病毒戒备、防黑客入侵, 防止针对网络的攻击与犯法行动进行检测等方面设施;对把持访问网络信息系统的用户, 防止非法链接或被诱骗等访问措施;具有审计与监控功能, 实行身份确认, 确保只有合法身份的用户才允许建立链接。

3. 软件安全保护, 是指电子档案信息能在相应的软

件中安全运行流转, 禁止非法用户的访问, 保证合法用户的使用。保障电子档案信息免遭破坏、更改或非法拷贝等保护措施。软件安全保护包括:软件自身安全, 以及与电子档案信息相关的软件及其说明的完整性。软件存储安全, 电子档案信息不被截取、修正或盗用。运行安全, 合法用户使用软件时保证软件的正常运行。通信安全, 软件的安全传输、加密传输、网络安全完整下载。使用安全, 是指避免合法用户不能正常登录、访问、使用软件。

4. 信息安全保护, 是指保证在系统中传输、存贮的

电子档案信息不被截取、修正或盗用, 保护档案信息的安全。在网络能够正常运行的基础上, 我们要保证在系统中传输、存贮的电子档案信息是安全的, 不被截取、修正或盗用。网络上的传输使得电子档案信息的完整性无法保证, 所以保持完整性应采用有效的措施来进行, 这对于电子档案信息来说至关重要。一个单位或组织最核心的信息通常以数据库的形式应用和保存, 确保信息数据库的安全对于电子档案信息来说十分重要。电子档案信息的特点和安全要求, 告诉我们建立一个完整系统的安全保障体系, 必须对电子档案信息从产生到永久保存的整个生命周期进行系统的保护。

三、电子档案灾难恢复策略

灾难恢复篇7

NetIQ宣布旗下最新、功能最强大的灾难恢复设备PlateSpinForge 700系列全面上市。新产品可在生产服务器发生停机或灾难事故的情况下为物理和虚拟服务器工作负载提供保护。PlateSpin Forge 700系列设备可为60% 以上的工作负载提供保护, 性能和容量水平比上一代产品500系列大幅提升。作为一套多合一解决方案, PlateSpin Forge 700系列具备灾难恢复要求分级和沙箱虚拟测试等先进功能, 能够通过大容量的高性能恢复环境高效、无缝地为企业级工作负载提供动力, 直至生产环境完全恢复。

弗雷斯特研究公司 (Forrester Research) 在近期发布的一项市场调查中建议基础架构和运营专业人士用基于磁盘的备份设备取代现有的磁带备份, 以减少手动工作量并改进恢复时间目标。早在2008年, NetIQ就通过一台业内首创的灾难恢复设备对这一方法进行了探索。在此基础上, PlateSpin Forge 700系列采用一种速度更快、效率更高的优化方法, 以极低的总体拥有成本为当今的虚拟和物理服务器工作负载提供保护。

来自黑斯廷斯县和爱德华王子县卫生部门的TomLockhart表示:“有了PlateSpin Forge设备, 不管出现怎样的计划外停机, 我们的解决方案都能在二十分钟之内恢复核心服务, 这让我非常放心。PlateSpin Forge是一套性能全面的解决方案, 而且安装和使用非常简单。它能帮助我们迅速、有效而可靠地恢复服务, 我可以高枕无忧了。”

PlateSpin Forge 700系列设备安装最新版PlateSpinForge 11软件, 新版操作系统和虚拟机管理程序来自微软和VMware等供应商, 并且支持采用GPT硬盘、启动驱动器容量大于2TB的新款UEFI物理服务器。

所有PlateSpin Forge 700系列设备均包含PlateSpin Recon 4许可证, 能够在30天内连续监控CPU、内存、网络带宽和最多100台生产服务器工作负载的磁盘利用率。掌握这些规划和分析数据之后, IT专业人员就能在恢复性能和基础架构成本之间找到最佳的平衡点, 进行灾难恢复时就能以最高的效率维持服务水平协议, 同时确保工作负载得到保护。

灾难恢复篇8

Exchange是微软Microsoft Office System服务器端的重要组成部分, 是系统协作与企业信息技术架构的重要一环。微软在其新的企业级云服务体系中, 把Exchange定义为面向未来的消息和协作平台, 是通信和信息交流的载体, 为企业协作和信息共享提供支持。

Exchange的核心功能是邮箱服务器, 是当前企业非常重要的应用之一, 许多企业员工每天的第一个事情是打开邮箱, 看一看有没有最新邮件, 因此邮件系统在企业工作和业务开展中承担了重要的角色。许多企业也认识到之一点, 希望他们的邮箱系统能可靠稳定的运行。一些企业在谈到其信息系统的高可用性时, 一个误解是必须建立服务器群集, 其实一个高可用性方案取决于许多因素, 其中最重要的因素是容错能力, 建立服务器群集只是为系统提供容错的一种方法, 为了要获得一个性价比高的高可用性方案, 必须要结合容错措施和其他高可用性方法相。本文选取其中的实现Exchange邮箱服务器容错能力中的灾难恢复。

2. Exchange邮箱服务器的数据资源

Exchange的邮箱服务器数据资源包括邮箱系统资源和日志资源, 为保证邮箱服务器的数据资源安全, 在进行系统规划时, 要根据企业发展规划情况合理确定邮箱数据库的大小, 确保系统有足够的空间支持满载的邮箱体系和日志记录。当该资源不足时, 应及时通过系统调整, 为其重新装载足量的空间。

为了能及时跟踪和观察邮箱服务器的数据资源情况, 可以更改邮箱服务器的默认设置。系统默认的邮箱服务器位置是“C:Program FilesMicrosoftExchange ServerMailboxFirst Storage Group”, 该路径较深, 藏在系统文件夹内, 不利于日常监视和观察。通过运行以下命令可以把默认的邮箱服务器更改为“d:new mail”。

move-Storage Group Path-Identity'VMW2K8EN-TX64CSFFirst Storage Group'-Log Folder Path'D:new mail'-System Folder Path'D:new mail'

有了这个路径后, 就可以对该资源进行连续的复制和备份, 连续的复制和备份可以采用以下三种方法。

3. 基于Exchange邮箱服务器的连续复制LCR

本地连续复制 (LCR) , LCR使用Exchange内置连续复制技术在本地计算机上创建存储组的第二个副本 (称为被动副本) 。计算机必须是独立 (而不是群集) 邮箱服务器。在LCR环境中, 管理员决定哪些存储组含有被动副本, 并为同一台服务器上的被动副本配置第二个副本。对于需要数据冗余而不是服务冗余的那些组织, 本地连续复制 (LCR) 是一个很好的选择。使用LCR时, 第一个故障恢复可能具有时间相对较短的服务级别协议 (SLA) 。双重故障需要从备份进行还原。使用此模型时, 双重故障的SLA可能时间要长得多。因此, 每周完全备份和每日增量备份的制度是可行且建议的策略。此策略还可以减少移至备份媒体的总内容。总之, 对于需要从数据故障或损坏中快速恢复但允许服务器由于计划或未计划的原因中断的组织, 本地连续复制 (LCR) 是一个很好的选项。它具有下列优点:

从活动数据库损坏或故障中快速恢复 (仅需两步完成) 。

管理员选择, 用于保护最需要保护的用户, 操作灵活。

在任意大小的邮箱服务器和所有的产品中都可用。

对活动数据库和日志I/O的影响最小。

能够从活动数据库和日志卷中卸载备份I/O。

能够减少移动到备份媒体的总数据量, 同时扩展备份窗口。

国内外灾难恢复发展状况及建议篇9

关键词：灾难恢复,业务连续,备份恢复

1. 绪论

自从第一台计算机诞生以来, 计算机的应用越来越广泛, 人们对计算机的依赖越来越强, 尤其是在金融、电信等行业。在计算机给人们带来便利的同时, 也带来一个新的问题, 一旦人们所依赖的信息系统出现灾难性事件, 如果没有良好的灾难恢复准备, 则会造成不可估量的损失, 对企业来说甚至是毁灭性的。这就对企业提出了一个新的问题即灾后迅速恢复的问题——灾难恢复。美国明尼苏达大学的一项研究表明, 对于没有建立灾难恢复系统的企业, 在经历灾难后有60%的企业会在两到三年后倒闭。由此可见企业建立自己的灾难恢复系统对企业抵御风险的能力和企业的良好发展至关重要, 企业的灾难恢复建设可以通俗的理解成为自己的核心业务运作购买的一份保险, 一旦灾难发生, 可从灾难中迅速恢复先前的运营状态。

2. 基本术语定义

灾难——是指由于人为或者自然原因, 造成信息系统运行严重故障或者瘫痪, 使信息系统支持的业务功能停顿或服务水平不可接受, 比较常见的灾难事件如自然灾害 (地震、海啸、火灾、洪水、台风等) 、人为因素 (操作员的失误、黑客攻击等) 和提供给业务运行所需的服务中断 (设备故障、通信电力中断等) 等。

灾难恢复——是指在发生灾难性事故的时候, 能利用已备份的数据或其他手段, 及时对原系统进行恢复, 以保证数据的安全性和业务的连续性。

灾难恢复的发展过程可以总结成三个发展阶段, 第一个阶段是20世纪90年代之前, 人们主要侧重于IT系统的数据和信息恢复, 这是狭义上的灾难恢复;第二个阶段是从20世纪90年代到2000年左右, 人们不光注重恢复信息系统, 开始注重于恢复信息系统的支撑业务, 确定业务的关键程度和确定业务的恢复目标, 从而灾难恢复有个更广的含义;第三个阶段是2000年以后, 开始侧重于灾难恢复的业务连续性, 使得灾难恢复的范围扩大到广义上的灾难恢复。

3. 国外灾难恢复行业的发展

美国是世界上最早建立灾难恢复的国家, 也是建立监管机制和发布政策最多的国家。美国灾难恢复的开始标志事件是1979年在费城建立了专业的商业化灾难备份中心。此后美国的灾难恢复行业出现了迅猛发展、合并和重组的景象。特别是在9·11事件以后, 企业对灾难恢复行业的重视达到前所未有的程度, 建设灾难恢复系统的比例在不断增高。据Globe Continuity Inc.对美国、英国和加拿大等国使用灾难备份中心的情况调查表明, 使用灾难备份服务外包的比例高达71%, 外包模式比自建模式有诸多优势, 例如安全性高、投资小、运营成本低、专业性高等。

在1983年美国货币监理署要求银行制定并维护灾难恢复预案, 美国通货控制委员会要求国家级金融机构必须进行灾难恢复和业务连续性运作计划。1994年美国联邦政府发布了联邦响应计划指导 (FRPG01-1994) , 明确了灾难恢复和业务连续性的责任和目标。同一年医疗机构评审联合委员会对信息安全、备份及恢复计划等作了相关规定。1996年联邦金融机构检查委员会要求为银行提供服务的部门或公司要有业务连续性运作计划。2001年的9·11事件对美国造成了沉重的打击, 同时也对监管部门在灾难恢复方面提出了新的问题。2002年美国国家标准和技术协会发布了多项有关灾难恢复的指南, 包括SP 800-34《信息技术系统的应急计划指南》、SP800-30《信息技术系统风险管理的指南》、SP800-18《制定信息技术系统安全计划的指南》, 都旨在对风险管理和灾难恢复进行技术角度的规范。2003年修订形成了《联邦金融机构检查委员会业务连续计划手册》, 对业务的连续性提供了指导和检查程序, 使得企业可以更好的应对灾难性事件。

9·11事件以后, 鉴于灾难恢复的重要性, 世界各国的监管部门对行业抵抗灾难的能力重新做了评估, 制定了新的规范和引导文件。例如英国的FSA (Financial Services Authority) 对全国40多个主要金融机构的灾难恢复情况进行了调查并发布了相关文献, 旨在提高本国的灾难恢复能力。新加坡的金融管理局对新加坡金融机构在灾难恢复方面的要求制定了新的指导, 并于2003年发布了正式的《业务连续性管理指南》, 2005年新加坡技术信息标准委员会出台了业务连续性/灾难恢复服务提供商评定标准SS 507, 这个标准对灾难恢复服务商提出了认证和区分标准, 并能促进灾难恢复服务商不断提高服务水平以保持良好的竞争优势。

4. 国内灾难恢复行业的发展

我国灾难恢复的发展与国外相比要晚些, 20世纪90年代末期, 一些单位在关注信息化建设的同时, 开始关注灾难恢复的建设。但那时无论是灾难恢复的理论水平、技术水平还是重视程度都还不成熟。2000年的“千年虫”事件让国内对信息系统的灾难恢复有了更高的重视, 越来越多的部门和单位开始意识到灾难恢复的重要性, 21世纪初期专业的灾难恢复服务商的出现标志着国内灾难恢复市场的起步。2003年中共中央办公厅、国务院办公厅下发了国内最早的一份灾难恢复政策《国家信息化领导小组关于加强信息安全保障工作的意见》, 明确要求了信息系统建设要充分考虑灾难恢复的建设。2004年国务院信息化办公室下发了《关于做好重要信息系统灾难备份工作的通知》, 文件强调了“统筹规划、资源共享”的灾难备份的工作原则, 2005年又下发了《重要信息系统灾难恢复指南》明确了灾难恢复工作的流程、等级划分及灾难恢复预案的制定等方面的内容, 这些都标志着国内灾难恢复工作逐步走向标准化、正规化。2007年6月《重要信息系统灾难恢复指南》经过修订成为国家标准, 国家质量监督检验检疫总局以国家标准的形式发布了《信息安全技术信息系统灾难恢复》 (GB/T20988—2007) , 从此我国也有了灾难恢复的国家标准, 信息系统的灾难恢复工作走上正轨。

随着国家灾难恢复相关政策的接连出台, 信息化程度很高的银行业率先出台了相关的行业政策和标准。2002年中国人民银行下发了《中国人民银行关于加强银行数据集中安全工作的指导意见》, 明确要求实施数据集中的银行必须建立相应的灾难恢复中心, 制定业务连续性计划。2006年4月中国人民银行颁布了《关于进一步加强银行业金融机构信息安全保障工作的指导意见》, 要求全国性大银行原则上应同时采用同城和异地灾难备份和恢复策略。2008年中国人民银行出台了行业标准《银行业信息系统灾难恢复管理规范》, 将信息系统分为了三个等级并确定了每个等级灾难恢复的最低要求。

我国的保险业与证券业也相继出台了灾难恢复的相关政策, 例如2006年中国保险监督管理委员会起草了《保险业信息系统灾难恢复暂行管理办法》, 同年证监会也起草了《证券期货行业信息系统备份工作指引》。

5. 对国内灾难恢复工作的建议

国内的灾难恢复的建设与国外发达国家相比, 无论从服务质量、专业水平还是重视程度上还有很大差距, 通过国内外灾难恢复行业的对比, 本文对国内灾难恢复系统的建设提出以下几点建议。

5.1 普及灾难恢复的基本知识

在我国, 信息系统的灾难恢复起步比较晚, 银行、证券、保险、基金等大型金融行业灾难恢复系统已经初具规模, 大中型企业已经认识到灾难恢复的必要性和重要性, 逐步开始着手建立适合自己的灾难恢复系统, 可对于中小型企业来说, 灾难恢复工作的建设尚未起步, 需要政府部门加大干预和宣传力度, 使得信息化程度依赖较高的中小型企业根据自身特点建立灾难恢复系统, 这对我国信息技术企业整体实力的提高至关重要。

5.2 加大灾难恢复服务商的建设

自建灾难恢复系统适合于有实力的大型金融企业和大型国有企业, 因为自建需要较大的投资和较高的专业技术水平。对于一般企业来说, 自建灾难恢复系统不是良策, 而采取灾难恢复服务外包的形式更适合国内企业状况。目前在我国, 专业的信息系统灾难恢复服务商屈指可数, 水平更是参差不齐, 要满足这些中小型企业对灾难恢复系统服务外包的要求, 国内就必须有足够数量的、足够专业的灾难恢复服务商。政府应扶持一批有实力的信息技术企业参与到灾难恢复服务商的队伍中, 这样一来可以满足企业对灾难恢复服务外包的要求, 二来可以在灾难恢复服务商之间形成竞争关系, 有了竞争才能更好的促进行业的发展, 避免灾难恢复服务行业垄断的形成。

5.3 加大行业内部灾难恢复规范的建设

任何一个行业, 要想良性的发展, 首先就要有国家标准, 而国家标准不可能细化到每个分支行业。需要在国家标准规范的范围内建立更适合某个分支行业的行业标准。同样, 灾难恢复行业也不例外。2007年, 我国有了自己的灾难恢复国家标准《信息安全技术信息系统灾难恢复》 (GB/T20988—2007) 。2006年中国人民银行在“银发[2006]123号文件”中对我国银行灾难备份和恢复系统的建立形式提出建设性意见。2008年中国人民银行出台了更细致的行业标准《银行业信息系统灾难恢复管理规范》, 在保险业、证券业相关行业灾难恢复标准也纷纷出台。上海、北京等城市也制定了本地的信息灾难恢复体系规划。可纵观全局, 我国的信息灾难恢复仍处于刚起步阶段, 很多对信息化依赖程度很高的地区和行业仍没有相关的标准规范和规划, 因此政府应加大力度促进地区和行业的标准规范的确立和实施。

参考文献

[1]吴世忠.《信息系统灾难恢复》.中国信息安全测评中心.北京.航空工业出版社.2009

[2]信息安全技术信息系统灾难恢复 (GB/T20988—2007)

[3]牛云.《数据备份与灾难恢复》.北京.机械工业出版社.2004

灾难恢复篇10

建设灾难备份中心的目的就是在于防止一些灾难性的小概率事件可能对集中式信息系统造成的不可恢复的原始数据的丢失。这些灾难性事件可能包括为火灾, 地震, 电源故障及一些人为的操作失误等。

建设灾难备份/恢复中心有如下的意义:

重要业务数据在灾难发生后得以有效保护;重要业务在灾难发生后可以在设定的时间内恢复, 从而实现业务的连续运行, 提高进一步提高企业声誉;增强客户及潜在客户的信心。

1 企业容灾体系的设计

由于用户数据中心的核心业务系统相对集中, 因此在数据中心实现关键业务数据的规范化的本地数据备份是灾备系统建设的前提和基础:同时通过进行重要业务数据的远程同步实现用户虽要业务数据的远程异地存储, 为实现业务系统的远程正常运作奠定坚实的基础。

容灾系统的关键就是远程生产数据的自动复制。由于用户的应用均为基于数据库的联机事务处理 (OLTP) 业务系统, 所以业务数据远程复制的关键就是确保数据库数据的完整性、连续性, 实时性和可恢复性。而现在基于用户不同的容灾需求所提供的灾难备份/恢复方案主要有四大类型。

1.1 容灾的类型

1.1.1 应用层容灾

通过应用程序来进行远捏数据复制 (应用层次) :其主要原理就是通过修改应用捏序或者使用BEA等公司的中间件产品, 使得前端平台在向数据库服务器发送生产数据时, 同时向主数据中心和备份数据中心均发送交易数据, 主数据中心处理交易数据并返回处理结果。备份中心在正常情况下, 只处理交易数据, 当主数据中心无法正常工作时, 备份中心服务器接替主中心服务器向前端平台返回处理结果。

1.1.2 数据库层容灾

利用数据库厂家的软件产品完成远程数据备份 (数据库层次) :现有的一些数据库厂家例如O racle数据库可以提供STANDBY数据库功能, 通过通信网络将实际数据库日志文件传至备份中心存储系统, 备份中心的STANDBY数据库按照主数据库结构从日志文件中重新恢复数据库;又例如Informix数据库可以提供日HADR (High Availability Data Replication) 功能。在初始化时将主数据中心的数据库中的所有dbspace进行一次零级备份, 并恢复到备份数据中心的数据库中, 之后主数据中心的数据库服务器可以通过通信网络将生产数据库的逻辑日志文件传送至备份中心的数据库服务器, 备份中心的secondary数据库将这些逻辑日志恢复到相应的dbspace上。

1.1.3 操作系统层容灾

利用主机上安装的操作系统级镜像软件进行远程数据镜像 (系统软件, 如HP-UX Mirror Disk UX以Veritas Volume Replicator) ;主中心存储设备与备份中心存储设备进行逻辑卷镜像, 主机同时将数据分别写到本地和远程的磁盘设备上, 实现业务数据的远程复制。

1.1.4 磁盘阵列硬件层容灾

通过最新存储产品磁盘阵列 (磁盘阵列硬件层次) , 可以实现主数据中心和备份中心的操作系统、文件系统、数据库、应用程序的实时远程拷贝复制。主、备中心磁盘阵列本身就可以通过阵列上的微处理器完成数据的实时同步功能。将灾难发生时关键数据的损失降至最低, 而且不需要主机干涉绒占用主机资源, 可以做到灾难发生的同时实现应用处理过程的恢复。远程备份系统的重新启动可以做到像一般输入电源故障后的重新启动那么简单。

1.2 容灾方式简介

1.2.1 应用层方式容灾方式结构简介

利用应用层容灾方式建立针对用户业务的灾难备份系统。其主要原理是同过应用程序或者中间件产品同时向主中心和备份中心传输未经处理的生产数据, 主中心服务器和备份中心服务器同时处理数据。在正常情况下。只用主中心和业务系统联系, 备份中心只在后台处理数据;当主中心瘫痪时。由于备份中心存有生产数据库, 并存有生产数据, 所以可以迅速接管业务。由于是利用应用软件来实现数据同步及保证一致性的, 因而对于硬件方面的影响较小。

这种容灾方式适合于传输距离极长, 且网络传输带宽和通信质量无法得到有效保证的用户环境。而对于存储设备则没有严格的限制, 用户可以灵活地选择满足容量和速度要求的存储设备。

1.2.2 数据库方式容灾结构简介

数据库方式容灾由于只是传送数据库日志, 与应用没有直按关系, 因此无须对应用程序作大的修改。以下介绍主要以Oracle数据库为主。数据库方式容灾通过数据复制把数据定期、在线地复制到目的地的机器上去, 以保持分布在不同地方的两个成多个数据库系统内台的一致性, 来实现数据保护。但它将消耗大量的主机资源 (至少要占用监控和复制两个进程) 。复制的对象是数据库的处理单位, 如事务日制逻辑日志) , 实现方式也有同步与异步两种, 严格来讲, 这种方法很难有真正的同步方案。因为同步数据复制要求做任何一笔交易, 都要实时地将结果发到远程的站点中, 等远程操作结束后, 再执行下一笔交易;而在实际操作中, 很难做到这一点, 只能做异步的数据复制。所以一个实时应用系统中, 一般采用异步方式。

备份数据中心通过网络连接到中央数据中心。在正常情况下。Oracle数据库运行在主数据中心的服务器上。数据存储于主数据中心的磁盘阵列中。利用Oracle数据库提供的STANDBY数据库功能, 可以通过网络将实际数据库日志文件传至备份中心存储系统, 备份中心的STANDBY数据库按照主数据库结构从白志文件中重新恢复数据库。以保持数据的一致性。一旦中央数据中心出现问题。用户可以立即启动备份数据中心的备份数据库以及相关应用。

此方案可以做到在有限的投资范围内, 充分和用现有机器设备, 实现应用系统和盖要数据的灾难恢复功能。

此种容灾方式适合于只远程备份数据库数据, 传输距离较长且网络传输带宽不大的用户环境。

1.2.3 操作系统级镜像软件容灾

利用操作系统层的镜像软件, 如HP-UX Mirror Disk/UX, 实现本地主数据中心的逻辑卷和远端备份数据中心的逻辑卷之间的实时同步数据复制。当主数据中心发生突发性灾难时, 用户可以通过在备份中心服务器上激活相应的卷组和逻辑卷, 进而启动备份中心服务器上的数据库和应用系统, 从而实现业务系统灾难恢复的目标。

这种容灾方式适用于对主机写操作性能要求不高, 而且业务系统可以忍受因光纤传输线路的师时故障而导致业务中止的用户环境。

1.2.4 磁盘阵列容灾简介

此方案最大的优势就是对主机应用完全透明, 所有数据复制工作由磁盘阵列硬件层完成, 不需修改应用, 而且可以保证大量数据复制的性能。由于磁盘阵列数据复制原理是利用磁盘远程镜像功能, 所以可以保证主数据中心关键业务数据和备份中心关键业务数据的完全一致, 而且容灾系统实现起来非常简便。还可以充分利用现有服务器设备, 实现应用系统和重要数据的灾难恢复功能。

2 总结

容灾技术随着需求的增加日益广泛, 而容灾系统的建设实际上不是一个纯粹技术上的问题, 容灾系统的可用性很大程度上同容灾的管理挂钩, 从容灾系统建设的必要性入手, 着重分析了目前容灾技术的四个主要方面, 希望能为容灾系统的设计和假设提供一些参考。

摘要：随着各种重大灾害的发生, 容灾技术越来越受到人们的重视, 如何建设容灾系统每个人的理解又不尽相同, 将对目前的容灾系统设计方案进行了总结, 着重分析了容灾系统四种方案的优、缺点。

【灾难恢复】推荐阅读：

数据的备份与灾难恢复论文10-15

公司数据灾难备份及恢复应急预案09-02

灾难报道05-12

灾难救援08-26

灾难教育08-30

重大灾难10-12

灾难新闻12-11

灾难档案12-25