数据的备份与灾难恢复论文

2024-10-15

数据的备份与灾难恢复论文(共4篇)

数据的备份与灾难恢复论文 篇1

一、引言

随着社会的进步和科学技术的发展,单位、机构的运作对信息系统的依赖性越来越大,而信息系统作为电子、信息产品,有其特有的脆弱性,在各种自然灾害和人为灾难面前难免会受到毁灭性的打击,进而直接影响单位、机构的产品服务的持续提供。对单位机构、社会生产环境、人民群众生命财产安全造成巨大的威胁。数据备份、灾难恢复、灾备建设逐渐成为与信息化建设同等重要的课题,并成为衡量机构信息化建设水平的标准之一。

二、信息系统灾难恢复

1、灾难的定义

《信息安全技术信息系统灾难恢复规范》(G B/T20988-2007)将灾难定义为:由于人为或自然的原因,造成信息系统运行严重故障或瘫痪,使信息系统支持的业务功能停顿或服务水平不可接受,通常导致信息系统需要切换到备用场地运行的突发事件。典型的灾难事件包括自然灾难,如火灾、洪水、地震、飓风、龙卷风和台风等,还有技术风险和提供给业务运营所需的服务中断,如设备故障、软件错误、通讯网络中断和电力故障等;此外,人为的因素往往也会酿成大祸,如操作员错误、破坏、植入有害代码和恐怖袭击。各事件造成的灾难统计数据比例如图1所示。

2、灾难恢复的含义与目标

灾难恢复是指将信息系统从灾难造成的故障或瘫痪状态恢复到可正常运行状态,并将其支持的业务功能从灾难造成的不正常状态恢复到可接受状态,而设计的活动和流程。它的目的是减轻灾难对单位和社会带来的不良影响,保证信息系统所支持的关键业务功能在灾难发生后能及时恢复和继续运作。

灾难恢复主要涉及的技术和方案有数据的复制、备份和恢复,本地高可用性方案和远程集群等;但灾难恢复不仅仅是恢复计算机系统和网络,除了技术层面的问题,还涉及到风险分析、业务影响分析、策略制定和实施等方面,灾难恢复是一项系统性、多学科的专业性工作。

3、灾难恢复的特点

(1)灾难恢复是为高风险、小概率事件作准备的。灾难是低概率事件,在一般情况下,灾难备份资源处于闲置状态,但当灾难来临时,若灾备中心不能正常发挥作用,将对单位和社会造成巨大的影响。

(2)灾难恢复系统建设投入大、运行维护成本高。构建第二个数据中心来备份主要数据中心,需要类似的基础设施、设备、人力投入等,并保证计算机系统的高可用性。与发生灾难的低概率相比,灾备中心建设投入的成本还是太高。在运行维护期间,涉及设施的维护、设备的更新、运维的人员及其管理,其成本也很高。

(3)灾难恢复技术人员的专业性要求高。灾难恢复团队的成员须对系统比较熟悉,经常参与灾难恢复演练,具有处理日常问题的丰富经验,才能保证在灾难发生时能够沉着应对。但维护这样的灾难恢复团队,使他们有足够的恢复演练机会,成本是很高的,长期维护一支高水平、具有丰富的演练实践经验的灾难恢复队伍十分困难。

(4)灾备中心的管理十分规范和严格。为了保持灾备中心的正常运行,灾备中心的管理应该具有严格的规范,具有先进的灾难恢复理念和完善的管理模式,用以保障平时的安全运行及在发生灾难或演练时候能够及时地接管。

4、我国灾难恢复的标准法规

2003年以来,党中央和国务院有关部门陆续下发了《国家信息化领导小组关于加强信息安全保障工作的意见》、《关于做好重要信息系统灾难备份工作的通知》、《国家信息安全战略报告》、《国家信息安全“十一五”规划》等政策性、指导性文件,对我国灾难恢复工作和国家灾难恢复体系建设,制定了基本目标、任务和原则。

此外,我国政府十分重视标准在信息系统灾难恢复建设中的规范性和指导性作用。国务院信息化办公室于2005年4月份下发了《重要信息系统灾难恢复指南》(国信办[2005]8号文件),明确了灾难恢复工作的流程、灾难恢复能力的等级划分及灾难恢复预案的制定。2007年6月,国家质量监督检验检疫总局以国家标准的形式正式发布了《信息安全技术信息系统灾难恢复规范》(G B/T 20988-2007),该标准于2007年11月正式实施。

三、灾难恢复与灾难备份、数据备份

为了灾难恢复而对数据、数据处理系统、网络系统、基础设施、技术支持能力和运行管理能力进行备份的过程称为灾难备份。灾难备份是灾难恢复的基础,是围绕着灾难恢复所进行的各类备份工作,灾难恢复不仅包含灾难备份,更注重的是业务的恢复。

数据备份通常包括文件复制、数据库备份。数据备份是数据保护的最后一道防线,其目的是为了在重要数据丢失时能够对原始数据进行恢复。从灾难恢复的角度来看,与数据的及时性相比更应关注备份数据和源数据的一致性和完整性,而不应片面地追求数据无丢失。任何灾难恢复系统实际上都是建立在数据备份基础之上的;另一方面,数据备份策略的选择取决于灾难恢复的目标。

四、数据备份技术

1、主要的数据备份方式

正常情况下,系统的各种应用运行在主中心计算机系统上,数据同时存放在主中心和备份中心的存储系统中。当主中心面临断电、火灾、地震及恐怖袭击等灾难无法工作时,则立即采取一系列相关措施,将网络、数据线路切换至备份中心,并且利用备份中心计算机系统重新启动应用系统。这里最关键的问题就是保证切换时间满足业务连续性要求,同时尽可能保持主、备中心数据的连续性和完整性。而如何解决主、备中心的数据备份和恢复则是备份方案的重点。

以下对灾难恢复系统所采用的几种常用技术作一简单描述。结合应用系统的相关特点(实时性要求、运行中断敏感性等)、数据更新频度、数据量大小、相关条件等因素,实际的灾难恢复系统解决方案可能是多种技术方案的组合。

(1)基于磁带的数据备份。利用磁带拷贝进行数据备份和恢复是常见的传统灾难备份方式。使用这种方式的数据拷贝通常是存储在盘式磁带或盒式磁带上,并存放在远离基本处理系统的某个安全地点。磁带通常是在夜间存储数据,然后被送到储藏地点。而在灾难或各种故障出现、系统需要立即恢复时,将磁带提取出来,并送往恢复地点,数据恢复到磁盘上,然后再恢复应用程序。这种方式的实现过程复杂,恢复效率低,已越来越不适合用户不断发展的业务系统的需要。

(2)基于应用软件的数据备份。是指由应用软件来实现数据的远程复制和同步,当主中心失效时,灾难备份中心的应用软件系统恢复运行,接管主中心的业务。

这种技术是通过在应用软件内部,连接两个异地数据库,每次的业务处理数据分别存入主中心和备份中心的数据库中。但这种方式需要对现有应用软件系统进行比较大的修改升级,甚至重新开发,增加应用软件的复杂性,对应用软件开发技术水平要求较高,系统实施难度大,而且后期维护比较复杂。并且由应用软件来实现数据的复制和同步会对整个业务系统的性能造成较大的影响。

(3)远程数据库复制。是由数据库系统软件来实现数据库的远程复制和同步。基于数据库的复制方式可分为实时复制、定时复制和存储转发复制,并且在复制过程中,还有自动冲突检测和解决的手段,以保证数据一致性不受破坏。其实质是实现主、备用系统数据库的数据同步(实时或者准实时同步),即将主系统数据库操作Log实时或者周期性地复制到备用系统数据库中执行,实现两者数据的一致性。

远程数据库复制对主机的性能有一定影响,可能增加对磁盘存储容量的需求(包括对Log的存储),但系统恢复较简单,在实时复制方式时数据一致性较好,所以对于数据一致性要求较高、数据修改更新频繁的应用可采用基于数据库的数据备份方案。

(4)基于逻辑磁盘卷的远程数据复制。是指根据需要将一个或多个卷进行远程同步(或者异步)复制。该方案通常通过软件来实现,基本配置包括卷管理软件和远程复制控制管理软件。远程复制控制管理软件将主用节点系统的卷上每次I/O的操作数据实时(准实时或者延时)复制到远程节点的相应卷上,从而实现远程两个卷之间的数据同步(或准同步),主、备节点之间通常需要配置相应带宽的IP通道。

基于逻辑磁盘卷的远程数据复制会增加各节点主机的一些处理性能需求,在此前提下且通信带宽保证时,远程复制效率和数据一致性可以得到保证。基于逻辑磁盘卷的远程数据复制因为是基于逻辑存储管理技术,一般可与主机系统、物理存储系统设备无关,对物理存储系统自身的管理功能要求不高,有较好的可管理性,也便于主、备系统的扩充和发展;同时,也可方便地做到多对一或者一对多的远程数据复制。

(5)基于智能存储系统的远程数据复制。是由智能存储系统自身实现数据的远程复制和同步,即智能存储系统将对本系统中的存储器I/O操作请求复制到远端的存储系统中并执行,保证数据的一致性。由于这种方式下,数据复制软件运行在存储系统内,因此较容易实现主中心和备份中心的操作系统、数据库、系统库和目录的实时拷贝维护能力,一般不会影响主中心主机系统的性能。如果在系统恢复场所具备了实时数据,那么就可以做到在灾难发生的同时及时开始应用处理过程的恢复。基于智能存储系统的方案具有高效快速的特点,数据复制过程不占用主机资源,操作控制比较简单,但该方案也有开放性差(不同厂家的存储设备系统一般不能配合使用)、对于主备中心之间的网络条件(稳定性、带宽、链路空间距离)要求较苛刻等缺点。

(6)远程集群主机切换。远程集群(Cluster)主机切换技术并非是一种数据复制技术,但该技术能和上述的数据复制技术相结合,对分布在多个节点的主机系统进行集群化管理控制。当主节点系统故障无法正常运行时,控制系统对相应应用系统的运行在主机间进行切换(检测到故障后人工干预切换或者自动切换)。一般情况下,考虑远程集群主机切换方案时,应首先解决数据的远程复制,否则单纯主机系统间的应用切换就失去意义。此外,远程集群主机切换方案要求节点间具备通信条件(如IP通道),每个节点主机需配置相关的集群管理控制软件以及管理代理。

2、网络存储备份渐成主流

网络存储是目前数据备份系统中应用比较广泛,发展比较迅速的数据存储备份技术。

(1)N A S(N etwork A ttached Storage,网络附加存储)。是采用独立于PC服务器,单独为网络数据存储的一种文件服务器。N A S服务器中集中连接了所有的网络数据存储设备(如各种磁盘阵列、磁带、光盘机等),基于以太网设计,存储容量可以较好地扩展,同时由于这种网络存储方式是N A S服务器独立承担的,所以,对原来的网络服务器性能基本上没什么影响,以确保整个网络性能不受影响。它提供了一个简单、高性价比、高可用性、高扩展性和低总拥有成本(TCO)的网络存储解决方案。

(2)SAN(Storage Area Network,存储区域网络)。与NAS完全不同,它不是把所有的存储设备集中安装在一个专门的NAS服务器中,而是将这些存储设备单独通过光纤交换机连接起来,形成一个光纤通道的网络,然后这个网络再与企业现有局域网进行连接。SA N对于LA N的带宽占用几乎为零,而且服务器可以访问SA N上的任何一个存储设备,提高了数据的可用性;SA N网采用光纤传输通道,可以得到高速的数据传输率;SA N可以把异构环境下不同厂商的存储设备整合在一起,实现资源的共享。凭借解决方案的集成特征、对开放标准的支持、虚拟化和自动功能,SA N将成为企业存储应用的主流,SA N与N A S融合也是大势所趋。

五、结束语

当信息系统中的业务数据正变得越来越重要时,数据丢失的风险也越来越大,灾难恢复与数据备份成为保证信息系统投资的必由之路。对很多用户来说,信息系统灾难恢复与数据备份虽然已经不是一个全新概念,但它的重要性及地位越来越高。

参考文献

[1]吴世忠,信息系统灾难恢复基础[M].北京:航空工业出版社,2009.

[2]王渝次,信息系统灾难恢复的规划及实施[M].北京:北方交通大学出版社,2006.

[3]张冬,大话存储-网络存储系统原理精解与最佳实践[M].北京:清华大学出版社,2008.

[4]http://www.chinaitlab.com[EB/OL].

数据的备份与灾难恢复论文 篇2

随着网络技术的不断发展和医疗改革的逐步深入, 医疗卫生信息系统在全行业中应用越来越广, 随之而来的信息系统灾难恢复与数据备份问题, 也越来越多的受到重视。如何保障业务发展的连续性, 避免数据损毁, 快速从灾难中恢复, 已成为医疗信息系统安全运行的关键因素。

1 影响医疗卫生信息系统安全运行的因素

影响医疗卫生信息系统安全运行的因素有很多, 具体可以归纳为:

(1) 数据备份保存问题:不可预见的自然灾害, 如火灾、水灾、地震等来自非计算机系统因素灾害, 有可能导致中心机房损毁。如果这样的灾难发生, 不管你本地采用什么样的安全措施, 都有可能会造成很大的损失。更可怕的是, 如果本地数据损毁, 并且没有异地备份, 这对医疗卫生信息系统可以说是一个致命的打击。

众所周知, 数据是医疗信息系统应用中最宝贵的财富之一, 在信息系统中占据主导地位。特别是各种病人数据对医疗行业来说是难得的资源, 是服务于病人的基础之一, 也是保持医疗业务持续发展的保障。可以充分利用这些数据, 通过数学统计分析处理, 找出疾病的相关因素, 更有效的治疗疾病, 提高病人的治愈率和满意度, 增强在同行业中的竞争实力。

当然, 自然灾难发生的概率很小, 若预防为主, 在当今网络无处不在, 上网非常方便的情况下, 只要采取远程异地备份数据或建立远程灾难恢复中心方式, 就可以避免遭受损失, 只是需要考虑成本与代价。

(2) 硬件系统故障及网络设备和通讯线路损毁

由于网络设备 (交换机、路由器) 或服务器的设备故障或由于施工, 造成通信线路中断, 不能及时传送数据。有条件的也可以采用线路的冗余备份。

(3) 病毒、木马、黑客攻击等造成的损失

首先, 对服务器采取安全措施:如设置网络防火墙, 关闭不必要的服务, 经常进行系统升级和修补漏洞, 其次, 建立服务器使用的规章制度, 设置不同使用人员的权限, 禁止使用服务器进行不必要的上网操作等。

(4) 资源不足引起的宕机。对于医疗卫生行业, 随着业务的快速增长, 可能引起系统资源不足, 特别是业务增长较快的单位。

(5) 人为操作故障

对管理较严、人员素质较高的单位, 人为误操作偶尔发生;对管理较松、人员培训不足的单位, 可能会经常发生;一般预防方法是:提高系统自动化运行管理水平, 做好本地数据备份, 减少人的操作与干预, 或据自身情况制定严格的管理规范, 并由管理人员切实执行备份制度, 减少或避免误操作。

(6) 存储媒体管理问题, 如今, 用来存储数据的介质越来越多, 各种不同系统下存储产生的软盘、磁带、光盘将给管理带来很大的困难。

2 可以采用的安全措施

要保证系统安全运转, 保证快速从灾难中恢复, 避免数据丢失, 必须对网络系统安全、硬件、软件、数据等采取完善的措施, 以应对突发事件。保证数据安全的办法可以采取软、硬件备份。

(1) 服务器硬件备份 (系统冗余)

磁盘阵列+双机热备份技术, 保证服务器安全运行。

双机热备份技术采用同步的数据备份, 用一台从服务器对主服务器进行备份, 同时对服务器磁盘采用磁盘阵列方式, 如RAID5, 保证由于频繁磁盘操作, 导致磁盘损坏时, 可以热插拔进行更换磁盘并有可能修复数据。

但该技术也存在着缺陷, 如果主服务器数据由于误操作导致数据丢失损毁, 从服务器也会照常进行备份, 将这种非正常的数据备份下来。RAID5也是无能为力, RAID5只能防止万一部份磁盘损坏, 将通过更换磁盘, 将坏盘中的数据恢复, 但仍不能将被误操作 (如被误删除) 的数据恢复出来。

总的来说, 本技术更适合保证无数据交换的、只提供服务的服务器来使用, 它可以保证系统的正常运行。但并不适合数据交换频繁或存储大量数据的情况。并且, 当服务器感染病毒、木马或受到黑客攻击, 也不能保证备份正常。因而, 采用本技术还要有一个数据恢复机制, 只有使用一个具有完善的双机备份及恢复机制的方案, 才能保障服务器全天候安全可靠运行, 也能将意外误操作的数据恢复出来。

(2) 群集技术保证服务器安全运行

可以通过群集技术提高数据库级信息服务的可用性。一个本地群集可以使由于系统的单点而出现故障的可能降到最小。在共享数据的群集中, 损耗窗口可以为零。在群集中, 备份可以运行在导入了数据库服务器镜像数据的辅助服务器上。

(3) 数据备份

数据备份分为常规备份和历史保存。一般备份目的主要有两个:一是系统的业务数据由于系统或人为误操作造成损坏或丢失后, 可及时在本地实现数据的恢复;另一个目的是在发生地域性灾难 (地震、火灾、机器毁坏等) 时, 可及时在本地或异地实现数据及整个系统的灾难恢复。

考虑到本地环境安全性原因, 常规数据备份一般要求一份数据至少应有两个拷贝, 一份放在应用中心以保证数据的正常恢复, 另一份则要移到异地保存, 以保证在本地出现灾难后的数据恢复。此外, 还应建立历史归档数据的异地存放制度, 从而确保对历史业务数据的可靠恢复与有效稽核的实现。

(1) 检验数据库备份

大多数的医疗卫生信息系统都会定期地对它们的数据库进行备份, 但很少对数据库备份进行检验。数据库备份由于一些原因, 如:数据库被破坏后才进行备份、在完全备份的过程中数据库处于应用状态、存储介质损毁等, 会使数据备份变得无效, 从某种意义上讲, 无效的数据库备份比根本不做备份的情况更糟, 因为无效的数据库备份会造成一种安全的假象。

因此, 检验数据库备份是一项非常重要的工作, 尤其是在进行了自动备份进程之后或是在数据库结构改变之后。即使是没有任何改变发生, 定期进行检验也是必需的, 例如可以定期地检测存储设备和存储是否有损坏等。

(2) 备份时间周期考虑

随着数据量的逐渐增大, 一个不容忽视的问题显现出来:备份所需要的时间越来越长, 它对服务器资源的占用也越来越多。当需要备份的数据量很大时, 一次备份所耗费的时间也许会很长, 尤其对于医疗行业不间断的业务方式, 在保证业务不间断的情况下, 备份工作就变得极为困难。

为了节省目标计算机的存储空间, 用增量或差分等高级备份选项, 将任意一天的数据备份到目标计算机上, 当数据受到破坏时就可以恢复到任意一天的数据状况。

3 数据备份方式

医疗卫生信息系统的数据一般都保存在数据库中, 要对数据进行备份, 可采用的备份方式有:

数据库服务器复制、数据库在线备份/离线备份、增量备份、文件备份。

(1) 数据库服务器的复制

大多数数据库服务器都支持复制, 如Microsoft SQL Server, 允许采用一对多或双向的复制, 也支持数据库子集的复制, 只将指定的数据复制到目标端。通过数据库服务器的复制, 就可以用来实现灾难恢复。

数据库服务器的复制需要在主站点和恢复站点间有一个高性能网络的连接, 但即使这样也不能完全实时同步, 这意味着在数据库完全将数据反映到备用数据库有一个时间延迟。一些数据库支持同步复制, 虽然解决了上面的问题, 但是它明显减低了主数据库的性能, 因为只有当所有的复制任务全部结束后, 数据库才能继续接收数据。

存储复制是一种简单可行的数据库复制方法, 它将所有的数据库数据复制到远程中心站点, 当需要实现灾难恢复时, 再从数据中心复制回恢复站点。

无论数据库复制还是存储复制, 都会将人为误操作和应用错误复制到恢复端。例如, 在应用站点误删除了一个表, 那么恢复中心也会删除, 因此使用复制无法纠正错误。

(2) 数据库离线备份和在线备份方式

离线备份, 在备份过程中, 禁止使用数据库。

在线备份, 在备份过程中, 用户仍可以使用数据库。这种情况下, 需要确保不管数据访问多么活跃, 都能够得到一个完整的数据拷贝。

(3) 完全备份或增量备份

不管是离线备份和在线备份, 都可以采用完全备份或增量备份方式。

完全备份采用的是复制文件的方式。但是, 随着数据库的不断增长和对可用性要求的提高, 数据库完全备份在许多情况下无法完成。如果在两次备份间只有少量的数据变化, 数据库增量备份可以缩短数据库备份时间和节省备份介质。

4 数据恢复技术

(1) 全系统恢复

全系统恢复一般应用在服务器发生意外灾难导致数据全部丢失、系统崩溃或是有计划的系统升级、服务器进行更新时。

(2) 个别文件恢复

由于操作人员的水平不高, 个别文件恢复可能要比全盘恢复常见得多, 可以利用网络传输, 恢复受损的个别文件

(3) 数据库恢复

数据库备份是最基本和有效的数据库容灾技术。通过备份, 并且快速的将备份介质运送到安全的地方, 数据库就能够在大多数的灾难中得到恢复。

为了预防数据丢失, 需要有详细的灾难恢复计划, 同时还要定期进行灾难演练。可以利用淘汰的机器或多余的硬盘进行灾难模拟, 以熟练灾难恢复的操作过程, 并检验所生成的灾难恢复盘和灾难恢复备份是否可靠。

5 结论

硬件故障、自然灾害、病毒、黑客攻击、误操作等都有可能导致重要数据丢失, 造成不可估量的损失。如何尽快地在短时间内恢复信息系统、以及能恢复到什么程度?是医疗卫生信息系统安全运转的重要问题。

完善的医疗卫生信息系统, 应具有快速从灾难中恢复, 以及一套完善、可靠的数据备份机制。备份机制应该是全方位、多层次的。采用的备份技术要具有高可用性, 通常要使用硬件备份技术来防止硬件故障, 在保障硬件系统安全运行的前提下, 还要考虑由于软件故障或人为误操作造成的数据损坏问题, 这可以采用网络存储备份系统和硬件容错相结合的方式。这种结合方式构成了对系统的多级防护, 不仅能够有效地防止物理损坏, 还能够彻底防止逻辑损坏。

参考文献

数据的备份与灾难恢复论文 篇3

随着社会信息化程度的不断提高, 一方面信息电子化为人们提供了前所未有的好处, 另一方面数据量也在几何级数增长, 非常重要数据的存储、安全性问题日益突出, 尤其是金融领域的数据, 不但要应对存储量的无限加大, 而且要确保数据的安全可靠, 以保证各应用服务系统全天候的可靠运行, 为经济金融提供良好服务环境。

人行地市中心支行作为国家银行的派出机构, 更是担负着维护辖区的支付清算、财税库银横向联网等重要金融业务系统稳定运行的重要职责。一旦其重要服务器因某种不可抗拒的自然力、服务器软硬件故障或人为因素造成数据损坏, 无法运行, 小会影响整个单位日常工作的正常运转, 大会影响整个辖区税款入库, 支付清算系统正常运行, 影响辖区内金融系统正常运转, 对当地经济和人民生活会造成难以估计的伤害。为保障它们正常运行, 维护地区金融业务系统稳定运转, 对关键服务器系统的数据备份和灾难恢复是人行地市中心支行重要工作之一。本文结合工作实际, 对地市中心支行在数据备份和灾难恢复方面提出一些建议。

1 数据灾难的种类及应对方法

在日常工作中, 造成数据损坏, 影响应用系统正常运行的原因不外乎以下几方面:一是自然灾害, 如水灾、火灾、地震、雷电等造成计算机系统损坏。为避免此类问题造成数据损坏, 通过将重要数据的备份放到其它地区、城市以“冷备份”的方式保存或者在异地建立热备份站点来进行在线备份。二是计算机设备故障等导致业务系统数据损坏。如硬盘、磁带等存储设备的老化等。可以从制度上要求对计算机设备进行定期维护检测, 重要数据定期进行备份, 树立安全意识, 防患于未然, 在存储设备突然损坏时, 通过事前的备份迅速开展灾难恢复工作, 以保证业务系统的及时正常运行, 使其对系统的影响减到最小。三是病毒或人为等因素造成业务数据丢失。通过建立数据访问控制制度和策略, 设置网络访问权限, 及时更新系统补丁, 定期查杀病毒, 以及定期备份数据来保障应用系统的稳定运行。

数据备份和灾难恢复目标就是克服上述各种情况对计算机系统造成的不利影响, 保障业务系统的持续稳定运行, 其核心思想是明确数据备份内容, 构建适宜的备份系统架构, 针对不同备份对象设置合理备份策略, 建立数据备份保管制度, 灾难恢复重建制度, 确保业务系统遭遇上述几种灾难后能被迅速恢复至稳态运行。

2 地市中心支行数据备份及灾难恢复现状

2.1 备份内容

地市中心支行业务系统需要备份的数据对象大体有以下几种:一是重要业务系统寄宿的操作系统, 其包括所有的补丁、修改和更新。二是单位网络配置参数。三是重要业务系统安装程序配置文档以及软件许可证等。四是数据库及其业务数据文件。

2.2 备份架构

为确保各业务系统的平稳运行, 设置了一套软硬结合备份架构, 具体如下:

2.2.1 硬件备份

对重要业务系统 (如中央银行会计核算系统, 国家金库会计核算系统等) 建立一主一备服务器, 业务数据由工作人员在每日业务结束时, 与手工进行同步, 避免因硬件故障、服务器无法启动而导致业务停运, 同时保留其备份文件至指定服务器, 以备不测。

2.2.2 软件备份

在内网建立专门的软件备份服务器, 其存储设备通过一块SCSI卡连接到磁盘阵列柜, 利用Legato NetWorker对所有服务器数据进行集中备份。

软件集中备份的网络拓扑简图:

2.2.3 备份策略

综合考虑各业务系统状态及运行要求, 合理利用网络带宽资源, 选择适合的备份方式制定一套备份策略, 既可以保证数据备份的有效性和可靠性, 又可以将备份操作对整个业务系统产生的负载减少到最小和灾难发生后系统恢复至正常状态的恢复时间最短。

备份操作分为以下几类:

正常备份 (Normal) :也叫完全备份。是将整个系统的状态和数据完全进行备份, 包括服务器的操作系统、应用软件以及所有的数据和现有的系统状态, 系统状态在Windows server中包括注册表、启动文件、COM+注册数据库、活动目录和系统卷等。

上图中每条线对应某一个时点的完整备份。其优点是备份全面、完整, 如果发生数据损坏, 可以通过灾难前一次的正常备份就可以完全恢复数据;缺点是占用大量的备份空间和时间, 效率比较低, 因为这些数据有大量的重复内容。

增量备份 (Incremental) :备份上一次备份后增加或者更改过的数据, 与差异备份差别是增量备份中指的“一次备份”不一定是针对上一次完整备份, 而是最近时间点的备份。

上图中红色线条表示完整备份的数据, 其他颜色线条表示是完整备份后增加的或者更改的数据备份。增量备份的数据更少, 因此备份时间也大大减少, 不过在灾难恢复时比较复杂, 需要完整备份和灾难发生以前的所有增量备份, 如果其中一个备份体出错, 应用系统就无法被恢复。

差异备份 (Differential) :备份上一次完整备份后增加或者修改过的数据。上图中红色线条是完整备份, 橙色线条表示对周二变更数据的差异备份;蓝色线条表示对周二至周六期间变更数据的差异备份。差异备份减少备份所需存储空间和时间, 恢复数据时, 用完整备份和差异备份两个备份文件就可以恢复到灾难发生前的系统状态。

因不同数据对象对灾难恢复要求存在差异, 下面的备份策略可根据需要进行选择。一是宿主操作系统文件备份, 通常变化不大, 可在系统更新后做一次完整备份, 系统设置发生关键性变更时做增量备份。这样既可满足灾难恢复需要, 又可以减少备份操作对时间和空间的需求。二是网络配置参数备份。双机热备关键路由器, 在物理链路上形成了一条安全环路。整个网络的配置参数只在网络环境发生变化时才予以备份。三是业务数据文件备份。业务数据属于数据备份的重心, 也是灾难恢复的最关键依据。因地市中心支行重要业务数据总量可测量的, 要求每个工作日做一次完全备份, 并在备份机器上做恢复操作, 确保备份体有效。四是重要业务系统配置文件备份。应用系统的重要配置参数及文件的备份, 一般是随着操作系统的备份一起完成, 因为这些参数文件和操作系统联系紧密, 对特别重要的还要形成纸质配置文档。

2.2.4 备份管理

数据备份和灾难恢复对数据备份体的管理是不可或缺的。建立合理的管理制度, 从制度上确保数据备份体的完整性和安全性, 确保灾难恢复的有效开展, 缩短应急处理的响应时间。一是对软件集中备份的数据对象, 定期查看软件的备份日志, 选择适合的时点, 通过客户端进行恢复测试。二是对硬件备份的重要业务系统, 备份体由专门的业务人员保存并形成保管日志。每个工作日业务结束后进行数据恢复, 一方面可确保备份体的可用性, 另一方面保证主备机的数据每日同步。三是网络配置参数在每次网络参数变更进行备份, 由专人手动备份保管, 在应急演练时予以恢复测试。

3 数据备份及灾难恢复存在的问题及建议

工作中发现地市中心支行数据备份及灾难恢复存在以下问题。

首先是工作人员混淆普通的数据备份与系统备份两者概念。如认为备份了应用业务系统的数据库文件就可以应付灾难恢复了, 其实这是不可靠的。因为他缺少了系统备份要求的应用程序, 数据库系统、用户设置、系统参数等信息的备份。普通的数据备份只是备份了业务系统的运行状态, 并没有记录业务系统运行的支撑环境, 这样势必影响灾难恢复的快速开展。因此建立完整的系统备份才能有效开展业务系统的灾难恢复。

其次是数据安全问题。目前重要业务系统的数据库手工备份只是简单备份至指定服务器, 没有对其进行安全处理, 如加密、完整性校验等。备份体存在被恶意利用甚至篡改的可能。应该从制度上要求业务人员加密保存业务数据备份体, 并用md5的文件校验工具来校验文件的完整性。

再次是重要业务系统不存在异地备份。目前地市中心支行还保留了众多的业务数据, 考虑到不可预测的自然灾害对数据产生破坏的可能性, 数据异地保存已经成为地市中心支行的数据安全工作中的一个重要议题。此类问题可从两个方面考虑, 一是改变现有业务系统数据存放架构。积极参与和配合上级行的业务系统大集中工作 (如中央银行会计核算数据集中系统、国库会计数据集中系统) , 使重要业务系统数据库上移至省会或总行数据中心;由省级业务中心尝试在少数地市中心支行建立灾备中心。二是同系统平级单位间洽谈数据互备协议, 建立数据互备中心。利用文件加密, 校验等技术确保数据文件的完整性和保密。利用访问控制技术提升备份空间的安全性。

最后是重构现有业务系统部署架构, 充分发挥业务系统的功能分层作用, 提高数据备份和灾难恢复工作效率。目前业务系统都是多层架构, 尤其是对业务逻辑层和业务数据层有明确区分。

现有的业务系统部署架构如上图所示, 是将业务逻辑和数据两个功能都部署在一台物理机器上, 这样不但增加了部署成本, 而且提高了业务逻辑和数据之间的耦合, 不利于数据备份和灾难恢复的开展。笔者认为在当前计算机硬件和网络的条件下, 结合虚拟机技术, 可以将业务系统的业务逻辑层部署至虚拟机上, 数据层部署至专门的数据库服务器上, 具体架构如下图所示。

此架构在没有增加硬件投入的情况下, 就可以轻松备份业务系统运行的支撑环境和业务逻辑部分。因为只要备份好虚拟机文件就可以了, 从而把重点放在业务系统的数据层备份上, 充分利用业务系统的特性, 来减少数据备份的工作量, 保证灾难恢复的快速开展。

参考文献

[1]王以和, 涂小平.分布式数据库系统.电子工业出版社.

[2]Legato NetWorker.操作手册.

数据的备份与灾难恢复论文 篇4

昆腾公司昆腾公司 (NYSE:QTM) 今天推出了一项新的云备份与灾难恢复订阅服务Q-CloudTM, 以消费级云存储价格提供企业级数据保护。Q-Cloud采用昆腾的重复数据删除专利技术, 提供物理和虚拟基础设施的备份, 受保护数据容量从1TB到1PB。通过创新的Q-Cloud, 从数据中心到企业边缘, 再到现在的云, 昆腾致力于提供业界最为全面的解决方案。

采用昆腾重复数据删除与虚拟数据保护

●Q-Cloud利用了本地和云中的DXiR系列数据保护与Quantum vm PROTM虚拟机保护功能。DXi设备提供独一无二的重复数据删除专利技术, 带来云存储经济效益的革命。

●DXi系列设备让Q-Cloud能够支持现有的备份软件, 包括Backup Exec、Comm Vault、Data Protector、NetBackup、v Ranger、Tivoli Storage Manager和Veeam。

●Quantum vm PRO和DXi的数据缩减率可以高达95%。

●Quantum vm PRO软件让客户能够对虚拟机进行快照并复制到云中, 是Q-Cloud灾难恢复即服务产品 (Draa S) 的基石。

低成本、可靠的边缘到云复制

●使用Q-Cloud的多站点企业可以经济地从边缘直接复制到云, 无需把主要资源用于备份和灾难恢复。

●单站点企业可以享受利用第二站点进行低成本备份和灾难恢复的优势。

●借助本地DXi系列设备, Q-Cloud客户可以享受本地恢复的速度和便捷, 同时拥有云备份的安全性。

“按需付费”的订阅式定价

●订阅式定价支持数据保护的“按需付费”, 让客户只需购买所需的存储容量, 无需多买。

●订阅式定价把资本支出转化为运营支出, 让客户避免成本与利用率低的硬件相联系, 使离线备份与灾难恢复解决方案更具经济效益。

●昆腾的Q-Cloud解决方案与很多云服务不同, 后者通常需要客户在数据增长时购买昂贵的额外硬件, 或者采用仅限云的全盘更换方式而放弃之前的投资。

支持性言论

●Enterprise Strategy Group的高级分析师Jason Buffington表示:“昆腾致力于通过重复数据删除以及针对虚拟化优化的数据保护机制而实现更好的备份。对于DXi用户, Q-Cloud有潜力彻底颠覆云备份与灾难恢复的假定经济效益, 使得Baa S和DRaa S成为那些认为这不可实现的用户的可行选择。”

上一篇:围护结构变形下一篇:动态密钥