存储备份(共10篇)
存储备份 篇1
1 存储与备份技术的高效性
1.1 高性能多源下载过程
(1) 服务器根据相关信息返回存储需要下载文件的Slave的具体信息; (2) 根据文件大小和Slave的负载状态, 选择合适的Slave建立socket连接对文件进行分块下载; (3) 下载完成后把各个文件块合并成为原始文件。
1.2 静态下载
在静态下载中, 不考虑备份文件的大小, 服务器的负荷量, 采取统一的模型进行下载。算法如下: (1) 得到备份文件所在服务器的个数n, 以及每个服务器的IP地址和端口号; (2) 得到文件的总大小size, 按照文件分割算法, 把文件分割为n块; (3) 与每个服务器建立连接, 从每个服务器上下载一块文件; (4) 下载完成后, 把所有文件块合并成一个完整的文件, 存储在备份介质上; (5) 保存备份文件的相关元数据信息; (6) 文件下载、备份完成。
1.3 动态下载
在动态下载模型中, 要综合考虑各方面因素, 动态决定文件是否分块进行多源下载, 以及文件块的大小, 提高系统资源利用率, 进而提高备份效率。对于没有冗余的文件, 只能从一个节点上下载。对于较小的文件, 使用单线程下载;对于较大的文件, 可以采用多线程下载。对于有多个冗余的文件, 可以动态选取从负荷量较低的节点进行下载。伪算法表示如下:
首先定义如下变量:文件大小阀值Tl, 当文件大小大于Tl时采用多源下载;节点标准负荷T2, 若节点负荷大于T2, 则节点处于重负荷状态;文件大小size文件冗余数n。
算法表示如下:
2 存储与备份技术的一致性
2.1 锁和快照技术
锁就是当进行数据备份时, 对需要备份的数据加锁, 此时禁止对数据进行修改。由于备份时禁止对数据的修改, 锁技术对数据的可用性会造成一定的影响, 会影响到系统的效率。快照就是在相当短的时间内生成原存储系统的瞬时映像, 该映像生成之后, 备份就可以根据该映像来进行, 而不用担心数据的不一致性。快照技术的实现有两种方式:更新复制方式和Split-mirror方式。更新复制技术就是当进行快照时, 并不立刻复制数据, 只有当数据发生变化时才进行复制。Split-mirror是使用和主存储系统一样的快照存储系统, 数据同时保存在主存储系统和快照系统, 此时快照系统就可作为备份数据。
2.2 在线备份
在分布式文件访问平台中, 存在着海量的文件, 文件的信息较多, 若把文件的信息逐个复制则要浪费大量的时间、空间, 对系统的可访问性造成影响。WAFL文件系统使用了更新复制技术。当创建系统快照时, 并不立刻复制所有文件信息, 而是创建新的快照根节点, 它与原文件系统根节点有相同的信息, 文件系统中根节点的子节点也为快照根节点的子节点。此时以快照根节点为根节点生成了一棵快照树, 它和原文件系统树除了根节点以外, 其余部分相同。当文件信息需要修改时, 创建新的节点, 把文件信息赋给此节点, 并把节点作为快照节点插入快照树中, 同时修改原节点的信息, 具体分为以下情况:
(1) 修改文件信息:当对文件的基本信息进行修改时, 如更改文件名称等, 此种情况下比较简单, 伪算法如下:
修改文件信息具体过程如图3:
(2) 移动文件:当把文件或者目录从一个目录移动到另外一个目录下时, 具体伪算法如下:
移动文件过程如图4所示:
(3) 新建文件:当新建文件时, 具体伪算法如下:
新建文件过程如图5所示:
2.3 备份的实现
在创建好快照树之后, 就可以进行在线备份。快照树保存的信息就是开始备份瞬间所有文件的信息, 进行在线备份时, 首先从快照树的根节点开始, 逐个访问节点, 按顺序对快照树进行遍历、备份, 保证了数据的一致性, 并且可以在备份的同时允许对数据进行修改, 不影响用户的访问。
3 存储与备份的可靠性
在分布式系统中存储着海量的数据, 数据量大, 备份的时间较长, 在备份的过程中可能会出现错误情况或者发生意外的中断。因此备份过程中需要随时记录备份的进度, 这样在备份发生错误或者异常时, 下次备份能够在上次备份的出错点继续进行, 实行断点备份, 而不用重新开始备份。断点备份过程中, 使用日志表来记录备份过程, 把每次备份的信息写入日志表。日志表如表1:
3.1 伪算法
3.2 算法复杂度
若日志表中的记录个数为K, 文件总数为N。则对于每一个记录项, 要查找其在文件树中的位置, 当前一个记录项查找到时, 由于遍历的顺序性, 后一个记录项可以从前一个的位置继续向后查找, 这样, 可以保证K个记录项查找次数为K, 也即为O (n) 。当备份发生错误或者中断时, 通过此算法, 能够在相当少的时间内, 找到断点位置, 下一次备份时可以直接从断点位置继续进行, 实现断点备份, 保证了备份的可靠性。
参考文献
[1]牛云, 徐庆.数据备份与灾难恢复[M].北京:机械工业出版社, 2007.
[2]张联峰, 刘乃安, 张玉清.P2P技术[J].计算机工程与应用, 2007, (12) .
[3]刘天时, 赵正.一种通用数据库数据整理方法[J].计算机工程, 2007, (2) .
[4]韩德志, 谢长生, 李怀阳.存储备份技术探析[J].计算机应用研究, 2006, (5) .
[5]谢川.数据备份技术的初探[J].中国科技信息, 2006, (12) .
存储备份 篇2
从体系结构上讲,数据中心的建设主要应该包含以下几个部分:(1)接入交换设备
在SAN的数据中心网络里,接入层交换设备主要是与服务器群相连,从可靠性考虑,也可将接入层与汇聚层设备融合在一起,服务器直接挂在汇聚层设备上,这样就要求汇聚层设备具备接入层设备的一些特性;
(2)服务器群
按照分区的原则,根据业务功能划分服务器群属于不同的分区,对这些分区的服务器进行访问控制,安全管理等操作,同时服务器又按照应用进行分层,如分为Web服务器,应用服务器,Database服务器,根据各层的安全级别不同分层进行控制;各项业务的数据也主要集中在服务器上,这样数据中心就形成一个网络上的存储和流通的中心,形成网络中数据交换最集中的地方;
(3)存储/备份
SAN是目前新兴的存储技术,也是我们建议的郑燃集团存储解决方案,它也解决了基于IP的存储传输及本地备份和异地容灾备份的问题,同时出于成本等方面考虑,部分小的数据中心可以采用服务器方式的备份;这是一块相对独立的安全区,也是数据量交互非常大的一块区域;
(4)安全防护
数据中心的资源是我们重点保护的地区,从数据中心的入口到各服务器区的入口都实施安全控制,各服务器群分级保护,确保所有对数据中心的访问都在安全控制范围内进行,防止任何入侵攻击,将安全渗透到网络结构,设备特性,数据资源,用户管理,形成一道道天然的保护屏障;
(5)管理
数据和管理分离是方案的一大特点,这样可以确保对网络的管理不受数据的影响,使各网络设备实时出于网络系统管理之中,不受任何攻击的干扰,同时对网络情况进行监控,网络故障能得到实时处理。4.2.2.5.2 存储系统规划要求
数据中心存储系统应具备如下功能:(1)海量存储
大量的数据资料和多媒体资料的存储和发布是数据中心应用的核心,拥有一套或多套大容量的存储系统是保证数据安全性和服务连续性的关键。海量存储不仅要求存储系统具有超大容量,而且硬件的可靠性、容量的灵活扩展、简便的安装维护管理也会提高应用的效率。
(2)传输能力
数据中心为郑燃集团内部用户提供丰富的数据资料,并且是众多信息化应用的后台,整个系统的性能有着较高的要求,包括存储系统与服务器之间的大容量、高频率的I/O传输,设备内部的总线传输带宽,服务器的网络性能和响应能力等都应是关注的焦点。
(3)管理和备份功能
数据中心数据量巨大,因而存储的规划、管理、数据备份方面的工作是保证可靠应用的前提,所以,配置先进的管理、备份工具能够高效地管理海量数据。4.2.2.5.3 存储系统设计目标
方案应该针对郑燃集团数据中心的需求而设计,设计的存储方案应具有以下特点:
(1)具备极高的安全性
存储系统采用的是应用与数据分离的方式和结构,因此,系统必须考虑如何保障应用服务器与存储系统的连接与访问的安全性。
(2)先进的体系结构
应采用先进、成熟的技术,使存储系统整体上具有很快的响应速度和更高的数据带宽,可以长时间承受大量用户极高的访问频率和访问速度。同时,还必须保障系统具有良好的架构,产品具备良好的扩充性。
(3)高可用性保障,关键应用无单点故障
数据中心所有应用数据集中后,数据的安全性和稳定性将非常重要,因而,存储系统应具备冗余配置,减少单点故障,从而能够支持对数据中心所有应用服务器的不间断访问。以及实现可靠的系统备份、恢复和实现重要的历史数据有效归档及恢复,为应用系统提供高可用性保障,使用可靠、便捷、功能强大的管理软件,实现自动化数
据存储、减少对人工干预的依赖。
(4)系统应具有较高的性价比
应采用优良的系统设计及多种存储架构,并充分考虑到存储系统的性能、价格、使用寿命以及系统投产后的后续成本等因素,以较经济的方式建成适应多种业务、稳定可靠的存储资源,满足未来数年数据中心网络对存储容量、性能的要求,保证系统具有良好的性价比。
(5)系统应具有良好的兼容性
存储系统应能够同网络、主流的操作系统、主流的服务器平台、数据库系统、应用软件较好地结合,并保证应用系统在升级后能够进行平稳的数据迁移及系统过渡。4.2.2.5.4 存储系统规划
针对郑燃集团数据中心对存储区域网络的要求及网络状况,首先需要考虑的就是解决数据存储的系统多样性和零散性,为了达到这一目标,我们建议采用智能化的海量存储及备份系统来实现。通过分析,我们认为,存储系统主要包括六个主要的模块:
基于SAN的网络集中存储: 使用智能化的高速海量存储系统 存储虚拟化 SAN管理 高可用系统 网络数据备份
下面将对这几个模块做详细的描述。基于SAN的网络集中存储
对于数据中心的核心存储架构,我们建议采用以数据和存储为核心的集中存储系统结构。以数据和存储为中心可以极大地保护投资,有效利用存储空间,降低用户管理费用,从而确保整体拥有成本最低。降低管理难度,维护数据管理的统一性。提高电子化数据管理的可靠性。数据的集中化管理,能够确保数据的一致性和完整性,保证电子化数据的可靠性。
以数据和存储为中心必然对整个存储系统性能有很高的要求,本规划方案选用集中式、高性能、大容量、智能化的存储区域网(Storage Area Network,简称SAN)来构建新一代计算中心存储环境。所谓存储区域网是指在服务器之后的高速子网络,它利用硬件、软件和光纤通道技术把所有与存储设备相关的处理工作移往一个集中的环境,使数据网络可以处理关键性任务。而信息存储则可通过存储区域网通信,从而消除I/O 瓶颈,提高系统性能。SAN一改过去以服务器为中心的存储模式,以数据存储为中心,采用伸缩的网络拓扑结构,通过IP连接方式,提供SAN内部任意节点之间的多路可选择的数据交换,并且将数据存储管理集中在相对独立的局域网内。SAN的最终目标是实现在异构环境中最大限度的数据共享和可管理性。存储区域网是未来存储系统发展的方向。
使用智能化的高速海量存储系统
使用智能化的高速海量存储系统,可以提供足够的数据存储空
间,采用冗余硬件、RAID技术以及动态备用磁盘提供高数据完整性,存储系统本身的高速缓存CACHE功能提高数据的读写速度,从而增强系统处理交易的总体性能。
提供高可靠性的数据存放,通过存储系统的可靠性设计以及磁盘镜像、RAID技术,保证存储介质内数据的可靠性。
可以实现较高的外部共享磁盘容量,存储设备的最大磁盘容量都可达到几十个TB。根据存储数据量需求,可配置可用容量,供数据存储使用,随着数据量增大,将来可以扩充磁盘数目增加容量。
可在在以后进行平滑的升级并继续使用,做到很好的投资保护。选用产品必须支持连接多种服务器平台,充分保证了将来主机升级到更高档次服务器后,能快速可靠地连接到存储系统,避免了系统升级时需要重新购买存储设备的投资。
高效而可靠的磁盘阵列备份和灾难备份,可以利用SAN的特点实现高速安全的数据备份,保证恢复数据的可用性和完整性,并可用于将来建立远程灾难备份中心,实现数据异地备份。在发生灾难事故时,通过将应用系统切换到灾难备份中心主机,保证系统能够继续运行,对外服务不会中断。
可利用存储软件进行多个镜像备份,利用备份软件通过生产数据卷的镜像备份卷,提供快速拷贝,可实现以下功能:
缩短备份时间。系统管理员可在镜像备份卷脱离生产卷以后,通过备份机挂接镜像备份卷,进行磁带/磁盘备份,在磁带/磁盘备份完成之后,再将镜像备份卷与生产卷重新同步。这样,备份由原来的磁
带拷贝变成镜像备份卷脱离生产卷的操作,使系统真正实现7*24小时对外服务。
实时数据采集。测试需要使用实时数据时,把镜像备份卷与生产卷脱离,然后挂接到开发机供测试使用。在完成测试后,将该备份卷与生产卷重新进行镜像,使备份卷与生产卷同步,可提供下次测试使用。这样进行的实时数据采集不会影响系统的运行,可在任意时间点进行。
存储虚拟化
存储虚拟化是一个抽象的定义,它并不能够明确地指导我们怎么去比较产品及其功能。这个定义只能用来描述一类广义的技术和产品。存储虚拟化同样也是一个抽象的技术,几乎可以应用在存储的所有层面:文件系统、文件、块、主机、网络、存储设备等等。
SNIA的存储网络字典里是这样定义的:虚拟化——通过将一个(或多个)目标(Target)服务或功能与其它附加的功能集成,统一提供有用的全面功能服务。典型的虚拟化包括如下一些情况:屏蔽系统的复杂性,增加或集成新的功能,仿真、整合或分解现有的服务功能等。虚拟化是作用在一个或者多个实体上的,而这些实体则是用来提供存储资源或服务的。
存储虚拟化是一个SAN里面的存储中央管理、集中管理,这是虚拟化的一个特点,一个突出的地方。任何一个企业的存储利用的是一个非常模式性的东西,特别是不能共享存储空间的时候,就需要去买很多存储,而不能用其他人空闲的存储。
SAN管理
随着SAN 备受关注,如何将这种新的环境管理起来成为存储管理软件的一大热点。SAN管理软件是提供存储合并和共享、管理、访问、安全及其他服务的产品。SAN管理的核心是实现存储设备共享的软件,该软件把SAN上不同的存储设备转化成可以通过任意授权主机访问并可以从中央位置管理的虚拟存储池。
在存储共享方案中,物理/逻辑关系都被打破,文件系统和物理资源间建立起一个虚拟层。虚拟层将文件系统映射到物理资源上,并对存储设备的分配进行管理,这样SAN上所有的存储设备都可以表现为一个单独的(或多重的)可通过SAN上的任意服务器访问的磁盘映像。
高可用系统
对于数据中心中最为重要的管理系统,由于其系统与数据的特殊性,通常将其系统分别安装在两台服务器上,数据库存放在稳定的、可靠的核心存储设备上,两台运行管理系统的服务器之间实施集群系统,以确保数据中心的管理系统的持续可用。由于目前的作为初期的存储项目,建议先采用企业级的智能存储系统作为数据中心的数据中心。
网络数据备份
考虑到数据中心数据及应用系统的重要性,建议将其各主要系统平台及数据库做全面的备份或容灾设计。即使保证了核心业务系统的不间断运行,但是仍有必要对整个系统做妥善的备份,同时,对其他
各PC-Server的操作系统、应用及数据库系统也需要建立完善的备份策略,以确保数据中心的管理系统稳定、可靠、持续可用。
综合以上情况考虑及SAN的存储整合实施需求,方案设计将存储设备集中存放在网络中心机房,将服务器通过IP方式与存储设备连接,可以直接访问SAN中的集中存储设备,其它的如VPN服务器、防病毒服务器等则不需要接入SAN。
总之,当系统完成后,郑燃集团的应用系统应具有一个能够符合未来发展(包括业务和技术)的可靠的基础构架。信息的可用性、可靠性、可管理性、系统的可扩展性和灵活性将大大提高,以满足目前及未来的业务发展及科学管理的需要。4.2.2.5.5 网络拓扑描述
规划方案采用SAN的方式实现数据中心的集中存储,同时,考虑到集中存储的可靠性,方案应考虑建设灾备中心。
整个系统服务器群和存储系统均以千兆网线联接至数据中心两台互为热备份的全千兆交换机。存储控制器后端通过4条FC光纤通道连接磁盘阵列柜。存储控制器前端经由全千兆以太网交换机连接服务器。
主存储系统建议使用较为高端的SAN存储阵列,该系统应该是完全模块化结构,应能提供上百T的存储容量。
备份存储系统建议使用中端的SAN 存储阵列,该系统也应该是完全模块化结构,应提供不小于10T的存储容量。
4.2.2.5.6 负载均衡设计
(1)定义
负载均衡是由多台服务器以对称的方式组成一个服务器集合,每台服务器都具有等价的地位,都可以单独对外提供服务而无须其他服务器的辅助。通过某种负载分担技术,将外部发送来的请求均匀分配到对称结构中的某一台服务器上,而接收到请求的服务器独立地回应客户的请求。
(2)作用
如果发现Web站点负载量非常大时,应当考虑使用负载均衡技术来将负载平均分摊到多个内部服务器上。如果有多个服务器同时执行某一个任务时,这些服务器就构成一个集群(clustering)。使用集群技术可以用最少的投资获得接近于大型主机的性能。
(3)类型
目前比较常用的负载均衡技术主要有: 基于DNS的负载均衡
通过DNS服务中的随机名字解析来实现负载均衡,在DNS服务器中,可以为多个不同的地址配置同一个名字,而最终查询这个名字的客户机将在解析这个名字时得到其中一个地址。因此,对于同一个名字,不同的客户机会得到不同的地址,他们也就访问不同地址上的Web服务器,从而达到负载均衡的目的。
反向代理负载均衡
使用代理服务器可以将请求转发给内部的Web服务器,让代理服
务器将请求均匀地转发给多台内部Web服务器之一上,从而达到负载均衡的目的。这种代理方式与普通的代理方式有所不同,标准代理方式是客户使用代理访问多个外部Web服务器,而这种代理方式是多个客户使用它访问内部Web服务器,因此也被称为反向代理模式。Apusic负载均衡器就属于这种类型的。
基于NAT的负载均衡技术
网络地址转换为在内部地址和外部地址之间进行转换,以便具备内部地址的计算机能访问外部网络,而当外部网络中的计算机访问地址转换网关拥有的某一外部地址时,地址转换网关能将其转发到一个映射的内部地址上。因此如果地址转换网关能将每个连接均匀转换为不同的内部服务器地址,此后外部网络中的计算机就各自与自己转换得到的地址上服务器进行通信,从而达到负载分担的目的。
由于目前现有网络的各个核心部分随着业务量的提高,访问量和数据流量的快速增长,其处理能力和计算强度也相应地增大,使得单一的服务器设备根本无法承担。在此情况下,如果扔掉现有设备去做大量的硬件升级,这样将造成现有资源的浪费,而且如果再面临下一次业务量的提升时,这又将导致再一次硬件升级的高额成本投入,甚至性能再卓越的设备也不能满足当前业务量增长的需求。
针对此情况而衍生出来的一种廉价有效透明的方法以扩展现有网络设备和服务器的带宽、增加吞吐量、加强网络数据处理能力、提高网络的来实现的,在DNS中为多个地址配置同一个名字,因而查询这个名字的客户机将得到其中一个地址,从而使得不同的客户访问不
同的服务器,达到负载均衡的目的。DNS负载均衡是一种简单而有效的方法,但是它不能区分服务器的差异,也不能反映服务器的当前运行状态。
代理服务器负载均衡
使用代理服务器,可以将请求转发给内部的服务器,使用这种加速模式显然可以提升静态网页的访问速度。然而,也可以考虑这样一种技术,使用代理服务器将请求均匀转发给多台服务器,从而达到负载均衡的目的。
地址转换网关负载均衡
支持负载均衡的地址转换网关,可以将一个外部IP地址映射为多个内部IP地址,对每次TCP连接请求动态使用其中一个内部地址,达到负载均衡的目的。
反向代理负载均衡
普通代理方式是代理内部网络用户访问internet上服务器的连接请求,客户端必须指定代理服务器,并将本来要直接发送到internet上服务器的连接请求发送给代理服务器处理。反向代理(Reverse Proxy)方式是指以代理服务器来接受internet上的连接请求,然后将请求转发给内部网络上的服务器,并将从服务器上得到的结果返回给internet上请求连接的客户端,此时代理服务器对外就表现为一个服务器。反向代理负载均衡技术是把将来自internet上的连接请求以反向代理的方式动态地转发给内部网络上的多台服务器进行处理,从而达到负载均衡的目的。
混合型负载均衡
在有些大型网络,由于多个服务器群内硬件设备、各自的规模、提供的服务等的差异,我们可以考虑给每个服务器群采用最合适的负载均衡方式,然后又在这多个服务器群间再一次负载均衡或群集起来以一个整体向外界提供服务(即把这多个服务器群当做一个新的服务器群),从而达到最佳的性能。我们将这种方式称之为混合型负载均衡。此种方式有时也用于单台均衡设备的性能不能满足大量连接请求的情况下。
(4)网络负载均衡技术
网络负载均衡服务在Windows 2000 高级服务器和Windows 2000 数据中心服务器操作系统中均可得到。网络负载均衡提高了使用在诸如Web服务器、FTP服务器和其它关键任务服务器上的因特网服务器程序的可用性和可伸缩性。运行Windows 2000的单一计算机可以提供有限级别的服务器可靠性和可伸缩性。但是,通过将两个或两个以上运行Windows 2000 高级服务器的主机连成群集,网络负载均衡就能够提供关键任务服务器所需的可靠性和性能。
每个主机运行一个所需服务器程序的独立拷贝,诸如Web、FTP、Telnet或e-mail服务器程序。对于某些服务(如运行在Web服务器上的那些服务)而言,程序的一个拷贝运行在群集内所有的主机上,而网络负载均衡则将工作负载在这些主机间进行分配。对于其他服务(例如e-mail)只有一台主机处理工作负载,针对这些服务,网络负载均衡允许网络通讯量流到一个主机上,并在该主机发生故障时将
通讯量移至其它主机。
网络负载均衡配置概述
网络负载均衡是Windows 2000的一个网络驱动程序。它的操作对TCP/IP网络栈而言是透明的。
为确保网络性能达到最优,网络负载均衡通常使用一个网络适配器来处理客户到群集的通讯量,而其它对服务器的网络通讯量则经由一个单独网络适配器。然而,第二个网络适配器是不需要的。
来自负载均衡服务器应用的数据库访问
某些服务器程序需要访问由客户请求来更新的数据库。当这些程序的负载在群集内得到均衡分配时,相关的更新工作则应保持同步状态。每个主机均使用一个本地、独立的数据库拷贝,而该数据库在必要时可脱机并入。另一种方法是,群集主机能够共享对一个独立的网络数据库服务器的访问。也可以组合使用这些方法。例如,静态Web网页能够在全部群集服务器间进行复制,以确保快速访问和全面容错。但是,数据库访问请求将转发至为多个Web服务器进行更新处理的公共数据库服务器。
某些关键任务程序可能需要使用高度可用的数据库引擎以确保全面容错。逐渐地,具有群集识别能力的数据库软件将得到部署,用以在整个群集模式中提供具有高度可用性与可伸缩性的数据库访问。Microsoft SQL Server就是一个例子,它能够使用群集服务功能以双节点方式进行部署。群集服务可确保在一个节点发生故障的情况下,剩余的节点将承担起故障电脑的职责,这样,就能够为Microsoft
SQL Server 客户提供近乎连续的服务。由于两台电脑共享一个公共磁盘子系统,则上述功能是可以实现的。
通过讨论在以下两个群集解决方案之间进行比选是十分重要的。第一方案,网络负载均衡主要是分配引入的传输控制协议/网际协议(TCP/IP)通讯量;加入这一解决方案的计算机形成一种群集。第二方案,群集服务主要是提供从一台计算机到另一计算机的故障应急服务;加入这一解决方案的计算机形成另一种群集。网络负载均衡群集通常运行Web服务器程序。群集服务通常运行数据库程序(当与网络负载均衡联合使用时)。通过将两个群集连接在一起以互补方式发挥作用,用户创建了全面群集解决方案。
网络负载均衡如何工作
网络负载均衡为共同工作且使用两个或两个以上主机群集的Web服务器提供了高度可用性和可伸缩性。因特网客户使用单一的IP地址(或一个多主主机的一组地址)访问群集。客户不能将单一服务器从群集中区分开来。服务器程序不能识别它们正运行于一个群集中。但是,由于网络负载均衡群集即使在群集主机发生故障的情况下仍能提供了不间断的服务,故而,它与运行单一服务器程序的单一主机大相径庭。与单一主机相比,群集还能对客户需求做出更迅捷的反应。
网络负载均衡通过在主机发生故障或脱机的情况下将网络通讯量重新指定给其它工作群集主机来提供高度的可用性。与脱机主机现存的连接虽然丢失,但因特网服务仍然处于可用状态。在大多数情况下(例如,就Web服务器而言),客户软件会自动重试发生故障的连接,而且,客户仅需几秒的延迟即可收到响应。
网络负载均衡通过在群集的一个或一个以上虚拟IP地址当中分配引入的网络通讯量来提供伸缩能力。群集中的主机于是对不同客户请求做出响应,即使是来自同一客户的多重请求也如是。例如,Web浏览器可能在单一Web网页内获得群集内不同主机处的多重映射。这就加速了处理过程并缩短了对客户的响应时间。
网络负载均衡使在一个子网上的全部群集主机能够为群集的主IP地址(以及多主主机上的额外IP地址)同时检测引入的网络通讯量。在每个群集主机上,网络负载均衡驱动程序充当了一个介于群集适配器驱动程序和TCP/IP栈之间的过滤器,以这种方式使主机能够收到一部分引入的网络通讯量。
网络负载均衡使用全面分布式的算法来从统计意义上将引入的客户映射到基于IP地址、端口和其它信息的群集主机上。在检查收到的数据包时,所有主机均同步执行这种映射以迅速决定哪个主机应处理该数据包。除非群集主机数量发生变化,该映射会保持不变。网络负载均衡过滤算法在数据包处理程序方面要比在集中负载均衡程序方面高效得多,而这必须修改并重发数据包。这就使网络负载均衡能够提供高得多的聚集带宽。通过直接在群集主机上运行,网络负载均衡的性能并不受某一代处理器或网络技术的局限。
群集通讯量的分配
网络负载均衡控制对从因特网客户到群集内选定主机的TCP与用户数据报协议(UDP)通讯量的分配,做法如下:在配置了网络负
载平衡以后,对群集IP地址的引入客户请求由群集内的所有主机收到。网络负载平衡在这些数据报到达TCP/IP协议软件之前,就对这些数据报进行过滤以指定TCP和UDP端口。网络负载平衡只管理TCP/IP中TCP和UDP协议,并以逐端口方式控制它们的活动。
除了流向指定端口的TCP和UDP通讯量之外,网络负载均衡不控制任何引入的IP通讯量。网络负载均衡不对网际控制报文协议(ICMP)、网际组成员协议(IGMP)、地址解析协议(ARP)或其它IP协议进行过滤。所有这些通讯量均不加修改地传递给在群集内全部主机上的TCP/IP协议软件。因为有了TCP/IP的稳定性及其处理重复数据报的能力,其它协议就能够在群集环境内正确运转。可是,当使用群集IP地址时,可能预期从特定的点到点TCP/IP程序(比如ping)中看到重复的响应。这些程序能够通过为每个主机使用专用的IP地址来避免这种情况的发生。
集中收敛
网络负载均衡主机通过在群集内定期交换组播或广播消息来协调彼此间的活动。这就使它们能够监控群集所处的状态。当群集所处状况发生变化时(比如主机故障、脱离或加入群集),网络负载均衡就会调用一个称为集中收敛的处理过程,在这个处理过中,主机之间将交换消息以确定一个新的、持续的群集状态,并推举一个具有最高优先级的主机充当新的缺省主机。当群集的全部主机就新的群集状态达成一致时,它们就会将集中收敛的完成记入Windows 2000的事件日志。
在集中收敛期间,除非故障主机没有收到服务,主机将一如继往地处理引入的网络通讯量。客户对工作主机的请求是不受影响的。在集中收敛完成时,故障主机的通讯量会重新分配给剩余主机。负载均衡通讯量将在剩余宿主间分配,从而达成特定的TCP或UDP端口间最大可能的负载均衡。如果一个主机添加到群集中,集中收敛会允许该主机接管处理端口的任务,并由此使之具备最高的优先级;同时,集中收敛还将使该主机分到它所应负担的负载均衡通讯量份额。群集扩展不会影响正在进行的群集操作,并且保证对因特网客户和服务器程序而言是以透明方式实现的。可是,在客户的相似性被选定的情况下,群集扩展会影响到跨越多重TCP连接的客户话路,这主要是因为在连接之间可能将客户映射到不同的群集主机上去了。
网络负载均衡假定只要主机参加了群集宿主间的正常消息交换,那么,它就在群集内处于正常运转状态。如果其它主机在若干期间均未收到对消息交换的响应,它们就会启动一个集中收敛操作以重新分配先前由故障宿主承担的负载。能够控制消息交换的周期和用来决定启动集中收敛操作的通信遗漏次数。以上两者各自的默认值分别为1000毫秒(1秒)和5次。由于上述参数不常修改,因此,它们不能在“网络负载均衡属性”对话框中进行设置。必要时,这些参数可在系统注册表中以手工方式加以调整。4.2.2.5.7 数据安全控制
(1)数据备份管理要求
日常的数据备份管理:由于系统数据量大,如果由人工来进行数据的备份工作将给系统管理带来很大的工作量。工作人员的情绪化,每天备份日程的变化,误操作等都可能造成可靠性得不到保障,难以形成制度化。一旦备份人员外出、生病等都可能导致备份工作中断。
重要文件的定期归档:建立对重要文件的定期归档管理策略,将重要的文件保护起来,实现对历史数据的长期保留和快速查询。
分级存储管理:建立对文件的分级存储管理策略,使得文件能够自动在不同的存储介质之间迁移。
存储介质管理:随着计算机的运行,用来存储数据的磁带介质越来越多,我们应将磁带有效的管理起来并建立电子标签;如果介质中没有电子标签,一旦人工标签脱落导致发生混乱,要想知道介质上数据的内容就会很难。
系统灾难恢复:实现火灾、地震等灾难后的系统重建和业务数据运作。
应用数据库在线备份:针对打开状态的应用数据库提供接口实现在线备份。做到不停止运行进行在线备份,实现连续运行以提供每天24小时不间断服务。
(2)数据备份主要内容
系统数据备份:操作系统、应用系统数据,支持AIX、HP-UX、Sun、WindowsNT、Linux等混合应用平台。
应用数据库7×24小时在线备份。
应用数据文件备份:是指备份用户系统内的一些重要的数据文
件,这些文件是基于相应的文件系统的。
远程数据文件备份:从中心服务器上备份中心服务器上的数据和重要信息文件。
(3)数据备份工具
使用Tivoli Storage Management(TSM)企业备份软件,实现统一制定策略、集中备份的方案,它具有以下特点:
自动化、智能化的备份和恢复能力。
系统管理员通过定制TSM的策略机制来安排数据备份和恢复,可以指定需要备份的数据、备份设备及备份周期等各相关项。灵活的TSM中心日程表,可以安排合适的备份时间,避开网络高峰时段,优化网络资源的使用。TSM自带的关系数据库能够跟踪每个文件的每个备份版本,标识磁带卷及保留其他管理信息。TSM避免了备份工作中的人工操作,提高系统管理人员的工作效率,降低了管理费用。
开放的解决方案。
TSM的客户机端为超过30种操作系统平台提供备份和恢复服务,服务器端可运行在多种平台上,包括AIX,WindowsNT,HP-UX,SunSolaris,MVS等。它能够备份及恢复分布式数据、应用和数据库,包括DB2,Oracle,Sybase,Informix,MicosoftSQLServer,MicosoftExchangeServer,Lotus应用和SAP/R3。
有效的存储管理。
TSM服务自动将不常用的数据从昂贵的磁盘移到磁带库或磁带库上。目的是尽量利用现有存储设备的资源,减少磁盘的升级,降低管
理费用。
灾难恢复,简单易行。
当系统出现错误或遭受自然灾害时,系统管理员按照详细的恢复指令,可将系统回复到最新备份版本的状态。利用DRM,系统管理员能够定制该计划,指定数据异地备份的地点;必要时,恢复TSM服务器到另一个站点。
快速备份和恢复
越来越多的公司要求计算机系统一周7天、一天24小时地运作。他们需要更快、更可靠的数据备份方案,备份窗口越小越好。TSM从各方面作了优化,以加速备份和恢复的过程。
TSM支持全盘备份和独一无二的“永久增量备份”方式。永久增量备份是指:初始时做所有数据文件的全盘备份,以后只备份新的或改动过的文件。这种方式减少了备份时间和所需的存储容量,减轻了网络负担。当然,仅有强大的备份功能还不够,更重要的是恢复。TSM可以帮助用户在发生意外事故或灾难后迅速、可靠地恢复系统。TSM运用其独有的“磁带配置”和“磁带重用”技术,使每个客户机的每天的备份数据都对应放在一盒或一组磁带上,使得TSM能够用最少的磁带数作全盘恢复。这是一种迅速、可靠的数据恢复方式。
简单易用的图形界面
它帮助用户非常容易的完成基本的备份和恢复。并支持“断点继续”的恢复方式,提供一个过程指示器,增强了搜索功能,支持目录树备份。系统管理员可以通过基于WEB的管理者界面,从企业网的任
何地方来管理TSM服务器。
存储器共享和灾难防护
一些企业中有多个TSM服务器,新版TSM提供了ServertoServerCommunication选件,使数据能在TSM服务器间迁移,多个服务器可共享存储设备,如大型磁带库。这一功能允许TSM服务器相互备份,所以,可以用来实现类似在线灾难恢复的功能。
提高效率
TSM的中心控制功能帮助企业有效利用资源,提供全面控制管理能力;数据操作的中心日志为管理存储设备状态提供方便;集中监视功能可与系统管理工具如Tivoli、HPOpenView、CAUnicenter和NetView结合,通过SNMP协议管理网络存储。
系统管理员可在Server端设置Client端选项,对Client分组等,避免重复的设置工作。
TSM数据库和Server的实时信息都可通过SQL界面被访问或报告。在Client端32位Windows平台上,还可通过ODBC将数据引入MicosoftExcel和Access,或Lotusl-2-3和LotusApproch中,以建立查询,产生报表。
TSM提供了完备的、可伸缩的存储管理方案,注重性能、控制和可用性,为今天和未来的网络计算提供存储解决方案。
(4)数据备份策略
周五采取全备份策略,保留一份完整的数据。
周一至周四采用增量备份,选用增量级别,使得备份时备份系统
中与周五全备份相比更改和产生的全部新文件。
当周一出现恢复要求时,只需将上周五备份的全部数据从磁带库中恢复出来即可。
当周二或周五出现恢复要求时,只需将上周五备份的全部数据加上前一天备份的增量数据恢复出来即可。
当要求恢复某些错误删除的文件时,系统会根据文件索引,找到删除文件的各个备份时间版本,从而帮助用户确认后从删除前一天的备份介质中加以恢复。
当要求备份的系统多于一个时,以上策略可以按轮流的方式实现,例如周五为A系统全备份,其它系统选择相对全备份的增量备份,周一为B系统做全备份,其它系统做增量备份。如此类推。
通过定义数据分组,实现介质与备份内容的关联。往往采用利于恢复的方式定义磁带,而不是象常规人工备份方式将不相关的系统和文件内容都备份在一磁带内。因此磁带数量的设定往往比计算的量要多一些。由于备份时换盘的时间一般不影响备份的效率,如用户要恢复某个文件的不同版本以确定在一个同时间内的某些被更改的内容。
(5)介质管理 磁带的“克隆”
在设定备份策略时,将全部磁带分成两组,备份采用“克隆”技术,即每次的备份都做完全相同的两份。
磁带的分组
我们利用的磁带分组技术,我们可以指定几个磁带专做系统备
份,其它的磁带用于日常数据备份。将用于系统备份和用于日常数据备份的磁带分开。
磁带的存放
磁带的日常存放可以这样安排:一份放在机房;另一份放在其它绝对安全的地方。
电子标签
对每一个用于作备份的磁带自动加入一个电子标签,同时在软件中提供了识别标签的功能,如果磁带外面的标签脱落,只需执行备份系统的这一功能,就会迅速知道该磁带的内容。
加密存放
用户不但可以对所归档的文件设置口令,而且可以进行加密处理,从而保证了数据的安全性,即使有人拿走了媒体,也无法打开或阅读其中的数据。而且对用作归档的媒体进行保护处理,使得它不会被重新使用而冲掉重要的归档数据。
(6)数据恢复
在服务器中为每次的备份建立在线式的索引,当用户需要恢复时,只需要点取在线式索引中需要恢复的文件或数据,备份系统就会自动进行文件的恢复。
(7)数据库在线备份
用户需要对数据库应用的全天候的数据保护,将备份策略扩展到大型关系型数据库上,与关系型数据库本身的备份功能结合实现市郊的在线式的数据保护。
支持数据库数据的“本地备份,集中管理”模式。实现数据库表空间、数据文件以及归档日志的跟踪备份。(8)灾难恢复计划
在计算机系统数据管理技术中,制订数据恢复计划是一个重要环节。在项目实施过程中给予高度重视。常规数据恢复计划如下:
业务数据库破坏而需要恢复时。
利用软件来浏览所需恢复的数据库文件,触动恢复功能,软件将自动驱动存储设备,加载相应的存储媒体,然后恢复指定文件。
非数据库文件破坏而需要恢复时。
利用软件来浏览所需恢复的文件存储集,触动恢复功能,软件靠自动驱动存储设备,加载相应的存储媒体,然后恢复指定文件存储集。
非TSM服务器的应用服务器系统瘫痪而需要恢复时。当硬件设备连接完成后,按以下步骤恢复应用服务器: 安装应用服务器操作系统并配置网络 安装TSM客户端软件
从TSM服务器的索引表浏览该服务器系统全备份信息,触动恢复功能,软件将自动驱动存储设备,加载相应的存储媒体,靠该应用服务器的全部数据恢复。
检查数据差值 录入孤立丢失数据 批准系统运行 完成事故报告
TSM服务器系统瘫痪而需要恢复时。
当硬件设备更换、连接完成后,按以下步骤恢复TSM服务器: 安装应用服务器操作系统并配置网络 安装TSM服务器端软件,配置存储设备 从存储设备中取得最新的TSM信息 确认信息为最新版本,批准系统运行 完成事故报告
当整个计算机系统损坏而需要重建业务时。
当硬件设备连接完成后,用异地保存的克隆带按以下步骤恢复系统数据。
将克隆带装入存储设备
按第4种情况恢复TSM服务器系统 按第3种情况恢复各业务系统数据(9)数据恢复策略
在灾难发生后的混乱中,管理员很难做到周全安排、井井有条的恢复系统及数据。因此,他们需要一份无懈可击、条理清晰的恢复指导书,TSM的灾难管理功能(简称DRM)能够指导用户如何操作来迅速恢复企业范围内的各种数据。
自动、准确的DRM功能帮助用户保护宝贵数据的安全性。在TSM管辖内的数据,都能通过DRM自动策划、准备及制作备份恢复计划,一旦DRM生成了计划文件,所有服务器上最新的相关信息都被收集起来,以备恢复。
如果灾难发生,DRM提供恢复步骤的详细文档,可执行的描述文件自动恢复数据、重建环境。DRM使得企业可以很快回复正常运转。
DRM智能化管理和跟踪备份介质的转移。帮助管理员决定哪些介质本地保存,哪些介质需要异地保存。当恢复灾难时,DRM帮助用户迅速找到所有需要的介质,无论这些介质是在本地或运输途中或在异地的保险柜里。
TSM客户端追踪管理功能帮助系统管理员了解哪些系统被灾害摧毁,以及这些机器所需要的软硬件,以便用户决定需要重新定购哪些设备来替换损坏的设备。
其他DRM记录的重要信息包括:需要恢复的各台机器的优先级;相关人员的连续方式等。
(10)数据异地恢复
在客户的数据备份方案中,网络是实现其备份动作的基础,但对于一个完整的解决方案而言,网络就可能是一个瓶颈。如果当网络出现较大的故障时而远程节点正好需要数据恢复时,整个恢复过程就可能成为一个问题,因为TSM的磁带只有TSM Server才能读出,此时就可能需要在恢复的节点安装TSM Server和磁带库来实现数据恢复。
TSM 3.7提供了一个独特功能帮助解决了这个问题:Instant Archive and Intelligent Retrieve。
这个功能是在TSM server上将所需要恢复的数据影像到其它的可移动存储介质中,如普通8mm tape、可写CD等。管理人员再讲这些存储介质拿到需要恢复的设备上,利用操作系统的功能将这些数据
恢复到系统中即可。
这个功能即可以帮助客户将最为重要的数据复制到CD中永久保存;又可以在网络出现故障时,解决远程恢复问题。
(11)远程数据备份
TSM的Server to Server Communication还可以实现对等备份,把数据迁移到另一台TSM服务器中。这两台服务器可以是不同的平台,从而保持整个系统的可靠性。
(12)备份系统管理
TSM作为一个独立运作的备份系统,可以做到无人职守的备份运作。Tivoli提供多种管理手段来对TSM的运作进行有效管理:
TSM Admin界面:TSM提供图形化的管理界面市的管理人员可以方便地管理到整个TSM系统的设置、运行以及性能优化等。
TSM Web界面:TSM提供对Web浏览器的支持,管理人员可以通过TSM内置的管理能力实现对TSM管理功能的全面支持。
TSM Command Line:可以利用命令行来完成对TSM Server进行的所有的管理功能。
TSM的Enterprise Management:TSM的企业级管理功能(Enterprise Management)使管理员能够摆脱地理限制,一个人就可管理企业中所有的TSM服务器。
Tivoli Module for TSM:充分利用TSM和Tivoli Enterprise的集成完成对TSM Server的实时监控和远程操作。Tivoli Module for TSM内置的Monitor可以非常容易地监控TSM的各个重要部件,发现
备份过程的异常。
TSM内置的数据存储系统基于SQL,管理人员可以简单地通过ODBC连接,采用SQL查询语句获得统计和明细资料。4.2.2.5.8 数据应用监控
存储备份 篇3
关键词:数据备份灾难恢复
0引言
一位银行工作人员说,如果银行出现火灾,大家都不会去抱钱柜,而是抱着硬盘往外跑。因为几千万元的人民币烧了,可以重新印。但数据一旦丢失后果非常严重。此话并非调侃,没有人怀疑数据的价值,数据安全的重要性也就顺理成章了。
网络环境下的数据安全有两层意思,一个是逻辑上的安全,比如在数据传输交易过程中,防止被截获或篡改、防止病毒的破坏、防止黑客入侵等等,另一个就是物理上的安全,比如防止人为的修改、删除、破坏或不可抗拒的自然灾难。前者需要系统的安全防护,重点在于“防”,后者需要数据备份、快速恢复、异地存放、远程控制、灾难恢复等系统保护,重点在于“保”。
1什么是数据备份
数据备份是指为了防止系统出现误操作或故障导致数据丢失,而将整个系统数据或部分重要数据集合打包,从应用主机的硬盘或阵列中复制到其他的存储介质的过程。在原始数据丢失或遭到破坏的情况下,利用备份数据把原始数据恢复出来,使系统能够继续正常工作。
2数据备份有哪些存储方式
2.1磁带存储目前使用磁带存储设备解决企业数据备份保存问题依然是行之有效的方法。磁带设备既是存储备份设备的元老。又是存储备份设备最有生气的主力军,磁带这种最基本的存储单元,依然会在存储技术突飞猛进的今天,发挥着它巨大的作用。
通常在下列情况中,可以考虑采用磁带介质:
2.1.1有充足的备份时间磁带的一大缺点就是速度慢。如果你对备份时间不敏感,那就无所谓了。通过磁盘到磁带的备份方式十分稳定,充分发挥了磁带的优势。
2.1.2不需要进行快速的文件,目录恢复工作,或者可以通过别的手段来实现这一目标。任何基于块存储的系统(通常磁带都采用这种存储方式)都不适合进行快速文件恢复。在有些情况下,的确不需要进行快速恢复。在其他情况下,可以采用实时快照或者镜像备份方式来实现快速恢复的目的。
2.1.3需要进行离线的大块数据恢复工作新一代的SDLT(超级线性数据磁带)可以在单个磁带上存储600G的压缩数据。同时,昆腾公司声称,他们研发的可以实现1.6TB存储容量的DLT-S4标准磁带马上就可以面向市场发布。这些因素都使得磁带的容量远远领先于其余的移动存储介质。
2.1.4需要长时期、高质量的文档存储越来越多的企业已经意识到,文档存储和备份存储是不一样的。尽管在备份存储领域。磁带的地位已经受到了强有力的挑战,但是,磁带存储仍然是最好的文档存储方案之一。通过正确的存储方式,磁带存储的文档至少可以保留20年。
2.1.5需要进行高质量、可移动的文档存储磁带具有高容量。易移动的特点。如果你打算采用可移动的数据存储进行灾难性数据恢复,那么自然要首选磁带介质。
2.1.6需要低成本的解决方案磁带是目前能够解决备份与灾难性数据恢复的最经济的解决方案之一。
目前磁带存储主要应用的技术有三种:LTO(Linear Tape-Open,开放线性磁带)、DLT(Digital Linear Tape,数码线性磁带)和AIT(Advanced Intelligent Tape,先进智能磁带)。
2.2网络存储网络存储技术是基于数据存储的一种通用网络术语。网络存储结构大致分为三种:直连式存储(DAS:Direct At-tached storage)、网络存储设备(NAS:Network Attached Stor-age)和存储网络(SAN:Storage Area Network)。
直连式存储(DAS):这是一种直接与主机系统相连接的存储设备,如作为服务器的计算机内部硬件驱动。到目前为止,DAS仍是计算机系统中最常用的数据存储方法。DAS已经有近四十年的使用历史,随着用户数据的不断增长,尤其是数百GB以上时,其在备份、恢复、扩展、灾备等方面的问题变得日益困扰系统管理员。
网络存储设备(NAS):NAS是一种采用直接与网络介质相连的特殊设备实现数据存储的机制。由于这些设备都分配有IP地址,所以客户机通过充当数据网关的服务器可以对其进行存取访问,甚至在某些情况下,不需要任何中间介质客户机也可以直接访问这些设备。
存储网络(SAN):SAN是指存储设备相互连接且与一台服务器或一个服务器群相连的网络。其中的服务器用作SAN的接八点。在有些配置中,SAN也与网络相连。SAN中将特殊交换机当作连接设备。它们看起来很像常规的以太网络交换机,是SAN中的连通点。SAN使得在各自网络上实现相互通信成为可能,同时并带来了很多有利条件。
3灾难鲁份与恢复
3.1什么是灾难备份通过第三方的服务来完成数据灾备工作。作为备份中心(备份地点),一方面要具有系统环境,即有一个计算机配置,购置相应的计算机设备并安装相应的软件;另一方面还就具备网络环境,即确保客户端能够顺地访问备份中心。与此同时,灾备中心要将数据和应用准备就绪,时刻处于待命状态。
一旦遭遇灾难事故,数据和应用可以在远程备份地点尽快得到恢复。要达到这个目标,一定要考虑三个要素:①备份地点准备就绪;⑦数据在备份地点准备就绪;③两个不同地点(slte)之间的数据如何传递。
3.2数据的灾难恢复数据备份的最终目的就是灾难恢复,灾难恢复技术也称业务连续性技术,是目前在发达国家十分流行的IT技术。它为重要的计算机系统提供在断电、火灾等各种意外事故发生,甚至在如洪水、地震等严重自然灾害发生时,保持持续运行的能力。
灾难恢复措施在整个数据备份策略中占有相当重要的地位,因为它关系到系统在经历灾难后能否迅速恢复。灾难恢复措施包括:
3.2.1灾难预防制度:为了预防灾难的发生。需要做灾难恢复备份。企业信息系统在数据实现大集中的节点上,应采用网络连接存储或存储区域网络备份技术进行灾难恢复备份系统建设,在紧急情况下,它会自动恢复系统的重要信息。
3.2.2灾难演练制度:要保证灾难恢复的可靠性,只进行备份系统的建设是不够的。还要进行灾难恢复演练。各企业可以利用淘汰的计算机或多余的存储介质进行灾难模拟,以熟练灾难恢复的操作过程,检验在用的存储备份系统运行是否正常和备份的数据是否可靠。
灾难恢复拥有完整的备份方案,并严格执行制定的备份策略,当企业信息系统遭遇突如其来的灾难时,它可以应付自如。
4结束语
电子档案安全存储及备份问题探析 篇4
一、电子档案安全存储及备份工作的必要性
电子档案和传统纸质档案相比有许多不同之处。电子档案需要特定的载体来存储, 而且信息和载体可以分离, 这种存储形式使得电子档案具有易修改、复制和删除且不留痕迹、难于发现等特点。计算机硬件可能因各种原因发生故障, 导致存储在上面的电子档案信息丢失, 造成难以挽回的损失。应用程序和系统程序在编程过程中存在未发现的错误和缺陷, 也会使计算机在运行过程中出现意外, 造成电子档案被修改和泄露。某些程序开发者故意留下漏洞和陷阱, 用以获得系统文件的非法访问权。计算机病毒利用软件中的缺陷, 在系统程序或应用程序中植入病毒程序代码, 在程序的运行过程中进行传染, 损害系统, 导致系统瘫痪、数据丢失, 其中的电子档案信息也可能会丢失。黑客也会随时威胁电子档案的安全。计算机技术的高速发展, 使得计算机软硬件升级换代频繁, 为了保证新旧软硬件具有兼容性, 电子档案能继续使用, 就必须将电子档案转换成新的版式, 转换过程中也可能造成电子档案信息的丢失、失真。因此, 相对于传统的纸质档案的保存来说, 电子档案在保证其原始性、完整性、真实性方面有相当大的困难。对电子档案进行安全存储和备份, 保证电子档案真实、完整、安全是极其重要的。
二、做好电子档案安全存储和备份的主要措施
1. 安全存储。
(1) 用户权限设置。一是入网访问权限控制。入网访问权限控制能够有效防止来自互联网的威胁。它能控制用户登录到服务器并获取网络资源, 控制用户的访问时间和准入网站。二是使用权限控制。对电子档案设置使用权限, 能防止非工作人员对电子档案进行非法操作。控制用户访问目录、文件和资料, 指定用户对文件、目录和设备能够执行哪些操作。三是防火墙控制。防火墙主要是用来阻止黑客访问本网络的屏障, 主要有包过滤、代理、双穴主机三种类型, 用在不同的网络层实现安全控制功能。 (2) 访问控制。一般分为自主访问控制、强制访问控制和基于角色的访问控制, 三种访问控制各有不同的功能。自主访问控制执行系统实体身份到系统资源的接入授权。利用自主访问控制在文件和共享资源中设置许可, 防止非法访问。在电子档案的存储过程中, 利用强制访问控制对主体和客体设置敏感标记。当某一主体需要访问电子档案时, 通过比较主体和客体的敏感标记决定该主体是否具有对电子档案的访问权。用户不能改变自己及其他客体的敏感标记, 因此, 可使电子档案免受木马和病毒等的攻击。对电子档案设置基于角色的访问控制后, 建立一个角色集合, 每一种角色对应一组相应的权限。因此, 在创建用户时不必进行权限分配, 只需分配给用户相应的角色, 由于对角色变更权限比对用户变更权限方便, 这样就可以简化权限的管理, 减少系统开销。 (3) 加密存储。现代加密算法的保密性不再依赖于算法本身, 而直接依赖于密钥。对电子档案进行加密后存储, 没有对应的密钥进行解密, 就难以对电子档案进行访问和修改, 从而使得电子档案的真实性、完整性和安全性得到保障。
2. 备份安全。
(1) 常规备份。对电子档案进行常规备份, 将电子档案信息备份成一个备份文件放在安全的存储空间中, 当电子档案被破坏或丢失时可以用备份文件恢复到备份时的状态。因此, 要对电子档案定期进行备份, 保证电子档案信息随时都保持在最新的状态。 (2) 数据备份。为了保证电子档案的安全, 还需进行远程数据备份, 防止电子档案损坏而本机备份的文件丢失或无法使用的情况下, 仍能远程恢复电子档案信息。数据备份必须要考虑到数据恢复的问题, 常用的方法包括双机热备、磁盘镜像或容错、备份磁带异地存放等多种防护措施, 以确保系统发生故障后仍能对电子档案信息进行恢复。
3. 容灾备份。
对电子档案进行容灾备份, 就是相隔较远的两地, 建立两套或多套功能电子档案备份文件, 当一地因意外引起电子档案不可使用时, 可以使用另一地的备份文件进行电子档案的恢复。容灾备份可分为数据容灾和应用容灾。数据容灾就是对本地关键应用数据建立一个异地数据系统, 在本地数据出现灾难时, 至少在异地保存可用的关键数据。数据容灾可以是对本地数据的完全实时复制, 也可以比本地数据略微落后, 但必须是可用的, 主要采用数据备份和数据复制两种技术。应用容灾是在数据容灾的基础上, 在异地建立一套完整的与本地生产系统相当的备份应用系统, 主要技术有负载均衡和集群技术等。
三、电子档案安全存储及备份技术的发展方向
在计算机技术和网络技术快速发展的今天, 信息安全备受关注, 信息安全技术更是电子档案安全存储和备份的重要保障。密码学能够为信息安全提供关键理论和技术, 因此, 密码技术对电子档案的安全存储和备份起到巨大的作用。传统的密码学通常采用数学的思想和方法, 加解密算法是公开的, 对信息的保密完全依赖于对密钥的保护。密钥的产生、分配和存储等是密码学需要解决的关键问题。随着信息科学的发展, 量子信息逐渐引起人们的关注。量子信息是基于量子的各种特性进行编码和信息传输的, 它是基于物理特性工作的, 相对于传统的电子信息有很大优势。近年来, 量子信息学在理论和实践上都取得了重大突破。因此, 利用量子信息研究电子档案安全存储和备份技术也是未来档案学研究的一个新方向。另外, 云计算是目前信息安全研究的一个新技术领域, 其具有超大规模、虚拟化和可靠安全等优势和强大的计算处理能力。云计算的特点是数据存储最可靠、最安全;对设备要求最低;可以实现不同设备间的数据共享
参考文献
[1].肖小宝.电子档案信息的安全储存问题及技术措施[J].电力档案, 2005.4
存储备份 篇5
一,用户概况
河南师范大学是一所建校历史较长的省属重点大学。学校北依巍巍太行,南滨滚滚黄河,位于京广、太荷 铁路交汇处的豫北名城新乡市,坐落在广袤的牧野大地、美丽的卫水之滨。其前身是始建于 1923年的中 州大学和创建于 1951年的平原师范学院。新中国成立后,由于院系调整,学校先后更名为河南师范学院 二院、河南第二师范学院、新乡师范学院。1985年始称河南师范大学。
二,设计要求
河南师范大学现有的应用及大致需求如下: 1.老校区所有应用系统共十几个,将所有的数据集中存储备份在存储数据中心。
2.老校区需要全 SAS 高速存储系统支持。3.老校区所有数据需要在本地做全部同步式备份。4.在另一新校区中建立老校区数据中心的灾难备份中心。
5.据初步统计,众多应用系统中共有 oracle 服务器 x 台, sql 服务器 y 台, linux 服务器 z 台(用户数
据保密。
6.据初步统计, 大约有 m 台重要服务器需要做 P2V 备份方案, 并要求灾难发生时能快速 V2P 恢复(用
户数据保密。
7.老校区本地数据备份到本地另一存储空间, 有部分数据需要实现 CDP 级别备份, 剩下所有实现基
于时间策略的增量备份即可。三,方案描述
本方案设计本着最大化存储利用率、对数据分重要性程度进行设计的原则,对前端各大应用系统服务器及 其数据进行分类,大约 10TB 数据进入上图中 “ 老校区主存储中心 ” ,该存储中心配置考虑: 1.基于数据重要性和数据量考虑,配置基于 SAS 和 SATA 混合的网络存储系统。
2.对重要性高的数据和读写性能要求高的数据存入 SAS 硬盘阵列中, 对于其余数据则存入 SATA 硬 盘阵列中,最大化提升数据中心的性价比。
3.配备两台 12盘位 NAS+IPSAN统一网络存储 ReadyNAS 3200, 每台配置 8块 600GB SAS硬盘。
对大学内视频及其相关应用的数据大约有 50TB 数据量, 则考虑存入 “ 老校区视频及相关应用主存储 ” , 该存 储中心配置考虑: 1.视频及相关应用数据量庞大,安全性要求相对低一些,配置基于纯 SATA 的网络存储系统。
2.目前, NETGEAR 的 ReadyNAS 统一网络存储提供全球领先的全速企业级 2TB SATA配置, 可以 最大程度保证视频及应用数据的大量高速存储。
3.配置两台 12盘位 NAS+IPSAN统一网络存储 ReadyNAS 3200,每台配置 12块 2TB SATAII全 速企业级硬盘。
另外, 考虑到主存储数据的安全性, 需要在本地近线备份所有重要数据, 建议设计 “ 老校区主存储备份中心 ” , 将主存储中心的 10TB 数据近线备份到此,相关考虑如下: 1.基于主存储数据的安全性和增长性考虑,建议在主存储备份中心配置基于 SATA 高性价比网络存 储。
2.考虑到主存储数据近线备份的多副本保存, 建议在主存储备份中心配置两倍于主存储中心的容量。
3.配置两台 12盘位 NAS+IPSAN统一网络存储 ReadyNAS 3200,每台配置 12块 1TB SATAII全 速企业级硬盘。
考虑到老校区重要数据的安全性,除了在本地做近线备份之外,建议在新校区建议远程的灾备中心,以确 保当老校区主存储数据中心发生不可预知的灾难时,可以借
助新校区灾备中心的备份数据及时恢复所有学 校的重要业务及数据,灾备中心建设考虑如下: 1.基于老校区主存储备份数据量的考虑, 建议在新校区建立的灾备中心在两倍容量与原数据量大小。
2.考虑到数据量很大,建议老校区到新校区数据备份线路采用千兆光纤,并结合文件及数据块增量 备份策略一起保证数据灾备的成功率。
3.配置两台 12盘位 NAS+IPSAN统一网络存储 ReadyNAS 3200,每台配置 12块 2TB SATAII全 速企业级硬盘。
在各应用系统服务器数据保护方案建设中, 建议配置与 NETGEAR 有紧密合作的 Symantec 备份恢复解决 方案 Bcakup EXEC, 在该校园数据中心备份方案中, 考虑 oracel 数据库服务器和 sql 数据库服务器及文件 被打开执行备份的成功率,主要配置有如下组件: 1.Windows 系统主备份服务器 2.Oracle 数据库备份 Agent 3.SQL 数据库备份 Agent 4.打开文件备份功能选件
在各项 Symantec BE备份功能与 RALUS for ReadyNAS配合工作下,可以实现下图描述的服务器系统数 据备份流程: 另外,考虑到部分重要服务器在灾难发生时的恢复问题,建议配置 NETGEAR 全球领先的 P2V 及 V2P 备 份恢复解决方案,该方案结合 VMware ESX(i可以对重要服务器实现以下全球领先的方案: 裸机恢复解决方案
传统的备份机制大都是以数据保护为核心,而忽略了系统及生产服务的保护,当系统发生灾难时,您必须 准备好所有的系统设置信息,并且耗费时间重新安装及设定系统,然后才能进行数据的恢复,最后生产才 有可能正常运行。
实际上我们需要保护的数据有下图所示的各种类型 : 我们创新的裸机恢复解决方案以快速恢复业务生产为前提, 完整保护系统及业务数据, 在系统发生灾难时, 依据独创的 iSCSI 远程启动技术,可以将系统及业务直接在 ReadyAS 存储设备上运行,然后可以在业务 运行的情况下将 ReadyNAS 设备备份的系统及业务数据恢复到原业务主机上。
另外,如果原生产主机设备根本就无法开机了,仍然可以采用最新的 P2V(物理机到虚拟机转换将备份 在 ReadyNAS 存储设备的系统及业务数据直接转换为虚拟机平台可以启动的整体数据, 保证系统在虚拟机 上启动系统并运行业务,如下图所示三种情况下,系统及业务的快速恢复方案。
NETGEAR 裸机恢复解决方案优势: 1.提供系统、应用及数据保护于一体 2.提供一个基于主机的数据复制方案 3.采用文件数据的完整性和一致性传输的方式 4.针对卷进行复制备份
5.基于 SAN 架构,提供 LAN-free 备份模式
6.充分结合 Microsoft VSS和专业数据库代理,保证文件系统和数据库安全备份 7.创新的基于 P2V 虚拟机启动和 iSCSI 远程启动方案
8.ReadyNAS 存储完美支持 VMWARE 虚拟化认证 N+1容灾备份解决方案
在如今的网络环境中,大都会有多种类型的服务器存在,提供不同类型的服务,这些服务器的业务都需要 实施数据保护措施,而意外的情况永远都无法预料,有可能是硬盘损坏,也可能是硬件主板损坏、也可能 是人为操作失误或病毒破坏等、也可能一台服务器出故障、也可能是多台服务器同时出故障。针对这些难 以预料的意外情况,是否有最为简单的容灾方案呢? NETGEAR 推出最新的 N+1容灾备份解决方案, 不论出现上述哪种意外情况, 也不论有几台设备同时出现 故障, 都可以通过事先部署的一台容灾服务器从 ReadyNAS 存储设备上将备份的数据启动起来, 以最短的 时间保证业务正常运行。
NETGEAR N+1容灾备份解决方案优势: 1.服务器主机系统及业务数据整机 CDP 备份到 ReadyNAS 存储设备 2.基于数据块的差异备份,确保快速保证数据变化的一致性 3.容灾服务器上部署 VMWARE ESX(I平台
4.发生灾难时,快速将备份在 ReadyNAS 上的数据通过 P2V 转换为容灾服务器可用数据系统及业 务数据的恢复可通过 V2P 在线实现
虚拟化远程容灾解决方案
对于校园数据网络的业务系统容灾光有本地的 N+1有时还不够安全, 有一些由不可抗力因素造成的业务系 统瘫痪可能会导致本地整个机房都无法运行,势必需要在远程异地构建一个容灾中心,在关键时候将关键 业务数据及系统进行接管。通常该需求会受到两个方面的限制:数据量大和网络带宽窄。
NETGEAR 远程容灾解决方案采用创新的 CDP、P2V、块差异备份、数据高压缩及 UDP 优化处理等技术, 保证远程容灾实现的快速安全,并且业务的接管可以通过异地虚拟机来实现。
NETGEAR 虚拟化远程容灾解决方案优势: 1.利用本地 CDP 和在线 P2V(真实机到虚拟机转换技术,虚拟化容灾解决方案把本地服务器的 运行环境(系统、应用、数据和系统配置等复制到容灾中心。
2.基于磁盘块差异备份技术,保证传输的数据量尽可能少 3.远程容灾中心的所有业务接管都是采用虚拟机来实现 4.在 WAN 中传输最高压缩比可达 4:1,并通过 UDP 优化处理 CDP 连续数据保护方案
CDP(Continuous Data Protection即连续数据保护方案,可在数据发生任何变化时将数据有效地保护起 来, CDP 技术将过去只有一次数据镜像、备份或副本的数据保护技术,演进为最新的可以有很多个数据镜 像、备份或副本的数据保护技术。该技术方案可以保护不同历史时间点的数据副本,而且在原始数据损坏 或丢失时,可以在最短时间内进行任意时间点的数据恢复。
NETGEAR CDP连续数据保护方案不仅涵盖了各类灾难保护(包括人为故障、病毒、软件故障、硬件故障 等灾难,而且能够针对不同主机服务器、数据库、存储的环境提供全面的数据保护, CDP 连续数据保护 方案可以将 RPO(恢复点目标和 RTO(恢复时间目标降到最低。
NETGEAR CDP连续数据保护方案优势: 1.基于 SAN 网络的文件级别的备份
2.基于数据块的差异备份,确保快速保证数据变化的一致性 3.配合数据库代理,确保数据库数据实时备份
4.通过网络中 CDP 管理服务器管理不同时间点的副本
综上方案描述,从主存储中心、近线备份、远程灾备、数据库服务器备份以及 P2V 和 V2P 备份恢复方案 的各项建议,为河南师范大学数据中心和灾备中心的建设提供了最为全面的方案建议。
方案优势
NETGEAR 领先的存储品牌 ReadyNAS ,以创新的技术和产品 ReadyNAS 3200交付用户使用,并且配合 一系列增值的解决方案,为用户打造最有竞争力的、具有投资保护价值的整体数据存储和保护的方案。
1.最佳性价比的本地、近线和远程灾备整体解决方案
几种常见网络存储备份方式浅析 篇6
信息是一个企业可持续发展的核心动力之一, 信息的可靠存储是一个企业得以正常运作和发展壮大的根本所在。信息化给人们带来快捷的服务和方便的管理时, 也给人们带来数字信息丢失的风险。数据的丢失会中断企业的正常运行, 同时也会给企业造成巨大的经济损失。因此, 数据的存储、备份成为保证数据安全的重要措施。
存储备份 (也称为数据备份) 是容灾的基础, 一切容灾系统的建立都是以数据备份为基础的。而建立容灾系统的最终目的不是备份, 而是快速恢复数据。存储备份系统一般使用磁带库设备和存储备份软件, 它是整个容灾体系中重要的后备支撑。当数据受到破坏, 存储备份系统的任务就是把由数据丢失而造成的灾难降到最低, 并在最短的时间内将系统中丢失和破坏的数据全部恢复, 使系统能正常运行。
存储备份分为两大类, 一种是离线备份 (Offline) , 如LAN-free、Server-free, 即把存储服务器中的数据备份到磁带库中。采用这种备份方式, 数据恢复的时间要比在线方式长, 但它的投资较小, 只要有存储备份设备和存储备份软件即可;另一种是在线备份 (on-line) , 如数据复制。数据复制实际上就是一种同步的数据备份, 其数据恢复的时间非常短, 短则几秒、几分钟不等。数据复制是一个高级的同步过程, 可使数据全整的保存, 达到一点都不丢失的状态。在现在的大部份用户中, 绝大部份用户使用数据离线备份即可。只有其业务需要连续性的关键业务用户, 才会使用在线备份。本文主要阐述离线备份技术的实施手段和优缺点。
2 存储技术的结构选择
目前, 存储数据的方式常见的有三种:
2.1 DAS
DAS (Direct Attached Storage) 即直接连接存储技术, 是指将存储设备通过SCSI接口或光纤通道直接连接到服务器上的方式。这种连接方式主要应用于单机或两台主机的集群环境中, 现在在各大银行的中心业务系统中常能见到这种方式。
2.2 NAS
NAS (Network Attached Storage) 即网络附加存储方式, 将存储设备通过标准的网络拓扑结构例如 (以太网) , 连接到一群计算机上, 提供数据和文件服务。NAS服务器一般由存储硬件、操作系统以及其上的文件系统等几个部分组成。此为以专业的网络文件存储及文件备份为中心的方式, 是现在以文件存储为主的一种存储方式。
2.3 SAN
SAN (Storage Area Network) 即存储局域网, 是指存储设备相互连接且与一台服务器或一个服务器群相连的网络, 通常有FC-SAN和IP-SAN两种架构。存储区域网络是一种专用的, 集中式管理的并且是具有安全性的信息系统构架, 存储区域网络能够实现服务器和存储设备之间的任意互联。SAN是一个由多厂商存储设备, 存储管理软件, 应用服务器以及网络硬件设备构成的高速的存储网络, 它能够辅助用户更有效地利用其业务信息。
3 备份方式的技术演进
3.1 本机备份
在传统的备份模式下, 每台主机都配备专用的存储磁盘或磁带系统, 主机中的数据必须备份到位于本地的专用磁带设备或盘阵中。这样, 即使一台磁带机 (或磁带库) 处于空闲状态, 另一台主机也不能使用他进行备份工作, 磁带资源利用率较低。另外, 不同的操作系统平台使用的备份恢复程式一般也不相同, 这使得备份工作和对资源的总体管理变得更加复杂。
3.2 网络备份
后来, 产生一种克服专用磁带系统利用率低的改进办法:即磁带资源由一个主备份/恢复服务器控制, 而备份和恢复进程由一些管理软件来控制。主备份服务器接收其他服务器通过局域网或广域网发来的数据, 并将其存入公用磁盘或磁带系统中。
3.3 先进备份方式
随着信息量呈爆炸性增长, 大量的系统数据通过用户网络进行备份, 使网络带宽成为难以逾越的瓶颈。有没有一种更先进的解决方案, 在备份的时候尽可能减小对系统资源的消耗, 同时又确保系统的高可用性和灵活性呢?
3.3.1 LAN-free备份
办法之一是采用LAN-free。所谓LAN-free, 是指数据不经过局域网直接进行备份, 即用户只需将磁带机或磁带库等备份设备连接到SAN中, 各服务器就可把需要备份的数据直接发送到共享的备份设备上, 不必再经过局域网链路。由于服务器到共享存储设备的大量数据传输是通过SAN网络进行的, 局域网只承担各服务器之间的通信 (而不是数据传输) 任务。
3.3.1. 1 LAN-free备份常用实施方式
通常, 用户都需要为每台服务器配备光纤通道适配器, 适配器负责把这些服务器连接到和一台或多台磁带机 (或磁带库) 相连的SAN上。同时, 还需要为服务器配备特定的管理软件, 通过它, 系统能够把块格式的数据从服务器内存、经SAN传输到磁带机或磁带库中。
更有一种常用的LAN-free实施办法, 在这种结构中, 主备份服务器上的管理软件能够启动其他服务器的数据备份操作。块格式的数据从磁盘阵列通过SAN传输到临时存储数据的备份服务器的内存中, 之后再经SAN传输到磁带机或磁带库中。
3.3.1. 2 LAN-free备份不足
LAN-free技术也存在明显不足。首先, 他仍旧让服务器参与了将备份数据从一个存储设备转移到另一个存储设备的过程, 在一定程度上占用了宝贵的CPU处理时间和服务器内存。更有一个问题是, LAN-free技术的恢复能力差强人意, 他很依赖用户的应用。许多产品并不支持文档级或目录级恢复, 映像级恢复就变得较为常见。映像级恢复就是把整个映像从磁带拷回到磁盘上, 假如您需要快速恢复某一个文档, 整个操作将变得很麻烦。此外, 不同厂商实施的LAN-free机制各不相同, 这还会导致备份过程所需的系统之间出现兼容性问题。
3.3.2 Server-Less备份
办法之二就是采用Server-Less。顾名思义Server-Less就是绕过服务器的备份, 具体地说就是在执行备份操作时, 备份数据是直接从磁盘上写入到磁带中, 在整个过程中对LAN网络和应用服务器毫无影响。这使得网络的负载和应用服务器真正从备份中解放出来。这种方案的主要长处之一是无需在服务器中缓存数据, 显著减少对主机CPU的占用, 提高操作系统工作效率, 帮助企业完成更多的工作。
3.3.2. 1 Server-Less备份常用实施方式
通常情况下, 备份数据通过名为数据移动器的设备从磁盘阵列传输到磁带库上。该设备可能是光纤通道交换机、存储路由器、智能磁带或磁盘设备或是服务器。数据移动器执行的命令其实是把数据从一个存储设备传输到另一个设备。实施这个过程的一种方法是借助于SCSI-3的扩展拷贝命令, 他使服务器能够发送命令给存储设备, 指示后者把数据直接传输到另一个设备, 不必通过服务器内存。数据移动器收到扩展拷贝命令后, 执行相应功能。
另一种方法就是利用网络数据管理协议 (NDMP) 。这种协议实际上为服务器、备份和恢复应用及备份设备等部件之间的通信充当一种接口。在实施过程中, NDMP把命令从服务器传输到备份应用中, 而和NDMP兼容的备份软件会开始实际的数据传输工作, 且数据的传输并不通过服务器内存。NDMP的目的在于方便异构环境下的备份和恢复过程, 并增强不同厂商的备份和恢复管理软件连同存储硬件之间的兼容性。
3.3.2. 2 Server-Less备份的优势
由于服务器瓶颈已不存在, 备份将更快。
专用的备份服务器被省略。
兼做备份及文件的服务器能将全部的能力用于业务处理。
由于数据被直接送到磁带设备而不受服务器性能的限制, 磁带机的速度被发挥到最佳。
能在任何时候进行备份并不会对用户网络造成影响, 真正实现7×24小时全天候备份。
无服务器备份的好处在数据恢复时得到体现。由于网络“快照”执行起来更方便, 所以备份磁带能包含最新的数据, 这样恢复得也就更快, 要做的工作也就更少。
3.3.2. 3 Server-Less备份的不足
虽然服务器的负担大为减轻, 但仍需要备份应用软件 (连同其主机服务器) 来控制备份过程。元数据必须记录在备份软件的数据库上, 这仍需要占用CPU资源。和LAN-free相同, 无服务器备份可能会导致同样类型的兼容性问题。而且, 无服务器备份可能难度大、成本高。最后, 假如无服务器备份的应用要更广泛, 恢复功能方面更有待更大改进。
4 结束语
数据的重要性越来越得到人们的广泛认同。未来网络的核心将是数据, 网络化存储正是数据存储的一个发展方向。这里我们简要的介绍了几种当前比较流行的网络存储技术及备份技术, 当前网络存储技术还在不断的快速发展, SAN和NAS的融合、统一虚拟存储技术是未来发展的两个趋势。
摘要:网络数据信息爆炸性的增长, 使网络存储技术变得越来越重要, 已成为Internet及其相关行业进一步发展的关键。本论文主要讲述了常用离线存储备份技术的结构选择、技术演进、常用实施方案及各种方案的优缺点。
关键词:存储备份,NAS存储,SAN存储,LAN-free备份,Server-Less备份
参考文献
[1]江小云.浅谈存储技术的发展历程[J].中国科技信息, 2005, (15) .
[2]周可, 黄永峰, 张江陵.网络存储技术研究[J].电子计算机与外部设备, 2005, 24 (2) .
计算机数据存储备份技术探析 篇7
1 计算机数据存储系统种类
DAS ( 直接依附 ) 、NAS ( 网络依附 存储系统 ) 与SAN(存储区域网络 ) 三者是目前普遍应用的数据存储技术。
DAS技术以服务器为中心, 其存储设备直接与服务器或者客户器后端相连接, 存储备份也依靠服务器与客户机控制完成,其本身只是单纯的存储备份载体, 并未有专门操作系统, 需要服务器或者客户机上由第三方软件进行专门操控, 在服务器提供其他服务或者用户数量增加时, 运行响应速度不可避免会变慢, 因此在随着前兆以太网的普及应用, 其制约发展瓶颈越来越典型, 在应用与推广方面变得困难重重, 应用范围缩小。
NAS技术以网络为中心面向文件提供存储服务 , 其存储设备是单独作为文件服务器与网络相连, 数据的存储应用部分并不在同一服务器, 所以设备数据其实都存储在NAS设备中, 通过网络LAN接口与文件系统服务器相连接, 这种性质决定了NAS的网络独立性, 即使遇到用户数量增加或者运行服务过多等情况也不至于像DAS技术一样导致服务器过载,影响运行响应速度, 所以NAS存储备份模式下网络运行性能还是较为可靠的。
SAN简单来说是依靠光纤通道的高传输速度以及大容量 ,从而将服务器和存储设备有效地连接在一起, 形成网络结构,二者通过高带宽FC交换机连接, 可随时完成工作站在局域网中的访问, 不通过服务器也能够成功实现存储设备存储数据之间的相互交换, 减少了数据交换与传输带来的网络冲突与堵塞, 减少了服务器运行荷载压力, 可显著提升系统整体运行的灵活性与伸缩性, 这也是为何现今SAN技术备受期待的原因所在, 是目前计算机存储备份领域最引人注目的技术之一[1]。SAN技术的优势在于可更加快捷、简便地完成数据资源的存储应用, 还可对这些庞大的数据资源实施集中管理, 直接提升了应用与管理的便利性, 因而具有较好的应用与发展前景。SAN技术以光纤为接口决定了其拥有其他技术不可比拟的高传输速度, 高性能、高扩展性的光纤网络、光纤交换机与存储阵列可提供更大的服务器扩展空间与吞吐量。在存储管理方面, SAN技术直接提供了存储、备份系统与系统相连接的架构, 数据在以太网络上流通直接提升了网络运行性能, 用户可以获得一个与服务器分开的存储管理理念, 文件的存储、备份、恢复与安全管理都将变得更加可 靠与简便 ,依靠网络方式连接的不同存储池在数据交换、共享方面具有更多优势, 用户访问数据的安全性与完全性得到了可靠保障。SAN技术的另一优势在于简易扩容与高效容错性能 , 只需要加入新的SAN设备做简单设置即可实现在线扩容配置, 及时存储设备有损坏丢失情况也不会影响整体数据的完整性与安全性, 通过更换损坏硬盘即可做数据容灾与备份, 而无需重启磁盘阵列那么麻烦, 数据灾备方面具有天然优势。
2 计算机数据备份系统种类
2.1 冷备份
冷备份是一种技术结构简单、成本较低的备份方式, 主要以打孔器、磁带机等进行定期存数备份, 处理后的数据被分别备份以实现灾备。从这种描述就可看出冷备份技术含量低、易于实现且应用成本低, 但是其也存在着巨大的 不足 ,一是备份数据转移较为麻烦, 且一旦被破坏, 恢复时间 慢 ,一旦备份介质出现问题很有可能永远无法恢复, 因此多数适用于经费或者周期紧张时段的数据备份, 多数也只适合一些中小企业和个人系统应用。
2.2 热备份
热备份是目前所有备份技术中效果最好、恢复最快的一种备份方式, 这种备份技术需要设置专门的灾备设备与技术中心, 通过光纤通道与需备份服务器之间实现连接, 在专门软件辅助下实时对备份服务器进行监控与自动探测, 在灾备系统安装完成后不需要人工操作即可完成灾备工作, 在监控服务器出现故障与问题时自动进行备份, 完成数据转移操作,祈祷防患于未然的作用。但是暖备份这种技术目前还有较多不足, 比如专用灾备设备价格昂贵、安装复杂, 需要配备专门的管理设备与软件, 且只能实现点对点传输, 扩容性、容错性与扩展性较差, 初期安装技术难度和施工难度较高, 且对设备厂商依赖程度较高, 因此适用范围较窄。目前热备份技术主要针对一些对数据存储高安全性、高可靠性、实时性要求较多的时候才予以使用, 或者超大规模的应用系统与企业计算机数据服务中心才予以采用。
2.3 暖备份
对于暖备份来讲, 不管是成本还是技术难度, 两者均处于冷备份和热备份之间, 属于这两者之间的一个折中。但是目前在实际应用中, 这一方案则是应用最为广泛的, 主要用途为数据库复制、硬盘远程影像设置以及灾备中心等等, 可以对存储数据的完全备份有效实现[2]。
硬盘远程镜像与主服务器相比, 设置出一个与之相比较差的另外一个服务器, 将其与众多磁盘阵列硬盘结 合应用 ,从而将数据存储工作有效实现, 关于数据的传输和备份则可以通过光纤通道及RAID技术完成, 相对来讲不管是成本还是技术难度均比较低。这一技术虽然技术难度并不高, 然而依旧需要花费大量费用在光纤铺设上, 还要受到距离 的影响 ,重点是这一技术并没有应用同步复制技术, 因此很难实现数据的同步存储, 但是并不会对正常使用产生较大影响[3]。和硬盘镜像技术相比, 数据库复制技术与之有一定相似, 但是在存储方式上具有一定差异, 但是数据库复制技术能够对存储不同步问题有效处理, 并且在对数据库软件强大功能的应用之下, 还能够有效地实现邮寄备份, 和RAID技术相比具有更高科学性和可靠性。因此在优缺点对比上, 两项技术并没有太大差异, 应用优势主要也就集中在数据同步存储上, 但是同时也因为数据库存在的差异, 目前也就只能单纯地实现同厂商之间的数据传输, 无法实现跨库操作, 并且在应用中兼容性比较差, 依旧可以将其认为是一种解决灾备问题的有效方式之一。设置灾备中心这里的概念与热备份中所提到的灾备中心有一定差别, 暖备份的灾备中心主要实在企业公司或者机关所在地构建较大数据备份中心, 基于这一中心将整体结构内全部数据存储及灾备管理工作全部完成。
3 结语
数据安全与数据备份存储技术分析 篇8
关键词:数据安全,数据备份,存储技术
一、数据安全
1.1逻辑上的安全。数据的不安全性主要原因包括病毒入侵, 黑客攻击, 人为篡改等等, 其中硬件和软件的故障是造成数据不安全性的主要原因。逻辑上的安全, 一般是指防止不法分子入侵或病毒破坏的措施。就比如说, 现在很多企业都是通过互联网来进行业务往来或通过互联网与其分支机构进行联系与管理, 一旦数据丢失, 造成的损失是巨大的。所以这些企业都很重视存储在服务器里的数据, 比如说, 公司内部文件, 公司账户, 或客户资料。而硬盘在数据存储中发挥着重大的作用, 正因为如此才成为黑客攻击的对象, 硬盘的价值是有价的, 但是存储在硬盘内的数据是无价的。
1.2物理上的安全。这就是对于电脑本身而言, 电脑受到人为因素的破坏或者不可抗力的灾害时, 若之前没有对电脑内部存储的数据进行数据备份, 那这些数据也会随着电脑的损坏而消失。
其实不管是逻辑上的安全还是物理上的安全受到威胁, 数据备份都是一个直接有效的措施, 这也就是俗话说的有备无患。
二、数据备份
数据备份是防止数据安全性受到挑战的有效措施, 一旦原有数据受到侵犯, 在对不法分子进行法律追踪的同时, 也能启动备用数据, 使服务器快速再次投入使用, 将受到的损害减少到最小的限度, 减少损失。
三、数据备份技术分类
数据备份从不同的角度可以分为不同的类型, 以备份模式的角度来看, 可以分为逻辑备份和物理备份。
3.1逻辑备份。逻辑备份也可以称为基于数据的备份, 前面我们提到过, 硬盘是有价的, 而硬盘内的数据是无价的, 逻辑备份就是针对数据进行备份。
每一个文件都是由不同的数据组成的额逻辑块组成的, 而每一个逻辑块都存储在有顺序的物理磁盘块上。备份软件不仅可以对磁盘块进行操作, 也可以对文件进行操作, 智能识别文件结构, 将所有的文件和数据拷贝到备份资源系统中去, 这样就可以按照文件的排列顺序读取文件, 并且录入备份媒介上, 这样极大地促使了单独文件的恢复速度。但是, 长期连续存储数据, 会让备份文件的速度减慢, 因此在进行无顺序文件的查找时需要消耗更多的时间。逻辑备份的缺点就在于, 因为其备份的原则是按照顺序连续备份, 如果只是其中一小部分的文件出现问题, 也要对整个文件进行备份。
3.2物理备份。物理备份也被称为“基于设备的备份”, 故名思义就是在电脑操作方面对文件进行备份。电脑系统在将数据拷贝到备份媒介上时, 会自动忽略文件的结构, 因为备份文件要求在实施过程中花费较少的时间和开销, 因此就需要以这种方式提高文件的性能。不过, 这种方法也有它的缺点, 因为物理备份与逻辑备份不同, 它并不是将文件连续的存储在备份媒介上, 这样的话文件恢复起来就会比较缓慢。在这种情况下, 要对数据进行备份的话, 就需要了解文件在磁块上的组织信息。物理备份的另外一个缺点就是可能会导致数据引入的不一致, 一般电脑在进行数据备份时, 会对要备份录入磁盘块的数据进行缓存, 而物理备份跨越磁盘块的特点会忽略缓存文件的数据, 造成数据的丢失。
即使两种备份方法或多或少地存在一些缺点, 但也不能否认其在数据备份中的重要性以及实用性, 对数据安全的保护作用。
四、结束语
数据备份的技术多种多样, 以上着重讨论了逻辑备份和物理备份技术, 人们在进行数据备份时, 也可以根据需要备份数据的不同, 选择合适的备份方式。但是, 不管如何, 数据安全与数据备份的目的都是为了保护重要信息不泄露, 保证数据的完整以及防止数据丢失。
参考文献
[1]章壮洪, 刘谦.组织的数据安全与容灾备份[J].会计之友 (中旬刊) , 2009 (02) .
存储备份 篇9
一、电子文件检查归档移交备份存储机简介
电子文件检查归档移交备份存储机作为档案管理中的一种普及型的专用设备, 对于电子文件的规范管理具有重要的意义, 已经有很长的研究历史, 经过国内外长期的发展研究开始进行实践应用。通过电子文件检查归档移交备份存储机可以很好地实现对电子文件以及电子档案的管理, 在准确性、安全性以及可用性, 甚至是安全性方面都具有重大意义。
电子文件检查归档移交备份存储机主要是通过黑箱的设计方法实现的, 利用专门的软件以及硬件结合来完善电子文件的管理系统, 在硬件的支持下, 可以利用软件很好地实现电子文件的管理, 包括文件检查、归档、以及备份存储等相关的操作。在电子文件检查归档移交备份存储机的使用过程中, 操作人员不需要了解机器的运行原理以及内部构造, 可以直接进行使用, 相比较而言, 简单易行, 也大大提高了电子文件管理的效率。
二、文件检查归档移交备份存储机研究背景及意义
(一) 电子文件检查归档移交备份存储机研究背景。
当今时代已经完全进入信息技术的时代, 当前面临大数据的发展趋势, 信息技术以及大数据已经被应用到各大领域。其中具有代表性的就是电子文件, 在企业的生产活动与社会活动中, 均能够起到很好的记录作用, 并且应用范围与领域也在逐年地扩张。为进一步加快其利用, 当今人们更加注重电子文件的检查、归档、移交以及备份存储等。为了实现并加快这一建设, 以国家档案局与省级档案行政管理部门为代表的相关部门开始加强该方面的研究, 对电子文件的归档等进行了规范, 并且开发研究相关设备与技术支持。
(二) 电子文件检查归档移交备份存储机研究意义。
电子文件检查归档移交备份存储机的产生主要就是为了解决电子文件规范而产生的, 对于电子文件的发展具有重要的意义。1.实现了电子文件的规范性管理, 通过设备管理实现了电子档案的准确性与完整性, 另外设备具有良好的特性, 可以保证电子文件的应用以及安全。2.电子文件检查归档移交备份存储机对于操作人员的技术要求较低, 只需要掌握简单的操作要领, 就可以进行使用, 完成相关的电子文件的处理工作, 这样就大大提高了档案管理人员的效率, 并且提高了企业的经济效益与竞争力。
三、电子文件检查归档移交备份存储机研究思想
(一) 建立实体证件的管理记录关系链思路。
建立实体证件的管理记录关系链思路主要是针对档案管理与文件管理的整体过程。在管理过程中, 需要了解并明确文件生成、管理等整个环节, 并且能够实现各个环节关系的固化。在实际档案管理工作中, 主要是通过实体文件来实现的, 效果良好, 于是在电子档案中也应该进行借鉴, 通过现有的技术实现对客户以及单位等信息的统计确认。就我国目前的发展可以看出, 相关的实体证书已经得到了人们的认可, 因此在新形势下这一思路建设应该进一步加强, 可以有效提高档案管理水平, 也能够减少企业资金支出。
(二) 组织结构代码证的应用。
组织机构码的出现已经有较长的历史, 并且技术已经逐渐成熟, 是一种具有法律地位的文书凭证。因为不同的组织机构代码证是完全不同的, 所以这样就保障了组织机构代码证的唯一性和权威性。在电子档案与电子文件的管理中, 若采用组织结构代码证, 可以有效地固化工作关系, 并且保证电子文件的准确性以及安全性, 就目前的发展现状可以发现, 该技术已经在电子文件管理中得到了广泛的应用。
(三) 卫星定位。
通过目前的卫星定位技术可以实现定位、导航灯相关操作。而在电子文件以及电子档案的规范管理中, 可以使用卫星定位来进行相关操作, 进行电子档案的移交以及接收定位与实时观测等操作, 这样就能够及时地掌握相关电子文件的信息, 包括地理位置以及时间等因素, 通过该思想的应用可以进一步提供关系链固化的可靠性, 进一步提高可信度。
四、电子文件检查归档移交备份存储机研究目标
(一) 电子文件检查归档移交备份存储机工作流程简介。
在电子文件检查归档移交备份存储机工作流程中, 实现了输入、显示、操作 (检查、归档、移交、备份、存储) 一体化。并且该设备的工作流程图中可以发现其原理简单, 相关的操作也相对容易, 能够很好地实现其功能。
(二) 电子文件检查归档移交备份存储机要求。
1.具有必要的人机交互设备, 能够用于人机交互, 从而实现电子文件的处理。2.具有必要的内存容量, 并且处理器必须合适选择, 能够适应电子文件的存储与处理。3.能够完成电子文件相关信息的记录与跟踪。4.能够完成对音乐类、文字类、图像类等各类电子文件的处理, 提高其应用范围。5.具有相应的抗破坏能力, 主要体现在抗击磁盘机械性损坏灾难的磁盘阵列功能方面。
(三) 电子文件检查归档移交备份存储机技术创新。
1.注重电子文件处理的四性。在电子文件以及电子档案的处理以及相关操作中, 最注重的主要体现在四个方面, 准确性、安全性、完整性与可用性, 显然在技术创新方面应该注重这一点。首先应该注重软硬件的结合使用, 在电子文件检查归档移交备份存储机中采用了42项技术进行相应的检测操作, 能够很好地满足电子文件的四性问题。通过自动检测, 包括电子文件容量、安全在内的各项内容进行检测与记录, 并反馈给操作者检测信息, 以便及时处理。2.提高各类文件的兼容性。由于当前需要电子文件的类型多样化, 因此电子文件检查归档移交备份存储机更加注重提高设备对各类文件的兼容性。主要体现在三个方面, 一是集成了主流计算机的外围设备接口;二是集成了主流计算机的网络通信协议;最后一点是通过软件技术来实现对各类文件的处理。3.海量智能存储技术。由于文件信息量越来越大, 对于设备存储提出了更高的要求, 需要进一步提高设备的存储量。就目前的技术来看, 可以利用磁盘阵列技术很好地实现海量存储。
五、结语
电子文件检查归档移交备份存储机已经取得了极大的发展, 并在实际的电子文件与电子档案的管理中得到了极大的应用。能够很好地实现电子文件的检查归档移交备份, 并且可以保证电子文件的准确性、安全性、完整性与可用性, 具有重要的意义。未来电子文件检查归档移交备份存储机的要求将进一步提高, 技术也将进一步创新, 需要相关工作者的不断努力, 共同促进其发展, 促进电子文件以及电子档案管理的发展。
参考文献
[1]田雷.《北京市电子文件归档与电子档案管理办法》解读[J].北京档案, 2014 (12) :10-13.
[2]孙洪鲁, 张瑾.电子文件检查归档移交备份存储机研制[J].中国档案, 2015 (05) :58-60.
[3]孙洪鲁, 张瑾.电子文件检查归档移交备份存储机[J].黑龙江档案, 2015 (04) :27.
[4]周洁.电子文件归档问题研究[D].苏州大学, 2013.
存储备份 篇10
关键词:网络备份,备份策略,备份模型,三方架构
0 引言
网络的高速发展不仅加速了数据的流动性,也加速了数据的衍生,企业计算机网络系统中保存的关键数据的量愈来愈大。数据是宝贵的资源,是企业赖以生存的命脉,其价值远远大于设备的价值。然而,病毒木马、软件故障、及人为误操作等不确定因素时刻威胁着数据的安全,数据安全性问题愈来愈突出。数据备份是一种数据安全策略,是保护数据安全的有力措施,已成为信息安全领域一个备受瞩目的研究方向。目前,企业数据系统的安全体系主要包括数据备份系统和高可用系统。数据备份系统提供应用系统的数据后援,确保在任何情况下数据具有完整的恢复能力;高可用系统主要是通过网络、服务器、存储子系统等的冗余,确保系统在发生局部意外的情况下(网络、电源、存储子系统等故障),以最短的时间恢复系统。备份技术用来保证数据对于灾难性事件的抵御能力。
1 数据备份的基本概念
数据备份是指为了防止由于操作失误、系统故障等意外原因而导致的数据丢失,而将整个系统的数据或者一部分关键数据从主机系统的存储设备中复制到其他存储介质的过程。这是为了保证当主计算机系统的数据不可用时,可以利用复制的数据进行恢复,避免数据的丢失。数据备份就是要解决数据的高可用性问题。
1.1 备份策略
数据一般都存在一个2/8规律,即80%的数据更新发生在20%的数据上。故备份工作并不一定需要把所有的数据进行备份。真实环境中的备份工作往往是基于一次完整数据复制之后的若干次增量或差量数据复制。所谓备份策略,就是描述进行备份工作时所采取的不同数据复制方式的组合。不同的数据复制方式组合形成了不同的备份策略,在保证能完整备份数据的前提下,也起到了不同的备份效果。在实际使用中,主要有如下3种备份策略:
(1)全量备份(Full Backup)。所谓全量备份,就是对整个服务器系统进行备份,包括服务器操作系统和应用程序生成的数据。
(2)增量备份(Incremental Backup)。增量备份指每次备份的数据只是相当于上一次备份后增加的和修改过的数据,注意是相对上一次备份而增加或修改过的数据。这种备份的优点很明显:没有重复的备份数据,节省磁带空间,又缩短了备份时间。
(3)差量备份(Differential Backup)。差量备份就是每次备份的数据是相对于上一次全备份之后新增加的和修改过的数据,注意这是相对上一次全备份之后新增加或修改过的数据,而并不一定是相对上一次备份。
1.2 备份数据的恢复
数据恢复在整个备份制度中占据相当重要的地位,关系到系统在经历灾难后能否迅速恢复。恢复不仅仅是备份的简单逆过程,而是比备份更为复杂。数据备份的目的是为了恢复,所以这部分功能自然也是备份软件的重要部分。很多备份软件对数据恢复过程都给出了相当强大的技术支持和保证。一些中低端备份软件支持智能灾难恢复技术,即用户几乎无需干预数据恢复过程,只要利用备份数据介质,就可以迅速自动地恢复数据。而一些高端的备份软件在恢复时,支持多种恢复机制,用户可以灵活地选择恢复程度和恢复方式,极大地方便了用户。
1.3 备份的几种模型
(1)LAN-Based备份,在该系统中数据的传输是以网络为基础的。其中配置一台服务器作为备份服务器,由它负责整个系统的备份操作。磁带库则接在某台服务器上,在数据备份时备份对象把数据通过网络传输到磁带库中实现备份。LAN-Based备份结构的优点是节省投资、磁带库共享、集中备份管理;它的缺点是对网络传输压力大。由于数据通过LAN传播,当需要备份的数据量较大,备份时间窗口紧张时,网络容易发生堵塞。
(2)LAN-free备份是将备份数据流从LAN转移到一个专用的存储网络中。它的思想和专用备份网络相同,不同的是它使用的是存储网络而不是LAN。把LAN排除在备份和恢复进程之外的这种解决方案具有很多优势。首先,用户只需将磁带驱动器和资源库连接到存储网络中,各服务器就可把需要备份的数据直接发送到共享的磁带上,不必再经过LAN链路。先进的备份和恢复程序仍然被用来完成进程控制和数据跟踪的工作。服务器到共享存储设备的大量数据传输是通过存储网络进行的,LAN只承担各服务器之间的通信(而不是数据传输)任务。这种分工使得存储设备、服务器和数据网资源得到更有效的利用,从而使存储网络成为速度更快,扩展性和可靠性更好的备份和恢复解决方案。其次,与传统的、备份相比,LAN-free备份具有跨平台的优点。
(3)Server-free备份称为无服务器备份或第三方拷贝。在以上备份过程中,数据的传送需要通过服务器的管理,实现数据在存储设备间的迁移。在SAN的备份领域发展中,出现了一种存储网络上的独立单位代表服务器和数据管理应用提供设备到设备的操作。这被称为无服务器备份。SAN备份应用可以向服务器请求文件组织层信息。知道单独文件和数据库表的准确逻辑块地址信息,就可以使得数据移动者在网络中作为发起者将数据从其存储位置移动到其备份设备,这就是第三方拷贝原理,在这种方式中,独立的设备和应用是无服务器备份的动力。无服务器备份方案可显著减少服务器的CPU占用时间,被释放的CPU资源可以用于其它方面,提高操作系统效率。
2 三方架构备份系统的设计
三方架构的三方是指:备份服务器,存储服务器和备份代理。备份服务器是整个系统的核心,负责管理备份服务器和存储服务器,控制备份与恢复的运行,但备份或恢复数据不经过备份服务器。存储服务器负责管理存储设备或介质,是备份数据存放的地点。备份代理是源,负责将要备份的数据发送到存储服务器和接收恢复的数据。其整体结构如图1所示。
基于三方架构的存储备份系统是基于IP网络存储环境下的数据备份/恢复应用系统。因此,基本通讯的外部环境依托于TCP/IP网络。按照上面介绍的备份模型属于LAN-based备份。系统实现了硬件平台无关性。不但可以很方便地按照客户特定的要求,将数据安全快速地备份到网络存储环境下的某个资源节点上,更重要的是当用户的数据受到破坏或丢失的情况下,可以按照用户的需要,方便、安全、完整地将数据恢复到源端系统或用户指定的目的地,这样可以保证用户的数据安全性和可用性。
系统采用B/S结构,用Web浏览器控制整个系统的运行。无论在什么地方,什么地点都可以对数据进行备份和恢复操作。系统能够根据用户自身业务的需要设计备份方案,并据此对其进行初始化配置。系统的初始化配置既可以通过手动修改系统的配置文件完成,也可以通过Web界面操作完成。初始化配置并运行后,系统能够按照配置要求自动调度作业运行,按要求把作业运行的信息及时反馈给用户。系统还负责备份数据的组织、目录数据库的自动维护、在执行恢复作业时能和用户交互并自动找到需恢复的数据以及把数据恢复到指定的地方。
系统提供集中式管理、分布式存储备份恢复的功能,可以共享网络上的存储设备,减少硬件投资实现数据离线或在线的全量备份和增量备份。系统采用三方架构,分别由备份服务器、存储服务器、备份代理实现三方交互协议。物理上各子系统独立安装运行,逻辑上备份服务器主导整个系统的运行,备份代理和存储服务器接受备份服务器发送的命令运行任务。用户从Web界面发出命令并发送给备份服务器处理。系统可部署于广域网,实现分布式的存储备份和恢复功能。即形成数据中心,使分布在广域网内的用户将数据备份到拥有大量存储资源的企业。
3 三方架构备份系统的实现
系统主要采用的操作系统为Linux系列平台。系统有跨平台的特性,备份代理有Windows和Linux两种,可以实现不同平台的数据备份与恢复。系统的管理是基于Web的管理界面,备份服务器、存储服务器、以及Web服务器都基于Linux平台。Web服务器采用Apache服务器,数据库服务器(又称目录数据库,用来存储存储备份系统的所有信息)可使用MySQL、SQLite或者PostgreSQL。Web服务器位于备份服务器上,并由备份服务器来维护目录数据库。存储服务器后台的存储设备可以采用DAS、NAS或SAN等组织形式。
系统以作业(Job)为单位来运行,作业的管理是系统的核心。作业的属性包括:名称、级别、备份代理、文件集、作业计划、存储服务器、消息、存储池、备份策略等。备份代理是指该作业是那个主机上的。存储服务器是指要存储的地点,可能有多个存储服务器。作业计划可以对作业实施定时运行,无需人工干预,也可以手动对作业运行。作业被定制后,进入作业队列中,等候被备份系统调度。定制作业的操作界面如图2所示:
4 结束语
本文介绍了一种基于三方架构的存储备份系统,系统基于LAN-based模型,能够对中小企业的数据进行很好的保护。与传统的C/S备份相比,采用三方架构,使备份服务器独立出来,在LAN上控制整个网络的备份与恢复,在备份代理和存储服务器之间只传送控制命令,而占流量的大部分的备份数据则直接从备份代理到存储服务器,且对于有SAN的网络,则可以成为LAN-Free的架构。该系统的下一步的研究工作,将是对于各个常用的企业级数据库进行备份以及对作业的调度加以改进。对于一般的中小型企业,该系统已能很好地满足保护数据的安全性和可用性。
参考文献
[1]韩德志,谢长生,李怀阳.存储备份技术探析[J].计算机应用研究,2004(6).
[2]周敬利,余胜生.网络存储原理与技术[M].北京:清华大学出版社,2005.
[3]杨立辉.网络存储中高可靠性关键技术的研究[D].武汉:华中科技大学,2003.
[4]薜芹,毛宇光.通用备份系统的设计与实现[J].计算机应用研究,2006(12).