在线式应用容灾系统(通用11篇)
在线式应用容灾系统 篇1
系统灾难不是是否会发生,而是迟早会发生的问题[1]。数据安全的威胁无处不在,主要有:自然灾害(如:水灾、火灾、雷击、地震等)造成计算机系统的破坏,导致存储数据被破坏或完全丢失;系统管理员及维护人员的误操作;计算机设备故障,其中包括存储介质的老化、失效;病毒感染造成的数据破坏;Internet上“黑客”的侵入和来自内部网的蓄意破坏[2]。
医院信息系统是一个业务数据量大、数据类型复杂和并发事务多的实时系统,医学信息涉及医院的各个部门和医疗服务中的各个环节。由于医院业务的特殊性,任何人为或自然因素所导致的数据破坏或丢失,都会造成医院巨大的经济和声誉损失。因此,有效的容灾系统建设对于医院信息系统来说至关重要。
1 容灾相关概念与技术
灾难可以定义为任何不可预知的影响企业正常运营的事件。容灾系统是指在相隔较远的异地,建立2套或多套功能相同的IT系统,互相之间可以进行健康状态监视和功能切换,当一处系统因意外(如火灾、地震等)停止工作时,整个应用系统可以切换到另一处,使得该系统功能可以继续正常工作[3]。本文讨论的灾难特指任何不可预知的影响医院信息系统正常运行的事件。根据灾难影响范围大小可以分成如下3类:(1)局部灾难,影响同一机房建筑范围内;(2)区域灾难,影响10~20 km;(3)地区灾难,至少100~200 km。
由于医院通常都是集中在一个园区之内,本文仅讨论针对局部灾难的容灾技术。
目前,常见的容灾技术可以分为以下3类:(1)存储镜像技术,如基于IBM DS4800磁盘阵列的远程镜像技术;(2)主机镜像技术,如AIX逻辑卷管理器镜像技术;(3)数据库镜像技术,如Oracle 10g数据的Data Guard技术。
2 容灾技术的原理和特点
目前,国内不少大型医院的HIS(hospital information system,医院信息系统),已经迁移到IBM AIX操作系统和Oracle 10g数据库,存储大多为IBM DS4800档次的磁盘阵列。下面根据实际系统环境讨论3种容灾技术的原理和特点:
(1)存储镜像技术,如基于IBM DS4800磁盘阵列的远程镜像技术
DS4800远程镜像(enhanced remote mirroring)用于在2个磁盘阵列间的在线实时复制,当在一个磁盘阵列上发生灾难或不可恢复的错误时,可以启用第二个阵列接管数据处理工作(见图1)。
磁盘阵列的远程镜像可以在同步模式和异步模式运行,同步模式可确保灾备存储的数据与生产存储的数据实时同步,这也是在容灾中最常用的一种模式。同步模式的I/O操作过程是:当运行至数据在主磁盘阵列和从磁盘阵列写完成时,控制器才会向主机返回I/O完成信号。当主控制器(主逻辑磁盘挂载的控制器)接收到一个来自主机的写请求时,控制器首先在镜像存储逻辑磁盘中记录写请求信息(添加到队列)。同时将数据写入主逻辑磁盘,然后控制器启动远程写操作使影响到的数据块复制到远程站点的从逻辑磁盘。当远程写操作完成,主控制器删除镜像存储逻辑磁盘中记录的写请求信息(从队列中删除)。最后,主控制器返回一个写完成信号给主机。当磁盘阵列的写缓存启用时,所有的写操作都是写到缓存,然后再由缓存写到物理硬盘中。写操作过程如图2所示。
当控制器接到读请求时,读操作由主存储系统处理,主存储系统不需要和从存储系统进行任何通信。
(2)主机镜像技术,如AIX逻辑卷管理器镜像技术
AIX LVM可以提供操作系统级别的镜像(mirroring)功能,即可以为一个存储块提供多份拷贝。该功能包含在逻辑卷管理中,它具有以下特点:支持2~3份拷贝的镜像;可选顺序(sequential)和并行(parallel)2种存取方式;读数据时可从先找到的拷贝处读取,加快访问速度。
镜像功能在数据损坏时,能够从备份中(最多有3份备份)自动恢复,增强系统的可靠性。
为了实现数据的同步,我们利用数据镜像功能LVM,为已有的磁盘上的生产数据添加一个拷贝,正常工作模式下,数据的写入操作可以用图3说明。
生产系统对本地存储的任何更新都在远程存储得到实时更新,本地存储和远程存储的更新方式可以选择顺序方式或者并行方式,建议使用并行方式以增加整体性能。
当本地存储系统发生故障时,生产无需停顿,生产主机利用异地的数据拷贝继续运行,因为2个系统间采取光纤直连方式,性能的影响可以忽略。
当进行本地存储维修时,断开镜像关系;本地存储修复后,恢复数据镜像关系,数据重新在2份拷贝间同步。
(3)Data Guard数据库镜像技术
如Oracle 10g数据的Data Guard技术,Oracle Data Guard确保企业数据的高可用性、数据保护以及灾难恢复(见图4)。Data Guard提供了一套全面的服务来创建、维护、管理和监控一个或多个备数据库,使得生产Oracle数据库从灾难和数据损坏中得以幸存。Data Guard独立维护备份数据库和生产数据库的事务一致性拷贝:如果生产数据库因故障中断而变得不可用,Data Guard能转换备用数据库中的数据至生产环境中运行,从而最小化中断引起的宕机时间。Data Guard能与传统的备份、恢复和Cluster技术一起使用,以提供高级别的数据保护和数据可用性。
Data Guard配置包含一个生产数据库和一个或更多备数据库。在Data Guard配置中的数据库可以通过Oracle Net连接并分布在不同地理位置。数据库所处位置是没有限制的,只要它们能互相通讯。例如,你能有一个备数据库与生产数据库处于同一系统上,并且有2个备数据库在异地的其他系统上。使用SQL命令行工具或Data Guard broker工具来管理主和备数据库,包括命令行工具(DGMGRL)和在Oracle企业管理器中集成的图形化用户工具。
主数据库:Data Guard配置包含一个生产数据库,也称为主数据库,作为主角。主数据库可以是单实例Oracle数据库或Oracle Real Application Clusters数据库。
备数据库:备数据库是主数据库的一个事务一致性拷贝。使用主数据库的备份拷贝,你最多能创建9个备数据库,并将其合并到一个Data Guard配置中。一旦创建,Data Guard自动维护每个备数据库,从主数据库传送重做数据并应用至备数据库中。类似于主数据库,备数据库也可以是单实例Oracle数据库或Oracle Real Application Clusters数据库。
备数据库可以是物理备数据库或逻辑备数据库。
物理备数据库:通过基于块对块的与主数据库同样的磁盘数据库结构,提供主数据库完全一致的物理拷贝。数据库方案(包括索引)是相同的。物理备数据库与主数据库保持同步,通过重做应用,恢复从主数据库收到的重做数据并将重做应用到物理备数据库。除了灾难恢复,物理备数据库只能在有限的范围内用于业务目的。
逻辑备数据库:包含与生产数据库同样的逻辑信息,尽管数据的物理组织和结构可以是不同的。逻辑备数据库通过SQL应用与主数据库保持同步,将其转换成SQL语句,然后在备数据库上执行SQL语句。逻辑备数据库能用于灾难恢复需求以外的业务目的,这允许用户在任何时间访问逻辑备数据库,进行查询和报表。同时,使用逻辑备数据库能升级Oracle数据库软件和补丁集而几乎没有宕机时间。这样,逻辑备数据库能并发用于数据保护、报表和数据库升级。
在一些情况下,业务不允许丢失数据。在另外一些情况下,数据库的可用性比丢失数据更为重要。一些应用需要最强的数据库性能并且能容忍丢失少量的数据。下面概述了3种不同的数据保护模式。
最大保护模式:如果主数据库故障,这种保护模式确保不会发生数据丢失。
最大可用性模式:这种保护模式提供了可能的最高级别的数据保护,而不用与主数据库的可用性相折中。与最大保护模式不同的是,如果故障导致主数据库无法写重做流到异地备重做日志时,主数据库不会关闭。替代地,主数据库以最大性能模式运行直到故障消除,并且解决所有重做日志文件中的中断。当所有中断解决之后,主数据库自动继续以最大可用性模式运行。
最大性能模式:这种保护模式(默认)提供了可能的最高级别的数据保护,而不影响主数据库的性能。当所用的网络连接有足够的带宽,这种模式提供了近似于最大可用性模式的数据保护级别,并且对主数据库性能的影响最小。
3 3种容灾技术的比较
综合比较上述3种容灾技术的特点,可以归纳出如下的对比表(见表1)。
经过比较可以看出,对于多数医院来说,采用基于存储镜像技术的容灾技术具有明显的优点:可支持各种应用和操作系统,故障恢复机制简单,易于操作,管理方便,建设成本的性价比也比较合理。
4 总结
医院信息系统的容灾建设是一个复杂的、长期的任务,面对各种容灾技术,需要根据具体需求,合理地选择一种或综合采用多种容灾技术,这样才能建设成安全、可靠的医院信息系统容灾体系。
参考文献
[1]丁鹏.医院信息系统的数据备份及容灾的设计与实现[J].医学信息,2006,19(3):379-380.
[2]王光明,吴文彬.嵌入式复合数据保护网络系统设计及实现[J].计算机工程与设计,2008,29(1):300-302.
在线式应用容灾系统 篇2
2.1在线监测系统设备
综合考虑监测系统和研究对象的工作环境,对在线监测系统进行了完善,建立了集成式的井下设备监测站,使得在线监测系统更加良好的满足监测要求和监测设备的运行环境。(1)显示屏与控制器。如图3(a)所示,建立的集成式井下设备监测站将控制器与显示屏连接起来,安设数据输入和输出接口,箱体为可移动箱体,显示屏安装在箱体上部,控制器安装在箱体中部前方,主机箱安装在箱体后发,传感器和信号接收器放置在箱体的下部。(2)振动传感器。振动传感器如图3(b)所示,安装方式选用磁吸方式,其头部具有磁性,可以紧密的吸附在监测点处。如图3所示,为显示屏与控制器和振动传感器的结构图。
2.2在线监测系统的应用
在线监测系统对不同型号的刮板输送机进行故障信息采集,采集系统使用网络平台研发的应用软件,该软件适用于Windows各操作系统,并支持SQLSERVER,ORACLE等多种关系数据库。对采集所得数据进行结果分析时,利用混沌理论学及小波理论学的原理,可以检测提取刮板输送机故障早期发出的微弱信号,通过系统的消噪功能进行设备运转噪音处理,提取到较为准确的故障信号。如图4所示,为在线监测设备的布置及应用情况图。
3在线监测系统的应用效益
(1)经济效益。由于刮板输送机在煤矿中的使用环境十分恶劣,且长时间的运行,导致其极易发生设备故障。因此,矿方需要花费大量的人力和物力,去对刮板输送机进行定时的检查和定期的维修。如果使用在线监测系统对刮板输送机进行实时监测,不仅可以减少设备发生故障的概率,保障煤矿生产的安全平稳进行,延长设备的使用寿命,而且可以减少煤矿在设备维修方面的人力和物力投入。同时,可以避免传统设备维修时,维修人员无法判断设备故障部件,而对全部部件更换的情况,监测系统可以准确的判断故障部件,减少维修成本。(2)安全效应。由于煤矿井下工作环境的恶劣性,当刮板输送机设备发生故障,维修人员对设备进行抢修时,长时间处于该环境中,极易发生安全事故问题。而当使用在线监测系统对刮板输送机进行故障诊断时,可以提前观测到设备的故障原因,在极短的时间内解决设备故障问题,保证工作面生产的顺利进行,保障维修人员的生命安全。
4结语
在线式应用容灾系统 篇3
【關键词】输电线路;监测系统;平台
输电线路的安全稳定运行是确保智能电网开展的前提,因为输电线路是智能电网的重要组成部分,而为了确保输电线路的稳定运行,建立运行状态监测系统是有效的采取措施,这是创新输电线路运行的举措。通过系统可以有效的获取相关线路运行以及周围环境的状态,并且为线路的维护提供了动态信息。随着发展的逐步深入,很多电业公司已建成雷电、覆冰、污秽、气象、微风、振动等线路运行状态的监测相关系统。在本文中主要介绍输电线路在线监测系统的应用和管理平台,通过将电网输电线路监测装置采集的信息及各监测系统应用产生的应用结果信息进行融合存储构建完整的输电线路运行状态信息数据平台[2]。
1.输电线路在线监测系统应用和管理平台架构
必须要明确的一点就是这个平台是一个比较复杂的软件平台,因为它集多种信息于一体,并且在构建的时候还要保证系统的稳定可靠运行。此系统的建立需要考虑数据的组织和应用两方面的构思,以此为基础构建一个基础信息平台和高级反应平台。各个功能可按其在数据流中所处的位置分布,在基础信息平台和高级反应平台之中最终形成一个整体系统[1]。 从平台中收集到的监测状态会在企业端有一个总体显示,方便使用者获取相关监测信息。
1.1基础信息平台
输电线路监测系统的运行需要一个基础的设施,这个就是基础信息平台,由数据库和服务总线以及相关模块等组成,负责各个动态的监测,子系统获取输电线路状态监测信息从生产和能量管理系统获取相应设备的运行信息,为深入的高级应用和后续管理提供数据支持,为整个系统的集成和高效可靠运行提供保障。
基础信息平台的基础作用主要工程首先体现在系统的管理上,它可以提供相关的进程管理,网络以及相应的安全和应用管理,许多基础的技术手段也是各种运行的安全保障和监护手段。其次它还是一个提供信息交换的平台,通过构建实时的数据共享和服务共享提供跨计算机的服务,使得监测数据在整个电网范围内可以有效获取,以应对随时变化的动态。再次就是基础信息平台的管理是一种统一的模型管理模式,这也是考虑到输电线路整个电网件的信息共享,并且做好科学的分工。最后就是基础平台是一个公共的服务,相关的历史数据和警告服务等数据全部都统计在一起,是多种应用所需的基础公共信息。
另外对于基础信息平台的设计,还是做了多个方面的分析。首先在基础信息平台上是做了检测数据可以相互交换的设计,监测数据交换功能实现输电线路状态监测系统与雷电监测子系统、污秽监测子系统、覆冰监测子系统、微风振动监测子系统、生产管理系统调度等系统之间的信息交换[2]。在应用和管理平台上的数据以监测系统与各个子监测系统之间数据的相互抽取和推送为主,从而使得输电线路在线监测系统具有响应的预警能力。不仅支持其他系统从特定的数据端口来监测和抽取数据也能向特定系统的指定文件目录下推送数据,并且进行相互间的数据交换。其次在平台上还做了对象模型管理的设计,依据每个对象的不同动态建造一个模型,这种工具为客观存在的输电线路对象及其关系建立对象模型,像区域线路都是属于这一类。设立一个特定的对象模型库,依次根据不同的属性进行分类管理和保存,从而形成基础平台与输电线路基本的相关业务对象模型。这样的管理方式为用户提供了在进行电网输电设备模型录入系统时的相关编辑功能,从而实现资源的源头维护和整个电网之间的服务共享。
1.2高级反应平台
高级反应平台指的是平台的后期使用工程,使用者根据基础信息平台提供的相关线路自身系统运行以及周围环境的动态分别可以做到实时监测,报警数据查询和数据统计。实时监测与报警高级应用负责综合雷电定位、污秽监测、覆冰监测、微风振动监测、防汛监测等子系统输电线路状态,各个子系统的状态预警信息分别被监测系统予以响应,及时报警各类越限监测信息,并且通过特定的图形或者其他方式来展示输电线路状态信息[1]。例如覆冰厚度的动态监测上,如果超过数值就会出现预警变色,报警信息会及时传达到调度员。还有些存在风险的电网设备,监测系统也会发出预警,然后详细的展示相关单元的状态。
数据统计的高级应用会生成统计分析报表,报表的类型会根据监测需要的不同分别有月报,季度报表,还有跟信息相关的预警报表,甚至连报表的体现形势也会根据需求以曲线,图表或者表格的方式呈现,总之就是在对监测数据进行处理时,要在采集查询的基础上,进行全面的天内高级分析,然后再进行数据的相关报表的分析处理。
2.根据监测系统应用和管理平台的研究做出的结论
综上所述,输电线路在线监测系统的应用和管理平台具有非常明显的特点,不仅可以提供实时的在线监测数据作为动态查询的依据,还能在充分利用已有监测子系统的基础上,使原有的功能在不断发挥作用的基础上融合其他线路,为整个电网的动态监测提供积累的相关数据,还有就是这个平台可以综合的利用传感信息等技术自动及时地向不同管理职责的用户分级做出预警汇报,并且在这一过程中还为工作人员的维修工作安排提供了充裕的时间,这在电网的隐患排查上起着极为重要的作用。这种应用管理平台的投入使用将会有效的避免重大事故的发生,保障了电网的稳定安全运行[2]。
监测技术在现在飞速发展的科技时代也得到了很大的发展和进步,检测设备也在不断的更新换代,设备的灵敏性和可靠性也是越来越先进,这就为数据的传输提供了保障。即便是处于环境恶劣的地段,也能很好多的做好动态监测。我们一定要在充分认识和肯定输电线路在线监测系统的基础上,做好应用和管理平台的研究,为确保完整健全的输电线路运行状态提供信息数据搭建良好的平台。
【参考文献】
[1]于德明,郭昕阳等.500KV输电线路在线监测系统应用[J].中国电力.
在线式应用容灾系统 篇4
当前,大型医院已普遍建有医院信息系统,并已成为医院高效、有序开展医疗服务的基本保障。由于大型医院全年365天、全天24h不间断服务和高峰期业务并发量大的特点,一旦信息系统发生故障,整个医院的业务将陷于瘫痪,因此对医院信息系统的运行安全性和连续性提出了很高的要求。为此,医院信息系统的容灾设计对于大型医院来说显得尤为重要。
医院信息系统的容灾目的,不仅是确保数据的完整性,还要保障关键业务运行的持续性。即当医院信息系统发生故障时,仍能够不间断地或尽可能快地恢复提供关键业务支持,并尽可能避免关键数据的丢失,以保证医疗业务的正常运行。
系统的容灾设计有两个评价标准:恢复时间目标(RTO,在灾难发生后需要恢复的紧迫性)和恢复点目标(RPO,在灾难发生后恢复运转时数据丢失的可容忍程度)。RPO针对的是数据丢失,而RTO针对的是服务丢失。即系统容忍丢失的数据量越小,RPO的值越小;系统服务的紧迫性要求越高,RTO的值越小。由于医院承担救死扶伤任务的特殊性,决定了医院信息系统对RPO和RTO具有很高的要求。
2 医院信息系统的容灾设计和实现
医院信息系统有计算、传输和存储三大核心资源。计算资源主要包括具有计算能力和业务处理能力的服务器。传输资源主要包括网络和各类网络交换设备。存储资源主要包括存放数据的各类存储设备。医院信息系统的容灾设计重点就是要保护这三种核心资源。
2.1 计算资源的保护
计算资源的传统容灾方式主要是通过采用服务器群集技术来实现的。以典型的三层架构(一般将医院信息系统架构由上至下划分为表示层、业务逻辑层和数据访问层)分别独立部署在服务器或服务器群集上运行为例介绍:
位于数据访问层的数据库服务器采用基于共享存储的双机热备方式。两台数据库服务器可以采用互备、主从、并行等不同的方式。在工作过程中,两台服务器将以一个虚拟的IP地址对外提供服务,依工作方式的不同,将服务请求发送给其中一台服务器承担。同时,服务器通过心跳线侦测另一台服务器的工作状况。当一台服务器出现故障时,另一台服务器根据心跳侦测的情况做出判断,并进行切换,接管服务。这一过程可自动在短时间内完成(分钟级),对业务不会造成影响。由于使用共享的存储设备,因此两台服务器实际上使用的是一样的数据,由双机或集群软件对其进行管理。通过服务器群集的方式,能够以较短的时间在部分计算资源发生灾难后恢复,保障业务系统持续稳定地运行。
在上两层中——业务逻辑层(应用服务器)和表示层(页面服务器)由于只提供应用服务和用户访问界面,并不保存数据,一般不需要使用共享的存储设备,而应配置多台服务器建立负载均衡机制:一是避免在这两层上出现单点失效,实现容灾;二是可以为用户提供更好的访问质量、提高服务器响应速度。
对于服务器供电中断这类故障,可通过UPS的冗余并联实现快速甚至无缝的灾难恢复。UPS冗余并联实现了若干UPS设备本身的灾难恢复,一旦主机故障停机,系统自动选择作为从机(哪台先开哪台就是主机,而后开机的都是从机)运行的另一台UPS接替主机的工作,保持供电不间断。
2.2 传输资源的保护
传输资源的保护主要通过虚拟路由技术,以及双链路冗余和负载均衡来保障系统容灾的RTO。虚拟路由技术中最具代表性的是VRRP(虚拟路由冗余协议),可将一组用于医院信息系统服务器与客户端通信的路由器协同工作,共同构成一台虚拟路由器。该虚拟路由器对外表现为一个具有唯一固定IP地址和MAC地址的逻辑路由器。处于同一个组中的路由器具有两种互斥的角色:主控路由器和备份路由器。一个组中有且只有一台处于主控角色的路由器,可以有一个或者多个处于备份角色的路由器。VRRP协议使用选择策略从路由器组中选出一台作为主控,负责ARP响应和转发IP数据包。组中的其它路由器作为备份角色处于待命状态。当主控路由器发生故障时,备份路由器能在几秒钟的时延后升级为主路由器。由于此切换非常迅速而且不用改变IP地址和MAC地址,故对医院信息系统客户端用户是透明的。
通过合理的网络设计,也能到达备份和负载均衡双重效果。比如让两台路由器同时属于互为备份的两个组:在组1中路由器A为IP地址所有者;组2中路由器B为IP地址所有者。将客户端1的默认网关设定为路由器A;客户端2、客户端3的默认网关设定为路由器B。这样既分担了设备负载和网络流量,又提高了网络可靠性。同样可以利用如Port-channel等技术实现链路的冗余和负载均衡。
2.3 存储资源的保护
存储资源由于承担保存医院信息系统数据的功能,建议在数据库服务器群集中采用双存储阵列作为共享存储(双链路双控制器冗余的存储阵列最佳),并以镜像方式同步。这样,即使作为共享存储的其中一个盘阵离线,服务依然能够无间断运行。
此外,可利用连续数据保护技术(CDP)对医院信息系统数据进行备份,此技术可以捕捉到一切文件级或数据块级别的数据改动,可以对备份对象进行更加细化的粒度的恢复,可以恢复到任意时间点。硬盘部分,设置RAID容错报错,且有热拔插功能,一旦硬盘毁损,立刻抽换硬盘,系统仍可正常运作,无需中断或关机。
2.4 建立异地灾备中心
上述技术手段实现了医院信息系统的本地容灾,但对于机房遭遇火灾等大型灾害,本地容灾则显得无能为力。有鉴于此,应当在数据中心所处的建筑之外建立异地灾备中心,将重要性高的应用实现异地数据容灾。由于现在存储局域网(SAN)的发展,使得数据备份过程可以在SAN中实现,以满足异地容灾需求。数据中心和异地灾备中心直接通过专用存储网络进行连接,生产系统的数据实时地通过专用的存储网络传输到灾备中心存储。由于数据的备份过程不经过主机系统所在的网络,因此不会对生产系统的网络有任何影响。
虽然异地数据容灾可以保障在生产系统设备遭遇严重损坏情况下的数据完整性,但该方案的系统恢复时间较长,业务支持连续性较差,较适合对实时性要求相对较低的业务应用,如出院结算服务、行政办公服务等。
对实时性要求高的应用,如门急诊结算应用,应实现异地的应用级容灾。即在异地灾备中心建立一套与生产系统相同的备用系统,不但通过SAN实现数据的备份,还应搭建一套备用的应用服务器,并与客户端间采用双网络回路。即使数据中心主核心路由器完全停止工作,网络线路仍可以快速切换到通向灾备中心的链路,客户端程序也可以通过容灾系统的路由连接到备用数据库,可使应用系统得以在30s内恢复运行,RTO值很小。
2.5 部署持续数据保护软件
上述技术可以有效降低或防止自然灾害、设备损坏对医院信息系统造成的破坏,但人为破坏(误操作、蓄意破坏等)同样会给医院造成不亚于前两者的损失,而上文提到的技术对此无能为力。
为防止此因素造成的破坏,需要在存储资源和计算资源上部署持续数据保护软件(CDP),它可以提供连续的恢复点,能够存取任何时间点上的数据,而不仅仅针对那些由快照流程预先确定的特殊时刻。
3 医院信息系统容灾的日常管理
除通过技术手段建立医院信息系统容灾方案以实现信息系统高可用性之外,信息系统日常管理的重要性也不可忽视。平时应定期对机房巡检,通过查看设备状态灯以及各类日志(包括操作系统、数据库、服务器和存储硬件监视软件、路由交换设备),分析系统当前的健康情况。对操作系统以及数据库的用户和密码进行严格管理,及时删除不再使用的帐户,定期更改密码。及时更新杀毒软件病毒码,不推荐被杀毒软件扫描的目录和文件(如数据库系统和数据文件),应当及时将其列入排除列表,以免严重影响系统性能和杀毒软件误删文件后造成系统崩溃。定期进行灾难恢复演练,确认恢复点及容灾方案在发生各种故障后的可用性。综上所述,日常的管理措施可以尽量减少系统故障点,防患于未然,避免不必要的系统恢复工作。
上述医院信息系统的容灾方案,是笔者所在医院的信息系统容灾建设10年发展的结晶,从最初的单服务器(定时备份)模式,发展到本地容灾(高可用、定时备份)模式,一直到现在的异地容灾(SAN、CDP)模式,取得了较好的实践效果。我院在100余台服务器、160余台交换机、3600余台计算机的规模下,已经连续10年未发生全院性信息系统瘫痪事件。诚然,实现医院信息系统的容灾需要较大的前期投入,但是相对于医院信息系统因遭遇故障而丢失的数据、造成的恶劣社会影响和经济损失、事后恢复所需的大量人力和时间,这些投入还是相当值得的。
参考文献
[1]李涛,刘晓洁,曾金全,等.信息系统容灾抗毁原理与应用[M].北京:人民邮电出版社,2007.
[2]董民,周卫东,沈庆国.路由器原理、操作及应用[M].北京:国防工业出版,2006.
[3]邹恒明.有备无患:信息系统之灾难应对[M].北京:机械工业出版社,2009.
[4]王改性,师鸣若.数据存储备份与灾难恢复[M].北京:电子工业出版社,2009.
[5]山德布.信息灾难恢复规划[M].北京:清华大学出版社,2006.
[6]杨霜英,等.大型医院网络信息系统的安全保障策略[J].中国医疗设备,2009,24(10):36-38.
[7]张大胜.医院数据存储备份系统建设的经验与体会[J].医学信息,2008,(12):2184-2186.
在线式应用容灾系统 篇5
【关键词】西门子;传动系统;SIMOVERT-S;轧机
一、前言
某线材厂,精轧机控制系统应用西门子公司的SIMOVERT-S电流源交-直-交变频型全数字大功率交流变频调速装置LCI)控制同步电机,同步电机功率5500KW,由上海电机厂生产。测速反馈采用脉冲发生器,构成全数字大功率交流变频调速传动控制系统,即所谓的无换向器电动机系统,以满足生产工艺对线材精轧机组主传动系统转速高及调频范围宽的要求。
二、西门子SIMOVERT-S的配置及功能简介
SIMOVERT-S电流源交-直-交变频器全数字大功率交流变频调速装置是一种具有90年代国际先进水平的组合式全数字大功率交流变频装置,主要用于大功率、高速旋转的同步电机,最大输出功率超过1MW,其典型的速度控制区域从1500rpm到6300rpm,最高输出转速可达到7000rpm。主要用于工业、电力、船运等调速传动系统中。整套装置主要有功率单元、控制单元和励磁单元三部分组成。
(1)功率单元:在线材精轧机组应用的SIMOVERT-S中,其功率单元由两套完全电气隔离的6脉波电流源交-直-交变频器组成,从而构成12脉波电流源交-直-交变频器。每套6脉波变频器主要由整直流耦合电路及逆变器3部分组成,其中整流器、逆变器均采用SITOR晶闸管模块组成三相全控桥式整流电路;直流耦合电路中的平波电抗器采用环氧树脂浇注型铁芯电抗器。由于SIMOVERT-S的调频范围较宽,因此,逆变器侧的电流互感器及电压互感器均采用霍尔效应变换器。
(2)控制单元:SIMOVERT-S的控制单元采用SIMOVERT-D全数字控制系统,它是一种可以自由组态的多微处理器高速全数字控制系统,也是SIMOVERT-S的核心部分,主要用于实现SIMOVERT-S功率单元及励磁单元的各种高速开/闭环控制、运算、检测、监视、报警及诊断等功能,其全部功能均由基于图形组态的控制软件来实现,并由各微处理器按功能分类进行实时处理,控制采样时间可以小于1ms。
(3)励磁单元:SIMOVERT-S的励磁单元同功率单元一样,也采用SITOR晶闸管模块组成三相全控桥式整流电路,实现6脉冲三相全控整流。
三、西门子SIMOVERT-S的工作原理
在SIMOVERT-S中,功率单元整流器的晶闸管采用电源的交流电压换相,逆变器的晶闸管采用负载同步电动机的定子反电势换相;SIMOVERT-S输出电流的辐值由整流器控制,输出电流的频率由逆变器控制。在额定转速以下采用恒磁调压/调频调速;在额定转速之上,采用恒压弱磁/调频调速;此外,还可以实现强励控制。
在同步电动机起动的初始阶段或运行过程中,当其转速低于额定值的10%时,由于电动机定子的反电势较小,致使逆变器的负载换相方式不能正常工作,此时需靠断续换相电路控制整流器进入逆变状态,将直流耦合电压周期性地反向,迫使直流耦合电流短时为零,从而使逆变器已导通的晶闸管恢复阻断能力,然后再适当控制整流器,重新建立直流耦合电流,并触发逆变器下一对要导通的晶闸管,从而实现强制换相。当采用强制换相时,逆变器以β=0°运行,这样会有效改善功率因数,补偿由于电流断续而产生的输出转矩降低及输出转矩脉动。当电动机转速升至超过其额定值的10%时,电动机定子的反电势超前,则SIMOVERT-S自动切除断续换相电路,转为负载换相。
整流器的控制方式采用速度及电流闭环的双环控制系统,类似于直流调速技术,同步控制电压取自电源侧的电压互感器。逆变器的控制方式采用矢量控制技术,其负载换相及强制换相控制均由矢量控制功能包SMS实现,晶闸管的触发脉冲由同步电动机的反电势控制。在逆变器的运行过程中,采用霍尔效应变换器型的电压互感器检测电动机定子电压矢量的幅值及角位置,并进行综合补偿计算后产生同步电动机电压模型的磁通矢量,然后通过计算该磁通矢量的角位置,完成对逆变器晶闸管的触发脉冲的同步定位,实现对同步电动机的电压模型的矢量控制,使逆变器每次都选择在电动机转子的磁通矢量与定子的磁通矢量互相成90°角的时刻进行换相,这样就保证了电动机的输出转矩最大,效率最高。而励磁单元的控制方式则采用电流闭环的单环控制系统。在正常运行时,逆变器通过同步电动机定子电压及电流的实际值来确定转速实际值,当同步电动机的转速低于其额定值的10%时,则采用脉冲发生器提供附加的转速实际值。
四、西门子SIMOVERT-S的特点及应用
在国外设计联络、技术培训、设备安装、冷/热负荷调试及试生产过程中,我们对SIMOVERTS在工程设计、安装调试及运行维护等方面的应用进行了初步探索及消化吸收,感觉到线材精轧机组主传动系统所用的SIMOVERT-S在软/硬件结构、功能组态及操作方式等方面具有许多新特点,概括如下。
(1)组态灵活,可以根据生产工艺的要求随时方便、灵活地组态所需要的各种控制系统。
(2)功能全面,由于SIMOVERT-S的控制单元采用了SIMADYN D全数字控制系统,具有丰富、全面的控制,监视及故障诊断功能。
(3)性能优越,由于SIMOVERT-S应用了矢量控制技术、多微处理器并行处理技术及12脉波电流源交-直-交变频器技术,使得SIMOVERT-S具有优越的控制性能,充分满足了生产工艺对线材精轧机组主传动系统的要求。
(4)操作简单,由于采用了友好的窗口界面,且附有各种提示及在线帮助信息,因此极大地方便了用户的操作。
(5)运行可靠,由于SIMOVERT-S的全部控制、监视及保护功能均由软件实现,从而大大减少了硬件故障隐患点;而且由于其软/硬件均采用模块组合技术,因此当发生故障时,大大降低了故障的危害程度及影响范围;此外由于从控制单元到功率单元的触发及检测信号采用光电耦合技术传输,因此增强了抗强电磁干扰能力,确保了触发的正确性及可靠性。总之,以上各点保证了SIMOVERT-S运行的高可靠性。
(6)降低干扰,由于采用了12脉波电流源交-直-交变频器技术,基本消除了SIMOVERT-S所产生的5、7次高次谐波,其他各次高次谐波含量也有不同程度的降低,使电网及同步电动机中的谐波电流大致可以降为6脉波变频器的1/2,从而大大降低了SIMOVERT-S对电网所造成的高次谐波影响,有效改善了电网质量。
五、结论
在线式应用容灾系统 篇6
在计算机与网络技术飞速发展的今天,医院信息系统(HIS)的建设已经成为医院现代化管理的重要标志。而随着信息技术在医院业务各方面深入应用,HIS数据库的数据量越来越大,医院正常业务的开展对HIS的依赖性也越来越强。一旦应用数据库被破坏或数据丢失,都会给医院造成不可估量的损失。为此,可靠的数据存储体系和容灾系统建设对于HIS安全运行来说至关重要[1]。
1 我院信息系统存储结构现状分析及不足
我院信息系统目前主要包括HIS、医疗保险结算系统、PACS(影像归档和传输系统)、LIS(检验信息系统)等几大部分,系统运行环境均采用C/S结构及分布式数据处理结构。已将HIS、PACS、LIS进行了整合集成,实现了信息集成共享;医疗保险结算系统作为独立系统。医院现有域控制服务器、数据服务器、医保服务器等十几台和300多个客户端。服务器是信息系统的核心,保证服务器的系统安全性和数据的可用、可靠性尤为重要。
由于受客观条件制约,我院HIS原数据储存方式为传统的“2个运算节点+1个存储节点”模式,即2台服务器配1台磁盘阵列的“双机热备”模式[2]。HIS是基于WINDOWS SERVER2003平台和SQL SERVER2000数据库系统,主服务器系统由主服务器(HP580G2)+从服务器(HP560)+光纤磁盘阵列(LENOVO 620R)组成。双机技术采用ROSE HA(集群系统)软件实现;磁盘阵列中的12块140G硬盘采用了RAID 5技术;光纤盘阵采用了双主机双控制器4路光纤直联,实现服务器与光纤盘阵连接中的HBA卡、光纤盘阵控制器、光纤通路的冗余,具有故障的自动切换功能。医疗保险结算系统基于WINDOWS SERVER2003平台和ORACLE10G数据库系统,前置服务器采用HPDL380G5(配置8块146G SCSI硬盘,采用RAID 5技术)单机应用存储模式。
这两套存储模式不足之处:这台为了在两台服务器之间共享数据而存在的独立磁盘阵列和医保前置服务器,往往就成了核心系统一个突出的故障点,一旦磁盘阵列和本机发生了故障,整个系统就会停机;ROSE HA主备服务器切换时,数据库无法正常打开;没有近线的容灾恢复系统,系统崩溃时数据系统恢复过程负载过重等。为了能够保证HIS的不间断运行(7×24 h),以及数据的安全性和可靠性,结合医院设备情况对医院的服务器存储架构及容灾备份系统进行了升级扩建。具体策略选择如下。
2 数据存储及容灾备份一体化解决方案
2.1 双机集群系统升级与构建SAN架构存储体系
在充分利用原有设备基础上,结合新购设备(HP580G5服务器1台,HP ISUM720磁盘盘阵2台,HP VTL150 G2虚拟带库1台,同有飞骥NETSTOR BACKUP EXPRESS V7(双机备份软件)),构建双机集群系统和基于SAN架构的存储模式[3],见图1。
HIS采用“2个运算节点+2个存储节点”模式,就是在原来双机热备方式基础上,增加了1台镜像磁盘阵列。主服务器系统由2台(HP DL580G5,HPDL580G2)+2台SAN光纤交换机+2台HP ISUM720盘阵组成基于SAN架构的存储模式。利用Veritas Storage Foundation HA(赛门铁克数据应用解决方案)软件来构建服务器的集群环境,Veritas Storage Foundation HA软件主要有Veritas Cluster Server(VCS,企业级软件服务)和Veritas Volume Manager(VVM,集群管理)组成。在主机上安装了VVM软件,对2个磁盘阵列通过镜像关系,形成一个LUN(Logical Unit Number,逻辑单元号)逻辑卷给主机用于存放数据库的数据。对该逻辑盘的任何数据更新,都分别通过2台主机通道到达2台磁盘阵列的控制器,同步完成2个阵列的I/O,保证2个硬盘的业务数据保持一致。2台服务器为WINDOWS SERVER2003操作系统,基于微软的双机集群技术,在镜像阵列中分出1个盘符(约2G)空间,作为集群仲裁盘,存放集群信息。HIS数据库升级为SQL SERVER2005、安装在镜像盘阵上,考虑医院数据容量与可扩展性,HP ISUM720盘阵配置了10块硬盘(每块300G),采用RAID 5技术,存储HIS数据。该方案是一个组件全冗余的存储系统,提高工作效率且无任何单故障点。
2.2 医保系统采用双机热备模式
由原本机存储模式升级为传统的“2+1”双机模式(图1),主机系统由服务器(HP560、HPDL380G5)+盘阵(LENOVO 620R)组成。服务器为WINDOWS SERVER2003操作系统,基于微软的集群技术建立双机热备,数据库ORACLE10G安装在LENOVO 620R(联想盘阵),考虑医保数据需与市医保核心系统进行实时结算,对响应时间要求更高且数据量不是太大,盘阵配置12块140G硬盘、采用RAID 0+1技术。
3 结果与分析
两套存储模式通过SAN光纤交换机分别与HP VTL150G2虚拟带库的两个驱动器互连。
HIS利用SQL SERVER 2005自身的备份策略,每天夜间、中午定时自动进行2次应用数据完全备份,备份到本地镜像盘阵上实现在线存储;采用SYMANTEC Backup Exec 12(BE)软件将数据再近线备份到虚拟带库,BE能为跨网络的服务器和工作站提供快速可靠的备份和恢复能力。我们利用BE的作业管理功能制定的备份策略为:每周日全库完全备份,周一至周六做增量备份,每月进行1次系统的灾难备份。该容灾备份系统能在数据库服务器崩溃时,利用最新的备份数据使系统和数据尽快恢复到运行状态。
医保系统本地在线备份策略为:把ORACLE10G设置成归档日志自动归档模式,采用基于用户表定时导出和基于ORACLE的RMAN技术备份两种策略;采用同有飞骥NETSTOR BACKUP EXPRESS V7(NBE)把ORACLE10G近线备份到虚拟带库[4,5]。容灾恢复策略为:用户表定时导出是基于文件的复制过程;基于ORACLE数据库的RMAN容灾备份。衡量容灾备份恢复通常使用2个指标:RTO(Recovery Time Objective,恢复时间目标)和RPO(Recovery Point Objective,恢复点目标)。其中RTO的实质是ORACLE ARCHIVE LOG的归档时间,ORACLE设定近线平均30 min归档1次。NBE对数据的恢复策略:基于用户表的导入;基于RMAN备份可根据故障点的任选时间点恢复。
依据上述制定的实施方案,我院顺利地完成了两套存储体系及容灾方案的安装与升级,对基于虚拟带库备份恢复系统进行了不同策略恢复测试,效果良好。
4 结束语
该设计方案以SAN架构来整合数据,利用先进的数据管理软件来保护数据;基于虚拟带库建立容灾恢复系统,从而实现医院信息系统的一体化管理平台的建立[6,7]。随着信息技术的飞速发展,我们只有依据本单位实际,合理规划,量身定做所需的最优解决方案,才能在有限的投入下,确保医院各信息系统的安全、高效、稳定地运行。
参考文献
[1]彭红波,蔡宏伟,韩晟.医院数据存储及容灾系统建设及经验[J].医疗卫生装备,2011,32(4):40-42.
[2]李东武.医院信息系统双机热备和数据备份的设计与实现[J].中国医疗设备,2008,23(7):38-40.
[3]郝尚永.基于SAN架构的医院网络数据存储系统设计与实现[J].医疗卫生装备,2009,30(12):47-48.
[4]CBINEWS.虚拟磁带库发展技术浅淡[EB/OL].(2007-05-07)[2010-10-11].http://www.cbinews.com/htmlnews/2007-02-05/50054.htm.
[5]马锡坤.基于Oracle的在线式应用容灾系统的建立[J].中国医疗设备,2012,27(2):38-40.
[6]薛雁.集群、备份和容灾技术在医院信息系统中的应用[J].中国数字医学,2008,8(1):58-61.
在线式应用容灾系统 篇7
笔者在设计一个重要信息系统案例时,是通过数据库双机系统,以Oracle原厂高可用技术(Oracle Data Guard)为基础,以达到系统数据容灾的功能,从而实现重要系统的高可用性。通过实际测试比较,运用Oracle Data Guard技术比第三方双机软件更安全、更稳定,同时能够得到更多的技术支持。数据库双机系统还提供了图形化管理界面,能够实现外部监控、管理Oracle Active Data Guard双机的状态等功能,能够帮助用户对双机系统进行高度便捷的管理。
数据库双机系统网络连接如图1所示。
由图1可以看出,双机子系统主要由表1所示的部件组成。
2 数据库双机系统的主要接口关键概念
1)服务端--数据同步:基于网络TCP/IP协议,利用Oracle11g Active Data Guard技术,将主用数据库的所有DML、DDL、DCL等数据操作信息,通过联机日志以实时异步的方式,传输到异地的备用数据库上。备用数据库会实时接收这些日志,并同步到本地数据库中。
2)客户端—双机监控:默认以每30分钟巡检一次数据库的频率,对数据库双机35个关键技术点进行分析。包含:备份、锁、连接数、表空间、数据同步、作业、归档日志等多个数据库对象,一旦达到预警范围,会立即在界面告警,并提示可能故障的原因。
3 数据库双机系统的配置
结合工作的实际,数据库双机系统有一个主数据库和一个备用数据库,备用数据库采用物理备用数据库方式,采用物理备用数据库方式有优点:
1)对主数据库分块复制提供了快速、高效的故障转移。
2)对数据类型不做限制。
3)允许用在执行预定的维护时,切换主数据库和备用数据库的角色。
4)能够从主数据库中卸载备份。
5)使得在升级时停机时间最短,并允许使用Transient Logical Standby Database功能进行修补。
4 系统设计
4.1 双机模式
双存储系统设计,真正意义上的双机环境,即使在主用数据库完全丢失的情况下,业务数据也能得到最大限度的保障。
数据库双机系统能实现1:1的双机模式,即一台主用数据库对应一台备用数据库。不支持一台主用数据库对应多台备用数据库的模式,也不支持多台主用数据库对应一台备用数据库的模式。
主、备库硬件要求非常低,支持x86_64架构,需要windows2008R2(x64)系统。Intel公司2006年以后生产的CPU都支持64位模式。
无心跳线设计,一根网线既可以满足业务需要,也可以满足数据同步需要。在网络带宽大于数据日志增长量的环境下,主、备机可以在城域网内实现异地容灾的效果。
因设计为异步数据传输,所以即使在主用数据库高负载模式下,也能稳健的完成数据同步,数据同步产生的性能损耗微乎其微。
智能容错模式,当备机因异常脱离双机环境,主用库会自动缓存增量日志。在缓存最高限额时间范围内,备机修复正常后,只要插上网线,双机自动恢复同步状态。
防病毒设计,主、备库仅通过1521端口传输数据,在防火墙配合下的双机环境,即使主库感染了病毒,病毒也无法传播到备库。相反地,如果备库感染了病毒,也无法传播到主库。
其他的特点:对杀毒软件均兼容,无操作系统分区大小限制。
4.2 监控模式
数据库双机系统监控软件作为双机系统的第三个视角,可以同时监控多个数据库,主要目的是加强双机数据同步的监管,做好真正意义上的数据保护。
同时,系统监控软件不仅监控数据同步的信息,还监控数据库容易引发故障的潜在信息,例如:锁、作业、连接数、表空间等,这些隐含在内部的信息不容易被察觉,一旦发生故障,对业务系统都会产生严重的影响。
系统监控软件在巡检过程中,如果发现了故障或隐患信息,会自动调用高级模式,将更加详细的日志在后台进行输出,确保后续的分析和处理。
5 数据库双机系统实现的系统功能
经过项目开发组测试,数据库双机系统实现的系统功能如表2所示。
摘要:随着信息化建设的逐步发展,数据库作为整个信息网络化最重要基础组成部分,其地位和作用越来越突出。经权威技术部门统计,影响业务系统宕机的主要原因有:硬件故障占44%、人为错误占32%、软件故障占14%、病毒影响占7%、自然灾难占3%.。上述这些问题都会给信息化的进程造成种种障碍,进一步影响了信息系统连续使用的可用性。为了进一步提高信息系统的可用性、可靠性和安全性,笔者在设计重要信息系统时,把数据容灾作为首要的项目重点进行实施,以保证在任何危机的时刻,信息系统都能保证其业务工作的稳定运转。数据容灾作为高可用性的一部分,在高可用性设计中是必不可少的。容灾建设,就是在复杂的环境中,以保证业务的连续性为目的,根据项目的需求去定制最佳的容灾方案,是一个业务和技术相结合,高度冗余的信息网络化基础组成部分。
关键词:数据容灾,高可用性,Oracle11g,Active Data,Guard
参考文献
[1]Scot Jesse,Bryan Vongray.Oracle Database11g R2高可用性[M].张慧颖,李波,译.北京:清华大学出版社,2012.
在线式应用容灾系统 篇8
1.1 容灾技术概述。
容灾(disater tolerant)是指除了本地系统以外,用户另外建立的冗余系统,当灾难发生本地系统受到破坏时,冗余系统可以接管用户正常的业务,达到业务不间断的目的。容灾表现为一种未雨绸缪的主动性,而不是在灾难发生后的“亡羊补牢”。
1.2 容灾原理。
容灾技术的基本原理就是数据备份。数据备份是指为防止由系统故障所导致的数据丢失,而将全部或部分生产数据中心的主机系统存储设备复制到其他的存储介质的过程。数据备份是用户进行容灾系统建设的第一步,也是最终容灾系统恢复的基础。
1.3 容灾系统的构成。容灾系统应包括两个层面的问题:数据容灾和应用容灾。
1.4 容灾关键技术。
在建立容灾系统时会涉及到多种技术,目前,关键的技术主要有:远程复制技术、快照技术、基于SAN的互连技术、虚拟存储等。
1.4.1 远程复制技术。
远程复制技术是将主点数据中心的数据复制到远程的备份数据中心,随着更新在主站点的执行,远程站点保持与主站点的同步,远程复制技术是容灾备份技术的核心技术,同时也是保持远程数据同步和实现灾难恢复的基础。
1.4.2 快照技术。
快照是通过软件对要备份的磁盘子系统的数据快速扫描,建立一个要备份数据的快照逻辑单元号LUN和快照cache。在快速扫描时,把备份过程中即将要修改的数据块同时快速拷贝到快照cache中。快照LUN是一组指针,它指向快照cache和磁盘子系统中不变的数据块(在备份过程中)。在正常业务进行的同时,利用快照LUN实现对原数据的一个完全的备份。它可使用户在正常不受影响的情况下,实时提取当前在线业务数据。其“备份窗口”接近于零,可大大增加系统业务的连续性,为实现系统真正的7×24运转提供了保证。
远程复制技术往往同快照技术结合起来实现远程备份,即先通过远程复制技术把数据备份到远程的存储系统中,再用快照技术把远程存储系统中的信息备份到远程的磁带库、光盘库中。
1.4.3 基于SAN的互连技术。
主点数据中心和备点数据中心之间的数据备份,可通过运用SAN的远程复制技术来实现。目前,出现了多种基于IP的SAN的远程数据容灾备份技术。它们是基于IP的SAN的互连协议,将主点数据中心SAN中的信息通过现有的TCP/IP网络,远程复制到备援中心SAN中。当备点数据中心存储的数据量过大时,可利用快照技术将其备份到磁带库或光盘库中。这种基于IP的SAN的远程容灾备份可以跨越LAN、MAN和WAN。
1.4.4 虚拟存储。
虚拟存储技术在系统弹性和可扩展性上开创了新的局面,它将几个IDE或SCSI驱动器等不同的存储设备串联为一个存储池。存储集群的整个存储容量可以分为多个逻辑卷,并作为虚拟分区进行管理。
2 电力行业远程容灾系统的特征
广东电网公司深圳供电局核心业务系统的远程容灾系统,相比与其他行业存在着非常明显的特征:(1)对可靠性要求非常高。供电局核心业务系统涉及到资金量和客户数,必需做到数据非常精确。因此对于数据正确性的比较和修复就尤为重要。(2)要求延迟尽量小。因为大量的实时数据只有被及时复制到容灾系统上以后,才具有抵御生产系统上各种风险的能力。因此在供电局核心业务系统复制的实时性上,必需尽可能缩短延迟。(3)带宽保证。对于深圳供电局来说,由于存在电力调度数据网等专网,带宽一般都有充分的保证,但如何提高网络的Qos、减少数据延迟、加快数据同步将是一个非常重要的目标。
3 深圳供电局远程容灾系统的建设目标
将原有营销、GIS、生产等核心业务在主、备数据中心间容灾手动切换时间,从8个小时缩短至30分钟左右。
4 远程容灾技术在深圳供电局核心业务系统中的应用
4.1 主中心系统构成主要包括:
2台RP8400主机3个分区,1台RP8420主机,分别运行营销、GIS、生产、历史等四个应用生产数据库;1台XP512磁盘阵列,容错机制采用RAID5;2台FC 2/16 16端口光纤交换机;一台MSL6030磁带库。
4.2 容灾数据中心系统构成主要包括:
1台rp8420 2个分区,在灾难发生需要紧急切换时分别运行营销/GIS/生产等应用数据库;1台XP128磁盘阵列;2台FC 2/16 16端口光纤交换机。
4.3 容灾系统软件采用HP Metro Cluster CA XP,Metrocluster集成Continuous Access XP即为Metrocluster CA XP。
作为集成的容灾解决方案,它利用XP存储产品的远程复制功能(Continuous Access)提供HP Storage Works Disk Array XP系列存储的自动重新配置。
5 小结
本文对广东电网公司深圳供电局核心业务远程容灾系统进行了分析和阐述,结合对容灾技术手段的比较和分析,采用了HP Metro Cluster CA XP进行远程容灾。
建立性能稳定的容灾系统并不意味着从此可以高枕无忧,还必须要制定容灾的管理制度。深圳供电局从远程容灾的基础理论出发,制定了一系列日常备份制度和灾难恢复措施,如灾难恢复流程,并在实践中不断进行评估、演练并加以完善,以保证远程容灾不仅仅是形式上的内容,能真正意义上确保主业务系统故障情况下业务的连续性。
摘要:随着广东电网公司深圳供电局信息化建设的逐步提高,营销、生产、GIS等核心业务系统面临的一个重要问题是可靠性问题,如因灾难的发生导致核心业务系统停用或系统不能恢复,不仅会给供电局带来巨大损失,而且还会给社会带来巨大的经济和政治影响。本文从电力行业容灾系统的特征入手,研究了最新容灾群集技术,并讨论了其在深圳供电局核心业务系统上的应用。
关键词:核心业务系统,远程容灾,深圳供电局,容灾应用
参考文献
[1]李涛.信息系统容灾抗毁原理与应用[M].北京:人民邮电出版社,2007.
[2]王渝次.信息系统灾难恢复的规划及实施[M].北京:北京交通大学出版社,2006.
在线式应用容灾系统 篇9
关键词:容灾系统,SAN,分布式数据库
1. 引言
在当前社会中, 信息的价值越来越重要, 作为信息的主要载体, 网络系统也经历着快速的发展。但是, 由于开放性、复杂性和各种天灾人祸等客观因素的存在, 网络系统面临着越来越严重的威胁。因而能够为数据的安全提供支持的容灾系统成为近几年的研究热点。容灾系统的核心思想就是对关键数据进行备份, 一方面, 随着网络系统的发展壮大, 要做到对所有数据的完全备份需要极高的成本;另一方面, 所有的工作设备同时出现故障是小概率事件, 几乎不可能发生。大型系统基本都采用设备间相互备份的折中方案:如果其中一台工作设备出现故障, 系统就把该设备的工作分发给其它正常的设备来处理。
当前已有很多容灾方案被提出来, 蔡皖东[1]对这些方案做了很好的总结, 他把这些方案分为:单机容灾系统、双机容灾系统、单集群容灾系统、双集群容灾系统。刘文[2]对容灾系统中应用到的各种关键技术做了整理和概述。在对关键数据的管理和保护上, 分布式数据库有着非常好的性能, Oracle数据库已经在市场上有了非常高的占有率, 潘立江[3]借助Oracle数据库技术实现了一个简单的容灾系统。本文结合典型容灾系统和分布式数据库的优点, 提出基于分布式数据库的容灾系统。
2. 容灾系统研究
为了应用的连续性和数据的安全性要求, 容灾系统从一开始便选择了“分布式计算, 集中式存储”的结构。按照不同的需求, 容灾分为数据级容灾、系统级容灾、应用级容灾。这三者是逐渐递进的关系:数据级容灾是最基本和最核心的, 确保了应用数据的安全;系统级容灾在数据级容灾的基础上进一步对应用服务器上的操作系统提出了要求, 使得灾难后恢复时间能尽量短;应用级容灾在系统级容灾的基础上对灾难恢复提出时间性的要求, 使得用户基本感觉不到灾难的发生。
2.1 容灾系统体系结构
一个典型的容灾系统的体系结构如图1所示, 分为5部分:用户、公网、应用服务器、SAN (Storage Area Network, 存储区域网络) 、文件服务器。多个应用服务器通过集群技术、负载均衡技术, 进程迁移技术等组成一个稳定服务集群, 为用户提供不间断服务。SAN (Storage Area Network, 存储区域网络) 由众多高性能路由设备构成, 鲁棒性非常强, 为应用服务器访问文件服务器和应用数据的备份提供了冗余的链路。文件服务器主要存储整个系统的应用数据, 这些数据是整个应用系统的核心。所有的文件服务器都有备份文件服务器, 备份文件服务器和主文件服务器可以分布于不同的城市。
2.2 结构分析
该系统最大的特点就是使用SAN给应用数据的访问和备份提供支持。SAN成为整个系统的关键, 一旦SAN网络出现问题, 应用服务器将因为不能访问文件服务器上的应用数据而不能响应用户的请求, 另外, 主备文件服务器上的业务数据也会出现差异。该系统面临如下问题:
(1) 搭建成本的问题
SAN作为一个大型的、稳定的数据传输网络, 需要由众多高性能的路由设备来搭建, 硬件成本比较高。由于SAN只提供应用数据的访问和备份, 要达到这两者在整个响应过程中只用非常少的时间, 就需要自行设计相关路由协议。一种解决方案是租用运营商的线路, 但是SAN网络和运营商的网络并非同构, 另外, 还会受到运营商带宽的限制, 所以难以实现理论研究中提出的各项指标。
(2) 恢复时间的问题
SAN可以允许主备文件服务器分布于异地, 即主文件服务器File Ser1和备份文件服务器File Ser2可以处于不同的城市。当较大规模灾难发生时, 应用服务器SER1可以访问异地的备份文件服务器File Ser2。此时由于SAN网络需要做路由重构, 高效的路由协议自然能够减少重构时间, 但是也会远远超过10秒, 此时应用系统对应用数据的访问就会失效。从用户角度来看, 10秒内应用系统没有了反应, 这点是很容易被感知的, 容灾便没有了透明性。
(3) 具体实现的问题
应用服务器需要首先定位需要访问的应用数据, 然后访问相应的文件服务器。如何实现正确的定位应用数据, 感知灾难发生, 定位到备份文件服务器是个难题。备份文件服务器需要不断地从主文件服务器上复制数据, 以确保数据的一致性。采用哪种复制机制, 能够在提高响应时间的同时又确保数据的安全也是个难题。
(4) 应用范围的问题
由于搭建SAN需要较高的成本, 因此这样的系统通常都适用于大型的, 对灾难恢复等级要求比较高的应用系统。而市场上大部分的应用系统都不属于这种类型, 因此, 此方案的应用范围也比较窄。
SAN作为一个网络系统, 部署的地域通常非常广, 需要方便、快捷、高效地管理。以上问题四个方面, 任何一个解决不好, 都会使SAN成为整个系统的瓶颈。
3. 分布式数据库的容灾技术
为了提高系统的可靠性、可用性和改善系统性能, 分布式数据库需要增加数据的冗余, 这与容灾系统的原理相似。分布式数据库已经有非常成熟的产品, 如Oracle分布式数据库。
Data Guard是Oracle公司针对其数据库产品Oracle Database提供的集成化灾难恢复解决方案, 而且是以组件的方式捆绑着Oracle Database中, 不需要额外的购买费用, 减少了实施过程中的预算。通过配置Data Guard, 可以实现三种数据保护模式, 按容灾能力从高到底依次为最大保护模式、最高性能保护模式、最高可用性保护模式。容灾能力越强, 对数据库的性能影响就越大。
(1) 最大保护模式 (Maximum protection)
最高级别的数据保护模式, 能够保证数据的零丢失, 但是对主数据库的性能影响也最大。它必须在写入到本地主数据库后, 还要保证至少有一个备份数据库写入, 才会在主数据库上对该事务进行提交。主备数据库之间网络或者备用数据库出现问题就会直接影响主数据的操作, 导致其当机。
(2) 最高性能模式 (Maximum performance)
提供稍低于最大保护模式的数据保护级别, 仅对primary数据库有轻微的性能影响。主数据库上的事务可以随时提交, 同样也要求写入至少一个备份数据库, 但是这种写入和事务的提交可以是不同步的。
(3) 最高可用性模式 (Maximum availability)
在备用数据库可用的时候, 该模式与最大保护模式没有差别。而在备用数据库出问题不能访问时, 主数据库不会因此而当机, 系统自动转化为最高性能模式。当备份数据库恢复正常之后, 它又会自动转化为最高可用性模式。
配置了Data Guard的数据库系统具有灾难恢复及高可用性, 还能提供不同的数据保护等级。另外, 它还具有故障自动检查、自动化的角色转化等特点。
4. 基于分布式数据库的容灾系统
基于分布式数据库的容灾系统建立在优秀的容灾方案的基础上, 并结合了分布式数据库的优点。其体系结构如图2所示, 分为四部分:用户、公网、应用服务器和数据库。该方案去掉了图1方案中的SAN, 取而代之的是分布式数据库。
该方案有以下优点:
(1) 分布式数据库自身附带管理系统, 为应用数据提供方便、高效的管理
分布式数据库的数据库管理系统能够直接对分布式数据库进行集中管理。如果需要额外的管理功能, 还能在数据库管理系统上进行进一步的开发。数据库管理系统对应用服务器屏蔽了应用数据的访问方式和备份方式, 应用服务器能够运用简单的数据库操作语言进行应用数据的查询和修改。
(2) 分布式数据库具有极好的扩展性, 部署简单
分布式数据的具有开放性的体系结构, 使得其扩展非常简单。因此, 使用分布式数据库搭建的应用系统能够动态的根据业务量的增减来扩展或者压缩分布式数据库的规模。扩展之后可以使分布式数据库的局部数据库分布不同的城市, 大大提高整个系统的容灾能力。
(3) 分布式数据库能够实现不同等级的数据级容灾
由于分布式数据库已经实现了数据级容灾, 因此在部署整个网络时, 就只需要考虑容灾系统的系统级容灾和应用级容灾。通过对分布式数据库的容灾组件进行配置, 可以实现不同等级的数据级容灾。这样的系统就能具有比较广的适用范围。
5. 结束语
通过分析各种容灾系统、研究分布式数据库的容灾方案, 提出基于分布式数据库的容灾系统。该解决方案有以下特点:方便管理, 部署简单, 易于扩展。由于高可扩展性和动态修改数据保护等级的分布式数据的存在, 搭建的应用系统能够适应各种需求的应用系统, 较小的如本地容灾系统, 较大的如异地容灾系统。
参考文献
[1]蔡皖东.基于等级保护的网络容灾系统模型[J].计算机科学, 2005, 32:47-49.
[2]刘文.现代容灾系统及技术[J].计算机安全, 2008, 9:71-73.
在线式应用容灾系统 篇10
相关容灾备份技术情况
目前,容灾备份技术日新月异,其分类方式也多种多样,下面从热备级容灾备份复制方式的角度,来阐述现有传统容灾备份技术的缺陷及新兴容灾备份技术的优势。根据热备级容灾备份复制方式的分类,主要可分为主机软件、磁盘阵列、网络等三种层次复制方式。其中主机软件、磁盘阵列层次复制方式是两种比较成熟、传统的容灾备份技术,网络层次复制方式是近年来新兴的容灾备份技术。
(1)主机软件层次复制方式
主机软件层次复制方式主要通过在主机操作系统逻辑卷管理软件基础上实现,通过IP网络将逻辑卷Log复制到异地主机,在异地主机重演逻辑卷操作I/O过程。其主要优点是相对低成本、支持异构存储系统、生产中心不需增加硬件成本即可确保两端数据的一致性,缺点是占用主机较多资源,每个主机都需代理许可、对不同的主机系统可能需要采取不同的解决方案、易受距离等影响,无法快速恢复数据,非精细时间策略,管理复杂。该层次复制技术主要应用于主机数量比较少,业务数据不多等情况。
(2)磁盘阵列层次复制方式
磁盘阵列层次复制方式是利用磁盘阵列本身所具有的远程磁盘镜像(复制)软件提供完全的备份/恢复功能,生产中心磁盘阵列随时自动将更新的数据传送至容灾备份中心的备份存储设备。其主要优点是不消耗主机资源、支持任意数量主机、高性能,缺点是服务器与存储子系统必须是同一厂家、同一系列,生产中心与容灾备份中心之间需要相同的支持远程磁盘镜像(复制)的高端磁盘阵列,是属于一种开放性不强、高资金投入、资源整合度差、无法有效保护现有投资及非集约化管理的方式。
(3)网络层次复制方式
该层次复制方式基本溶合了上述两种复制方式的优点,是一种开放的、支持异构存储、不对主机资源产生重大影响的复制方式。一般通过在生产系统串入或旁路一个具备远程镜像(复制)功能的系统,并根据主机系统的代理许可及连续或间隔(分钟级)的复制策略,实现生产中心与容灾备份中心数据的一致性,并达到在故障瞬间完成近似任何时间点的故障恢复。利用这种复制方式架构容灾备份系统一方面有利于保护现有资金投入,对原有生产中心系统的影响较少,另一方面又由于其是一种开放的模式,有利于适应目前各级党政机关电子政务新业务应用急剧增加、应用系统规模急剧扩大的需求,保证了容灾备份系统具有良好的可扩展性和开放性,有利于容灾备份系统的大规模扩展及推广应用。
绍兴市异地电子政务容灾备份系统
绍兴市异地电子政务容灾备份系统作为绍兴市政府有效保护全市电子政务业务应用系统数据安全与完整,有效整合资源,减少财政投入,实现对电子政务资源进行集约化管理的重要举措,在建设中遵循了“科学规划,有效保护、分步实施”、“先重点、后全面”的建设原则。初期以实现包括绍兴市协同OA、“中国绍兴”政府门户网站、绍兴市电子监察等全市性基础业务应用系统对容灾备份需求,防止因人为错误、硬件故障、自然灾难等导致的对这些系统的不可用为建设最初目标。然后把全面提高全市范围内电子政务业务应用系统的持续可用,保证各业务应用系统的高速、安全、完整不间断运行作为系统建设的最终目标。绍兴市在选择容灾备份技术方案时,坚持了以适应今后基础业务应用系统规模的不断扩展、兼容和保护各现有业务系统为基线,以形成一次构建,长期受益的良好架构,并达到系统良好扩展、轻微投入等长期服务目标。
(1)容灾备份系统架构图
(2)容灾备份系统说明
系统在充分保证原有生产中心存储架构、环境不变,对应用服务器零干扰的情况下,采用连续数据保护CDP技术,以块增量扫描形式来构建异地容灾备份系统,在本地部署CDP设备,将生产中心的数据以旁路的方式连续抓取到CDP存储管理器上,对本地生产中心或者利用服务器自带的复制软件功能或者利用容灾备份系统专门配置的复制软件,实时抓取I/O数据,将数据镜像到生产中心的CDP设备中,然后利用本地CDP设备的快照功能,实现对容灾备份中心CDP设备的远程复制,并保证两端CDP存储数据的一致性。所有的复制系统(包括本地复制和异地复制)连接均通过IP以太网络传输。最终达到当本地生产中心数据出现逻辑故障时,能方便利用利用远端CDP设备的反向复制技术,将变化的数据快速从容灾备份中心恢复到生产中心,当生产中心存储设备出现物理故障或自然灾难不可用时,能通过系统提供的一站式可视化界面远程启用存放于容灾备份中心的备用存储设备,直接供生产中心服务器远程调用,保证各业务应用系统不中断。
目前,系统已初具规模,并根据市级相关各部门对容灾备份中心的需求情况,利用系统自有的良好开放性与扩展性,正计划逐步推广到全市所有部门,全面做好全市电子政务业务应用系统的数据安全与完整。
建设注意事项
由于网络技术、容灾备份技术及数据存储技术的不断进步,要想建设一个理想的异地电子政务容灾备份系统并不是件容易的事,除了需要强有力的行政推动,资金的投入,还必须根据本地实际情况选择合适的容灾备份技术方案,这是从技术层面决定了整个容灾备份系统建设成败的关键。从绍兴的实践经验来看,在建设容灾备份系统选择合适的容灾备份技术方案时还应事先明确以下几个方面。
(1)明确系统所防范的灾难范围
根据国务院信息办颁布的《重要信息系统灾难恢复指南》中所述定义,灾难指由于人为或自然的原因,造成信息系统运行严重故障或瘫痪,使信息系统支持的业务功能停顿或服务水平不可接受、达到特定的时间的突发性事件。灾难恢复指为了将信息系统从灾难造成的故障或瘫痪状态恢复到可正常运行状态,并将其支持的业务功能从灾难造成的不正常状态恢复到可接受状态而设计的活动和流程。
具体来说,可以将常规的信息系统故障风险分为几大类:
一是系统的物理故障风险,如主机系统、网络系统、数据库系统、存储系统等;
二是网络的安全风险,如大规模的网络入侵、黑客侵入、病毒的侵扰等;
三是系统的变更风险,如组织变更、系统升级等;
四是系统的环境风险,如突发自然灾害(包括地震、大规模停电、水灾、火灾等);
五是人为的错误,包括程序错误、人工误操作等。
由于系统故障、通信故障、长时间断电、火灾及地震等各种意外情况对信息系统所采取的备份、容灾及恢复方案不尽相同。在考虑技术方案时首先必须明确业务应用系统需要承受的灾难类型,根据我国政府行业特点和国际相关机构调查,人为错误、软件错误、硬件故障居信息系统故障发生概率的前三位,自然灾害等属于小概率事件,但由于破坏力大,也是容灾备份系统必须防范的重要内容。同时从宏观上看,现在人们经常将灾难分为自然性和渐进性(如人为的失误型故障、黑客攻击、断点等)等2种灾难,传统的容灾手段一般重点集中在大型站点类灾难的恢复能力上(主要指上述第1-4点所列风险等灾难),而渐进性灾难(主要指上述第5点风险等灾难)恢复能力不强,但这类故障却是各类故障中发生频率最高的,传统容灾备份系统并不具备涵盖全系列灾难的防范内容。因此地市级政府在考虑容灾备份技术方案时应选择以防范渐进性灾难为重点,酌情考虑防范自然灾害。
(2)明确容灾备份系统对现有业务的影响程度
目前,各地市级政府的现有基础业务应用系统如办公自动化系统、网上审批系统等一般均为24小时在线的生产系统。容灾备份系统具体实施时,首先应考虑不修改现有生产中心的系统结构(否则可能造成对现有系统状态的破坏及增加不稳定因素,并导致生产中心维护成本及难度的增加)。其次,容灾备份系统的实施应采取最为简易和快捷的方式,工程上应具有可操作性、周期的可控性,实施周期要短,这样才能最大限度地减少对原有在线系统的影响,保护现有投资,提高容备份系统建设的成功率。
(3)明确最大容忍时间
明确当业务应用系统发生意外无法正常工作时,导致业务停顿所造成的损失程度,也就是明确地市级政府对信息系统发生故障的最大容忍时间。这是在设计容灾备份系统方案的重要技术因素。以绍兴市为例,信息系统出现故障并导致无法正常工作的最大容忍时间大约为4小时,如果4小时内无法修复相关数据,最终将严重影响全市业务的正常开展。通过明确最大容忍时间以确定容灾备份系统方案的远程传输模式及相关设备的选型。
(4)明确数据保护程度
明确数据保护程度即考虑生产中心数据出现意外时,从容灾备份中心恢复数据可能容忍的最大数据丢失量,这是容灾备份方案规模和复杂程度的重要依据。零数据丢失是目前要求最高的一种容灾备份方式,它要求不管发生什么灾难,系统都能保证数据的安全。但其所需投入的软硬件设备相对而言是最大的。地市级政府在选择方案时,应根据不同信息系统的业务需求,明确不同的数据保护程度,同时合理选择连续时间保护与定时间点保护相结合的数据保护机制,以保证生产中心与容灾备份中心数据的连续性和一致性。
(5)明确系统维护成本
由于长期以来,容灾备份技术的复杂性和高成本性,使得大量的容灾备份系统建设都呈现出维护难度大、传输故障的防范能力低、容灾备份演习难度大的特征。因此,选择技术方案时还需考虑系统管理的友好性和简易性,这是快速故障响应和恢复处理的一个基础。
容灾备份是各级党政机关信息化发展过程中必须认真对待和高度重视的工作,也是一项负责的系统工程,进行容灾备份系统设计往往要与系统所要防范的灾难范围、系统对现有业务的影响程度、最大容忍时间、数据保护程度、系统开放与扩展性、及维护成本等密切结合,才能最终选择符合本地实际的容灾备份系统技术方案,并最终实现确保电子政务业务应用系统的高可用性和连续性,促进电子政务工作健康有序发展的总体目标。
在线式应用容灾系统 篇11
关键词:混合组网,SDH微波,光传输,容灾
0 引言
电力通信网络上传输有继电保护、调度数据网、调度电话、变电站在线监测等电网运行实时数据以及办公、营销、财务等重要生产管理信息, 是电网安全运行和企业正常运转的重要支撑, 是现代电网安全稳定运行的重要保障。随着光通信技术的飞速发展, 光纤传输方式以其传输容量大、成本低等优点, 被广泛应用在电力通信网络中。截至2014年, 福州供电公司已建成以光纤通信为主, 其他通信方式为辅的电力专用通信网络。电力通信网络的主要传输介质——通信光缆在运行中一旦发生故障, 将导致通信网络及其上传输的电网生产管理信息中断, 危及到电力系统安全稳定运行。
目前福州闽江以南地区远至福清、平潭、长乐的通信网络主要通过市区内的普通光缆接入福州地调中心通信站, 光缆路由相对单一, 抗灾能力薄弱。跨江大桥上的管孔多为市政建设的开放性管孔, 通信光缆的安全性无法得到保障。此外, 福州市区地铁站、市政工程等工程项目的开展, 造成该区域内电力通信光缆受外力破坏事故频繁发生, 严重影响通信网络安全运行。2012年, 在则徐广场附近的电缆沟发生的一次火灾, 将连接南部地区变电站的数条通信光缆烧断, 导致220 k V南郊变电站以南通信网络大面积中断, 福清、长乐地区半数以上变电站调度数据网、调度电话通道中断, 给电网安全生产带来重大风险。因此, 组织跨江电网通信容灾备用通道, 提高通信系统容灾能力, 成为亟待解决的问题。
1 跨江电网通信容灾方案选择
1.1 跨江电网通信通道现状
福州闽江以南至福清、平潭、长乐等地区的通信网络通道, 在接入220 k V南郊变电站之后, 经则徐大道、闽江大桥、鳌峰洲大桥通过以下3种路由组织到福州地调 (见图1) 。
1) 220 k V南郊变电站—110 k V会展变电站— (鳌峰洲大桥) —110 k V鳌峰洲变电站—福州地调。
2) 220 k V南郊变电站—110 k V白湖亭变电站—110 k V高湖变电站— (鳌峰洲大桥) —福州地调。
3) 220 k V南郊变电站—110 k V白湖亭变电站—110 k V高湖变电站—仓山区供电营业网点— (闽江大桥) —福州地调。
南郊变与福州地调之间的普通光缆所经区域内地铁、市政建设施工密集, 为光缆外破故障高发区域。为提高福州南部地区电力通信网络至福州地调中心通信站通信可靠性, 需要组织跨江电网通信容灾备用通道。
1.2 空中微波通道方案优点
若采用从其他区域建设迂回光缆, 投入成本高、建设周期长, 且同样存在因地面施工等原因遭外力破坏中断风险。
选择空中无线通信方式作为光缆中断时的备用通信方式, 可有效绕开地面外破故障高发区域, 抗灾能力强。通过充分调研现有无线通信方式, 结合对闽江一带地形地貌的分析研究, 提出采用微波通信技术建设跨江电网通信容灾备用通道。微波通信不需要固体介质, 当两点间直线距离内无障碍时就可以使用微波传送, 已经在抢险救灾应急通信等特殊环境下广泛运用。微波传输方式有传输质量高、通信传输可靠等优点, 其传输保密性好, 可以用于电网生产管理实时数据的安全传输。设备安装方便灵活、成本低、建设周期短, 能够快速投入业务且易于维护[1]。
1.3 微波与光传输混合组网
近年来微波技术在功能、技术性能、组网方式等各方面, 都紧跟通信技术的发展方向。目前SDH微波设备室内单元 (Indoor Unit, IDU) 既有连接天馈线的中频接口, 也有与光传输设备对接的STM-N光接口, 还可以直接传输E1及FE等业务, 各接口间统一通过IDU集成的交叉总线实现业务调度, 可以组成链形、树形、环形等各种复杂的网络结构[2]。各种业务可以直接在IDU内部实现基于VC-4/VC-12的交叉连接, 支撑微波链路无缝接入光传输网络, 实现微波与光传输网络的融合[3]。
跨江电网通信容灾系统总体方案思路为:采用SDH微波与光传输网络混合组网方式, 利用微波跳接尽可能跨越普通光缆隐患覆盖区域, 接入现有的电力通信光传输设备, 与福州地区已有的SDH光传输网络相连, 实现对现有南部地区通信网络与地调联网方式的可靠备份。跨江通信容灾系统示意如图2所示。
2 空中微波链路建设
2.1 微波站址选取
微波站址需选择通信容灾系统覆盖范围内符合微波通信视距直通特点并且具备接入电力通信光纤传输网络条件的站点。选点的位置将决定信号的好坏、施工的难易、微波设备的安全以及运行维护的方便程度等。优先选择电力通信网点, 包括变电站以及具备电力专用通道的营销网点及办公场所等。
在可选站点中, 220 k V南郊变电站与福州地调之间所有路由均为普通光缆, 微波接力站点的最佳选择为南郊变与福州地调, 通过直接在南郊变与福州地调之间开通微波通道, 可形成南部地区网络至地调的OPGW光缆—微波的可靠互联路由。但根据微波直线传输原理, 2个对接的微波站之间必须保证通视。在南郊变进行现场勘察时发现, 南郊往福州地调方向被山丘阻挡, 无法实现通视, 因而南郊变不能作为微波接力站点。
110 k V白湖亭变电站、110 k V高湖变电站处于仓山老城区中, 四周建筑物密集, 无法与地调实现通视, 都不能作为微波接力站点。
仓山区供电营业网点虽可与福州地调调度通信大楼实现通视, 但因南郊变至仓山区供电营业网点中间经过南郊变—白湖亭变—高湖变普通光缆。这2条光缆建设时间较早, 光缆路由及管孔设置与城区建设规划不一致, 近年来屡屡因地铁建设、市政道路施工等遭到外力破坏导致光缆中断, 可靠性较低。如果将微波接力通道建在仓山区供电营业网点与地调之间, 则南部地区网络通往地调通道无法绕开南郊变—白湖亭变—高湖变普通光缆这一段薄弱环节, 其中任何一个位置发生故障, 都会使该跨江容灾系统失去作用。因而同样不能选取仓山区供电营业网点作为微波接力站点。
110 k V会展变电站为2010年新建成的半数字化变电站, 位于海峡国际会展中心旁, 靠近闽江南岸, 视野开阔, 周围无建筑物阻挡, 且与南郊变之间相连的光缆大部分为OPGW光缆, 光缆网络相对可靠。在南郊变与福州地调之间无法直接相连的情况下, 可选择会展变作为与地调互联的微波站点。
2.2 微波跳接方案确定
确定了以110 k V会展变电站作为闽江南岸微波接力站点后, 到达会展变进行现场勘察, 发现从会展变往福州地调中心大楼方向, 正好被闽江北岸世茂外滩沿江一排高层建筑所阻挡, 无法实现通视。进一步辨认发现, 会展变与五一路联信大厦之间可以满足通视条件。联信大厦内设有福州供电公司的办公场所, 为福州公司通信站, 且与地调中心通信站通过普通光缆相连。
根据这2个站点的实际情况, 提出以下组网方案:以会展变和联信大厦作为微波站点, 在会展变与联信大厦之间架设微波电路;会展变微波信号转换成光信号后就近接入到已有的华为Metro 1000光传输设备上;联信微波站通过已有的连接即联信大厦到福州供电公司新大楼的普通光缆到达福州地调中心通信机房, 与福州供电公司SDH光传输通信网络连通。微波跳接方案示意如图3所示。
2.3 微波设备安装调试
分别在会展变主控楼顶平台和联信大厦28层天台架设微波天线, 进行对接调试。由于会展变与联信大厦微波路由长度不到5 km, 需选配直径0.6 m天线。使用GPS系统进行微波天线定位, 通过测量天线功放单位出口信号电压值, 调整天线角度, 确定能够获得最优收信质量的天线位置。2个微波站点对测结果见表1和表2所列。
根据测试结果可得, 会展变至联信大厦双向微波通信ODU接收信号电平值在允许值范围内, 系统可正常运行。
3 混合链路保护配置与联调
SDH数字微波设备和SDH光传输设备虽然接口标准统一, 但其网管系统各自独立, 互不兼容。为了实现SDH光传输设备网管信号和微波设备的网管信号正常交换, 需要在数字微波设备的网管上进行相应设置, 将原再生开销中数据传输通道 (Data Communication Channel for Re-generator Section, DCCR) 让给光传输设备, 原先的网管信号改走复用开销段 (Multiplex Section Over Head, MSOH) 中的数据传输通道 (Data Communication Channel in MSOH, DCCM) , 才能打开相应的再生段开销 (Re-generation Section Over Head, RSOH) 透传通路, 使2种不同系统上的配置数据统一起来, 实现微波链路在已有SDH光传输网络中的无缝接入[4]。
在会展变SDH光传输设备及福州地调SDH光传输设备上分别加装155 M光板, 将微波信号经SDH微波设备转换成的光信号分别接入两侧新增光板, 通过上述网管设置, 形成会展变至福州地调传输通道, 与原会展变Metro 1000—白湖亭变Metro3000—高湖变Metro 3000—福州地调E环Metro3000光路形成155 Mbit/s环网 (见图4) 。在网管上进行配置, 将该环网设置为双纤双向自愈通道保护环。
当会展变—白湖亭变—高湖变—福州地调光路中任一位置发生故障时, 通道保护环自动倒换, 原来在该光路上的业务倒换到会展变Metro 1000—福州地调E环Metro 3000传输通道上。通过将会展变—白湖亭变—高湖变—福州地调光路设置为主用通道, 当网管检测到主用通道恢复正常时, 系统会自动将倒换到微波链路上的业务切换回主用传输光路上运行。通过在网管上插入MS-AIS信号以及在地调光传输设备侧断开光纤芯等方法进行保护倒换试验, 验证各种情况下环网能否正常倒换。试验结果为, 通道均能正常倒换, 且倒换时间小于50 ms, 传输误码率等各项质量性能指标均符合相关规范要求。
4 应用效果
本系统利用SDH微波和光传输混合通信技术, 将联信大厦和会展变作为微波通信站点, 搭建跨江微波通信通道, 与福州供电公司已有的SDH光传输网络组网, 建成跨江电网通信容灾系统, 在各种不可控因素引发的通信光缆大量中断的情况下, 确保了福州南部福清、平潭、长乐地区通信网络重要业务的可靠接入, 保证了电网的安全稳定运行。
为了进一步完善该系统, 可增大微波链路传输容量以便满足更多业务接入需求。通过分析福州地区现有光传输网络, 在薄弱环节增设SDH微波站点, 进一步提升福州地区电力通信网络结构坚强性。由于光传输设备与微波设备厂家不同, 网管系统不统一, 各自独立管理。通过对网管接口进行扩展, 使网管系统互联互通, 实现对微波、光传输链路的全网无差别统一管理[5]。
5 结语
本文提出构建跨越闽江的地面 (光纤) —空中 (微波) 通信容灾系统, 弥补了跨江普通光缆路由单一、抗灾能力差的缺点, 保障了电网运行重要业务通道的可靠畅通。该系统具有建设周期短、成本低、标准统一、接入灵活等优势, 可在各种不同条件下因地制宜地加以应用。本系统为电信运营商等其他以光纤传输为主的通信网络建立容灾备用通道提供了可借鉴的模式, 具有实际应用意义。
参考文献
[1]吴飞龙.微波通信技术在输变电工程临时通道的应用[J].中国电力, 2013, 46 (11) :146–149.WU Fei-long.Application of microwave relay technology in Interim communication of power transmission engineering[J].Electric Power, 2013, 46 (11) :146–149.
[2]王颖舒.SDH数字微波在电力通信网中作为应急通信的可行性[C]//中国电机工程学会第十届青年学术会议, 2009:2068–2074.
[3]毛祥钱.SDH微波在传输网应用中的探讨[J].电力系统通信, 2005, 26 (8) :46–48, 50.MAO Xiang-qian.Discussion about SDH microwave application in transmission network[J].Telecommunications for Electric Power System, 2005, 26 (8) :46–48, 50.
[4]赖广文.SDH数字微波传输系统的关键技术及优点分析[J].有线电视技术, 2011 (7) :114–117.
【在线式应用容灾系统】推荐阅读:
光缆在线监测系统应用11-15
Ajax技术在在线考试系统中的应用研究10-27
在线播出系统06-26
在线就业系统07-29
在线评价系统08-17
在线答题系统09-10
在线预警系统09-11
在线选课系统10-05
在线发布系统10-09
在线分析系统10-10