双机热备设计论文

2024-06-05

双机热备设计论文(共7篇)

双机热备设计论文 篇1

1 引言

防火墙部署于网络流量的必经节点, 如果防火墙出现故障, 将会导致网络中断。防火墙的热备机制保证了单点故障后, 当前的会话或者后建立的会话不会中断。双机热备的机制支持A/S模式和A/A模式两种工作模式, 在这两种模式下防火墙即可部署在透明模式又可以部署在路由模式, 可广泛适用于各种复杂的组网需求。

2 双机热备工作模式

双机热备解决方案根据组网情况有两种工作模式:主备模式 (A/S) 和负载均衡模式 (A/A) 。在这两种模式中, 设备的角色根据是否承担流量来决定:有流量经过的设备即为主设备, 无流量经过的设备即为备份设备。

2.1 A/S模式设计

A/S (Active/Standby) 模式即主备模式, 其中一个防火墙称为Active_Firewall, 另一个防火墙称为Standby_Firewall。正常情况下Active_Firewall处理所有通信任务。并将自身的会话信息和状态信息实时的复制给Standby_Firewall;Standby防火墙不处理任何通信, 只接收Standby防火墙的会话信息和状态信息。当Active防火墙出现故障, Standby防火墙立刻接管Active防火墙的所有通信。进而确保新建立起的会话能正常通信, 当前正在运行的会话也不会中断。具体的设计方式如图1所示。

2.2 A/A模式设计

A/A (Active/Active) 模式即负载均衡模式, 也即是两个防火墙均称为Active防火墙。他们在正常通信时根据当前的流量自动调整自己的会话, 保证每个防火墙的压力都不是很大, 进而提高防火墙资源的利用率, 同时两台防火墙各自实时对对端的防火墙的会话信息进行备份。当其中一个防火墙出现故障, 另外一个防火墙立刻接管故障防火墙的所有会话, 保证通信不会中断。但是这台防火墙的压力会变大。具体的设计方式如图2所示。

3 双机热备实现机制

3.1 数据同步

两种工作模式的“心跳线”链接用于在两台防火墙之间传递主备协商消息和配置同步。可以用以Ethernet链路作为故障切换的链接, 这个Ethernet接口就不能再同时用于其他用途。它的好处在于可以支持两台相距较远的防火墙热备, 并且配置的同步更快。两台防火墙除了“心跳线”链接外, 还可以增加“状态链接”, “状态链接”用于在两台防火墙之间传递TCP链接状态等系统实时状态信息。状态链接仅支持用Ethernet链接。如果两台防火墙之间只有“心跳线”, 没有“状态线”链接, 当防火墙切换时会话会暂时中断, 之后重新建立会话链接。但是当两条链接都具备时候, 防火墙切换不会中断。因为通过“状态”链路, 活动防火墙会实时的将自己的状态发给备份防火墙。当备份防火墙初始化完成后, 会从活动防火墙同步配置;此时查看查看从防火墙的配置和状态信息与主防火墙一致。当登录到备份防火墙的配置界面时候, 见到的是主防火墙的配置界面。

3.2 流量切换

负载均衡模式中, 两个设备可以同时传送流量。当其中一个设备down掉时候, 另外一个设备自动接管全部流量。主备模式中, 同一时间, 只能有一个设备传输流量, 另一个设备作为备份用。当主防火墙down掉时候, 备份防火墙接管主防火墙的所有流量。

4 双机热备的条件限制

双机热备的两台防火墙应满足如下条件:首先, 要求设备型号和硬件 (设备模块、接口类型, 接口数量, CPU, 内存, fl ash闪存等) 配置相同;其次, 软件的版本号和特征集 (如支持的加密同为DES或者3DES) 一致;最后防火墙部署模式必须同为路由模式或者透明模式。否则初始化的信息以及运行中的状态信息无法复制到令外一个设备上。致使会话错误。总之, A/S模式防火墙利用率低, A/A模式防火墙利用率高, 但是具体选择哪种模式要根据网络的需求而定。

参考文献

[1]陈波, 于泠.防火墙技术与应用[M].北京:机械工业出版社, 2013.

[2]阎慧, 王伟, 宁宇.防火墙原理与技术[M].北京:机械工业出版社, 2009.

电动汽车主控制器双机热备的设计 篇2

随着日益加剧环境和污染问题, 电动汽车凭借其零污染、高效率以及结构简易的优点越来越受到人们的青睐。电动汽车主控制器作为整个电动汽车的通信与控制枢纽, 其稳定、可靠、有效、持续的运行直接关系到整个电动汽车的安全行驶。一旦电动汽车的主控制器发生严重故障, 将会带来惨重的后果。综上因素, 想要提高电动汽车主控制器的可靠性一方面要提高单台嵌入式处理器的可靠性;另一方面要从系统冗余的角度进行设计, 提高系统容错能力。[1]现在, 在许多的嵌入式实时系统中, 越来越多地采用双机备份的结构。因此, 双机备份技术的研究有着重要的现实意义。

本文设计基于电动汽车的主控制器, 其需要采集车速、温度等实时数据, 并对这些实时数据及时的进行响应处理, 要求系统必须不间断的运行, 并且能够对数据准确的处理。针对主控制器的这些工作特点, 设计了双机热备系统。处理器的双机冗余设计保证了主控制器的可用性;而热备份技术的采用, 能够实现系统不间断运行, 以及在发生故障时实现无缝切换, 较大程度上提高了电动汽车的可靠性。

1、双机备份的研究

在工程实现中, 双机备份通常为同构型双机备份, 其原理为两套具有相同内外在特征的处理单元, 能够执行相同的任务。[2]两套处理单元分别被定义为一主机和一备机, 即主机为处于工作状态的处理单元, 备机为处于等待状态的处理单元。当主机发生故障时, 备机通过切换装置承担起与主机相同的工作, 进而保证整个控制系统的可靠运行。按照工作模式不同, 通常双机冗余备份分为双机冷备份模式、双机温备份模式和双机热备份模式。

1.1 双机冷备份模式

双机冷备份模式是指系统工作时只有一套处理单元加电, 另外一套断电冷备用。外部监控设备检测到主机故障时, 备机加电启动并通过手动或自动切换装置接替主机工作, 备机转换为主机, 发生故障的处理单元排除故障后转换为冷备份状态。冷备份模式设计简单, 但是由于处理单元从加电到正常工作通常需要一定时间, 双机冷备份模式无法完全满足实时性系统的需求。

1.2 双机温备份模式

双机温备份模式是指系统工作时两套处理单元同时加电, 但只有一套处理单元处于工作状态, 另一套处理单元处于等待或故障诊断状态。当主机出现故障时, 能够迅速自动切换, 由备机接替主机工作。发生故障的处理单元排除故障后转换为备机状态。与双机冷备份模式相比, 双机温备份模式缩短了主备机的切换时间, 减小了系统故障造成的损失。与双机热备份模式相比, 结构简单, 性能消耗较小。

1.3 双机热备份模式

双机热备模式是双机温备模式的一种升级, 通常带有同步装置, 保证两套处理单元产生的关键数据同步。其分为主从模式和全双工模式。主从模式指当系统工作时, 两套处理单元同时加电, 并且都处于工作状态。但只有主机的处理结果输出。[3]当主机发生故障时, 主备机通过同步装置, 能够实现“无缝切换”, 并接替主机控制, 从而保证了控制的连贯性和稳定性。全双工模式指当系统工作时, 两套控制单元同时加电, 同时工作, 产生两个处理结果。然后两个处理结果需要经过表决器进行比较选择对外输出的结果, 表决器的设计十分复杂, 输出若相同则通过表决;若不同则有多种比较方法。因此, 全双工模式设计十分复杂, 对两套控制单元的时序同步、数据同步等要求十分严格。然而, 其实现无缝切换的性能也十分优越。

综上所述, 可用度较高的模式为双机热备模式, 考虑到汽车主控制器对实时性的要求, 但对控制的同步要求并不十分的严格, 只需当系统出现故障时通过切换装置能够迅速的将主机从系统切除并将备机投入系统使系统仍能不间断地正常工作即可。并且考虑到系统对性能消耗和复杂性的约束, 选用STM32F107作为该系统的处理单元, 以及u C/OS-II作为操作系统, 采用双机热备份主从模式设计方案以提高系统可靠性。

2、双机热备份主从模式的设计

2.1 双机热备份主从模式的整体结构

电动汽车主控制器主要功能包括对整车的控制 (仪表、灯光、电动座椅等) 和对驱动、电力以及ABS防抱死系统的监控等, 是整个汽车控制系统的中枢神经, 对汽车的安全运行至关重要, 实时性要求较高。图3.1为电动汽车主控制器双机热备份主从模式的结构框图, 本方案中, 以心跳信号作为仲裁的依据, 两套处理单元互为备机, 系统工作时处理单元1作为主机, 处理单元2作为备机, 处理单元1和处理单元2并行执行相同的处理计算, 且处理单元1和处理单元2各有独自的外围控制逻辑和外设, 这样不会引起系统资源的竞争, 增加了整体系统的稳定性, 当然这样是以花费更多的硬件设施为代价的。通过可编程逻辑器EPM240T100C5N的软件编程来实现对两套处理单元输出的仲裁, 其根据处理单元1和处理单元2周期性发送的心跳信号的频率来判断处理单元1和处理单元2的状况, 由于EPM240T100C5N具有并行处理的特性, 所以能够实现心跳信号的同步检测。当两套处理单元都正常工作时, 心跳信号按照设定的频率正常输出给仲裁单元, 仲裁单元默认处理单元1继续作为主机, 输出选择控制信号控制选择模块的通道1导通, 通道2闭合, 处理单元1的处理结果通过CAN总线和RS232分别发送给各个电子控制单元和人机界面;当检测到处理单元1的心跳信号正常, 而处理单元2的心跳信号的输出频率异常或检测不到心跳信号时, 处理单元1继续作为主机, 同时可编程逻辑器EPM240T100C5N发出处理单元2故障的报警;当检测到处理单元2的心跳信号正常, 而处理单元1的心跳信号输出频率异常或检测不到心跳信号时, 仲裁模块输出选择控制信号控制选择模块的通道1和通道2完成切换, 即处理单元2作为主机接替处理器单元1的工作, 同时可编程逻辑器EPM240T100C5N发出处理单元1故障的报警, 处理单元1排除故障后作为备机。当开关置于手动状态时 (即图中位置) , 通过触发器发出选择控制信号, 实现手动选择处理结果的输出。[4]同时存储模块将两套处理单元工作产生的主要参数以及实时状态存储起来并实现相互共享。

2.2 故障分析与检测

故障检测是双机系统基本的功能实现, 基于电动汽车主控制器的运行特点, 要求故障检测必须能够及时准确的分辨故障的种类, 以便能够快速定位故障;并且要求故障检测占用系统的消耗应尽量要小。根据故障对系统造成的影响, 本方案将故障进行了分类, 如表1所示。

本方案中只采用心跳机制来判断电动汽车主控制器的处理单元的实时运行状态。所谓心跳机制是指处理单元定时的发送一个自定义的信号, 用以告知对方自己还“活着”或正在正常运行。心跳信号的定时周期的设定尤为重要, 如果定时周期过长, 将会造成检测的滞后, 不利于故障的及时恢复, 如果定时周期过短, 将会造成处理单元性能的过度消耗, 不利于整个系统的快速运行。确定定时周期后, 通过检测在定时周期内心跳信号的频率来分辨故障的类型, 若为故障1, 心跳信号自动屏蔽该种故障, 故系统不作处理;若为故障2或3, 将通过检测心跳信号频率进行故障分辨, 进行相应的故障恢复操作。

2.3 仲裁模块的设计

为了提高系统的稳定性, 本方案采用了现场可编程逻辑控制器EPM240T100C5N作为仲裁控制单元, 其具有的并行处理特性简化了心跳信号的同步过程, 同时减小了处理单元的性能消耗。当故障仲裁模块的控制流程如图2所示。在可编程逻辑控制器程序设计中, 处理单元1的模块和处理单元2的模块同时对心跳信号在定时周期内的频率进行计数, 若与正常运行的设定值相等, 则相应模块的故障标志为0, 否则故障标志为1, 主模块通过对处理单元1模块和处理单元2模块的故障标志的值判断两套处理单元的运行情况。若两个故障标志位的值都为0 (两套处理单元都正常运行) , 则通过运行状态位的值, 判断此时的主机, 并输出相应处理单元的选择控制信号;若两个故障标志位的值分别为0和1 (有一个处理单元发生故障) , 则将运行状态位设定为故障标志位为0的处理单元的对应值, 并输出相应处理单元的选择控制信号;若两个故障标志位的值都为1 (两套处理单元都异常, 这种情况发生概率很小) , 则没有选择控制信号产生。若此时转换开关接通仲裁单元, 则选择控制信号控制选择模块的相应通道导通, 另一个通道关闭。

3、结束语

对双机备份的各种模式及特点进行了研究, 结合电动汽车主控制器运行的特点, 最终应用了双机热备份主从模式。本方案中结合了心跳机制、仲裁切换和故障分辨等技术, 并有效的将PLCD与嵌入式系统的结合。本方案主要针对于电动汽车的主控制器, 已在电动汽车仿真平台得到应用, 证明该方案显著提高了主控制器运行的可靠性。在运行的处理单元故障的情况下, 实现处理单元的无缝切换, 保证了系统的不间断运行且准确可靠。能够准确的对故障进行分辨, 缩短了故障的定位及恢复时间。可编程逻辑控制器的应用极大的简化了仲裁模块的硬件及软件的设计, 提高可靠性的同时降低了处理模块的性能消耗, 大大降低了汽车的主控制器失效对汽车带来的风险。同时, 本方案具有一定的普遍性, 在其他的嵌入式系统中均可应用并为其他方案提供了借鉴。

参考文献

[1]赵豫峰, 张善从.一种双机热备的嵌入式计算机系统设计[J].研究与开发, 2013, 32 (5) , 75-78.

[2]唐仁杰.列车控制车载子系统双机容错模拟研究[D].西南交通大学, 2007.

[3]张科超, 崔刚.实时嵌入式系统中的双机热备份容错设计[J].计算机研究与发展, 2010, 47 (SUPPL) 133-136.

双机热备设计论文 篇3

传统意义上, 民航气象雷达多为单通道设计, 即天馈分系统 (含天线罩、天线转台和馈线) 、发射分系统、接收分系统、信号处理分系统、监控分系统、伺服分系统、数据处理与显示分系统 (也称终端分系统) 以及电源分系统均为单套系统, 一旦某个分系统出现故障, 就会造成整机故障停机, 造成气象业务的中断。

随着天气因素对航空安全运行的影响越来越大, 作为监视危险天气重要手段的天气雷达, 其不间断运行的要求也越来越高。目前, 民航系统内多套气象多普勒天气雷达正在建设过程中。借鉴航管二次雷达硬件设计上的方案, 实现气象雷达双机热备配置, 可以大大提高气象雷达的运行冗余程度, 提高雷达系统的可靠性。

2 多普勒天气雷达基本工作原理

多普勒天气雷达通过发射高功率的高频脉冲信号, 借助于云、雨等气象目标的后向散射来检测、分析和确定降水目标。根据回波信息, 测量其强度以及运动的径向速度和速度谱宽。

多普勒天气雷达系统一般由天馈分系统 (含天线罩、天线转台和馈线) 、发射分系统、接收分系统、信号处理分系统、监控分系统、伺服分系统、数据处理与显示分系统 (也称终端分系统) 以及电源分系统8 个部分组成。

激励源输出的高频激励信号, , 送入发射机, 经固态功率放大器后, 进入速调管放大, 输出高频脉冲信号, 经过馈线送至天线向空间定向辐射。定向辐射的电磁波遇到气象目标时, 便会发生后向散射, 形成气象目标的高频回波信号被天线接收。

接收到的微弱高频回波信号, , 经过馈线送往接收分系统, 经过两路高频放大和变频 (高灵敏度通道和低灵敏度通道) , 成为60MHz的中频回波信号, 直接进行中频采样。经中频接收机处理后送往信号处理分系统。

信号处理分系统将两路I、Q正交信号, 作平方律平均处理、地物杂波对消处理, 和拼接处理后, 得到反射率的估测值;并通过脉冲对处理 (PPP) 或快速傅里叶变换 (FFT) 处理, 从而得到散射粒子群的平均径向速度V和速度的平均起伏即速度谱宽W。并将处理后的回波数据通过网络传输至终端系统。

伺服分系统接收到控制指令, 完成天线的方位和俯仰扫描控制;同时它将天线的实时方位角、仰角数据送往信号处理分系统。

终端分系统对于信号处理分系统送来的雷达探测的气象目标回波的原始数据、天线角度信号, 以及GPS时钟进行采集、处理, 以PPI、RHI、体扫等工作方式, 实时显示回波图像, 并可将数据存储下来, 自动生成航空气象保障所需的各种天气预报和天气监测用的图像、图形、曲线等丰富的气象产品。

3 气象雷达双机热备设计

(1) 概述。双机热备设计即是采用双通道体系硬件结构, 即除了天线罩、天线、转台的系统硬件外, 发射、接收、信号处理和监控均进行双套系统冗余设计, 各分系统包括两套独立的设备, 互为冗余备份, 可通过冗余控制电路进行自动重组、无缝切换, 并可在线维修, 减少故障时间, 提高雷达系统的可靠性。

(2) 系统设计。多普勒气象雷达系统双机热备功能主要通过波导开关和二选一切换开关实现。双机热备包括数据处理服务器的切换和雷达硬件的切换。数据处理服务器具备自动/ 人工切换功能, 可以人工切换服务器主备用状态;波导切换开关具有手动切换手柄。

数据处理服务器双机热备份:服务器的热备份是通过服务器之间的网络通信来实现的。主备机通过周期性的发出相互检测的网络测试包, 来互相确认对方的运行状态。如果主机出现故障, 备机在连续丢失设定数目的测试包后, 会认为主机出现故障, 备机则根据已设定的规则, 启动备机的相关服务, 完成双机热备的切换。同时会将此信息通过网络通知网络节点上计算机。当主用服务器修复后, 作为备用服务器使用。切换服务器工作状态不影响整个雷达系统正常工作。

雷达硬件切换:当监控单元检测到雷达的发射机、接收机、信号处理器出现故障时, 监控单元发送关高压、并通过交换机、串口服务器控制切换波导开关和控制信号选择组件, 将硬件系统切换到备份系统, 切换到位后发送反馈指令到监控单元, 监控单元开高压, 雷达正常工作。

雷达工作周期内, 两套雷达的监控单元之间通过交换机周期性的发送握手信号, 互相监测运行状态, 其目的是为了监测备用的雷达系统在不工作情况下的运行情况, 并在终端软件中显示备用系统状态。

整个切换过程包括雷达报警、关闭高压发射、波导开关切换、主备服务器切换、开启雷达高压和状态标校, 整个过程除了波导切换开关是机械动作, 其他都是电讯号动作, 所需时间控制在30s以内。

具体各分系统设计如下:

发射分系统:两套互为冗余的发射系统, 通过大功率波导转换开关选择其中一套发射机高压工作, 另一套处于开机预热状态。每套发射机包含发射配电单元、监控单元、高压电源单元、固态调制器单元、脉冲变压器、速调管、钛泵电源、脉冲旁路器、固态放大器组合、发射组合电源单元和散热风机;

接收分系统:两套独立接收系统 (接收通道单元、频率源单元、激励源单元) , 对原有BIT单元、标定单元进行改进, 满足为两套接收机提供高品质标定信号及监测两套接收机的工作状态;两套互为备份的接收机始终通电工作, 回波信号经冗余开关控制进入其中一套接收机, 经处理得到中频信号后送往数字处理系统进行后续处理。

信号处理、监控分系统:采用模块化设计, 将信号处理板、监控板、数字接收机配置在一个单元内, 组成信号处理单元, 同时增加冗余控制插件, 负责整个系统冗余功能控制, 实现系统故障时自动切换备份通道功能。

数据处理终端:包括数据处理服务器软件、控制和维护软件、显示终端软件;软件设计应包含多终端热备份工作功能, 主终端故障时, 可自动切换到备份终端, 不影响数据处理, 并可对故障终端进行维修。

电源分系统:包括不间断电源、遥控配电箱、电网滤波分机和分布于各分系统的线性电源和开关电源等;双备份系统中各独立分系统均单独供电, 达到故障系统可在线维修, 不影响系统正常工作。

摘要:本文通过借鉴航管二次雷达硬件设计上的方案, 对传统意义上的气象雷达进行双机热备设计的探讨, 通过对发射分系统、接收分系统、信号处理分系统、监控分系统、数据处理分系统以及电源分系统的分析、设计, 实现气象雷达双机热备配置, 从而大大提高气象雷达的运行冗余程度, 提高雷达系统的可靠性。

双机热备设计论文 篇4

本文在分析校园一卡通的数据安全问题进行了多方面的分析,然后根据实际情况给出了校园一卡通系统的数据存储安全实现方式的总体设计规划。校园一卡通系统的数据存储安全设计和实现不仅实现了数字化校园的高可用性和高可靠性,提高了一卡通系统运行的稳定性,确保了学校师生的正常学习生活。

1背景

一卡通系统是数字化校园的主要组成部分之一,而数字化校园是以校园网络作为基础的。我院的校园网络始建于2003年,后经过3次大规模的改扩建,万兆核心,千兆以太网络。目前校园网采用光纤连接17个校内楼宇,千兆到桌面。当前的数字化校园建设主要是以骨干校建设项目为蓝本,逐步建设实施的,一卡通系统作为数字化校园的重要组成部分也做了全面升级,将原有的南开太阳系统更新为正元一卡通系统,系统建设完成后投入使用,目前采用的产品是杭州正元公司一卡通系统。但是由于当时的一些原因,双机热备系统虽然完成整体设计规划,但没有实施部署。2009年双机热备系统规划设计采用的技术方案是ROSE HA模式,当前双机热备的条件均已具备,计划进行正式部署,但由于技术进步目前双机热备的模式已经出现了重大变革和技术更新,出现了三种可选择技术方案,即ROSE HA、ROSE MIRROR HA和Oracle RAC,下文将主要对三种实施方案进行技术比对,以期选取最优方案。

2 技术方案

双机热备系统主要目的是提供一个高可用、高性能、高容错的信息化平台和数据管理系统。本文中所涉及双机热备系统主要是力争为数字化校园,特别是校园一卡通系统提供一个高可用、高性能、不间断解决方案。具体来说就是对重要服务,包括数据管理,使用两套或多套服务器系统,互为镜像,互相备份,执行服务,当一个系统出现问题发生宕机或性能指数低于阈值时,切换到另一个系统继续服务,保证整个系统能够提供持续、不间断,高可靠性的服务。根据两套服务器系统实现方式不同一般将服务器运行方式分为:Active/Standby、Active/ Active这两种方式。

2.1 ROSE HA

最初的数字化校园一卡通设计方案中规划设计的就是采用ROSE HA技术实现校园一卡通系统的双机热备系统。这是主要考虑到ROSE HA可以根据不同的行业及各行业不同的需求设计多种备援模式以弹性的调适用户的最佳组合及选择。ROSE HA适用于采用共享存储的双击阮籍实现关键业务连续性。

Rose HA原理如下图:

ROSE HA双机热备系统运作方式在正常的运作情形之下,主机之间透过冗余侦测线路互相侦测,当主机有错误产生时,ROSE HA判断与分析,确认主机出错之后,才完全启动备机接管。RoseHA支持的数据库有MS-SQL、Oracle、Sybase、DB2等。Rose HA的工作过程:自动侦测、自动切换、自动恢复。在故障主机修复后,透过冗余通讯线与原正常主机连线,自动切换回修复完成的主机上。当作一台活动服务器宕机时,其IP地址、服务器名称及运作的作业会自动转移至另一台服务器,客户端软件不须重新设定,只要重新连接至原先的IP地址及服务器名称即可继续作业。ROSE HA采取错误检测和故障恢复机制减少系统宕机时间并防范错误,提供故障警告。ROSE HA提供基于GUI的监控中心。GUI与SERVER分离,可随时中断GUI而不影响SERVER的运行。支持JOB和BRINGIN/BRINGOUT、在一台SERVER上停止JOB不会导致FAILOVER,支持多个JOB运行。

2.2 ROSE MIRROR HA

ROSE MIRROR HA采用镜像技术的双机软件实现关键业务连续性,具有数据冗余、应用无缝切换、不需要共享存储、增加高可用容灾距离的特点,详见下图。

利用数据镜像技术实现无需共享存储的高可用解决方案。基于文件系统的数据镜像技术,只传输变化字节,减少数据镜像对带宽的占用;实时将数据传递到备机端,减少切换时间;支持虚拟MAC地址,支持ACTIVE/STANDBY和ACTIVE/ACTIVE两种工作模式;支持MSSQL、Oracle、Sybase、DB2等用户需求,详见下图。

2.3 Oracle RAC

RAC( real application clusters),实时应用集群是Oracle数据库中采用的一项技术,是高可用性的一种,也是Oracle数据库支持网格计算环境的核心技术。

Oracle RAC充分利用服务器资源实现了可用,RAC的并行模式实现方式与传统的双机热备实现方式截然不同,详见图四。RAC是一种纯并行的架构,两个服务器并行运行,即Active/Active模式。RAC的高可用性体现在数据可靠性和不间断运行。自动化管理各个资源,定时状态检测机制,自动对一些失败的进程以及心跳检测失败的节点进行重启,详见图五。RAC最多可以支持100个服务器节点,并支持网格即插即用 (Grid Plug and Play,GPnP),可以实现服务器节点的快速添加、迁移,动态地移除服务器节点,提高系统的可用性。RAC架构中多个实例分布在多个服务器上,吞吐量可以动态增加,具有高可用性。

3 技术对比

3.1 ROSE HA、ROSE MIRROR HA和 Oracle RAC 三种技术中 Oracle RAC 具有更高的可用性和安全性。

3.2 ROSE HA采用的双服务器+存储的方式具有一定局限性,无法实现服务器的进一步扩展。ROSE MIRROR HA采用的双服务器模式主要是针对服务器本身进行的热备,没有存储的支持,数据量大的时候无法保证数据的高可靠性和高可用性,也不符合现代架构设计理念和实现模式。

3.3 Oracle RAC对服务器节点支持比较好,支持动态伸展和迁移,但主要应用于针对数据库的管理应用,其主要作用还是局限于维护数据的可靠性和高可用性。

4 结论

双机热备设计论文 篇5

串口联网服务器实现的功能是RS-232/422/485格式和以太网传输的IP包之间的数据转换, 将串口设备连接到以太网进行传输, 它是串行口 (RS-232、RS-422/485) 和以太网RJ45接口间的转换器, 是一个带有CPU和嵌入式OS及完整TCP/IP协议栈的独立智能设备。多口串口服务器中不同串口可以被配置成不同的模式, 确保操作的多样性[1]。

双机热备就是对于重要的服务, 使用两台服务器, 互相备份。其实现方式一般采用active/standby方式, 在同一时间内只有一台服务器运行, 当其中运行着的一台服务器出现故障无法启动时, 另一台备份服务器会通过双机软件的诊测 (一般是通过心跳诊断) 将standby机器激活, 保证应用在短时间内完全恢复正常使用, 从而在不需要人工干预的情况下, 自动保证系统能持续提供服务。双机热备由备用的服务器解决了在主服务器故障时服务不中断的问题。

目前水电站综合自动化系统一般采用分层分布式结构, 其监控系统的典型配置一般要求两台主操作员站互为热备用, 切换零中断, 以实现电站的实时运行数据不至于因主服务器故障而导致数据丢失。本文正是在分析串口联网服务器的工作方式的基础上, 详细讲述了应用串口联网服务器Real port模式实现双机热备软件的设计思想和实现方法[2]。

2串口联网服务器的工作模式及Real port模式的使用方法

2.1 工作模式

YBK-2000水电站综合自动化系统监控软件中采用北京海豚公司的NC600系列串口联网服务器IO-Server, 其工作模式主要有5大类。

(1) TCP/UDP Real port (Windows 扩展串口模式) 。

齐全的基于 Windows 平台下的扩展串口 (com) 驱动, 并提供简洁易用的 Windows 平台下的管理程序, 在WindowsNT/Windows2000/WindowsXP 下可最多达1 024个串口。在这种模式下, IO-Server 的各串口可以映射成Window主机的本地COM口。这意味着使用这些串口就如同使用主机上的本地COM口, 同时也代表所有应用在原有串口设备上的现有软件或通讯模块皆无需修改就可以直接使用。

(2) Multi screens TTY (UNIX 主机登录模式) 。

终端设备可借这种模式登录 Linux/Unix 主机。在这种模式下, 每个串口均支持最多达6个虚拟屏幕, 每个屏幕均支持标准TELNET或固定端口 (RTELNET) 两种登录方式, 且每个屏幕可各自登陆不同的主机或相同的主机。通过热键切换, 支持在一个终端前分别与不同的主机通讯, 很好地实现了单人单终端多任务的应用。

在固定端口模式 (RTELNET) 下, 提供了 SCO Unix/Linux/Unixware 平台下的 Fixed tty驱动。用户可以给每个登录终端取以tty开头的任意名字, 这样就大大方便了用户的管理工作, 也更容易诊断错误。

(3) PPP dialout/PPP daemon (作为 PPP 服务端或 PPP 客户端) 。

IO-Server 的各串口都可支持 PPP。经过配置, 每个串口可以作为 PPP 服务端或 PPP 客户端使用。可以支持远程拨号访问服务系统的应用方式, IO-Server 作为远程拨号访问服务系统中的拨入或者拨出服务器来使用。如果中间走RS-232 两端走网络的方式, 也可以用 PPP 的方式来进行连接, 比如说 RS-232 的光端机。

(4) TCP/UDP Socket (基于网络通讯的Socket 访问模式) 。

提供基于Socket访问IO-Server串口的全部数据包格式以及示例C源代码, 可以在任何支持TCP/IP的操作系统下使用这种方式访问并且控制IO-server的串口。TCP/UDP Socket模式下面分为tcpclient、tcpserver、udp。分别作为TCP的客户端、TCP的服务端和UDP功能。

(5) Line printer daemon (串口工作在 LPD 模式) 。

专门针对串口打印机的应用, 可以支持 LPD 打印队列。

2.2 Real port模式使用方法

水电站中串口设备 (如调速器、励磁、温度巡检、PLC等) 一般都作为上位机系统的从站[3], 负责上送设备数据信息和接受上位机的控制命令, 因此结合实际情况在水电站中应用串口联网服务器的TCP/UDP Real port (Windows 扩展串口模式) 模式, 将IO-Server 的各串口可以映射成Window主机的本地COM口, 可利用串口通信进行数据采集工作, 非常简便。

系统硬件的物理连接非常方便:它一方面可以通过以太网接口直接和上位机连接;另一方面又可以 RS485 接口直接和串口设备相连。在应用IO-Server实现其在串口设备与上位机间的数据通讯双向转换功能时, 要分两个步骤来完成:首先, 因为IO-Server内置了以太网和TCP/ IP 协议, 并且要和上位机通过以太网和TCP/ IP 协议来交换数据, 所以要通过相应操作为IO-Server设置 IP地址和网关等参数, 同时也为上位机设置相应的 IP 地址和网关, 使两者处于一个局域网网段, 这样两者就可以通过以太网相连来交换数据了;其次, IO-Server具备串行通讯接口, 能同时接1路或多路 RS232/RS422/RS485 串行接口设备, 与 串口设备同时进行双向数据交换, 而IO-Server与上位机之间只通过一个以太网接口交换数据。解决以太网接口与串口设备通信的办法是通过在上位机上安装IO-Server的设备驱动程序。该设备的驱动程序与 Windows 标准串口驱动程序完全兼容。通过在上位机上安装设备驱动程序, 该设备上的物理串口可以被映射成 Windows操作系统下的 (虚拟的) 标准串口[4]。

3 利用串口联网服务器实现双机热备功能

3.1 设计思想

在水电站中应用串口联网服务器的TCP/UDP Real port (Windows扩展串口模式) 模式, 将IO-Server的各串口虚拟映射成Window 主机的本地COM口, 因此可利用虚拟串口在同一局域网内只能由一台网内计算机打开串口的特点, 两台主操作员站通过不断检测串口是否被占用来决定操作员站的数据采集控制权, 从而确定本机是作为服务器模式还是客户端模式。

3.2 具体实现

设置两台主操作员站的IP地址分别是:192.168.0.1和192.168.0.2, 两台主操作员站启动串口检测线程 (Detect COM Thread) 通过不断检测串口 (COM1或其他任一虚拟串口) 是否被占用, 若没有占用, 则本操作员站立即作为服务器, 启动利用串口联网服务器的虚拟串口进行底层数据采集工作的线程 (Collect Data Thread) , 并启动侦听线程 (Listen Thread) 接受网络上另一台操作员站的连接请求, 连接上后启动发送网络实时数据线程 (Send Real Data Thread) 向另一台操作员站发送实时数据, 同时启动接受控制命令线程 (Receive Control Command Thread) 接受另一台操作员站发送的控制命令;若已占用, 则说明另一台操作员站已作为服务器在进行数据采集工作, 本操作员站立即转为客户端, 启动连接线程 (Connect Thread) 连接另一台操作员站, 连接上后, 启动接受服务器实时数据线程 (Receive Real Data Thread) 接受服务器发送过来的实时数据, 并启动发送控制命令线程 (Send Control Command Thread) 发送控制命令给另一台操作员站。其数据流图如图1。

在此种方式下, 两台主操作员站安装相同的监控软件, 同时运行, 但任一时刻负责采集数据的操作员站只有一台, 只要其中任意一台出现故障, 即立刻交出数据采集控制权, 同时另一台自动承担起数据采集工作, 切换无扰动, 保证系统实时数据不丢失从而实现两台操作员站的热备份。

4 与传统双机热备软件实现方式比较

传统水电站综合自动化系统双机热备用监控软件的实现方式是:两台操作员站上均安装相同上位机软件, 同时运行, 同时通过以太网通信实现数据采集传输工作, 地位对等, 相对独立, 一台出现故障, 另一台继续工作, 互不影响, 但这种方式要求现地LCU PLC具备通信管理功能或装有通信管理装置。首先由现地LCU作为主站通过串口通信采集串口设备数据, 数据置于PLC或通信管理装置的CPU内存区, 然后通过PLC或通信管理装置的以太网接口通信传至两台主操作员站[5]。

在传统方式下, 电站必须配置价格昂贵的PLC通信管理模块或通信管理装置, 这样实现以太网联网通信功能的成本就太高, 而对于以节约成本、可靠实用为首要考虑因素的小型水电站不太适用。

5 结 语

基于串口联网服务器的水电站双机热备软件已在多个中小型水电站中应用, 结果表明利用串口联网服务器能较好实现双机热备功能, 系统稳定可靠, 灵活性强, 同时由于串口联网服务器价格低廉, 性价比高, 对节约型中小水电站实现联网通信非常实用, 是水电站实现双机热备用功能的一种新的值得推广的模式。

参考文献

[1]杨文忠, 章兢.基于串口服务器的指纹网络考勤系统[J].微计算机信息, 2006, (22) :7-9.

[2]崔明.变电站与水电站综合自动化[M].北京:中国水利水电出版社, 2005.5.

[3]杨东, 李邦云.基于MOXA串口服务器的中小型水电站监控系统[J].东北电力技术, 2006 (1) :20-22.

[4]宋小弟, 迟钦河.串口设备联网服务器在工业控制中的应用设计[J].计算机与现代化, 2004, (11) .

服务器双机热备方案探讨 篇6

通信与计算机技术的迅速发展, 促使企业越来越依赖基于Internet和Intranet的远程计算。

伴随着全球企业日益重视竞争和协作的统一, 企业开始对系统的可用性应用提出了越来越高的要求。高可用性就是需要系统具有快速处理数据的能力, 大存储容量和可管理性, 从而达到要求系统具有高可靠性、高稳定性、高安全性等特性。

传统的单节点的服务器在越来越繁重和复杂的应用服务中体现出来的弊端越来越明显, 而双机热备或多机互备的集群方式在企业高效服务应用中扮演了越来越重要的角色。

2 服务器宕机或者服务异常的种种原因

⑴系统硬件故障。如系统磁盘的损坏将导致数据不能访问, 并进而可能导致应用进程终止或系统停机, 甚至系统不能重启动;网卡的损坏可使终端用户无法访问系统服务;CPU或内存的失效则会导致系统的死机;

⑵应用程序或操作系统出错。由于操作系统或应用程序中可能存在不完善的地方, 当碰到某种激发事件时, 应用程序非正常终止或系统崩溃 (只能通过改善程序或系统来解决) ;

⑶人为错误。一些人工的误操作, 如删除系统或应用文件, 终止系统或应用服务进程, 也会导致系统服务的无法访问;

⑷电脑病毒/黑客入侵。由于目前的大多数计算机系统均连接在网络上, 若缺少有效的防范机制, 很容易遭受病毒的感染或黑客的入侵, 轻者数据被损坏, 重者系统瘫痪 (只能通过加强管理杜绝) ;

⑸其他造成的问题。由于电压不稳定或者静电造成的服务器重起或者关机, 服务器运行时间过长计划内的停机, 更新系统或者添加硬件造成的必要的关机重起操作。

3 集群备份方案设计

⑴需求概述。在今天的商务应用系统中, 稳定持续的系统运行时间变得越来越重要, 而传统意义中的小型机系统使得普通用户望而却步。用户需用的是更高的可用性以及更低的成本。

a.集群系统。集群系统是一种提供高可用性、改善性能和增强企业应用软件可管理性的有效途径。随着基于Intel平台的服务器业已成为关键性业务和应用的主流服务器, 集群技术的应用也日益广泛。

b.集群系统优点。集群可有效地提高系统的可用性。如果一个服务器或应用程序崩溃, 集群系统中另一个服务器在继续工作的同时, 接管崩溃服务器的数据和任务, 最大限度地缩短用户服务器和应用程序宕机的时间。

集群的另外一个优点是通过增加现有系统的的节点, 提高了系统的延展性, 使系统因故障中断的可能性降到最低。在这种架构中, 多服务器的运行是针对相同的应用程序或数据库的。同时可以通过集群来优化性能。

另一个优点是基于英特尔处理器的服务器集群系统成本较低, 使得过去因预算有限而无法采用集群技术的公司得以使用该技术。

集群技术随着服务器硬件系统与网络操作系统的发展将会在可用性、高可靠性、系统冗余等方面逐步提高。未来的集群可以依靠集群文件系统实现对系统中的所有文件、设备和网络资源的全局访问, 并且生成一个完整的系统映像。这样, 无论应用程序在集群中的哪台服务器上, 集群文件系统允许任何用户 (远程或本地) 都可以对这个软件进行访问。任何应用程序都可以访问这个集群任何文件。甚至在应用程序从一个节点转移到另一个节点的情况下, 无需任何改动, 应用程序就可以访问系统上的文件。

在今天, 利用服务器的集群技术, 通过周密计划和网络维护, 系统破坏的机率是非常小的。所以, 一个高稳定性的企业服务器必须使用集群技术。

⑵系统简介。用户的应用环境由几组数据库SQL服务器和应用软件服务器组成, 分担用户常用的一些系统的后台支持。

数据库服务器是整个用户应用系统的核心组成部分, 对系统的稳定性, 安全性和机器性能都必须有一个很高的要求。

应用软件服务器是和用户程序界面的直接接口, 因此, 应用软件服务器的稳定性也是很高的。

⑶方案描述。

1) 实施环境可能存在的不足

·单点故障

当机器由于人为或者非人为原因出现故障后, 都会影响到用户正常访问服务器业务, 从而带来损失。

·数据安全

服务器的数据库只有保存在本机本地, 一旦服务器硬盘出现故障, 将导致数据永远丢失, 要将数据恢复将付出比较大的代价。

·服务器冗余

服务器没有冗余资源, 当服务器出现故障后, 用户完全无法登陆服务器。数据库没有同步的情况下, 用户无法访问最新的数据, 使业务受到影响。

·数据备份

当服务器出现故障后, 用户完全无法登陆服务器。数据库没有及时备份的情况下, 用户恢复数据时间将非常漫长, 间接导致用户无法访问最新的数据, 甚至造成数据严重丢失。

2) 双机集群应用结构图

在整个系统出现某些节点故障的情况下, 仍能继续对外提供服务, 最大限度地减少服务中断时间, 用以提高系统可靠性、可用性、适用性 (reliability、availability、serviceability, 即RAS) 。

高可用集群系统结构图:

2) 、系统功能

如上图, 该系统结构图是典型的集群解决方案系统结构:服务器系统由数据库服务器双机和多台应用服务器组成。

数据库双机热备服务器后端连接accusys a12u-is的阵列柜, 存放着数据库的DB文件。

由Lander Cluster作为双机热备软件, 应用于SQL数据库高可用, 数据库服务器之间通过心跳线相连互相监测。数据库文件存放在后端磁盘阵列上, 数据的可靠性得到保障。

这个系统中, 由于采用IP-SAN的存储架构, 使得今后系统的扩展很容易, 加上accusys a12u-is的阵列柜单控制器就有4个主机接口, 最大能达到120个磁盘位, 为今后的扩容留下很大空间。

5 结束语

在企业中各节点服务器通过内部局域网相互通讯, 当一台节点服务器发生故障时, 这台服务器上所运行的应用程序将在另一节点服务器上被自动接管。当一个应用服务发生故障时, 应用服务将被重新启动或被另一台服务器接管。当以上任一故障发生时, 客户将能很快连接到新的应用服务上。集群技术随着服务器硬件系统与网络操作系统的发展将会在可用性、高可靠性、系统冗余等方面逐步提高。未来的集群可以依靠集群文件系统实现对系统中的所有文件、设备和网络资源的全局访问, 并且生成一个完整的系统映像。这样, 无论应用程序在集群中的哪台服务器上, 集群文件系统允许任何用户 (远程或本地) 都可以对这个软件进行访问。任何应用程序都可以访问这个集群任何文件。甚至在应用程序从一个节点转移到另一个节点的情况下, 无需任何改动, 应用程序就可以访问系统上的文件。

双机热备环境下数据同步的研究 篇7

随着现代信息技术水平的不断发展,网络信息的稳定可靠越来越被各单位所重视,双机热备技术作为一项安全保障技术正不断广泛地被应用。而VPN设备作为网络传输线路中必不可少的一个内外网的接入点,当VPN设备出现故障将会导致内外网之间的网络业务全部中断。在这种关键业务点上为解决网络中断的风险,双机热备就成为最佳的解决方案,如图1所示。而当主VPN设备出现故障时,为使备VPN设备能够在不需要人工介入情况下,自动接替主设备的工作,保证网络系统持续运转,需要将主VPN设备中的会话密钥等数据同步到备VPN设备中,否则会话报文会被丢弃从而导致会话中断。为此我们需要选择一个最佳的、且适合本环境的数据同步方案。

1 数据同步的实现

在此双机热备的环境中数据同步的方式有批量备份和实时备份。

(1)批量备份。VPN设备工作了一段时间后,可能已经存在大量的会话密钥等数据,此时加入另一台VPN设备,在两台设备上使能双机热备功能后,先运行的VPN设备将已有的会话密钥等数据一次性同步到新加入的设备中。

(2)实时备份。VPN设备在运行过程中,可能会产生新的会话密钥等数据。为了保证数据的完全一致,主VPN设备在产生新会话密钥或数据变化后会及时备份到备VPN设备中。

根据我们VPN设备的实际应用环境,我们将采用纯软件的数据同步技术。当前流行的纯软件数据同步实现技术主要有drbd、rsync。在此双机热备环境中我们对rsync方式进行了研究。

2 RSYNC数据同步的研究

Rsync是linux下一款非常强大的数据镜像备份工具,采用差异同步的方法,可以镜像保存整个目录树和文件系统;可以很容易做到保持原来文件的权限、时间、软硬链接等;无需特殊权限即可安装;优化的流程,文件传输效率高;可以使用rcp、ssh等方式来传输文件,当然也可以通过直接的socket连接;支持匿名传输,只同步文件/文件夹的不同部分,同时可以对传输数据部分先进行压缩及解压缩操作,所以rsync的传输效率是很高的,通过rsync可以解决对实时性要求不高的数据备份需求;且rsync使用所谓的“rsync同步算法”来使主备机的数据文件达到同步,这个算法只传送两个文件的不同部分,而不是每次都整份传送,因此速度相当快。

但是随着应用系统规模的不断扩大,对数据的安全性和可靠性也提出了更好的要求,rsync在高端业务系统中也逐渐暴露出很多的不足之处,首先,rsync同步数据时,需要扫描所有文件后进行比对,进行差量传输。如果文件数量达到了百万甚至千万量级,扫描所有文件将是非常耗时的,而且正在发生变化的往往是其中很少的一部分,这是非常低效的方式。其次,rsync不能实时地去监测、同步数据,虽然可以通过linux守护进程的方式进行触发rsync同步,但是两次触发动作一定会有时间差,这样就导致了主备机数据可能出现不一致,无法在应用故障时完全的恢复数据。基于以上原因,我们考虑采用rsync与inotify相结合的方式解决这些问题。

Inotify是一种强大的、细粒度的、异步的文件系统事件监控机制,Linux内核从2.6.13起,加入了对inotify的支持,它监控文件系统的操作,并及时向专门的应用程序发出相关的事件警告,比如通过inotify可以监控文件系统中的添加、删除、修改、移动等各种细微事件。利用这个内核接口,第三方软件inotify-tools就可以监控文件系统下文件或目录的各种变化情况,当文件数据有任何变动时,就触发rsync进行数据同步,从而达到主备机数据一致目的。

3 RSYNC数据同步的实现

Rsync可以通过rsh或ssh使用,也能以daemon模式去运行,在以daemon方式运行时rsync server会打开一个873端口,等待客户端去连接。连接时,rsync server会检查口令是否相符,若通过口令查核,则可以开始进行文件传输。第一次连通完成时,会把整份文件传输一次,以后则就只需进行增量备份。

在我们的VPN设备的备机端,需要启动rsync的服务程序。这里以daemon模式去运行,打开防火墙的873端口,让rsync的服务端与客户端能够通过。在这里需要配置rsync的配置文件rsyncd.conf,当备机的rsyncd.conf文件配置完成后,让rsync以daemon模式后台运行"/usr/bin/rsync--daemon&"。本应用中rsync的配置文件/etc/rsyncd.conf如下:

在我们的VPN设备的主机端,利用inotify监控所需要同步的文件及目录。在shell脚本中使用inotifywait执行阻塞的等待inotify事件。当文件系统发现指定目录下有符合条件的文件发生变化时就触发相应的指令,这是一种主动告之并循环监控目录下的文件的异动的形式,该程序在运行时,更改目录内的文件时系统内核会发送一个信号,这个信号会触发运行rsync命令,这时会将主机源目录变化的文件同步到备机的目标目录。当向inotify监控的目录写入一个很大文件时,由于写入这个大文件时需要一段时间,此时inotify就会持续不停地输出该文件被更新的信息,这样就会持续不停地触发rsync去执行同步操作,将占用大量系统资源。针对这种情况,最理想的做法是等待文件写完后再去触发rsync同步,在这种情况下,可以将inotify的监控事件设为:“-e close_write,delete,create,attrib”。

在启用数据同步功能时,首先在主VPN设备上运行“rsync-vzrtopg--delete--progress$1$user@$ip::$dst--password-file=/etc/rsyncd.password”,以完成对主机上已存在的数据的批量备份,然后运行以下脚本进行实时备份。在此我们通过以下的shell脚步来完成对多目录、多文件的监控,将数据同步到备用设备上。这个脚本的作用就是通过inotify监控文件目录的变化,进而触发rsync进行同步操作,由于这个过程是一种主动触发操作,通过系统内核完成的,所以,比起那些遍历整个目录的扫描方式,效率要高很多。

在所有配置完成后,当在主VPN设备的/usr/local/data目录下添加、删除或者修改某些文件后,到备机的/usr/local/data目录下查看这些文件是否跟主设备该目录下文件一样发生变化。如图2所示,我们对主VPN设备的数据先进行批量同步,然后添加data1文件,并修改其内容,看到主设备数据已进行了同步的传输。查看备机设备发现其对应的目录文件已发生同步变化,由此我们利用rsync和intoify相结合方式进行实时数据同步的双机热备环境就配置成功了,且此方式已满足我们运用需求。

4 总结

根据实验结果,在VPN设备的双机热备环境下,利用rsync和intoify相结合的数据同步方式实时监测和同步数据,将VPN设备的主机会话密钥及数据实时同步到备机。实现了当主VPN设备发生故障时,流量主动切换到备VPN设备并且保障了当前业务持续正常运转。

摘要:针对VPN设备在双机热备环境下需要将主备机数据进行同步的实际需求,研究了rsync与inotify相结合的同步方式,以保障数据信息的同步。实际运行中当主设备发生故障时网络通信能够正常进行。

关键词:双机热备,数据同步,rsync,inotify

参考文献

[1]rsync.[EB/OL].http://rsync.samba.org.

[2]武特,陈君莉.基于inotify的内核态与用户态跨平台数据交互[J].西安邮电学院学报,2012(4):79-82.

[3]高俊峰.高性能Linux服务器构建实战[M].北京:机械工业出版社,2012.

[4]李雪,咸迪.跨平台文件共享系统设计与实现[J].计算机科技与发展,2012(6):191-194.

上一篇:力学传导下一篇:矛盾与统一