高可靠性网络

2024-11-12

高可靠性网络(精选10篇)

高可靠性网络 篇1

0 引言

随着节目制作技术不断发展,电视台的新业务不断涌现,高清、3D电视节目都对电视台生产制作方式提出了更高的要求。为了高效率高质量地实现这些业务,全台网络化制播是一个必不可少的建设路径,在全台网络化后,各个关键的业务节点被打通,业务的网络化流动贯穿于整个节目的制作播出过程,而基础网络位于全台网主干平台的底层,作为连接全台各个业务板块的交换平台,承载着电视台的各类生产业务数据流量。它的安全性和稳定性无疑会对业务的稳定运行产生巨大的影响。

1 电视台网络可靠性现状分析

由于电视台业务的特殊性及敏感性,高可靠性是电视台网络架构的重要衡量指标之一。电视台网络的可靠性技术也是在不断完善发展中,在电视台网络化初期,采用一些简单的二层互通的方式,这时的IP网络还仅仅只是参与一少部分的业务,非网络化的生产方式仍然占据主要地位,在网络设计时,可靠性的要求对于网络设计者来说并不是个头痛的问题。而在今天,电视台全台网络化后,IP网络在电视台业务流程中起着至关重要的作用。不管是单网架构(IP网络)还是双网架构(IP+FC网络),任何节目流量迁移,都需要服务器事先在IP网络上进行信令信息的成功交互。可以说如果IP网络出现瘫痪,整个制播网络就会出现“一觉睡回解放前”的状态。这时的网络设计者已经遇到了很大的挑战。为了增加可靠性,最常见的就是增加冗余设备和冗余链路。这就是目前的大多数电视台全台网基础网络解决可靠性的方式。

2 新一代基础网络架构探讨

新一代的高可用的全台网应该是一个具备设备组件级、网络架构和协议的高可用性的网络。

2.1 设备组件级的高可靠

全台网的主干基础网络是整个网络的核心,它的可用性要求也是最高,不光要求设备的冗余,设备组件级的冗余也应在考虑中,选用的设备应具有充分的组件冗余性,同时产品架构设计上要满足电视台苛刻的可靠性要求。

设备级的可靠性设计是一个系统工程,需要从多个技术角度去设计实现。H3C数据中心级的交换产品非常契合电视台的业务特性,这类数据中心级的交换产品由于应用场景苛刻的高性能高可靠性要求,需要具备几个特征:

1.采用多级多平面的分布式交换架构;

2.将控制引擎和交换网板硬件相互独立,最大程度的提高设备高可用性;

3.组件冗余,包括双主控、多交换网板、多电源、双风扇等;

3.无阻塞的高速转发机制和大端口缓存,保障数据交换无丢包;

4.平滑升级的能力,支持未来40GE、100GE的以太网标准,确保投资安全。

可以看到数据中心级交换机和一般交换机相比有很大的不同,首先在架构上数据中心级交换机不仅要实现组件的全冗余,而且在控制和转发层面要做到完全的分离。再有就是针对数据中心特性的设计,比如突发流量的大端口缓存设计,保证在非编等业务时不会出现丢帧等问题。数据中心级交换机完全满足了电视台这种特殊的应用场景。

2.2 网络架构的高可靠

目前的电视台网络从汇聚到接入多采用VRRP+MSTP的技术,这种方式给管理员带来很大麻烦。

为了解决这一问题,业内的领先厂家已做了大量的工作,实现方式也不尽相同,但虚拟化无疑是其中效果最好的方式之一,H3C公司在这一方面是业内的领导者,目前H3C公司的新一代主流交换机产品已经从核心、汇聚到接入交换机都能实现完全的虚拟化,可以将多台交换机完全虚拟为一台逻辑交换机,对外呈现出一个逻辑实体。

2.3 协议的高可用性

目前电视台的主干网络内所使用的路由协议多为OSPF,但OSPF路由协议的收敛时间非常缓慢,最长可达40s,这样漫长的收敛速度对重要业务是没法忍受的。

通过分析路由协议的收敛机制可以知道收敛时长主要在于路由检测机制,路由协议本身的检测机制无法实现快速的检测,要实现业务在路由故障后的快速恢复,必须借助新的方式,如BFD链路检测机制。BFD检测可以达到ms级,与物理接口和线路无关,是基于IP层的检测,各主流网络设备厂商的BFD完全可以互通,BFD能够与各种上层协议联动,如OSPF、BGP、VRRP、LDP等,极大提高了这些协议的收敛速度,它的收敛速度可以达到300ms以内。

BFD检测机制是一种非常有效的减小收敛时间的成熟技术,当然,实现协议的高可用性不仅只是BFD一种方式,三层协议和二层协议之间的配合、路由的规划等都直接影响到故障的恢复时长。需要针对具体的网络规模和功能进行设计。

3 结束语

网络的可靠性总是伴随着技术的进步而不断得到提升,对于网络管理员来说,一方面需要时实全面的掌握网络情况,制定突发事件的响应办法,做好日常维护工作、完善备品备件的管理流程。另一方面,需要不断吸收一些成熟安全的方法和技术来提升网络的可靠性,要从多方面进行考虑,在设计、维护和管理上下足功夫。

高可靠高性能 篇2

华为赛门铁克(以下简称华赛)是国内专业的存储和安全厂商之一,旗下包括SAN,NAS,VIS,HDP,VTL及云存储等全系列存储产品线。在今年年初,华赛对其SAN系列产品进行了升级,其中包括了新一代的智能存储Oceanspace S5600T(以下简称S5600T)。S5600T属于华赛的T系列,其包括了S5500T、S5600T、S5800T和S6800T这四款型号。华赛T系列存储产品集成了一系列业界的先进技术,包括提升性能密度的TurboModule和提升性能和降低功耗的TurboBoost技术。

华赛S5600T在T系列当中属于为中端市场设计的型号,但是其功能和特性也能满足大型应用的需求。S5600T支持8Gb FC以及1/10Gb iSCSI前端,支持4Gb FC或24Gb SAS宽端口(4个6Gb/s端口捆绑)后端。S5600T最多支持576块盘,包括SAS、SATA和FC类型的磁盘,可以达到较大的容量和不错的性能。S5600T还提供了对SSD的支持。

华赛SmartCache技术

华赛的TurboBoost技术包括了一系列用来提升性能的技术。其中,华赛SmartCache技术通过建立由一块或多块SSD组成的资源池,根据统计算法将频繁访问的热点数据从磁盘中动态缓存到SmartCache中来达到提升热点数据存取性能的目的,这整个过程是全自动的。访问保存在磁盘上的热点数据不仅缓慢、需要耗费大量的电能,并且对硬盘的机械部件也是一个磨损,将热点数据缓存至SmartCache之后,不仅提升了性能,降低了能耗,同时也降低了磁盘组的损耗。

高可靠性

S5600T采用了多种措施来保障系统的可靠性,其采用的双Active-Active主控就具备高性能和高可靠的特点,而华赛T系列的TurboModule设计,让系统的所有I/O模块都支持在线热插拔而无需中断业务。对于SSD可靠性有疑虑的用户,华赛提供了写通的Cache运作方式,数据可以立即写入磁盘,避免系统宕机造成数据丢失。华赛还采用了磁盘预复制(预先检测失效磁盘并迁移数据)、HyperImage(提供最多2048个快照)、HyperCopy(支持异构LUN复制)和HyperMirror(同步和异步远程复制)等技术,还有一个值得一提的是S5600T的坏扇区修复技术,可以自动检测和修复磁盘坏区,从而降低故障率,延长硬盘的可使用周期。S5600T给出的可靠性指标非常高。

测试系统建立

华赛Oceanspace S5600T的最大配置是576块磁盘,建立这样一个庞大的系统有些困难,我们最后建立了一个比较小规模的系统,包含了24块SAS硬盘以及24块SATA硬盘。

5600T搭载了两个一样的Active-Active控制器,每个控制器支持双路Nehalem-EP/Westmere-EP至强。测试系统为每个控制器配置了一个主频为2.4GHz的四核心至强E5504处理器,内存为24GB。S5600T的控制器由华赛自制的Linux系统控制,基于Linux Kernel 2.6.32,64位SMP模式。这两个控制器共处一个控制器机框,由4个冗余电源单元供电。控制器在背板提供了10个TurboModule设计的IO模块位置,用户可以自由搭配。最后,每组还有一个管理模块,并通过以太网连接到远程控制台。

S5600T控制器(上)、S5600T存储框(下)

测试所用存储系统由三个存储机框组成:两个磁盘框和一个SmartCache SSD框,这些机框在架构上都是一样的,只是搭载的存储媒介不同。每个机框可以搭载24个磁盘,由4个冗余电源单元供电。测试系统搭载了24个SAS硬盘和24个SATA硬盘,分别为希捷的450GB Cheetah 15K.7(15000RPM)和1TB的Cheetah NS.2(7200RPM),各自占据了一个框,最后一个框则安装了4块华赛自家的SSD,每块容量为100GB,接口为SATA 3Gb/s。每个机框提供了两个SAS 6Gb端口和一个以太网管理端口。

根据测试项目的不同,测试的压力由二到六台不等的DELL PowerEdge R710服务器产生,它们通过8Gb FC连接到一台博科的32口FC交换机再连接到S5600T的两台控制器上,服务器还通过以太网连接到远程控制台接受管理,它们使用的操作系统是Windows Server 2003 R2 SP2,使用的光纤卡是QLE 2562(8Gb FC HBA)。

测试过程

我们先测试了其最大性能指标,使用运行Iometer 2006.06.27的六台R710服务器给控制器施加小容量、被100%缓存在控制器内存中的数据压力,最终得到的指标是1059057的IOps和8626的MBps。

接着测试的是Oracle Orion,这个软件模拟了Oracle数据库的磁盘负载,用来测试目标存储系统的在线事务处理性能。我们在S5600T上使用24块SAS硬盘创建了4个每个包含6个硬盘的RAID 5组,每个RAID组下组建一个100GB的逻辑磁盘LUN,并平均分配到两个控制器上,测试中我们关闭了S5600T SmartCache特性。测试搭载的LUN从1依次递增到4个,最后得出两个曲线:OLTP(IOps)和OLAP(MBps),如图所示。

测试结果表明,在使用所有24个磁盘的情况下,OLTP指标是7644 IOps,OLAP指标是3059 MBps。两条没有什么波折的直线表明系统的伸缩性不错,可以随着磁盘的增多而接近线性地提升性能。

接着是SmartCache特性测试,我们分别测试了SmartCache建立后和去除后的磁盘性能。我们在S5600T上使用12个SATA盘建立了2个LUN,并挂接到一台R710负载发生器上,使用标准的Iometer WebServer网站服务器配置文件进行性能测试。WebServer测试是一个包含了大小不等的数据块大小、100%随机读的测试。最终得到了两个曲线,如图所示。

在SmartCache缓存率99%的情况下,系统得到了32116的峰值WebServer IOps性能,这是一个很不错的成绩。而在去除SmartCache之后,系统表现的峰值性能是1556,SmartCache的峰值加速比达到了20.6,也就是使用SmartCache之后,在WebServer这样的100%随机应用可以提升到原来性能的约21倍。

总结

高可靠性网络 篇3

1 消息的即时传输

良好的用户体验对即时通信系统的消息传输具有较高的要求,尤其是消息的即时性。但在某些情况下,服务器并不能即时地将信息推送给接收者,存在着两种主要情况[3]。

(1)客户端与服务器之间的通信长链接不稳定。服务器资源限制和网络问题的影响是客观存在的,从理论的角度没有办法避免。但可以从其他方面解决通信链接的稳定性对消息即时传输产生的影响。提出的高性能长链接、通信链接的检测和通信链接的恢复方法,有效地利用了服务器的资源,并保证链接断开后能够快速的恢复,从而保证消息的即时传输。

(2)同一时间服务器需要推送的消息量较多。服务器转发消息也需要消耗时间,当同一时间进行即时通信的用户较多时,服务器来不及转发新接收的消息,导致了消息的阻塞,从而影响了消息的即时性。因此采用消息的并发推送方法解决消息阻塞的问题[4]。

1.1 高性能通信长链接

用户量的不断增加,服务器需要存储的通信链接越来越多,但一些通信链接在某些时候并不会被使用。通过分析得出客户端与服务器之间建立的通信长链接并不会随时都被利用,某些时间会处于空闲状态,为此提出了高性能通信长链接,尽量地减少客户端空闲状态下的链接时间,提高服务器的资源利用率,保证用户量剧增时通信链接不会因为服务器的资源限制而断开,从而保证消息的即时传输[5]。为了建立高性能通信链接,使用时间片轮转的算法。把用户开始登陆客户端的时间或者用户发送消息的时间记为开始时间,从开始时间起,把时间分为等长的时间片段N,假设得到的时间片段如图1所示。其中黑色区间表示在这个时间片段内用户有消息需要接收。白色的区域表示用户处于空闲状态没有消息需要接收。时间片轮转算法的目的是保证用户使用即时通信需要接收消息时,客户端与服务器存在通信链接[6]。而用户没有使用即时通信时,客户端与服务器之间不存在通信链接,从而释放了服务器的资源。时间片轮转算法的规则如下:

(1)当客户端需要接收消息时,当前时间片为忙碌状态。相反如果没有消息需要接收,则当前时间片处于空闲状态。当用户登录软件后,默认第一个时间片为忙碌状态,并且客户端向服务器发送建立通信链接的请求。

(2)如果当前时间片客户端处于忙碌状态,那么接下来的m个时间片客户端都将主动向服务器端发送建立链接的请求。

(3)如果当前时间片的前m个时间片处于空闲状态,那么当前时间片的链接状态与前一个时间片的链接状态相反。例如前一个时间片客户端与服务器有通信链接,那么当前时间片客户端将向服务器发送断开链接的请求。

(4)如果当前时间片的前m个时间片中的任何一个时间片客户端处于忙碌状态,那么当前时间片客户端将向服务器发送建立链接的请求。

1.2 通信链接的检测和恢复

为了保证消息的即时传输,提高服务器长链接的效率,保证服务器与客户端链接稳定,避免意外中断情况的出现,采用有效的长链接检测方法和消息恢复方法[7]。理论上称客户端发送询问信息的过程为心跳过程,心跳时间指客户端向服务器发送询问信息的间隔时间。为了避免客户端频繁地发送心跳信息,消耗能量,或者避免心跳时间过长,导致消息传输的延迟。本文提出了心跳时间衰减函数如下:

式中:Ti表示第i时刻的心跳时间;Ti-1表示第i-1时刻的心跳时间;n1和n2表示时间衰减系数都是常量;T0表示最短的心跳时间间隔,同样也是一个常量;Tmax表示最长的心跳时间间隔,也是一个常量;new表示客户端发送了新的消息或者是服务器向客户端推送了新的消息。心跳机制和时间片轮转结合后,客户端只有处于忙碌状态时才会发送心跳信息。这样既保证了通信链接的稳定,又节约了服务器的资源。

1.3 客户端通信恢复机制

当客户端启动后,在客户端的后台会启动两个线程,在Android中使用Service服务,Service相当于Activity,只是没有界面而是运行在后台的服务。其中一个线程按照定时器的设定不停地向服务器发送心跳信息,确认客户端与服务器的通信链接是否正常[8]。另外一个线程用于监听服务器,接收服务器推送的消息。通过心跳机制,当客户端检测到与服务器的通信长链接断开时,需要向服务器请求再次建立链接以及获取离线数据。

为了进一步降低服务器的数据处理压力,提升用户体验。提出了一种获取离线消息的方法,通过短链接的方式获取离线消息[9]。短链接指的是客户端向服务器发送请求会携带必要的参数,而服务器做出响应时也会把客户端想获取的数据返回,当客户端得到数据后链接就断开,如图2所示。

基于这种方式,当客户端与服务器的链接再次建立后,由客户端主动发送获取离线消息的请求,获取离线消息可以使用HTTP协议。客户端不用发送确认信息,服务器在返回信息后可以直接清除数据库中暂存的数据,同时服务器也不用每次都对新建立的链接做查询操作,这样大大减少了服务器的压力,同时使获取离线消息的过程变得清晰,不会出现消息重复的情况。

1.4 消息并发推送

如果某一时刻发送消息的用户较多,而服务器来不及把消息推送给目标客户端,那么就会造成服务器需要推送的消息越来越多,最终导致服务器消息的阻塞。消息阻塞虽然不会导致消息的丢失,但是会严重影响消息的即时传输,会给用户带来特别不好的使用体验。

为了解决这个问题,在服务器端使用了消息的并发机制。当服务器从客户端接收到一条新的消息后,把消息存放在本地数据库的同时也会把消息存放进一个队列。而在服务器的后台,即时通信系统会根据服务器处理器的使用情况开启若干个线程,每一个线程所做的操作都相同,从队列中取出一个消息,然后根据消息中的目标地址,查询与其是否有通信链接,如果存在则把消息推送给客户端,如果不存在则不做任何处理。这样服务器可以在同一时间推送多条消息,有效地利用了服务器的资源,降低了消息阻塞的可能性。

2 消息的可靠传输

2.1 消息握手协议

为了确保消息在传输过程中不会出现丢失,提出了消息传输的握手协议。握手协议分为客户端给服务器发送消息的握手和服务器给客户端推送消息的握手。握手协议的本质是客户端与服务器端约定的消息传输规则,握手的主要目的就是为了确保消息不会丢失。

(1)正向握手协议

正向握手协议是指客户端向服务器端发送消息时消息的确认协议。客户端需要发送消息时,会先把消息存放在本地数据库中,然后再调用发送消息的接口,存入本地数据库中的消息标记为未发送。如果服务器成功接收到消息,会给客户端返回一个包含了消息ID的反馈信息,表示自己已经接收到消息,客户端接收到反馈信息后,根据ID把本地数据库中的消息标记为已经发送,这样就完成了一次客户端到服务器的握手。如果没有接收到服务器的反馈信息,那么客户端将继续向服务器发送这条消息。

(2)反向握手协议

反向握手协议指的是服务器端向客户端推送消息时消息的确认协议。当服务器接收到客户端的消息后,首先会把消息存在数据库中,然后从消息中解析出接收人的地址信息,然后根据地址信息查找目标客户端与自己是否有通信链接。

2.2 文件传输协议

为了避免使用通信长链接传输文件,提出了文件和文件地址相分离的传输方法,文件存储服务的提供商会提供文件上传的相应接口,客户端通过调用接口,上传文件后,会得到一个文件的网络地址,通过该网络地址用户就可以直接下载文件。

3 高复用架构

3.1 服务器

消息即时传输系统具有高复用性,就不能与应用软件的功能结合,本文提出了单系统双服务的系统架构。单系统指功能完全的应用软件系统,而双服务指为应用软件提供了后台服务的两套服务系统:消息的即时通信系统和数据功能处理系统。这样把消息和软件功能分离后,就可以使消息的即时传输服务在任何应用软件中使用,其功能模块如图3所示。

为了保证消息后台服务器的安全性,本节提出了双服务权限认证的方法。为了叙述简便,把消息后台服务器简称为消息系统,而应用软件的数据处理服务器简称为功能系统,如图4所示。通过这种方式,不仅增加了通信系统的安全性,同时也做到了功能的分离,使即时通信系统的后台通用性更高。

3.2 客户端

客户端和服务器的设计思想类似,单独把即时通信的功能打包封装,仅对外提供数据的操作接口,如图5所示。客户端的即时通信主要包含五个功能:发送建立链接的请求;发送消息;接收消息;发送心跳信息;断开通信链接,用户退出系统时会调用断开通信链接的功能,用于释放服务器的资源。应用程序的客户端添加即时通信的功能包后,只需要根据自己消息格式修改对本地数据库的操作,对外提供的接口不变[10]。

4 系统测试

4.1 测试系统介绍

测试系统的主要功能是用于学校老师、学生家长和学生之间的沟通,为学校管理学生带来便利。同时也包含了即时通信的功能模块,用于用户之间的交流沟通,发送团队公告信息和发送申请加入团队的申请信息。

应用系统在添加即时通信功能时,采用了本文设计的即时通信框架。后台使用了双服务器设计,提供了一个独立的消息系统和一个功能系统,两个系统之间使用同一个权限缓存。消息系统主要负责处理与客户端的消息通信,功能系统使用的是短链接,为客户端提供了获取数据的接口。客户端加入了即时通信包,并按照自己的需求对数据存储格式和数据读取格式做了修改。

服务器的配置是2 GB内存、双核、2.6 GB的主频,2 MB的网络带宽,客户端使用Android系统的手机。把一个客户端叫A,另一个客户端叫B。

4.2 实验结果

测试过程中通过改变客户端的工作状态来模拟用户的各种使用情况。

测试1:参数设置:客户端A、客户端B同时登陆系统,客户端A给客户端B发送消息。测试结果:客户端B能正常接收到客户端A发送的消息。

测试2:参数设置:客户端A、客户端B同时登陆系统,客户端A和客户端B同时给对方发送消息。测试结果:客户端A和客户端B都能正常接收到对方发送的消息。

测试3:参数设置:客户端A登陆系统,向客户端B发送消息。客户端B在客户端A发送消息后,登陆系统。测试结果:客户端A发送消息成功,客户端B正常接收到客户端A发送的消息。

通过用例测试,应用程序中的即时通信功能在很多情况下正常使用,满足了本文对即时通信框架功能的要求。

压力测试中,设置3个测试参数,并发人数、每个客户端共发送消息的条数、每两条消息发送的时间间隔(单位:ms)。对私人聊天、群聊天和发送通知进行了压力测试,消息发送和接收的成功率都在100%。但也有消息发送和接收不到100%,甚至有88%的成功率。通过分析可以发现,当消息发送成功率不高时,客户端的在线人数和发送消息的量普遍偏高,发送消息的频率也较快,而且发送成功率和这几个参数之间还有反比的关系。

因此可以得出结论,当消息发送成功率过低时,可能是受到了服务器硬件资源的限制。因为在线人数过多时,客户端需要和服务器建立的通信长链接较多,如果同时还有多人发送群信息或者公告,那么服务器的资源将被消耗殆尽。因而会有一些通信链接中断或者消息被阻塞。

5 结论

即时通信是网络聊天的核心技术,本文从消息即时传输、消息可靠传输和高复用框架三个方面对现在的即时通信提出了改进方案。文中高性能通信长链接有效地解决了普通通信长链接消耗资源的问题,并且消息传输效果并不会比普通通信长链接差。同时,在通信链接的检测方法中提出了一个更加节约资源的心跳算法。加入了更高效的文件传输,利用第三方文件服务使文件传输更加可靠。然后,基于高复用框架设计了即时通信框架,减少了应用软件开发的周期。最后通过对即时通信系统的功能和性能的测试,充分证明了本文设计的即时通信系统可靠性较高,完成了对即时通信系统的研究。

参考文献

[1]葛福鸿,刘晓莹,张丽萍.基于Socket技术的即时通信软件的设计与实现[J].电脑开发与应用,2011(5):63-65.

[2]剧忻,苗放.基于MINA开发高性能网络应用程序[J].重庆工学院学报(自然科学版),2008,22(10):121-125.

[3]郑志刚.Web服务组合执行引擎Web Jet Flow的改进与优化[D].长沙:湖南师范大学,2008:19-25.

[4]陈航,赵方.基于服务器推送技术和XMPP的Web IM系统实现[J].计算机工程与设计,2012(5):12-15.

[5]ZHOU T,LU Y.Examining mobile instant messaging user loyalty from the perspectives of network externalities and flow experience[J].Computers in human behavior,2011,27(2):883-889.

[6]ZAMAN M,ANANDARAJAN M,DAI Q.Experiencing flow with instant messaging and its facilitating role on creative behaviors[J].Computers in human behavior,2010,26(5):1009-1018.

[7]潘凤,王华军,苗放,等.基于XMPP协议和Openfire的即时通信系统的开发[[J].计算机时代,2011(3):15-19.

[8]吕东,刘小河,王鸿飞,等.基于Android的实时视频通信研究与实现[J].现代电子技术,2014,37(1):25-26.

[9]王志国,侯银涛,石荣刚,等.Android智能手机系统的文件实时监控技术[J].计算机安全,2009(12):55-56.

磁盘阵列高可靠应用技巧 篇4

磁盘阵列技术众所周知,有些人称之为Raid盘,也有些人直接称存储。当然,专业的术语是最为准确的,包括智能存储、在线存储以及各种根据连接方式和规模进行的定义,不一而论。

Raid 的学问

为什么要有Raid 磁盘阵列?以前有人向我提出这个问题,他们说,将磁盘不断扩展,用一个总线或多个总线串接起来,不就成了?我发现,其实磁盘阵列是基于Raid控制器保护起来的磁盘集成,Raid首先是一个安全保障,它将多个磁盘以Raid的保护方式集中起来,通过各种Raid技术,确保一块或多个磁盘故障不会造成任何数据丢失,因此磁盘阵列的可靠性大大高于磁盘自身的可靠性,这当然不是简单集中起磁盘所能比拟的。另外,磁盘阵列通过多通道的磁盘访问技术,提供了磁盘体系的多路访问能力,磁盘访问性能大大提高。随着业务量的增长,我们每天的用户访问量特别频繁,如果没有多路磁盘访问技术,我很难想像,系统能够经得住频繁访问的压力?

在系统的多年运行中,我发现,有效的利用主机与磁盘阵列之间的多路技术以及磁盘阵列的多路冗余技术,能够使我们的系统大大提高抗击干扰的能力,而且,系统能够始终保持良性健康的运行态势,系统保用年限也大大提高。

下面,我以我公司系统所采用的STK D176 全光纤快速磁盘阵列系统为例,对于利用冗余通道提高I/O系统的安全性给出相应的使用技巧。

我的点滴经验

我看到很多信息系统在建设存储网络时,都是采用多台主机分别连接一条光纤通道到磁盘阵列的交换机,然后通过交换机连接多条通道到达磁盘阵列的多个主机端口的方式,这种方式在很多情况下也是可靠的。但是在日常的运行中,由于光纤电缆的脆弱性,很容易造成主机I/O的中断,这时很多人寄希望于高可用系统切换到其他主机上继续I/O操作。这样造成系统十分不稳定,而且往往会发生切换操作的失败。我们利用STK磁盘阵列的RDAC通道冗余的技术,能够有效地避免I/O通道的故障对于系统的冲击,而且还可对I/O系统的故障从容处理,真正实现高可靠性。

设计技巧

我在存储网络的设计中,采用了STK D176磁盘阵列(双控制器)的全冗余通道连接技术(如图1 所示):主机采用双光纤卡,分别连接到2台光纤交换机上,而每台交换机分别连接到STK磁盘阵列的一个主机端口(共8 个端口,我们只使用2个,分别对应一个Raid 控制器)。

STK的磁盘阵列提供了通道冗余的软件RDAC,一旦在I/O 通道的任何环节出现故障,如光纤卡、光纤电缆、交换机及控制器等,RDAC均自动实现控制器的切换操作,使得I/O 操作不发生中断,而且,主机上的应用程序并不会感应到故障的发生(通过故障报警感应),真正做到故障隔离。而故障的处理过程尽可以有序地完成。

操作细节

为了让大家有一个感性认识,现在我介绍一下在使用过程中我们是怎样处理和修复控制器等通道故障的。

1.双控制器故障分担

在磁盘管理软件SYMplicity中,您能够清晰地看到双控制器的分布(Controller A 和Controller B),以及所创建的逻辑单元LUN的分布(如图2)。这2 个控制器内部Cache实现了镜像,并且具有心跳机制。一般说,主机的每条I/O通道分别连接到一个控制器上。为了充分利用2个控制器的能力,将磁盘阵列中的逻辑磁盘LUN最好由2 个磁盘控制器分别控制,如0、2、4 由Controller A 控制,1、3、5 由Controller B 控制。这样,系统的I/O 访问通过双通道进行。一旦出现单侧通道故障,另外一个控制器会接管故障通道的LUN 逻辑磁盘,确保I/O 继续。

正常状态的LUN 分布:

# rdacutil -i sunos1_001

sunos1_001: dual-active

Active controller a(c2t5d0s0) units:

0 2 4

Active controller b(c1t4d0s0) units:

1 3 5

如果系统的一条I/O 通道发生故障,如ControllerA故障,SYMplicity 软件会出现报警,我们通过Manualrecovery界面可以看到Controller A处于Offline状态(如图3)。这时,Controller A 的LUN 0、2、4 全部归属到Controller B 上。

#lad

c1t4d0 1T84710227 LUNS: 0 1 2 3 4 5

表明控制器接管成功。

系统恢复

恢复的过程可以有几种办法: 一种是通过SYMplicity的管理软件进行,这种方法比较直观、简单,管理人员易操作;另一种方法是通过命令行来完成,这种方式稍微复杂一些,要求操作者的能力要强,思路清晰,但这种方式对磁盘系统的恢复成功率很高。

第1 种恢复方法 首先,替换故障光纤(若光纤故障)或插入新的控制器(若原控制器故障);其次,在SYMplicity 的图形界面上,我们选择点击“ControllerA”,选择“Place Online”(如图4)。如果恢复过程顺利,不仅Controller A 恢复了Online 状态,让系统正常运行, 而且原有的所归属的L U N 也会恢复到Controller A 上。

但是在某些情况下,LUN并未进行归位,怎么办?那么我们可以采用第2 种恢复方法。

第2 种恢复方法 首先,仍然是替换故障光纤(若光纤故障)或插入新的控制器(若原控制器故障)。其次,键入如下命令:

#rdacutil -U sunos1_001.b

这时,新的Controller A会被强行置成Online的状态,原归属的LUN 也将陆续回归。

如果发现LUN 的回归失败,则键入下一个命令:

#rdacutil -l 0,2,4 c2t5d0s0

这样,我们就完成了LUN 的归位,一切状态又恢复了正常。

应该说,灵活地运用磁盘阵列的冗余技术,使我们关键数据的访问性能和可靠性大大提高,而且在面临故障时,我们完全不必再惊慌失措。

高可靠性矿用分站的设计 篇5

矿用分站是煤矿安全监控系统中的一个重要部分,它的性能好坏将极大地影响整个系统的稳定性和可靠性。《AQ 6201—2006煤矿安全监控系统通用技术条件》中规定[1]:分站接收来自传感器的信号,并按预先约定的复用方式远距离传送给传输接口,同时,接收来自传输接口的多路复用信号;分站还具有线性校正、超时判别、逻辑运算等简单的数据处理能力,并能处理传感器输入信号和传输接口传输来的信号,控制执行器工作。另外,对于分站采集传感器输入信号部分,在《MT/T 1005—2006矿用分站》中规定[2]:分站应具有模拟量采集功能,模拟量输入信号优选数字信号和频率型模拟信号。目前,现场使用的矿用分站大多只可采集频率型模拟量输入信号,而不能采集数字信号的模拟量输入信号。在煤矿井下的使用过程中发现,频率型模拟量输入信号抗干扰能力较数字信号的模拟量输入信号差。笔者设计的一种高可靠性矿用分站可以解决该问题。

1 矿用分站硬件系统设计

高可靠性矿用分站的工作原理如图1所示,以LPC1754微处理器为核心,由看门狗电路、红外遥控电路、键盘与显示电路、串口扩展电路和RS485数据收发电路等组成。

1.1 LPC1754微处理器

LPC1754是一款Cortex-M3微处理器[3],适用于处理要求高度集成和低功耗的应用领域。ARM Cortex-M3是处理器下一代新生内核,它可提供系统增强型特性,例如现代化调试特性和支持更高级的块集成;其核心是基于哈佛架构的3级流水线内核,该内核集成了分支预测、单周期乘法、硬件除法等众多功能强大的特性;与执行ARM指令的ARM7TDMI-S处理器相比,其效率提高了35%;具有在系统编程(ISP)和在应用编程(IAP)功能的片上FLASH程序存储器,片内集成了128 KB的FLASH ROM、32 KB的SRAM,3个SPI控制器,具有同步、串行、全双工通信和可编程的数据长度,4个UART,带小数波特率发生功能、内部FIFO、DMA支持和RS485支持,4个32位通用定时/计数器,片内看门狗和上电复位电路,4 MHz的内部RC振荡器可在±1%的精度内调整,70个通用I/O(GPIO)管脚,带可配置的上拉/下拉电阻。基于其优越的性能和丰富的配置,本设计采用LPC1754微处理器。

1.2 看门狗电路

煤矿井下环境中的干扰大多是以窄脉冲的形式出现,造成分站出现的故障大多是“死机”、程序“跑飞”或进入“死循环”。为使程序能自动恢复,重新正常工作,一种有效的办法是采用硬件看门狗技术,即不断监视程序循环运行时间,若发现时间超过已知的循环设定时间,则认为系统进入了死循环,然后强迫程序返回到0000H入口,在0000H处安排一段出错处理程序,使系统纳入正轨。本设计中采用的看门狗芯片是美信公司生产的MAX813L,其特点是具有独立的看门狗输出功能[4]:如果看门狗输入在1.6 s内未被触发,其输出将变为高电平;低电平有效的手动复位输入;加电、掉电以及供电电压下降情况下的复位输出。这些功能可以提高分站的抗干扰性能。

1.3 红外遥控电路

常用的红外遥控接收电路多存在电路复杂、易受到干扰而误动作、较大的静态功耗等问题。本设计采用一体化红外接收头HS38B3V,它只需要少量的外围电路即可正常工作[5],可靠性高、抗干扰能力强,非常适合在煤矿井下使用。

1.4 键盘与显示电路

键盘与显示是人机交互的一个窗口,键盘输入部分直接通过按钮与微处理器的I/O相连,按钮共有4个,分别是“上页”、“下页”、“取消”和“确认”。显示部分采用12864的液晶显示屏,循环显示分站所挂接的数字传感器的实时数据和各个开关量的状态。

1.5 单路RS485数据收发电路

常用的RS485数据收发电路由3只隔离光耦、RS485收发器件和隔离电源模块组成,元器件数量较多,占用的PCB面积大,电磁兼容EMC性能差。本设计采用的是ADI公司生产的ADM2582E芯片,它是集成电源隔离、电气隔离、RS485接口芯片和总线保护器件于一体的芯片[6],具有电磁辐射EME极低和电磁抗干扰EMI极高的优点;另外,它具有过热关断特性,能够防止输出短路,并可防止温度过高时因电源的过度损耗而毁坏芯片:当芯片温度高于150℃时,它独有的热关断电路会关断驱动器输出,而当温度回到140℃时,它会自动使能驱动器输出,满足了《GB 3836.1—2000爆炸性气体环境用电气设备第1部分:通用要求》中对于I类电气设备(煤矿用电气设备)的温度要求[7];其隔离电压为2 500 V,输入/输出引脚上提供±15 kV ESD(Electro-static Discharge)保护功能,真正防故障装置的接收输入端,以及大于25 kV/μs的高共模瞬态抑制能力,非常适合在煤矿井下电磁干扰复杂环境中的产品使用。由ADM2582E组成的RS485数据收发电路如图2所示,其中TX1、RX1、RTS1引脚与LPC1754或VK3234的UART相关引脚相连。

1.6 串口扩展电路

目前市场上使用较多的串口扩展芯片是通过微处理器的串行口来扩展串口的,这样就占用了一个微处理器固有的串口。本设计采用的串口扩展芯片是摩托罗拉公司生产的VK3234芯片,它是SPI总线接口的四通道通用异步收发器[8],可独立设置每个子通道串口的波特率、字长、校验格式;采用绿色环保的无铅封装,2.5~5.5 V的宽工作电压范围,具备可配置自动休眠/唤醒功能;只需与微处理器的SPI接口桥接,节省了微处理器固有的串口。LPC1754有3个SPI接口,这样就可以扩展12个串口,再加上LPC1754固有的4个串口,本矿用分站共有16个独立的串行接口,其中,一个串口用于与上位机通信,其余的串口用于连接数字传感器,每个串口可连接的数字传感器的数量最大为64个,这样可以挂接的数字传感器的数量已经远远超出了煤矿现场使用的数字传感器的数量,完全可以满足现场需求。由VK3234组成的串口扩展电路如图3所示,SCS0为SPI片选信号,SCLK0为SPI串行时钟信号,SDIN0为SPI数据输入信号,SDOUT0为SPI数据输出信号,它们与LPC1754的SPI接口相连;TX1~TX4、RX1~RX4、RTS1~RTS4与ADM2582E相连,这样就实现了1个SPI接口扩展4个串口的目的。

1.7 I/O接口电路

在煤矿井下,矿用分站不仅要接收模拟量数字传感器的信号,同时,还要接收开关量传感器的信号和对远动开关等设备发送控制信号,当然,开关量传感器也可通过RS485总线与矿用分站通信。矿用分站与其它开关量设备通信同样采用光耦隔离方式,用于消除两者之间的干扰。

2 矿用分站软件设计

矿用分站软件设计采用C语言模块化设计,各模块之间既相互关联又相互独立,其主要功能是实现对模拟量数字传感器数据和开关量传感器数据的采集、处理、显示及发出控制命令,同时,担负着与上位机通信的任务。矿用分站与传感器通信和矿用分站与上位机通信采用高效、严密的通信协议;在数据采集部分采用了多种滤波方法相互结合的滤波手段;在使用硬件看门狗的同时,使用了微处理器自身带的软件看门狗,增强了程序的健壮性和抗干扰能力。矿用分站软件程序流程如图4所示。

3 结语

针对目前矿用分站在煤矿使用中存在的问题,设计的高可靠性矿用分站采用高集成度和低功耗的LPC1754微处理器、具有SPI接口的串口扩展芯片VK3234将微处理器和RS485接口芯片ADM2582E完美地结合起来。测试结果表明,该分站界面清晰、简洁;参数设置简单、快捷;采用数字传输的方式提高了数据采集的可靠性;通过了《AQ 6201—2006煤矿安全监控系统通用技术条件》中第4.11条规定的抗干扰性能试验,稳定性得到了很大的完善。

参考文献

[1]国家安全生产监督管理总局.AQ 6201—2006煤矿安全监控系统通用技术条件[S].北京:煤炭工业出版社,2006.

[2]中华人民共和国国家发展和改革委员会.MT/T1005—2006矿用分站[S].北京:煤炭工业出版社,2006.

[3]周立功,张华.深入浅出ARM7[M].北京:北京航空航天大学出版社,2005.

[4]张元良,吕艳,王建军.智能仪表设计应用技术及实例[M].北京:机械工业出版社,2008.

[5]唐黎明.高级遥控电风扇的修复[J].电子制作,2008(12):9-10.

[6]何希才.常用集成电路应用实例[M].北京:电子工业出版社,2007.

[7]国家质量技术监督局.GB 3836.1—2000爆炸性环境用电气设备第1部分:通用要求[S].北京:国家标准出版社,2000.

关于高可靠性电价实施方案研究 篇6

1 高可靠性电价的现状

目前, 高可靠性负荷用户为了提高供电可靠性, 必然要采用备用线或备用电源, 对备用线或备用电源收费就使得可靠性负荷的电价水平提高。作为电力市场的支点, 价格是首先应考虑的问题。价格是市场的杠杆, 电价制定原则对电力市场的形成与发展有举足轻重的作用。合理的电价应该兼顾两个方面:在供应侧能反映生产成本, 在需求侧能反映负荷特性。现行电价制度只反映了供应侧成本, 将电力产品视同一品质属性的商品, 而没有考虑到用户的用电特性。高质量的商品其价格自然要比低质量的同类商品高, 这是市场经济的一个基本立足点。不同用户对电能质量的要求是不一样的, 对电能质量要求不同的用户应该支付不同的电价。因此, 应该在用户侧对可靠性不同的电能体现出价格的差异, 而现行电价制度并没有体现出这一点。高可靠性电价在我国许多地区已开始实施。自从取消贴费后, 电力公司的供电成本有一部分不能收回, 所以有些地区直接将贴费计为高可靠性电价来征收, 这种做法的不妥之处在于, 贴费与高可靠性电价所体现的并不是同一项内容。高可靠性负荷用户为了提高供电可靠性, 必然要采用线或备用电源对备用线或备用电源收费就使得高可靠性负荷的电价水平提高。

2 实施高可靠性电价的重要性及其对供用电双方的影响

2.1 由于电能的不可经济储存, 决定了

电能的生产必须与系统负荷要实时匹配。而系统负荷变化的随机性和发、输、配设备故障的随机性, 不可能绝对保证连续不断地供电。电力企业在向用户供电时出现紧急停电、有计划拉闸限电在所难免, 尤其是在电力供不应求的时候更是如此。我国《电力法》明确规定“因供电设施检修, 依法限电或者用户违法用电等原因, 需要中断供电时, 供电企业应当按照国家有关规定事先通知用户。用户对供电企业中断供电有异议的, 可以向电力管理部门投诉, 受理投诉的电力管理部门应当依法处理”。《居民用户家用电器损坏处理办法》也规定了供电企业给居民用户造成损失的赔偿责任。因此, 在我国电价制度中, 反映供电可靠性的电价是十分必要的, 这样用户可选择支付较高的电费获取较高供电可靠性的电能, 让供电企业来承担停电给用户造成的损失, 也可以选择较低可靠性的供电, 少支出电费, 自己承担中断电的损失。

2.2 高可靠性电价的实施对电力公司产

生的影响可以体现在以下两方面, 以上通过收取高可靠性电价使公司的收入有了明显的增加, 从而使企业的利润有了明显的提高;二是对系统供电可靠性负有更大的责任, 因为收取了用户的费用就一定要为用户提供合适的供电可靠性, 否则会造成用户方不满。

2.3 高可靠性电价的实施对用户产生的

影响也可以从两个方面说明:一是用户通过区别供电, 获得其所需的供电可靠性。电力公司按用户用电特点不同, 为其提供不同的供电方式, 从而使不同用户的供电可靠性产生差异, 这样可以在用户之间形成区别供电。这不仅减少了第可靠性用户的用电成本, 同时也可以确保高可靠性用户的供电可靠性, 使用户的利益得以维护。二是用户通过支付高可靠性电价, 获得高水平的供电可靠性, 从而减少了用户的停电损失。

3 用户供电可靠性的影响因素

3.1 供电系统自身的完备程度及其设施

质量的高低是首要的影响因素。系统设计是否合理、完善化程度, 设备是否先进、安装水平的高低以及管理水平的好坏都会直接造成对用户供电可靠性指标的差异。

3.2 用户的用电方式及管理水平和电力

发供用的同时性特点, 使系统可靠性程度受到用户的用电方式管理水平的牵制。比如无规划无预告的增减负荷, 会危及系统稳定, 降低系统的可靠性;能否就地平衡无功, 也会对系统发生影响;类如电气化铁路这类用户出现谐波, 对系统的二次回路及地网产生负面影响, 危及可靠程度等。

3.3 不可抗拒的自然灾害, 如暴风雨、

雪、雷电、洪涝灾害、地震等因素会直接造成供电中断。超常的自然灾害是较难抵御的;正常的自然灾害, 虽属偶然因素但有一定的规律, 制定相应的防范措施, 常备不懈, 积极抢修, 就可以降低其影响程度。

3.4 环境污垢程度增大、盐密度的提高, 对供电系统可靠性是不容忽视的威胁。

3.5 系统设施的计划检修对可靠性指标

的影响较大, 配合协调的状态检修作业与单项计划检修相比, 可以大大减少其影响程度。

3.6 城市电网结构的影响, 表现在有无合理的城网布局、能否灵活地进行负荷转移;

以及联络线的设置、导线截面的正确选择, 都可对可靠性发生影响。

3.7 电源的供给能力涉及两件事:电源点的建设及合理布点和主网架的形成及其实际具备的支撑能力。

4 高可靠性电价收取方式

现阶段, 主要是将为提高可靠性的成本分摊到各个受益用电用户身上。分摊方法有三大类, 一种方法是以基本电价的形式分摊;一种方法是以电度电价的形式分摊;另外一种方法是一部分分摊到电度电价, 一部分分摊到基本电价。高可靠性电价可以理解为输配电价的一种特殊形式, 宜实行两部制输电电价, 一部分回收固定资产的投资, 另一部分是短期电力电量交换效益。但由于短期电力电量交换的不确定性, 难以按电量计算确定输电电价, 因此, 高可靠性电价宜实行单一制容量电价。从用户方考虑, 由于提高了可靠性并没有使用户增加用电量, 只是供电的容量成本提高了, 具体操作时可以在正常的基本电价的基础上再收取可靠性加价部分。

5 高可靠性电价的具体实施方法

电力公司首先要定义高可靠性用户级别。由于用户的受端电压不同, 电力公司为维持同一水平的可靠性为低压用户的投资要比高压用户的高许多, 所以我们还要考虑用户的受端电压等级情况。根据各电压等级下的用户对可靠性要求的不同分为三类, 即一级、二级和三级用户。各电压等级下再分为三个可靠性等级, 分类区间数值可以不同, 因为电压高普遍可靠性要高;可靠性改善度递减, 但最终可靠性价差可均匀相等。

5.1 对于申请临时用电的电力用户, 供

电企业应与用户以合同方式约定临时用电期限, 并按上款标准收取临时接电费用。在合同约定期限内结束临时用电的, 预交的临时接电费用全部腿还用户;超出合同约定期限的, 由供电企业与用户另行约定处置。

5.2 对已收取高可靠性供电费用的用

企业骨干网高可靠性分析与设计 篇7

根据国家标准GB-6583的规定, 产品的可靠性是指:设备在规定的条件下、在规定的时间内完成规定的功能的能力。对于网络系统的可靠性, 除了耐久性外, 还有容错性和可维护性方面, 涉及到网络通信设备、拓扑结构、通信协议等多方面因素。

在网络架构的设计中, 充分保证整网运行的可靠性是基本原则之一。网络系统可靠性设计的核心思想则是, 通过合理的组网结构设计和可靠性特性应用, 保证网络系统具备有效备份、自动检测和快速恢复机制, 同时关注不同类型网络的适应成本。构建可靠的网络, 需要从耐久性、容错性以及可维护性三个方面进行网络规划设计。

2. 高可靠骨干网的典型结构设计

大型企业网通常有较大的地理覆盖范围和较多的网络设备, 根据这些设备所在的位置和其所影响的范围可将它们分别称为核心层设备、汇聚层设备和接入层设备, 如图1所示。在网络的方案设计中, 通常采用层次化的网络设计结构, 不同层次解决不同级别的可靠性要求, 网络层次越高其可靠性要求也越高。

在企业的核心骨干网里, 各网络节点设备都担负着重要的业务, 要进行大量的数据传输和处理, 因此, 对这些设备自身的可靠性有很高的要求。除设备本身的可靠外, 还需要设备之间的热备份, 只有这样才能避免单点故障的存在。

另外, 合理的子网 (VLAN) 划分对整个网络的可靠、安全、性能以及管理有非常重要的影响。根据企业各部门的业务性质不同以及管理的需要, 通常需要把企业网划分为多个VLAN, 即多个逻辑上互相隔离虚拟网络。这些虚拟子网之间必须通过路由功能才能实现彼此之间的通信。

每个虚拟子网都有一个中心交换机, 并通过两条物理链路分别上连到核心交换机上, 用于提高可靠性并实现链路负载均衡。在此基础上还必须正确选择并配置相关协议, 才能使冗余的设备和链路相互配合、协同工作, 真正成为无单点故障的高可靠性网络。图1所示是根据上述分析设计出来的高可靠企业网的一般典型结构。

需要注意的是, 可靠性技术的实施并不是设备和链路的简单叠加和无限制冗余。否则, 一方面会增加网络建设整体成本, 另一方面还会增加管理维护的复杂度, 给网络引入潜在的故障隐患。因此在进行规划时, 应该根据网络结构、网络类型和网络层次, 分析网络业务模型, 确定基础网络拓扑, 明确对网络可靠性最佳的关键节点和链路, 合理规划和部署各种网络高可用技术。

3. 高可靠网络路由协议选择与分析

在高可靠企业网的设计与实现中, 通常要涉及到的3个重要的协议, 分别是:VRRP (Virtual Router Redundancy Protocol) 、OSPF (Open Shortest Path First) 和STP (Spanning Tree Protocol) , 正确选择并配置它们, 是高可靠性网络设计的重要组成部分。

3.1 VRRP协议

虚拟路由器冗余协议VRRP[1]是一种容错协议, 可以保证当主机的下一跳路由器失效时, 及时的由另一台路由器来替代, 从而保持通信的不间断性。VRRP的应用实际上是对网络可靠性和安全性要求的一种体现。

VRRP的运行是以路由器为基础, 为了使VRRP工作, 需要在路由器上配置虚拟路由器号和虚拟IP地址, 同时产生一个虚拟MAC地址, 这样在这个网络中就加入了一个虚拟路由器。对于运行在三层交换机上的VRRP, 与路由器上的VRRP并没有本质的区别, 因为虚拟IP和虚拟MAC地址是和网络接口绑定在一起的。

V R R P将网络中的一组路由器组织成一个虚拟路由器, 称之为一个备份组。其中仅有一台设备处于活动状态, 称为主用设备 (Master) , 其余设备都处于备份状态, 并随时按照优先级高低做好接替任务的准备, 称为备份设备 (Backup) 。

如图2所示, 路由器Ra、Rb和Rc组成了一个备份组, 一个备份组相当于一台虚拟路由器, 虚拟IP为192.168.16.1。备份组内Ra充当Master设备, IP地址为192.168.16.2;Rb和Rc都充当Backup设备, IP地址分别为192.168.16.3和192.168.16.4。对于VRRP而言, 只有Master设备才能转发以虚拟IP为下一跳的报文。

内部网络中的所有主机仅仅知道该虚拟IP为192.168.16.1, 而并不知道具体的主用或备用设备的IP, 因此各主机都将缺省网关配置为该虚拟IP地址。于是, 内部网络中的各主机就通过该备份组与外部网络进行通信。

Master路由器的VRRP模块监视通信接口状态, 并通过组播方式向Backup路由器发送通告报文。如果Master路由器故障或链路出现问题, 则会导致无法正常发送VRRP通告报文。当Backup路由器在指定时间内收不到VRRP通告时, 备份组内的其它Backup路由器将会根据优先级高低选出一个路由器充当新的Master, 继续向网络内的主机提供路由服务。因此, 采用VRRP技术可以实现内部网络中的主机不间断地与外部网络进行通信, 提高了网络的可靠性与安全性。

在高可靠网络设计方案中, 可以采用两台路由交换机S6810组成双核心, 作为整个网络的核心, 如图1所示。从位置上看, 这两台设备刚好位于整个网络的中心, 因此还应充分发挥它们数据中转的能力。为此, 需要定义两个VRRP组, 在不同的组里面, 两个设备分别为Master和Backup。这样, 在正常情况下, 两台设备都可以进行数据包的转发, 一个出故障时还有一台在转发, 既实现了容错又实现了负载的均衡, 充分发挥了核心数据中转的能力, 提高了子网之间访问的速度。

3.2 OSPF协议

OSPF是网间工程任务组织 (IETF) 的内部网关协议工作组为IP网络而开发的一种动态路由协议。动态路由是指网络中的路由器之间周期性的相互传递路由信息, 重新计算路由, 更新路由表以适应网络结构的变化。对于规模大、网络拓扑复杂的校园网来说, 采用动态路由协议能在关键链路或设备不能正常工作时, 实现自动切换, 保证网络的畅通。

根据是否在一个自治域内部 (AS) 使用, 动态路由协议[2]分为内部网关协议 (IGP) 和外部网关协议 (EGP) 。这里的自治域指一个具有统一管理机构、统一路由策略的网络。自治域内部采用的路由选择协议称为内部网关协议, 常用的有RIP (Routing Information Protocols, 路由信息协议) 、OSPF;外部网关协议主要用于多个自治域之间的路由选择, 常用的是BGP (Border Gateway Protocol, 边界网关协议) 和BGP-4。

RIP协议[2, 3]最初是为Xerox网络系统的Xerox Parc通用协议而设计的, 是Internet中常用的路由协议。RIP协议根据距离选择路由, 一条路由有15跳 (网关或路由器) 的限制, 如果一个RIP网络路由跨越超过15跳, 则标记为不可到达, 再加上不支持可变长度子网掩码 (VLSM) , 使得RIP只适用于小型网络。80年代中期, RIP已经不能适应大规模异构网络的互连, OSPF随之产生, 目前广为使用的OSPF为第二版, 最新标准为RFC 2328[4]。

OSPF是一种基于链路状态的路由协议, 需要每个路由器向其同一管理域的所有其它路由器发送链路状态广播信息。在OSPF的链路状态广播中包括所有接口信息、所有的量度和其它一些变量。利用OSPF的路由器首先必须收集有关的链路状态信息, 并根据一定的算法计算出到每个节点的最短路径。而基于距离向量的路由协议仅向其邻接路由器发送有关路由更新信息。

与RIP不同, OSPF将一个自治域再划分为区, 相应地即有两种类型的路由选择方式:源和目的地在同一区时, 采用区内路由选择;当源主机和目标主机在不同区时, 则采用区间路由选择。当一个区内的路由器出了故障时并不影响其它区内路由器的工作, 这给网络的管理、维护带来方便。OSPF协议的这种分层模式更能适应校园网的拓扑结构。同时OSPF在路由广播时采用了授权机制, 保证了网络安全。

相对于动态路由, 静态路由是在路由器中设置的固定的路由表, 除非网络管理员干预, 否则静态路由不会发生变化。静态路由的优点是简单、高效, 在所有的路由中, 静态路由优先级最高, 当动态路由与静态路由发生冲突时, 以静态路由为准。一个分组在路由器中进行寻径时, 路由器首先查找静态路由然后转发, 否则再查找动态路由。静态路由不能对网络的改变作出反映, 一般用于网络规模不大、拓扑结构相对固定的网络中, 在规模大的网络中静态路由通常可以作为动态路由的补充。

因此, 在高可靠网络设计中, 骨干网要选择OSPF作为路由协议, 出口则可以选择采用静态路由指向外网。

3.3 STP协议

提高链路的可靠性往往通过链路的冗余设计来实现, 目前最流行的技术是链路聚合技术和生成树技术。

对二层以太网来说, 两个LAN间只能有一条活动着的通路, 否则就会产生广播风暴。但是为了加强一个局域网的可靠性和安全性, 建立冗余链路又是必要的, 其中的一些链路必须处于备份状态。当活动链路失效时, 就可以选一条冗余链路提升为活动状态。STP协议是用来避免因链路成环产生的广播风暴、并提供链路冗余备份的协议。STP协议[3]可以自动的完成这项工作, 它使局域网中的交换机可以重新学习变化后的网络拓朴, 自己发现故障并随之进行恢复。

最早的生成树协议 (STP) ——IEEE802.1d规定可在50s内恢复连接。但是随着视频和语音应用的要求, 网络必须具有更快的自恢复能力, 因而IEEE随后又开发了802.1w定义的快速生成树协议 (RSTP) , 以及802.1s定义的多路生成树协议 (MST) 。

RSTP协议完全向上兼容802.1d STP协议, 除了和传统的STP协议一样具有避免回路、提供冗余链路的功能外, 最主要的特点就是快。如果一个局域网内的网桥都支持RSTP协议, 一旦网络拓朴发生改变需要重新生成路由的话, 只需要不超过1秒的时间。

MSTP是在STP、RSTP的基础上发展而来的新的生成树协议, 本身就包含了RSTP的快速FORWARDING机制。传统的生成树协议与VLAN没有任何联系, 在某些情况下会使交换机同一VLAN下的端口不能通信。因此, 高可靠网络设计中要选择支持MSTP的设备, 以实现通信线路故障后的快速修复。

同时, 在两个核心路由交换机之间, 还要采用链路聚合技术提高传输带宽并实现容错。这种技术, 相当于将两条低带宽的链路合并成一条高带宽的链路, 所有数据根据链路的负载情况随机地分配到两条链路上并行传输提高了速度, 当其中一条链路不通时, 所有的数据还可以自动选择另一条链路。

4. 结语

企业的骨干网是其承载业务, 以及经营流程的核心基础, 如果没有一个高度可靠的网络, 各项业务将无法顺利开展。通过对路由器、交换机以及通信链路的冗余设计, 配合相应的备份路由协议 (SPT、OSPF、VRRP等) 技术, 消除网络中的单点故障, 可以建立一个高可靠、高速度的企业骨干网。

在网络可靠性规划实施时, 应在保证网络各层次可靠性要求的基础上, 尽量降低复杂度, 适度地控制成本。不能为追求单纯可靠性而忽视系统的整体成本和性能, 构建可靠性网络是一个平衡各方面因素的过程。所以对于网络可靠性, 没有最好的方案, 只有最合适的方案。

参考文献

[1]锐捷.S6800系列交换机软件配置指南[DB/OL].锐捷网络, 2010.

[2]华为.Quidway Net Engine80核心路由器操作手册IP分册[DB/OL].IXPUB技术社区, 2010.

[3]刘有珠, 罗少彬.计算机网络技术基础[M].清华大学出版, 2007:141-146.

高可靠性失电制动进给箱设计 篇8

我国立式加工中心、数控立式车床、数控龙门镗铣床、数控龙门移动式镗铣床垂直刀架滑枕的Z轴进给箱和横梁升降W轴进给箱中, 一般使用滚珠丝杠、齿轮齿条驱动滑枕、横梁作进给运动, 由于滚珠丝杠、齿轮齿条传动结构不能自锁, 滑枕、横梁在机器控制故障意外切断驱动电源或断电情况由于自身重力的作用下向下产生滑落, 为了克服滑枕、横梁自身的重力, 进给箱一般选用带抱闸型伺服电机进行制动, 在机床断电时, 带抱闸型的伺服电机制动滑枕、横梁, 但是, 当伺服电机发生故障时, 将会导致滑枕、横梁滑落事故。

为了克服上述不足, 研制了一种高可靠性失电制动进给箱, 该进给箱具有制动扭矩大、可靠性高、安全性好的特点, 在伺服电机发生故障时, 该进给箱仍能安全、可靠地对垂直进给部件进行制动。

2 高可靠性失电制动进给箱结构介绍

高可靠性失电制动进给箱包括:伺服电机、失电制动保护器、电机轴齿轮、大齿轮、进给箱体、滚珠丝杠、横梁、滚珠丝杠螺母。其中伺服电机与电机轴齿轮通过键连接, 电机轴齿轮与大齿轮降速啮合传动, 大齿轮与滚珠丝杠通过键连接, 整个传动机构通过进给箱体与立柱固定连接。

失电制动保护器选用意大利泰普利公司的KF8/D型制动器, 制动原理如下:

如图1, 失电制动器组件由固定螺丝9把合安装在机床立柱顶面, 花键套5与横梁垂直进给滚珠丝杠通过单键连接。机床工作状态时, 失电制动保护器通电, 线圈7通电后伸长, 电磁体1与电枢端板2出现间隙, 扭矩弹簧3达到自由状态, 当机床突然断电, 线圈7断电后缩短, 扭矩弹簧3压缩后产生弹力作用于电枢端板2上, 通过压力摩擦制动摩擦圆盘4及花键套5, 从而实现制动功能。

1.电磁体2.电枢端板3.扭矩弹簧4.摩擦圆盘5.花键套6.密封圈7.线圈8.调整螺母9.固定螺丝

高可靠性失电制动进给箱在机床正常工作时, 失电制动保护器不制动, 伺服电机驱动电机轴齿轮转动, 电机轴齿轮与大齿轮啮合传动, 大齿轮转动带动滚珠丝杠转动, 并带动滚珠丝杠螺母实现横梁上、下进给运动。

高可靠性失电制动进给箱在机床断电时, 伺服电机和失电制动保护器同时制动横梁, 一方面伺服电机制动, 从而通过电机轴齿轮与大齿轮使滚珠丝杠制动, 相应地使滚珠丝杠螺母、横梁制动;另一方面失电制动保护器断电制动, 直接使滚珠丝杠制动, 相应地使滚珠丝杠螺母、横梁制动。因此, 在伺服电机发生故障的情况下, 失电制动保护器能够独立制动横梁, 有效地防止了横梁滑落事故的发生。

3 高可靠性失电制动进给箱制动扭矩校核

式中:M为制动器制动扭矩, Nm;F为制动负载重量, N;i为降速比;a为安全系数 (大型机床a=1.2~1.3) ;η为效率 (直连传动方式可取η=0.9) 。当横梁重量G1=7500kg, 刀架重量G2=4500kg时, F=G1g+G2g=7500×9.8+4500×9.8=117600。

1.伺服电机2.失电制动保护器3.电机轴齿轮4.大齿轮5.进给箱体6.滚珠丝杠7.横梁8.滚珠丝杠螺母

本产品横梁进给采用双丝杠驱动, 因此配有两套失电制动器。

单套制动器制动扭矩能力为300N·m, 双套制动器制动扭矩共为300×2=600N·m, 大于负载扭矩, 因此满足横梁进给制动要求。

4 高可靠性失电制动进给箱优点

如图2, 高可靠性失电制动进给箱可在未安装电机的情况下, 任意位置抱住轴, 方便机床安装调试。即使在频繁紧急停机制动后仍可维持较长的使用寿命。密封的刹车壳体能有效防止冷却液和润滑液的渗透。反应时间短且制动性能高, 可实现小距离的制动。

高可靠性网络 篇9

【关键词】网络时代;网络安全;可靠性;对策

引言:网络时代提升计算机网络可靠性意义重大,随着计算机技术的高速发展,黑客技术也在不断的更新,网络安全关系着计算机用户的信息安全和财产安全。并且对企业来说网络安全更加重要,很多企业的计算机数据中都可能包含着很多的商业机密,商业机密的泄漏不仅会给企业造成巨大的经济损失,更可能造成社会不良影响。网络时代提升计算机网络可靠性对策迫在眉睫,实现保障计算机系统运行稳定、安全、通畅、可靠。

一、网络时代提升计算机网络安全的重要性

随着计算机的推广和普及,计算机网络用户越来越多,几乎可以说城市家庭几乎每家都拥有一台计算机,计算机网络可靠性、安全性成为了二十一世纪热门课题。计算机网络可靠性是计算机网络建设的基础和发展的关键,如果无法保证计算机网络的可靠性,那么用户将对计算机网络失去信心,最终制约计算机网络发展,不仅会给经济发展和社会建设造成不良影响,也会给用户财产造成威胁。计算机网络可靠性,必须从多方面考虑,实现真实有效的提升计算机网络可靠性。计算机网络为人们带来了信息时代,在这个时代,信息就是财富,目前计算机网络和信息技术已经成为经济建设中的中重要组成部分。计算机网络的出现,改革了人们的工作方式及生活方式,实现了无纸化办公,足不出户购物,自动化、智能化生产等等,提升计算机网络安全至关重要。另一方面,计算机为人类社会带来了深刻改变,网络业务的增多,人们对电子银行、电子商务和电子商城的广泛应用,计算机网络安全问题更不能小视。并且计算机网络可靠性不仅直接影响着国计民生,更重要的是网络安全与国家信息安全密切相关,不仅涉及到国家政治、军事和经济各个方面,而且影响到国家的安全和主权。随着计算机网络的广泛应用,计算机网络安全的重要性日益突出。

二、网络时代计算机网络安全现状

(一)人们对计算机网络安全不够重视

通过调查得知,很多个人及企业的计算机网络中并没有安装任何防护软件或杀毒软件,并没有深层的网络安全意识。造成这种现象的主要原因是,计算机用户对计算机网络安全并重视度不够,对计算机网络安全并没有深刻的认识,所以忽视了建立计算机网络安全策略,这将给计算机用户的计算机网络安全造成了很大的隐患[1]。

(二)计算机用户缺乏计算机网络安全知识

经过调查发现,很多计算机用户并不知道计算机病毒和网络攻击的存在,因此也就不懂得网络安全防护。这是因为很多用户缺乏计算机网络安全知识,单纯的认为计算机是安全的[2]。

(三)缺少计算机网络安全防范措施

计算机网络离不开计算机及互联网为基础支持,但是互联网不是封闭的,它连接着整个世界的信息资源,具有较强的开放性。但目前计算机病毒、網络黑客日益猖獗,信息截取、盗取事件时有发生,所以难免给网络安全造成威胁。经过调查发现,一些计算机用户在传递信息文件和使用计算机时,缺乏加密和权限管理,因此随时可能被黑客截取或篡改[3]。

(四)缺少有效的防护软件

计算机网络安全概念源自西方国家,我国计算机网络建设起步较晚,因此安全理论知识比较滞后,虽然也有一些安全软件被陆续开发出来,如:360安全卫士、百度安全卫士、瑞星安全等等,但这些软件都或多或少存在问题和隐患,甚至有着流氓软件的嫌疑,通过实践,一些杀毒软件和安全软件不但不能起到防护作用,更会窃取网络中的信息、散播病毒,以此来谋取利益。

三、网络时代提升计算机网络可靠性的对策

随着时代的进步,人们知识水平的提高及计算机的普及,我国在计算机网络安全方面已经取得了一定成绩,网络安全事件依然时有发生,网络安全问题不可避免,网络安全必须引起重视,下面通过几点来分析网络时代提升计算机网络可靠性的对策。

(一)提高对计算机网络安全的重视,更新观念

保护自己的计算机网络安全就是保护自己的财产和信息,提升计算机网络的可靠性,必须更新思想观念,接受网络时代带来的新鲜事物,正确认识计算机网络安全问题,提高对计算机网络安全的重视度。对计算机网络安全的中式,是提高网络安全可靠性的关键,只有提高了重视,才能将网络安全问题落到实处。

(二)完善计算机网络安全措施

对于计算机网络来说,网络安全是关键,安全问题关系着整个计算机网络系统的稳定性和可靠性,甚至关系着用户自身利益。如果没有相应的安全措施,那无疑会给用户造成巨大的损失。所以为了保障计算机网络安全,必须对网络传输通道进行动态加密处理,经常更换密码,并设置访问权限,利用验证码、密码、数字签名手段来验证对付身份,提高计算机网络安全可靠性。另一方面,必须安装可靠的安全防护软件强化计算机网络可靠性。

(三)制定计算机网络安全计划

想要提高计算机网络安全必须制定相关的计算机网络安全策略计划。盲目的安装防护软件,不仅仅会造成系统不稳定,甚至可能导致流氓软件捆绑到计算机网络内的现象,计算机网络防护要科学,有针对性,根据网络使用情况,及计算机使用情况来判断进行什么的计算机网络安全计划。

(四)定期进行计算机安全维护

计算机在使用中会产生一定的无用软件垃圾,并且随着软件的安装,一些软件的漏洞就会被病毒利用,想要提高计算机网络的可靠性必须进行定期的安全维护,建立一个良好计算机网络安全维护习惯,定期卸载一些几乎用不到或不常用的计算机软件,定期更好网络密码,定期更新安全软件。

结束语:通过以上分析不难看在网络时代提升计算机网络可靠性的重要性,只有安全可靠的计算机网络,才能满足网络时代的发展需求,缺乏安全的计算机网络将制约网络时代的发展和进步。由于我国网络建设起步较晚,其中依然存在着许许多多的问题,我国计算机网络安全建设将是一个漫长的过程。

参考文献:

[1]徐梅玉.计算机网络信息安全保障建设探讨[J].湖北工商学院,2012,13(11):119-124.

[2]李力旺.计算机系统信息安全保障体系的构建研究[J].浙江经济学院,2011,11(14):132-136.

高可靠性网络 篇10

在“2008下一代数据中心国际峰会”上, 来自IBM、艾默生、微软、Novell、英特尔、戴尔、Avocent、NEC、力登、VMware等全球专业厂商的代表携数据中心领域最新理念和解决方案出席了峰会。这次会议讨论的主要议题集中在数据中心的虚拟化、如何建设绿色数据中心和数据中心的远程灾备等方面, 这些问题的关键就是如何建设一个高效安全的数据中心机房。

数据中心机房的高可靠性建设往往只注重利用计算机技术、网络技术来实现网络层的可靠性, 而忽略了基建、供电、消防、环保、制冷等方面的影响, 其中任何一个环节都有可能会导致系统瘫痪甚至数据丢失, 因此, 数据中心机房从规划、设计、建设到设备的安装、调试、运维都必须遵守行业的规范标准, 以满足数据中心在科学、经济、安全、可靠、绿色、环保等方面的要求。本文以某职业技术学院数据中心机房建设为例, 从选址布局、供电整合、消防安保、机房防雷、远程灾备、绿色数据中心、制度建设等方面探讨如何建设高可靠性数据中心机房。

1 数据中心机房的选址与布局

数据中心一般位于一个企业经济、文化或资源相对集中的位置。例如选择跨国企业的研发中心、企业总部等作为数据中心, 这样便于集中管理, 维护方便, 从安全的角度也更容易得到保障。对于网络运营商级的企业, 则可多地区布置网状的数据中心, 他们之间实现实时备份, 确保主干网的可靠运行。对范围较小的局域网用户, 可选择相对中心的位置, 这样从布线的成本运行维护方便。在地形地质比较复杂的地区, 网络中心机房要避开雷区、汛区和山区, 防止自然灾害引发的灾难性后果, 从而导致数据丢失。

2 数据中心虚拟化

所谓虚拟化, 就是将相同的设备进行合并, 它包括服务器的虚拟化、网络的虚拟化、存储设备的虚拟化等。

对于服务器的虚拟化, 需要把大量的、低端的、使用率较低的服务器上运行的应用程序, 整合到少量的高端服务器上, 从而提高服务器的使用效率, 同时又能降低能耗。通过虚拟化存储可以把数据跟存储划分开, 对用户而言, 不必知道自己数据存放的具体位置, 只需要掌握内容的变化, 以及如何管理, 最终实现对数据存储的动态配置和负载均衡目的。虚拟化可以提高IT设备的使用率, 尤其是服务器和存储设备。对于最终用户来讲, 虚拟的资源跟原先真实的资源是一样的, 同样的界面、同样的功能, 只是属性和方式变化了, 变得更容易扩展。

3 数据中心消防与安保

按照《建筑设计防火规范》、《火灾自动报警系统设计规范》和《电子计算机机房设计规范》等的有关规定, 安装必要的消防器材和消防设备, 如建造消防水池、安装火灾报警系统、室内消火栓, 在重要区域加装光电感应探测器、感温探测器、组合控制器等。另外要加强灭火实战演练和日常巡查当地消防部队或单位消防部门应加强数据中心机房的灭火演练, 熟悉建筑物内部构造及消防设施布置点, 发生火灾时能快速处置和有序疏散, 尽量降低灾害的损失。

4 机房防雷与放静电

雷电按照作用机理可划分为直接雷和感应雷两种, 直接雷指的是云层直接通过人体、建筑物或设备等对地放电而产生的电效应、热效应和机械力效应。其强大的电流会导致机房设备的烧毁, 人员伤亡等。感应雷是由于雷云的静电感应或放电时的电磁感应作用, 使建筑物上的金属物体感应出与雷云相反的一种电荷, 这种电荷对电子、电气设备的干扰和损伤效应。

为确保数据中心机房内各类设备不受雷击损害, 采用综合防雷措施, 力争将雷击损害降低到最低程度。

5 绿色数据中心建设

所谓绿色数据中心, 一方面指的是在数据中心建设中不使用对人体有害的物质, 这就要求在建筑设计、计算机、服务架构设计时选择无毒无害物质和绿色材料并通过屏蔽和隔音尽可能降低噪音, 即最小化环境影响;另一方面要求数据中心的机械、照明、电气和计算机系统要有最大化能源效率。

前者实现并不难, 而后者所谓的能耗又与系统性能密不可分, 性能越高所消耗的能源也就越多, 降低能耗的同时不允许降低系统性能。因此, 必须找准耗电量和设备的性能之间的最佳平衡点, 才可能实现真正意义上的绿色。

展望未来, 绿色数据中心具有以下两个特点: (1) 色数据中心内的照明、冷却、机械、电力和计算机系统被设计成最节能的模式, 能比以往的数据中心节省50%到80%的能耗。如借助风能和太阳能等可再生资源来补充电能的不足;利用广电热泵和蒸发冷却等节能技术来有效节约能源;数据中心选址位于水力发电资源的地方, 这样就可以节省下大笔的能源成本。 (2) 绿色数据中心的备份发生器上安装了催化式排气净化系统 (Catalytic Converter) 来减少二氧化碳排放量, 使得数据中心对环境的破坏程度降到最低。

6 数据中心的灾备

灾难备份指的是信息系统在各类风险的威胁下, 其强壮性和抗击风险的能力, 它直接决定了企业甚至该行业的生存能力, 成为服务水准的基本保障。它的主要表现形式为两个方面:一是保证企业数据的安全, 二是保证业务的连续性。灾备技术最为重要的一个步骤就是通过网络, 将本地数据复制到远程保存。在复杂的IT架构下, 要想成功实现并不容易。以往主要有主机型和存储型两大类容灾方式, 今后有可能出现具有更强能力的存储网络型的虚拟化容灾方式, 使得容灾的技术手段更加丰富, 如现在流行的CDP连续备份技术就是使容灾和备份两大不同的体系开始走向融合, 另外还有VTL、重复数据删除、电子发现、存储生命周期管理等。

7 数据中心机房制度建设

确保各类硬件设备正确高效运行, 离不开完善的管理制度, 对于系统要害部位的数据中心机房更应如此。包括人员出入制度、清洁卫生制度、设备操作制度、机房运行管理、数据备份制度等。另外可根据本单位的具体实际制定出详细具体的操作细则。

8 结语

网络中心机房建设是一项系统工程, 涉及基础建设、供电安全、计算机技术、网络新技术、制冷技术、消防、绿色环保、管理制度等多方面技术, 只有综合以上各类因素, 才能确保建设高可靠性的现代数据中心机房, 以确保系统的长期稳定运行。

摘要:文章从数据中心机房的规划、设计、建设过程中涉及到的选址布局、供电、消防安保、机房防雷、远程灾备、绿色数据中心、制度建设等方面阐述如何建设具有高可靠性的数据中心机房, 并对关键技术加以探讨。

关键词:数据中心机房,可靠性

参考文献

[1]电子计算机机房设计规范[M].北京:国家标准出版社, 1993.

[2]王达光, 甘井中, 莫礼健, 李丁.高校网络中心机房建设研究[J].中国现代教育装备, 2009, 1:71.

上一篇:凤凰涅磐下一篇:方向引导