群集设计

2024-09-07

群集设计(共7篇)

群集设计 篇1

水电站的存在能够极大的改善一些地区的居民生活和企业发展程度, 尤其是在一些偏远的山区, 在同一个区域内部, 含有多个小型水电站, 这给当地的发展带来了积极的影响, 但是, 与此同时, 还出现了很多管理上的问题, 因此对这些群集性小水电站的管理与监控已经成为水电部门要解决的重大问题。本文对群集性小水电站集控系统模式的设计和应用进行分析和讨论。

一、有关集控系统的分析

在一定的区域内, 如果存在多个小型水电站, 那么就需要对这些水电站进行集体的控制和管理。区域水电站需要按照统一的管理原则进行优化设计, 能够使这些小型水电站在调控上实现一体化, 可以通过遥控、遥信、遥调以及遥测进行各个接入口位置和平台的设计。在这些设备的控制上主要采用计算机网络连接系统, 这样可以对整个区域中的水电站进行监督。目前计算机科学技术得到了迅猛的发展, 这使得集控系统与计算机之间实现了真正意义上的联网, 对各个水电站所运行的状态以及运行的参数进行了解, 由此, 管理人员和对设备运行进行负责的人员, 可以及时的掌握水电站的运行状况。计算机网络不仅要与水电站的总机联系, 还要个各个级别的分系统进行连接, 接受总机的调度和管理, 规范运行。以上这些做法能够对水电站的负荷进行合理的分配, 以此来使区域的水文电力情况得到优化。提高水电站的经济效益, 对此区域内部的综合治理提供便利条件。

集控系统所使用的计算机软件应该更具模块化, 优化各方面的结构设计, 这样系统在进入工作状态以后可以有能力进行规模化的扩充, 遇到系统问题能够进行自我诊断。若计算机集控系统某一部分出现问题, 那么该系统可以保持正常的工作状态, 若要提供集控系统的访问, 就要对外部的接口和网络发布功能进行丰富配置。

二、集控系统的设计原则

集控系统的设计原则是为了保障集控系统能够正常的进行运行。具体原则主要有以下几个方面:

第一, 系统接受调度命令的设计。接受命令才能对水电站进行监督和控制。在总集控中心向各个分中心发送指令, 便可以实现远程遥控和遥测等, 这对于水电站的优化和管理都有促进作用。第二, 阶梯中心需要向上级系统提供相关参数和信息等数据, 然后接受调度机构的各种命令, 实现数据间的传输和通信。第三, 实现集控中心的电网调度AGC和AVC命令, 并把这些命令传达给LCU。第四, 要严格的落实国家关于水电站集控的各项安全防护规定, 并且集控系统还要支持各软件的开发和应用, 若第三方软件存在也能够进行可靠的运行, 完成通信。第五, 系统的运行必须安全可靠, 及时的清楚一些冗杂部分和系统垃圾, 以免发生故障影响系统的运行。除上述原则以外, 还要注意系统的容错设计、系统硬件软件的的使用、抗干扰性和投资原则等。

三、区域小水电站群集控结构

(一) 结构分析

集控中心为了提升自动化, 减少人员设置, 一般按照无人值班的设置原则进行总体方案的研究。在各个小水电站和集控中心处, 选择计算机监控系统进行全面的监督和管理, 另外引进高科技的软件和硬件武装系统。此集控系统的稳定安全运行能够提升水电站的运行状态, 利用一些冗余技术和全面分布式的系统结构可以使集控系统更加安全、实用、可靠和经济。集控中心是由计算机监控系统、水电站的远程控制中心共同构成的, 使用开放的分层结构对水电站的运行状态和各种数据进行监督控制。本文所讨论的系统采用IEEE802.3设计方案, 使用分层新样式的快速交换式以太网。

(二) 网络结构分析

水电站流域的主干层, 在集控中心的传输速度设定为100M;厂站层:该层主要负责对水电站进行监督和控制, 需要利用100M的网络与现地层进行连接, 所选网络为光纤星形网。现地层就是对现场设备进行控制的层, 利用大网进行连接。在调度层, 要选择较为专业的通讯数据网完成连接。在区域水电站的集控系统中, 交换机是控制整个网络的核心部分, 它主要与其他交换机进行联络, 然后形成较大的一个星形状的网络。在集控系统中, 上位机要连接网络然后实现对水电站中LCU的控制, 这样流域的运行能够被更加全面的遥控遥测, 提升水电站的经济运行和调度功能。这样能够在很大程度上矫情水电站的数据传输, 以免集控中心的数据传输被上机系统所干扰。与此同时, 在区域水电站的集控中心, 计算机网络所监视的到的数据要与其所在的上一级调度进行数据通信才能完成每一个级别的调度机构所需要的水电站信息的传输。

四、集控系统的配置

(一) 硬件配置

在集控系统的硬件配置方面需要两台以上的主机, 一般采用的是惠普品牌主机, 它具有比较高的性能, 且能够完成多任务工作站的建构。此硬件设置的功能是对数据进行实时的采集和处理, 并且把这些数据想通讯站报告。两台主机主要是对集控中心各个部分的电站进行监督和管理, 通过AGC计算和处理对水电站情况进行反应, 同时还能对故障进行分析, 一些小故障可以进行自我修复。

配置需要通信服务器、web服务器以及GPS系统和打印机。打印机选择黑白激光的, 然后完成各项打印任务。GPS系统需要对串口进行监控以使其能够与服务器的时钟同步。Web服务器, 需要对监控系统进行安全检测, 保障安全的基础上设置隔离装置, 与外网进行连接, 这样, 授权对象就可以通过计算机网络浏览器对水电站的运行情况进行了解。通信服务器的存在, 是用于实现调度和集控之间的通讯, 一般在节省成本的情况下, 服务器还要设置与其水电站的通信结构。

(二) 集控系统的控制

区域性的水电站, 需要进行统一的管理和操控。按照现地优先的原则, 对一些控制权限进行设定。在水电站集控系统正常运行的情况下, 集控中心需要对所有的分系统进行远方控制和监督。如果梯级的控制中心和水电站之间出现通讯故障或设备遇到检修, 则需要把电站的控制权力转移到电厂。一般按照“选择-确认和执行”的方式进行, 这样每一个步骤的软件都需要进行校验, 发现错位及时的关闭该系统的逻辑功能, 以免硬件发生损坏。

结语

随着国家经济的不断发展, 水电站发挥的作用越来越大, 因此对一定区域内部的水电站进行集体监控和管理能够更好的促进水电站经济效益的提升, 集控系统随着计算机科学技术的进步已经日臻完善, 但是还要进一步努力去研究出更完善的系统, 创造无人值班和无人控制式的集控系统, 提升水电站管理的自动化水平, 促进区域的经济发展和国家的经济发展。

摘要:随着我国经济的快速发展, 社会各企业事业单位都在不断的进行改革, 以能够适应现代科学技术的发展。随着国家信息化的加强, 企业的发展也开始面向自动化。水电是人们生活和社会发展之间不可或缺的必备项目之一, 一些大小型水电站都在进行改革创新, 促进自身安全的提升, 不断提高区域小水电群集控系统对水电站的监督和控制, 这样可以不断优化我国小水电展的发展, 从而促进人民生活和国家经济的发展。

关键词:区域,小水电站,群集控,设计

参考文献

[1]郑舒天.小水电站群智能调度系统的研究与实现[D].浙江工业大学, 2014.

基于群集的网络教学资源库设计 篇2

教学资源库指广义的资源库概念,它不仅包括教学资源存储功能,而且包括教学资源管理、教学资源访问、教学资源评价等功能,即广义上的教学资源共享和管理系统[1]。

目前网络教学资源库多采用传统的B/S三层体系结构,包括表示层、业务层和数据层三个部分;其主要事务是在服务器端发生,极少部分事务在前端实现;数据多采用集中存储和集中管理的模式。随着教学资源的增加以及资源需求服务的不断增长,教学资源库逐渐暴露出以下几方面的不足:

(1)负载不均。

目前多数教学资源管理采用的模式是集中存储与管理。在教学资源库中多媒体素材以视频素材居多,数据流量大;校园网中数据访问时间相对集中,容易造成服务器负载不均,出现数据访问瓶颈。

(2)数据与业务耦合度高。

传统的三层体系结构中,业务层承担了业务逻辑和数据库访问两大任务,造成业务逻辑与特定的数据库访问之间的高耦合,导致系统维护吃力,不利于系统业务的扩展,无法满足新的业务需求。

(3)可靠性不高。

教学资源库中一旦出现服务器故障,易出现服务中断、服务可靠性不高等问题。

2. 群集的概念

群集(Cluster)是一个逻辑概念,用于对用途相同的服务器实例进行分组。当其为客户工作站提供高可靠性的服务时,对客户来说是透明的;即对于外界用户来说,使用某个提供的服务时,服务器群集似乎是一个服务器。客户并不知道是哪台服务器为他提供服务。群集中的应用服务器实例可以运行在同一台机器,也可以运行在不同的机器上。

群集通过在服务器的多个实例之间分配工作负载,为应用程序提供可伸缩性和可靠性。

(1)可伸缩性。

群集可以在不影响应用程序运行和客户端的情况下,根据需要动态添加服务器实例到集群中,增加应用程序容量满足客户访问需求。

(2)可靠性。

应用程序可以部署到集群中的多个服务器实例,由于服务器实例的选择对客户端透明,因此,即使某个服务器实例失败,不影响应用程序的继续执行。

3. 网络教学资源库群集部署方案

基于传统B/S三层架构的网络教学资源库存在负载不均、可扩展性不足、可靠性不高等问题。为解决这些问题,若是采用增加普通服务器,其处理能力并不能很好地解决问题;若采用高速、高性能服务器,不但价格高昂,而且不一定能满足Web服务的高强度并发处理要求。群集技术为解决这些问题提供了一种廉价有效的方案。

3.1 体系结构设计

传统的B/S三层架构,如图1所示,其数据与业务耦合度高。可通过对其进一步适当分层解决各层之间的高耦合问题。分层架构具有松耦合、伸缩性、重用性和扩展性等优点,但分层同时也带来了性能影响,并增加了系统的复杂性。因此,网络教学资源库设计采用了多层体系结构,在传统三层结构的基础上增加两层,共分为五层,即表示层、Web层、业务逻辑层、数据持久层和数据层,如图2所示。

从图1和图2的比较可以看出,五层体系结构中增加的Web层将应用的逻辑处理和表现相分离,使得系统具有逻辑流程清晰、功能代码复用性强、分布式部署的特点;而数据持久层位于数据库之上,隐藏数据读取和操纵中的所有数据访问代码细节,将客户应用程序与底层存储机制隔离开,完全抽象出开发应用程序时使用的数据物理细节[2,3]。

3.2 教学资源库主要功能模块

网络教学资源库广义上来讲是个资源共享和管理的系统,一般包括5个模块:资源管理、资源访问、资源需求、用户管理和服务管理,如图3所示。

(1)资源管理功能主要进行资源审核和资源维护工作。包括对上传资源进行审核入库;管理员对资源进行添加、删除和修改[4]。

(2)资源访问功能主要包括用户对资源的检索、下载、评价、收藏等功能。

(3)资源需求功能主要包括资源需求请求、资源需求回复、资源交换等功能。

(4)用户管理功能主要包括用户信息管理、资源上传、已上传资源列表、用户投诉等功能。

(5)服务管理功能主要包括建议反馈、游客访问、评价管理等功能。

3.3 群集设计

BEA Web Logic是用于开发、集成、部署和管理大型分布式Web应用、网络应用和数据库应用的JAVA应用服务器。Web Logic还拥有出色的集群技术,既实现了网页集群,也实现了EJB组件的集群,并且不需要任何专门的硬件或者操作系统支持。

在Web Logic中域(Domain)是配置了管理服务器(Administrator Server)的Web Logic Server实例管理的逻辑单元,在域中可以包含了多个服务器实例以及服务器群集[5]。域和服务群集间的逻辑关系如图4所示。一个域中必须配置一台管理服务器,并且只能配置一台;而服务实例1、服务实例2、服务实例3和服务实例4可以运行于同一台机器也可以是运行于不同的机器;一个域中可以有多台物理机器。

在教学资源库中使用Web Logic群集技术,通过一组相互协作的服务实例,在多台机器间复制和应用表示层和逻辑层的能力,从而实现关键业务系统的负载分布,消除个别故障点。

(1)故障转移的实现

简单的说,故障转移是当应用程序组件正在处理某个特定作业时,某些处理任务部分由于任何原因而变得不可用,已失败对象的副本将结束此作业。由于群集中的所有服务实例执行同一服务请求,同一服务在多个服务实例上同时存放,并且服务实例间可以复制状态信息。故当某个服务实例发生故障,另一服务实例可以接管,服务自动切换到正在运行的服务实例上。群集故障转移的处理对用户来说是完全透明的,用户并不知道发生了故障转移。

(2)负载均衡的实现。

群集由代理来实现负载均衡。通过代理将请求转发到不同的管理服务器上来实现。代理将负载按比例分配到群集中所有的服务实例,使每个服务实例能够充分发挥其能力。群集对加入其中的服务实例的性能没有限制。并且可以在同一台机器上启动多个服务实例,充分利用机器的资源。因此,当教学资源库客户端的请求突然大幅增加时,可以通过动态增加服务实例来提高性能。

4. 结束语

基于群集的网络教学资源库采用了多层体系结构设计,解决了传统三层体系结构中存在的数据与业务耦合问题,方便系统进行动态服务扩展;使用群集服务有效地实现了系统负载均衡和故障转移,并为今后教学资源库服务的变化做了更有效的准备。

参考文献

[1]董旭东,艾伦.基于Web Service的教学资源库架构设计[J].中国教育技术装备,2007,3.

[2]李小平等.基于J2EE多层架构的Web开发框架研究[J].计算机应用研究,2008,25(5).

[3]郭涛.J2EE多层体系结构及在教育信息平台中的应用[J].计算机应用研究,2004,6.

[4]丁永刚,雷体南.基于ASP.NET/XML的校园网教学资源库系统设计与实现[J].现代远距离教育,2007,3.

项目群集成化风险管理 篇3

项目群风险管理作为项目管理学科的一部分,在国际项目管理学术领域尚属早期,而国内则刚处于启蒙阶段。1996年William McElroy在《Implementing strategic change through projects》中说明如何利用项目、项目群以及相关的管理过程来保证战略变革的成功。他认为项目群是由一些存在的项目和新定义的项目组成的集合,项目群不同于一般项目,它既不需要一个单一的目标,也不需要有一个固定的时间限定。随后,1997年Roderic J Gray在《Alternative approaches to programme management》中归纳了前人对于项目群的定义,并据此得到项目群的三种结构模型,即“松散型”、“紧密型”和“开放型”。2004年Mark Lycett等在《Programmme management:a critical review》一文中通过对标准项目群管理方法的评论,认为在目前的项目群管理中存在以下三种问题:过度的控制、企业战略缺乏柔韧性和项目间无效的合作。

同国外的研究相比,国内对于项目群风险管理的研究起步较晚,各种方法和成果还处于初级的阶段。中国矿业大学的何鹏认为项目群风险大量表现为隐性的,从知识挖掘角度提出项目群风险知识集成模型[1];天津大学的尹贻林提出了大型复杂项目群治理体系与集成整合模型[2];河海大学的周海炜提出考虑层次维度的南水北调项目群总体结构,并建立了南水北调项目群集成化管理的概念模型[3]。

2 项目群风险管理内涵

基于以上相关研究,作者认为项目群即是基于组织战略目标,由现有的和将来新定义的、按照特定结构并有序组成的若干相关子项目的群组功能系统,以期创造出超过集群个体项目总和的利益。

而项目群风险管理就是为了取得具有战略意义的目标和收益,而对一组相关项目进行的计划、分析,监控、应对等风险管理活动的统称。

3 项目群风险管理的特点

项目群是一个复杂系统,符合复杂系统理论的原理,项目群风险是它固有特性。因此,项目群风险管理远比单个项目风险管理要复杂得多,众多客观规律还需要我们进一步研究,本文这里进行了一些初步探索,认为项目群风险管理具有以下特点:

①实现各个单项目整合后的整体利益最优。群组总目标是为了实现所有项目整合后利益最大[4],因此,单个项目的成败一般不是群组成败的关键。有时为了群组总目标的实现,甚至可以牺牲若干个子项目,只要这种行为有助于整体利益最优,即局部服从全局。这一点,同围棋博弈原理相似,作者把它定义为项目群风险管理的“围棋理论”。

②组织结构呈现空间网络状复杂结构[5]。一般项目风险管理组织呈现矩阵制或直线制,但是项目群风险管理组织要复杂得多。首先,项目群的各个子项目采用矩阵制,则有多少的子项目就有多少个矩阵结构;其次,各个子项目由于资源、时间等影响,相互之间会发生一定的联系,见图1。

③群组总目标随环境的变化而发展,而单个项目的目标会随着群组的总目标的变化而出现优先等级的重构。项目管理的目标一般都是既定不变的,一般都要求在既定的时间内完成既定的交付事物。但是对于项目群管理目标,有的项目群会随着企业战略目标变化而发展、有的项目群会随着国家宏观政策变化而变化、有的项目群会随着重大自然灾害的升级而调整。另外,当群组目标发生变化之后,往往伴随着子项目在群组中的优先等级的重构。这里可以利用目标规划建立起初始的模型状态,确定出目标值、优先等级、权系数等,它都具有一定的主观性和模糊性,可以用后面信息系统功能模块设计提到的风险管理专家系统进行量化和后期的调整。其目标规划通用公式如下[6]:

undefined

xj 0,j1,…,n

d-k,d+k 0,k 1,…,k

④单个项目之间以及单个项目与群组之间存在不确定的动态价值关联。尽管项目群风险管理是具有一定关联的单个项目风险的整合管理,但是关联的类型和程度是有差异的。例如Santhanam和Kyparisis针对信息系统的项目,将关联性分为三类即资源相关性、收益相关性与技术相关性[7],这说明子项目是存在复杂关联的。另外,按照我们定义的“围棋理论”,单个项目之间,也就是棋子与棋子之间的价值关联,会随着主客观条件发展而动态变化。

⑤与项目群有关的海量信息筛选与甄别困难。特别是那些重大自然灾害防治、跨流域国土整治、国际冲突事务管理、大规模军事行动等项目群,往往收集到海量信息,而这些信息的真假甄别工作与优先排序整理都十分难以及时处理。

⑥项目之间的信息传递非常重要。由于项目之间存在不确定的动态价值关联,那么项目与项目之间的信息传递就十分重要,而实际上往往信息传递会出现失真,按照德国学者马莱兹克(Gerhard Maletzke)的传播理论[8],单个项目的风险是会传播到其它与之相关的项目的,从而加大项目群总目标实现的风险。

⑦冲突管理与协同工作地位突出。从项目群管理者与项目管理者角度看,单一进行项目管理工作已经不是最重要的事务了,怎么处理好项目之间的协同成为风险控制的关键[9]。

4 项目群集成化风险管理

考虑到项目群风险管理的特点,常规的平面化项目管理手段已经不能适应,集成化管理才能适应这种新的结构。一般而言,集成可以理解为两个或两个以上的要素经过选择搭配和优化,融合成一个优势互补、相互匹配的整体,最终达到或形成“1+1>2”的效果或局面。本文提出的项目群集成化风险管理,即是指以项目群整体优化为目标,综合全过程中各个子项目目标和相互关系,协同各个参与方之间的利益和动态关系,建立起来的一种包括组织集成、过程集成以及目标集成的多维度风险管理系统,从而实现各种管理要素协同和优化的一种综合性的管理活动。其概念模型见图2所示,包括组织集成、过程集成与目标集成。

4.1 组织集成

组织集成包括项目群的战略整合、子项目的项目结构分解以及子项目之间的协同组装共三个方面的集成,见图3。

4.1.1 项目群战略整合

这里既包括项目群各子项目的分解与范围界定,还包括项目参与方的组织结构之间的整合,通过这种整合达到使具有各自利益的各参与方最大限度地服务于项目群目标,见图4图5。

4.1.2 子项目的项目结构分解

这里最主要的就是指通常的项目管理中项目的结构分解PBS(Project Breakdown Structure),要注意每个子项目由于各自的任务、特点等不同,不一定要求按照同一标准划分,只要这种分解有利于项目完成目标即可。一般项目的分解是直至分解到具有一定功能的工作包的树状图,以保证项目控制过程中信息来源的单一性和集成性,见图6。

4.1.3 子项目之间的协同组装

项目群由若干个相互关联的子项目构成,这些子项目之间存在不确定的动态价值关联。这决定了有的项目的实施可能需要以其它项目的完成作为基础,有些项目可能与其它项目存在某些资源共享或资源配给状况,有些项目在项目群中起着关键作用,而有些项目相比而言在群组中地位不是那么突出但又不可或缺,因此子项目之间的这种协同既要通过目标规划的方法进行优先等级的排序,也要处理好协同集成。从流程角度来看,就是根据组织结构,按照既定的协作规则,处理好组织的相互关系,通过过程集成运行、检验、监控、调整,以达到目标集成的各个任务,从而实现项目群整体功能最优,如图7。

例如对于项目群资源目标,应进行集成管理、动态配置,这些资源主要包括人力资源、材料设备、资金等,通过构建相应的资源协同机制,达到项目群资源共享;通过构建项目群资源分解结构,以统计分析资源在项目群内所有子项目的分配和负荷情况,达到项目群资源的合理分配。

4.2 过程集成

项目群的过程集成是将项目群的整个生命周期,包括项目群构建、目标规划、决策、设计和计划、实施以及运营等综合起来,通过整合各阶段的需求和各个阶段之间的顺序,以达到风险控制的最科学的效果。为了实现过程集成管理,应设计出满足可视化要求的风险管理系统接入界面,如图8。

4.3 目标集成

项目群目标集成要突出一体化的整合思想,追求的不是某些单个目标的最优,而是要寻求项目目标之间的协调和平衡,确保各参与方之间达成某种利益均衡状态下的群组总目标最优,从而最终实现项目群管理活动的总体效率的提高。项目群目标集成的目的就是通过运用集成手段和系统化思想,明确项目群管理中的关键要素,以子项目要素的集成(包括项目范围、进度、成本、质量、资源、沟通)作为是项目群目标集成的基础,以项目范围为核心,以项目进度、质量和成本为约束条件,兼顾资源、沟通等因素,分析关键要素之间相互影响、相互制约的关系,进行组织、计划、协调、控制使项目群风险管理处于受控和协调状态,以达到对项目群组的全局优化。

5 集成管理的信息系统设计

随着internet技术的迅猛发展,基于Web的信息管理系统成为风险管理的发展趋势,利用Web技术,不仅可以实现信息的快速收集、分布、存储、处理和交流,而且可以帮助项目群建立起有关目标与要素以及风险控制间的优先次序及协调性等一系列的风险集成管理系统。系统中的数据的安全性显然是相当重要的,为保证多方信息交流的安全可靠,可以一方面建立起数据库层次的防火墙,另一方面还可以建立起用户层次的认证系统。虚拟专用网(Virtual Private Network,VPN)就是利用公共网络基础设施,通过加密认证、密钥交换等技术在公网上开辟一条VPN通道,使得合法用户可以安全地访问相关私有数据,如图9。这样,各个独立单位可以通过DSL或宽带方式接入internet,通过VPN技术实现风险管理的信息交流(10)。

5.1 系统用户

本系统的一级权限用户是项目群管理办公室PMO(Programme Management Office)及系统构建外包的委托服务商。PMO是业主单位,承担立项、规划、计划、决策、处理及制度建立、外部协调任务;委托服务商是运营单位,承担系统架设、功能设计、数据处理、运营维护任务,比如它通过日常的运营,按照业主单位拟定的法则、指标,将功能模块中专家系统生成的参考结果传达给业主单位以供决策。二级用户包括专家组、子项目的工作人员。三级用户包括社会咨询机构及个人等。

5.2 功能模块设计

集成化风险管理系统的网络结构可以由四个模块功能构造而成:

①风险管理系统后台(战略规划及管理控制层)。

②风险管理专家系统(操作处理层):根据不同专家的授权权限,风险管理专职人员可以进行模型建立、审核,群风险评估,风险要素的数据处理、交流等管理工作。

③风险管理系统网站(简单事务处理层):设有办公OA、查询、子项目的账号登录接口以及项目群风险数据收集、分析、监控等窗口。

④权限分级的子项目风险管理系统(外部接入层):按照风险管理办公室的目标要求,各个子项目主及其它社会研究机构登录、接入资源、费用、进度等风险管理窗口。

5.3 系统开发工具

①开发语言平台;

②数据库系统;

③可视化集成开发工具。

例如跨流域的国土整治项目群,可以通过GIS,针对危险源管理可以实现危险源的空间位置、分布信息的监控与维护,可以对危险源进行添加、删除、修改空间位置信息等操作,还可以对危险源的属性信息如危险源的责任单位、联系人等进行维护。

5.4 信息系统安全保护系统

①安全认证;

②安全等级评测、保护。

参考文献

[1]何鹏,谭章禄.项目群风险管理研究[J].北京工商大学学报(社会科学版),2006,21,(2):70-74.

[2]尹贻林,刘艳辉.基于项目群治理框架的大型建设项目集成管理模式研究[J].软科学,2009,23,(8):20-25.

[3]周海炜,邓玉林等.南水北调项目群集成管理研究[J].南水北调与水利科技,2009,7,(6):62-65.

[4]Michel Thiry.Combing value and project management into aneffective programme management mode[J].internationalJournal of project management,2002,20,(3):221-227.

[5]Roger Miller.Govermance Regimes for Complex Projects[J].Project Management Journal,2005,36,(3):42-50.

[6]胡运权,顾基发等.运筹学[M].北京:清华大学出版社,2005,6:103.

[7]Radhika Santhanam,George J.Kyparisis.A decision model forinterdependent information system project selection[J].European Journal of Operational Research,1996,(89):380-399.

[8]Christina Holtz-Bacha,Gerhard Maletzke.German MediaBooks[J].Communication Booknotes Quarterly,1985,16,(11):126-131.

[9]Harold Ainsworth.协同在大型项目计划和项目中的效力[J].项目管理技术,2005,(7):16-17.

故障转移群集技术研究与部署 篇4

1 集群类型

根据所要完成任务的不同, 通常把集群分为三种基本类型:

高性能集群 (HP Cluster) , 将问题分为若干部分, 每台计算机同时参与问题的解决, 缩短计算时间。

高可用性集群 (HA Cluster) , 高可用集群的目的是减少服务中断时间, 故障转移集群是其其中一种。

负载均衡集群 (LB Cluster) , 大量的同一类型的并发访问, 分担到多台节点设备上分别处理。

2 构建模式

双机热备模式。主服务器承担所有负载, 备份服务器不处理任何负载。当前者出现异常, 后者主动接管其工作。

双活动模式。两台服务器均提供对外的服务, 当一台服务器出现异常另一服务器接管其工作。

N+1模式。一台备份机同时为多台主机做备份。

3 浮动IP

浮动IP就是客户端访问服务的IP地址

4 失效检测

4.1 心跳原理

节点=2:周期性地通过心跳线向对方节点发送心跳信息, 如果规定的时间内从所有路径都收不到对方的信息, 则确认主节点失效, 备用节点开始故障转移。

节点>2:一个节点检测到与另一节点的通信故障, 则向整个群集发送消息, 要求系统中的各个节点相互进行成员身份检查和测试, 再对测试结果进行分析, 确定发生故障的节点。常见的诊断算法有Majority算法、Hopfield算法。

4.2 心跳路径

私网:专门传递服务器之间信息的网络。

4.3 传播形式

环形心跳和广播心跳。

5 故障转移

首先选择节点, 节点首选项列表直接指定, 反馈节点性能、当前负载和应用程序。其次资源转移, 关闭集群服务, 禁用磁盘。最后重启服务, 故障恢复。

6 故障恢复

后向恢复:快照恢复--检查点多米诺效应仲裁资源。

前向恢复:系统利用故障诊断信息构建一个有效的系统状态, 继续执行下去, 实时性。

7 Windows集群实验

Windows Server 2003、VMware虚拟机、Active Directory注:都是针对主节点的操作

8 结语

群集技术在企业网站中应用与探究 篇5

群集技术是指多台服务器以对称的方式组成一个服务器集合, 每台服务器都具有等价的地位, 都可以单独对外提供服务。通过负载均衡技术将外部发送来的请求均匀分配到对称结构中的某一台服务器上, 而接收到请求的服务器独立地回应客户的请求。负载均衡能够平均分配客户请求到服务器列阵, 借此提供快速获取重要数据, 解决大量并发访问服务问题, 群集技术提高了网络的可用性与可靠性。微软公司主要提供两种群集技术:网络负载平衡 (NLB) 和微软群集服务 (MSCS) 。

1、NLB群集技术实现WEB服务器的负载均衡

网络负载平衡 (NLB) 群集技术可以将两台或更多的服务器结合起来使用, 提供了一种扩展服务器带宽和增加服务器吞吐量的廉价有效的方法, 加强了网络数据处理能力, 提高了网络的灵活性和可用性。NLB群集技术还可以提高服务器的响应速度及其它资源的利用效率, 避免网络关键部位出现单点失效, 从而为用户提供更好的访问质量。

现有两台windows sever 2003的WEB服务器, 其中一台服务器名称为Server1, 另一台服务器名为Server2。两台服务器通过NLB群集技术实现WEB服务的负载均衡。这两台服务器都有两块网卡, 一块为群集网卡, 另一块为检测服务器存在的“心跳”网卡。Server1的群集网卡地址为:192168.10.10, 心跳网卡地址为:10.0.0.1。Server2的群集网卡地址为:192.168.10.20, 心跳网卡地址为:10.0.0.2。规划虚拟群集IP地址为192.168.10.1。在Server1上配置DNS, 将www.abc.com与192.16810.1进行域名解析。当客户机访问服务器时, NLB群集技术可以根据每台服务器的负载情况自动选择Server或者Server2对外提供服务。配置方法如下:

1) 以管理员身份进入到Server1中, 在“控制面板”-“管理工具”中运行“网络负载平衡管理器”, 用鼠标右键单击“网络负载平衡群集”, 从出现的菜单中选择“新建群集”, 进入“群集参数”界面。在“IP地址”后面输入规划的群集参数地址192.168.10.1, 在“完整Internet名称”后面输入www.abc.com。

2) 点击“下一步”按钮, 进入群集IP地址页面后再进入“端口规则”界面, 点击“下一步”按钮, 进入“连接”界面。

3) 在“连接”界面的“主机”栏中输入心跳网卡的地址10.0.0.1, 然后点击“连接”按钮, 将在“对配置一个新的群集可用的接口”框中显示出连接Server1的群集网卡和心跳网卡。选择Server1的群集网卡192.168.10.10后点击“下一步”按钮, 进入设置“主机参数”界面, 注意选择多播, 点击“完成”按钮, 系统将自动开始网络负载平衡群集的配置。几分钟后, NLB群集配置完成。

4) 在第Server1上, 用鼠标右键单击新创建的群集, 从出现的菜单中选择“添加主机到群集”。将出现“连接”界面, 在“主机”中输入Server2的心跳网卡地址10.0.0.2, 点击“连接”按钮, 将会在“对配置群集可用的接口”下面显示出Server2的群集网卡和心跳网卡。选择Server2的群集网卡192.16810.20, 进入主机参数界面, 在端口设置里选择“启用”, 然后点击“完成”按钮。

5) 当客户机访问www.abc.com时, NLB群集服务器自动选择Server1和Server2提供WEB服务, 若Server1出现故障时, Server2会提供服务, 从而保证网络的可靠性与可用性。

若两台服务器不能满足业务的要求, 可以继续添加多台服务器, Windows Server 2003的NLB群集技术共支持32台服务器组成群集。

2、MSCS群集技术实现WEB服务器的负载均衡

服务器群集 (MSCS) 就是指将很多服务器集中起来一起进行同一种服务, 在客户端看来就像是只有一个服务器。群集可以利用多个计算机进行并行计算从而获得很高的计算速度, 也可以用多个计算机做备份, 从而使得任何一台服务器出故障整个系统还能正常运行。

MSCS群集需要在Windows Server 2003的企业版和数据中心版上配置, 服务器需要两块网卡, 其中一张网卡为群集网卡, 另外一张网卡为心跳网卡。心跳网卡用来保证数据的同步和群集信息的共享。群集网卡用于外部网络访问使用, 用来维持WEB服务器与数据库群集之间的数据交换。MSCS技术必须要服务器加入到域中才能使用。

2.1 配置仲裁磁盘

仲裁磁盘的作用是在协调群集服务器之间的故障转移。在Windows Server 2003的群集技术中是否需要进行故障转移是有仲裁磁盘决定。在每一个服务器上建立一个1GB容量的仲裁磁盘使用NTFS文件格式, 注意仲裁盘的容量不能小于50MB。

2.2 配置共享磁盘

所有共享磁盘都必须是基本磁盘, 使用NTFS格式化所有的硬盘, 并分配卷标及盘符。在创建群集资源前, 必须在两个节点上给共享磁盘分配相同的固定盘符。每个共享磁盘上只能创建一个分区。

2.3 配置群集服务

MSCS的群集服务必须使用具有本地管理特权的域用户进行登录。在“群集管理器”创建新群集, 确认具有配置群集所必需的前提条件, 检查出现的所有警告或错误信息, 来判断群集安装状况是否正常, 确认无误, 完成群集服务的安装。

2.4 测试群集安装

为了保证群集安装成功, 需要对它进行安装测试。在群集管理器中如果仅完成了节点l的安装, 启动群集管理器, 然后尝试它是否能够连接到群集;如果已经完成了节点2的安装, 在任意一个节点上启动群集管理器, 然后确认节点2显示在列表上。

2.5 测试故障转移

服务器群集的主要功能就是故障转移, 因此要进行故障转移的测试。对服务器群集进行移动组操作, 将该组及其所有资源将转移到另一个节点, 在第二个节点上实现联机。这样可以实现对WEB服务器故障转移测试, 证明了MSCS群集实施成功。

3、NLB群集技术与MSCS群集技术的比较

NLB群集主要用于实现网络流量的平衡, 分配传入的IP流量, 是为电子商务Web站点实现增量可伸缩性和出色可用性的理想选择。随着流量的增加, 可以向群集添加更多的服务器, 最多可容纳32台Windows Server 2003的服务器。NBL群集在为用户提供连续服务的同时还提供了高可用性, 即自动检测服务器故障, 并在10秒内在其余服务器中重新分配客户端流量。

MSCS群集的主要用途是通过自身提供的容错能力来提高服务程序可用性, 当某服务器发生故障时, 其它健康服务器能实现故障转移和故障恢复。MSCS故障转移功能是通过群集中连接的多台服务器冗余实现的, 每台服务器都具有独立的故障状态 (独立内存、系统磁盘、操作系统和群集资源子集) 。为了实现冗余, 需要在群集中各服务器安装相同服务程序, 当某服务器正在运行的某服务程序故障或停机, 另一服务器将重新启动该服务程序, 从故障服务器上接管工作负载及相关数据, 继续为用户提供服务。

4、总结

随着图像、视频等高带宽的网络应用迅速发展, 对企业WEB服务器的要求日益增高。让多台服务器共同承担一些繁重的网络服务, 从而以较低的成本, 消除网络瓶颈, 提高网络灵活性、可靠性和可用性, 保证企业网站的长期可靠的运行。

摘要:随着Internet的快速发展, 对企业信息化的建设提出了更高的要求。本文对NLB群集技术和MSCS群集技术进行研究, 使用两种群集技术对企业网站进行负载均衡, 让多台服务器共同承担一些繁重的网络服务, 从而以较低的成本, 消除网络瓶颈, 提高网络灵活性、可靠性和可用性, 保证企业网站的长期可靠的运行。

关键词:群集技术,NLB,MSCS

参考文献

[1]江小云建立基于服务器群集的负载均衡架构.重庆科技学院学报 (自然科学版) [J].2007, 2:95-97

[2]王树森基于Windows2003Server的负载均衡技术.济源职业技术学院学报[J].2006, 2 (5) :11-13

群集技术在校园网服务的应用研究 篇6

为了提高整个校园网服务系统的可靠性和不间断性,除了提高计算机各个部件的可靠性以外,一般情况下都会采用集群的方案。

1 集群技术

所谓集群,就是共同为客户机提供网络资源的一组计算机系统。而其中的每一台提供服务的计算机,我们称之为节点(node)。当一个节点不可用或者不能处理客户的请求时,该请求将会转到另外的可用节点来处理,而这些对于客户端来说,它根本不必关心这些要使用的资源的具体位置,集群系统会自动完成。

应用最为广泛的群集计算技术可以分为三大类:高可用性群集技术、高可扩展性群集技术和高性能计算群集技术。

1)高可用性群集技术

高可用性群集(High Availability Cluster,HAC)是指以减少服务中断(宕机)时间为目的的服务器群集技术。高可用性群集系统可使应用程序服务能够在发生硬件或软件故障时仍继续运行。高可用性系统使用户不受软件故障以及系统处理设备(SPU)、磁盘或局域网(LAN)组件的故障的影响。当某个组件出现故障时,将由冗余组件接管操作。群集和其他高可用性子系统负责协调各组件之间的切换。在实际应用中,通常将HAC群的一个节点配置成主服务器,另外一个节点配置成从服务器。主从服务器有各自的IP地址,并且有一个共享的虚拟IP地址,客户端仅须向这个虚拟IP地址请求服务,而不需要分别向主从服务器的实际IP地址请求服务。这种措施确保集群服务的切换不会影星客户的IP层的访问。常用的HA集群系统由2台服务器组成,每台服务器作为HAC的一个节点。由2个节点构成的HA集群典型应用模式有双机热备和双机互备两种。

2)高可扩展性群集技术

高可扩展性群集技术(Loading Balance Cluster,LBC)就是带均衡策略(算法)的服务器群集。负载均衡群集在多节点之间按照一定的策略(算法)分发网络或计算处理负载。负载均衡建立在现有网络结构之上,它提供了一种廉价有效的方法来扩展服务器带宽,增加吞吐量,提高数据处理能力,同时又可以避免单点故障。

3)高性能计算群集技术

高性能计算集群(High Performance Computing Cluster,HPC)是指以提高科学计算能力为目的计算机集群技术。HPC是一种并行计算(Parallel Processing)集群的实现方法。并行计算是指将一个应用程序分割成多块可以并行执行的部分并指定到多个处理器上执行的方法。目前的很多计算机系统可以支持SMP(对称多处理器)架构并通过进程调度机制进行并行处理,但是SMP技术的可扩展性是十分有限的,比如在目前的Intel架构上最多只可以扩展到8颗CPU。为了满足哪些计算能力饥渴"的科学计算任务,并行计算集群的方法被引入到计算机界。著名的“深蓝”计算机就是并行计算集群的一种实现。

2 规划

2.1 操作系统

任何群集需要面对的第一个主要决定就是操作系统的选择。事实上,群集可以运行任何一个操作系统,现行的群集运行的操作系统包括Windows、Solaris、HP-UX、AIX,Mac OS X、Free BSD、Linux。

对于一个只考虑设计要求而没有操作系统倾向性的高校来讲,运行Linux是阻力最小的一个选择,因为大量的面向Linux的免费群集工具的存在。

当然了,操作系统的选择就比较复杂。需要考虑的重要因素包括硬件平台,本地是否有富有经验的系统管理员,是否有需要使用的应用程序,维护是否方便,系统性能以及是否有必要对操作系统做必要的更改。

2.2 节点的运行方式

集群中节点可以以不同的方式来运行,这要看它们是如何设置的。在一个理想的2个节点的集群中,2台服务器都同时处于活动状态,也就是在两个节点上同时运行应用程序,当一个节点出现故障时,运行在出故障的节点上的应用程序就会转移到另外的没有出现故障的服务器上,这样一来,由于两个节点的工作现在由一台服务器来承担,自然会影响服务器的性能。

针对这种情况的解决方案是,在正常操作时,另一个节点处于备用状态,只有当活动的节点出现故障时该备用节点才会接管工作,但这并不是一个很经济的方案,因为你不得不买两个服务器来做一台服务器的工作。虽然当出现故障时不会对性能产生任何影响,但是在正常运行时的性能价格比并不太好。

从上面的工作方式出发,我们可以把集群分为下面几种(特别是两节点的集群):

1)主/主(Active/active)。这是最常用的集群模型,它提供了高可用性,并且在只有一个节点在线时提供可以接受的性能,该模型允许最大程度的利用硬件资源。每个节点都通过网络对客户机提供资源,每个节点的容量被定义好,使得性能达到最优,并且每个节点都可以在故障转移时临时接管另一个节点的工作。所有的服务在故障转移后仍保持可用,但是性能通常都会下降。

2)主/从(Active/passive)。为了提供最大的可用性,以及对性能最小的影响,Active/passive模型需要一个在正常工作时处于备用状态,主节点处理客户机的请求,而备用节点处于空闲状态,当主节点出现故障时,备用节点会接管主节点的工作,继续为客户机提供服务,并且不会有任何性能上影响。

3)混合型(Hybrid)。混合是上面两种模型的结合,只针对关键应用进行故障转移,这样可以对这些应用实现可用性的同时让非关键的应用在正常运作时也可以在服务器上运行。当出现故障时,出现故障的服务器上的不太关键的应用就不可用了,但是那些关键应用会转移到另一个可用的节点上,从而达到性能和容错两方面的平衡。

2.3 寻址与命名

为一个群集中的节点分配IP地址有三种方式。对于小的群集,许多架构就简单地把他们放在已有的网络中。这样做的话,群集中的节点不需要另外的路由开销即可和随机的外部数据源进行通讯;缺点就是IP地址和物理节点并不会一一对应,因而很难区分各个节点;另外,群集之间没有子网划分也使得节点之间的通讯很容易影响到外部网络。另外的两种方式都是把群集放在一个单独的子网中,无论是使用私有IP或者是公网IP。使用公网IP的好处是,群集节点可以通过一个适当的路由器和随机的外部数据进行通讯和数据交换。在一个子网中(通过某一特定的方式分配之后),IP地址可以帮助管理员记忆某一IP属于哪个节点。使用公网IP的缺点就是这一资源正变得越来越稀缺因而很难获得大批的连续公网IP,即使可以也是非常昂贵的。当然缺点就是群集节点无法直接和外部数据进行交换。

选择节点名称则是群集架构时面对的另一个问题。通常的主机命名规则可以用来命名核心服务器。然而,除非是一个群集非常小而且以后不会扩展,数字化的命名方案,比如node00,node01等,可能是一个比较好的选择。

2.4 管理方式

由于一个群集中节点往往是数量最多的,那么有效的节点配置管理就成为至关重要的一环。众所周知,网络管理方式可以简单地分为带外管理(out-of-band)和带内管理(in-band)两种管理模式。所谓带内管理,是指网络的管理控制信息与用户网络的承载业务信息通过同一个逻辑信道传送,简而言之,就是占用业务带宽,常用的方法有Telnet、Web、网管工具等。而在带外管理模式中,网络的管理控制信息与用户网络的承载业务信息在不同的逻辑信道传送,也就是设备提供专门用于管理的带宽。

对于高可用性群集进行带外管理的有许多优点,一是故障探测和恢复较为方便,当某节点到群集内部通讯网络的通路故障时,带外管理可以分析原因,恢复故障点,或者减弱网络故障的影响。二是可以减少网络传输,与管理相关的网络传输被迁移到带外路由上面,所以用户应用可以使用全部的网络带宽。三是降低安全风险,所有的带外远程管理方式使用定制的操作系统。这些特殊的操作系统提供安全特性和特别目的图形化用户界面或命令集,这样可以降低受到病毒和非授权访问的攻击。

对于高可用性群集的带外管理有3种选择:串口通信连接器、键盘/监视器/鼠标(KVM)切换器、数字KVM切换器。

3 应用

目前,在高校的大多数应用系统都是基于B/S架构,这就要求作为应用服务器的Web服务器具有高可用性和高性能,而数据库服务器又是各种应用系统的核心。

3.1 Web服务器负载均衡群集

在学校的某些应用系统中,例如电子图书馆、BBS、远程教育等,由于涉及的信息量十分庞大,用户访问的频率也高,随之而来的是Web流量的激增。这就需要在实时性和吞吐量方面都具有较高性能的Web服务器支持,如何提高Web服务器的性能和效率成为一个亟待解决的问题。

实际上,服务器的处理能力和I/O已经成为提供Web服务的瓶颈。如果客户的增多导致通信量超出了服务器能承受的范围,那么其结果必然是服务质量下降。显然,单台服务器有限的性能不可能解决这个问题,一台普通服务器的处理能力只能达到每秒几万个到几十万个请求,无法在一秒钟内处理上百万个甚至更多的请求。显然,采用高性能的主机系统(小型机乃至大型计算机)是可行的。但是,除了其价格昂贵外,这种高速、高性能的主机系统,很多情况下也不能解决同时处理几万个并发。因为,高速主机系统只是对于复杂单一任务和有限的并发处理显得高性能,而Internet中的Web服务器绝大多数处理是“简单任务”、高强度并发处理,因此,即便有大资金投入采用高性能、高价格的主机系统,也不能满足Web应用的需要。这就是利用Web服务器群集实现负载均衡的最初基本设计思想。

在Web负载均衡群集的设计中,网络拓扑被设计为对称结构。在对称结构中每台服务器都具备等价的地位,都可以单独对外提供服务。通过负载算法,分配设备将外部发送来的请求均匀分配到对称结构中的每台服务器上,接收到连接请求的服务器都独立回应客户的请求,如图1所示。

这种Web服务器群集有如下特点:

1)高性能。一个Web服务器群集系统由多台Web服务器组成,对外部而言,整个群集就如同一台高性能Web服务器,系统只有一个对外的网络地址(主机名或IP地址),所有的HTTP请求都发到这个地址上。系统中有专门的机制能够将这些请求按照一定原则分发到群集中的各台服务器上,让它们各自分担一部分工作。

2)可扩展性。它是采用同样的方法或技术高效率地支持较大规模系统的能力。Web服务器群集系统的组成结构和工作原理决定了它能够比较容易地达到较好的可扩展性,因为扩大系统规模非常容易,只要在网络中增加新的Web服务器计算机即可。

3)高可用性。Web服务器群集系统将会在各种商业应用领域中占有举足轻重的地位。商用系统最重视系统的可靠性和容错性,二者合在一起称为系统的可用性。常用的系统可用性指标有系统平均无故障时间、期望不间断工作时间及年平均故障率等。由于Web服务器群集系统中各台Web服务器之间相对独立,采用一些不太复杂的技术就能使Web服务器群集系统达到很高的可用性。一些商用产品中已经部分实现了这种技术。

此外,Web服务器群集系统还具有价格便宜、能够保护原有投资等特点。

3.2 数据库群集

数据库是校园网各类应用的核心,目前应用在校园网上的主流的数据库管理系统主要有Orcale、Mircosoft SQL Server和My SQL等。

3.2.1 Oracle

真正应用集群(Real Application Clusters,RAC)是Oracle数据库支持网格计算环境的核心技术,它解决了传统数据库应用中面临的一个重要问题:高性能、高可伸缩性与低价格之间的矛盾。

Oracle RAC是一个可“共享一切”的体系结构,用于获得数据库高可用性和负载平衡,在此体系结构中,有两个或多个Oracle RAC节点集群在一起,共享同一存储区。RAC节点通过高速互连连接在一起,此互连方式支持Oracle节点之间的快速通信,可以在启动、锁定信息、事务信息、数据等过程中交换各种类别的数据块所有权信息。

ORACLE RAC具有以下特性:

1)高可用性。Oracle RAC提供一个高性能低成本的应用平台,支持所有类型的应用系统,无论是事务处理型应用还是分析型应用。所有应用共享同样的服务器和存储资源。出现任何的服务器或磁盘故障,系统会自动重新接管发生故障的功能。这些对前端用户的完全透明的。同样,如果您需要增加服务器或改变其他组件的配置也不会影响到应用系统。

2)负载均衡。除高可用性外,还可以将Oracle RAC配置为提供工作负载均衡数据库的工作负载均衡在连接级别发生。Oracle使用随机算法把连接请求分发给RAC节点。

3)可按需扩充。Oracle RAC可以基于当前的工作负载而构建的。当应用规模需要扩充时(支持更多的数据、用户或应用),就需要扩展系统以保证系统的性能。当应用是构建于大型的SMP主机时,可能需要购买另一台昂贵的主机,但可能只能使用到其处理能力的很小一部分。但是如果使用Oracle RAC的话,可以通过增加一台或多台低成本的服务器来扩充应用系统的处理能力,满足应用需求。

4)第三方应用支持。Oracle RAC数据库服务器象一个单一镜像的数据库服务器,所有的应用无需任何改动都可以直接部署,同时可以提高应用性能和可靠性。

3.2.2 SQL Server

SQL Server故障转移群集为整个SQL Server实例提供高可用性支持,包括一个或多个Microsoft群集服务(Microsoft Cluster Server,MSCS)节点,以及专用群集资源组。其中,专用群集资源组主要有:用来访问集的网络名称、IP地址、用于SQL Server数据库和日志存储的共享磁盘、控制SQL Server故障转移行为的资源DLL、在所有故障转移群集节点中自动保持同步的检查点注册表项。

SQL Server故障转移群集在网络上显示为一台计算机上的单个SQL Server实例。在群集内部,一次只有一个节点拥有群集资源组,满足针对该故障转移群集实例的所有客户端请求。在出现故障(硬件故障、操作系统故障、应用程序或服务故障)或进行计划升级时,组所有权就转移至故障转移群集内的其他节点。此过程称为故障转移。

SQL Server故障转移群集构建于MSCS之上,也就是说,若要创建SQL Server故障转移群集,首先需要创建基础Microsoft群集群集。由于MSCS群集是用于获得高可用性的,而非用于实现负载平衡,SQL Server也没有任何内置的、自动负载平衡功能,因此,用户必须通过应用程序的物理设计来实现负载平衡。

3.2.3 My SQL

由于My SQL体积小、速度快、总体拥有成本低,尤其是开放源码这一特点,它与其他遵循GPL的开放源码软件Linux、Apache、PHP一起,构成了Internet上流行的网站构架方式LAMP。目前,这种网站架构方式在高校中也有普遍的应用。

为了能在群集系统上部署的其开放源代码数据库,My SQL公司于2004年4月份发售My SQL Cluster这一高可用性版本。

My SQL Cluster能够实现在多种软、硬件平台上的数据库群集功能,其中包括Linux、Windows、Solaris操作系统平台和Inter、Sparc硬件平台。

4 结束语

校园网的高可用性一直是网络管理人员追求的目标之一,而单一计算机只能提供有限级别的服务器可靠性和可伸缩性。但是,通过将两台或两台以上高级服务器的主机连成群集,就能够提供关键任务服务器所需的高可靠性和高性能。

摘要:集群技术是提高服务器系统计算能力、可扩展性和可靠性的一种重要方法,该文介绍在校园网中如何规划和实施服务器集群,以提高校园网服务的高可靠性和高性能。

关键词:集群,可靠性,负载均衡

参考文献

[1]陈刚,郭学理,韦智.Web服务器负载均衡的研究[J].计算机应用,2001(9).

[2]付社良,田斌.Oracle RAC 10g系统高可用性测试及分析[J].武汉理工大学学报:信息与管理工程版,2007(2).

[3]古俐明.集群服务器负载均衡技术研究[J].微计算机信息,2007(12).

[4]江小云.建立基于服务器群集的负载均衡架构[J].重庆科技学院学报:自然科学版,2007(2).

[5]门华.数字化校园中门户服务负载均衡的分析与实现[J].重庆工商大学学报:自然科学版,2007(1).

[6]任娜,张文强,王洪江.HP-UNIX集群系统下ORACLE RAC实现方案简析[J].科技信息:学术研究,2007(19).

[7]王璐璐.Web服务负载均衡群集的设计与实现[J].辽宁师专学报:自然科学版,2007(2).

[8]喻莉,阮文涛.负载均衡技术的研究与实现[J].计算机技术与发展,2007(8).

[9]张基温,杜精益,江森林.基于负载均衡的Web服务双向选择方案[J].计算机工程与设计,2007(16).

[10]张志友.计算机集群技术概述[J].实验室研究与探索,2006(5).

群集设计 篇7

关键词:故障转移群集,双节点群集,数据库,SQL Server2008

0 引言

吉林石化公司门户网站是本企业发布新闻、通知, 实现二级单位管理、信息链接与查询、资源共享, 集成各种综合应用系统的统一平台, 保障门户系统的正常运行至关重要。目前根据规划对门户网站系统进行全面的升级, 此次升级后操作系统版本为Windows Server 2008 R2, 数据库的群集服务正是基于此操作系统内置的故障转移群集技术。

1 群集技术及原理

Windows Server 2008提供了两种群集技术:故障转移群集 (Failover Cluster) 和网络负载平衡, 其中故障转移群集主要用于搭建高可用性架构。故障转移群集是一组独立的计算机, 这些计算机相互协作以提高应用程序和服务的可用性。群集内的每台服务器被称为节点 (Node) , 节点之间通过网络硬件和软件连接在一起为用户提供服务, 如果其中一个群集节点出现故障, 另一个节点就会开始提供服务 (该过程称为故障转移) , 通过使用冗余节点来减少宕机时间[1]。其典型的应用包括文件服务器、数据库服务器和打印服务器。

故障转移群集只适用于Windows Server 2008 R2企业版和Windows Server 2008 R2数据中心版, 目前应用最广泛的是双节点故障转移群集。

双节点故障转移群集原理如图1所示。

Node A和Node B组成双节点群集, 对于客户端来说体现为一台虚拟的服务器, 通过软件连接, 将需要管理的资源提交给群集管理器。通过群集服务器, 客户端发送给虚拟主机的服务请求由Node A上的服务程序或应用程序从磁盘阵列中读取业务数据处理以后通过群集服务器返还给客户端。

Node A和Node B采用直连, Node B通过心跳信号检测A的状态, 当群集服务器发现处于Active的节点发生故障时则关闭Node A上的服务和应用程序, 同时释放Node A的主机名, IP地址、磁盘阵列等控制权由Node B接管, 然后启动Node B上的服务和程序, 从而实现故障转移的目的。

其中群集搭建中需要共享的磁盘阵列用来做仲裁盘、DTC和共享盘[2]。

仲裁盘:群集系统数据的固定存储区域, 网络连接失败后各节点联系的纽带, 当群集网络故障导致节点间无法通讯后, 仲裁机制可保证群集中只有一个节点进入联机状态。

DTC:即分布式事务协调器, 当主节点宕机时, 备份节点会“取出”宕机时的工作状态继续提供服务。

共享盘:安装数据库文件。

2 吉林石化门户系统应用实例

2.1 设计思路

吉林石化门户系统的数据库服务器采用双节点的群集结构, 当工作服务器运行正常时, 备用服务器只是处于监听监测的状态, 当工作服务器故障时, 备用服务器接管主机的一切服务, 待主机恢复正常后, 将服务器切换到主机上运行, 数据的一致性通过共享存储解决, 实现门户系统的稳定可靠运行。

该系统采用的硬件平台配置为:数据库服务器采用两台IBM X3850 X5, 每台服务器配有Emulex光纤卡两块, 两块双口网卡, 磁盘阵列在原有的EMC CX480上进行扩展, 扩展磁盘容量为600G*8, 交换机采用H3C S5500-28C。

软件配置为:操作系统选用Microsoft Windows Server 2008R2 Enterprise (64位) , 数据库服务器安装SQL Server 2008 R2Enterprise (64位) 。

部署前先做好服务器磁盘空间及IP地址规划, 注意网络高级设置中的绑定顺序, 服务器的生产网络要优于心跳网络, 如图2所示。

2.2 实现方法

吉林石化部署的数据库服务器每台配置两块光纤卡, 此光纤卡用于服务器与存储阵列的两台冗余光纤交换机相连接。两块双口网卡, 其中一口网卡用于连接两台服务器的心跳线, 一口网卡用于将服务器连接在局域网内, 一口网卡用于CMS频道数据迁移使用。

数据库服务器与磁盘阵列连接如图3所示。

硬件连接好之后, 在两台配置相同的服务器上均安装Windows 2008 Enterprise Server R2企业版操作系统, 安装光纤卡的驱动程序。

将EMC CX480中扩展的8块硬盘做一个RAID组, 设置RAID5+1热备方式, 划分3个LUN:一个用于仲裁盘, 容量为1G;一个用于DTC, 容量为1G;一个用于共享盘, 容量为2T。在两台服务器的磁盘管理器中, 会看到窗口上多了3个磁盘, 然而它并不是真正连接到服务器上的磁盘, 而是磁盘阵列中的LUN, 如图4所示。

然后需要两台服务器上分别验证访问这个3个磁盘的有效性, 注意在一台服务器的共享磁盘上写数据时, 另外一台访问的共享磁盘应处于脱机状态, 待数据写完后再联机, 查看文件的有效性, 如此反复在另外一台服务器上进行测试, 保证磁盘的可用性。

群集中的所有服务器都必须位于同一Active Directory域中, 连接好磁盘阵列后, 将服务器加入中国石油集团域控服务器及DNS服务器, 再次登录时采用域账户登录, 进行集中控制及应用软件部署。

根据添加故障转移群集功能的向导, 我们需要对群集服务器作一系列的配置, 具体步骤包括:

(1) 打开服务器管理器“功能”—“故障转移群集”选择“创建群集向导”。

(2) 将两台服务器加入群集, 确定群集名称。在安装添加群集功能结束后, Windows Server 2008包含一个内置的验证过程, 使用户能够对系统, 存储及网络的配置是否适于集成进行确认, 新的确认向导所进行的部分测试包括:

节点测试, 确认服务器是否正在运行同样的操作系统版本及是否进行了相同的软件更新。

网络测试, 确定是否计划的群集网络符合具体的需求, 如针对网络冗余是否具有至少两个独立的子网。

存储测试, 分析是否进行了正确的存储配置, 以使所有共享的磁盘能通过全部的群集节点进行读取以及确认存储是否符合特定的需求[3]。

验证过程如图5所示。

验证结束后需要验证群集是否安装成功, 在群集管理界面上手动停止主服务器的服务, 服务可以自动切换到备用服务器节点上, 从而验证群集的正确性。

(3) 配置仲裁磁盘及IP, 配置DTC及IP, 其中仲裁磁盘选择多数节点与磁盘, 选择大小至少500 MB且配置了NTFS分区的磁盘, 我们这里为1G。

(4) 安装SQL Server 2008故障群集, 需要注意的是在主机上安装新的SQL Server故障转移群集, 在安装过程中实例安装到非系统盘, 数据文件安装到共享磁盘。

(5) 设置管理用户、密码、登录方式等。

(6) 在备机上选择向SQL Server故障转移群集添加节点。

这样就完成了整个故障转移群集部署。

3 结论

双节点群集技术的应用保障了用户访问系统数据的实时性、完整性, 实现了门户系统稳定可靠。

参考文献

[1]刘鹏, 靳文婷.故障转移集群部署在石油销售企业档案管理系统中的应用[J].中国管理信息化, 2012 (8) .

[2]李皓.Windows Server2008中故障转移的创新点[J].每周电脑报, 2008 (3) .

上一篇:计算机思维下一篇:建筑桥梁