云计算的分析与研究(共12篇)
云计算的分析与研究 篇1
1 云计算的概述
早在2006年亚马逊推出了弹性计算云服务, 事隔5个月, Google首席执行官埃里克!施密特就在搜索引擎大会上首次提出“云计算”这个概念, 畅想未来我们会从以桌面系统为中心转移以网络为中心。
云计算基于共享基础架构模式, 依托互联网, 将所有系统池连接在一起提供各种IT服务, 并依据用户的需要, 提供给用户软硬件资源和信息。未来的我们只需要一个宽带连接, 一个账号和密码, 依托电脑的CPU和显卡, 就可在“云端”管理任何事务, 而终端只需接受图像和声音。“云端”拥有规模庞大的服务器和前所唯有的计算能力。也就是把海量的服务器处理能力和储存能力通过网络汇集起来实现云计算。
2 云计算的组成
云计算的分类从部署方式来说, 可分为:私有云、公共云和混合云。公共云是对Internet上所有的用户都可以使用。目前AWS和Rackspace是公共云最大的提供商。私有云则是一种专有的云环境, 是针对一个组织单独构建的互联网服务, 该组织拥有基础设施, 可以在此基础设施上部署应用程序, 并对数据、安全性和服务质量提供有效控制。混合云, 也可称为虚拟私有云, 它提供的服务运行在一个公共的云基础设施之上, 但通过虚拟专用网 (VPN) 限制对它的访问。
从提供服务的模式来说, 云计算包括三个层次的服务:基础设施服务IAAS (Infrastructure as a Service) 、平台服务PAAS (Platform as a Service) 和软件服务SAAS (Software as a Service) 。本文将主要从服务模式来解析云计算。
3 云计算的服务
3.1 基础设施服务
基础设施服务即将各个基础设备, 如IT系统, 数据库等集合在一起, 分隔成不同区域供企业或个人使用, 这也是最低层级的服务。IAAS作为一种标准化服务在网上提供基本存储和计算能力。它通过互联网提供服务器、操作系统、磁盘存储、数据库和信息资源等基础架构硬件及软件资源。在IAAS中, 服务提供商把硬件计算资源, 网络, 冗余, 负载均衡等等基础设施打包成服务, 用户直接购买这些的服务, 而不需要自己去组建负载均衡来平衡客户端请求的压力, 也不需要自己建立冗余服务器来保证无故障运行时间。
分布化和虚拟化是云计算基础设施服务的重要基础技术。
云计算无论在存储或计算, 都是分布化的实现。云计算要处理的数据量在单机上无法完成, 因此须将数据处理任务分布开, 化整为零交给多台机器完成。其采用了分布式计算, 或称为并行计算。所谓并行计算就是将大型的计算任务拆分, 再派发到云中节点进行分布式的并行计算, 最后将结果收集, 统一排序或合并。云计算在此基础上进一步升华, 将计算资源虚拟化。用虚拟机实现资源的虚拟化, 把硬件机器攒到一起, 其计算资源被量化到计算资源池中, 并被动态分配, 实现资源的动态调整 (动态调整时不需要重新启动系统就可调整资源大小) 这样就极大地节约了云中的计算资源。
在理论角度云计算并不一定需要虚拟化技术, 但是云计算作为一个面向企业和个人的商用技术是离不开虚拟化的。 (1) 现在企业由于长期运营, 必然会引入了不同厂商, 不同配置, 不同型号的机器, 造成异构系统。虚拟技术就可以将异构系统的差异性屏蔽掉, 使资源达到一视同仁。 (2) 企业的发展, 数据量也不断扩大, 需要多少资源, 无法预知。将服务器部署在虚拟机上, 扩容时迁移虚拟机即可, 节约了成本, 也提高了扩容的安全性和便捷性。 (3) 服务器的访问量在各个时段不同, 固定的资源分配, 会引发高负载或资源的浪费。通过虚拟化将物理机的资源进行切割, 以实现资源的随需分配和自动增长, 且其资源的自动分配和增减不会超过物理节点本身的物理上限。
3.2 平台服务
云平台即发动各大企业打造程序开发平台与操作系统平台, 让开发人员可以通过网络撰写程序与服务, 而一般消费者也可在其运行程序。从传统角度PAAS是云环境下的中间层服务, 如图1所示:
本文通过微软公司开发的Windows Azure Platform来剖析PAAS。Windows Azure Platform既提供可靠的软件平台, 也提供服务或开放的系统运营企业服务。Windows Azure Platform大致可分为三个层次:Windows Azure、SQL Azure、Windows Azure AppFabric。
Windows Azure是微软开发的一套云计算操作系统, 先阶段主要作为云联机服务所需的操作系统和基础存储及管理的平台, 如图2所示。Windows Azure包括三个部分:一是运营应用的计算服务, 二是数据存储服务, 三是基于云平台进行管理和动态分配资源的控制器 (Fabric Controller) 。SQL Azure是以SQL Server 2008为主, 构建在Windows Azure之上, 运行云计算的关系数据库服务, 是一种云存储的实现, 它提供网络型的应用程序数据存储服务。App Fabric作为中间件层, 起到连接非云端程序与云端程序的桥梁功能, 它让开发人员可以把精力放在他们的应用逻辑上而不是在部署和管理云服务的基础架构上。App Fabric也属于云的基础架构服务, 基于Web的开放服务, 它可把现有应用和服务与云平台的连接和互操作变得更简单, 为本地应用和云中应用提供分布式的基础架构服务。在云计算中存储数据与运行应用都很重要, 但我们还需要一个基于云的基础架构服务。这个基础架构服务应该既可以被客户自有软件应用, 又能被云服务应用, App Fabric就是这样一个基础架构服务。App Fabric最常用的一个场景是Web Role和Worker Role之间的通信, 而App Fabric最强大的地方在于能够跨平台。
3.3 软件服务
软件服务 (SAAS) 即供应商通过Web浏览器为成千上万用户提供软件服务。Sales Force.com是目前最具代表的供应商, 它的在线CRM服务 (客户关系管理系统) 就是其中的主打产品。基于云计算的特点, 它所提供的软件服务具有以下几个特点:
互联网特性:SAAS通过互联网浏览器为用户提供服务。例如hotmail就满足了所有SAAS的基本标准:供应商提供所有程序逻辑和数据的主机服务, 使用户能通过web的用户界面在Internet上存取数据。所以SAAS应用必须是互联网的, 并且这种网络的应用可以灵活启用和暂停, 随时随地都可使用。正因为通过网络访问, SAAS对网络的传输质量有更高的要求。
Multi-tenancy特性:SAAS通常基于一套软件为成千上万个用户提供服务, 所以它必须要支持不同用户之间数据和配置的隔离, 从而保证用户的安全和隐私, 以及用户对界面、业务逻辑、数据结构等的个性化需求。
可扩展 (Scalable) 特性:可扩展性意味着最大程度的提高系统并发性。比如说应用, 优化资源锁的持久性, 使用无状态的进程, 使用资源池来共享线和数据库连接等关键资源, 缓存参考数据, 为大型数据库分区。
可配置 (Configurable) 特性:传统的本地安装软件的使用环境中谈论可配置性时, 直接修改部分代码进行二次开发来适应当前用户的需求是比较常见的解决方案。但在基于SAAS模式的使用环境中, 如果业务应用的任何部分被修改了, 则这一修改将可能同时影响所有当前客户的使用环境。因此, 一般而言在Saa S模式的使用环境中, 客户使用元数据 (Metadata) 来为其终端用户配置系统的界面以及相关的交互行为。
4 结语
云计算提供可靠、安全的数据存储中心, 用户不用担心数据丢失、病毒入侵等麻烦;同时它对用户端的设备要求低, 电脑、手机、上网本等终端均可接入;此外, 云计算可以轻松实现不同设备间的数据与应用共享。当然, 云计算还面临着很多问题, 安全及成本就是云计算未来发展的最大阻碍, 还有云计算标准不统一, 在日后其大范围推广后, 就会才出现类似兼容性之类的问题。但是不可否认, 云计算成为主流技术的时代即将到来, 假以时日, 云计算将会为我们的网络时代带来翻天覆地的变化。
摘要:阐述了云计算的定义。针对现代云计算的发展形势, 通过剖析云计算的现有服务模式, 论述了各个服务模式的核心技术和特点。结合现有的云技术, 提出未来的发展和亟待解决的问题。
关键词:云计算,服务模式,核心,特点
参考文献
[1]陈康, 郑玮民.云计算:系统实例与研究现状.JOURNAL OF SOFTWARE, 2009, 20 (5)
[2]张强.云计算时代的平台战略[A].中图分类号:TP311文章编号:1009~3044, (2010) 06-1350-03
[3]陈全, 邓倩妮.云计算及其关键技术.Journal of Computer Applications, Vol29No.9Sep.2009
[4]维基百科.WindowsAzure.http://zh.wikipedia.org/wiki/Windows_Azure, 2011年6月23日
[5]Sriram I.SPECI:a simulation tool exploring cloud-scaledata-centers[C]//Proceedingsofthe1st.International Conference on Cloud Computing (CloudCom‘09) , 2009:1-1
[6]袁斌.惠普融合存储:软件是核心硬件是平台http://cloud.csdn.net/a/20110712/301506.html
云计算的分析与研究 篇2
【摘要】文章通过分析云计算的定义特点及云数据的管理技术,以促进云计算和云数据管理技术的发展和提高。
【关键词】云计算;云数据;管理技术
作者简介:初鲁京(1987-),男,山东烟台人,中国人民大学在职研究生,研究方向:企业管理
近年来随着科技水平的不断提高,信息数据量不断增大,并且具有快速的增长速度,用户对于计算机的存储能力提出了更高的要求。而“三网融合”、“物联网”、“智能电网”等应用的快速发展对于计算和数据管理也带来了新的挑战。云计算作为一种正在兴起中的新型技术,可以改变普通用户操作计算机的模式,可以根据用户的需要来提高计算能力和存储能力,使用户像使用水电一样的方便快捷的使用计算机,降低用户的软件和硬件采购成本。云计算是基于分布式系统和网络计算上提出的新型概念,核心功能的提供海量的数据和存储,并且提供高效率的计算能力,由于开发更多的应用形式。而云计算并不仅仅是做计算,还需要融合更多的技术成果,提出云数据的管理概念。本文通过分析云计算和云数据的管理技术,促进云计算和云数据管理技术的发展和提高,方便今后工作的开展。
一、云计算的概念
(一)云计算的定义
云计算是一种近年来兴起的新型计算模型,是在互联网技术快速发展的基础上发展起来的。由于目前对于云计算还没有统一的标准定义,所以出现了很多云计算的定义版本。而通过对于云计算的分析研究,总体的定义方向都是一致的。具体来说,云计算实际上是一种对于虚拟化技术、网络技术和WebService等几种不同的新型信息技术的综合应用。云计算所运用的技术几乎包括了所有的互联网和信息技术。可以说云计算是网络计算的必然发展,虚拟化技术又是云计算得以发展的基础和前提,WebService信心技术为云计算提供了互联网环境的技术支持。随着互联网的发展,计算机用户也越来越专业化,它们对于数据信息的.了解和使用越来越熟练,对于数据信息的要求也发生了变化,提出了各种不同的信息数据需求,云计算正是满足了这类用户的需要,也得到了进一步的使用和发展。
(二)云计算的工作原理
云计算在工作环境下不需要使用本地的计算机,通过互联网联接来进行数据的分布和处理,并且优化数据,然后经过互联网的连接来实现分享数据的目的。这种工作模式可以使企业方便的进行资源利用,并且有效的切换有效资源,根据实际工作的具体要求来访问计算机和存储系统,获得相关的信息和数据。云计算作为一项新型的实用性技术,一定程度上提高了计算能力的商业性,通过网络传播和售卖实现了降低售卖成本的目的,同时还充分发挥了实用性,使企业的相关工作得以全面落实。
(三)云计算的体系结构
云计算的体系结构非常庞大,并且具有很强的复杂性,一般以“云”网络为核心,联接到其他网络和服务器,发送出相关的数据信息。同时通过虚拟技术的支持扩展相关服务器的功能,在云计算的平台上实现各种信息资源的整合,达到为用户提供更多更有效数据的目的,提升了计算能力和储存能力。完善的云计算体系结构应包括云端用户、部署工具、服务目录、管理系统这主要的四个部分。
二、云数据管理技术的主要特点
(一)规模大,海量性
随着近年来互联网技术应用的发展和普及,一些互联网技术是通过传感器来进行数据信息的采集来完成相关的工作。而随着应用技术的发展和推广,数据量变得越来越大,并且还在快速的增长。云计算中的“云”具有规模大的特性,以云计算为基础而构建的信息服务或设备也具有大规模的特点,并且应用于处理海量性的信息数据。另外云计算还可以无限扩展,同时处理成百上千的信息节点。这种可以无限扩大和伸缩的特点满足了不同用户的不同需求,在云计算的数据管理技术中也要注重技术和方法的改进,提高信息数据的管理水平和处理水平,重视信息数据的整合、提取和推理,有助于工作决策的完成。
(二)安全可靠性
云计算的技术包括了虚拟化技术、互联网技术及分布式计算等比较成熟的技术手段,为云计算的可靠性提供了有效的保证。并且云计算在安全性方面也具有优势,云计算采用了不同服务器上的信息数据多副容错的方式,计算的信息节点采用了同构互换技术,这些都极大地提高了云数据管理的安全性。
(三)异构性
由于应用云计算技术的领域和行业的不同,云计算的数据采集设备和方式也各不相同,存在着一定的差异性。每个行业中云计算所获取的结构和数据形态也存在着不同的差别,需要根据具体的实际情况,来判断采取不同的传感器,例如二氧化碳浓度传感器、温度传感器和湿度传感器等。不同的传感器在应用的时候,传递信息和获取信息的形式也是不尽相同的,这些差别会带来数据分析、处理和访问等各个环节的差别,另外数据的多源性也会造成数据的类型各不相同,不同类型的数据信息也有不同的格式,从而会出现半结构化数据、非结构化数据和结构化数据同时存在的情况,使信息数据存在异构性的特点。
(四)不确定性
云计算的运行环境中数据信息具有一定的非确定性,主要表现为信息数据本身、数据语义匹配及数据信息的分析查询等方面具有不确定性。而为了达到保证信息数据准确客观的目的,用户在应用云计算时一定要明辨真伪,去其槽粕取其精华,反映真实的需求完成预期的工作目标。
(五)通用性、便捷性
云计算的使用平台在提供各项服务时,用户在使用中不会受到空间上的限制,也不会受到时间的约束。用户只要具有访问验证信息就可以自由的使用云计算平台,享受云计算的服务,不会受到系统和平台的限制,具有极大的通用性和便捷性。
三、云数据管理技术
用户通过云计算来分析处理大量的数据信息,云计算的数据管理技术必须要能够满足用户的需求,高效及时的管理分析海量的数据和信息。云计算分析处理的数据具有海量性、不确定性,这对云计算数据管理技术的开发和发展不断提出新的要求,需要积极的构造高效可用的信息数据管理系统。
(一)数据信息的组织管理
数据的组织管理可以采用分布式的系统来访问分析海量的分布式数据,例如GFS技术。这种技术可以在差别不大的各种普通硬件上运行,为用户提供了容错功能,并且为用户提供高效可靠的信息数据并行的存储和访问权限。
(二)数据信息的集合管理
数据信息具有海量性、动态性、不确定性等特点,需要采取分布式的数据信息处理技术来进行采集分析,例如BigTable技术可以用于对海量数据信息的处理,提供高效的服务。
(三)数据信息的分析管理
应用云计算的数据管理技术是为了分析和挖掘相关的数据来满足用户的需求。因此需要运用不同技术和布局来从海量的数据中提取挖掘有用的潜在数据,并且理解所挖掘的信息数据同时进行分析,为各种应用提供支持。
(四)数据信息的存储管理
以Dynamo技术为例,这是一个具有高可用度的存储系统,具有DHT和数据库的特征,为AWS提供了基础的技术支持,并不直接展示于外网。Dynamo技术设计的存储架构可以使信息数据在框架内均匀的存储,并且各个存储节点之间可以互通,根据数据的具体操作需求在框架内进行转发,具有较强的自主性,而由于有主控点来进行控制,单个节点之间一般不会出现故障。Dynamo技术在存储时还具有一些优点,可以通过提供N、R、W这三个参数结合实际情况去调整实例。N即表示副本的个数,R为可完成的数据信息的成功一致个数,W为完成写入的个数。Dynamo技术可以记录、处理不同版本的对象,将对象的不同版本来提供给技术应用,使应用可以对这些数据信息进行合理的整合和利用。在这一过程中并不要求将副本个数N全部的成功完成,只需要成功读取的个数R和成功写入的个数W两者相加,大于副本个数N,这样就可以保证数据的最终一致性。这种读取方式比写入一次进行多次读取的系统要麻烦一些,但是写入方式变得更简单,也充分满足了用户的需要。同时Dynamo技术也具有负载均衡的优势,由于所采用的DHT方式将需要的信息数据都均匀的存储到每个节点,导致每个节点的数据信息访问量和存储量都大致相同,比较均衡。
四、结语
当今社会处于高速发展的信息时代,各种数据信息在全球范围内传递交换,也就需要开发和利用高效可用的信息传播媒介来适应信息时代的发展,云计算和云数据管理技术正是为此而生。作为新型的信息技术,云计算具有广阔的发展空间也面临着不同的挑战。网络互联网技术的快速发展使云计算和云数据管理技术有了更好的机会和支持,也导致了新型应用系统的开发和应用,因此云计算和云数据管理技术要充分把握机会面对挑战,利用本身的优势和时代的发展来实现进一步的提高,解决应用过程中的技术难题,得到长远发展。
参考文献
[1]刘正伟,文中领,张海涛,等.云计算和云数据管理技术[J].计算机研究与发展,,49(z1):26-31.
云计算的分析与研究 篇3
[关键词]图书馆云计算;研究论文;文献计量分析
一、引言
云计算(cloud computing)是基于互联网的相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。目前,对于云计算的定义有多重说法,但较广为接受的是由美国国家标准与技术研究院(NIST)所给出的定义:云计算是一种按使用量付费的模式,这种模式提供可用的、便捷的、按需的网络访问,进入可配置的计算资源共享池(资源包括网络,服务器,存储,应用软件,服务),这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的交互[1]。随着云计算这一概念的日益推广和普及,关于在图书馆中应用云计算的探讨也不断涌现,使得研究图书馆云计算的文献应运而生。
二、数据来源及研究方法
本次研究的数据来源为CNKI(中国知网)数据库。此数据库平台覆盖面广,内容权威性高,数据更新及时,保障了研究结果的准确度和可靠性。
笔者于2014年12月18日以“图书馆”并含“云计算”为主题进行模糊检索,排除会议、年鉴、通知、散文、杂文及无作者文献等文献后,共检得相关文献664篇。利用中国知网“导出/参考文献”功能,下载各文献的作者、题名、文献来源、发表时间、关键词、摘要、基金等信息,并保存为文本格式及Excel表格格式。以信息计量学相关理论为基础,利用Excel等相关软件对数据进行统计处理,实现对数据的图形化分析处理。
三、图书馆云计算研究情况统计及分析
3.1图书馆云计算研究的时空分布分析
3.1.1文献时间分布分析
确定文献信息数量随时间变化的关系,可以大致地揭示科学发展的某些特点和规律;同时,通过文献信息增长规律的研究,还可以预测文献增长的趋势,从而为科学情报工作未来的发展提供决策依据。[2]
一个学科的成长过程与该学科的文献数量和内容构成有密切关系。研究文献的数量在一定程度上可以反映出该领域的研究水平和发展状况。[3]笔者认为,结合普赖斯所提出的科技文献增长的四阶段理论,由宏观时间概念(即以年份为时间跨度)对该领域文献进行评估,可效判定该领域文献所处的发展阶段,从推断该学科领域发展的成熟度。
由图1可知,我国对图书馆云计算的研究始于2009年,并在經过2009年与2010年的认知与积累后,于2011年取得了较为迅速的发展,但仍处于科技文献增长的萌芽期。
由图1可预测,我国关于图书馆云计算的研究将在2015年进一步得到发展,研究广度将进一步扩大,研究深度将进一步细化,研究方法将进一步成熟。同时,通过对以上文献的研究,可发现我国学术界对该领域的研究热度不断升温,图书馆云计算是图书情报界具有研究价值的新热点。
3.1.2文献期刊分布分析
笔者通过对所获得的664篇文献进行来源期刊分布统计,经过统计,这664篇文献共分布于200种期刊内,包括图书情报、经济、电子科技、软件工程等多个领域,总载文比(即每种期刊的载文平均数量)为3.32,这一比例相对较低,可见目前我国关于图书馆云计算研究的文献分布较为分散,我国图书情报界尚未形成此领域具有影响力的核心期刊及核心期刊群。这一数据也反应了图书馆云计算不仅是图书情报学界的一大新兴研究热点,同时也具有多重社会效应,该领域的研究具有跨学科的特征。
笔者通过利用Excel数据透视表,获得刊载研究图书馆云计算文献数量排名在前20位的期刊,共载文318篇,占全部文献数的47.9%,如表1所示。
这说明了我国对图书馆云计算的研究虽已渐渐进入发展期,但发展程度仍较低,距成熟期尚有较大差距。且载文量第一的《科技情报开发与经济》并不完全是图书情报类期刊,说明我国图书情报界对于图书馆云计算这一领域的研究并未成熟,对该领域探讨尚以信息技术学家为主导,图书情报学家则稍次之。
3.2图书馆云计算研究的引证分析
笔者利用CNKI(中国知网)中检索并按照被引频次排序,获得被引量前20位的文献,如表3所示。
由表3可见,被引频次较高的文献均来自图书情报学核心期刊,其中:图书馆建设、图书馆学研究、图书与情报各载文3篇。就作者而言,被引频次最高的论文为我国著名图书情报学家范并思与胡小菁所撰的《云计算给图书馆管理带来挑战》,此文论述了从云计算环境下图书馆面临的管理方面的挑战及为应对挑战,图书馆学理论界应研究的问题[4],可谓研究图书馆云计算的奠基之作。
就时间跨度看,以上高被引文献均发表于2009—2011年,及我国研究图书馆云计算的起步阶段。这反映了我国图书情报界是在充分考虑多方因素后方将云计算这一概念引入图书馆中,将云计算这一概念引入图书馆是一极具创造性及实用性的举措。但新发表的文献被引频次较低这一现象却反映了近年来部分作者只求数量而不求质量的毛糙的科研作风,这一现象亦值得警醒。
3.3图书馆云计算研究的作者统计分析
3.3.1作者分布分析
nlc202309020216
经统计,此664篇文献中共涉及作者678人,其作者发文量如图4所示。其中,以发文量1篇的作者为主要,占全部作者数的91.11%,远超出正常值水平,这说明图书馆云计算研究是一新兴研究领域,尚未引起学术界的足够重视,因而尚未形成核心作者群。
3.3.2作者机构分析
经统计,此678名作者共涉及单位、机构565个。其中出现频次4次及以上的单位、机构如表7所示。
目前大部分作者来自高校图书馆,且均为普通高校图书馆,无一所“211”高校及“985”高校图书馆,且图书情报界的传统优势单位如:武汉大学信息管理学院,南京大学信息管理学院,中山大学资讯学院等均未出现。这一现象从侧面说明了目前图书馆云环境研究仍属于新兴研究领域,各重点高校,省、市图书馆对该领域仍持观望态度,暂未将对该领域的研究提入科研日程,对图书馆云环境的研究目前虽已兴起,但尚未形成热点。
3.4图书馆云计算研究的主题分析
一篇文献中,最能够反映文献主题的就是关键词。每篇文献都会有三到五个关键词,这些关键词是作者根据文献的内容提炼出来的。通过对关键词的统计分析,筛选出高频关键词,能够利用高频关键词分析领域的研究主题[6]。通过利用中国知网关键词统计功能,对图书馆云计算关键词的分析,排除“图书馆”、“云计算”,得出出现频次前10位的关键词如表8。
由表7可以看出,除“图书馆”、“云计算”外,主要高频关键词为“数字图书馆”及“应用”,造成这一现象的主要原因有二:其一,云计算本身的特殊性,云计算通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源,这一特性与数字图书馆较为相似,两者联系性紧密,因而吸引较多的研究视线;其二,研究者自身的局限性,由于国内引进云计算概念尚未满10年,国内学者,尤其是非信息工程专业的学者,对这一概念尚处于认知阶段,固而对图书馆云计算研究的角度带有一定的局限性。
四、不足及思考
云计算是一项迅速发展的信息技术,引起图书馆界的关注。云計算已不是概念的炒作,而是大型企业的实际运作。图书馆学应该关注云计算,云计算也将给图书馆带来挑战[7]。
纵观前文所述的图书馆云计算研究的相关内容,笔者思考后认为目前图书馆云计算研究存在着以下不足。
其一,图书情报界对云计算这一概念的认知程度较低,多数研究机构尚未将其提上研究日程,研究核心力量缺乏。
其二,研究内容单一,存在重复研究及研究空白。目前,关于图书馆云计算的研究研究主要集中于探讨将云计算应用于数字图书馆日常工作的可行性,缺少对合理可靠的实践模型的构造;且研究主要集中于理论层面,缺少相应实际操作经验为参考。
其三,研究力量分散,缺少合作沟通。目前,在对图书馆云计算研究领域中的合作多只限于本机构、本学科内部合作,缺少跨机构、跨学科间的合作,因而难以弥补知识结构、研究方法上的不足。
其四,研究过于追求速度,在一定程度上忽视了对研究质量的保障。
五、结语
云计算作为一种新型网络资源服务模式,给图书馆的日常工作带来了机遇与挑战。国内目前对图书馆云计算的研究处于上升阶段,该领域的文献数量呈增长态势,核心期刊群及核心作者群亦在逐渐形成。可以预测,随着图书情报界对云计算概念的深入了解,未来对于图书馆云计算研究的广度和深度将不断扩展。
参考文献
[1]百度百科.云计算.[EB/OL]. http://baike.baidu.com/link?url=7c37t1AIHxocFyQUt3uRSmu_SjM5SfZBAo2i1KtrBl4wIfOvD-WwAG9GVP51nYR9JIYIwHP5DD-8mgrqPyuMI_.
[2] 邱均平.信息计量学[M].武汉:武汉大学出版社,2007:39—40.
[3]邱均平.信息计量学[M].武汉:武汉大学出版社,2007:105—106.
[4]范并思,胡小菁.云计算给图书馆管理带来挑战[J].大学图书馆学报,2009(4):7-12.
[5]张立肖.近年来我国网络计量学研究进展分析[J].图书馆建设,2005,(2):34-36.
[6]邱均平,楼雯.我国高等教育质量研究的现状与发展:基于计量学的统计分析结果[J].宏观质量研究,2013(3):95-103.
[7]范并思.云计算与图书馆:为云计算研究辩护[J].图书情报工作.2009(21):5-9.
云计算核心技术研究与分析 篇4
一、云计算的主要特征及架构体系分析
1.1云计算的主要特征分析
云计算主要是基于互联网服务器等提供的动态扩展虚拟化的资源而形成的, 其自身有着鲜明的特征。云计算主要是分布在大量分布式计算机基础上存在的, 从其所具有的特征来看, 其体现在规模的庞大, 以及虚拟化, 高可扩展性、通用性、廉价性等方面。以虚拟化特征为例, 这一技术能够支持用户在任意位置, 使用各种类型的终端来进行获取应用服务, 而这些服务请求是源于“云”, 所以有着虚拟化的特征[1]。
1.2云计算的架构体系分析
云计算架构体系并不复杂, 总体而言分为管理和服务这两个主要部分。管理架构主要分为用户层和机制层以及检测层, 用户层主要用于客户支持及相关管理, 同时具备了服务管理功能;机制层主要用于运行管理及维护管理, 同时也涉及到了安全管理与资源管理;检测层主要对系统进行监控。服务层架构主要有软件服务层, 主要面向于用户并为其提供浏览器服务, 同时可将其与云层应用相关联。然后就是基础设备服务层以及平台服务层, 基础设备服务层与平台服务层可从云计算供应商处得到相关应用并用于储存信息[2]。
二、云计算核心技术研究现状及主要技术分析
1、云计算核心技术研究现状分析。
从云计算核心技术的研究现状分析来看, 所涉及到的层面比较多样化, 其中虚拟化与资源管理层面的研究比较早。虚拟化技术的研究在IBM VM/370就出现了, 这一技术使得一台物理计算机能够进行多台虚拟机的运行, 而在虚拟机上运行的操作系统也不同, 这样就能够达到不同的虚拟机之间较强的独立性。同时在硬件之上的超级管理层, 其在最高优先级上实行的运行, 主要是对CPU以及网络和内存等虚拟化的完成进行负责, 同时对上层的虚拟机提供资源访问接口, 完成虚拟设备的管理。而在云计算的网络拓扑层面的研究是对传统数据中心体系的优化, 当前的数据中心主要是以太网作为典型的架构, 采取三层交换树状架构。其主要由接入层以及汇聚层和核心层构成。传统树状网结构存在缺陷, 就是交换机节点增加节点间的连接也会随之增长, 这样就造成了网络复杂性的增加。但云计算平台的大部分应用是通过网络来实现数据的传输与计算, 这样就提高了其自身的效率。但在云计算平台上带宽成本较高, 所以可通过fat tree拓扑结构连接方式 (如图1) 进行实现便捷的交换[3]。
2、云计算核心技术分析。
云计算核心技术中的海量数据分析技术以及海量数据管理技术、MAP-Reduce编程模型、虚拟机在线迁移技术、虚拟机快速部署技术等, 都是云计算核心技术中的佼佼者。其中海量数据分存技术值得重视, 数据量的发展已经非常迅速, 现有的云数据库系统主要有三种类型, 在这一新兴技术领域中最具代表性的云数据库系统就是CASSANDRA。另外是云计算平台管理技术, 云计算所聚集的资源相对较多, 故此对相应的数据处理就比较大, 这样对服务器的需求数量也就随之增加。通过云计算平台管理技术能够解决实际问题, 同时可以促进服务器间充分发挥协同作用, 以最快的速度进行业务的部署和对系统的故障进行恢复[4]。再者就是虚拟机在线迁移技术, 该核心技术能对整个云计算系统进行有效的管理, 并对其平台的多种服务的实现都具有决定性的意义。从其技术优势上来看, 主要是对均衡负载以及可靠性提供巨大的便利, 在物理机出现负载过重, 通过在线迁移技术就能够将这些负载进行转移, 从而达到均衡负载的作用。
三、结语
总而言之, 随着当前科技的不断进步与更新, 针对云计算核心技术的研究范围也会愈来愈广, 在这一过程中要重点关注安全性和可靠性等问题, 因为只有在安全可靠稳定的运行条件下才能体现云计算核心技术的真正价值。由于受到本文篇幅限制, 不能进一步深化研究, 希望此次努力能起到抛砖引玉的作用, 以待后来者居上。
参考文献
[1]宋庭新, 张成雷, 李成海, 黄必清.中小企业云制造服务平台的研究与开发[J].计算机集成制造系统, 2013, (05) .
[2]李延东, 赵秋爽.IDC的智能化与运营管理系统建设[J].电信技术, 2013, (01) .
[3]黄华祝诗平刘碧贞.近红外光谱的云计算分析系统构架及实现[J].农业机械学报, 2014, (06) .
云计算的分析与研究 篇5
云计算平台是一种基于云计算基础设施和并行架构、通过互联网部署的、以服务形式交付的IT资源池。云计算用户可以在任何时间、任何地点,随时随地按需获取计算、存储、软件、应用、网络等各种IT资源。
1云计算基本特征及应用
云计算是在网格计算技术的基础上逐渐发展起来的,在全球范围内已经得到广泛应用。云计算是大数据在21世纪的典型应用,其以IT资源交付、共享为核心,是一种IT资源配置、交付和管理模式的创新,其资源的汇聚、交付、共享、管理都是基于云计算平台展开。云计算技术是以服务为导向的商业模式创新,以服务模式创新为核心理念和发展模式。
云计算若按照行业应用分类可以归纳为:教育云、医疗云、金融云、工业云、政务云等。教育云是指在教育领域,以云计算技术为依托,在现代远程网络教育的基础上,通过构建区级/县级数据中心,而构建起来的一种新型泛在学习模式。教育云通过有效整合软硬件教育资源,对教师的教学能力和学生的学习方式都是一个巨大的变革。医疗云是在医疗护理领域采用云计算相关技术和服务理念构建医疗保健服务系统。政务云是云计算在政府站建设、政务领域应用的系统建设。金融云是指利用云计算技术将金融机构的数据中心与客户端应用整合到云计算体系架构之中,达到降低运营成本的目的。
2能耗优化与资源分配
云计算的对象规模大,资源与用户需求各异,且数量巨大,所以系统每时每刻都要处理海量数据,任务调度和资源分配是云计算的重点和难点,更是云服务质量高低的重要影响因素。云计算中的资源分配和调度是云计算研究的关键问题之一。
云计算资源调度通常根据一定的资源使用规则,在不同资源使用者之间进行资源调度和任务分配。目前,资源调度策略大多数通过虚拟机级别上的调度技术结合一定的调度策略为虚拟机内部应用作资源调度。由于这些调度算法的时间复杂度和空间复杂度比较高,导致算法运行效率比较低,算法整体性能不理想。传统资源分配方法大都采用预分配的静态资源调度算法,这种算法已经不适应云计算资源的异构性、动态性等特征,而且资源负载能力是动态变化的。国内外云计算资源分配领域研究主要集中在启发式仿生算法、负载均衡机制与时间跨度最小化原则、能耗最小化与能耗均匀化管理等方面。图1为Map Reduce调度模型。
资源管理器将系统调度过程中的所有资源进行全局管理,并对所有资源进行分配,每一个应用的Application Master主要负责相应的资源调度和协调等基本工作。一个应用程序是一个单独的传统的Map Reduce任务或者是一个DAG(有向无环图)任务。
每一个应用的Application Master是一个详细的框架库,它结合从Resource Manager获得的资源和Node Manager协同工作来运行和监控任务。
Resource Manager支持分层级的应用队列,这些队列集群一定比例的资源,根据资源的计算能力和动态负载能力分配适量的计算任务到该节点上,分配结束后将自动从任务等待队列中删除任务。同样,它不能重启因应用失败或者硬件错误而运行失败的任务。Resource Manager是基于应用程序对资源需求进行调度,每一个应用程序需要不同类型的资源,因此需要不同的容器。
3实验测试与结果分析
针对绿色云计算中资源管理与调度过程,在Map Reduce调度模型基础上,本文设计了一种并行Map Reduce资源分配算法。PMRRAA算法的实现步骤如下:
步骤1获取云计算系统中计算节点相关性能参数;步骤2:根据用户访问请求获取资源需求参数;
步骤2:利用Map Reduce资源分配过程,并发访问云计算系统各个计算节点;
步骤3:在云计算系统中选择计算节点参数符合资源需求参数的计算节点,并将所选计算节点的资源分配给所述用户,用于执行相应的访问请求。
步骤4:将用户请求从等待队列中删除,资源分配结束。
本文利用Cloud Sim澳大利亚墨尔本大学网格实验室云计算仿真软件Cloud Sim,对PMRRAA算法和Map Reduce算法者性能进行比较。
图3为两种算法的能耗对比,图4为两种算法系统执行时间比较。通过图3实验结果,不难看出:本文设计的PMRRAA算法的能耗少于Map Reduce算法。图4中,PMRRAA算法的执行时间也比Map Reduce算法少,当系统的任务数量急剧增大后,这种优势表现得更加明显Job Tracker两个主要的功能分离成单独的组件,分别用来进行资源管理和任务调度/监控。
资源管理器将系统调度过程中的所有资源进行全局管理,并对所有资源进行分配,每一个应用的Application Master主要负责相应的资源调度和协调等基本工作。一个应用程序是一个单独的传统的Map Reduce任务或者是一个DAG(有向无环图)任务。
每一个应用的Application Master是一个详细的框架库,它结合从Resource Manager获得的资源和Node Manager协同工作来运行和监控任务。
Resource Manager支持分层级的应用队列,这些队列集群一定比例的资源,根据资源的计算能力和动态负载能力分配适量的计算任务到该节点上,分配结束后将自动从任务等待队列中删除任务。同样,它不能重启因应用失败或者硬件错误而运行失败的任务。Resource Manager是基于应用程序对资源需求进行调度,每一个应用程序需要不同类型的资源,因此需要不同的容器。
4结语
云计算的分析与研究 篇6
【关键词】图书馆 云计算 资源共享 对策研究
1. 云计算的基本原理
云计算的基本原理是:将数据计算分布在大量的分布式计算机上,而非本地计算机或远程服务器中,数据中心的运行将与互联网相似,这使得用户能够将资源切换到需要的应用上,根据需求访问计算机和存储系统。这就好比是从古老的单台发电机模式转向了电厂集中供电的模式,它意味着计算能力也可以作为一种商品进行流通,就像煤气、水电一样,取用方便,费用低廉。但其最大的不同在于,它是通过互联网进行传输的。
2. 图书馆馆际共享与云计算
2.1 图书馆馆际资源共建中存在的问题
(1)基础设施建设滞后。信息基础设施是现代化图书馆开展工作和服务的基础。随着办学规模的不断扩大,一些院校把主要经费投入到教学楼和宿舍的修建上,图书馆的建设相对滞后。业务用电脑及其他现代化设备不足。系统管理软件急需升级或更新换代。同时,图书馆数字资源的共享必须以网络为依靠,一些学校的校园网尚未建成或未及时更新,从而无法满足用户对数字资源的需求。
(2)数字资源相当贫乏。首先是数字化的馆藏资源贫乏。尽管宽带网络已普及,但能用于计算机处理的信息资源及其产品短缺。大部分历史积累的资料、图件、档案尚未数字化。作为信息传播主渠道的大量的中小型图书馆,藏量普遍不足,数字化程度较低,而且拥有自己特色数据库的较少。其次,由于受知识产权的保护,图书馆所用数据库一般只限于馆内使用,而不能作为馆际间数据库信息资源“共享”的基础。“共建”是“共享”的基础和前提,参与馆际资源共建共享的必然选择就是建立特色数据库。
(3)经费紧张制约了图书馆馆际资源的共享。实现图书馆馆际资源共建共享,可以节约总成本,获得更大的资金效益,但是在共建共享初期,因系统整合、管理机制建立、资源流动及回收等需要更多的资金投入,而各图书馆资源普遍紧张,无法挪出更多的经费给予支持。
2.2 云计算在馆际资源建设方面的应用优势
2.2.1 颠覆了传统的信息资源利用方式
云计算的核心是海量数据的存储和计算。由几十万台甚至几百万台计算机构成的计算机群,对信息进行聚合和分布处理,然后通过网络对客户提供服务。这样,用户只需使用电脑、手机、PDA 等终端设备接入互联网,便可获取需要的信息服务。在未来,只需要一台笔记本或者一部手机,就可以通过网络服务来实现我们需要的一切,甚至包括一些个人计算机无法应对的超级计算任务。
2.2.2 提高了信息资源的安全性
使用云计算服务的用户,他们的数据库将不在用户自己的数据中心里,而是位于云中,由服务提供商来维护运行,数据的安全性依赖于云的安全可靠性。云计算提供了最可靠、最安全的数据存储中心,用户不用再担心数据丢失、病毒入侵等麻烦。云服务端由专业的团队来管理信息,由先进的数据中心来保存数据,严格的权限管理策略还可以帮助用户指定的人共享数据。
2.2.3 降低了信息资源的共享成本
云计算服务提供的是按需服务,基于某个特定应用程序的成本不再是用户个人承担而是由所有使用用户均摊。用户只需为自己所使用部分付费,降低了数据运行的建设成本。使用过程中用户只需要通过互联网连接云计算中心,不必购买服务器和存储装置,不需要自行升级软件,也不需要专门的技术团队来维护数据中心的正常运行,从而降低了运维成本。
2.2.4 加强信息资源整合并兼顾个性定制
云计算的基础是“整合”的思想,采用统一的基础架构诸如硬件、软件、服务等,我们在对资源的利用方面不用考虑传输协议、数据结构等对信息资源的整合。简言之,在图书馆领域,各图书馆的各种编目信息、自建资源等可以借由一朵“云”统一结合起来,内容高度融合,用户通过网络获取他们想要的文献,但他们只需要关注获取过程本身,无须理会界面之后的繁复运作,各图书馆的信息资源将得到真正的整合和共享。
3. 利用云计算建设图书馆馆际共享的对策分析
(1)利用云计算建设图书馆馆际共享是一个全新的领域,当前还面临着各种困难,通过前文的分析,并结合当前形式,本文提出以下几点应用对策:
(2)本地存储与云数据中心逻辑整合。当前,完全摒弃本地数据中心依赖于云数据中心建设馆际资源共享既是不可实现的,也是对当前高校已购置资源的浪费。在数据存储平台的建设中,可以采用集中分布式控制模式,将共享需求大、重复利用率高的资源置于云数据中心,自建特色子数据库依旧置于各图书馆数据中心,两者通过网络连接实现数据逻辑整合。各高校数据库都设有 DBMS保持自治性,有自己的控制中心,通过 Web 网络与云数据存储中心连接进行逻辑整合。
(3)设置合理的权限保证云安全。各图书馆本地数据中心设置为私有云,对于私有云中的资源,外部用户浏览下载其资源内容需要通过本地系统的身份验证,并且不能对其数据进行编辑和修改。混合云中的数据可以通过格式转换器转换为用户需要的形式,并可以存入本地私有云中,对其数据的编辑修改可以通过反馈,经系统审核后方可显示。
(4)实现云计算标准化。标准化的基本原理通常是指统一原理、简化原理、协调原理和最优化原理。针对数据利用终端的多样性也需要制定数据转换标准保证馆际资源畅通共享。同时还要针对各种异常制定统一的选择、调整标准,使共享平台达到最理想的效果。
云计算的分析与研究 篇7
如今云计算方兴未艾,但真正部署一个云计算环境应用于生产实践费时费力,投入比较大,并且云计算环境存在诸多安全隐患和漏洞,极容易受到威胁和攻击[1,2]。现在大多数的开源云计算平台都只是针对其中一个层次上的开发应用,那么将各个不同体系的开源云计算平台进行整合,构建具备完整三层体系的云平台是很重要的[3]。
此外,利用此类构建的云计算平台可快速、经济的进行一些安全的模拟仿真,如传统的攻防及安全测评等,所以说,整合筛选多种开源软件构建一个异构的云计算平台具有非常大的创新性和研究利用价值[4]。
1 云安全隐患分析模型
1.1 全生命周期云安全隐患分析模型的构建
在云计算中,有效的安全管理和企业风险控制是从良好开发的信息安全管理过程中得到的。良好的开发信息安全管理过程会使信息安全管理程序一直可依据业务伸缩、在组织内可重复、可测量、可持续、可防御、可持续改进且具有成本效益。在参考分析了美国国家标准研究院发布的风险管理框架及ENISA的云计算风险评估方法的基础上,结合已有的信息安全管理方法,提出了一种基于全生命周期的云安全隐患分析模型——LCSAM模型[5],模型包括五个主要过程,如图1所示。
LCSAM模型主要包括选型风险评估、实验室预评估、现场评估、运营过程评估、报废评估五个关键过程。相对于其他云安全隐患分析评估模型来说,LCSAM模型更符合国内的操作习惯,具有较好的实践性[6]。
鉴于该模型的具体应用情况,主要针对实验室预评估过程进行相关验证。验证方案的主要思路如下:在实验室预评估阶段,综合筛选多种开源软件,组合搭建一套特有的云计算平台,对各应用层次平台的软件产品进行模拟评估和检验。那么,搭建一套对于特定的环境进行快速、经济的分析验证的云计算平台系统是验证方案的关键所在。在部署构建完成该系统后,即可对前面所述的LCSAM模型加以验证,并在此平台上部署一些典型的应用并针对此环境进行云安全隐患的分析研究。具体验证方案如图2所示。
在图2所述模型验证方案中,对云计算平台各层次相应的产品需要进行对比选取,其考虑因素包括产品的开源性、性能稳定性、安全性、兼容性等相关需要关注的影响因子。然后,构建特定的云计算平台,对每个层次上的应用模拟现实产品的真实应用场景,并对各层上需要关注的性能因子进行影响评估,验证确定是否符合评估和检验标准。
1.2 Paa S层安全策略模型的构建
云技术主要来自于一个隐藏内部细节和实现的抽象层。抽象层主要采用的是虚拟化技术,能够很好的使数据快速的迁移,同时平台也具有很高的独立性。目前许多云解决方案的研究者提供了一套具有一定安全级别服务的全局云环境,云计算中的虚拟化技术将允许用户以一种完全透明的方式从一个平台迁移到另一个平台。实际上云平台直接看起来是没有交互操作的。如果存在兼容性问题,它一般仅限于数据互操作性和访问层次。从一个平台迁移到另一个平台一般需要一次新的认证过程,其中涉及一个新的定义或安全概念定义的范式转变、成本和技术支持相关的平台。这其中的诸多限制因素限制了云技术的使用并且降低了原本应有的高效性。为了构建一个更加灵活富有弹性的云环境,一个更高的抽象层次是云安全服务所必需的。
在任何云环境需要交换彼此的平台服务时,要确保云层之间取得Qo S安全机制。已研究的云信任框架主要涉及云服务提供层,信任管理服务层,云服务消费层三个层次。
构建基于Kerberos的云服务提供层、信任管理服务层及云服务消费层三层的信任即服务框架。
(1)云服务消费层Client将获得的TGT和请求的服务信息发送至KDC,此时KDC中的TGT(Ticket Granting⁃Service)将为Client和云服务提供层Service之间生成一个Session Key用作Service对Client的身份鉴定。
(2)KDC将刚才的Ticket转发给Client。因为这个Ticket是要给Service的,不能让Client看到详细信息,所以KDC用协议开始前KDC与Service之间的密钥将Ticket加密后再发送给Client。
(3)为了完成Ticket的传递,云服务消费层Client把之前得到的Ticket转发到云服务提供层Service。由于前面的Client不知道KDC与Service之间的密钥,所以它无法篡改Ticket中的信息。
(4)此时,Service在收到Ticket后利用它和KDC之间的密钥将Ticket中的信息解密出来,从而获得Ses⁃sion Key和服务名,用户地址(IP),用户名,有效期。
(5)如果云服务提供层Service有返回结果,将其返回给云服务消费层Client。
2 平台的构建
2.1 关键技术分析
基于云计算模型以及模型验证方案,本研究课题中模拟云计算平台环境主要包括Iaa S平台、Paa S平台、Saa S平台的设计构建,各层次平台主要遴选目前较为流行的开源软件进行部署搭建。
有的开源Iaa S云平台在分层上做得都比较好;从SOA/组件化/解耦这点上来看,Open Stack和Eucalyptus有优势;在框架和插件设计上,除Eucalyptus较差外,其他平台均有很好的设计,Open Stack的开发平台做得最好,Cloud Stack次之。综合来看,目前Open Stack的设计是最好的,Eucalyptus和Cloud Stack次之。综上所述,对于Iaa S平台搭建选择Open Stack是比较好的。
在搭建的云计算平台中对hadoop分布式计算平台的测试,只需简单地将待分析内容提供给分布式计算系统作为输入,就可以得到分布式计算后的结果。而对于应用程序服务平台Cloud Foundry,主要部署发布已有的应用程序,测试其运行效率和使用情况[7]。
依据云计算平台的通用层次结构划分,建立一个多层次的云计算平台系统。平台依次由物理资源层、虚拟资源层、Iaa S层、Paa S层、Saa S层和云安全攻击与防护组成[8]。
2.2 平台构建过程
(1)硬件设备搭建
系统共使用4台戴尔R710服务器,每台服务器共配备8核CPU,24 GB内存,4 TB硬盘容量,配备一台PC机,另外,环境中配有一台交换机。
(2)网络环境
整个云环境部署在一个局域网络内,服务器网络配置如下所示:
服务器一:控制节点,主机名iaas001,IP地址:192.168.0.50。
服务器二:计算节点,主机名iaas002,IP地址:192.168.0.100。
服务器三:计算节点,主机名iaas003,IP地址:192.168.0.150。
服务器四:物理资源虚拟化设备,安装VMwa⁃re ESXI,IP地址:192.168.0.200。
(3)系统部署结构
PC机客户端的主要作用是对网内服务器进行控制操作,如分布式密码破解客户端操作、DDo S客户端操作等。物理资源虚拟化服务器主要安装ESXI,并直接安装Windows XP及Server 2003等系统虚拟机。在各虚拟机上部署应用,如分布式密码破解、虚拟交换机,虚拟IDS。计算节点和控制节点主要安装Open Stack,并在Opens Stack管理环境下启动相应镜像实例,在启动实例上进行hadoop分布式部署,在此平台上,在各个启动实例上部署传统的应用,如DDo S攻击等。
(4)系统物理结构
该系统在XX中心真实的部署试运行,从图3中可以看到4台服务器整个的运行情况,显示器中显示的是Iaa S层的Open Stack的管理界面。
(5)Open Stack的安装配置
整个安装过程采用离线源码的方式安装Open Stack的各部分组件。因涉及的操作安装过程步骤较多,较为复杂,不在此赘述。
(6)hadoop的安装配置
在系统环境中,采用5台虚拟机实例部署hadoop的分布式环境,其实例启动情况如图3所示。关键安装配置操作如下。
首先,需要设置各实例间的无密码访问,方便后面各节点之间服务的访问通信,关键命令如下:
然后,需要为实例配置Java环境,将事先下载的JDK传入实例,进行安装配置即可。
下一步即进行hadoop的安装,hadoop安装包在相应实例中进行解压即可完成安装,接下来对hadoop/conf文件夹下的各个配置文件进行相应配置,主要配置文件包括masters,slaves,core-site.xml,hdfs-site.xml,mapred⁃site.xml。最后,配置完成后,确保各个节点之间的配置相同,即可进入hadoop/bin目录,输入hadoopnamenode⁃format命令格式化hadoop云计算系统,正常执行后,输入start⁃all.sh命令即可启动hadoop服务。
(7)Nutch的安装配置
首先,需要将下载好的安装包解压到node1节点实例中即可完成安装,接下来只需对其相应的文件进行配置即可正常使用nutch服务,在此环境中主要采用nutch的分布式抓取功能,在rutime/deply/bin/nutch下执行分布式抓取命令,执行chmod+xbin/nutch命令赋予执行权限。
nutch⁃site.xml,regex⁃urlfilter.txt文件的关键配置如下所示:
</property>配置完成后,即可执行爬取操作,关键命令如下所示:
看到map⁃reduce任务成功执行,则配置成功。
3 模型的验证
利用已构建完成的云计算平台,进行安全隐患的模拟仿真,并依次对平台各层次进行应用的评估测试,以此实现LCSAM模型的验证。根据云平台搭建方案,选取开源软件Open Stack作为平台的Iaa S层,那么在该层应用中,主要针对此软件的应用进行入选模拟评估及检验。
3.1 评估验证样本及环境
评估验证样本:主要包括搭建环境中的Paa S模块,主要由hadoop构成。
评估验证环境环境:主要采用的服务器为戴尔R710,24 GB内存,配备5 TB硬盘容量,8核CPU,服务器数量为4台。环境所采用的操作系统为Ubuntu。
3.2 功能验证
对搭建安装的各个功能模块包括hadoop中两个关键组件hdfs,mapreduce进行安装测试验证,采用手工方式逐项安装测试,预期各个功能模块功能安装成功,服务均能正常启动,主要包括数据存储服务、数据计算处理服务等。
本测试仍采用黑盒测试方法,针对功能进行验证。测试过程如下:
(1)针对hdfs组件中的存储功能进行测试验证,存入本地的文件或文件夹到hdfs中,查看是否存储成功;
(2)启动mapreduce任务,测试验证能否正确执行分布式计算处理任务,出现问题查看日志文件进行排查。
测试结果表明,系统正确实现了各个组件模块的功能,并可通过Java自带的jps命令查看各服务进程是否处于启动状态。
压力验证:测试结果表明在当前的网络环境下,启动50个任务,服务响应正常,60个左右服务性能开始下降,与设定目标较为相符,在可接受范围内。
安全性验证:对hadoop服务进行安全性测试,采用手工的方式进行测试,主要针对系统网络安全及数据库安全两个方面测试,预期在现有安全措施及环境下无任何致命性缺陷或安全漏洞泄密,系统服务在自身可控范围内正常工作。通过测试,产品与预期相符,符合使用要求。
3.3 Saa S层应用
(1)云计算攻击
在已构建云环境中,启动多台虚拟机实例模拟DDo S攻击,其实例设置如图4所示。
利用实例进行模拟攻击实验有很好的效果,主要试验过程如下所示。
首先,对DDo S的软件进行测试,将其中的4台虚拟实例攻击机添加进入Autocrat DDo S Client软件,然后,对4台主机的状态进行检测,接下来,远程登录被测主机,查看其本地连接的数量,在攻击软件中点击“开始攻击”之后,本地连接数迅速增加,最后,在停止攻击之后,本地连接数马上下降,即流量迅速下降。
在云环境中,除了需要注意并预防这些传统的攻击手段之外,更要重点关注云计算环境带来的特有的攻击手段,如在云“多系统多用户”的系统中,利用底层虚拟机漏洞进行虚拟入侵。
(2)云计算防护
在已构建的云计算环境中,利用云技术进行安全防护验证,验证示例如图5所示。
图中验证测试主要是对相关的加密文档进行密码恢复破解,其中利用云环境中的多台实例作为agent,进行分布式计算工作。通过在已有云计算环境中进行一系列防护验证及对现有云安全现状进行研究分析,认为下一步云计算安全防护可以主要从“快、全、多”三个方面着手考虑实施。其中“快”是指快速响应的能力、快速规则升级能力、快速部署能力;“全”是指技术覆盖能力、行业覆盖能力、地理覆盖能力;而“多”是指功能的多样性,如正则匹配、统计分析、数据挖掘、快速搜索。
4 结论
针对已有的云安全隐患评估方法,提出了一个基于全生命周期的云安全隐患分析模型——LCSAM模型,力求对云环境中存在的安全问题提出一种可行的解决方案,在本文中,也对模型中的实验室预评估阶段进行了实验验证,初步证明了该模型的有效性。
此外,在已有的信任即服务框架基础上,研究提出了一个基于Kerberos的信任即服务框架实现,并对其加以理论验证,该框架主要关注于Paa S层的安全策略以及云层之间数据的交换或平台的迁移,用于解决云服务提供层和云服务消费层之间的安全信任问题。
摘要:目前各国对于云环境中存在的安全隐患缺乏一个统一标准的解决方案与防控措施,在研究已有云安全隐患评估方法及模型的基础上,提出了一个全生命周期云安全隐患分析模型——LCSAM,详细分析了云计算潜在的安全隐患,构建Paa S层安全策略模型,在已有研究基础上提出了基于Kerberos的信任即服务框架,综合利用云计算关键技术,组合多种开源软件搭建了一套对于特定的环境进行快速、经济的分析并可用于云攻、云防、云测的云计算平台系统,为LCSAM的验证提供了实验环境。最后,在此平台上部署一些典型的应用并针对此环境进行云安全隐患模拟仿真,实现了LCSAM模型的验证。
关键词:云计算,云安全,隐患分析,信任即服务,LCSAM
参考文献
[1]房秉毅,张云勇,程莹,等.云计算国内外发展现状分析[J].电信科学,2010(z1):1-6.
[2]秦中元,沈日胜,张群芳,等.虚拟机系统安全综述[J].计算机应用研究,2012,29(5):1618-1622.
[3]蒋万春,汤立,陈震.虚拟化安全问题探析[J].信息网络安全,2010(8):83-86.
[4]张秋江,王澎.云计算的安全问题探讨[J].信息安全与通信保密,2011(5):94-95.
[5]冯登国,张敏,张妍,等.云计算安全研究[J].软件学报,2011(1):72-83.
[6]王宇宾.基于Cloud Sim的作业调度算法评价模型设计与实现[J].现代电子技术,2015,38(14):12-15.
云计算与网格计算的比较研究 篇8
关键词:网格计算,云计算,体系结构,资源管理,作业调度,资源虚拟化
网格计算是伴随着大规模计算需求而产生的一种能够整合零散资源并实现资源共享和协同工作的计算模式,它的出现解决了很多领域复杂的问题。而云计算在网格计算的基础上发展起来,与网格计算不同,它将计算任务分布云计算部署的资源池上,使连入互联网的用户能够根据需要获取计算能力、存储空间和各种软件服务,是一种通过互联网将数据中心的各种资源打包成服务向外提供的商业模式。
1 网格计算
网格(Grid)一词来自于电力网(Electric Power Grid),网格提出的初衷是希望用户在使用网格时,就如同使用电力这样的基础设施一样方便。网格计算(Grid Computing)的概念最初是I-way项目于1995年提出的[1],其前身是元计算(Meta computing)。早期的元计算被定义为在一个网络环境下用户能够透明地获得强大的计算资源。网格以及网格计算本身目前还没有一个公认的定义。根据Ian Foster博士早期的定义[2],网格是一个集成的计算和资源环境,或者说是一个计算资源池。网格能够充分吸纳各种资源,并将它们转化为一种随处可得的、可靠的、标准的同时还是经济的计算能力,除了各种类型的计算机,这里的资源还包括网络通信能力、数据资源、仪器设备等。
2 云计算
2.1 云计算的概念
目前,对于云计算的认识在不断的发展变化,云计算仍没有普遍一致的定义。号称“网格之父”的美国Argonne国家实验室的资深科学家、Globus项目的领导人Ian Foster在“Cloud Computing and Grid Computing 360-Degee Compared”一文中这样定义云计算:“云计算是由规模经济拖动,为互联网上的外部用户提供一组抽象的、虚拟化的、动态可扩展的、可管理的计算资源能力、存储能力、平台和服务的一种大规模分布式计算的聚合体”。中国网格计算、云计算专家刘鹏给出如下定义:“云计算将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算力、存储空间和各种软件服务[3]。
2.2 云计算的概念模型
图为简化的云计算概念模型[4],虚拟化的资源形成云,通过其提供的服务接口采用按量计费的模式为互联网上的各类用户提供服务,而用户可以使用任何终端,在任何地点接入互联网即可享受云提供的服务。
2.3 云计算与传统IT商业模式
云计算的商业实现与传统的IT商业模式不同。传统的商业模型是用户自己部署硬件资源包括网络设备和各种计算机相关设备,用户对软件一次购买然后在本机无限使用的模式;而云计算是基于互联网的,由厂商建立起数据中心、基础设施和开发平台,并提供资源管理、安全机制、使用监测,用户只需付费购买或免费使用。这样,用户无需在本机拥有软件,也不必购买新的服务器和部署软件,只需一台能够接入互联网的设备,便可随时随地使用云计算提供的各项虚拟资源,享有需要的服务。
3 云计算与网格计算的分析与比较
总的来说,云计算包含了网格计算的涵义,但它也具有着一些网格计算不具有的新的特点,以下从涵盖范围、应用范围、专注方向、体系结构、资源管理、资源调度、作业管理、安全体制等多方面做了全面的分析和比较。
3.1 涵盖范围不同
如图2所示为云计算与网格计算的涵盖范围。Web2.0涵盖了面向服务的应用,而云计算包含了大部分。超级计算机和机群计算更加专注于传统的非服务应用,网格计算涵盖了所有这些领域,并涵盖了一部分Web2.0。
3.2 学院派与现实派
网格计算与云计算的关系,可以和OSI与TCP/IP之间的关系做一个比较,ISO制定的OSI网络标准定义了七层协议,但实现起来却异常困难,而TCP/IP协议对其进行了简化,是一个四层协议,这种简化也带来了TCP/IP的迅速通用和成功。而网格计算在概念上争论多年,在体系结构上进行了三次修改,在标准规范上花费了大量的心力,设定目标远大,实现起来困难。而云计算是网格计算的一种简化形态,它暂时不管概念、不管标准,注重以简洁的方式为用户提供服务。
从这种意义上说,网格计算走的是学院派的路子,云计算走的是现实派的路子。
3.3 应用目标不同
网格一般用于科学计算,为专用领域的问题而设计;云计算是面向用户不同需求设计的通用模式,可提供多种多样的服务满足用户不同的需求,更加商业化。
网格需要根据用户需求先将并行算法写好,并且通过调度系统将作业分解到各个不同的物理节点进行,用户只需将任务提交给网格,等待结果返回。而接入互联网的个体希望的是能够根据需要能够从资源池中申请一定量的资源来部署并使用,而不是将自己的任务提交给整个网格来完成。从这一点来看,网格的构建大多为完成某一个特定的任务需要,这也是会有生物网格、地理网格、国家教育网格等各种不同的网格项目出现的原因。而云计算一般来说都是为了通用应用而设计的,没有专门的以某种应用命名的网格。
3.4 体系结构不同
到目前为止,比较重要的网格体系结构之一就是Ian Foster等在早些时候提出的五层沙漏结构[5],如图3所示。
最底层是构造层(fabric):构造层面向具体的物理资源,主要对这些物理资源进行局部范围内的管理,向上层即连接层提供对这些物理资源的管理和控制界面;连接层(connectivity):主要是为下层的物理资源提供安全的数据通信能力,即连接层为单个物理资源间建立联系,使其具备互操作性;连接层的上面是资源层(resource):它反映的是抽象的局部资源的特征;汇聚层(collective):它的主要功能是将下面已经具备互操作性的单个资源集中起来,协调解决多个资源间出现的各种问题,为协调各资源共同完成某项任务提供基础;应用层(application)和具体物理资源的距离最远,它关心的是上层的虚拟组织可以使用什么样的物理资源,从而解决不同虚拟组织的各种应用问题。
由于云计算采用了成熟的虚拟化技术,因此云体系结构呈现出与网格计算体系结构最大的不同之处在于在底层构造层之上的虚拟资源层包括了虚拟化和抽象化的资源,呈现给用户集成的资源形式;平台层即所谓的管理中间件,提供用户管理、安全管理、资源管理、映像部署等。应用层提供运行在云上的应用和服务。
3.5 资源虚拟化
网格资源指所有能够通过网格可以远程访问和使用的实体,包括计算机软件、计算机硬件、设备和仪器等。计算机软件资源即我们日常计算机中应用到的各种软件如系统软件、应用软件、数据等;计算机硬件资源包括处理器、存储器、硬盘、闪存等;设备和仪器包括各种通信介质、天文望远镜、显微镜、传感器等;云计算在网格计算的思想基础上,结合了成熟的虚拟化技术,把网格计算中已有的各项资源虚拟化为计算资源池、存储资源池、网络资源池、数据资源池。当用户提出应用请求后,上一层的映像机制可根据用户需求将一台主机资源映射到多台虚拟机上,为用户分配虚拟化的资源,从而为用户提供所需服务。
资源虚拟化实现了多个用户之间的资源节点共享,使硬件资源得到复用,从而提高了资源的利用率,并降低了资源成本。
3.6 资源管理
3.6.1 网格计算环境中的资源管理
为了能够向用户提供方便而高效的服务,网格计算与传统的分布式计算环境下的资源管理系统的出发点相同,具备以下三种功能:作业管理、任务调度和资源管理。其中,资源管理是网格计算的核心问题,网格资源管理的任务就是把网格中分散的各种资源管理起来,使多个资源请求者可以共享使用网格中的同一个资源,网格资源管理采用生命周期的管理方式,如图5所示为网格资源的生命周期。
网格资源的生命周期分为以下六个阶段:1)第一步是网格资源向网格资源管理器进行注册;2)资源管理器对步骤1)的注册进行处理,把该资源的注册信息写到网格资源信息数据库中。注册成功之后的资源才能称之为网格资源;3)用户需要某一网格资源时,向网格资源管理器提出请求;4)资源管理器对3)的请求进行响应,从网格资源信息数据库获得与用户请求匹配的网格资源信息,返回给用户;5)用户获得网格资源信息后,与实体的网格资源进行交互,即获取网格资源;6)如果网格资源想要退出网格系统,可向资源管理器发送注销请求。网格资源管理器接收到这样的请求后将资源信息数据库中关于该资源的信息删除。该资源作为网格资源的生命周期就结束了。
3.6.2 云计算环境中的资源管理
对于云计算服务提供商来说,其核心技术是如何对用户申请的计算资源进行分配和管理。如上图所示是一个简单的云计算资源管理部署图。
1)用户通过交互接口以Web Services方式进行访问:服务目录是用户可以访问的服务清单,用户交互接口允许用户从服务目录中选取并调用一个服务;2)用户的服务请求传递给系统管理模块后,它将为用户分配合适的资源,并调用配置工具来为用户准备运行环境;3)云端的系统管理员使用一些系统管理软件和配置工具为用户提供计算和存储资源;4)通过交互接口获取自己申请的服务。
由于云计算采用了成熟的虚拟化技术,因此与网格计算不同的是,云计算将数据中心的资源虚拟化为资源池。通过简化的服务接口,采用按量计费的商业模式,使用户可通过各种终端设备享受云提供的各种服务。通常,数据中心的一台主机的资源可以根据用户的需求映射到多台虚拟机上,因此云计算资源管理需要提供对资源的监测以及主机到虚拟机的映射功能。
3.7 作业调度
作业调度是网格技术的核心价值,网格的目标,是想要尽可能地利用各种资源共同协作完成一个任务。它通过特定的网格软件,将一个大的作业分解为无数个相互独立的的子任务,这些子任务分别交给网格系统中的各个计算节点完成。即便某个节点出现问题,不能及时返回结果,该节点所承担的计算任务也能被任务调度系统分配给其他的节点完成,从而不会对整个任务的进程产生影响。
云计算不同于网格计算,不再将任务分配给各个具体的物理节点进行计算,而是采用成熟的虚拟化技术将主机的资源映射到虚拟机层,将所要完成的任务与所需的资源进行匹配,从而使任务所需资源以一台虚拟机的形式体现。由此可见云计算的作业调度简化了任务与资源的匹配,一个任务可以以虚拟机的形式组织自己需要的资源,更为方便直观,方便个体用户使用。
3.8 专注的方向不同
网格计算专注于超级计算、科学研究、科学计算等领域,主要是将各种资源连接在一起,构成一个网格系统,共同协作来完成单个资源或分散的多个资源无法完成的超级计算任务。其强大的计算能力是其专注一个重要方向。
而云计算是一种商业实现,专注于通过互联网为用户提供各种服务(平台即服务、软件即服务、基础设施即服务)。目前的云计算平台和产品中,通常采用计费服务的模式。对于用户来说,按需购买相应的存储和计算资源,就可以通过客户端或浏览器简单、方便、快捷地使用这些计算资源。如Amazon提供的云计算服务,收费的服务项目包括存储服务器、带宽、CPU资源以及月租费。存储服务器、带宽按容量收费,而CPU则根据运算时长(小时)收费。
因此,云计算面向未来的商业发展,而网格计算专注于未来科学领域的发展。
3.9 安全性的考虑
传统的系统中的安全模式一般是,为用户在他所要使用的资源上建立一个合法的账号,只有通过该账号才能使用资源。但是在网格系统中,存在数量庞大的网格用户和网格资源,致使传统的安全策略难以实现。因此基于用户对资源的安全使用方面的考虑,网格计算环境中网格资源管理器采用了如下的安全策略:用户请求到来时,资源管理器为该用户在资源本地建立一个进行活动的场所———“用户容器”。建立用户容器后,用户就可以在容器内使用资源。用户容器是动态建立的,严格定义了用户拥有的权限和可以进行的操作等。用户容器在资源请求时建立,请求结束后就撤销。
与网格计算不同,由于云计算通过Web2.0提供面向用户应用的服务,而SSL是面向Web应用的安全解决方案,因此,云计算环境通过SSL来创建和管理帐户信息和通信过程,虽然具有实时性和快捷性,但是相较网格计算不具备更严格的安全策略[6]。
4 结论
总之,网格计算旨在整合零散的分布资源并利用各种资源共同协作完成一个任务,云计算旨在将各种资源虚拟化为资源池,随时随地为接入网络的用户提供按需服务。网格计算是云计算的重要基础,没有网格计算的成熟发展,云计算时代也不会如此快的到来。目前国内的许多IT和通信公司都在致力于将云计算应用在目前业务的融合与拓展上,以期能够为用户提供全新的服务。
参考文献
[1]Foster I.Internet Computing and the Emerging Grid[D].J.Nature web Matters,December,2000.
[2]Foster I,Kesselman C(editor).The Grid:Blue print for a New Computing Infrastructure[M].Morgan Kaufmann,San Francisco,CA,1999.
[3]中国云计算.刘鹏:云计算的定义和特点[EB/OL].[2009-02-25].http://www.chinacloud.cn.
[4]百度百科.云计算[EB/OL].http://baike.baidu.com/.
[5]Foster I,Kesselman C,Tuecke S.The Physiology of the Grid:Enabling Scalable Virtual Organizations[J].International J.Super computerApplications,2001,15(3):200-222.
云计算技术的探索与研究 篇9
云计算是指把计算分布在大量的性能较高的分布式计算机上,而不是在本地的服务器或数据中心上,公司的数据中心的运行犹如互联网的运行机制,首先用户可以通过电脑、笔记本、手机等方式接入到公司的数据中心上,之后便可以按照自己的需求进行问访和计算分布式计算机上的资源。它是基于互联网的相关服务的增加、使用和交付模式。简单的可以把它想象成,以前从单台发电机模式向电厂集中供电的模式转换时,把电作为了商品进行流通,而云计算是把计算作为了商品进行流通,不同的是计算是通过互联网进行传输的。
2云计算的优点
一般互联网公司的数据中心的服务器平均利用率只有在5%到20%之间。因为服务器的峰值一般是公司日常的并发量或访问量的好几倍。所以公司在大部分的日常使用情况下,服务器总是过度空闲,产生了资源过度浪费。正如为了满足像春运时的高峰期间的运输需求,铁道部决定每天都像春运一样向全国提供最多的列车,配备最多的乘务员,结果自然是最大的浪费。而互联网服务无法预测哪天春运会到来,使用量会更高,无法提前做好准备。因此云计算就具有一定的优势,具体表现如下:(1)不需要进行技术资源规划,而且资源取之不尽。正如像对于个人用户来说,发电厂的电总是无穷的,总也用不完的。想什么时候开灯,就什么时候开,非常的方便。同样云计算的用户也不需要提前为资源做充分的规划。(2)公司在初期投资时不需要事先在硬件,软件等上面进行投资。如果某个项目非常具有潜力,有市场盈利的可行性,但有时会因为初期投资风险较高而终止。但是有了云计算就可以免去公司初期高额的投资。(3)公司按使用量来进行收费,使行公司初期的投资负担不会很重。并且云计算的用户可以与供应商签订短期合同,所以后期使用中,云计算用户可以随时改变决定,进行调整,比较灵活方便。(4)灵活的IT基础架构。云计算平台上的资源的可以随时随地进行按需分配,动态调度管理。这种模式特别适合于提供短期的、灵活的服务。(5)端到端服务请求管理。云计算平台不仅提供了对业务系统进行运维管理的能力,还提供了针对业务的端到端流程管理。该流程管理可以提供对服务请求的全周期管理,包括订单处理,系统开通、服务计费等等。
3云计算存在的安全问题
3.1使用云计算的用户
云计算为使用云计算的用户和公司提供了方便快捷的服务,但同时也可能因为用户不好好策划,草率跟进项目,盲目需求变更等问题而起严重的后果。
首先如果使用云计算的原因是因为不需要做技术规划,那是一件很可怕的事。就像一个公司或家庭认为电资源是无限的,可以随意使用。这样不但造成巨大浪费,而且可能造成超负荷用电而跳闸或导致火灾的现象,所以要想使用云计算机的用户还是有必要做一下必要的规划。其次,如果公司的每个项目初期投资都很小,不能引起足够的认识,而出现随意启动很多项目。结果不能很好的善始善终。最后,由于后期非常灵活便利,可使用户不停的变更需求,产生较大的管理成本。
3.2云计算服务本身
(1)云外部安全隐患。应用程序安全、物理和个人安全、身份管理、数据保护、时间相应和隐私措施、安全漏洞管理是在使用云计算时应该考虑的首要问题。因为云计算即可以为用户存储和计算海量数据,同是也可以藏匿各类的恶意软件窃取或破坏机密数据。
(2)云内部安全隐患。云计算内部的信息安全隐患包括数据隔离、可审查性、调查支持、特权用户访问、数据的位置、长期生存、数据恢复等。
数据隔离:在云计算这个大环境下,所有云计算用户的数据都是存放在共享环境里。利用加密技术可以起到一定的效果,但还是远远不够的。
可审查性:云计算提供商不肯接受审查,因此用户对自己数据的安全和完整承担全部责任。
调查支持:在云计算的大环境下,很难实现调查非法或不正当的活动。
特权用户的访问:在公司外的场所处理一些关键数据很可能会带来被盗危险。
数据位置:在使用云计算服务同时,用户们自己并不知道数据储存的位置,所以用户应当询问服务提供商是否按照隐私协议提供服务。
长期生存:一般情况下,云计算提供商不会遭到破产或是被大公司收并。不过以防万一用户仍要确认,以致在发生这类问题时,自己的数据不会受到影响。
数据恢复:用户需要询问服务商在特殊情况发生时是否有没有恢复数据的能力,以及恢复数据所需要的时间。
4云计算的关键技术
4.1分布式计算
分布式技术其实质上是一种基于网络的计算机处理技术。一个分布式系统(Distributed System)是一组逻辑和物理上互联的处理单元的集合。其实质就是对资源的系统范围的分散控制,以达到应用程序的协同执行。这种系统不要求单台计算机的功能十分强大,故能降低成本。分布式系统具有快速访问、多用户使用的优点。系统中的每台计算机可以方便快捷的访问其他内部节点的信息文件,它既可以为本地用户的特殊要求服务,也可以为网络中其他用户服务,实现不同计算机之间的通信与协同工作。
4.2虚拟化技术
虚拟化,原本是指资源的抽象化,也就是单一物理资源的多个逻辑表示,或者多个物理资源的单一逻辑表示。具体到服务器虚拟化,就是多个物理资源的单一逻辑表示。正如计算机的架构,虚拟化也是计算机的本质。当PC同时启动使用邮件和Web浏览器等多个应用,这时候可以理解成虚拟化技术,操作系统把PC物理资源抽象化了,将多个应用集中到一个物理资源环境下。因为虚拟化hypervisor是运行在操作系统上层的,所以会被认为有些抽象。
4.3云存储
云存储发展于分布式存储,融合了并行与网格技术,延伸了虚拟化概念,通过对网络中大量异构存储设备的统一协调处理,最终实现了远程存储服务的提供。
摘要:近年来,云计算已成为IT业界最热门的研究方向之一。几乎所有的主流IT厂商都在谈论云计算,既包括硬件厂商(IBM、因特尔等)、软件开发商(微软等),也包括互联网服务商(GoogleAmazon等)。那么到底什么是云计算呢?本文将从云计算的概念、云计算的优点、云计算存在的安全问题和云计算的关键技术四方面进行阐述与剖析。
云计算平台的搭建与研究 篇10
为了解决大数据的存储和分析的问题, 云计算[1]的解决方案应运而生。云计算综合了分布式计算、并行计算、网格计算、网络存储技术、虚拟化技术和负载均衡等传统计算机技术。实质上, 云计算就是通过虚拟化技术将相应的硬件资源和软件资源构建为虚拟化资源池, 通过网络的方式, 按照自身需要获取其中的资源, 根据实际使用量来付费, 并且不用管理他们。当前, 云计算平台众多, 但大多数是商业平台, 而Hadoop是免费的, 它开源实现了谷歌公司的GFS (Google File System) , 采用Java语言编程, 具有Java可移植性强等特点, 从而为研究云计算提供了平台。
2 Hadoop介绍
Hadoop[2]是Apache的一个开源分布式系统架构, 具有低存储成本、高效率、高容错性、高扩展性及高可移植性等主要优点, 它可以在大量廉价的普通PC机器上搭建起分布式集群, 通过分布式集群来存储和处理海量数据。
Apache Hadoop项目包含许多个子项目, 下面我们主要介绍本课题所用到的几个子项目。
2.1 HDFS
HDFS[3] (Hadoop Distributed File System) 是Hadoop分布式文件系统, 它采用主/从架构, 由一个控制节点 (Namenode) 和多个数据节点 (Datanode) 组成。其中, 控制节点是中心服务器, 负责管理文件系统的命名空间以及客户端对文件的操作, 同时负责建立数据块和数据节点的映射关系。数据节点负责管理本节点上的存储, 响应客户端的读写请求, 同时在控制节点的统一指挥下进行数据块的创建、复制和删除。HDFS的工作流程及架构图如图1所示。
在H D F S中, 一个大文件其实被分成一个或多个数据块, 数据块默认是64MB, 存储在数据节点中, 每个数据块都有一定数量的备份, 备份数是可配置的, 默认备份数是3。通过这种方式, 来提高数据安全性和可靠性。
2.2 HBase
HBase (Hadoop Database) 是Google Bigtable的开源实现, 是一个面向列的分布式数据库。HBase就是为存储和快速读取海量数据而专门设计的。利用HBase技术可在廉价的PC服务器上搭建起大规模存储集群。HBase不是传统的关系型数据库, 它采用的是基于列存储模式而不是基于行存储模式, 基于列存储的好处就是数据库中表的数据按每列存放在物理相邻的存储单元里, 查询数据时只查询所在的列, 不用把整行数据都读取出来, 这样就能极大的降低I/O的开销。
2.3 Hive
Hive是建立在Hadoop基础上的一个数据仓库工具, 它将结构化数据文件映射成一张数据表, 并提供了类似SQL语句的查询功能, 通过类似SQL语句直接编译成Map Reduce任务, 对于那些不熟悉Map Reduce编程模型的用户有很大的帮助。
Hive主要由以下几部分组成:用户接口:Client, CLI和WUI。其中常用的接口是CLI。元数据存储:为了避免多个用户建立不同的元数据, Hive将元数据存储在共享的数据库服务器中, 如mysql、derby。元数据包括表名, 表的属性, 表的列属性, 表的数据所在目录等。解释器、编译器、优化器、执行器:前三个器完成类SQL语句从词法分析、语法分析、编译、优化及查询计划的生成。生成的查询计划存储在HDFS中, 由执行器调用执行。Hadoop:Hive的数据都存储在HDFS中, 大部分查询是由Map Reduce完成的。
3 云计算平台的搭建步骤
3.1 硬件和软件配置
云计算平台由一个控制节点 (Namenode) 和三个数据节点 (Datanode) 组成, 每个节点就是一台普通的PC服务器。所有节点都配置ubuntu10.04版本的Linux操作系统, Hadoop1.0.4的集群框架, JDK1.6.29的JAVA环境。
3.2 Hadoop、HBase、Hive环境配置
配置Hadoop、HBase、Hive环境首先需要配置Hadoop中的几个文件:hadoop-env.sh、hdfs-site.xml、core-site.xml、hbase-env.sh、hbase-site.xml、regionservers、hive-env.sh、hive-site.xml, 具体配置参见文献[5]。
3.3 HBase数据库设计
我们在userinfo表中添加1亿条数据, 以便进行下面的性能比较。具体数据库设计如下Userinfo表所示。
其中, Row Key:行键, 表的主键, 表默认按行键升序。Time Stamp:时间戳, 每次操作数据所记录的时间戳。Coulmn Family:列族, 表在水平方向可以有一个或多个列族, 一个列族可以由多个列组成, 在这里列族只有userinfo, 列族下面有四个列id, name, sex, city。
4 云计算平台的优势
4.1 快速查询
我们通过针对1亿数据进行复杂SQL查询, 将云计算平台与Oracle进行响应速度比较。查询语句如下:SELECT city, count (1) from userinfo Where city like‘%南昌%’Group by city Order By count (1) DESC;得出结果是:云计算查询时间仅需92秒, 而Oracle查询时间为365秒, 足足提高了4倍。
我们再通过单条SQL语句来进行比较。查询语句如下:
SELECT*from userinfo Where id=‘123’测试结果是:云计算查询时间仅需0.164秒, 而Oracle查询时间为0.796秒, 足足提高了5倍。
4.2 高容错性
与传统的关系型数据库不同, 云计算平台节点出现宕机、系统崩溃和网络故障都是属于常态的, 任何一个节点出现故障都不会中断用户的当前操作, 也不会影响数据的完整性。在整个节点正常的情况下, 执行select count (1) from userinfo, 其结果为220639254 rows。
场景1:先手动拨除主机名为hadoop_2的节点的网线, 再执行上述SQL语句, 结果为220639254 rows。场景2:查询过程中拨掉节点网线, 同样执行上述SQL语句, 结果为220639254rows。
手动拨除主机名为hadoop_2的节点的网线, 30秒后监控报警提示。重新插上节点的网线, 30秒后监控中显示恢复正常
5 结论
本文基于Hadoop+HBase+Hive分布式技术搭建起云计算平台, 云计算平台所有节点都是采用廉价的普通PC机器。整个云计算平台具有低存储成本、高存储效率、易于实现等现实优点。在云计算平台基础之上, 我们做了与Oracle数据库查询响应速度比较和云计算平台出现故障两个实验, 结果表明, 云计算平台在海量数据下查询性能优于Oracle和出现故障能快速自我修复。
参考文献
[1]张建勋, 古志民, 郑超.云计算研究综述[J].计算机应用研究, 2010.27 (2) :429-433.
[2]朱珠.基于Hadoop的海量数据处理模型研究和应用[D].北京:北京邮电大学, 2008:32-40.
云计算的分析与研究 篇11
运用云计算的重要意义
传统会计信息化建设模式需要企业购买大量的网络和软硬件基础设施,建设时间长,同时还要消耗大量的人力和物力。基于云计算构建企业会计信息化管理体系将改变企业会计信息化建设的实施模式,对中小企业会计信息化建设产生重要而深远的影响。
成本显著降低。云计算基于互联网的超级计算模式,通过一系列技术实现网络和计算资源的规模化效益,让IT资源可以像水电一样方便的获取,带来一种新的业务形态和新的服务经济模式。基于云计算的会计信息化模式,企业不需要购置软硬件等设施,避免了中小企业初期的大额投资,只需花费较少的成本就可以享受到优质高效的会计信息化服务,同时还将使中小企业摆脱会计信息化建设维护的繁琐工作,使其更加注重于价值增值的业务活动。
满足个性化和灵活性。在云计算的基础上诞生了云会计,可以为中小企业提供SaaS、PaaS、IaaS三种会计信息化建设模式,企业可以根据自己的业务需求选择相应的建设模式。SaaS指软件即服务,企业根据自己的会计信息化业务需求,以模块化的形式向云会计供应商定制相应的会计信息化软件,供应商以服务的方式提供给企业使用。PaaS指平台即服务,云会计供应商向用户提供的是云会计应用产品的开发运行平台,用户通过使用供应商提供的开发环境自主开发满足企业会计信息化业务需求的会计云服务。IaaS指基础设施即服务,云会计供应商给企业提供服务器、计算机网络及数据中心等会计信息化基础设施,并负责基础设施的维护,企业只是在租赁的基础设施上运行自己的会计信息化程序。企业可以按需选择,按需定制,实现个性化和多样化服务。
提升交流共享水平。传统信息技术模式容易形成信息孤岛,同时面对瞬息万变市场中的海量数据又不能及时挖掘和分析,造成资源浪费,制约着企业经营决策的科学性。云计算下则可便捷解决这些问题,只需在服务器群里把会计信息及时通过云计算发布,云计算将会以高效快速的方式进行数据分析处理后再发送到用户,用户利用互联网即可在多设备之间移动共享信息,加强部门之间的协同作用,实现动态的、可伸缩扩展的服务。
解决人才短缺问题。随着会计信息技术不断发展,企业对会计信息化专业人才需求越来越多,但工作实践中既懂财务又精通信息的人才少之又少,中小企业更加面临人才短缺的窘境。基于云计算下的企业会计信息化建设,企业自身没有服务器,财务软件都放在云端运行,由服务商负责管理和维护,一旦出现问题告知服务商即可,极大地缓解了对人才的需求,省去聘请高技术人才,也不会有一旦人才流失给企业造成损失的顾虑。
推进过程中存在的问题
利用云计算推动中小企业会计信息化建设的重要性不言而喻,而且优势明显,可以帮助中小企业以低成本快速建立起与大型企业一样的会计信息系统,但是在现实推进中面临一些难题。
中小企业认知不足且持观望态度。当前政府和财政部门在不断加强推广云计算,但中小企业仍举棋不定。一是许多中小企业对云计算服务认知度不够,对于选择何种云服务并没有深入的了解,甚至相当一部分中小企业误认为,云计算会自动解决他们的离线问题。二是许多中小企业对云计算服务持观望态度,先看看其它企业使用云计算服务的运行效果,然后再作打算。另外,中小企业会计从业人员对传统会计信息化软件的使用偏好,一时难以让其适应在线会计软件应用。
中小企业对安全问题存在担忧。数据安全是中小企业管理者尤为重视的问题,也是企业不愿使用云计算的重要原因,也成为很长时间以来阻碍中小企业运用云计算进度的主要结症。云计算平台中存放着大量的企业核心会计和经济业务数据,一旦数据毁损、丢失,后果不堪众多设想。云计算模式下有可能多家企业的财务数据均存储在一台服务器中,中小企业担心的问题很多,包括云服务商故意或者无意授权其它企业员工获取财务数据、黑客盗窃核心机密财务数据、病毒入侵数据库导致数据泄露、云服务提供商的员工进入数据库篡改、出现软硬件配套基础设施和网络服务故障时数据备份、云服务商破产倒闭后数据的保存和销毁等等。
技术问题有待进一步解决。我国的云计算产业起步较晚,尚属于新兴产业,落后的配套基础设施和网络带宽都影响云计算的快速发展。目前国内云计算服务商没有完全掌握核心技术,云平台的财务软件开发也不完善。大多数云服务软件运营商提供的财务服务资源较少,公共局限性大,有关财务方面的应用是基础层面,难以满足企业的全面财务管理需求。由于出现时间段,操作流程较复杂,一些中小企业虽然把云计算引入了会计信息化建设,但在使用过程中抱怨比较多,影响了推广。
加快推动工作的建设对策
云计算技术的兴起给中小企业会计信息化带来了机遇和挑战,将成为中小企业会计信息化的未来发展趋势,我们应顺势而为,加快推进,进一步推动中小企业繁荣和发展。
加快云计算平台建设。加快制定实施基于自主核心技术的“中国云”总体技术方案和建设标准,建设国家级云计算平台,引导部门、地方和企业,形成不同规模、不同服务模式的云计算平台,鼓励国内IT厂商积极进行云计算技术创新,建设“云计算平台示范工程”,规范云计算平台自主研发工作,逐步培养一批综合实力强、技术水平高、具有较大规模和发展潜力的云计算平台供应商,加快构建自主可控的“中国云”。
加大信息化基础设施建设力度。云计算平台的发展和应用有赖于高速、可靠、低成本的网络性能,中小企业利用基于云计算的会计服务质量受到接入网络带宽的直接约束。加快实施“宽带中国”战略,组织实施国家新一代信息基础设施建设工程,推动宽带网络光纤化改造,加快提升移动通信网络服务能力,促进网间互联互通,大幅度提高网络访问速率,有效降低网络资费,完善电信普通服务补偿机制,使互联网下沉为各行业、各领域、各区域都能使用,人、机、物泛在互联的基础设施。
进一步提升基于云计算的财务会计应用与服务能力。云计算模式下的面向中小企业财务会计应用要以中小企业的会计需求为核心,不再像以前的面向中小企业财务软件只是提供简单的日常记账、管理资金等,要根据中小企业实际需求不断完善后续服务。除了满足中小企业日常的财务管理需求外,云计算服务商还应逐步增加基于云计算的在线财务分析、预测、决策支持等功能与服务,将会计信息化软件的功能和服务向更为实用、更为深入的层次发展。此外,云服务提供商还需增加云计算软件自主开发的模块,提供灵活的自定义功能和在线定制服务,以满足中小企业的个性化需求,能让中小企业根据自身的业务特点和需求变化来随时调整与之相匹配的会计信息化软件功能和服务。
强化数据安全管理。云计算在会计信息化建设的过程中需要企业树立安全防护意识,与云计算服务运营商做好对接,做好监控工作,确保公司财务信息的安全。在云计算的服务平台或者是财务软件系统的管理上,重点通过访问控制、木马防御、反病毒部署等措施来提高整个会计信息系统的安全水平,特别是要加强用户登录系统时的身份识别,对于进入财务信息系统的人员进行严格限制,对其身份进行全面了解,以防财务信息泄露;同时云计算运营商可以参照银行系统的相关做法,通过分级控制以及流程管理对企业的相关数据以及程序进行管理,为企业会计信息化体系的建设提供安全的使用环境。此外,企业还应该对云提供商提出明确的商业保密要求,可以通过签订保密协议的方式,明确相关的违约以及侵权责任,进而避免在云计算模式下企业的会计信息系统出现商业秘密或者是核心经营数据被窃取、非法披露以及使用的问题。最后还要做好财务信息数据备份工作,以防数据丢失问题的出现。
加强培训和人才队伍建设。政府部门要通过政策引导、营造环境、组织培训、提供服务等加大对中小企业信息化建设的扶持力度,促进云计算技术在中小企业大规模普及和发展,帮助大多数中小企业迈入云计算门槛,共享信息化的成果。对于中小企业而言,重点是加大对员工云计算环境下财务会计管理的培训,提高实际操作能力。云计算系统的操作过程比较复杂,在日常工作中,只了解一定的理论知识是远远不够,相关企业必须加大对员工的管理力度,多开展有关云计算系统下财务管理工作的培训活动,鼓励员工积极参加,增加其实际操作的机会,提供他们的动手能力。
云计算的分析与研究 篇12
作为一种典型的商业计算模型, 云计算在实际的应用过程中, 通过调用规模庞大的计算机资源池, 为用户提供了远超出服务器能力的计算量, 而这里所说的资源池, 我们将其形象的称之为“云”。通过该技术的运用, 用户能够有效的调动大量的网络资源, 因此在细节的处理方面则能够有效的提升效率, 使其能够投入更多的精力于技术的创新和降低成本方面。
2 安全风险分析
(1) 计算模式所引发的安全风险。在具体应用过程中, 由于用户将所需要使用的信息上传到云计算服务商处, 那么该数据的有限访问权就归属于服务商。而在实际上, 由于网络风险、非法访问以及操作人员本身的操作技术问题, 这些信息的安全性无法得到有效的保证, 这对于用户来说是非常危险的。例如, 用户数据没有被盗卖给其竞争对手、用户使用习惯隐私没有被记录或分析等等问题的存在, 都是云计算模式所带来的隐患之一, 这对于该技术的推广和应用显然是非常不利的。
(2) 管理方式引发的安全风险。在云计算服务平台中, 用户所获得的数据是通过租用的方式获取的, 这些资源在实际的应用过程中按照物力资源的多寡绑定起来。而在云计算技术的因公过程中, 由于多租户功所使用的资源都是共享的, 因此不同的虚拟资源在具体的应用过程中非常容易被绑定到同一个物力资源上。这种情况的存在, 对于云计算本技术本身所提倡的加强资源利用效率、提高用户使用体验显然是非常不利的, 假设资源存在漏洞, 那么用户的数据安全也就无从保障。基于上述情况, 如果在云计算技术的具体应用过程中, 无法真正意义上的隔离不同用户的数据, 那么云计算服务商就没有证据来证明自身所提供的服务在安全性方面是有保障的。
(3多层服务模式引发的安全风险。正如上文中所介绍的, 具体应用过程中, 云技术服务商本身也需要从其他服务商处购买相应的服务。而在用户的使用过程中, 所调用的资源来自于多个服务商, 这种多层转包实际上增加了用户的风险, 尤其是在这种复杂的网络资源使用过程中, 安全策略的选择成为一道新的难题。
3 安全架构分析
3.1 基于可信根TPM的TCCP安全架构
在本文中所论述的可信平台模块TPM从本质上来说是一种应用范围相对较广的加密芯片, 一般情况下可以通过在通用硬件上的捆绑来实现其作用。当前阶段该芯片的使用数量已经超过二十亿。以云计算环境为基础, 是一种加密芯片, 可以捆绑在通用硬件上, 目前全球采用TPM芯片的终端已经达到了20亿。针对云计算环境, TPM芯片应提供以下服务: (1) 完整性度量, 实际上就是为用户提供一个完整的验证机制, 通过该机制来保证非法访问能够被阻止; (2) 内部资源授权访问, 通过该芯片的应用, 能够利用所提供的授权协议来保障用户对资源调动的权限, 在网络环境安全的前提下, 能够有效的实现对资源的共享和利用。
云安全计算环境安全的保障, 首要的条件就是使用主体之间的信任, 这是云计算技术能够出现并发展的基础前提。在实际的应用过程中, 应最大限度的避免安全威胁得逞。在架构的典型代表为基于TPM可信平台模块的云计算安全架构。
这里所说的可信根是一种保障资源使用主体之间能够达成相互信任的模块, 具体应用过程中一方面能够对行为结果的有效性和安全性属性进行界定, 同样还能够对所有的非授权行为加以阻止, 上述特点的存在, 被认为是提高云计算整体信息安全水平的重要基础。TPM在大规模的应用中, 其安全性得到了检验, 在当前阶段可信计算信息系统的可信根的应用方面得到了社会各界的认可。在TCCP中, 按照流程进行操作之后, 能够得到一个基于TPM的封闭虚拟环境, 而在用户提供与之对应的网络密匙之后, 系统能够对用户的访问权限进行验证, 这对于云计算运行空间的安全性的保障所具有的积极作用是不容忽视的。
3.2 基于隔离的安全架构
用户通过对网络虚拟资源的租用, 实际上都被限制在一个相对独立的环境之中, 这样一方面保证了用户信息的安全, 同样也有效的规避了用户在调用资源过程中所造成的彼此影响的问题。基于隔离的云计算安全架构实际上主要集中在软件隔离层面。
当前阶段, 该方案能够得以顺利的实施, 虚拟化技术的发展功不可没。可信服务平台的统一隔离方案就是其中的最佳代表。按照云计算运行环境中的隔离策略, 能够在包括网络、系统在内的多个环节实现隔离, 并利用高级的虚拟化技术, 用逻辑层的隔离来代替物理层的隔离, 并保证最终的隔离效果和物理层隔离一致。
3.3 基于安全即服务的安全架构
由于在具体操作过程中, 云计算平台上每天都要进行着大量的服务, 因此必然要求有多重服务功能作为支撑。而由于执行的环境和目的的不同, 在用户的使用过程中也必然面临着不同的安全问题。如网络传输过程中需要面对通信环境的威胁、工作流控制过程中也有一定的访问控制方面的问题。
租户业务本身所具有的不同, 导致所提供的安全措施也具有巨大的差异性。而如果简单的设置一个统一的安全配置, 一方面极大的浪费了系统资源, 另一方面也无法真正意义上的为所有的租户提供相应的信息资源的支持。
SOA技术的应用, 能够有效的整合现阶段的软件功能模块, 从而为用户不同需求下的安全措施的提供奠定坚实的基础。SOA技术的应用过程中, 要求服务和系统形成一个典型的松散耦合, 从而有效的将功能模块的作用分离出来, 并在设计之初就对不同功能模块之间的数据交互提供了一个规范的模式, 这对于提高用户使用体验显然是非常有用的。
4 小结
作为当前阶段一项发展迅猛的新型技术, 云计算在发展的过程中取得了辉煌的成就。但是由于监管、技术等方面客观存在问题, 云计算也面临着越来越严重的安全技术的挑战。这种情况的存在, 需要我们广大的信息技术工作者做出切实的努力。同时, 云计算的安全问题不仅仅是技术层面上的问题, 还涉及到包括法律在内的诸多层面, 需要社会各界都给予足够的关注和重视, 通过共同的努力, 将云计算所带来的便利带到每一台电脑、服务器上来。
参考文献
[1]刘鹏.云计算[M].北京:电子工业出版社, 2011.
[2]郑昌兴.云模式下的信息安全探讨[J].信息网络安全, 2011.
[3]张秋江, 王澎.云计算的安全问题探讨[J].信息安全与通信保密, 2011.
[4]雷蕾, 何明, 姚建文.云计算技术及其安全性研究[J].计算机安全, 2010.
【云计算的分析与研究】推荐阅读:
云计算的安全性分析05-23
云计算安全问题分析10-23
云计算及应用前景分析10-10
云计算下网络安全分析08-21
云计算技术的发展研究06-25
云计算技术研究的重点10-26
云计算中的云安全研究05-19
密度计算与分析05-24
云计算安全研究06-05