云存储技术与标准化

2024-09-18

云存储技术与标准化（通用10篇）

云存储技术与标准化篇1

摘要：在云存储应用中, 安全虚拟化和安全网络为云存储服务提供了基本的保证。研究基于云计算的虚拟化安全和存储网络安全, 目的在于基础设施云服务中更加合理利用网络与存储资源, 为云存储的安全应用提供参考和保障。

关键词：云存储,虚拟化,网络,安全

一、引言

云存储是以存储设备为核心, 通过应用软件对外提供数据存储和业务访问服务[1]。云存储安全的关键技术研究中, 又以虚拟化安全技术和存储网络的安全技术为研究核心之一。

二、云存储技术之虚拟化的安全

虚拟化技术在逻辑上分离了物理设备与操作系统和应用软件, 基于虚拟化的计算资源调配可使有限的硬件和软件资源按需重新规划分配, 灵活扩展硬件容量, 简化软件配置和资源的访问与管理, 提高硬件与软件的综合效率和应用能力[2]。

基于虚拟化的云存储应用环境中, VM Hopping可以访问被接入宿主机的存储和内存;VM Escape攻击可获得Hypervisor的访问权限, 从而对其他虚拟机进行攻击[3];通过管理平台进行跨站脚本攻击、SQL入侵;拒绝服务攻击会获取宿主机资源, 造成系统拒绝客户所有请求;Rootkit能够获得Hypervisor的管理员级访问控制权, 进而取得整个物理机器的控制权[4];在虚拟机迁移过程中, 随着虚拟磁盘的重建, 攻击者可改变源配置文件和虚拟机特性[3];虚拟机的镜像安全漏洞、生命周期的复杂性和故障会导致其承载的数据和服务不可用和控制难度。

因此, 可以将所有虚拟机全部安装防毒软件或杀毒软件;提高容错监视服务器的利用率, 避免服务器过载;在数据库和应用层之间设置防火墙, 防止虚拟机溢出;使用可信平台模块;为虚拟服务器分配独立硬盘分区, 并使用VLAN技术和网段划分, 对虚拟服务器逻辑隔离;使用VPN在虚拟服务器间通信;按计划备份, 进行虚拟化的灾难恢复;监测分析网络流量确保存储网络安全运行;通过可信第三方机构的安全认证和监管。

三、云存储的安全网络

云存储服务的应用中, 其网络防护不当会导致用户私密数据被非法访问;云存储网络应用在服务提供商的控制下, 用户无法通过网络监管自己的程序和数据的使用情况;网络传输协议和数据移动过程容易被窃听和分析;云存储服务平台中的软硬件故障和其他灾难会导致服务的异常终止和数据丢失;云存储集中存储的大量数据容易引起攻击者的注意;基于虚拟化技术的访问控制、认证和授权的实现更为困难;云存储中大量廉价计算资源和数据资源可能成为攻击者的工具。

由虚拟机监控器实现基于存储区域网络及应用层的域分割为寻址提供了逻辑隔离, 可以在虚拟的网络域执行全面的状态监视以及其他网络安全监测;如能承担足够资源开销, 可由服务提供商完成网络访问控制和安全防火墙服务;使用SSL、IPSec、数字签名等技术对传输中的数据进行有效加密;选择使用安全传输协议;加强安全日志审计和应用基于网络的入侵检测和防御系统;及时修补虚拟机实例配置和迁移中的管理漏洞和补丁;实现存储网络信任边界的通信控制;限制访问管理程序及其他虚拟化层面;阻止所有到虚拟服务器的端口;限制应用程序栈功能, 加固镜像, 限制主机所有攻击面;防止未授权访问;在镜像中除解密文件系统的密钥外, 不包含其他身份认证作证[5];保护访问主机私钥, 从数据所在的平台中隔离密钥;关闭不必要的服务。

四、结束语

随着云服务层次的提高, 基于云存储的虚拟化安全技术与网络存储安全技术为云存储的发展提供了有效的保障。研究可信的虚拟化云存储将是提高云存储服务的主要方向之一。

参考文献

[1]黄晓云.基于HDFS的云存储服务系统研究.大连海事大学.硕士论文.2010年6月

[2]黄振华.基于云计算的虚拟化存储技术研究.硅谷.2012年第20期.24, 71

[3]房晶等.云计算的虚拟化安全问题.电信科学.2012年第4期.135-140

[4]Hanqian Wu, Yi Ding, Winer Chuck, et al.Network security for virtual machine in cloud computing.Proceedings of 5th International Conferenceon Computer, Sciences and Convergence Information Technology (ICCIT) .Seoul, Korea.2010.18-21

[5]Tim Mather, Subra Kumaraswamy, Shahed Lati.Cloud Security and Privacy.刘戈舟, 杨泽明, 刘宝旭译.机械工业出版社.2011年5月

云存储技术及应用研究篇2

关键词：云存储；技术研究；未来发展

中图分类号：TP333 文献标识码：A 文章编号：1674-7712 （2013） 24-0000-01

我们知道，现在各大市场上充斥着平板、智能手机、笔记本电脑、台式电脑等各个网络设备。而且这些设备的价格也正在不断的降低，无论是哪个阶层的人群都有能力消费起这类的科技产品。正是如此，人们所使用的网络设备，也不在局限于哪台、哪个地方的网络设备，如何才能够满足人们在不同地点、不同时间对于数据的便捷访问的需要，是现今网络技术发展需要解决的难题所在。而云存储技术就是在这样的一个环境下孕育的。

一、云存储技术的发展历程

（一）云存储技术在国外诞生

中国的计算机科学技术起步较国外来说，实在是太晚。中国现今的计算机科学技术和国外的计算机科学先进技术相比，还无法并驾齐驱。2008年，这也是中国首次举办奥运会的年份，这年，世界上云计算技术开始浮现。也就是紧跟着云计算技术发展的节奏，云存储技术也慢慢走入了人们的视野。各大internet公司，如IBM，苹果，谷歌等开始开发属于自己的云存储技术。关于云存储的存储模式，现今市场上所流行地一般有两种：一是文件的大容量分享方式；二是云同步存储模式。相信各位网民在网上冲浪的时候，总会发现自己身边的各个软件开始增设云同步、云存储的服务。例如360安全卫士就增设了云盘、网易也是不甘落后，增设了云附件。现今，云存储技术发展领域的竞争激烈，各大公司为了推广自身的云存储技术，开始设计出仅和自身旗下产品相适应的云存储技术，云存储技术已经和它们的电子产品进行绑定。例如苹果的icloud就仅仅只是面向于ios用户。

（二）云存储技术在国内崭露头角

1.云存储技术“前途无量”

云存储技术是一个新兴的产业，同样也是备受各大公司、专家学者的青睐。从2008年云计算开始到现今，云存储技术似乎已经是为各大网民用户所熟悉、所接受。例如我国IT公司巨头腾讯、金山、迅雷等，无论是专攻于播放器、还是专攻于网络安全类的IT公司已经是开发出云存储功能，关于这点相信大家在日常生活之中也能够切身体会到。而且，就现在的网络电视机上也正是在普遍地使用着云存储技术。可见，无论是哪位商家都想要动这一块奶酪。云存储技术的发展迅猛之势，用“一夜风靡”来形容也不过分。

2.机遇与挑战

国内的云存储技术虽然发展速度快，但是必须要清醒地是，我国的计算机科学技术本身的底子就不是特别扎实，再加上这么快的发展速度，其的质量问题很是令人担心。云存储技术的研究发展在我国目前仍旧只能够算起步阶段，市场的发展状况也是没有国外的那么稳定，未来发展之路仍旧不好走。国内的网民对于SSP还是没有完全信任，网民在上网时，仍旧存在自己的信息可能是否被泄露的担忧。纵然现今各大商家已经推出了云存储技术服务，但是也是鲜有几个网民是它忠实粉丝。对于商家和网民之间的信任度的建立，不是一两天的工夫，这需要日积月累的交流沟通之后，才能够建立起来。由此可见，云存储技术的发展之路，前路漫漫，荆棘丛生。

二、云存储技术发展的瓶颈

安全性问题：如前所述，虽然云存储已经是遍布了网络市场，但是还是没有能够得到人们的广泛使用。一些企业或者单位部门，根本就无视于云存储技术的使用，还是数据存储于自己私人的光盘、U盘之中。究其根源，还是在于它们对于“云”的不了解，不放心。毕竟网络上因数据丢失而引发各种安全问题还是在触痛了网民的神经。可以说，安全问题是对云存储服务的最大挑战。这一问题直接关系到云存储市场的生死存亡。从客户的角度分析，既然把重要数据交给第三方托管，自然希望SSP能够确保数据的不被篡改、不丢失、不被非法访问或任意窃取。而且上传和下载的速度不能太慢，最好能够提供实时高带宽的传输服务，这就给SSP们出了一道市场考题。

三、云技术的应用

（一）云教育应用

视频云计算应用在教育行业的实例：流媒体平台采用分布式架构部署，分为web服务器，数据库服务器、直播服务器和流服务器，如有必要可在信息中心架设采集工作站搭建网络电视或实况直播应用，在各个学校已经部署录播系统或直播系统的教室配置流媒体功能组件，这样录播实况可以实时传送到流媒体平台管理中心的全局直播服务器上，同时录播的学校也可以上传存储到信息中心的流存储服务器上，方便今后的检索、点播、评估等各种应用。

（二）云会议应用

云会议是基于云计算技术的一种高效、便捷、低成本的会议形式。使用者只需要通过互联网界面，进行简单易用的操作，便可快速高效地与全球各地团队及客户同步分享语音、数据文件及视频，而会议中数据的传输、处理等复杂技术由云会议服务商帮助使用者进行操作。目前国内云会议主要集中在以SAAS（软件即服务）模式为主体的服务内容，包括电话、网络、视频等服务形式，基于云计算的视频会议就叫云会议。云会议是视频会议与云计算的完美结合，带来了最便捷的远程会议体验。及时语移动云电话会议，是云计算技术与移动互联网技术的完美融合，通过移动终端进行简单的操作，提供随时随地高效地召集和管理会议。

四、结束语

云存储技术，毋庸置疑地将会掀起市场上存储技术的又一次改革浪潮。在未来，云存储技术也会得到人们的广泛使用。但是随着一个新兴产业的发展，总需要一定的机制和制度来制约、去保障其的安全、稳定、高效性质。云存储应用将网络上各种超大数据进行整理、归集，使之成为一个云状，为用户对于大数据的存储和访问提供了便捷的接口。

参考文献：

[1]门刘贝，汤斌.云存储原理及发展趋势[J].科技信息，2011（05）.

[2]朱光磊.云存储技术的发展应用趋势探析[J].电脑知识与技术，2011（11）.

云存储技术与标准化篇3

近年来,云计算无疑是最热门的研究热点之一。2006年谷歌最先提出“云计算”想法,同年又推出了“Google 101计划”,并正式提出了“云”的概念和理论。随后各大知名IT企业都大力开发和推进云计划,如亚马逊的AWS[1],IBM的“蓝云”计划,微软的Windows Azure计划。这些都对云计算的商业价值给予了巨大肯定。学术界也纷纷掀起了云计算研究的热潮。在企业及学术界的共同推动下,一些初步的云计算产品目前已经投入使用了,但云计算还处在发展阶段,各项技术还不是很成熟。

随着互联网的普遍应用,计算机产生的数据量正急剧增加,用户对计算机的要求也越来越高,如何提高普通计算机的存储能力和计算能力成为一个亟待解决的问题,而云计算的出现为这个问题提供了一个很好的解决办法。云计算改变了用户使用计算机的模式,云服务提供商把存储资源、计算资源、基础设施以及其它资源通过互联网以服务的形式提供给用户,用户可以根据需要购买相应的服务。这不仅打破了个人计算机在存储空间和计算能力上的局限性,还大大降低用户的软、硬件采购费用。

2 云计算

2.1 云计算的概念

云计算是网格计算、分布式计算、并行计算、网络存储等传统计算机技术和网络技术发展融合的产物,是一种新兴的商业化计算模型。人们对于云计算的理解仍在不断发展变化,至今还没有一个标准的定义。

美国Argonne国家实验室的资深科学家Ian Foster定义云计算为:云计算是由规模经济拖动,为互联网上的外部用户提供一组抽象的、虚拟化的、动态可扩展的、可管理的计算资源能力、存储能力、平台和服务的一种大规模分布式计算的聚合体[2]。

维基百科的定义:云计算将IT相关的能力以服务的方式提供给用户,允许用户在不了解提供服务的技术、没有相关知识以及设备操作能力的情况下,通过Internet获取需要的服务[3]。

云计算的定义还有很多,不同的人可以根据自己的理解给出不同的定义。综合不同的定义,我们可以看到云计算定义的共同点就是均认为云计算就是将计算资源、存储资源、网络资源以及其它一些资源以服务的形式提供给用户,云计算的最终目的是服务用户。

下面根据个人理解给出一种定义。云计算是基于网络的超级计算模式,它融合了网格计算、并行计算、分布式计算、数据存储与管理技术、网络技术等。它将硬件、数据存储、计算分析、软件等以服务的方式提供给用户,允许用户在不了解技术的情况下,通过网络采用付费的方式获取需要的服务。云计算通过网络将大量的数据和计算分拆成无数个较小的数据片和计算,然后由多个计算机所组成的计算机群搜索、计算、分析之后再将处理结果返回给用户。

2.2 云计算的特点

云计算环境下的数据存储、管理方式和传统的数据存储、管理方式相比,有很多新的特点。

首先,购买方式更加灵活。用户可以根据需求,灵活的选择自己需要的服务,并按照使用的服务来支付一定的费用,这样用户就不再需要因为需求变化而不断购买新的硬件设备和软件资源。

其次,云计算环境下企业可以很好的应对突发的大量访问。使用云计算系统,企业可以随时根据突发情况临时调用云端的计算和存储资源。

第三,云服务提供商负责存储设备的升级和数据的有效管理。云服务提供商负责完成存储设备的升级和日常管理,并通过一定存储机制保证数据的安全。

第四,云存储可靠性高。云服务提供商采用分布式存储和冗余存储来保证服务的高可靠性。

第五,可扩展性强。云服务提供商可以根据不断变化的需求不断开发新的云服务,扩展云计算系统的功能。

最后,存储能力和计算能力是前所未有的。云计算系统把数据存储在多个计算机上,把计算任务分配给多个计算机并行进行,因而它提供的存储能力和计算能力都是普通计算机无法比拟的。

3 云计算数据存储及管理技术

云计算的核心问题是海量数据的存储与管理,因此云计算的关键技术主要包括数据如何存储在云端以及如何对云端的数据进行高效的管理。另外云计算还需要其他一些技术的支持,例如需要分布式并行编程技术实现任务的并行执行和任务调度,需要虚拟化技术实现服务器资源的动态分配等。

3.1 数据存储技术

在云计算系统中,云端存在着海量的数据,为了保证数据的可靠性和可用性,云计算采用了分布式存储方式,并采用了冗余的方式(为一份数据保存多个副本)来保证数据的可靠性。所谓分布式存储,就是把一份数据分割成多个数据块,存储在不同的服务器上。下面以谷歌的GFS为例介绍一下典型的云计算存储技术。

GFS是一个管理大量分布式数据的可扩展性良好的分布式文件系统,一个GFS集群通常由一个Master服务器和多个块服务器构成。Master服务器主要负责存放文件系统中与数据文件相关的所有元数据,元数据包括文件和块的名字空间、访问控制信息、文件与块的映射信息以及块副本的位置等。简单地说,元数据就是管理文件的目录结构。另外,Master服务器还负责创建新块与副本、回收垃圾块、在块服务器间负载平衡等。

GFS将文件分割成64MB的块存储在各个块服务器上,在每个块创建时,服务器会为它分配一个不变的、唯一的64位的标识符对其进行标识。GFS默认为每份数据保存3个备份,一个为主块,其余的为副本。为了保证数据的一致性,对于数据的修改需在所有的备份上进行。读数据时先读取主服务器上的元数据获取数据块的位置,然后再根据数据块的位置信息到相应的块服务器上读取数据,这可以避免大量读操作对Master服务器带来的拥挤。

GFS的写操作将控制流和数据流分开。具体的讲,就是客户端在得到Master服务器的写授权后,先将数据传输给所有的数据副本,只有在所有的数据副本都收到修改的数据后,客户端才发出写请求控制信号。在所有的数据副本更新完数据后,再由主副本向客户端发出写操作完成控制信号。向GFS写数据的过程如下[4]。

(1)GFS客户端向主服务器请求块服务器用于增加或修改现有数据。如果是增加数据,主服务器就分配块服务器;如果是修改现有数据,主服务器则查找请求文件所在的块服务器的位置。

(2)Master服务器向客户端返回主块的标识符和其他副本的位置。

(3)客户机得到主服务器授权后将数据发送到所有备份所在的块服务器上,每个备份所在的块服务器会把这些数据保存在其内部的缓冲器内。

(4)客户端在所有数据发送结束后向主服务器发送写主块请求,由主服务器负责将数据写入所有备份。

(5)所有备份在写入数据后发送消息给主块。

(6)最后主块向客户端回复写入操作已经完成。

3.2 数据管理技术

云计算需要对大数据集进行处理和分析,因此所采用的数据管理技术必须能够高效地管理大规模的数据。在云计算环境下,数据的读操作频率远远大于数据的更新频率,云计算的主要任务是读取数据后进行大量的数据分析。因此,云计算系统的数据管理往往采用按列存储的模式。下面以谷歌的Big Table为例来介绍云计算环境下的数据管理技术[5]。

Big Table是建立在GFS之上的一个大型分布式数据库,它把所有的数据都作为对象来处理,从而形成一个巨大的表格来分布地存储大量结构化的数据。Big Table采用多级映射的数据结构,从结构上可以把Big Table看成是一个有序、稀疏、多维度的映射表,每个Cell由行关键字、列关键字和时间戳三个维度来进行定位。行是划分数据对象的标准,将多个行组成一个小表保存到同一个服务器节点中,这样的一个小表称为Tablet。列关键字的命名规则是列族:限定词,一组列关键字组成“列族”,列族是访问控制的基本单位,在创建之后很少改变。时间戳用来标识不同时刻数据的不同版本,不同版本的表项内容按时间戳倒序排列。

Big Table分为三个部分:一是Master节点,负责给Tablet服务器分配任务并使其达到负载平衡,监测Tablet服务器的状态,垃圾回收等。二是Tablet节点,负责处理Tablet的读写请求,并将大的Tablet进行分割。三是一个链接到每个客户端的库。其基本架构如图1[6]。

3.3 编程模型

为了让用户能快速使用编程模型编写程序来实现特定的目的,方便地使用云平台提供的服务,云计算系统使用的编程模型必须十分简单,并要保证后台复杂的并行执行和任务调度向用户及编程人员透明。大部分云计算系统采用了一种非常简单的Map-Reduce分布式编程模型,它最早是由Google提出的。Map-Reduce主要用于数据的并行运算和并行任务的调度处理,它在处理T级别以上的大规模数据集的运算方面具有明显的优势。

Map-Reduce编程模型通过Map(映射)及Reduce(化简)两个步骤来并行处理数据,它先把分割不相关的数据块文件通过Map程序进行高度的并行处理和计算,再通过Reduce程序将结果汇集整理输出。Map-Reduce的模型图如图2所示。

用户使用Map-Reduce时需要定义两个函数Map和Reduce。程序员需要在Map函数中指定对各分块数据的处理过程,在Reduce函数中指定如何对分块数据处理的中间结果进行归约。执行时,首先将数据分割为多个片段并分配给多个服务器进行Map操作,不同的Map操作之间是高度并行执行的。Map函数接收形式的数据,并行地多个Map函数会产生多个形式的中间结果,构成一个形式的中间结果的集合。接着把K值相同的Value值集合在一起,形成新的元组,再把这个元组分割成多个片段分配给不同的服务器进行并行Reduc操作,把形式的中间结果进行合并输出,将执行Reduce操作后的结果输出到分布式数据库中保存起来。

4 云计算的发展趋势

云计算有着广阔的发展前景,与之相关的各项技术也在迅速发展。未来云计算的发展会向构建大规模、能与应用程序密切结合的底层基础设施的方向发展。由于现有的云存储系统大都存在着缺陷,设计新一代的云存储和云数据管理系统是迫切需要解决的问题。另外,由于云存储和云数据管理通常要用于很多种不同的场景,云系统还需针对各种应用场景分别做出优化。因此,云计算的发展还有很长的路要走。

5 结束语

云计算是一种新兴的商业计算模式,由云服务公司搭建计算机存储、计算中心,用户通过网络就可以很方便的享受云端的服务。云计算所带来的资源共享和应用模式,必将能为云计算提供更广泛的市场和应用场景。但目前云计算还存在很多问题,如数据的安全性、可用性等,这些问题将随着学术界和商界的研究和应用逐步得到解决,云计算的相关技术也会越来越成熟。未来云计算将会在越来越多的应用中发挥重要作用,给我们的生活带来更多便捷。

参考文献

[1]VARIA J.Cloud architectures-AmazonWebservices[EB/OL].[2009-03-01].http://acmbangalore.org/events/monthly-talk/may-2008——cloud-architectures——ama-zon-web-services.htm.l.

[2]Ian Foster,Yong Zhao,Ioan Raicu,et a.lCloud Computing andGrid Computing 360-Degree Compared[C]∥Proceedings of IEEEGrid Computing Environments workshop(GCE08).USA:IEEE ComputerSociety,2008:1-10.

[3]维基百科.Cloud computing[EB/OL].[2009-03-10].http://en.wikipedia.org/wiki/Cloud_computing.

[4]Ghemawat S,Gobioff H,Leung S T.The GoogleFile System[C]//Proceedings of 19th ACMSymposium on Operating Systems Principles,2003:20-43.

[5]CHANG F,DEAN J,GHEMAWATS,etal.Big-Table:A distributed storage system for struc-tured data[J].ACM Transactions on Comput-erSystems,2008,26(2):1-26.

云存储技术与标准化篇4

关键词：云存储教学资源存储与服务

1.引言

高职教育正在推广模块化，项目化教学改革，采用基于工作过程的项目化课程体系，“教学做”一体，必需大量课件、视频、模拟仿真软件，而且强调通过在线考试，实训操作更多需要在线仿真，示范院校和骨干院校建设也需要上传大量的教学资源。相比本科院校，存储量更大，存储形式更多样化，教师更希望通过教学资源服务实现网络教学，项目提交，答疑，师生交互，远程测试，加强自主学习和协同学习。

教学资源是教学工作开展的基础，包括文本资源、图形图像资源、动画资源、声音资源和视频资源等类型。进行教学资源的整合有利于合理、高效地使用，促进教学质量的提高。

将云存储运用到教学资源的整合中，学校不仅能节省投资费用，简化复杂的设置和管理任务，而且把教学资源放在云中还便于从更多的地方访问资源，实现教学资源的共享，提高精品课程、示范特色专业和特色专业等优秀职教成果的辐射作用。

2.云存储

2.1云存储基本概念

云存储是指通过集群应用、网格技术或分布式文件系统等功能，将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作，共同对外提供数据存储和业务访问的功能。在云存储环境下，存储不再是单纯的硬件设备，而是一种服务。用户将不用再购买存储设备，而只需要购买存储服务提供商所提供的存储服务即可。从而使用户从繁重的存储设备的管理中解脱出来，集中精力关注他们所关心的数据。

采用云存储，我们无须像使用某一个独立的存储设备时，要清楚这个存储设备是什么型号，什么接口和传输协议，存储系统中有多少块磁盘，分别是什么型号、多大容量，存储设备和服务器之间采用什么样的连接线缆。而且对于保证数据安全和业务的连续性，无须自己建立相应的数据备份系统和容灾系统。除此之外，用户也无需关心存储设备的状态监控、维护、软硬件更新和升级。云状存储系统中的所有设备对使用者来讲都是完全透明的，任何地方的任何一个经过授权的使用者都可以通过接入线缆与云存储连接，对云存储进行数据访问。

2.2HDFS

HDFS（Hadoop Distributed File System）是Hadoop 的分布式文件系统，具有高容错性，并且可以被部署在低价的硬件设备之上。HDFS 提供对数据读写的高吞吐率，很适合那些有大数据集的应用。HDFS 是一个master/slave 的结构，就通常的部署来说，在master 上只运行一个Namenode，而在每一个slave 上运行一个Datanode。

HDFS 支持传统的层次文件组织结构，同现有的一些文件系统在操作上很类似，比如创建和删除一个文件，把一个文件从一个目录移到另一个目录，重命名等操作。

3.基于云存储的教学资源整合模型

在进行教学资源服务平台设计时，我们以“个性化、共享性”为目标，重点考虑个人体验，系统的功能包括：智能搜索、个性化课程自动推荐、公共信息展示、全媒体浏览支持、核心资源访问控制等。为教师用户提供在线备课、在线课程、技能测评库和资源管理等教学应用服务模块；为学员用户提供网络课堂、技能测评等课堂教学模块以及职业规划、项目案例库、仿真实训平台、职业提升、在线求职等职业服务模块；为企业提供网络招聘、技能认证和实训管理等服务模块。

3.1基础平台设计

依据高标准、国际化的建设原则，在原有系统基础架构上融入云存储模型，采用集中式服务、分布式布局的网络体系架构，搭建技术先进、功能强大的基础支撑平台。校园网采用IPv4 和IPv6 双栈设计，核心设备均采用冗余热备；6个电信网络出口、万兆光纤骨干、千兆到桌面；服务器负载均衡，思科防火墙和入侵检测设备。

3.2平台实现

教学资源系统使用JSP+Oracle+Linux开发模式，既保证了平台的灵活性、稳定性和安全性，又提供了良好的兼容性、可移植性和可扩展性，有效地实现了海量资源和分布式资源的整合。

系统采用B/S/S（Browser/Web Server/Cloud Server）来开发设计，即客户端采用浏览器，中间服务器是Web 服务器，后台为云服务器。由客户端在Web 页面发出请求至系统管理、服务目录等进行一系列的分类处理后，发送至Web 服务器，然后再由中间服务器对云服务器发出请求，客户端与云服务器不直接联系，保证了数据的安全性，具有跨平台、可移植、操作简单等优点。

4.性能分析

下面我们将对云存储系统读取和写入教学资源的速度进行测试。目前，在系统的实际运行中包含126台的数据节点存储教学资源，而且拥有大量的用户对资源进行访问。但是为了便于测试，我们使用171 台电脑构建云存储环境，其中1 台设置为名称节点，50 台为数据节点。120 台电脑作为客户端。名称节点和数据节点的配置均为双核CPU，4GB内存，1T 硬盘，一块100M 全双工网卡，并以一台交换机相连。120 台客户端都配备一块100M 全双工网卡，并以另一台交换机相连。两台交换机之间使用1 Gbps 的链路相连。

我们分别在51 台电脑上部署Hadoop-0.18.3 构建云存储环境。其中操作系统为FC10，Java 版本为jdk1.5。首先修改51 台电脑Hadoop 目录下的conf/hadoop-site.xml 文件，其中fs.default.name 为NameNode 的IP 地址和端口号；mapred.job.tracker 为JobTracker 的IP 地址和端口号；fds.replication 为HDFS 中每个Block 被复制的次数，起到数据冗余备份的作用，我们设置为5。其次配置SSH，因为Hadoop启动以后，名称节点通过SSH（Secure Shell）来启动和停止各个数据节点上的各种守护进程的，这就需要在节点之间执行指令的时候不需要输入密码，所以需要配置SSH 使用无密码公钥认证的方式。

5.结束语

教学资源的建设是远程教育发展的重要的环节，对教学资源进行整合有利于教学资源的共享，减少教学的成本，提高教学的质量。而云存储作为一种新的服务形式，能够很好地解决教学资源整合中产生的问题。云存储作为教育资源整合的有力手段，对教育资源的建设和发展有着积极的促进作用。随着云存储的不断发展和完善，必然会在高等院校和教育网络中有着越来越多的应用。

参考文献：

[1]张铮，顾京，尹洪.共享型高职专业教学资源库体系的构建——以数控技术专业为例？，职业技术教育，2010（05）：34—3.

[2]尚建新，解月光，王伟.云计算模型下的PLE 构建初探[J].现代教育技术，2009，19（04）：46-49.

[3]高宏卿，汪浩.基于云存储的教学资源整合研究与实现，现代教育技术， 2010（3）：97-101.

云存储技术与标准化篇5

关键词：云存储,教育资源,资源共享

高校教育是培养人才的重要平台,近年来我国对于高校教育越来越重视,并且呼吁实现教学资源的共享,从而提高教学的质量。但我国现在的高校教育资源共享存在着明显的不足,优质资源存在着封闭性,现存的共享资源存在着质量偏低的特点。

要想提高现代的高校教学资源,寻找一种新型的教育共享途径是非常重要的,这样的情况也突出了高校云存储技术运用的必要性。

一、当前高校教育资源共享的现状

1.1资源共享程度低

随着现代信息化技术的发展,很多高校都建设了自身的教育资源库,这在一定程度上提高了资源的传播。但现在很多高校教育资源都是基于本校平台建立,开设的精品课程等多数面对本院校的学生开放,很多教学资源比较非常的高校同样也可以享有一定的网络资源,但一些教学资源比较薄弱的高校缺乏这方面的优势,导致了资源分布不均衡的状况。现在很多高校之间的IP地址存在限制,导致了“资源孤岛”现象的出现,这样的情况在一定程度上限制了高校资源的流通。

1.2高校缺乏资源共享的积极性

现在很多高校为了收益,也会开设相对应的盈利性网络课程,这样的课程虽然也提高了资源的推广,但受众非常小。同时由于不同专业的学生对于课程的需求不同,所以在开设网络课程中也会存在一定的难度,这样的现状也导致了高校满足于自给自足的状态,缺乏资源共享的积极性。

1.3资源使用具有复杂性

信息技术的发展带动了资源共享终端的多样性,现在学生有很多可以访问数据的终端,比如说手机、笔记本,或者是台式机,但现在很多高校并不能满足多样终端的需求,往往是只能通过学校的内部网络进入资源平台,很多精品课程的视频只允许在线浏览,这样的方式就限制了资源共享的及时性,使用过程缺乏便利性也容易让学生丧失学习积极性,从而造成资源的浪费。

二、云存储资源构建的意义

2.1云存储技术的概述

云存储是现在新兴的概念,云存储并不是简单意义上的存储器,而是在云计算的基础上,通过集群应用,网络技术等功能,将网络中大量不同的类型的存储设备通过应用软件结合起来,从而支持对外的数据存储和业务访问功能的系统。在使用者进行访问的过程中,并不是简单的使用某个单一的存储设备,而是在使用云存储技术的访问服务,因此云存储技术并不是存储技术,而是提供服务。云存储的拥有着复杂的工作系统,通俗意义上来理解云存储也可以看作是云计算中的存储。

2.2云存储技术的特点

云存储现在和人们的工作和生活联系越来越紧密,尤其是现代的高校资源构建中,云存储有着不可替代的作用,相对于传统意义上的存储方式,云存储有些自身的独特优势。

1. 廉价和便利

传统的纸质文件或者是硬盘文件在存储过程中都需要占用大量的空间,并且需要花费一定的金钱,尤其是在高校环境中,所需要存储的资源比较多,学校为了满足这一存储需要,往往需要一定的资金去购买存储设备,但这些设备往往需要一定的重复购买,导致了一定的资金消耗。同时这样的设备报废率比较高,增加了高校资源存储建设的费用。而云存储只需要使用者根据自身的需求去购买相对应的云存储空间即可,在使用时也是非常便利的,相对于需要随时携带的移动硬盘存储,云存储只需要帐号和密码,对终端要求比较低,只要是在有网络和终端的条件下,就可以进行数据的访问,打破了以往的时间和空间的局限性,有效的提高了使用的便利性。

2. 安全

在运用计算机数据时,硬盘式的存储在一定程度上提高了存储的效率,但硬盘容易携带病毒,影响了数据使用安全。高校的资源往往带有一定的学术性,如果越到病毒的情况下,很可能导致一定的问题出现,比如说数据流失等。云存储的资源分散在不同的节点,在使用时通过数据加密,数据传输,数据备份等,有效的提高了数据的安全性,避免了计算机病毒对数据的威胁,从而提高了使用质量。

三、基于云存储技术的高校资源的构建和共享

3.1打造基于云存储的高校资源系统

构建高校云存储资源时,需要高校进行相对应的管理工作。云存储技术在构建过程中是需要一定的硬件设备和应用软件的支持。其总体框架是物理层,数据资源层,数据管理层,应用平台层以及最后呈现给用户的用户访问层。在进行高校资源构建时,最基础的就是物理层,这为整体数据的发展提供物理支持,在高校进行云存储时,需要强调物理层的管理。高校在构建云存储时,可以将不同类型的配置和服务资源可以整合为完善的数据存储空间,这些设备进行协同工作,从而实现对外的存储和访问功能。

高校在此基础上同时加强各个环节的控制,争取可以打造出优质的高校资源中心。对于最后用户访问层,高校可以打破终端的局限性,为用户提供多样的访问方式,避免资源使用的复杂性。

3.2云存储技术的资源共享方式

要想真正的实现高校的资源共享,就需要在构建云存储资源前提下进行。高校资源所面对的受众是两大类,一类是教师,另一类是学生。根据受众的使用方式,可以将云资源共享中心分为三种方式。

1. 个人云盘

个人云盘并不是字面上的属于局限性资料,而是在保护私密数据的前提下为个人设置的存储方式,这样的存储方式主要是面向教师。为了保护个人的资源,教师可以使用加密文件,这样的文件是面对个人开放,任何人不享有打开文件的权利,从而可以保证高校教师研究成果的安全性。同时利用个人云盘,教师可以存储上课所需要的课件,并不需要携带移动硬盘,在上课的时候只需要有利用教师的无线网络就可以进行向学生展示课件,在学生需要的前提下,教师可以授权将自身的课件等传递给学生,实现了资源的共享。个人云盘的存储空间是非常大的,这也提高了教师工作的便捷性,提高课堂的效率性。

2. 资源中心

资源中心是保证高校资源共享的重要方式,这不仅仅可以保证校内的资源共享,同时可以实现高校之间的资源共享。这里所存储的资源是学校的优质公开资源,比如说精品课程,学科研究成果等,这些资源是面向一定的高校开放,用户进行访问时,需要获得相对应的授权,本校学生可以通过一卡通进行访问,给予外校学生也可以给予一定的访问平台,提高资源的利用效率。

3. 社区空间

社区空间是一种公共的存储方式,在社区空间内,拥有相同研究兴趣的人可以进行组合,对于相同的研究课题,可以由一个用户申请社区空间,在获得批准后,邀请其它用户进入,每个用户都可以享受其中的存储资源,也可以为社区贡献自身的研究,用户可以进行数据交流和评论,从而实现彼此之间的资源共享。

四、结语

信息技术的发展对人们现代的生产和生活产生了重要的影响,从当前的高校教育现状来看,高校教育需要信息技术,当前的高校建设中需要重视到云存储技术,实现资源的交流和共享。将更多的新技术运用到教育和教学中,从而提高高校教育质量,为国家输送更加优秀的人才。

参考文献

[1]庄科君.基于云存储技术的高校优质教育资源共享探析[J].科教导刊(上旬刊),2013,No.16608:32+35.

[2]徐琦.基于云存储的高校教育资源中心构建研究[J].中国教育信息化,2014,No.33419:27-29.

大数据场景下的云存储技术与应用篇6

1 大数据场景

1.1 大数据的概况

随着科学技术的不断发展, 网络技术也得到了快速的发展, 大数据成为了发展的必然趋势, 大数据中的信息更加丰富, 不断适应着人们对数据的需求。随着网络技术的普及, 大数据得到了快速的增涨, 数据量的迅猛增涨需要对其进行处理, 这种需求随着数据量的增涨将变得更加迫切。

在信息化、网络化的环境中, 大数据的时代已经到来, 企业、个人在决策过程中将根据数据, 进行综合的分析, 这有利于决策的成功。在互联网的时代, 通过数据可以让人们了解到更多的知识, 并能够利用计算机技术提高工作的效率, 保证工作的质量。大数据的竞争将愈加激烈, 大数据的技术需要不断的提升, 才能保证国家的安全、社会的稳定。同时, 大数据的商业化价值是巨大的, 社会和政府对其的投入在不断增多, 大数据将因此获得更多的发展机会。

1.2 大数据的类型

随着网络技术的不断普及, 大数据的类型更加丰富, 主要表现在信息系统规模日渐拓展, 致使海量非结构化数据的管理、异构数据存储的利用与资源的扩展出现了问题。随着大数据的不断发展, 数据量不断增多, 数据存储呈现出海量增涨的趋势;数据源具有非确定性, 其种类众多, 具有异构性特点;同时数据块的大小、种类、访问方式等均存在不确定性。

1.3 大数据对存储的要求

在大数据的场景下, 其数据量呈现海量增涨的趋势, 对存储的要求不断提升。非确定数据要求存储的组织方式与管理策略要与之相匹配;同时大数据有着较长的发展时间, 并且要求存储要具备一定的规模并能够不断的扩展。在大数据场景下, 存储技术要不断改进, 才能满足大数据的需求, 保证系统的正常操作。

2 云存储技术

2.1 云存储的含义

随着云计算的发展, 逐渐衍生了云存储。云存储主要应用于集群、网络技术, 将系统中的存储设备进行协同作业, 不仅能够保证数据的存储, 还能提供访问的功能。在云计算系统中, 通过对其海量的大数据进行存储, 并利用云计算系统转化为云存储, 能够更好的满足其数据存储与管理的要求。

2.2 云存储技术的需求

在大数据场景下, 云存储技术要不断提高, 才能满足大数据的需求, 主要表现在以下几方面:其一, 随着海量数据的增涨, 数据存储的规模要不断扩大, 存储的规模要满足跨区域的要求, 并不断提供多种功能, 如:访问、备份、容灾等, 云存储要不断适应不同的存储设备, 对其进行管理, 保证工作的效率;其二, 云存储设备要实现线性扩展与收缩, 实现对数据的智能管理;其三, 云存储要不断实现专业化的管理, 提高存储资源的使用率, 保证海量资源的科学管理, 实现用户数据的安全化管理。

3 大数据场景下云存储技术的应用

3.1 应用于视频监控

和谐社会的发展、现代化城市的建设、经济的快速增涨等, 使社会对视频监控的需求加大, 满足社会的这种需求, 才能促进社会的发展与城市建设和经济的增涨。在视频监控中, 需要高清的视频数据, 而对其数据的管理则需要云存储技术, 云存储提供的视频, 满足了对视频的高清需求, 解决了海量数据管理的难题。同时, 云存储让视频监控的范围更广, 实现了对其分布式管理。

3.2 应用于互联网

随着网络技术的普及、计算机的应用, 在大数据场景下, 云存储技术应用于互联网, 实现了广大用户的需求。互联网企业重视对云存储的研发与应用, 互联网为用户提供云存储的平台, 在云存储的平台上用户将得到丰富的资源, 并且云存储不受时间、空间的限制, 提高了资源的利用率。

3.3 应用与视频编排

云存储系统实现了对不同存储设备的管理, 保证了不同设备的协同工作, 通过虚拟化的管理, 让视频数据的管理更加简单, 进而保证了系统的灵敏性与拓展性, 并能够对海量数据进行管理, 满足了其需求。云存储系统为视频编排提供了便利, 对编排中需要的素材、成品、再加工的节目实现了分层存储与管理, 提高了视频编排的效率。

3.4 应用于家庭

目前, 家庭中的网络应用比较普遍, 家庭网络中应用云存储实现了资源的共享与备份, 同时, 对家庭内多种终端间的资源实现了共享, 并能够多屏互动、多终端交互控制, 满足了用户的需求。

4 总结

随着科技的进步, 网络技术水平在不断提高, 大数据已经成为了发展的必然, 数据的产生有着多种原因, 对其应用有着新的发展特点, 随着应用规模的不断扩大, 数据呈现出海量增涨的趋势, 这就对海量信息的存储提出了更高的要求。在大数据场景下, 云存储技术的应用满足了海量数据存储的需求, 实现了对数据的科学管理。但随着大数据的发展, 云存储技术需要不断的提高。文中对大数据场景进行了分析, 并介绍了云存储技术, 同时还阐述了大数据场景下云存储技术的应用, 相信随着科技的发展, 云存储技术也将得到快速的发展。

摘要：随着科学技术的发展, 信息时代的到来, 网络系统的发展需要云计算, 关于云计算的说法众多, 云计算的研究在不断拓展, 并得到了迅猛的发展。目前, 大数据的发展规模不断扩大, 发展速度是惊人的, 随着大数据场景的不断发展, 对云存储的需求不断提升, 云存储的技术需要不断改进才能满足大数据场景的要求。云存储作为新的信息产品, 为企业与个人提供了便利。文中将对大数据场景进行分析, 并将阐述云存储技术及大数据场景下云存储技术的应用。

关键词：大数据,云存储,应用

参考文献

[1]陈杰.大数据场景下的云存储技术与应用[J].运营应用, 2012, 12 (06) :47-48.

[2]张明.浅谈云存储技术与应用[J].信息技术, 2010 (03) :15-16.

云存储技术与标准化篇7

基于对象的云存储作为一种新兴的数据存储模式, 发展十分迅速, 目前主流的公众云存储服务接口方式基本都采用对象方式。在基于对象的云存储应用接口方面存在两类接口规范, 一类是网络存储行业协会 (Storage Network Industry Association简称SNIA) 发布的云数据管理接口 (Cloud Data Management Interface, 简称CDMI) , 该规范由于考虑到与传统存储方式的兼容, 设计复杂, 目前的商业实现很少;另一类是各大云存储服务提供商推出的私有接口规范, 这些接口规范功能类似, 但是接口不统一, 这些云存储接口的不统一带来了服务提供商绑定和数据绑定问题。本文将系统分析上述两类云存储接口规范, 并根据国内外云存储市场的实际发展情况, 提出基于对象的云存储应用接口标准化建议。

2 基于对象的云存储接口概述

云存储服务是云计算领域发展最早也是最为成熟的应用之一。目前国内外已有多家云存储服务提供商提供基于对象的云存储服务, 例如Amazon的简单存储服务S3 (Simple Storage Service) 、Google的GS (Google Storage) 、AT&T的存储服务 (Synaptic Storage as a Service) 、微软的存储服务 (Azure Storage Service) 、金山快盘等。此外, SNIA也发布了CDMI规范。目前CDMI规范已经通过PAS (公开可获得规范) 通道提交给ISO/IEC JTC1, 并通过DIS (国际标准草案) 投票。下面简要介绍这些基于对象的云存储接口。

(1) 2006年Amazon推出S3。S3是目前使用最广泛的一个事实规范。S3采用桶和对象的两层结构来存储数据, 支持REST和SOAP两种访问协议, 可与多种网络开发工具集成工作。作为最早的云存储服务, 基于客户应用实践的积累, S3在对象存储的功能丰富方面也走在业界前列, 如对于超大数据 (数据容量5TB) 存储、BT方式下载以及第三方支付的功能支持等。由于针对S3应用开发的广泛性, 围绕S3有一些开源项目, 使S3的编程工作变得更加简单, 方便非HTTP编程开发者使用。

(2) 2010年谷歌推出名为“Google Storage (GS) ”的云计算存储服务, 目前提供面向开发者的在线申请。GS架构模仿了S3, 采用了基于桶和对象的两层架构存储数据。

(3) AT&T推出基于EMC (Atmos) 数据存储基础架构的AT&T (Synaptic Storage as a Service) , 该存储服务为企业用户提供了对存储的控制, 让用户在任何地点、任何时间、使用任何可连接网络的设备分布和找回他们的数据。Atoms的数据模型上只有对象, 没有桶或者容器的概念。

(4) 2010年4月SNIA下属的云存储技术工作组 (Cloud Storage Technical Working Group) 推出了CDMI规范。CDMI最大的作用在于提供了访问云存储和管理云存储数据的方式, 以及针对云架构厂商和第三方服务供应商的交互指导方针。CDMI采用五种对象支持数据存储管理和访问操作, 支持可嵌套桶容器结构, 有更丰富的对象和功能设计。

由以上分析可看出, 各家云存储服务接口不统一带来了以下问题:

(1) 导致用户面临服务提供商绑定问题。用户在不同云存储服务提供商之间迁移数据时会遇到以下问题:由于数据模型、接口协议和存储服务功能的差异而导致的数据迁移困难。给用户的云存储服务选择带来了较大的风险。

(2) 云存储接口标准的不统一也影响到产业的长远发展。受到接口不统一的影响, 围绕存储服务接口的特定语言编程包和第三方管理软件的开发需要做多种适配, 造成行业发展力量的过度分散, 并最终会影响到整体市场的增长动力。

3 基于对象的云存储接口标准化分析

基于对象的云存储服务在数据模型、接口协议、操作集合和第三方支持上存在很大不同, 给用户数据迁移和共享带来很大的障碍, CDMI考虑到与传统存储体系的融合, 体系架构较为复杂, 目前的商业实现较少。下面以S3和CDMI为代表, 对基于对象的云存储接口在数据模型、接口协议、操作能力和服务使用方式进行分析。

3.1 云存储参考模型

SNIA的CDMI给出了整个云存储参考模型, 如图1所示。按照存储系统提供存储资源接口类型的不同, 云存储的接口可分为四类:块存储 (如iSCSI) 、文件存储 (如POSIX) 、基于对象的存储 (如CDMI和适配器转换方式XAM) , 及基于表的存储方式。

云存储和传统存储有很大差异。从使用方式上看, 云存储可以按需提供存储服务, 存储的使用可以精确地配置和计费;从实现的技术架构上看, 云存储多采用横向可扩展的集群架构。

云存储的四类服务接口上, 块存储和文件存储接口方面, 已有的标准协议已经非常成熟, 基于表的云存储服务还处于发展初期, 各种创新比较活跃, 标准化的时机尚不成熟。对象存储接口可通过标准HTTP协议对数据对象进行增删改查等操作, 数据对象通过URI (统一资源标识) 进行标识, 一组数据对象通常抽象为容器。基于对象的云存储虽然也存在服务商专有协议情况, 但由于操作集类似, 标准化时机也较为成熟。

3.2 数据模型

从数据模型上看, 除了Atoms外, 大部分云存储服务提供商, 如Amazon的S3和Google的GS等都采用了对象和桶的两层架构, SNIA的CDMI也借鉴了该两层架构, 而且进一步采用五类对象进行数据存储管理和访问操作, 包括容器对象、数据对象、域对象、能力对象和队列对象, 其中后三个可以看做特殊的容器对象。每个对象通过多个Key-Value数据对进行元数据描述。元数据包括安全和数据存储管理方面的元数据、用户自定义元数据等。表1从CDMI和S3支持的对象类型和元数据方面对这两类云存储服务进行对比。

3.3 接口协议

从支持的接口协议上看, 市场上大部分基于对象的云存储都支持REST接口协议, 都在标准HTTP的基础上进行了各自的扩展, 且扩展内容不尽相同。

3.4 操作能力

从操作能力上看, CDMI除了对能力对象仅仅提供读操作外, 其他对象均支持增删改查四种操作。S3除了提供对桶和对象的增删改查操作能力外, 还提供查询服务的能力, 支持查询合法用户拥有的全部桶信息。

由于CDMI支持的对象类型更为丰富, 因此相较于S3, CDMI还支持对域对象、队列对象和能力对象的操作能力。就容器对象 (桶) 和数据对象而言, 通过对CDMI和S3的操作能力对比发现, 两者的操作能力基本相当。目前还存在一些S3支持而CDMI尚未支持的操作, 如表2所示。

从操作能力上看, GS不支持表2中所列的版本支持、BT下载和第三方支付的操作。

3.5 服务使用方式

目前用户使用基于对象的云存储服务, 主要有以下三种方式:

(1) 直接采用REST (或HTTP) 接口, 编程实现与云存储系统的交互。

(2) 通过与特定编程语言绑定的API开发包。这种方式通过在REST接口之上封装一层, 可以提高特定语言开发者的编程效率。

(3) 通过云存储运营商管理门户 (Portal) 或第三方管理软件实现。这种方式下, 用户无需编程, 直接通过图形界面使用, 或直接使用管理软件, 由管理软件调用REST接口实现存储的管理。这种方式下, 用户对后台的控制能力受到Portal或第三方管理软件的限制。

不同的支持方式可以服务于开发者、最终用户等不同需求的云存储用户。

表3给出目前市场常用的基于对象云存储服务以及CDMI的第三方支持情况。

Amazon的S3除了提供Portal操作外, 还公开了REST接口, 使用户能够使用任何支持HTTP通信的语言访问S3。此外, 围绕S3的一些开源项目, 包括JetS3t (JAVA) 、Boto (Python) 可以抽象出使用S3的REST接口细节, 将API公开为常见的Java或Python的方法和类。使S3的编程工作变得更加简单。针对非开发者用户, 还提供Portal管理软件, 实现网络存储空间的使用和用户数据备份等功能。

Google Storage目前提供三种形式的管理工具:基于网页界面的Google Storage Manager、开源的命令行管理工具GSUtil Tool和Python库 (改进过的Boto) 。

Rackspace的CloudFile提供多种语言的API支持, 包括PHP、Java、Python、.NET、Ruby, 方便程序员利用自己熟悉的语言对CloudFile的容器和对象进行操作, 而不是直接使用HTTP请求和响应。

从第三方支持的角度看, 目前市场对CDMI的支持度还不是很好。

4 结语

随着基于对象的云存储市场迅速发展, 用户越来越多的面临着在不同云存储服务提供商之间的迁移和互操作问题。通过对现有主流的基于对象的云存储服务接口规范研究分析可以看出, 虽然各家接口尚未统一, 但是数据模型、操作能力、接口协议都比较类似, 标准化时机成熟。需要针对中国云存储市场的需求, 适当参考国际上现有的接口规范, 制定适合中国云存储市场的基于对象的云存储应用接口规范, 以保证数据层和上层应用的互操作和可移植。

摘要：针对基于对象的云存储应用接口的标准化问题和面临的挑战, 介绍了主流的基于对象的云存储应用接口及应用情况, 对数据模型、接口协议、功能、应用支持进行分析, 并提出未来的标准化工作建议。

云存储技术与标准化篇8

云存储技术的发展, 是因为传统的盘阵存储由于高成本和系统的高负载性, 已经难以适应云计算服务对存储的需求。传统盘阵虽然利用专有的、定制设计的硬件组件和互连接口设计集成在一起, 保障了的存储的性能和可靠性, 但是其单点扩展存在容量上限和接口带宽等限制, 面对PB级的海量存储需求, 无论是SAN或NAS在容量和性能的扩展上均无法满足应用的需要;且盘阵造价昂贵, 标准化程度较低, 组件的更换常常导致系统故障或者硬件的升级, 从而导致存储成本居高不下。

由此, 为实现存储的低成本、高可扩展与资源池化, 云存储技术应运而生, 这其中最关键的是存储虚拟化技术与分布式存储技术的应用[1]。从短期来看, 存储化技术可以充分提升现有存储资源的应用水平, 实现资源池化, 提升设备使用率, 降低管理成本。从长远发展来看, 分布式存储技术则是未来云存储的发展趋势, 分布式存储底层可构建在标准X86服务器集群之上, 通过分布式文件系统对外提供弹性存储资源, 可选择SATA作为存储实现方式, 根据应用需要提供丰富的服务接口, 从而大大降低了存储成本。同时基于X86的分布式存储的集群架构也实现了较强的Scale-out扩展能力。

该文的第二章对现有的三种类型的存储虚拟化技术原理及应用进行了详细分析, 第三章对分布式云存储的技术发展和应用进行了分析和研究, 第四章给出了研究结论。

1 存储虚拟化

存储虚拟化技术主要指通过在物理存储系统和服务器之间增加一个虚拟层, 使服务器的存储空间可以跨越多个异构的磁盘阵列, 实现从物理存储到逻辑存储的转变。从而能够把不同品牌、架构甚至不在统一物理居址的存储设备统一到一个 (若干个) 虚拟的存储资源池, 实现存储资源的统一调度、管理和使用。存储虚拟化技术是传统存储向云存储过渡的重要中间技术, 在实现存储资源管理统一、高效的同时, 使得存储资源的调度、增减对用户完全透明, 使存储资源具备了支撑云计算服务的能力。

1.1 主要存储虚拟化技术

存储虚拟化技术虽然不同设备与厂商之间略有区别, 但从总体来说, 可概括为基于主机虚拟化、基于存储设备虚拟化和基于存储网络虚拟化三种技术[2]。

1) 基于主机的虚拟化存储的实现, 其核心技术是通过增加一个运行在操作系统下的逻辑卷管理软件将磁盘上的物理块号映射成逻辑卷号, 并以此实现把多个物理磁盘阵列映射成一个统一的虚拟的逻辑存储空间 (逻辑块) 实现存储虚拟化的控制和管理。从技术实施层面看, 基于主机的虚拟化存储不需要额外的硬件支持, 便于部署, 只通过软件即可实现对不同存储资源的存储管理。但是, 虚拟化控制软件也导致了此项技术的主要缺点:首先, 软件的部署和应用影响了主机性能;其次, 各种与存储相关的应用通过同一个主机, 存在越权访问的数据安全隐患;最后, 通过软件控制不同厂家的存储设备存在额外的资源开销, 进而降低系统的可操作性与灵活性。

2) 存储设备虚拟化技术依赖于提供相关功能的存储设备的阵列控制器模块, 常见于高端存储设备, 其主要应用针对异构的SAN存储构架。此类技术的主要优点是不占主机资源, 技术成熟度高, 容易实施;缺点是核心存储设备必须具有此类功能, 且消耗存储控制器的资源, 同时由于异构厂家磁盘阵列设备的控制功能被主控设备的存储控制器接管导致其高级存储功能将不能使用。

3) 基于存储网络虚拟化的技术的核心是在存储区域网中增加虚拟化引擎实现存储资源的集中管理, 其具体实施一般是通过具有虚拟化支持能力的路由器或交换机实现。在此基础上, 存储网络虚拟化又可以分为带内虚拟化与带外虚拟化两类, 二者主要的区别在于:带内虚拟化使用同一数据通道传送存储数据和控制信号, 而带外虚拟化使用不同的通道传送数据和命令信息。基于存储网络的存储虚拟化技术架构合理, 不占用主机和设备资源;但是其存储阵列中设备的兼容性需要严格验证, 与基于设备的虚拟化技术一样, 由于网络中存储设备的控制功能被虚拟化引擎所接管, 导致存储设备自带的高级存储功能将不能使用。

1.2 存储虚拟化技术对比

被节用表格的方式对三种存储虚拟化技术的技术优点与缺点、适应场景等进行了分析对比, 结果见表1。

2 分布式存储

分布式存储相比传统的集中阵列存储设备, 其技术和解决方案, 还处于发展初期, 总体来看只具备部分场景下的存储需求实现能力。但是从发展趋势来看, 通过一个可扩展的网络进行连接各离散的处理单元的分布式存储系统, 其高可扩展性、低成本、无接入限制等优点是现有存储系统所无法比拟的。该文的分析研究将以目前发展的分布式块存储、分布式文件系统存储、分布式对象存储和分布式表存储这四种分布式存储技术为对象进行。

1) 分布式块存储:块存储就是服务器直接通过读写存储空间中的一个或一段地址来存取数据。由于采用直接读写磁盘空间来访问数据, 相对于其他数据读取方式, 块存储的读取效率最高, 一些大型数据库应用只能运行在块存储设备上。分布式块存储系统目前以标准的Intel/Linux硬件组件作为基本存储单元, 组件之间通过千兆以太网采用任意点对点拓扑技术相互连接, 共同工作, 构成大型网格存储, 网格内采用分布式算法管理存储资源。此类技术比较典型的代表是IBM XIV存储系统, 其核心数据组件为基于Intel内核的磁盘系统, 卷数据分布到所有磁盘上, 从而具有良好的并行处理能力;放弃RAID技术, 采用冗余数据块方式进行数据保护, 统一采用SATA盘, 从而降低了存储成本。

2) 分布式文件系统存储:文件存储系统可提供通用的文件访问接口, 如POSIX、NFS、CIFS、FTP等, 实现文件与目录操作、文件访问、文件访问控制等功能。目前的分布式文件系统存储的实现有软硬件一体和软硬件分离两种方式。主要通过NAS虚拟化, 或者基于X86硬件集群和分布式文件系统集成在一起, 以实现海量非结构化数据处理能力。

软硬件一体方式的实现基于X86硬件, 利用专有的、定制设计的硬件组件, 与分布式文件系统集成在一起, 以实现目标设计的性能和可靠性目标;产品代表Isilon, IBM SONAS GPFS。软硬件分离方式的实现基于开源分布式文件系统对外提供弹性存储资源, 软硬件分离方式, 可采用标准PC服务器硬件;典型开源分布式文件系统有GFS[3]、HDFS。

3) 分布式对象存储:对象存储是为海量数据提供Key-Value这种通过键值查找数据文件的存储模式;对象存储引入对象元数据来描述对象特征, 对象元数据具有丰富的语义;引入容器概念作为存储对象的集合。对象存储系统底层基于分布式存储系统来实现数据的存取, 其存储方式对外部应用透明。这样的存储系统架构具有高可扩展性, 支持数据的并发读写, 一般不支持数据的随机写操作。最典型的应用实例就是亚马逊的S3 (Amazon Simple Storage Service) 。对象存储技术相对成熟, 对底层硬件要求不高, 存储系统可靠性和容错通过软件实现, 同时其访问接口简单, 适合处理海量、小数据的非结构化数据, 如:邮箱、网盘、相册、音频视频存储等。

4) 分布式表存储:表结构存储是一种结构化数据存储, 与传统数据库相比, 它提供的表空间访问功能受限, 但更强调系统的可扩展性。大多数表存储的数据可靠性依赖于表存储底层采用的文件存储, 对底层硬件要求不高, 一般常采用开源软件和通用PC, 具有低成本的特性。提供分布式表存储的云存储系统的特征就是同时提供高并发的数据访问性能和可伸缩的存储、计算架构, 适合存储海量结构化或半结构化数据。其典型产品代表有Greenplum和谷歌的Bigtable[4]。以Greenplum为例, 一般采用MPP (MassiveParallel Processing) 架构实现海量数据存储和处理、以及高并发数据读写能力, 它实现了SQL到MapReduce的翻译、优化、执行和结果收集, 具有良好的扩展能力。

3结论

综上所述, 从目前云存储主要技术和解决方案的发展来看, 已经具备从传统存储架构向云存储架构演进的条件。具体到技术选择和方案实施层面, 首先需要关注存储系统的应用需求, 特别是其数据需求量与数据结构特点, 从而确定选择的存储技术与方案类型;其次需要考虑是否需要利用现有存储设备, 分布式存储技术多数应用了全新的存储架构, 一般无法和现有存储设备整合;最后需要从性能实现和存储成本等方面对技术方案进行比较。

摘要：云存储是云计算与云服务实现的核心基石之一, 目前业界已有基于虚拟化技术和分布式存储技术的多种云存储解决方案, 但是其技术比较与演进趋势仍不明朗。该文从研究目前的虚拟化和分布式云存储技术着手, 详细分析对比了各类技术的实现原理、适用场景与应用情况, 进而提出了云存储发展的预期, 为各种云存储应用与研究提供参考。

关键词：虚拟化,分布,云存储

参考文献

[1]李煜民, 章才能, 谢杰.云计算环境下的数据存储[J].电脑知识与技术, 2010, 6 (5) :1032-1034.

[2]白翠琴;王建;李旭伟.存储虚拟化技术的研究与比较[J].计算机与信息技术, 2008 (7) .

[3]Ghemawat S, Gob Dffh, Leung P T.The Google file system, Proceedings of the19th ACM Symposium on Operating Systems Principles[M].New York:ACM Press, 2003:29-43.

云存储系统分析与发展趋势研究篇9

摘要：本文从云存储的基本概念出发，分析了云存储的系统运行原理，介绍了云存储的若干重要的应用领域，以及云存储面临的挑战和发展趋势。

关键词：云存储；网络磁盘；数据访问

中图分类号：TP393

随着信息技术的不断发展，在商业计算、科学计算等诸多领域产生了规模巨大的数据，并且数据量仍然在飞速的增加，数据的存储需求常常达到PB甚至EB级，如何安全、高效、低成本的存取这些数据，成为一个重大的问题，云存储技术的应用，使得高效率低成本的存取数据成为可能。

1 云存储概述

1.1 云存储的概念

云存储是一种先进的在线存储技术，用户只需要向存储服务提供商申请存储服务，就可以方便高效的存取数据，数据由存储服务提供商统一管理和维护，这样就节约了数据的存储空间，保证了数据的安全。

1.2 云存储原理

云存储的结构模型从下至上可以分为数据存储层、数据管理层、应用接口层、用户访问层四个层次，与普通存储设备不同，云存储不再仅仅是一个用来存储数据的硬件，而是一个结合了各种网络及网络设备、服务器及客户端程序的有机统一体，各个部分以数据存储层为基础，通过应用软件为用户提供存储功能和业务功能。

1.2.1 数据存储层

数据存储层是云存储的基础层，不同区域的数据被存储在这里，存储量非常庞大，依靠互联网、广域网、或者光纤通道，不同类型的数据被有机的连接在一起，最终实现了对存储设备的统一管理，可以有效进行容量扩展或是状态监控。

1.2.2 数据管理层

数据管理层是云存储的最为核心的一层，为了将底层的存储和上层的应用良好的对接起来，数据管理层的主要功能是让云存储中不同的存储设备能够协同工作，共同对外提供高性能的服务，以此来提高云存储数据的可访问性。

1.2.3 应用接口层

应用接口层是云存储中最为灵活的一层，可以根据用户需求，开发出不同类型不同功能的应用服务接口程序，提供丰富的服务，如视频监控、网络磁盘、空间租赁、数据备份等。

1.2.4 用户访问层

用户访问层是面向用户的，任何的授权用户，无需知道存储设备的各种情况，只需要通过标准的公用应用接口，就可以方便的登录和使用云存储系统。

2 云存储的应用

从云存储的结构模型来看，云存储可以实现的功能和服务决定于应用接口层，那么根据服务类型、面向用户、运营策略的不同，云存储运营商可以在应用接口层嵌入不同功能的应用软件、提供特色化的服务，这也是云存储结构模型的灵活性的体现。

2.1 网络磁盘

网络磁盘提供的是一种在线存取服务。用户向存储服务提供商申请之后，可以将自己的文件通过客户端或web的方式，进行上传或是下载。这样就实现了数据的网络化存取，网络磁盘的容量取决于存储服务提供商的运用策略。

2.2 在线文档编辑

在线文档编辑提供的是一种直接在线编辑文档格式、内容的服务，即使用户没在个人电脑上安装文档编辑软件，只需要登录自己的账号，就可以在线对自己的文档进行编辑和保存，大大提高了工作效率。

2.3 空间租赁服务

空间租赁服务使得企事业单位可以根据实际需要，向存储服务提供商租赁相应的企业级的存储空间和存储服务，以满足自身不断增长的数据存储需求。

2.4 远程备份和容灾

对于企事业单位中的重要数据，企事业单位可以选择远程自动备份和容灾服务，这样在出现不可预期的灾难时可以保障数据的安全，需要时可以迅速的恢复所有数据。

3 云存储面临的挑战和发展趋势

3.1 数据安全性

数据安全性，是云存储用户首先考虑的问题，许多私密的和重要的数据如果被破坏或损失，将给用户带来灾难性的后果。不断提高云存储系统的安全技术水平，是云存储发展的一个重要方向。

3.2 使用便携性

云存储用户只需要一个账号和密码，便可以很方便的存取数据，这是云存储便携性的体现；此外，对于云存储用户所选择的任何媒介，云存储还可以将用户所需数据集高效准确的推送。

3.3 稳定性和效率

应用客户端和本地设备高速缓存技术，把经常需要用到的数据缓存在本地，可以有效解决互联网延迟甚至网络中断问题。秒传是云存储的一大特色功能，用户在上传文件时，如果服务器上已经有了这个文件，则仅需为用户保存这一文件的链接即可，从而达到快速上传的目的。其原理是，每个文件的哈希值都是不同的，如果两个文件哈希值相同则认为这两个文件是同一个文件。秒传有效节约了空间，提升了存储效率。

3.4 数据访问和数据恢复

如果有大规模的数据访问和数据恢复的需求，云存储的访问性是一大考验，随着云存储技术的发展，云存储服务商可以快速稳定的将数据传送给用户；同时，云存储服务商可以为用户提供一套组件，高效的访问云地址，达到高效存取数据的效果。

3.5 资源池化

资源池化问题对云存储也是一个挑战，中心业务要求计算中心的内存、CPU、以及其他存储设备、网络资源等，能构成一个全局的资源池，以进行动态绑定、灵活调配。那么可以通过定义的数据中心，通过云操作系統，建立一个虚拟的数据中心基础设施，来对所有资源进行统一分配和调度。

3.6 存储设备的协同管理

云存储中所用到的存储设备数量巨大、且各自分布在不同区域，如何更有效的解决不同储存设备之间的存储虚拟化管理、多链路冗余管理、逻辑卷管理，是一个重大的问题，这些问题得不到有效解决，将使得存储设备成为云存储发展的瓶颈，并且会制约着后续扩容和升级的实现。

4 结束语

云存储提供了一种方便、高效的数据存取方案，用户可以在任何时间和任何地方，只要连接上网络，就可以方便的存取数据。随着用户对于数据存储要求的不断提高，云存储技术也在不断的进步和发展。

参考文献：

[1]许志龙，张飞飞.云存储关键技术研究[J].现代计算机（专业版），2012（13）.

[2]蔡佳，秦兴兴.浅谈云存储及安全性[J].计算机光盘软件与应用，2014（10）.

[3]李昆阳.云存储技术理论研究[J].计算机光盘软件与应用，2014（09）.

[4]史英杰，孟小峰.云数据管理系统中查询技术研究综述[J].计算机学报，2013（02）.

[5]陈杰.大数据场景下的云存储技术与应用[J].中兴通讯技术，2012（06）.

作者简介：蒋晓科（1984-），男，重庆人，讲师，硕士，研究方向：软件开发和高职教育理论；符龙生（1981-），男，海南人，讲师，硕士，研究方向：网络技术；李健（1985-），男，陕西人，讲师，硕士，研究方向：网络技术。

云存储技术与标准化篇10

随着云计算技术的飞速发展和大数据时代的到来,越来越多的企业和个人将自己的业务及数据迁入云端,以解决爆炸式增长的数据存储问题,同时满足用户随时随地通过可连网设备获取云端数据的需求[1]。云计算以其高效率、低成本等优势越来越受到大众的欢迎,在各个行业都能感受到云计算给人们带来的便利。伴随着云存储技术的快速发展,云端的安全问题也受到越来越多的关注[2]。黑客攻击、信息泄露、数据篡改等安全隐患接踵而来,这在很大程度上影响了用户将数据迁入云端的选择[3]。这些安全隐患也给云存储的发展带来极大的挑战,新的云存储安全解决方案亟待被提出[4]。

针对云存储的安全问题,虽然目前许多云存储服务商都有使用加密技术保护用户的数据,但是在方便高效方面还存在新的挑战。例如,i Disk不支持用户数据在客户端进行加密,这意味着上传到i Disk的数据是明文[5];Dropbox[6]服务商支持用户在上传数据到云端之前进行加密,但是必须使用云服务商提供的加密机制进行加密,意味着密钥必须由云服务商进行保管,这无疑增加了数据被服务商利用的风险,并给用户选择云计算带来顾虑;Spider Oak、Wuala等服务商允许用户在本地进行数据加密,用户保存根密钥,其他密钥则以密文的形式被保存在云服务器中,虽然这样的方式能够在一定程度上保证云端数据的安全,但是它们提供的一些功能让用户产生疑虑,如“在线重置数据密钥”等功能威胁到了密钥的安全性[7]。

为了解决以上云存储的安全问题,文献[8]提出了基于双线性对密文策略的属性加密机制CP-ABE-WP(Ciphertext-Policy Attribute-Based Encryption with pairing)。该方案通过对CP-ABE-WP提高云存储的安全性和加解密效率,但是该方案在属性个数较多时显得效率不高,且对数据的访问控制较复杂。为实现高效保证云存储数据安全,本文提出一种结合数字信封技术的改进的密文策略的属性加密机制CP-ABE(Ciphertext-Policy Attribute-Based Encryption)[9]云存储安全模型。通过动态口令OTP(One Time Password)[10]对用户进行登录校验,数据在上传之前进行本地加密,加密密钥通过CP-ABE进行加密,结合数字信封技术将数据和加密密钥同时上传至云端存储;当用户下载数据至本地时,根据用户属性及账户信息自动解密数据供用户使用。数据分析与对比表明,新模型能够在不影响云服务性能的前提下高效地保护云端数据的安全。

1 云安全相关技术

1.1 数据加密技术

针对数据存储及传输的安全问题,目前大多数云服务商还是采用传统的数据加密方式保护用户数据的传输及存储安全[11]。例如亚马逊的简单存储服务[12]要求用户在上传数据之前自行加密数据。传统的数据存储和传输方法如图1所示。

图1 传统的数据存储和传输方法

图1中涉及数据交换的主体有云服务器、数据拥有者和普通用户,主要由以下几个步骤完成:

(1)数据拥有者在本地加密数据之后上传至云服务器进行存储;

(2)普通用户注册成为数据拥有者的合法用户;

(3)数据拥有者分发数据加密密钥给注册用户;

(4)注册用户访问云端数据;

(5)使用从数据拥有者处获得加密密钥下载并解密所需数据;

(6)数据拥有者可直接下载自己已上传至云端的数据。

存在的安全隐患:在传统的数据存储和传输方法中,如果注册用户发生变化,数据拥有者需要更新数据密钥以便分发给最新注册的用户,并及时删除原用户信息;在数据拥有者传输密钥给注册用户时,面临着密钥在不安全信道被截取和篡改的威胁。这些不安全隐患都表明传统的数据存储和传输方法不再适应于云存储安全。

目前主流的数据加密技术包括对称加密和非对称加密。主流的对称加密算法[13]包括DES、3DES、IDE-A、AES、RC4、RC6等,主流的非对称加密算法[14]包括RSA、DSA、ECC等。虽然这些主流的加密技术能够在一定程度上保护用户的数据机密性和完整性,但运用在云安全中其效率方面还有待进一步提高。另一方面,这些加密操作都是在云端完成的,用户很难做到完全信任云服务商不会泄露自己上传的隐私数据,这也是导致大部分用户对云存储持怀疑态度的原因。

1.2 CP-ABE算法

CP-ABE[15,16]是将用户的身份表示为一个属性集合,而加密数据则与访问控制结构相关联,用户访问数据取决于用户的属性集是否满足访问控制结构的要求。与传统的公钥加密相比,CP-ABE不需要关注信息共享体中成员的规模和身份信息,具有高效性、抗串联性和策略表示灵活性等优点,使其拥有更强的访问控制能力。

1.2.1 CP-ABE算法结构

CP-ABE算法中相关术语定义如下:

定义1属性:设A={P1,P2,…,Pn}为所有属性的集合,则每个用户的属性集Au是A的一个非空子集,Au⊆{P1,P2,…,Pn}。

定义2访问结构:访问结构T是全集{P1,P2,…,Pn}的一个非空子集,。T代表一个属性判断条件,即在T中的属性集合称为授权集,不在T中的属性集合称为非授权集。

定义3访问树:用来描述一个访问结构,树的每个叶节点代表一个属性项,每个内部节点代表一个关系函数,关系函数可以是“与”、“或”以及“至少满足”等。

例如,假设属性集合A={现居地:北京,现居地:广州,职业:老师,学历:博士};

用户1的属性集Au1={现居地:北京,职业:老师,学历:硕士};

用户2的属性集Au2={现居地:北京,职业:老师,学历:博士};

用户3的属性集Au3={现居地:天津,职业:老师,学历:博士};

访问结构T={{现居地:北京,职业:老师,学历:博士},{现居地:广州,职业:老师,学历:博士},{现居地:北京},{现居地:广州}}。

根据CP-ABE算法机制,分别判断用户是否满足访问结构要求:

用户1的“{学历:硕士}”属性不满足访问结构中的“{职业:老师,学历:博士}”的“与”操作;

用户2满足访问结构要求,可以访问数据;

用户3的属性“{现居地:天津}”不满足“{现居地:北京,现居地:广州}”的“至少满足一个”门限操作。

图2为根据以上假设的一个CP-ABE算法访问控制结构实例示意图。

图2 CP-ABE访问控制结构实例示意图

1.2.2 CP-ABE算法实现步骤

CP-ABE算法主要包含四个步骤:

(1)Setup(Au),授权中心执行:当用户发送访问请求给云服务器时,由授权中心执行该算法,授权中心根据用户的属性Au判断当前用户需要获取的数据,输出系统公共参数PK和主密钥MK,即(PK,MK)=Setup(Au)。

(2)Key Gen(PK,MK,Au),授权中心执行:密钥生成算法以系统公共密钥PK、主密钥MK和用户属性集Au作为输入参数,输出对应于Au的解密密钥SK,即SK=Key Gen(PK,MK,Au)。授权中心在用户发送请求时根据用户属性生成对应于当前用户的解密密钥SK,并通过安全信道发送给用户秘密保存。

(3)Encrypt(PK,M,T),数据拥有者执行:根据授权中心生成的公共参数PK决定具体加密哪个数据,输入系统公共参数PK、数据拥有者的明文M以及访问结构T,加密之后得到密文C,即C=Encrypt(PK,M,T),且该密文只有在满足访问结构的集合属性时才能被解密。

(4)Decrypt(C,SK,PK),普通用户执行:它的输入参数是用访问结构T加密的密文C,以及对应于用户属性集Au的解密密钥SK和系统公共参数PK。如果用户属性集Au满足访问结构T,则输出明文M,即M=Decrypt(C,SK,PK)。

CP-ABE加密机制[17]如图3所示,用户在本地使用对称加密算法对要上传到云端的数据进行加密。其生成的密钥由CP-ABE算法进行加密,用户密钥与用户属性集Au相关,只有Au满足访问结构T时才能解密密文。在云存储中,用户在上传数据之前对数据进行加密的密钥通过CP-ABE进行加密,在传输密钥过程中,即使密钥被黑客截取也无法破解密钥内容,因为只有满足访问控制集合中的属性才能解密密文[18]。通过CP-ABE对密钥加密能够有效防止密钥被截取,其加密方式不会影响数据传输效率。

图3 CP-ABE机制示意图

1.3 数字信封技术

数字信封[19]是一种综合利用了对称加密技术和非对称加密技术两者的优点进行信息安全传输的一种技术。数字信封既拥有对称加密技术的速度快、安全性高等优点,又发挥了非对称加密算法密钥管理方便的优点。

数字信封的功能类似于纸质信封,纸质信封保证了只有收件人才能阅读信的内容。数字信封则采用成熟的密码技术保证只有规定的接收方才能获取发送者的内容,发送者必须知道接收者的数字证书的公钥。图4、图5为数字信封技术加密、解密过程图。

图4 数字信封加密过程

图5 数字信封解密过程

其执行步骤如下:

(1)明文M通过对称密钥K1进行加密,加密函数为Encrypt(K1,M),得到密文C;

(2)对称密钥K1通过接受者的公钥PK进行加密,加密函数为Encrypt(PK,K1),得到加密密钥K2;

(3)将密文C和加密密钥K2同时发送给接收者或上传至云服务器;

(4)接收者接收到密文和加密密钥之后对数据进行拆分,分为密文C和解密密钥K2;

(5)接收者通过私钥SK解密出加密密钥里面的对称密钥,其解密函数为Decrypt(SK,K2),得到对称密钥K1;

(6)使用对称密钥K1解密密文C,解密函数为Decrypt(K1,C),从而恢复出明文M。

数字信封技术的加密过程类似于纸质信封中的信件封装,并指定了具体的收件人,解密过程类似于纸质信封中合法收件人才能拆封并阅读信件。整个信封传递过程都是处于保密状态,确保了数据的安全性。

2 CP-ABE融合技术的云存储安全模型

安全模型主要解决用户数据在云端的上传和存储安全问题。它能够有效解决用户数据在上传中被截获和被篡改的安全问题及数据在云端存储被非授权用户和云服务提供商利用的问题。

2.1 安全模型系统架构

新模型使用三层不同的安全系统架构,层次图如图6所示。

图6 新模型安全层次图

第一层通过短信校验码结合用户信息生成动态口令OTP对用户进行登录校验,有效阻止非授权用户的登录对云服务造成安全威胁。

第二层用户登录成功之后就能够上传数据至云端,在上传之前,用户可以根据安全模型提供的加密方法对数据加密,并使用CP-ABE算法对加密密钥加密,确保只有满足访问结构属性的用户才能解密数据。被加密的密钥和数据通过数字信封技术进行加密上传。数据加密的过程如图7所示,其中本地加密数据的算法以AES算法为例。

图7 基于AES和改进的CP-ABE的数据加密过程

第三层用户从云端下载数字信封封装的数据到本地,模型根据用户的登录信息及账户信息判断当前用户是否为合法用户。如果符合判断要求,则通过模型自动解密数字信封的加密密钥和密文,即根据CP-ABE的属性进行判断用户是否能够解密密钥,从而解密密文供用户使用,数据解密过程如图8所示。

图8 基于AES和改进的CP-ABE的数据解密过程

安全模型在整个数据传输与存储过程中的作用相当于一个网关的作用,用户所有的数据都是经过该模型进行过滤之后再上传到云服务器或者从云服务器下载。模型主要完成以下安全任务:

(1)数据未上传至云端之前对隐私数据加密;

(2)非授权用户从云存储服务器获得数据,只能看到加密形式的数据,无法解密密文数据;

(3)合法用户从云端获得数据,则在用户端自动解密供用户使用;

(4)阻止恶意用户访问服务器,同时检测恶意软件攻击。

图7中为了更好地融合CP-ABE和信封融合技术,将经过CP-ABE加密的加密密钥和密文数据整合成一个数据包同时上传至云端。由于加密密钥和密文数据在数字信封里是属于分开存储的,所以不会造成加密之间的冲突,能够兼容不同的加密技术对数据进行加密,确保数据的机密性。

2.2 登录动态口令OTP设计

模型中的动态口令OTP对用户的账户安全起着至关重要的作用,其主要实现方法是通过接收短信校验码,校验成功之后根据用户名、密码和短信校验码生成一个OTP。用户使用生成的OTP登录云服务器获取数据。短信校验码生成与使用场景是物理隔绝的,因此将校验码在通路上被截取的概率降至最低。OTP总体设计架构图如图9所示。

图9 OTP总体设计架构图

用户首先通过注册时的用户名和密码登录云服务器,登录成功之后,云服务器发送短信校验码到用户手机。用户使用接收到的短信校验码生成OTP,并将OTP存入到云服务器的临时数据库中,存储的时候根据用户信息相应存储。用户再使用用户名、密码及OTP获得云端的隐私数据并自动解密数据,在每次获取数据的时候都需要输入OTP,直到用户退出程序为止。用户再次登录云端服务器的时候需要再获得短信校验码生成OTP。

2.3 用户与云服务器数据交互

图10详细描述了用户和云服务器之间的数据交互过程。用户在上传数据时需要通过CP-ABE密钥授权中心设置访问策略用于加密密钥;用户需要从云存储服务器下载数据时,需要通过CP-ABE密钥授权中心判断用户属性是否满足设置的访问策略。

图1 0 用户和云服务器数据交互序列图

数据使用主流加密技术进行本地加密,在模型的第二层中为了确保数据的完整性,通过对数字信封的检验确定数据有没有被第三方篡改。在模型中数据的密钥是通过CP-ABE加密的,这是为了防止密钥在传输过程中被黑客截获,要想获得密钥必须要满足CP-ABE的访问结构。

3 改进模型仿真实验及性能分析

为了评估本方案的效率和在云环境下的可行性,本文采用模拟的云环境进行仿真实验,同时参考文献[22]所使用的实验方案进行验证。软硬件实验环境为:Vmware Workstation虚拟机及搭建在该虚拟机上的Red Hat Enterprise Linux 6.2操作系统,分布式系统基础架构Hadoop 1.0.4,百度云,实验代码基于cpabe-0.10库[23]实现改进的CP-ABE方案。

3.1 仿真模型及参数描述

本仿真实现由安全模型进行数据的上传和下载,并采用百度云为云端服务器进行数据的存储。仿真模型的三层主要功能包括用户进行OTP登录校验、数据和密钥在传输过程中使用信封技术保证传输的安全性、使用CP-ABE进行密钥的加密传输。在上传时进行数据本地加密和下载时实现模型对数据的自动解密,提高系统的效率。

首先用户通过在百度云注册成功的用户名和密码登录仿真系统,登录校验成功之后服务器会发送短信校验码到注册时填写的手机上。获取到短信校验码之后填入仿真系统中,系统将根据用户名、密码和短信校验码生成动态口令OTP。OTP的展现形式为128 bit MD5加密的文本内容,并被存储在临时数据库中,用户在使用OTP时需要和临时数据库存储的OTP进行比对校验。用户将使用此OTP获取云端的数据。图11即为用户登录校验成功并输入短信校验码之后生成的动态口令OTP。

图1 1 生成动态口令OTP

生成动态口令OTP之后即可进入系统进行文件的上传和下载。在进行文件上传的时候需要设置用户属性集合,用来实现CP-ABE对密钥的加密,属性集合将会保留在系统的数据库中。在上传数据之前,用户需要使用主流的加密算法对数据进行本地加密。本系统采用的主流算法有:AES、DES、3DES、RC4和RC6,用户根据需要进行加密算法的选择。在上传数据的时候需要输入OTP来验证是否为当前用户在操作,确保系统的安全性。图12即为用户上传数据的演示界面。

图1 2 上传数据演示界面

系统通过对接百度云的接口,可以在仿真系统中输入数据的网络地址。在进行文件下载的时候需要选择正确的解密方式,输入解密密钥和OTP,系统将会自动解密需要下载的数据供用户使用。图13为用户从云端下载数据的演示界面。

图1 3 下载数据演示界面

如仿真系统所示,当恶意用户访问云服务器时,OTP校验会阻止恶意用户的访问请求;假如恶意用户非法获得OTP,也会在校验用户属性的时候阻止恶意用户的访问。新模型使用三层不同的安全系统架构,安全有效地保护用户云端的隐私数据。

3.2 改进CP-ABE模型性能分析

本文提出的安全模型是通过OTP校验、数字信封技术和CP-ABE算法保证数据的传输和存储安全。通过给定不同个数的属性来分析CP-ABE算法私钥生成的时间及其加密和解密同等大小的密钥的加密时间变化。图14为CP-ABE算法中用户私钥生成所需时间,从图中可知,用户私钥生成的时间是随着私钥绑定的属性个数增加而增加的。

图1 4 用户私钥生成时间

图15给出了在相同长度对称密钥的前提下,给定不同的属性策略中的属性个数,CP-ABE加密和解密时间对比。从中可以看出随着属性策略中的属性个数的增加,加密和解密时间都相应增加。

图1 5 CP-ABE加密和解密时间

表1通过给定不同大小的文件对不同算法进行加密速度的测试,其中改进模型中CP-ABE算法属性数为10个。从表中可以看出AES的加密速度是最快的,其次是RC4加密算法,改进的CP-ABE模型的加密时间变化和数据加密时间成正比。

表1 加密时间性能比较

图16给出了改进的CP-ABE和文献[8]提出的改进方案CP-ABE-WP加密时间性能对比情况。从图中可以看出改进的CP-ABE的加密时间性能在属性个数较大时得到较大提升。图17给出了其解密时间对比情况,在属性个数增大时其解密时间性能明显提升。

图1 6 改进模型和CP-ABE-WP加密时间对比

图1 7 改进模型和CP-ABE-WP解密时间对比

图18给出了改进的CP-ABE和CBHAC算法[20]权限变更时间性能对比,CBHAC算法通过对称加密方法进行数据加密,能够简单有效地保护数据的机密性。仿真实验设定属性个数为10,用户数目为300,从图中可以看出,权限变更时间改进的CP-ABE比CBHAC小得多,时间性能提升明显。

图1 8 权限变更时间对比

本文还对动态口令OTP的安全性能进行了仿真模拟测试。系统采用模拟攻击的方法分别对OTP和传统静态密码进行字典攻击暴力破解测试,并取1000次暴力破解数据的平均值作为最终结果。数据结果表明,OTP的安全性能明显高于传统的静态密码方法。

4 改进CP-ABE模型安全性分析