云存储(共11篇)
云存储 篇1
1 云计算概念
云其实是网络、互联网的一种比喻说法。过去在图中往往用云来表示电信网, 后来也用来表示互联网和底层基础设施的抽象。云计算分狭义云计算和广义云计算。狭义云计算指IT基础设施的交付和使用模式, 指通过网络以按需、易扩展的方式获得所需资源;广义云计算指服务的交付和使用模式, 指通过网络以按需、易扩展的方式获得所需服务。如果仅下一个定义, 人们仍然无法理解到底什么是云计算, 我们举一个很浅显的例子。传统模式下, 企业建立一套IT系统不仅仅需要购买硬件等基础设施, 还有买软件的许可证, 需要专门的人员维护。当企业的规模扩大时还要继续升级各种软硬件设施以满足需要。对于企业来说, 计算机等硬件和软件本身并非他们真正需要的, 它们仅仅是完成工作、提供效率的工具而已。对个人来说, 我们想正常使用电脑需要安装许多软件, 而许多软件是收费的, 对不经常使用该软件的用户来说购买是非常不划算的。如果能够提供我们需要的所有软件供我们租用, 我们只需要在用时付少量“租金”即可“租用”到这些软件服务, 为我们节省许多购买软硬件的资金。我们每天都要用电, 但我们不是每家自备发电机, 它由电厂集中提供;我们每天都要用自来水, 但我们不是每家都有井, 它由自来水厂集中提供。这种模式极大得节约了资源, 方便了我们的生活。面对计算机给我们带来的困扰, 我们可不可以像使用水和电一样使用计算机资源?这些想法最终导致了云计算的产生。云计算的最终目标是将计算、服务和应用作为一种公共设施提供给公众, 使人们能够像使用水、电、煤气和电话那样使用计算机资源。云计算模式即为电厂集中供电模式。在云计算模式下, 用户的计算机会变的十分简单, 或许不大的内存、不需要硬盘和各种应用软件, 就可以满足我们的需求, 因为用户的计算机除了通过浏览器给“云”发送指令和接受数据外基本上什么都不用做便可以使用云服务提供商的计算资源、存储空间和各种应用软件。这就像连接“显示器”和“主机”的电线无限长, 从而可以把显示器放在使用者的面前, 而主机放在远到甚至计算机使用者本人也不知道的地方。云计算把连接“显示器”和“主机”的电线变成了网络, 把“主机”变成云服务提供商的服务器集群。在云计算环境下, 用户的使用观念也会发生彻底的变化:从“购买产品”到“购买服务”转变, 因为他们直接面对的将不再是复杂的硬件和软件, 而是最终的服务。用户不需要拥有看得见、摸得着的硬件设施, 也不需要为机房支付设备供电、空调制冷、专人维护等等费用, 并且不需要等待漫长的供货周期、项目实施等冗长的时间, 只需要把钱汇给云计算服务提供商, 我们将会马上得到需要的服务。这就是云计算, 在这样的模式下, 云存储又是怎么一回事, 它与云计算有怎样的联系呢?
2 云存储概念
云存储是在云计算 (cloud computing) 概念上延伸和发展出来的一个新的概念, 是指通过集群应用、网格技术或分布式文件系统等功能, 将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作, 共同对外提供数据存储和业务访问功能的一个系统。当云计算系统运算和处理的核心是大量数据的存储和管理时, 云计算系统中就需要配置大量的存储设备, 那么云计算系统就转变成为一个云存储系统, 所以云存储是一个以数据存储和管理为核心的云计算系统。简单来说, 云存储就是将储存资源放到网络上供人存取的一种新兴方案。使用者可以在任何时间、任何地方, 透过任何可连网的装置方便地存取数据。然而在方便使用的同时, 我们不得不重视存储的安全性, 存储必须具有良好的兼容性, 以及它在扩展性与性能聚合方面等诸多因素。首先, 作为存储最重要的就是安全性, 尤其是在云时代, 数据中心存储着众多用户的数据, 如果存储系统出现问题, 其所带来的影响远超分散存储的时代, 因此存储系统的安全性就显得愈发重要。其次, 在云数据中心所使用的存储必须具有良好的兼容性。在云时代, 计算资源都被收归到数据中心之中, 再连同配套的存储空间一起分发给用户, 因此站在用户的角度上是不需要关心兼容性的问题的, 但是站在数据中心的角度, 兼容性却是一个非常重要的问题。众多的用户带来了各种各样的需求, Windows、Linux、Unix、Mac OS, 存储需要面对各种不同的操作系统, 如果给每种操作系统更够配备专门的存储的话, 无疑与云计算的精神背道而驰, 因此, 云计算环境中, 首先要解决的就是兼容性问题。再次, 存储容量的扩展能力。由于要面对数量众多的用户, 存储系统需要存储的文件将呈指数级增长态势, 这就要求存储系统的容量扩展能够跟得上数据量的增长, 做到无限扩容, 同时在扩展过程中最好还要做到简便易行, 不能影响到数据中心的整体运行, 如果容量的扩展需要复杂的操作, 甚至停机, 这无疑会极大地降低数据中心的运营效率。最后, 云时代的存储系统需要的不仅仅是容量的提升, 对于性能的要求同样迫切, 与以往只面向有限的用户不同, 在云时代, 存储系统将面向更为广阔的用户群体, 用户数量级的增加使得存储系统也必须在吞吐性能上有飞速的提升, 只有这样才能对请求作出快速的反应, 这就要求存储系统能够随着容量的增加而拥有线性增长的吞吐性能, 这显然是传统的存储架构无法达成的目标, 传统的存储系统由于没有采用分布式的文件系统, 无法将所有访问压力平均分配到多个存储节点, 因而在存储系统与计算系统之间存在着明显的传输瓶颈, 由此而带来单点故障等多种后续问题, 而集群存储正是解决这一问题, 满足新时代要求的千金良方。
3 云存储技术与传统存储技术
传统的存储技术是把所有数据都当作对企业同等重要和同等有用来进行处理, 所有的数据集成到单一的存储体系之中, 以满足业务持续性需求。但是在面临大数据难题时显得捉襟见肘:1) 成本激增。在大型项目中, 前端图像信息采集点过多, 单台服务器承载量有限, 就造成需要配置几十台, 甚至上百台服务器的状况。这就必然导致建设成本、管理成本、维护成本、能耗成本的急剧增加;2) 磁盘碎片问题。由于视频监控系统往往采用回滚写入方式, 这种无序的频繁读写操作, 导致了磁盘碎片的大量产生。随着使用时间的增加, 将严重的影响整体存储系统的读写性能, 甚至导致存储系统被锁定为只读, 而无法写入新的视频数据;3) 性能问题。由于数据量的激增, 数据的索引效率也变得越来越为人们关注。而动辄上TB的数据。甚至是几百TB的数据, 在索引时往往需要花上几分钟的时间。
作为最新的存储技术, 与传统存储相比, 云存储具有以下优点:1) 管理方便。其实这一项也可以归纳为成本上的优势。因为将大部分数据迁移到云存储上去后, 所有的升级维护任务都是由云存储服务提供商来完成, 节约了企业存储系统管理员上的成本压力。还有就是云存储服务强大的可扩展性, 当企业用户发展壮大后, 突然发现自己先前的存储空间不足, 就必须要考虑增加存储服务器来满足现有的存储需求。而云存储服务则可以很方便的在原有基础上扩展服务空间, 满足需求;2) 成本低。就目前来说, 企业在数据存储上所付出的成本是相当大的, 而且这个成本还在随着数据的暴增而不断增加。为了减少这一成本压力, 许多企业将大部分数据转移到云存储上, 让云存储服务提供商来为他们解决数据存储的问题。这样就能花很少的价钱获得最优的数据存储服务;3) 量身定制。这个主要是针对于私有云。云服务提供商专门为单一的企业客户提供一个量身定制的云存储服务方案, 或者可以是企业自己的IT机构来部署一套私有云服务架构。私有云不但能为企业用户提供最优质的贴身服务, 而且还能在一定程度上降低安全风险。
传统的存储模式已经不再适应当代数据暴增的现实问题, 如何让新兴的云存储发挥它应有的能力, 在解决安全、兼容等问题上, 我们还需要不断的努力, 就目前而言, 云计算时代已经到来, 作为其核心的云存储必将成为未来存储技术的必然趋势。
摘要:随着信息化以及计算机网络技术的高速发展, 从计算机应用由于资源匮乏而不得不采取的计算资源大集中模式到如今IT技术高度发展而带来的云计算时代。数据信息量的不断增加, 给传统的存储技术带来了新的挑战, 如何让数据存储适应新技术的发展无疑是我们在发展的道路上必须弄清楚的一个重要问题。本文由浅入深, 首先从云计算、云存储的概念谈起, 进而分析在云计算时代云存储技术的实际作用。通过对传统存储技术与云存储技术的对比, 体现云存储技术是未来数据存储的必然趋势。
关键词:网络,云计算,数据存储,云存储
参考文献
[1]高岚岚.云计算与网格计算的深入比较研究[J].海峡科学, 2009 (2) .
[2]卢大勇, 陆琪, 姚继锋.伯克利云计算白皮书 (节选) [J].高性能计算发展与应用, 2009 (1) .
[3]李德毅, 孟海军.隶属云和隶属云发生器[J].计算机研究与发展, 2009.
[4]中国云计算网.什么是云计算, 2009.
[5]维基百科.Cloud computing, 2009.
[6]Amazon Amazon elastic compute cloud (Amazon EC2) 2009.
[7]IT168.云计算技术的产生, 2012, 1.
云存储 篇2
云存储系统数据结构
为了保证存储系统的可靠性,需要将数据复制为多份。当数据规模增加时,我们可能会对传统的数据库分库分表以水平扩展,很多企业还开发了各自的数 据库中间层以屏蔽分库分表规则。然而,在传统的分库/分表架构下,每一份数据只能为一组 Master-Slave 节点服务,这就导致同一组机器节点存放了完全相同的数据,当其中某个节点发生故障时,只能通过所在机器组中的节点进行故障恢复,这样的系统称为同构系统。
云存储系统一般指异构系统,每份数据可以被动态分配到集群中的任意一个节点,当某个节点发生故障时,可以将故障节点原有服务动态迁移到集群中的任何一台机器。只有实现系统异构才能发挥分布式集群的规模优势,减少集群运维成本,适应云存储系统数据量快速增长的需求。
数据结构决定了云存储系统的功能,云存储系统的数据结构主要有两种:分布式 Hash 表和分布式B+ 树,如图 1 所示。分布式 Hash 表通过比如一致性 Hash 的方式将数据分布到集群中的不同节点,数据随机分布,不支持范围查询;而分布式B+ 树的数据连续存放,支持范围查询,但是需要支持分裂和合并,实现相对较为复杂。
图 1 云存储系统分类图
常见的 Key-Value 系统的数据结构一般为分布式 Hash 表,只支持基本的 Put、Get 和 Delete 操作,比如 Amazon 的 Dynamo 和 S3 系统。而 Amazon Simpledb 按照 domain 进行数据划分,规定同一个 domain 数据量不能超过 10GB,从而可以存放到一个数据节点,用户只允许在同一个 domain 内部执行范围查询操作。Amazon 的云存储系统看起来不完美,但相当实用。
Google 的系统设计之初就强调可扩展性。从最初的 GFS 到 BigTable,再到后来的 Megastore、Percolator,Google 先将系统的可扩展性发挥到极致,以后再逐步加入分布式事务、SQL 支持等功能。这样的设计得益于 Google 强大的工程师团队和公司一直以来崇尚通用系统的文化。Google 的云存储分为两层:分布式文件系统 GFS 和分布式数据库系统 BigTable,GFS 是一个带有追加功能的分布式文件系统,BigTable 将事务的提交日志追加到 GFS 中做持久化。数据在 BigTable 内连续存储,逻辑上构成一棵分布式B+ 树,Megastore、Percolator 又在 BigTable 的基础上加入分布式事务、索引、SQL 支持等功能。Google 的系统设计比较贵族化,可以远观,但模仿前请三思,比如将系统分成多层可能会增加用户操作的延时,对工程师的设计编码能力提出了更高的要求。
Microsoft SQL Azure 是一个传统数据库厂商在云存储系统设计上给出的答案。当数据量增长时,必然要求牺牲部分功能来换取可扩展性,这对于 Microsoft 是不愿意看到的。Microsoft 直接在原有的关系型数据库 SQL Server 上进行分布式扩展,尽可能多地支持 SQL 功能,其功能非常丰富,但系统内部不支持 SQL Azure 实例的分裂和合并。因此,SQL Azure 内部也限制了单个 SQL Azure 实例允许的最大数据量,如 Business Edition 的最大数据量不超过 50GB。相比 Google 的系统,Microsoft 系统的扩展性较弱,但功能较强。
云存储系统的难点在于状态数据的迁移和持久化,状态数据也就是系统的事务提交日志。Google BigTable 通过分布式文件系统 GFS 持久化提交日志,Microsoft SQL Azure 直接将提交日志通过网络复制到数据的多个副本,而 PNUTS 通过 Yahoo!内部的分布式消息中间件 Yahoo! Message Broker 持久化提交日志。Yahoo!没有对外提供云存储服务,但这样的设计可扩展性也是相当不错的。
淘宝 Oceanbase 架构设计
淘宝 Oceanbase 是从 年 5 月开始研发的,其定位是解决淘宝内部在线业务的云存储问题。我们在设计系统时,总是考虑现在及今后一段时间的需求。互联网业务大致可以分为 OLTP 和 OLAP 两类,对在线存储的需求简单归纳如下。
OLTP:今后数据规模为千亿级,数据量百 TB,要求几十万 QPS 和几万 TPS。
OLAP:支持千万级记录的数据集上进行实时计算。
功能:支持范围查询,支持跨行跨表事务。
其他:5个 9 的可用性、自动故障处理、自动扩容等。
OLTP 和 OLAP 业务对性能的要求使我们必须采用分布式方案。另外,淘宝的业务发展迅猛,传统的分库/分表方法带来的扩容及运维成本太高,必须构建异构的云存储系统。通过 进一步分析在线业务,我们发现互联网在线存储业务有一个特点:数据量虽然很大,但新增数据量比较小,每天新增数据量基本在 1TB 之内。此外,淘宝的业务面临一些其他挑战,比如需要高效支持跨行跨表事务,需要支持两张几亿到几十亿条记录的大表进行联表操作。淘宝的海量数据以及复杂的 功能需求对存储系统的设计提出了新的挑战,关系型数据库在数据量上有点儿力不从心,而云存储系统又不能高效地支持复杂的功能要求。因此,需要融合关系型数 据库的功能和云存储系统的可扩展性这两个优点,
如何借鉴已有技术满足淘宝未来一段时间内的云存储需求?如果直接模仿国外的互联网巨头,比如模仿 GFS + BigTable,淘宝的团队确实有一定的经验。然而这样的系统在两年之内很难稳定,并且不能满足跨行跨表事务等复杂的功能需求。既然在线业务新增数据量 比较小,那是否可以把最新修改的数据和以前的数据分离呢?
答案是肯定的。淘宝 Oceanbase 将数据分成动态数据和静态数据两部分:动态数据的数据量较小,侧重 TPS 和 QPS,采用集中式的方法存放到单个节点的高品质存储介质,如内存和 SSD;静态数据的数据量很大,侧重存储容量,采用分布式的方法将数据分布到多台普通 PC 服务器的磁盘或者 SSD。由于动态数据的存储介质成本较高,需要不断地将动态数据合并到静态数据中,从而分布到多台机器以实现分布式存储。
淘宝 Oceanbase 系统架构大致如图 2 所示。从图 2 可以看出,系统有以下几个主要模块。
图 2 Oceanbase 架构图
RootServer:负责数据定位、机器管理、负载均衡、全局表 Schema 信息管理等。
UpdateServer:负责存储动态数据,存储介质为内存和 SSD。
ChunkServer:负责存储静态数据,数据存储 3 份,存储介质为磁盘或者 SSD。
Client:Oceanbase 提供的胖客户端。
写事务只操作 UpdateServer,读事务需要同时读取 ChunkServer 和 UpdateServer。某些操作,比如 OLAP 分析型操作可能需要涉及多个 ChunkServer 上的数据,这时将引入一个新的 MergeServer 模块将请求拆分到不同的 ChunkServer,合并每个 ChunkServer 的返回结果后执行排序、分组、分页等操作。静态数据在 ChunkServer 中保存三份,UpdateServer 通过 Linux HA 的方式进行双机热备以保证可靠性。RootServer 的访问压力很小,一般可以和 UpdateServer 部署在相同节点上,并采用相同的 Linux HA 方式。Oceanbase 的 UpdateServer 在同一个 IDC 机房采用实时同步的方式保证强一致性,这意味着写事务只有等到主机和备机都操作成功后才返回客户端。Oceanbase 支持跨 IDC 机房的异步准实时热备,多个机房之间的数据延迟为秒级。
Oceanbase 的静态数据和 BigTable 类似,数据被分为几十到几百 MB 不等的子表,每个子表的磁盘存储格式为 SSTable,通过 bloom filter、block cache、key value cache 等方式进行优化。SSTable 支持根据 column group 按列存储,从而高效地支持 OLAP 分析。动态数据采用 copy-on-write 的方式实现了单机内存中的B+ 树,在单写多读的应用场景下不需要加锁。
Oceanbase 静态数据构成一棵分布式B+ 树,动态数据为单机B+ 树。与线下 MapReduce 批处理应用不同,在线存储应用的更新量一般比较小,动态数据服务器不会成为性能瓶颈。这也就意味着,淘宝 Oceanbase 用一种更为简便的方式在底层实现了和其他互联网巨头类似的B+ 树数据结构,并且能够高效地支持跨行跨表事务。当然,当数据量增长到万亿级或者数据更新更快时,需要考虑将动态数据服务器的方案由集中式修改为分布式。我 们也考虑过多 UpdateServer 方案的设计,但由于短期内看不到明确的需求,暂时没有实现,目前我们认为可以通过硬件的方法,比如万兆网卡、更好的 CPU、更大的内存和 SSD 来解决。
Oceanbase 还实现了一些分布式系统中常见的特性,比如自动负载均衡、在线修改 Schema、内置压缩解压缩等。另外,Oceanbase 系统里面没有随机写操作,因此天然适应 SSD 存储介质,很好地弥补了磁盘的 IOPS 不足这个问题。
Oceanbase 应用效果和经验
Oceanbase 首先应用在淘宝收藏夹并取得了明显的效果。淘宝收藏夹最初采用 MySQL 分库/分表的方式实现,通过使用 Oceanbase,机器数由原来的 16 台主加上 16 台备共 32 台减少到 12 台静态数据服务器加上 2 台动态数据服务器,大大节省了机器资源。另外,目前应用的很多问题在 Oceanbase 中是通过更好的架构来解决,单机层面基本没做优化,相信后续还有很大的提升空间。在这过程中,我们也积累了一些经验教训。
选择合适的技术。云存储听起来比较神秘,但实际上,对于大多数企业,需要设计好系统可扩展性发展的路线图,当数据规模比较小,可以采用传统的分库分表的方式构建同构系统;当数据规模逐步增加时,可以考虑构建符合企业需求的异构系统。
细节决定成败。云存储更多地是一个工程问题,代码质量、优化细节对系统的表现影响至关重要,淘宝 Oceanbase 的大多数代码都被两个以上的工程师 Review,我们也在减少 Cache 锁粒度、减少上下文切换、减少内存分配和内存拷贝等方面做了很多细粒度的工作。
展望
Oceanbase 目前的主要工作是应用推广,根据应用的需求来逐步完善 Oceanbase 系统,实现互联网数据库的构想。我们已经开始和淘宝的业务团队开展了千万级数据秒级实时分析的 OLAP 项目。另外,Oceanbase 还在考虑整合分布式 Blob 存储系统。随着应用推广的深入和 Oceanbase 系统的优化,希望能在合适的时间进行数据库新基准 TPC-E的测试。
另外一个振奋人心的消息是:Oceanbase 将在合适的时间点开源。相信通过业界同仁一起努力,一定能够将云存储这个问题解决好!
作者杨传辉,花名日照,淘宝存储系统专家,热衷于分布式存储和计算系统设计,对分布式系统理论和工程实践有比较深厚的理解。之前在百度作为核心成员主导或参与 MapReduce、BigTable 和分布式消息队列等底层基础设施架构工作。
迷你云:60秒搞定云存储 篇3
近8年的多行业管理及经营经验,并在资金方面做了较好的准备。我们一共有三位股东,我和其他两个股东是大学同学。
谁是你的标杆?
我们要做中国版的Dropbox。
你的第一个重要客户是谁?第一笔重要收入来源?何时挣到第一个1 00万?
中国电信。第一笔重要收入来自政府扶持资金。2010年我们挣到了第一个100万。
你和竞争对手有何不同?如果腾讯跟你做一样的,你怎么办?
我们推出了“60秒搭建私有云存储同步服务平台”,让用户决速实现私有的类Dropbox服务,包括产品名与Logo可自定义,可以在公网或局域网内诞生出多个大大小小的Dropbox。与竞争对手的不同在于:1.提升了存储的“信任安全”,数据存储在自己的服务器上;2.传输通道是自建;3.学习了Dropbox的开放,提供API。我们将继续完善产品,提供差异化的用户体验。
你的创业有哪几个难忘时刻?你们经历了哪些困境并且如何挺过来的?
难忘时刻有三个:第一,拿到营业执照那一天;第二,第一次试用自己研发的产品;第三,收到360的收购邀请,但后来我们没有接受,因为我们希望整个团队一起幸福,而不仅仅是几个股东的幸福。
你重视营收还是利润?增长速度还是PE估值?公司—两年的财务表现?
我更注重曹收和增长速度。公司争取2012年曹收超过400万元,2013年曹收达到800万一1000万元。
你希望获得什么样的天使及VC?你的融资需求主要在哪里?
云存储安全探讨 篇4
一、云存储问题
(一) 制度问题
首先是缺乏统一的安全标准。没有统一的安全标准, 数据主权、迁移、传输、安全、灾备等都存在问题。以数据主权风险为例, 往往客户并不是数据的唯一所有者, 客户隐私容易泄露。再比如各家云服务商数据存储的模式各不相同, 当需要进行跨平台数据迁移和数据恢复时, 可能不能完成任务。其次是目前没有云安全数据保护的法规, 还没有明确的法律规定云服务提供商或者其他官方机构能否够查用户存储于云上的信息。
(二) 技术问题
一是采用第三方平台带来的安全风险问题。分布式的架构决定了很多云服务提供厂商没有自己的数据中心, 而是租用第三方云平台。一旦租用第三方云平台, 就存在服务提供商管理人员权限过高的问题, 从而带来数据安全隐患。
二是服务连续性问题。传统的互联网服务存在单点故障的问题, 所以才双机备份。在传统方式下, 一组服务停止工作只会影响自己的业务和用户, 可以迅速切换到备机恢复使用。但是在云环境下, 云服务提供商的服务终止, 影响的就不是一个用户, 而是一大片用户, 涉及范围巨大;同时, 恢复服务需要排查修复多个存储设备, 而这些存储设备位于不同区域, 因此恢复服务所需的时间和代价也很大。
二、建议
(一) 加强制度建设
一是建立云安全技术标准体系。明确数据主权, 这是数据安全的基本前提。数据主权不明, 就无法界定什么样的事件是云存储安全事件, 同时, 这也是用户放心使用云平台的前提。建立统一的数据存储规范, 便于数据传输、迁移、灾备和恢复, 以及便于提供更好的共享和数据挖掘等服务。
二是建立健全云安全法律法规。法规建设要结合当前云存储和云计算形式, 预判未来发展趋势, 制定有一定前瞻性的安全法规。这样才能真正有效规范这个快速发展的新型事物, 才能从法律上威慑信息犯罪。
(二) 加强技术保障
一是使用多副本策略。云存储的分布式文件系统构建在大量的廉价机器之上, 系统需要容忍硬件的失效, 所以硬件失效在分布式文件系统中是被允许的。如果某一个硬件机器失效, 那么存储在该台机器上的数据是无法被访问的, 为了防止数据的丢失, 可以采取多副本策略。每个数据块在整个集群之上有多个备份, 这些备份根据系统的分布情况分布在不同的物理位置, 即使其中某一个或某几个节点出现问题, 都能正常被访问。特别是面对恶意攻击时, 可能造成不止单份数据的损坏, 多备份策略更有助于快速找回数据、恢复服务。
企业云存储生意 篇5
这是一个虚拟数据与文件大爆炸的时代,大数据的爆发助推了云存储市场的发展。统计显示,随着云存储服务的迅猛增长,2012年全球用户总量约为3.75亿,这一数字到2013年将攀升至6.25亿。
面对急速扩张的云存储市场,不仅仅是国外的厂商在角逐发力,国内的互联网企业也不甘寂寞,纷纷推出自己的云存储产品,并迅速实现产品升级。云存储市场一时群雄逐鹿、战火纷飞。
如何才能脱颖而出?在又拍云存储公司CEO刘平阳看来,“真正对云存储有‘刚需’的是企业方而不是消费者,只有企业才会不得不对用户产生的海量数据负责,并且在考虑成本的情况下去购买云储存服务。”
又拍云存储就是这样一家只提供面向企业收费云储存服务的公司,目前有4万多个企业用户,其中包括唱吧、捕鱼达人、蘑菇街、百姓网、天天动听等众多知名企业,营业收入超过千万元。这家云服务商在图片领域的专业优势日渐彰显,成为企业级云存储商家的一匹黑马。
前景:企业存储市场大
云存储到底是一种什么样的服务呢?
云计算的功能主要是指服务器的可扩展性、硬件优化以及在云端结构中将一个虚拟服务器上的应用程序移动到另外一个服务器的能力。不过,2013年云计算通过其存储能力给企业带来了更大的影响。通过使用云存储,企业可以满足日益增长的数据可用性需求,获得移动性的安全保障,管理日益膨胀的数据,并且将它视作一项战略性存储分化措施。
移动互联网的高速发展,给云存储带来了前所未有的机遇。据Springboard研究机构预计,2014年中国总体云存储服务市场规模(含企业与个人用户市场)将达到2.1亿美元,年复合增长率高达103%。云存储所具有的各种优势对企业来说意义重大,企业级市场对于存储的需求日益增加,面向企业提供服务才是云存储的价值所在。
2012年以来,在个人云存储服务逐渐获得用户认可的同时,面向企业级客户的云存储市场正在悄然展开,并呈快速燎原之势。国际巨头纷纷推出自己的云存储服务,国内三大运营商也在云存储市场不断发力,互联网巨头不断跟进。除此之外,一批专注于企业级云存储的创业公司亦逐渐萌发。
目前,国内的IaaS(基础设施即服务)供应商大致可分为三大阵营:第一阵营是传统的IDC厂商,如西部数码、世纪互联等;第二阵营是阿里云、盛大云、腾讯云等几大互联网巨头,称之为“平台类服务商”,产品线大而全;第三阵营如又拍云存储、云测等,分别深耕细作基础设施的某个领域,称为“垂直类服务商”。
与传统的IDC厂商及“平台类服务商”相比,从图片领域起家的又拍云存储凭借其在图片领域近10年的沉淀成为云存储市场的一匹黑马,为企业提供通用大规模存储服务,为创业者提供静态数据云存储+云处理+CDN加速服务,目前已在全国各地部署了60多个CDN节点、600多台服务器,并且还在不断扩展中;打通了包括电信、联通、移动、教育网和各地方运营商在内的全网带宽。
出路:差异化与专业化
刘平阳对又拍云存储从众多企业级云存储服务商中脱颖而出的评价是“正确的方向、明确的目标和对产品的专注”。
又拍云存储的前身是又拍网,这家2006年由刘平阳和同事沈志华一起开发的图片存储和分享的网站,最初的定位是基于图片分享的SNS网站,并把目标用户瞄准国内的Flickr用户、博客用户以及技术达人们。
经过几年的积累,在又拍网的基础上,针对客户的需求,刘平阳及团队推出了又拍云存储平台。新上线的又拍云存储平台针对的存储对象不仅局限于图片的存储加速,而且将范围扩展到了所有的静态文件存储+CDN加速服务,而静态文件就包括图片、音频、视频、flash、js、css、各种附件等无需调用数据库的文件。
“又拍云存储平台的推出,是我们在又拍网多年运营的基础上,针对客户需求进行分析而研发的产物。”刘平阳认为,处于这样一个大数据时代,又拍云存储的出现可以说是偶然中带有必然,“我们的方向很正确”。
“又拍云储存已经不仅仅是单纯意义的存储服务商,考虑到用户图片缩略图,防盗链、音视频的转码压缩等功能,我们开拓出云处理业务。”刘平阳告诉记者,又拍云存储的与众不同之处就是不仅仅是存储:“又拍云存储目前主要包括云存储、云处理、云加速三个业务板块。拿云加速服务来说,考虑到中国网络环境比较复杂,运营商之间带宽互相限制,访问速度容易受到影响。我们设有分布全国的CDN加速网络,打通了全网带宽,包括电信、联通、移动、教育网以及各地方运营商,不限制带宽峰值,并通过高速缓存、智能解析、负载均衡技术,让用户最快访问机房。”“只有能够抓住企业应用痛点,可为企业提供更多增值服务的云存储企业才能实现自身价值。”对于蓬勃发展的云存储市场,刘平阳的观点不无道理。
《新财经》:相比其他已推出云服务的产品,又拍云存储有何特点和独特服务?
刘平阳:又拍云是非结构化数据的云存储、云处理和云加速平台。非结构化数据是指图片、视频、文档、网站样式文件等各种类型的静态文件。又拍云的服务与一般云存储服务不同,我们除了存储,还有处理和加速功能。比如唱吧,一年时间内发展出近亿用户,不仅对存储要求非常高,而且对数据处理、音视频的云端编解码处理工作以及各个地方的用户对于访问的响应速度要求都非常高。按照过去的处理方式,我们的客户既要自己考虑购买存储设备,随着业务增长,需要忍受不断去采购服务器、上架、配置服务器的痛苦,还要安排开发人员去开发音视频的编解码服务,而且还要去采购CDN(内容加速网络)的服务。 而现在,我们的客户他只需要做一件事情,就是成为又拍云的客户,这一切问题都解决了。另外,如今移动互联网发展迅速,PC端和移动端浏览方式不同,对图片分辨率也有不同要求,网站技术可以做到适应不同分辨率,但是体验不好、速度较慢。而又拍云能够针对不同设备,分发对应图片,提高浏览速度。
《新财经》:在移动互联网飞速发展的当代,云存储的安全问题很重要,又拍云在这方面有什么措 施?
刘平阳:云存储的安全性实际上体现在两个方面。一方面是数据内容的安全,这一安全隐患对于又拍云是不存在的,因为又拍云客户的数据都是公开数据,比如《新财经》,图片文档都是公开的,不存在泄露的问题。只有面向企业内部和个人网盘的云服务才有这种隐患。另一方面是物理方面的安全,即数据会不会丢失。在这方面,对于客户上传的数据,又拍云都有三个拷贝数量,自动复制。若第一份数据丢失,服务器会生成一个新的文件备份。另外,我们还设置跨地区服务器备份,提供双重保障。
云存储的剖析 篇6
目前, 云存储被越来越多人熟知。我们说云存储不只是设备, 还有服务。如同云状的广域网和互联网一样, 云存储对使用者来讲, 不是指某一个具体的设备, 而是指由许许多多个存储设备和服务器所构成的一个集合体。使用者使用云存储, 并不是使用某一个存储设备, 而是使用整个云存储系统带来的一种数据访问服务。所以严格来讲, 云存储不是存储, 而是一种服务。云存储的核心是应用软件与存储设备相结合, 通过应用软件来实现存储设备向存储服务的转变。
目前, 云存储主要分为公有云的存储服务和私有云的存储服务。这两种云存储服务在IT建设上和适用场景上差距很大, 公有云存储服务主要指互联网企业或者个人在使用的存储服务, 如网盘 (快盘、金山网盘、51快盘等) 为个人免费提供存储空间;七牛云存储不仅提供存储空间, 还可以提供相关的A PI接口, 提供相关的开发;公有云的存储服务做的最好的是亚马逊, 提供标准的S3接口, 来满足上层应用的需要。公有云IT建设主要采用服务器存储的方式来提供空间, 通过多份副本实现数据的安全可靠;私有云IT的建设主要采用传统的存储架构和应用软件来实现云计算中心高可用、智能化、可扩展、易管理的数据中心。私有云的存储服务主要建设在自己单位的机房中, 整体IT架构和公有云有很多区别, 目前私有云建设在存储层都采用专业的存储阵列, 阵列采用双控制器或者多控制器的架构, 通过分布式文件系统实现数据的集群存储。
2 公有云存储服务
公有云的存储服务即是基于互联网应用的云存储, 云存储系统中的所有设备对使用者来讲都是完全透明的, 任何地方的任何一个经过授权的使用者都可以通过一根接入线缆与云存储连接, 对云存储进行数据访问。目前互联网使用的云存储产品有:微软skydrive、云创minicloud迷你云、百度云、联想网盘、华为网盘、阿里云、七牛和亚马逊。公有云的IT基础建设架构如图1所示。
通过整体拓扑可以看到, 不同的设备在不同的地方, 只要通过互联网就可以实现数据的存储和访问, 实现跨时间和跨地域云服务。整个IT的建设主要通过不同的分布式文件系统实现数据的多份存储。
在存储设备的选择上, 互联网企业不约而同的采用了存储服务器的架构。以一个10, 000台服务器的互联网数据中心为例, 其中大约有10%的服务器用于云存储, 存储数据的空间全部由普通的服务器提供, 利用服务器内置的RAID卡管理10~12块硬盘, 单台可以提供30TB的空间, 通过存放3~5个副本的方式来保证数据的可靠性。这样做的原因有两点:
(1) 单一设备, 简化运维管理。服务器是互联网企业最主要的硬件设备, 其上可以通过软件实现计算、CACHE、网络、存储等所有功能。统一的硬件设备能够最大化发挥维护团队的技术能力, 降低维护成本。
(2) 应用的性能低, 瓶颈在于网络带宽。服务器提供存储的主要瓶颈是性能, 互联网企业云存储的性能一般在10~20MB, 甚至低于服务器内部硬盘的读写速度。考虑公有云的存储服务一般用于网盘等业务, 受到互联网的出口带宽限制, 这样的速度也足够了, 没有必要配置专业存储。
3 私有云存储服务
云存储作为一种方便快捷的文件备份方式已经为广大客户所接受。考虑到公有云存储所存在的数据存储安全性、私密文件保护隐患方面的问题, 以及企业上网行为管理的在执行上的需求, 很多企业开始在自己的网络内部架设私有云, 将云存储的服务端部署在企业的内部网络中, 服务端的维护与管理可以由企业自行控制, 企业员工可以在授权范围内安全使用私有的云存储功能。
很多在公共云存储服务端无法实现的功能 (如云计算中心高性能计算、大数据等应用) , 都能在私有的环境下得到良好的解决。由于企业信息化的运维人员没有互联网企业对应的运维人员多, 同时, 互联网对数据的安全性和企业对数据的安全性要求相差很远, 所以在私有云建设的时候, 为了保证更好的运维和管理, 数据的安全和可靠, 企业或者政府单位都采用传统的专业的存储整理加上对应的应用软件实现云存储系统的搭建。私有云IT建设拓扑如图2所示。
通过图2可以看出, 私有云的云存储建设相对于公有云的云存储建设要复杂的多, 整体建设从数据的安全性、业务的连续性考虑, 充分满足了政府和企业的整体需求。图2中, 存储层采用专业的磁盘阵列的集群实现资源的集中存储, 传统专业的存储都采用双控或者多控制器的方式实现数据的可靠存放;上层通过NAS节点 (应用服务器) 实现并行访问, 单独的元数据管理, 保证了私有云存储数据的顺利访问和读写;NAS节点通过交换机和服务器冗余链接, 构建了云存储的后端SAN网络。
4 结束语
目前, 采用NAS+传统的磁盘阵列是实现云存储的主要建设方式。EMC的Isilon采用One FS文件系统, 实现磁盘阵列的集群, 为上层应用提供统一存储空间;IBM的SONAS采用GPFS的文件系统实现云存储的建设;华为的N9 0 0 0采用Vx C FS文件系统实现NA S的集群;宏杉科技的NS20 0 0采用Lust re文件系统实现NAS的横向和纵向扩展, 实现存储资源的集群扩展和资源的统一提供。
云存储 篇7
关键词:PACS系统,云存储,云计算,数据存储
1 前言
在医学影像领域,数字成像技术的创新促进了医疗影像存储与传输系统(Picture Archiving and Communication System,PACS)的开发。目前,PACS系统已经日益成为各级医院实现信息化建设的重要组成部分。
2 PACS系统的存储特点
1)PACS系统和医院信息系统(HIS)的数据各有特点,在存储容量、访问响应速度、访问频率、存储可扩展性等方面存在差异,需要分别考虑,采用分类存储策略。2)PACS系统中数据保存量大,数据量增长速度快,部分数据将作为归档数据,实现安全保存和随时方便地调用,需采用分级存储策略。3)PACS系统数据以多媒体文档为主,文件尺寸较大,并发访问量小。4)许多影像资料用于科研和教学,重要性高,需要可靠有效的容灾数据保护方案。5)PACS存储系统的设计需要具备高扩展性和灵活性,需要支持容量增长的高度可扩展架构和对异构存储环境的支持,以实现将来无缝扩容,且尽量减少因扩容带来的成本开销。
3 PACS系统存储现状分析
我院由总院、分院、传染病医院三个院区组成,各院区均有影像科室。分院距总院5公里,传染病医院距总院3公里,分别由光纤接入总院服务器,实现三院区HIS系统无缝联接。PACS系统有专用服务器和磁盘存储阵列,采用SAN存储架构;支持DICOM存储和DICOM查询;支持影像数据的长期存储管理(LTSM)和短期存储管理(STSM);提供影像有损和无损压缩;支持多种方式查询检索;在数据库建立病人ID号与影像内容及存储位置对照表;可从Intranet和Web Server上获取DICOM影像;支持影像调出、转存、删除和图像迁移功能。在各院区的影像科建立了科室级的PACS存储服务器,临床医生通过HIS系统的医生工作站访问CT、核磁共振、超声等影像图像和电子报告编辑。
4 基于云存储的PACS系统存储设计
4.1 云存储的概念
云存储是在云计算(Cloud Computing)概念上延伸和发展出来的一个新的概念,是指通过集群应用、网格技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。
4.2 云存储的结构模型
与传统的存储设备相比,云存储不仅仅是一个硬件,而是一个网络设备、存储设备、服务器、应用软件、公用访问接口、接入网、和客户端程序等多个部分组成的复杂系统。各部分以存储设备为核心,通过应用软件来对外提供数据存储和业务访问服务。云存储的结构模型由四层组成,如图1所示。
4.3 PACS存储系统的分级存储需求分析与设计
4.3.1 分院区(科室级)存储需求分析与设计
分院区存储容量一般在0.5~5GB/日数据量,以为临床医生提供3个月的在线影像资料查询为例计算,需保存的在线可用容量为0.5GB/日~5GB/日×365=182.5~1825GB;预计存储空间达到总空间的80%时的性能损耗,配置20%的冗余空间,由此得出总空间需求为:182.5~1825GB/80%=228.1~2281GB;按RAID5模式估算:存储裸容量需求为:228.1~2281GB/(3/4)=304.2~3042GB;考虑到数据库空间、文件损失和热备份等因素,配置800GB~4TB的裸容量作为科室级存储。
分院区PACS存储系统应具有良好的性能、可扩展、经济实用等特点。该级存储采用24盘位SAS磁盘阵列插入24块300G的SAS硬盘,提供7.2T裸容量,完全满足了要求的800GB~4TB总裸存储容量,用于PACS的数据库和短近期的医疗图像的存储。
4.3.2 总院区(全院级)存储需求分析与设计
总院级存储容量可在20GB/日数据量以上;在线容量将为临床医生提供1年以内的在线影像资料查询,需保存的在线可用容量为20GB/日×365=7300GB=7.3TB;预计存储空间达到总空间的80%时的性能消耗,配置20%的冗余空间,由此得出总空间需求为:7.3TB/80%=9.125TB;整体上按照RAID5模式估算:存储裸容量需求为9.125TB/(3/4)=12.2TB;考虑到数据库空间、文件损失和热备份等因素,配置15TB的裸容量作为总院级存储。
存储系统在异地建立独立的容灾备份中心,保证在发生灾难时对数据保护。考虑备份存储容量以大于全院10年的影像总量为例,备份存储容量为80TB。
全院级PACS存储系统需具备高性能、高可靠性、高可用性以及高可扩展能力,兼顾容灾功能的考虑。采用24盘位磁盘阵列,使用独立双控制器,包括4个4GB光纤主机接口,总带宽达到1600MB。采用两台扩展柜,使用SAS硬盘共提供7.2×3=21.6TB的裸容量,满足最大15TB的容量需求。容灾采用VTL结合磁带库,增强了备份数据管理特性,提高备份和恢复的速度。
4.4 云存储技术的优点
1)硬件冗余自动故障切换;2)存储设备升级不会导致服务中断;3)容量分配不受物理硬盘限制;4)海量并行扩容;5)负载均衡;6)容易管理。
5 总结
医院PACS系统的存储要求较高,当有异地多院区需通过光纤接入局域网形成全院级的一致性存储需求,同时网络中存在各种不同类型的存储设备时,采用基于云计算的数据存储概念云存储技术实现PACS存储系统,即可满足用户对PACS存储系统的新建、升级、扩容、数据管理和数据安全等需求,也可进一步增强数据应用的灵活性和可靠性。
参考文献
[1]王鹏.云计算的关键技术与应用实例[M].北京:人民邮电出版社,2010:105-111.
[2]陈全,邓倩妮.云计算及其关键技术[J].计算机应用,2009,9.
云存储 篇8
1 PACS数据存储方案
PACS系统主要用于医疗影像数据的存储和调阅等功能,其数据增长迅速,随着检查设备的数量增多和精度提高而快速递增,而且PACS影像资料需要安全保存和随时方便及快速调阅。此外,PACS还需要具备良好的扩展性和灵活性,以方便未来的无缝扩容,所以PACS系统的存储策略及存储扩展方案一直是PACS系统设计的重点。
虽然PACS影像数据量巨大且增长迅速,但由于不同阶段的图像数据在临床应用中被使用的频率与时间有很大的关联性,最新的影像数据被调阅得最为频繁,越旧的历史数据被调阅的机率越小,所以医院大多对影像数据按其访问规律进行分类并分级存储。存储策略依赖于存储产品和PACS产品,主要有分级存储管理、分层存储管理和基于分布式PACS的分布式存档机制等[1]等几种策略,不同的医院会根据自身实际情况进行选择。
广州医科大学附属第二医院的PACS系统虽然也是采用按时间分级存储管理,但并不是通常所使用的“在线- 近线-离线”三级存储架构进行存储,而是所有影像数据均提供在线访问。数据按时间段分别存放于不同的存储上,最近的数据被存放于高性能的FC SAN架构存储,历史影像数据存放于大容量、成本较低的存储或云存储平台。客户端需要调阅影像数据时,会按预定的优先次序访问文件服务器,当读取到所需的数据时立即返回。这种方式实现了所有影像数据可在线访问。
2 基于云存储的PACS系统存储方案
2.1 云存储概念
云存储是在云计算概念上延伸发展出来的一个概念,它通过集群应用、网格技术或分布式文件系统等功能,将网络中各种不同类型的存储设备通过应用软件集合起来协同工作[2],为用户提供存储服务和访问服务。用户需要存储空间时,只需向云存储服务提供商申请存储服务即可。
2.2 基于云存储的PACS存储架构
云存储能为用户提供可扩展的、安全可靠的存储服务,且容量可无限扩展,非常适合PACS系统存储。广州医科大学附属第二医院将云存储与PACS系统相结合,采用如图1 的存储架构。
从图1 可以看到,云存储平台通过点对点专用光纤接入本地中心机房,PACS系统访问云存储端数据时可以像访问本地存储一样。PACS影像文件由于数据量大,故分级存放于多个文件服务器,最新的数据存放于高性能的基于FC SAN存储的文件服务器,并将其访问优先级设为最高,其他历史影像数据存放于大容量、成本较低的基于NAS或云存储的文件服务器。客户端需要调阅影像数据时,先从数据库读取文件相对路径,然后按预设的优先顺序依次访问文件服务器,当读取到所需的影像文件后即停止访问。虽然历史数据可能需依次访问多个文件服务器才能取到数据,访问时间略长,但由于其访问频率低及访问量小,性能上也能让人接受,总体上保障了用户对所有影像数据的在线调阅,实现了效率与成本的平衡。
当PACS影像数据需要扩容时,只需增加云存储空间,无需在本地投入资金搭建平台,存储设备升级也不会导致服务中断,且云存储的容量扩展几乎不受限制,能为历史影像数据提供海量存储空间。同时,该存储架构可以非常方便的横向扩展文件服务器,从而提高文件服务的吞吐能力。
3 总结
云存储具有管理维护方便、扩展容量简单、数据安全可靠等特点,可以解决目前PACS系统存储扩展的难题,为PACS系统的高效运行提供有力的保障,是PACS影像存储的发展趋势。
摘要:PACS系统的影像数据由于其数据量大,增长速度快,已使系统面临存储扩展能力不足的问题。基于此,主要介绍如何利用云存储平台以应对PACS影像数据量迅速增加的压力,为日益庞大的影像数据提供按需扩展的存储空间。
云存储 篇9
在网络融合以及服务器、网络和存储基础设施的虚拟化这一大趋势的推动下, 企业的下一代数据中心纷纷朝着基于服务的云计算的模式发展。随着应用向云计算基础设施的迁移, IT管理者们面临着如何在不影响正常业务的情况下将数据从一个数据中心迁移到另外一个数据中心的难题。而QLogic也围绕这一趋势不断开发着自己的数据迁移解决方案 (DMS) , 帮助企业通过灵活、弹性的操作将数据从最为复杂的数据中心环境迁移出来, 并帮助企业开发卓越的云计算战略。
除了不断以实际行动来证明其对解决数据迁移问题的决心以外, QLogic还通过讲演来向人们展示其解决方案是如何优化基础设施以解决“云”难题的。在6月11日纽约举办的Cloud Expo大会上, QLogic的云计算总监Ilker Cebeli和产品营销总监David Clark就分别发表了题为“大数据的I/O架构”和“数据中心迁移到云”的演说, 一直以“云计算”作为会议主题的Cloud Expo大会已经在多地举办过, 也是业内人士以及企业了解最新云趋势的最好机会。Ilker Cebeli的演说让与会者了解了大数据如何影响数据中心的存储和网络架构, 如何搭建优化的基础设施来解决所面临的难题。此外, 还诠释了如何在利用云存储的同时, 维持本地iSCSI和Fibre Channel存储基础设施。而David Clark不仅简要介绍了数据中心存储迁移到云所面临的机遇, 同时展示了如何通过单个工具的解决方案来解决并简化数据从最为复杂的数据中心环境迁移到云的进程, 最为复杂的环境包括如下组件:异构存储、多厂商架构、多协议网络以及操作系统。
QLogic还将在大会上展示其FlexSuiteTM适配器和Universal Access PointTM交换机, 这些产品可以在不升级硬件的情况下为16Gb FC或10Gb以太网融合网络提供灵活的支持。QLogic还将发布支持多协议的下一代10Gb以太网智能存储路由器 (iSR) 。QLogic解决方案致力于帮助企业按需实现平稳的数据中心网络迁移, 并提供了对所有协议、主机、存储和网络架构的支持, 为虚拟企业和云计算环境提供了自由的架构选择。
大数据商机:云存储 篇10
如果3000多年前商朝的史官穿越到今天这个时代,他们一定会产生一种对信息数据的眩晕感。
这是一个数据爆炸的世界,人类从未像今天这样随时随地地创造数据。有统计称,现在全球一天创造的数据相当于过去几百年创造的数据。我们可以在互联网上搜索、聊天、购物、摄影、看视频、听音乐、写文档……现在BAT(百度、阿里巴巴、腾讯)各自处理的数据量已达到100P(1P=1024T,1T=1024G))级别。据说淘宝和天猫每天新增的数据量,能让人连续不断地看28年高清电影。
随着数据量的与日俱增,如何方便、安全地存储信息就成了人们考虑的问题。在随处是“云计算”的“云时代”,人们纷纷将数据搬到云端。数据云端化趋势催热了存储市场,各种云存储产品纷纷落地。
“云计算”催热“云存储”
2002年左右,陈进才所在的研究团队正从事一项数字电视台研究,需要存储高清的数字电视信号,当时主流的硬盘大小只有几十“G”(1G=1024M),无法满足存储需求。陈进才想到的办法是,将几个小容量且便宜的硬盘组合成为一个磁盘阵列,每个磁盘阵列大小为1T,总共用了四个这样的磁盘阵列。
“现在在京东、淘宝上很轻易就能买到几‘T’大小的移动硬盘。”回想起12年前的存储条件,陈进才感叹道。计算机科学出身的陈进才现在是华中科技大学光电国家实验室信息存储与光显示功能实验室的科学家,专注于信息存储的基础研究工作。
“硬盘是信息存储历史上具有里程碑意义的发明。我最早使用的硬盘大小只有几十‘M’,现在几百‘G’、几‘T’容量的硬盘都很常见了。”陈进才的硬盘使用史大致与硬盘发展史相当。
不过现在,陈进才可能要跟硬盘说拜拜了。人们逐渐将数据搬到云端,而不是硬盘、U盘或者光盘,而这一切都拜“云计算”这个时髦词儿所赐。
“计算和存储是两个密不可分的概念。人们在计算什么?数据。计算的结果是什么?还是数据。只要是数据,都需要有一个场地,这就是存储。”陈进才说,“以前学术界和产业界对计算的投入较多,所以云计算才发展这么快,不过紧接着云存储又落地了,现在网盘已经走进了人们的生活。”
人们日常使用水、电,只要拧开水龙头、插上插头就可以用了,并不需要知道所使用的水和电来自何方。事实上,水、电来自不同的水厂、电厂,并纳入统一的水电供应网络中。云存储也是一样的道理。以前,人们知道一个文档存储在U盘、光盘、硬盘当中,现在数据走向云端,人们不知道数据究竟存储在哪里,但这并不妨碍人们随时随地使用数据。
云存储技术的出现是符合时代发展需要的。这是一个大数据时代,生活在这个时代的人跟商朝史官的最大不同是,人们能随时随地记录和保存自己的历史。人们记录个人历史的方式各式各样,产生的数据诸如文字、语音、照片、视频、消费记录、搜索记录等,五花八门。特别是智能硬件兴起以后,各种可穿戴设备正马不停蹄地记录我们身体的数据。个人拥有的数据量与日俱增,传统硬盘已经无法满足需求,云存储适时出现,缓解了存储压力。
这又是一个移动互联网时代,人们随时随地都在使用PC、笔记本、手机、平板等多种终端设备,而这些设备之间的数据同步和共享问题也日益突出。人们使用数据的场景日益丰富:工作时在单位的PC上办公,有时又需要在其他终端上查看数据;用手机拍摄了照片、视频,想在PC或者电视的屏幕上观看。传统的解决办法是用U盘、移动硬盘等存储介质转移数据,但使用起来总是不便。一旦终端设备或者U盘、硬盘损坏或丢失,造成的数据损失无法弥补。云存储技术则很好地解决了数据同步和共享,给用户带来便捷。
据思科公司发布的《思科全球云指数:2013-2018》报告预测显示,到2018年,全球将有78%的数据量会在云端存储和处理,只有22%的数据会在传统物理介质中存储和处理。对此,陈进才表示:“具体的比例我无法评价,但是数据云端化趋势是明显的,这个预测大方向是对的。”
云存储应用无处不在
正因为数据无处不在,所以云存储也无处不在。近两年,个人云、家庭云、企业云、行业云等各式各样的“云”纷纷问世。
对家庭来说,照片是最值得回忆的纪念。360云盘就打算把用户的照片作为未来发展的重点。“照片对用户来说是很重要的数据。我们想把用户的照片都备份到云盘中,避免用户手机、电脑故障时丢失照片的情况。以后用户也可以在手机的云盘或相册内看到这些照片,实现无障碍查看,且不占用手机存储空间。”360云盘产品经理刘航对《支点》记者说。
云存储的好处还在于能突破传统U盘物理时空的局限。比如人们拍摄了照片,将照片保存并分享到云存储,远在老家的爸妈可以瞬时查看这些照片。类似的使用照片数据的场景很多,而家庭云存储则能很好地满足家庭成员在不同地区、不同场景下查看照片的需求。
随着物联网建设的推进,家庭智能化也逐步实现。“一个家庭就是一个物联网系统。现在家里一般都有好几台移动设备,还有其他的智能设备,比如空调、电视、冰箱等。对这些智能设备的控制、需求都会产生信息数据,而有数据就需要存储配置。家庭云存储能够把这些电子设备共用起来,建立在一个共同的平台上,从而达到数据同步和共享的目的。”陈进才认为,家庭云存储前景广阔,“按照现有技术,家庭云存储很快就能够推广开来。”
云存储在智慧城市建设中也应用广泛。比如城市智慧交通,有了云存储,交警可随时在个人终端上查看道路交通信息。比如智能安防系统,由于要存储大量的高清监控视频,传统的存储方式根本无法满足。云存储不仅能存储大量视频,还能让用户随时随地调取视频数据。又比如在智慧医疗中,云存储平台将人们跟医院等健康机构联系起来。各种可穿戴设备记录人们身体的数据,并实时将数据上传到云端,医生则可随时查看数据并提出指导意见。
nlc202309041205
类似的云存储技术应用还有很多,未来云存储将在智慧城市的各个细分领域都将得到长足发展。据IDC的《2020年的数字宇宙》报告预测,到2020年数字宇宙的规模将达到40万亿GB,其中40%的数据将会在云服务商那里被存储或处理,15%的数据将始终存储在云中。
业内混战跑马圈地
尽管云存储市场空间巨大,但无论是美国,还是中国,云存储行业还处于起步阶段,市场中还没有形成占绝对优势领头羊的局面。
比如在美国,不仅苹果公司推出iCloud云存储服务,其他巨头如谷歌、亚马逊和微软也纷纷角逐云存储市场。而Box这样的初创公司也开始与大牌公司Dropbox(世界上最大的云存储服务公司之一)抢市场。一时间,美国云存储市场好不热闹。
国内云存储市场也热闹非凡,互联网巨头和初创企业纷纷在云存储市场上跑马圈地,并没有哪一家处于很明显的优势地位。网盘作为针对个人用户的一种云存储产品,尤其受到青睐。百度云盘、360云盘、微云、天翼云、115网盘、金山快盘、华为网盘、新浪微盘,都在使出浑身解数,积攒人气。
“现在PC没落了,移动设备越来越普及。云存储可以备份终端设备中的重要资料,防止丢失,各个终端之间也可以同步和分享数据,给用户带来便利。另外,手机制造商也想用云存储黏住用户,资料备份在他们的云存储里,用户换品牌的机会就变少了。”刘航向《支点》记者解释了为什么云存储会引发起众多互联网公司的兴趣。
热闹归热闹,陈进才从热闹中看出了些门道。在他看来,目前国内的云存储服务提供商还处于聚集用户的初级阶段。“通过提供免费的大容量的网盘服务,达到聚集大量用户的目的,再通过提供增值服务收费,比如扩充存储容量等。”
“企业这么做也很无奈。毕竟云存储刚出现,消费者心里没底,如果一开始就收费的话,用户肯定不买账,免费则符合国内用户的心理。”陈进才认为,国内云存储服务提供商还需慢慢探索更有效的商业模式。
刘航也坦言,360云盘还没有找到有效的盈利模式,处于用户积累期。不过他坚持认为:“好的基础服务应该是免费的,未来我们也不会向云盘用户收费。”
陈进才建议,云存储服务商应转向企业级用户要利润。“企业有时会存储大量数据,所以迫切需要云存储。”当然企业可以自建私有云,但云存储技术门槛很高,需要企业投入大量资金购买存储硬件和软件设备建设云存储平台,还得请专业人员运营和维护这一平台,成本投入较大。当然企业也可以把这些工作交给专业的云存储服务商,这就给国内云存储服务商们带来了机会。
未来存储将生物智能化
人类自文明诞生以来,就一直在探索存储信息的方式。从结绳记事到龟甲兽骨,从莎草纸到竹简丝绸,从纸张到软盘,从硬盘到光盘,从U盘到云盘,信息存储能力在越来越强、越来越便捷的同时,人们也越来越注重存储的安全问题。
艾媒咨询在去年底发布的《2014中国个人云存储行业及用户行为研究报告》显示,80.3%的中国网民会选择用U盘存储文件,只有33.6%的网民会选择云存储产品存储文件,同时还显示,有59.6%的网民在选择云存储服务时比较关注存储的安全性。
安全的云存储对用户使用习惯的形成至关重要。一说到“云”,总给人一种虚无缥缈的感觉,用户对于云存储也有这样的感觉。跟U盘存储不一样,数据云端化以后,用户不知道数据究竟存储在哪里,从而对云存储的数据安全产生担忧。
云存储,究竟安不安全?去年闹得沸沸扬扬的好莱坞女星艳照门事件,不禁让人们对云存储安全性产生怀疑。女星的艳照就是从苹果公司的云存储服务iCloud中流出的。
刘航解释说,iCloud泄漏是因为苹果公司对iCloud账户登录没有限制,允许用户反复重试密码,黑客利用这个漏洞开发软件穷举各种密码,从而破解账户盗取文件。
刘航认为没有绝对的安全。要提高安全性能,一方面云存储服务商本身要将安全措施做到极致;另一方面用户也要提高自身安全意识。
陈进才认为,安全问题是目前云存储推广的最大障碍之一,但用户没有必要因此就排斥云存储。“以前我们去银行柜台存钱就觉得安全,而在网上交易则觉得不安全,可现在大家普遍都在网上转账、付款。请给云存储一点时间,未来云存储的安全体系会越来越先进。”陈进才对云存储的未来充满信心。
当然,云存储也并不是人类存储信息的最终形态,事实上云存储的数据依然存储在硬盘上。刘航认为,未来肯定会出现更为先进的存储技术,比如蛋白质存储器。据悉,一个蛋白质存储器的存储容量可达5万GB,与传统光盘相比访问数据的速度更快,且在无电源的情况下还能存储数据。
“互联网预言帝”凯文·凯利在《失控》一书中认为,人造事物和天生事物正在联姻。他说:“机器,正在生物化;而生物,正在工程化。”蛋白质存储器正是生物工程化的体现。未来,蛋白质存储器很有可能会成为继云存储以后存储市场新的增长点。
依靠存储技术,人类知识得以传承。毫不夸张地说,未来人类文明的延续,存储技术的进步至关重要。(支点杂志2015年3月刊)
云存储平台设计探析 篇11
近年来,随着互联网的迅速发展,每天产生数量庞大的信息,如何存储这些潜力巨大的信息,成为亟需解决的问题。如果将这些信 息都存储 在本地,则会占用 大量资源。因此,人们可以利用虚拟化云技术进行存储。首先介绍云存储的概念和特点,进而论述云存储平台在设计过程中遇到问题和解决方案,最后探讨云存储平台设计。
1 云存储特征及服务
1.1 云存储特征
云存储将大量不同类型的存储设备通过软件集合起来协同工作,共同对外提供数据存储服务。云存储服务对传统存储技术的数据安全性、可靠性、易管理性等方面提出了新挑战[1]。通过对近年来互联网上的典型云存储技术进行调研和分析,大多数云存储技术具有以下特征:1按需扩展。云存储平台类似于一个空间比较大的资源池,当用户使用空间超过原有分配空间时,平台会自动按需分配出足够的空间供用户使用,不仅能满足消费者需求,而且使资源得到合理分配;2功能隐藏性。在使用云存储过程中,用户只需请求相关服务,云平台会自动进行分配,以满足用户需求,云平台对外隐藏具体实现细节;3低成本存储。随着信息量不断增加,本地化存储需要更多资源,如硬盘、软盘等,使用户增加大量存储成本,但若利用云存储平台,不仅可降低用户成本,而且也能满足用户的移动存储需求。只需具备上网条件,用户无论何时、何地都可以上传或下载所需文件。
1.2 云存储服务
云存储是将一些文件和数据存储在云端,然后开放一些标准的协议和接口,让用户能够方便地将文件和数据传输到云端。将文件保存在云端不用担心存储空间问题,也不用关心数据或文件的存储位置,并且随着云存储技术的不断发展,存储安全性也得到了极大提升。
云存储服务主要分为3类:1存储服务。该服务不仅指云存储可直接为用户提供服务,而且开发人员还可利用这些服务进行二次开发;2相关平台服务。平台技术能对普通资源进行再次抽象,并对资源进行动态扩展或收回,还加入多种容错技术。而且平台对外提供统一接口,能解决不同终端的接入问题;3云存储软件服务。主要面向普通用户群体,该用户群体可直接利用客户端使用服务,这些服务允许用户自定义使用环境,而且还可为特定人群提供个性化服务。
2 云存储关键技术与解决方法
基于对企业需求的分析和对市场中标杆产品的学习,云存储平台的研发目标是为上层应用提供海量、安全和高可用的云存储服务,帮助其有效应对高并发和海量数据的场景[2]。
2.1 拓扑结构
在利用云技术进行存储的过程中,需设计科学合理的拓扑结构,使节点间 能相互关 联。对于数据 存储服务 而言,利用传统星形结构比较合适,原因在于星形结构能进一步发挥云存储按需分配的特点,将存储空间进行合理分配和回收。因此,本文中拟采用星形拓扑结构,同时在相邻节点间进行通信。当用户查询某个数据或文件时,若在某个节点中无法查询到,该节点能将查询请求发送到相邻节点,帮助用户进行查询服务。
2.2 云存储系统架构
云存储平台主要是为用户提供数据和文件存储服务。为此,在设计云存储平台架构时,需要以用户需求为出发点进行架构设计。当用户利用客户端使用云存储平台服务时,能及时将请求传送到云存储平台。经过云存储平台处理,然后及时向客户端返回处理结果。本文采用架构主要是以客户端为核心的架构方法,客户利用客户端发送服务指令,然后存储平台节点接收并执行这一指令,如果某个节点接收该指令而无法完成,可以向相邻节点进行指令转发。该方式能使节点之间进行通信,同时可减少节点间的负荷,从而大大提高数据传输效率,为用户带来更好的服务体验。
2.3 元数据
元数据可理解为存储在云存储平台中的数据结构,其是对数据或文件进行的抽象,能将数据或文件转换为云平台存储内部的数据格式,从而使云存储平台对数据进行更好的管理。本文采用类似于Linux操作系统的文件存储类型,主要是将元数据和元数据的存储数据进行分离。在进行元数据查找过程中,可以通过对元数据索引遍历进行快速查询;同时,元数据索引所占空间小,可方便进行二级和三级索引扩展,从而方便用户使用和查询。
2.4 数据隔离
云存储平台是一个多用户、多任务的存储平台,在该平台上,不同用户可同时执行不同操作,云存储平台需对这些请求作并行化处理。因此,为防止用户数据在操作过程中相互干扰,需对用户数据进行隔离。本文的解决方案是将数据按照一定分类进行隔离。主要分类标准是应用种类、数量和规模,而且在进行分类的过程中不能出现数据交叉或重复现象。数据隔离是云存储平台设计过程中的关键问题,必须给予很好的解决。
2.5 数据存储和维护
数据存储和维护是云存储平台的核心业务。数据存储主要需考虑以下问题:1数据能方便、快速地进行插入、查询、删除和清空等操作,而且表与表之间关联性较低,不存在复杂表关系;2存储模式。目前的主要存储模式分为关系型存储和非关系型存储,因此需要根据不同文件的存储需求,选择不同存储模式;3数据维护。在云平台进行存储的过程中,由于多种因素可能导致数据破坏或消失。为更好地满足用户需求,要求云存储平台具有数据维护功能,主要是利用数据校验和容错技术,保证数据能在云存储平台进行安全存储。
3 云存储平台设计
3.1 系统结构
通过以上论述和分析,云存储平台系统结构主要分为以下部分:1客户端。客户端主要是使用户能利用可视化界面进行操作,发送文件或数据存储和读取命令到云存储平台并进行相应处理;2云存储服务端。服务端主要是对数据进行存储,然后对节点进行管理,通过服务端节点可以生成很多子节点;3中间接口和协议。云存储平台对外开放标准协议和接口,使用户或其他开发者能方便地使用云存储平台,在云存储平台基础上进行二次开发,从而能为用户提供更加丰富的服务。
3.2 分布式存储流程
为满足众多用户的 服务请求,对数据进 行分布式 存储,可有效减少服务器性能损耗,同时也可提高用户查询数据的效率。为了更好地进行分布式存储,需合理设计分布式存储流程和架构。存储流程主要分为以下步骤:1当用户通过客户端发送 请求后,需读取用 户信息的 相关文件,检查该用户是否存在,如果存在,则继续进行后续服务;否则返回用户不存在提示,结束服务;2当用户通过客户端向服务端发送请求时,携带用户IP地址和请求命令,并根据用户请求IP到特定服务器查询用户的相关数据和服务,从而实现分布式存储。
3.3 系统相关模块
如图1所示,云存储平台系统架构设计完成后,通过对云存储平台的分析,抽象出系统的3个主要子模块:1管理节点模块。该模块主要是对节点进行管理,使云存储平台节点能及时有效地响应客户端需求,同时通过对节点的管理,及时发现节点问题,从而提高平台有效利用率;2子节点。为更好地实现节点功能,可将节点划分为更加细致的子节点,各子节点任务间需要具有较高的无关性,从而能使各子节点间进行并行的任务处理,有效提高节点性能;3客户端。客户端是用户使用服务的重要工具,因此客户端不仅需要满足基本功能,还需具有一定美观性。
4 结语
云技术的出现,可使大量计算和存储过程都利用云技术加以解决。利用云技术不仅能使文件和数据方便、安全地存储在云端,而且能帮助本地节约大量资源。随着科学技术的不断发展,云存储平台将得到进一步完善,从而为人们提供更加方便、快捷的服务。
摘要:随着计算机技术的不断发展,互联网为人们提供越来越丰富的服务,只需具有基本的上网条件,即可方便地使用互联网提供的各种服务。尤其在云技术出现后,人们可利用云技术进行“云”存储。介绍了云存储的相关概念和特征,并论述了云存储关键技术和解决方法,最后探讨了云存储平台设计。
【云存储】推荐阅读:
云存储安全06-27
云存储平台设计05-20
云存储安全网关10-03
云存储模型架构10-03
云存储的优势11-03
云存储技术及应用10-13
分布式云存储技术06-24
保证云存储的数据安全08-06
云存储及其安全性研究05-22
云存储数据安全性分析06-06