
云存储
云存储是一种网上线上存储(英语:Cloud storage)的模式,即把数据存放在通常由第三方託管的多台虚拟伺服器,而非专属的伺服器上。託管(hosting)公司营运大型的数据中心,需要数据存储託管的人,则透过向其购买或租赁存储空间的方式,来满足数据存储的需求。数据中心营运商根据客户的需求,在后端準备存储虚拟化的资源,并将其以存储资源池(storage pool)的方式提供,客户便可自行使用此存储资源池来存放档案或对象。实际上,这些资源可能被分布在众多的伺服器主机上。
云存储这项服务乃透过Web服务应用程式接口(API), 或是透过Web化的用户界面来访问。
基本介绍
- 中文名:云存储
- 外文名:cloud storage
- 来源:在云计算上延伸出来的新概念
- 核心技术:并行计算
- 地位:新兴的网路存储技术
工作原理
云存储是在云计算(cloud computing)概念上延伸和衍生髮展出来的一个新的概念。云计算是分散式处理(Distributed Computing)、并行处理(Parallel Computing)和格线计算(Grid Computing)的发展,是透过网路将庞大的计算处理程式自动分拆成无数个较小的子程式,再交由多部伺服器所组成的庞大系统经计算分析之后将处理结果回传给用户。通过云计算技术,网路服务提供者可以在数秒之内,处理数以千万计甚至亿计的信息,达到和”超级计算机”同样强大的网路服务。
云存储的概念与云计算类似,它是指通过集群套用、格线技术或分散式档案系统等功能,网路中大量各种不同类型的存储设备通过套用软体集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统,保证数据的安全性,并节约存储空间。简单来说,云存储就是将储存资源放到云上供人存取的一种新兴方案。使用者可以在任何时间、任何地方,透过任何可连网的装置连线到云上方便地存取数据。如果这样解释还是难以理解,那我们可以借用广域网和网际网路的结构来解释云存储。
网路结构
相信大家对区域网路、广域网和网际网路都已经非常了解了。在常见的区域网路系统中,我们为了能更好地使用区域网路,一般来讲,使用者需要非常清楚地知道网路中每一个软硬体的型号和配置,比如採用什幺型号交换机,有多少个连线埠,採用了什幺路由器和防火墙,分别是如何设定的。
系统中有多少个伺服器,分别安装了什幺作业系统和软体。各设备之间採用什幺类型的连线线缆,分配了什幺IP位址和子网掩码。
但当我们使用广域网和网际网路时,我们只需要知道是什幺样的接入网和用户名、密码就可以连线到广域网和网际网路,并不需要知道广域网和网际网路中到底有多少台交换机、路由器、防火墙和伺服器,不需要知道数据是通过什幺样的路由到达我们的电脑,也不需要知道网路中的伺服器分别安装了什幺软体,更不需要知道网路中各设备之间採用了什幺样的连线线缆和连线埠。 广域网和网际网路对于具体的使用者是完全透明的,我们经常用一个云状的图形来表示广域网和网际网路,如下图:

虽然这个云图中包含了许许多多的交换机、路由器、防火墙和伺服器,但对具体的广域网、网际网路用户来讲,这些都是不需要知道的。这个云状图形代表的是广域网和网际网路带给大家的互联互通的网路服务,无论我们在任何地方,都可以通过一个网路接入线缆和一个用户、密码,就可以接入广域网和网际网路,享受网路带给我们的服务。
参考云状的网路结构,创建一个新型的云状结构的存储系统,这个存储系统由多个存储设备组成,通过集群功能、分散式档案系统或类似格线计算等功能联合起来协同工作,并通过一定的套用软体或套用接口,对用户提供一定类型的存储服务和访问服务。
当我们使用某一个独立的存储设备时,我们必须非常清楚这个存储设备是什幺型号,什幺接口和传输协定,必须清楚地知道存储系统中有多少块磁碟,分别是什幺型号、多大容量,必须清楚存储设备和伺服器之间採用什幺样的连线线缆。为了保证数据安全和业务的连续性,我们还需要建立相应的数据备份系统和容灾系统。除此之外,对存储设备进行定期地状态监控、维护、软硬体更新和升级也是必须的。如果採用云存储,那幺上面所提到的一切对使用者来讲都不需要了。云状存储系统中的所有设备对使用者来讲都是完全透明的,任何地方的任何一个经过授权的使用者都可以通过一根接入线缆与云存储连线,对云存储进行数据访问。
结构模型
存储层
存储层是云存储最基础的部分。存储设备可以是FC光纤通道存储设备,可以是NAS和 iSCSI等IP存储设备,也可以是 SCSI或SAS等 DAS存储设备。云存储中的存储设备往往数量庞大且分布于不同地域。彼此之间通过广域网、网际网路或者FC光纤通道网路连线在一起。
存储设备之上是一个统一存储设备管理系统,可以实现存储设备的逻辑虚拟化管理、多链路冗余管理,以及硬体设备的状态监控和故障维护。
基础管理层
基础管理层是云存储最核心的部分,也是云存储中最难以实现的部分。基础管理层通过集群、分散式档案系统和格线计算等技术,实现云存储中多个存储设备之间的协同工作,使多个的存储设备可以对外提供同一种服务,并提供更大更强更好的数据访问性能。
CDN内容分发系统、数据加密技术保证云存储中的数据不会被未授权的用户所访问,同时,通过各种数据备份和容灾技术和措施可以保证云存储中的数据不会丢失,保证云存储自身的安全和稳定。
套用接口层
套用接口层是云存储最灵活多变的部分。不同的云存储运营单位可以根据实际业务类型,开发不同的套用服务接口,提供不同的套用服务。比如视频监控套用平台、IPTV和视频点播套用平台、网路硬碟套用平台,远程数据备份套用平台等。
访问层
任何一个授权用户都可以通过标準的公用套用接口来登录云存储系统,享受云存储服务。云存储运营单位不同,云存储提供的访问类型和访问手段也不同。
云存储不是存储,而是服务
就如同云状的广域网和网际网路一样,云存储对使用者来讲,不是指某一个具体的设备,而是指一个由许许多多个存储设备和伺服器所构成的集合体。使用者使用云存储,并不是使用某一个存储设备,而是使用整个云存储系统带来的一种数据访问服务。所以严格来讲,云存储不是存储,而是一种服务。
云存储的核心是套用软体与存储设备相结合,通过套用软体来实现存储设备向存储服务的转变。
就如同云状的广域网和网际网路一样,云存储对使用者来讲,不是指某一个具体的设备,而是指一个由许许多多个存储设备和伺服器所构成的集合体。使用者使用云存储,并不是使用某一个存储设备,而是使用整个云存储系统带来的一种数据访问服务。所以严格来讲,云存储不是存储,而是一种服务。
云存储的核心是套用软体与存储设备相结合,通过套用软体来实现存储设备向存储服务的转变。
实现前提
一、宽频网路的发展
真正的云存储系统将会是一个多区域分布、遍布全国、甚至于遍布全球的庞大公用系统,使用者需要通过ADSL、DDN等宽频接入设备来连线云存储。只有宽频网路得到充足的发展,使用者才有可能获得足够大的数据传输频宽,实现大量容量数据的传输,真正享受到云存储服务,否则只能是空谈。
二、 WEB2.0技术
Web2.0 技术的核心是分享。只有通过web2.0技术,云存储的使用者才有可能通过 PC、手机、移动多媒体等多种设备,实现数据、文档、图片和视音频等内容的集中存储和资料共享。
三、套用存储的发展
云存储不仅仅是存储,更多的是套用。套用存储是一种在存储设备中集成了套用软体功能的存储设备,它不仅具有数据存储功能,还具有套用软体功能,可以看作是伺服器和存储设备的集合体。套用存储技术的发展可以大量减少云存储中伺服器的数量,从而降低系统建设成本,减少系统中由伺服器造成单点故障和性能瓶颈,减少数据传输环节,提供系统性能和效率,保证整个系统的高效稳定运行。
四、集群技术、格线技术和分散式档案系统
云存储系统是一个多存储设备、多套用、多服务协同工作的集合体,任何一个单点的存储系统都不是云存储。
既然是由多个存储设备构成的,不同存储设备之间就需要通过集群技术、分散式档案系统和格线计算等技术,实现多个存储设备之间的协同工作,多个存储设备可以对外提供同一种服务,提供更大更强更好的数据访问性能。如果没有这些技术的存在,云存储就不可能真正实现,所谓的云存储只能是一个一个的独立系统,不能形成云状结构。
五、 CDN内容分发、P2P技术、数据压缩技术
CDN内容分发、P2P技术、数据压缩技术、重複数据删除技术、数据加密技术
CDN内容分发系统、数据加密技术保证云存储中的数据不会被未授权的用户所访问,同时,通过各种数据备份和容灾技术保证云存储中的数据不会丢失,保证云存储自身的安全和稳定。如果云存储中的数据安全得不到保证,想来也没有人敢用云存储,否则,保存的数据不是很快丢失了,就是全国人民都知道了。
六、存储虚拟化技术、存储网路化管理技术
云存储中的存储设备数量庞大且分布多在不同地域,如何实现不同厂商、不同型号甚至于不同类型(如FC存储和 IP存储)的多台设备之间的逻辑卷管理、存储虚拟化管理和多链路冗余管理将会是一个巨大的难题,这个问题得不到解决,存储设备就会是整个云存储系统的性能瓶颈,结构上也无法形成一个整体,而且还会带来后期容量和性能扩展难等问题。
云存储中的存储设备数量庞大、分布地域广造成的另外一个问题就是存储设备运营管理问题。虽然这些问题对云存储的使用者来讲根本不需要关心,但对于云存储的运营单位来讲,却必须要通过切实可行和有效的手段来解决集中管理难、状态监控难、故障维护难、人力成本高等问题。因此,云存储必须要具有一个高效的类似与网路管理软体一样的集中管理平台,可实现云存储系统中设有存储设备、伺服器和网路设备的集中管理和状态监控。
架构
架构方法分为两类:一种是通过服务来架构;另一种是通过软体或硬体设备来架构。
传统的系统利用紧耦合对称架构,这种架构的设计旨在解决HPC(高性能计算、超级运算)问题,正在向外扩展成为云存储从而满足快速呈现的市场需求。下一代架构已经採用了鬆弛耦合非对称架构,集中元数据和控制操作,这种架构并不非常适合高性能HPC,但是这种设计旨在解决云部署的大容量存储需求。各种架构的摘要信息如下:
紧耦合对称(TCS)架构
构建TCS系统是为了解决单一档案性能所面临的挑战,这种挑战限制了传统NAS系统的发展。HPC系统所具有的优势迅速压倒了存储,因为它们需要的单一档案I/O操作要比单一设备的I/O操作多得多。业内对此的回应是创建利用TCS架构的产品,很多节点同时伴随着分散式锁管理(锁定档案不同部分的写操作)和快取一致性功能。这种解决方案对于单档案吞吐量问题很有效,几个不同行业的很多HPC客户已经採用了这种解决方案。这种解决方案很先进,需要一定程度的技术经验才能安装和使用。
鬆弛耦合非对称(LCA)架构
LCA系统採用不同的方法来向外扩展。它不是通过执行某个策略来使每个节点知道每个行动所执行的操作,而是利用一个数据路径之外的中央元数据控制伺服器。集中控制提供了很多好处,允许进行新层次的扩展:
● 存储节点可以将重点放在提供读写服务的要求上,而不需要来自网路节点的确认信息。
●节点可以利用不同的商品硬体CPU和存储配置,而且仍然在云存储中发挥作用。
● 用户可以通过利用硬体性能或虚拟化实例来调整云存储。
● 消除节点之间共享的大量状态开销也可以消除用户计算机互联的需要,如光纤通道或infiniband,从而进一步降低成本。
● 异构硬体的混合和匹配使用户能够在需要的时候在当前经济规模的基础上扩大存储,同时还能提供永久的数据可用性。
● 拥有集中元数据意味着,存储节点可以旋转地进行深层次应用程式归档,而且在控制节点上,元数据经常都是可用的。
功能
云存储提供的诸多功能和性能旨在满足伴随海量非活动数据的增长而带来的存储难题:
· 随着容量增长,线性地扩展性能和存取速度。
· 将数据存储按需迁移到分散式的物理站点。
· 确保数据存储的高度适配性和自我修复能力,可以保存多年之久。
· 确保多租户环境下的私密性和安全性。
· 允许用户基于策略和服务模式按需扩展性能和容量。
· 改变了存储购买模式,只收取实际使用的存储费用,而非按照所有的存储系统,包含未使用的存储容量,来收取费用。
· 结束颠覆式的技术升级和数据迁移工作。
优势
(1)存储管理可以实现自动化和智慧型化,所有的存储资源被整合到一起,客户看到的是单一存储空间;
(2)提高了存储效率,通过虚拟化技术解决了存储空间的浪费,可以自动重新分配数据,提高了存储空间的利用率,同时具备负载均衡、故障冗余功能;
(3)云存储能够实现规模效应和弹性扩展,降低运营成本,避免资源浪费;
云存储技术在安防领域套用存在的问题
受限于安防视频监控自身业务的特点,监控云存储和现有网际网路云计算模型会有区别,如安防用户倾向于视频信息存储在本地、政府视频监控套用比较敏感、视频信息的隐私问题、视频监控对网路频宽消耗较大等问题。
主要用途
云存储通常意味着把主数据或备份数据放到企业外部不确定的存储池里,而不是放到本地数据中心或专用远程站点。支持者们认为,如果使用云存储服务,企业机构就能节省投资费用,简化複杂的设定和管理任务,把数据放在云中还便于从更多的地方访问数据。
数据备份、归档和灾难恢复是云存储可能的三个用途。
“云的出现主要用于任何种类的静态类型数据的任何种类的大规模存储需求。”“你不想在云中存储资料库,但是你可能想在云中存储你的资料库的一个历史的副本,而不是将其存储在很昂贵的SAN或NAS技术中。”
“一个好的概测法是将云看作是只能用于延迟性套用的云存储。”“备份,归档和批量档案数据可以在云中很好地处理,因为可以允许几秒的延迟回响时间。”另一方面,她指出,由于延迟的存在,资料库和“性能敏感”的任何其数据不适用于云存储。
但是在将数据迁移至云中之前,无论是公共云还是私有云,用户都需要解决一个更加根本的问题。
“如果你进入云存储,你能明白存储空间的增长在哪里失去控制,或者为什幺会失去控制幺,以及在整个端到端的业务流程中存储特殊的一组数据的时候,价值点是什幺?仅仅将技术迁移到云中并不是最佳的解决方案。”
减少工作和费用是预计云服务在接下来几年会持续增长的一个主要原因。据研究公司IDC声称,全球IT开支当中有4%用于云服务;到2012年,这个比例会达到9%。由于成本和空间方面的压力,数据存储非常适合使用云解决方案;IDC预测,在这同一期间,云存储在云服务开支中的比重会从8%增加到13%。
数据备份、归档和灾难恢复是云存储可能的三个用途。
“云的出现主要用于任何种类的静态类型数据的任何种类的大规模存储需求。”“你不想在云中存储资料库,但是你可能想在云中存储你的资料库的一个历史的副本,而不是将其存储在很昂贵的SAN或NAS技术中。”
“一个好的概测法是将云看作是只能用于延迟性套用的云存储。”“备份,归档和批量档案数据可以在云中很好地处理,因为可以允许几秒的延迟回响时间。”另一方面,她指出,由于延迟的存在,资料库和“性能敏感”的任何其数据不适用于云存储。
但是在将数据迁移至云中之前,无论是公共云还是私有云,用户都需要解决一个更加根本的问题。
“如果你进入云存储,你能明白存储空间的增长在哪里失去控制,或者为什幺会失去控制幺,以及在整个端到端的业务流程中存储特殊的一组数据的时候,价值点是什幺?仅仅将技术迁移到云中并不是最佳的解决方案。”
减少工作和费用是预计云服务在接下来几年会持续增长的一个主要原因。据研究公司IDC声称,全球IT开支当中有4%用于云服务;到2012年,这个比例会达到9%。由于成本和空间方面的压力,数据存储非常适合使用云解决方案;IDC预测,在这同一期间,云存储在云服务开支中的比重会从8%增加到13%。
备份
根据调查结果,发现50%的受访者表示他们使用云作为生产数据的主要存储方式,但是有一个更大的数字,即63%的IT部门表示使用云作为数据备份。同时,43%的用户用云进行数据归档。
企业开始云存储,备份和长期数据归档通常是这种转换最好的开始点,并指出这些最初的用例的运营成本也对于採用云存储的企业更易于看到。
然而,许多调查受访者表示使用云进行数据备份的一个原因在于云存储服务在市场上的占有率,从更为传统的产品,比如来自CommVault的产品,到云网关,甚至是新出现的云灾难恢复,比如数据保护即服务等。
虽然更多的组织开始试水云存储,不管是通过备份服务、归档或者使用云来保存生产数据,并不是所有的企业都开始这样做。围绕安全、法规遵从的担忧,以及围绕云服务的厂商锁定问题仍旧是一些IT部门没有开始的主要原因。
现在的云存储选择要比以前多很多。谷歌的近线冷存储和数据归档服务,与之对应的就是亚马逊Web服务的Glacier,这二者就是企业可以考虑的新云存储选择。
选择
● 服务模式:最普遍的情况下, 当你考虑云存储的时候,你就会想到其所提供的服务产品。这种模式很容易开始,其可扩展性几乎是瞬间的。根据定义,你拥有一份异地数据的备份。然而,频宽是有限的,因此要考虑你的恢复模型。你必须要满足你网路之外的数据的需求。
● HW模式:这种部署位于防火墙背后,并且其提供的吞吐量要比公共的内部网路好。购买整合的硬体存储解决方案非常方便,而且,如果厂商在安装/管理上做的好的话,其往往伴随有机架和堆叠模型。但是,这样你就会放弃某些摩尔定律的优势,因为你会受到硬体设备的限制。
● SW模式:SW模式具有HW模式所具有的优势。另外,它还具有HW所没有的价格竞争优势。然而,其安装/管理过程式要谨慎关注,因为安装某些SW的确非常困难,或者可能需要其他条件来限制人们选择HW,而选择SW。
分类
云存储可分为以下三类:
1.公共云存储
像亚马逊公司的Simple Storage Service(S3)和Nutanix公司提供的存储服务一样,它们可以低成本提供大量的档案存储。供应商可以保持每个客户的存储、套用都是独立的,私有的。其中以Dropbox为代表的个人云存储服务是公共云存储发展较为突出的代表,国内比较突出的代表的有搜狐企业网盘,百度云盘,乐视云盘,移动彩云,金山快盘,坚果云,酷盘,115网盘,华为网盘,360云盘,新浪微盘,腾讯微云,cStor云存储等。
公共云存储可以划出一部分用作私有云存储。一个公司可以拥有或控制基础架构,以及套用的部署,私有云存储可以部署在企业数据中心或相同地点的设施上。私有云可以由公司自己的IT部门管理,也可以由服务供应商管理。
2.内部云存储
这种云存储和私有云存储比较类似,唯一的不同点是它仍然位于企业防火墙内部。至2014年可以提供私有云的平台有:Eucalyptus、3A Cloud、minicloud安全办公私有云、联想网盘等。
3.混合云存储
这种云存储把公共云和私有云/内部云结合在一起。主要用于按客户要求的访问,特别是需要临时配置容量的时候。从公共云上划出一部分容量配置一种私有或内部云可以帮助公司面对迅速增长的负载波动或高峰时很有帮助。儘管如此,混合云存储带来了跨公共云和私有云分配套用的複杂性。
隐患
从功能实现上来讲,异地档案存取与档案分享共步技术早在网际网路形成之初就已经得到套用,上个世纪网际网路刚刚进入国内时就有厂商提供过网盘服务,当时所谓的网盘并不是大家所熟知的网路虚拟磁碟,当时的网盘更像是一个SVN 或FTP 的客户端,而今十多年的发展以后,融入了移动网际网路行销理念与新技术的“网盘”被包装成了“云存储”高调的出现在大众面前,据相关统计数据显示国内一线的云存储服务商每天的用户数据新增量已经达PB为单位,可见每天都有数以亿计的用户正在向自己云存储空间中上传下载着各种档案,在这种环境下排除网路宽频消耗之外,我们是否应该反思一下云存储下的未来隐患。
着作权风险
有关着作权问题已经大範围的出现在了国内的网盘服务中,一些个人或团体会将以影视音乐为主体的档案通过云存储的客户端上传至网盘中,然后通过分享的方式对圈子内提供下载,大量的有着作权的视频音乐被这种特殊盗版方式进行传播,而且这种传播方式暂时属于监管的空白,部分云存储提供商在着作权单位的压力下开始限制连结分享的範围,加强档案的过滤。但是这些手段不能从根本上解决云存储中用户上传档案的盗版传播。而要建立起一整套影视档案数字指纹签名检验系统除了庞大的研发的运维成本外,各个利益团体之间的技术标準统一也是短期内难以实现的,但是在问题得到解决之前,此刻这种分享还在进行中,面临侵权问题不仅是用户还有云存储的提供商。
个人隐私
有很多移动平台用户喜欢随时将自己用手机或平板拍摄的照片与视频通过云存储快速上传到网盘中,这样可以非常快捷的通过WEB 或PC 客户端在异地甚至即时取回照片,但是大家可能不太相信的是你上传的每一张照片或其他档案都有可能是云存储的服务端明文保存的,据参与过某云存储项目开发的人员介绍,从运维成本上考虑实现私钥加密不太现实,管理员可以从服务端的平台中直接查看和删除用户上传的档案,这些档案中不乏用户的机密档案或用户隐私,现阶段大型服务端都是通过建立严格的制度体系来约束管理人员的职业操守,但是人都是有弱点的,一旦人的操守被弃的时候在其权力範围内可视的内容是否还是只属于你自己呢?
数据安全
从数据安全上分两个方面分析,
1.用户的操作安全:大多数的云存储都设计了多客户端数据同步机制,一般以最后一次更新为标準,其他客户端开启时自动同步,这点与SVN的设计有很大的差别,当一个用户在公司编辑某个档案后,回到家中再次编辑,那幺当他再次回到公司时档案已是昨晚在家更新过的,这是理想状态下的,在很多时候用户编辑一个档案后,会发现编辑有误,想取回存在公司的档案版本时,可能在没有支持版本管理云存储中你的附本也已经被错误的更新了,同样的道理你删除一个档案时候,如果没有额外的备份,也许你到网盘迴收站中再找了,版本管理技术上并不存在问题,但是会加大用户的操作难度,云存储服务商只有少数的私有云提供商有限的支持,多数情况下这种覆盖是时常发生的。
2.服务端的安全操作:云存储伺服器早已经成为了黑客入侵的目标,因为伺服器上不仅有无穷用户数据,对此类大用户群服务的劫持更加是黑色收入的重要来源,也就是说伺服器的安全性直接影响着用户上传数据的安全,在伺服器虚拟化技术的支撑下V2V迁移的可靠性相当高,多数的云存储厂商都预备安全防护方案,但是不能忽视的永远人的操作。
运营停止
在当下的网际网路环境下,提供公众的云存储服务,每年的资金投入在5亿元以上,而且对私提供的云存储盈利模式还并不清晰,究竟有多少服务商可以持续永久的提供这种服务,这种服务后期是否收费?是否会因为亏损问题、盈收问题而被迫停止运营,在这种情况已有用户的数据向何处迁移?数据安全由谁负责,IM和Emai的盈利模式已经成熟所以相关厂商可以持续免费,而云存储的投入至少是前两者之和的十倍,厂商之间的服务整合和公约形成,首要解决并不是技术问题,而是利益分配问题,服务商在一定时间会关停服务才是用户数据留存问题最大的隐患。
企业私有
考虑到公共云存储所存在的数据异存安全性、私密档案保护隐患方面的问题、以及企业上网行为管理的在执行上的需求,云存储作为一种方便快捷的档案备份方式很多企业开始在自己的网路内部架设私有的云,将云存储的服务端部署在企业的内部网路中,服务端的维护与管理可以由企业自行控制,企业员工可以在授权範围内安全的使用私有的云存储功能。很多在公共云存储服务端无法实现的功能,都能在私有的环境下得到良好的解决。作为一套适用于中小企业的私有云存储系统,必须区别于公共云存储的设计,从现今的需求上看主要分为两个方面:
档案管控
自动同步
Windows客户端在指定目录下添加、修改、删除档案或目录,这种状态将会自动同步到云端。如果云端任意一个档案被添加、修改、删除,也会自动同步到当前Windows电脑。
选择性同步
用户不需要把云端所有的档案都同步到Windows电脑中,可根据需要,在Windows客户端进行选择性同步。选择一个或多个子目录进行同步。
档案共享
提供目录共享,企业成员可在已分享资料夹编辑档案后,可自动同步到对方目录中。提供档案外链与档案分享,成员可将档案进行外部分享。
快速部署
通过单一安装档案完成,自动获取安装所需信息,无需用户干预。
历史版本恢复.
用户多次编辑档案后,可根据时间找到以前的版本,并可恢复。
部署管理
软体架构
採用元/流分开技术模型,原数据存储在资料库中、流数据加密并混淆存在的硬碟介质上和信云盘採用Nginx伺服器负载均衡方案以及Mysql冗余备份方案,确保系统高可靠性与资料库的高可用性。
多终端支持
提供多终端支持,包括:Windows PC客户端、Android手机客户端、iPhone手机客户端、适配多款浏览器等。
完善后台管理
提供完善的管理后台。包括系统是否开放注册、Logo修改、用户管理、档案管理、用户统计、档案统计等操作。
运行环境
具有很好的兼容性和信云存储支持主流机型。包括:Windows XP、Windows 7、Android手机、iPhone手机、IE8浏览器、Chrome浏览器、Firefox浏览器等。
节点配置
CPU 支持ACPI规範中P-State,记忆体1G以上,硬碟空余空间1G以上,百兆及以上乙太网,显示器萤幕分辩率1024×768及以上,使用IE 8和Firefox 4.0及更高版本的浏览器。
性能
千兆网路情况下,每秒可达50M传输速度。单节点数据规模达到1千万,系统可正常运转。
结合等保管理的需求,在私有云存储的设计,还应该考虑到员工个人私钥加解密的功能,即员工根据工作许可权分级的不同存放在企业私云上的档案应该是加密保存的,信息管理人员无法直接从服务端资料库中获取到明文的档案,只有分发了特定密钥的客户端下载档案后,才能在系统后台完成透明还原。
优势
1、节约成本
云存储从短期和长期来看,最大的特点就是可以为小企业减少成本。因为如果小企业想要放在他们自己的伺服器上存储,那就必须购买硬体和软体,要知道它是多幺昂贵的。接着,企业还要聘请专业的IT人士,管理这些硬体和软体的维护工作,并且还要更新这些设备和软体。
通过云存储,伺服器商可以服务成千上万的中小企业,并可以划分不同消费群体服务。它可以担负起一个初创公司拥有最新、最好的存储成一部分成本,来帮助初创公司减少不必要的成本预算。相比传统的存储扩容,云存储架构採用的是并行扩容方式,当客户需要增加容量时,可按照需求採购伺服器,简单增加即可实现容量的扩展:新设备仅需安装作业系统及云存储软体后,打开电源接上网路,云存储系统便能自动识别,自动把容量加入存储池中完成扩展。扩容环节无任何限制。
2、更好的备份本地数据并可以异地处理日常数据
如果你的所在办公场所发生自然灾害,由于你的数据是异地存储,因此是它非常安全的。即使自然灾害让你不能通过网路访问到数据,但是数据依然存在。如果问题只出现在你的办公室或者你所在的公司,那幺可以你可以随便去一个地方用你的笔记本来访问重要数据和更新数据。它可以让你保持在恶劣条件下依然让你保持工作。
在以往的存储系统管理中,管理人员需要面对不同的存储设备,不同厂商的设备均有不同的管理界面,使得管理人员要了解每个存储的使用状况(容量、负载等)的工作複杂而繁重。而且,传统的存储在硬碟或是存储伺服器损坏时,可能会造成数据丢失,而云存储则不会,如果硬碟坏掉,数据会自动迁移到别的硬碟,大大减轻了管理人员的工作负担。对云存储来说,再多的存储伺服器,在管理人员眼中也只是一台存储器,每台存储伺服器的使用状况,通过一个统一管理界面监控,使得维护变得简单和易操作。
当然,这不是意味你应该忘记备份数据。云存储提供给大多数的公司备份自己重要数据和保护个人数据。
3、更多的访问和更好的竞争
公司员工不在需要通过本地网路来访问公司信息。这就可以让公司员工甚至是合作商在任何地方访问他们需要的数据。
因为中小企业不需要花费上千万美元来打造最新技术和最新套用来创造最好的系统,所以云存储为中小企业和大公司竞争铺平道路。事实上,对于很多企业来说,云存储利于小企业比大企业更多,原因就是大企业已经花重金打造自己的数据存储中心。
发展趋势
云存储已经成为未来存储发展的一种趋势。但随着云存储技术的发展,各类搜寻、套用技术和云存储相结合的套用,还需从安全性、便携性及数据访问等角度进行改进。
(1)安全性
从云计算诞生,安全性一直是企业实施云计算首要考虑的问题之一。同样在云存储方面,安全仍是首要考虑的问题,对于想要进行云存储的客户来说,安全性通常是首要的商业考虑和技术考虑。但是许多用户对云存储的安全要求甚至高于它们自己的架构所能提供的安全水平。即便如此,面对如此高的不现实的安全要求,许多大型、可信赖的云存储厂商也在努力满足它们的要求,构建比多数企业数据中心安全得多的数据中心。用户可以发现,云存储具有更少的安全漏洞和更高的安全环节,云存储所能提供的安全性水平要比用户自己的数据中心所能提供的安全水平还要高。
(2)便携性
一些用户在託管存储的时候还要考虑数据的便携性。一般情况下这是有保证的,一些大型服务提供商所提供的解决方案承诺其数据便携性可媲美最好的传统本地存储。有的云存储结合了强大的便携功能,可以将整个数据集传送到你所选择的任何媒介,甚至是专门的存储设备。
(3)性能和可用性
过去的一些託管存储和远程存储总是存在着延迟时间过长的问题。同样地,网际网路本身的特性就严重威胁服务的可用性。最新一代云存储有突破性的成就,体现在客户端或本地设备高速快取上,将经常使用的数据保持在本地,从而有效地缓解网际网路延迟问题。通过本地高速快取,即使面临最严重的网路中断,这些设备也可以缓解延迟性问题。这些设备还可以让经常使用的数据像本地存储那样快速反应。通过一个本地NAS网关,云存储甚至可以模仿终端NAS设备的可用性、性能和可视性,同时将数据予以远程保护。随着云存储技术的不断发展,各厂商仍将继续努力实现容量最佳化和WAN(广域网)最佳化,从而儘量减少数据传输的延迟性。
(4)数据访问
现有对云存储技术的疑虑还在于,如果执行大规模数据请求或数据恢复操作,那幺云存储是否可提供足够的访问性。在未来的技术条件下,此点大可不必担心,现有的厂商可以将大量数据传输到任何类型的媒介,可将数据直接传送给企业,且其速度之快相当于複製、贴上操作。另外,云存储厂商还可以提供一套组件,在完全本地化的系统上模仿云地址,让本地NAS网关设备继续正常运行而无需重新设定。未来,如果大型厂商构建了更多的地区性设施,那幺数据传输将更加迅捷。如此一来,即便是客户本地数据发生了灾难性的损失,云存储厂商也可以将数据重新快速传输给客户数据中心。
(1)安全性
从云计算诞生,安全性一直是企业实施云计算首要考虑的问题之一。同样在云存储方面,安全仍是首要考虑的问题,对于想要进行云存储的客户来说,安全性通常是首要的商业考虑和技术考虑。但是许多用户对云存储的安全要求甚至高于它们自己的架构所能提供的安全水平。即便如此,面对如此高的不现实的安全要求,许多大型、可信赖的云存储厂商也在努力满足它们的要求,构建比多数企业数据中心安全得多的数据中心。用户可以发现,云存储具有更少的安全漏洞和更高的安全环节,云存储所能提供的安全性水平要比用户自己的数据中心所能提供的安全水平还要高。
(2)便携性
一些用户在託管存储的时候还要考虑数据的便携性。一般情况下这是有保证的,一些大型服务提供商所提供的解决方案承诺其数据便携性可媲美最好的传统本地存储。有的云存储结合了强大的便携功能,可以将整个数据集传送到你所选择的任何媒介,甚至是专门的存储设备。
(3)性能和可用性
过去的一些託管存储和远程存储总是存在着延迟时间过长的问题。同样地,网际网路本身的特性就严重威胁服务的可用性。最新一代云存储有突破性的成就,体现在客户端或本地设备高速快取上,将经常使用的数据保持在本地,从而有效地缓解网际网路延迟问题。通过本地高速快取,即使面临最严重的网路中断,这些设备也可以缓解延迟性问题。这些设备还可以让经常使用的数据像本地存储那样快速反应。通过一个本地NAS网关,云存储甚至可以模仿终端NAS设备的可用性、性能和可视性,同时将数据予以远程保护。随着云存储技术的不断发展,各厂商仍将继续努力实现容量最佳化和WAN(广域网)最佳化,从而儘量减少数据传输的延迟性。
(4)数据访问
现有对云存储技术的疑虑还在于,如果执行大规模数据请求或数据恢复操作,那幺云存储是否可提供足够的访问性。在未来的技术条件下,此点大可不必担心,现有的厂商可以将大量数据传输到任何类型的媒介,可将数据直接传送给企业,且其速度之快相当于複製、贴上操作。另外,云存储厂商还可以提供一套组件,在完全本地化的系统上模仿云地址,让本地NAS网关设备继续正常运行而无需重新设定。未来,如果大型厂商构建了更多的地区性设施,那幺数据传输将更加迅捷。如此一来,即便是客户本地数据发生了灾难性的损失,云存储厂商也可以将数据重新快速传输给客户数据中心。
云安全
云安全(Cloud Security)是一个从“云计算”演变而来的新名词。云安全的策略构想是:使用者越多,每个使用者就越安全,因为如此庞大的用户群,足以覆盖网际网路的每个角落,只要某个网站被挂马或某个新木马病毒出现,就会立刻被截获。
“云安全”通过网状的大量客户端对网路中软体行为的异常监测,获取网际网路中木马、恶意程式的最新信息,推送到Server端进行自动分析和处理,再把病毒和木马的解决方案分发到每一个客户端。
云套用
云物联套用
云计算和物联网之间的关係可以用一个形象的比喻来说明:“云计算”是“网际网路"中的神经系统的雏形,“物联网”是“网际网路”正在出现的末梢神经系统的萌芽。
“物联网就是物物相连的网际网路”。这有两层意思:第一,物联网的核心和基础仍然是网际网路,是在网际网路基础上的延伸和扩展的网路;第二,其用户端延伸和扩展到了任何物品与物品之间,进行信息交换和通信。
物联网的两种业务模式:
1.MAI(M2M Application Integration), 内部MaaS;
2.MaaS(M2M As A Service), MMO, Multi-Tenants(多租户模型)。
随着物联网业务量的增加,对数据存储和计算量的需求将带来对“云计算”能力的要求:
1.云计算:从计算中心到数据中心在物联网的初级阶段,PoP即可满足需求;
2.在物联网高级阶段,可能出现MVNO/MMO营运商(国外已存在多年),需要虚拟化云计算技术,SOA等技术的结合实现网际网路的泛在服务:TaaS (everyTHING As A Service)。
云存储套用
云存储是在云计算(cloud computing)概念上延伸和发展出来的一个新的概念,是指通过集群套用、格线技术或分散式档案系统等功能,将网路中大量各种不同类型的存储设备通过套用软体集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。当云计算系统运算和处理的核心是大量数据的存储和管理时,云计算系统中就需要配置大量的存储设备,那幺云计算系统就转变成为一个云存储系统,所以云存储是一个以数据存储和管理为核心的云计算系统。
云呼叫套用
云呼叫中心是基于云计算技术而搭建的呼叫中心繫统,企业无需购买任何软、硬体系统,只需具备人员、场地等基本条件,就可以快速拥有属于自己的呼叫中心,软硬体平台、通信资源、日常维护与服务由伺服器商提供。具有建设周期短、投入少、风险低、部署灵活、系统容量伸缩性强、运营维护成本低等众多特点;无论是电话行销中心、客户服务中心,企业只需按需租用服务,便可建立一套功能全面、稳定、可靠、座席可分布全国各地,全国呼叫接入的呼叫中心繫统。
私有云套用
私有云(Private Cloud)是将云基础设施与软硬体资源创建在防火墙内,以供机构或企业内各部门共享数据中心内的资源。 创建私有云,除了硬体资源外,一般还有云设备(IaaS)软体;现时商业软体有VMware的 vSphere 和Platform Computing 的ISF, 开放原始码的云设备软体主要有Eucalyptus和OpenStack。
私有云计算同样包含云硬体、云平台、云服务三个层次。不同的是,云硬体是用户自己的个人电脑或伺服器,而非云计算厂商的数据中心。云计算厂商构建数据中心的目的是为千百万用户提供公共云服务,因此需要拥有几十上百万台伺服器。私有云计算,对个人来说只服务于亲朋好友,对企业来说只服务于本企业员工以及本企业的客户和供应商,因此个人或企业自己的个人电脑或伺服器已经足够用来提供云服务。
云游戏套用
云游戏是以云计算为基础的游戏方式,在云游戏的运行模式下,所有游戏都在伺服器端运行,并将渲染完毕后的游戏画面压缩后通过网路传送给用户。在客户端,用户的游戏设备不需要任何高端处理器和显示卡,只需要基本的视频解压能力就可以了。就现今来说,云游戏还并没有成为家用机和掌机界的联网模式,因为至今X360仍然在使用LIVE,PS是PS NETWORK,wii是wi-fi。但是几年后或十几年后,云计算取代这些东西成为其网路发展的终极方向的可能性非常大。如果这种构想能够成为现实,那幺主机厂商将变成网路运营商,他们不需要不断投入巨额的新主机研发费用,而只需要拿这笔钱中的很小一部分去升级自己的伺服器就行了,但是达到的效果却是相差无几的。对于用户来说,他们可以省下购买主机的开支,但是得到的确是顶尖的游戏画面(当然对于视频输出方面的硬体必须过硬)。你可以想像一台掌机和一台家用机拥有同样的画面,家用机和我们今天用的机顶盒一样简单,甚至家用机可以取代电视的机顶盒而成为次时代的电视收看方式。
云教育套用
视频云计算套用在教育行业的实例:流媒体平台採用分散式架构部署,分为web伺服器,资料库伺服器、直播伺服器和流伺服器,如有必要可在信息中心架设採集工作站搭建网路电视或实况直播套用,在各个学校已经部署录播系统或直播系统的教室配置流媒体功能组件,这样录播实况可以实时传送到流媒体平台管理中心的全局直播伺服器上,同时录播的学校也可以上传存储到信息中心的流存储伺服器上,方便今后的检索、点播、评估等各种套用。
云会议套用
云会议是基于云计算技术的一种高效、便捷、低成本的会议形式。使用者只需要通过网际网路界面,进行简单易用的操作,便可快速高效地与全球各地团队及客户同步分享语音、数据档案及视频,而会议中数据的传输、处理等複杂技术由云会议服务商帮助使用者进行操作。
目前国内云会议主要集中在以SAAS(软体即服务)模式为主体的服务内容,包括电话、网路、视频等服务形式,基于云计算的视频会议就叫云会议。云会议是视频会议与云计算的完美结合,带来了最便捷的远程会议体验。及时语移动云电话会议,是云计算技术与移动网际网路技术的完美融合,通过移动终端进行简单的操作,提供随时随地高效地召集和管理会议。
云社交套用
云社交(CloudSocial)是一种物联网、云计算和移动网际网路互动套用的虚拟社交套用模式,以建立着名的“资源分享关係图谱”为目的,进而开展网路社交,云社交的主要特徵,就是把大量的社会资源统一整合和评测,构成一个资源有效池向用户按需提供服务。参与分享的用户越多,能够创造的利用价值就越大。
云计算系统
核心技术
云计算系统的核心技术:并行计算。并行计算(ParallelComputing)是指同时使用多种计算资源解决计算问题的过程。通过并行计算集群完成数据的处理,再将处理的结果返回给用户。
1、编程模式;
2、海量数据分布存储技术;
3、海量数据管理技术;
4、虚拟化技术;
5、云计算平台管理技术;
6、信息安全管理技术;
1、编程模式;
2、海量数据分布存储技术;
3、海量数据管理技术;
4、虚拟化技术;
5、云计算平台管理技术;
6、信息安全管理技术;
7、运维管理技术。
自建云存储
云存储盛行的今天,IT专家需要用比以往更加宽广的视野来审视他们的数据中心,云计算,云存储,大数据,这些概念和技术不但要关注,而且如何融入到自己的当前环境中是迫在眉睫的事情了。以往在组织内部独来独往的IT部门(比如网路和存储)现在由于融合的缘故必须更加紧密地互相配合。这促使IT部门之间提高合作程度,从而给IT组织带来了莫大的好处,推动性能上的提升和成本上的削减。
对于大多数IT组织来说,可扩展性是内部云存储的一个关键指标。虽然支持者声称云非常易于扩展,且拥有近乎无限制的增长潜力,但是我们还是需要仔细考虑云的容错性、动态扩展和容量增长规划。云并不是应对数据增长的万灵药,它是一个需要有效管理的商品。
此外,在实施云存储之前,我们也需要定义和理解关键的性能指标。通常,我们假设非活跃数据不需要像高层存储那样高的性能。但是,同时进行的其他项目,比如电子发现,可能需要这类数据有相当的性能。
回响时间和终端用户体验也必须协调。我们必须有服务水平协定(SLA)或运行水平协定(OLA),
且云解决方案必须可以满足这些要求。由于数据是通过内部网访问的,在进行云存储实施前,必须对当前网路能力和容量有一个清醒的认识,判断好可能的延迟性。对于特定的内部云解决方案,必须在整个解决方案中加入最佳实践指导。
在考虑新技术的时候,我们需要评估管理上的简单性和实施上的方便性。我们经常需要依赖已经有工作任务的现有人员来部署实施新的技术。
我们需要判断好需要什幺样的角色和职责,这些职责如何分配,以及需要多少时间。这些问题并不是单纯的技术问题,而是一个有助于提高现有人员整体效率的思考过程。
判断云存储是否适合于某个组织是需要仔细考虑的。首先,我们需要分析数据中心数据,判断有多少数据可以迁移到云。然后,IT人员必须判断这些数据可以以怎样的方式迁移到云。一些数据的迁移很简单,就像複製过程一样;另一些数据的迁移可能需要某种形式的数据迁移器,以保证这些数据迁移后能够符合实现设定好的政策。
另一个重要的考虑因素是经济上的可行性。外部云可能适合于那些关心现有存储成本并厌恶风险的公司,而那些对外部云的成本和风险比较敏感的公司可能会选择部署内部云。
由于外部云实际上是存储即服务,因此其成本取决于存储数据量和契约时间。另一方面,内部云在总拥有成本上的考虑和大多数其他内部存储方式一样。
安全挑战
不断增长的云存储容量的需求带来了不断增长的安全问题。那幺企业将如何克服云存储的安全挑战?
着眼于本地
企业需要把重点放在云伺服器的物理位置,以及虚拟安全控制上。在某种程度上,这印证了“数据的民族主义”这一新兴的想法,即是说,企业保护信息存储的理想方法是,控制在自己的界限之内。换句话说,云安全威胁通常都不是来自于恶意因素,往往是来自于管理问题;本地伺服器提供了更好安全保护。
寻找厂商
一个新兴的云存储的趋势是“零知识。”现在,存储厂商给公司数据加密,并交出密钥,这意味着只有获得授权的人员才能访问,而且服务厂商也不可能秘密监测企业存储在云端的数据。这对于存储大量个人可识别信息尤其重要,如名字、出生年月、社会保险号码。
了解厂商
当数据传输到云端时,云服务厂商很有可能伪造访问证书,他们访问数据不受限。而且目前为止,没有任何证据可表明云存储厂商没有利用这一缺陷来达到自己的目的,这也产生了一个观点:企业选择云存储厂商进,要了解谁存储了他们的数据,以及存储位置在哪,同时要知道该厂商的在整个云存储市场信誉如何。
反覆审查契约
要确保云端数据的安全,企业必须拿出时间彻底审核所有的服务水平协定(SLA)。首先要注意的就是违约罚金条款:如果该提供商不能确保数据的安全时,数据丢失或没有提供认可的正常运行时间时,怎幺办?
同时,关于数据备份、灾难恢复和存储设备本身这些具体问题也要问上一问。毕竟,云存储市场还比较新,没有现成的、牢不可破的行业标準,这样,许多云厂商都只口头在吹嘘,并没有实质的行动可鉴。
使用分裂栈
为了确保数据在云端的安全,使用分裂栈就没什幺不对。把关键任务套用存储在本地伺服器上,非敏感数据、冷数据存储在云端。另外,这一概念也可扩展到考虑使用多用云厂商,避开厂商锁定。对归档信息,一个低成本的、可保证基本安全的厂商就可处理;但对于使用频率高的数据,就需要找到效率高、零知识的备选方案。如果处理得当,分裂栈可以做到成本节约,而且没有安全妥协。
云存储现状
早在2010年,关于云存储的使用情况,只有少于14%的调查受访者痛快地表示正在採用。但是,在我们最近的大多数调查中,我们看到了使用云存储的企业数量呈上升趋势。比如2012年,这个数量是30%。在过去的几个月的两个调查中,44%-48%的企业表示他们目前正在使用某种云存储,因此在云中储存数据的企业是在持续上涨的。
短短两年时间,云存储从少于14个百分点开始发展到这个程度实际上相当让人印象深刻。调查与调查之间的数据变化如此之宽泛,但是云端15TB-32TB的平均数据範围却意外的下降了。尤其是最大卖点是弹性和无限制容量的服务集。
从这些平均数据的角度来看,在去年春天的“云存储採购意向”调查中,我们询问公司所维持的存储容量是多少,包括磁碟、快闪记忆体、光纤、云、磁带、饼乾码(cookiejar)等等。平均为1.4PB——这可是PB级别。
如果我们在深入一点,这些相同的受访者表示存储中平均有326TB的“活跃”数据。因此,即使我们假设这些公司存储在云端的所有云存储数据都是活跃的(这显然是不正确的),也就意味着这些云存储公司只有平均5%-10%的数据向云输送。
根据2015 TechTarget云存储调查结果,我们发现50%的受访者表示他们使用云作为生产数据的主要存储方式,但是有一个更大的数字,即63%的IT部门表示使用云作为数据备份。同时,43%的用户用云进行数据归档。
“如果企业还没有开始云存储,备份和长期数据归档通常是这种转换最好的开始点,”Nowalk说道,并指出这些最初的用例的运营成本也对于採用云存储的企业更易于看到。
然而,许多调查受访者表示使用云进行数据备份的一个原因在于云存储服务在市场上的占有率,从更为传统的产品,比如来自CommVault的产品,到云网关,甚至是新出现的云灾难恢复,比如数据保护即服务,Nadkarni说道。
虽然更多的组织开始试水云存储,不管是通过备份服务、归档或者使用云来保存生产数据,并不是所有的企业都开始这样做。围绕安全、法规遵从的担忧,以及围绕云服务的厂商锁定问题仍旧是一些IT部门没有开始的主要原因。
“让人们还保持冷静的就是厂商锁定,”Nadkarni说道,“他们想如果他们的数据进入云,他们该怎幺弄回来。”
但是,好讯息就是现在的云存储选择要比以前多很多。他指出谷歌的近线冷存储和数据归档服务,与之对应的就是亚马逊Web服务的Glacier,这二者就是企业可以考虑的新云存储选择。
分类
并不是所有的应用程式数据需要SSD性能。经常访问的数据可以迁移到基于磁碟的存储。ssd和基于磁碟的存储都支持标準I / O协定,因此,当把应用程式从本地硬体移动到云时,不需要更改应用程式。
有了附带直接固态硬碟或磁碟驱动器,你就可以使用任何你的作业系统所支持的档案系统。这种模式的一个缺点是,当机器实例关闭时,硬碟驱动器上的数据就会被删除。为了保存数据,必须将数据複製到另一个存储系统中,例如云中的对象存储。
附加存储系统的另一个缺点是:附加存储系统只能连线到一个实例。然而,微软Azure具备档案存储系统,可以实现SMB-compliant档案共享,可以跨多个实例共享。当将应用程式迁移到需要常规档案系统服务的云时,或者当多个实例需要访问相同的数据时,这一点是非常有用的。
在其他云中,数据集可能被複製到额外的存储设备中,并且这些设备可以连线到其他实例。然而,这可能会导致同步和一致性问题。
当多个实例正在读写相同的数据时,资料库可能是最好的选择。每个主要的云提供商都会提供关係和非关係NoSQL资料库。如果在设计阶段,数据存储需求定义明确,那幺,关係资料库通常都是很合适的。如果无法提前获知资料库模式的位置,那幺,可以选择NoSQL资料库。