主持人:尊敬的各位来宾,欢迎大家在百忙之中莅临本次峰会。 今天下午本次分会场讨论的主题是云计算技术。在今天下午四个小时中,我们请到四位业内专家与我们一起分享他们的经验。同时,主办方DOIT传媒将在全部演讲结束以后,进行幸运抽奖环节。 首先有请HDS资深解决方案顾问张文天,她带来的演讲题目是《构建云时代的融合基础架构》,有请张女士。

张文天:大家好,我先自我介绍一下,我是来自日立数据系统地张文天,我这边主要负责云计算这块的解决方案。

首先介绍一下我们公司,我们是日立数据系统,我们主要是做存储方面的解决方案,也包括存储方面的云计算、云存储的解决方案。我们有像投影仪之类的产品,但是主要还是在存储这块的业务。

信息技术在不断地发展,因为不断发展的信息技术,使得在PC行业也有我们的新的发展。

全世界的第一台计算机是哪一年诞生的,第一台计算机是1946年诞生的,叫爱尼亚克,整个的占地面积有150平米,相当于这样一个会议室的面积。大机时代产生了计算机,但是计算机只在一些特殊的领域,比如说像军事这样的特殊领域被一些特殊的企业所使用,因为它当时非常昂贵。但是随着大机的产生我们对计算机的需求越来越多,这个时候我们就有了PC。在1946年的时候我们从大机时代过渡到PC时代,现在我们人手都有一台笔记本电脑,我们就需要共享这些信息的需求。我们现在不是自己用自己的计算机去完成自己的作业,我们需要共享,需要从网络获得资源。

在1992年的时候我们迅速进入了网络时代,但是我们知道一旦数据通过共享,大家一起去访问这样的网络,它的发展比原来特殊行业的需求发展的速度还要快。

随着网络的发展,比如我们现在用Facebook,用微博,用微信等等的工具去上传一些数据和照片等等,所以我们企业要提供这样一个平台,我们这个平台提供服务的能力要很强,同时管理又要简单,于是我们就出现了云计算。

所以现在这个时代也是云时代,这也是我们今天的这个主题,我们要讨论的是云计算。 那么我们看一下云的本质是什么?这个图看上去可能是一个比较卡通的图,但是它确实告诉了我们云计算的本质是什么,不管我们在什么样的地方,在家里或者在路上,或者我们在公司,我们随时随地地通过网络去访问我们所要的资源,当然这个资源包括我们要访问的内容,像视频、文件等等,甚至像我们现在出现了虚拟桌面,我们不再需要自己的电脑,我们通过网络可以获得一个我们的桌面,我们只要有网络能访问的地方,我们都能拿到我们所要的服务,都能拿到我们所要的资源,这就是云计算对我们提供的一个实在的意义。

它有一个计费模式的要求,因为大家都来访问,我们怎么去计费,云计算实际上是一个交付模式的要求,要按照我真正使用的量,我真正在云平台里面使用了多少资源,按照我要用到的资源去交付,这就是我云计算的本质,我要随时随地访问我需要的资源,并按照我访问的实际量去交付。

在云计算上面,HDS三步云的一个战略。刚才讲了我需要随时随地访问我的资源,这些资源都需要哪些。在虚拟桌面里面,我们需要访问一个远程的桌面,这个桌面要提供计算能力、提供存储空间,要提供给我它的网络,归根结底就是一些基础架构的需求。首先我们要实现基础架构级服务的云计算,早的时候对云计算来讲要打好一个基础架构,要打好一个云计算的根基,也解决我们HDS的基础架构云。

我们的基础架构云做了一个虚拟化的基础架构平台,像服务器存储、网络,当做一个虚拟化的池子,然后可以动态地分配我的资源,使用的时候可以按照实际使用的量获取基础架构的资源,这就是一个虚拟架构云,是一个虚拟化的统一的平台。

第二步是实现内容云。内容云是什么概念呢,就是我们不再和应用,不再和上层的数据库等等的应用去挂钩,我们主要解决一些非结构化数据,比如说在微博里面经常产生的图片、视频等等这样一些非结构化数据的统一的存储。我对内容需要感知,我可以按照用户的需求搜索内容,可以做全文的检索,我可以随时随地收到我想要的东西,这就是我们的内容云,它是一个平台,但是提供给我们的是基于内容的服务。那么有了内容云之后,我们一些个人的需求可能得到了满足,但是对于我们企业来讲肯定不是停留在内容这块。如果内容不转化成信息,不转化成最终的一个业务价值,对我来说是没有意义的。

我们举一个例子,我们通过大量地社交媒体产生了一些数据,但是对我们企业来讲它拿到这些数据,其实可以分析出这个行业的人们的一些需求,或者我真正在业务上的一些价值,我要拿到这些价值要怎么样,我要分析这些数据,然后再作出我的决策。比如说像超市,超市可能有很多东西,然后我可以计算它的销售数据,在信息云这块可以做相对的智能化,通过对大量数据的分析,然后对我们的业务的将来的决策提供一个信息的产品,这就是信息云的概念。

从基础架构云到内容云再到信息云,这就是三步云的战略。

下面在数据中心融合这一块,给大家讲我们的基础架构云。

我们讲基础架构云之前看一下,目前基础架构建设的时候我们面临的挑战有哪些。那我是有一个长期的计划,包括像采购、集成、二次开发、测试、技术支持、部署,可能有一些部门要经过长期的测试,才能购买这样的产品,保证长期的运行,才能达到期望的目标。我跟很多用户谈过,用户再买的时候可能担心将来建的基础架构是不能满足我的需求的,很多时候我们出现了像超额购买的现象,我们现在数据中心整体的利用率并不高,但是我们为了前期的构建其实也付出很多的成本,我们的客户说我们需要大量的集成的工作在里面。

我们这里有一个第三方组织的报告,IDC调查有23.3%的员工的时间和员工的一些资源,都用在了前期的设计和部署上,我相信我们有很多企业,特别是对于我们IT架构要求特别高的企业,在前期这一块可能做的工作其实是更多的。那如何去减少这样的一个前期的投资,又提高我们基础架构的利用率呢。我们现在有40%的大型企业都在考虑去购买融合的基础架构,有的叫做一体机,但是HDS不叫一体机,我们买这种基础架构的时候还要保留一定的开放性。

这是HDS的融合基础架构平台,HDS UCP,提供给我们用户的有计算能力、有网络、有存储能力。我们看到有服务器、存储和网络,我们整合在一个平台里面,作为一个基础架构云,基础架构及服务的一个云。在此基础上我们结合了存储虚拟化、服务器虚拟化、网络虚拟化,提供给用户的就是一个虚拟化的架构的池子,可以布置用户真正的应用,包括像甲骨文数据库,甚至像我们的ERP等等,来实现我们的基于关键业务的云平台。

现在我们的基础架构云有两个系列地产品,其中一个系列我们叫UCP Select,为什么叫参考架构解决方案,但是在融合的基础架构上我们又保证了我们数据中心的开放性。在这里我们的用户所购买的解决方案它是一个打包的方案,但是这里面的存储服务器和网络我们是可以定制化的,而且我们看到在这个平台里面管理有相互的集成,但是每个模块其实还是有自己的一个管理工具。在这基础上我们又有一个集成度更高的叫UCP Pro,我们总共只有一个管理软件,就是有一个统一的管理软件,管理整个的基础架构,我们的服务器存储网络,包括整个虚拟化都通过单一的软件进行统一的管理,这是第一。

第二,它是完全打包的解决方案,预配置好的,给到用户就是一个即插即用的基础架构。从UCP Select到UCP Pro,降低了复杂度,但是灵活性来讲就是Select更高。

今天我们主要介绍UCP Pro的一个产品,这是一个基础云架构的分层部署的演示图,在我们实际的环境中我们的基础架构上面会有物理资源层,可以看到服务器、存储和网络,从而才有了根基,接下来我们要做得是在这个平台上虚拟化,把它做成一个池子,这就是我们的虚拟化平台层,我们做成了虚拟化的服务器存储和网络的资源池,在这个大的池子里面根据实际的应用实现按需的分配。虚拟化之后,我们还要做得是应用,我们有了这个虚拟化之后提供给用户的是一个虚拟化的架构的资源,但有了这个资源以后,我的用户的应用和业务怎么在这个上面进行操作。不同的业务怎么在虚拟化的资源池里面获得我要的最终的一个服务,这个时候有一个服务的提供层。在服务提供层里面会把用户需要的虚拟机,或者虚拟硬盘网络提供给用户,同时结合用户需要的一些应用的模板,比如说财务的人员需要一些财务的管理软件,那么在平台层申请的时候就可以拿到我要的应用的资源,不仅拿到了虚拟机,同时上面的应用也拿到了。云平台除了能够提供这些资源,还能够允许用户随时随地去申请这样的资源,这就是我们说的自服务的一个平台,就是基于web、基于网页的一个Portal。

下面来看一下我们HDS的UCP Pro for VMware,基于基础架构上面我们可以看到每个模块都会有自己的一个管理工具。肯定用户会问,这是我们原来传统的数据中心就是这样的搭建模式,跟传统的数据中心不一样的是我们这个平台是按照用户的实际的虚机的需求,然后预先验证和预先经过测试完全地满足我们的需求的一个统一的方案。

在这上面的话我们可以运行VMWARE的虚拟化,存储服务器的管理软件在底层会管理我们的基础架构,中间是没有交集的,我们在管理虚拟化的平台的时候,是管理不到底层的基础架构的,我们HDS在这里有一个产品叫做UCP Director,对我整个基础架构的平台可以实现统一的管理,这样的话被称为叫钥匙的解决方案,因为我们拿到用户现场的所有的东西,首先是经过预验证和预配置好的。这里面的所有的东西是预安装好的,包括整个管理又是统一的,我的用户是一个即插即用的整套的基础架构云的解决方案。

我们来看一下在UCP Pro里面我们的基础架构层的底层的物理资源的组成是什么?这是我们的一个架构图,左边可以看到有刀片服务器,还有我们整个网络和服务器的资源是放在左边的机架里面,右边是存储的控制单元以及存储空间,这是一个基本的配置,这个基本配置包含了用户所需要的基础架构云的所有的组建。如果说我们用户实际的需求这样两个机架不能够满足我的要求,我可以按照我们实际的要求扩展我们的基础架构,这个平台可以支持从一千到八千个虚机,根据我们实际的虚机数目我们的平台是可以按需去扩张的。基于这样的基础架构,下面看一下我们的统一管理。在传统的数据中心里面有不同的管理源,服务器和存储网络、虚机是不同的管理元在做。

比如说我们财务部门提出一个新的需求,要创建一个新的虚机,这个时候IT部门的人创建虚机的时候发现虚机的存储资源、网络资源都不够了,这个时候需要管理员重新分配空间,再找存储管理员、网络服务器的管理员分配相应的空间,才能够把这个基础架构给到我,给到我以后我才能创建这样一个虚机,给到财务部门。通常传统的情况下,这样的操作可能是一天到两天,因为涉及到不同任的工作的交接。现在有了UCP Director,我们如果发现创建的时候空间不够,UCP Director直接通过vCenter管理整个基础架构。UCP Director和VMware vCenter相集成,单一的虚拟服务器及基础架构视图,自动的基础架构视图、管理、部署和监控,提供UCP API,和现有平台进行结合。如果减少了管理的成本就是提高了我的投资回报率。

这是UCP Director,我们可以看到整个管理工具的界面和vCenter的管理工具的界面非常相似。 有了这样的一个物理层以后,我们要看的是我们怎样实现虚拟化的。在服务器虚拟化上面,不是HDS在做的工作。我们通过跟服务器虚拟化的厂商去合作,我们实现了服务器的虚拟化,把多个服务器打造成虚拟化的资源池,分配虚机的时候,可以把资源池分成不同的分区和集群,再分配虚机的时候可以按照用户最终的需求分配不同级别的虚机,比如说有金银铜不同的级别,因为业务有重要、一般、不重要的,我按照不同的级别把不同的虚机分成不同的级别,有不同的存储资源、这是我们在服务器虚拟化上面所做的技术。

在存储虚拟化这一块,用到了我们的云存储,VSP,它具有虚拟化的能力,我们可以虚拟第三分的异构的存储。通过把这些异构的存储挂接到后面以后,形成虚拟化的存储池。我们可以把当做容量和性能的整体的资源的池子。在这个池子里面可以有异构的存储,可以有不同级别的存储,整个级别的管理都通过VSP的管理进行实现。用户只要通过VSP的管理工具,然后使用到这些VSP的技术,就可以管理到整个资源池的资源。

下面看存储构成的一个资源池,也是需要做分区的,HDS是唯一一家可以在存储上做到32个存储分区的厂商,不同的分区还可以有不同的管理源,实现多租户的管理。我们先虚拟化,再通过分区隔离到不同的池子里面,每个池子有不同的服务级别,然后做了分区以后,再把存储的分区做一个分级。我们可以看到有内部存储VIP的级别,还有外部存储的级别,可以在不同的级别之间移动我们的数据,通过虚拟化做成资源池,可以动态分配我的资源,同时我的这些数据还能在这个池里面动态的移动,这就是我们存储虚拟化在这里面做的事情。

因此,我们通过整个基础架构的虚拟化提供给用户的一个虚拟化的云的平台。 下面看一下存储虚拟化的技术。

下面是我们VSP的存储虚拟化,我们挂了很多第三方的存储构成了一个池子。HDS是全球唯一一家厂商已经拥有了2万1千个存储虚拟化的案例的这样的厂商,我们很早就开始做这样的事情。我们可以支持很多管理的集成,也可以使得很多旧的一些存储可以支持我们高端存储的技术。

因为我们刚刚说了,我们所有的管理都是通过VSP进行管理,我们的VSP具有高端存储的,像存储分级,存储分区等这样的一些技术。通过虚拟化,我们的整个池子都可以看作是VSP的空间和容量,在VSP里面,后台的所有空间的存储都具备这样高端的技术,都可以去做分区,可以去做分级,然后可以做数据的克隆、动态的迁移这样的特性,在这个池子里面所有的管理接口、所有的管理功能都是VSP去提供的。这是HDS的存储虚拟化跟友商的存储虚拟化不同的地方。我们的友商的存储的技术都是通过外部的存储去实现的,而我们的所有的平台都是具有奔驰的这样的所有的特性。

对我来讲管理是非常复杂的,那么在云里面有什么要求,我们需要随时随地给用户提供他要的容量和空间。如果随时随地去提供,那么也包括随时随地去扩展,那么传统的数据存储的方式不能满足现在的需求,因此讲了我们还做了虚拟资源的动态分配。我们使用的技术叫做HDP,当我有一个用户提出了要求,假设我的邮箱申请的是20G,实际上在谷歌是不是真的给了我20G的空间呢,实际上不是的,而是我用多少它分配我多少空间,在谷歌的数据中心里面数据空间是小于所有人的邮箱加在一起的总合的。

我们有一个叫做过量分配,我是告诉你有20G,你也可以用到20G,但是当你没有用到20G的时候,你用多少我给你分多少,整个资源池你没有用的空间我可以留下来给别人。虚拟资源的动态分配是通过虚卷的方式进行分配的,我节约出来的可以给别的应用去使用,按照实际需求去分配你所需要的容量。按照实际使用量去付费是云的要求。这样的话就解决了数据的利用率的问题。我们现在很多IT里面都存在过量分配的情况,那么有了这样一个虚拟卷的技术,就可以按照实际使用的量去分配,这样的话数据不会存在过量分配。

同时通过的方式还可以消除数据热点,还可以帮助我们去实现管理。我不需要像传统一样跨新的存储,我只要对这些池子挂新的资源,就可以再进行扩容,这些扩容的操作也比原来更简单。 有了资源的动态分配之后,我们现在在云的平台里面会面临不同的用户、各种不同的用户,那么如何给这样的用户设定不同的级别,然后做到多租户的管理呢。 比如说我的平台有物理机、有虚拟机,可能虚拟机里面还有一些不同的部门,这些部门在传统的购买方式的时候,我的部门需要多少服务器和存储,我就购买我需要的存储和服务器资源,现在如果你给我一个Clod的平台,我跟别的部门共同使用资源,我怎么知道不会因为别的部门的业务需要而影响到我,这个时候我们做一个隔离,我们HDS通过存储分区进行实现的,我们把存储的前后端口,还有其他的物理资源分到不同的分区里面,每个分区都有自己的不同的存储空间和性能,这样可以满足不同的组织和不同的性能级别的要求。

不同的分区根据它实际使用的量的大小,我们给到不同的资源,这样就实现了多租户的管理。 我们刚才讲的是UCP的主要计算平台,它有我们底层的服务器、存储和网络,是经过我们预验证的打包的基础架构云的解决方案。那么有了这样一个方案以后,我们实现了平台的虚拟化,然后还实现了它的统一管理。

我们整个的融合的基础架构云,首先我们采用了业界领先的刀片服务器、存储、还有网络,做到了业界领先的基础架构。我们在做云的时候还是不能忘了我的基础架构本身的可靠性和稳定性,本身的扩展能力,基础架构因为是一个根基的东西,所以这个根基很东西。因此在统一计算平台里面我们首先保证的是基础架构是业界领先的。

然后基于这样的基础架构我们是做了简化的一个管理,我们整个数据中心的管理可以通过本身的虚拟化平台管理到底层所有的基础架构,这样就实现了基础架构云的一个统一管理。 对我们有的用户来讲,可能我不想要一个一体机,我更想要一个开放的架构,那么我们有灵活的选择,我们可以选择这种集成的解决方案,也可以选择参考架构的解决方案。

我们有UCP Pro等等去做选择,包括我们开发集成的成本,包括我们管理的成本,包括我们资源利用率等等的成本。整个UCP的解决方案,也就是融合基础架构其实有很多应用的解决方案,今天主要是讲UCP Pro,如果对基础架构云这一块想了解的,大家可以访问我们的官方网站,我们有虚拟化平台,还有数据库平台,还有业务分析的,另外还有我们的邮件服务器等等,包括桌面虚拟化,大家可以通过我们的官方网站了解我们更多UCP的资料。 谢谢大家。

主持人:感谢张文天女士的精彩演讲,下面有请Fusion-io公司销售经理邢懿,邢先生的演讲题目为《颠覆性技术助力企业级应用加速》,有请邢先生。

邢懿:很高兴今天能有这样一个平台让大家来看一下现在存储发生的一些新的技术的变化,我们从原来的磁带、磁盘到今天是怎样的一个发展过程。 今天不太愿意说自己是一个存储的厂商,我们更多的是能够帮助到用户的应用方面的加速。

现在这也是一个非常热的话题,我们现在部署了很多很多的应用在每个用户的环境里面,但是我们没有很好很多应用能有很好的运行环境,这样的话你会发现到很多很多的应用跑起来比较慢,那么我们可以看到现在有很多很多的应用有很多的问题。比如我们的系统运行地很慢,I/0性能不足,基本上就是要扩硬盘解决这些问题。

扩了硬盘以后会发现我们现在的存储扩容量的时候,不是发现容量不够用了,而是系统地性能不够用了,要扩大我们的系统性能,导致我们的制冷、我们的用电都在节节攀升,想要控制在一个合理的范围是很难的。很多COO说了,我们就是一个花钱的部门。如果我们应用上线以后,CPU使用的频率就很高了,这样的话你会看到I/0在未来面临很大的瓶颈。 我们发现我们的存储数据资源有什么样的变化没有,从最古老的磁带到现在的磁盘,并不是我们的计算资源不够用,你会发现我们很多计算资源的利用率还不够。

那我们从磁带到磁盘,大家会发现小的时候用过随身听,磁带方式查找数据有几种模式,前进、后退、播放、停止,四种模式,到了磁盘的时候我们有了循轨的模式,到了闪存的时代,我们还能沿用原来硬盘时代的这些工具吗,我们会更颠覆性地算法帮助你更快、更好地找到你相应的数据,这个东西才是核心。

并不是说所有的厂商拿出一块PC的卡说这就叫闪存,这有非常非常大的差异化,关键核心里面的算法是不是有一个领先性,这点非常重要。 目前的模式来讲,先把应用需求提交到CPU,然后再到你的存储上的卡,然后再寻找你的数据,大概是一个毫秒级的运算方式,这种运算方式现在已经没有办法更好地能帮助我们用户很快地去查询我们相应的大数据量的数据化结构。我们把整个的存储管理模式进行了分级,我们把相应的六个月的数据尽量地放在离CPU近一点的资源上面,原来的历史数据、我们需要查询的数据放在老的旧的磁盘阵列上面,可以做个归档的数据库来用。

把I/0访问的时间从毫秒级减少到微秒级。 我们公司大概从06年成立的,由两个科学家在美国成立的,08年的时候他们做了第一块PCIE的闪存的存储卡,市值现在30亿美金左右,最大的一个客户是Facebook,全球就10亿人访问Facebook,对于I/0响应的迫切性是最重要的。大家曾经做过一个调查,用户在你的浏览器的面前最多响应等待一个页面大概是8秒钟的时间,如果时间很慢的话用户就不用了。

所以我们帮助用户在这方面达到非常大的提升。还有一个用户就是苹果,当然了在国内因为网络的原因可能下载很慢,但是在国外访问的话都是非常快的速度。 有一个用户原来问过我,他从京东商城找了一块OCG的卡是三千多块,他说为什么人家的价格是你们的十分之一都多。我给大家讲一个简单的例子,其实这块卡从逻辑上来讲就是一个小的磁盘阵列,这个卡上里面有相应的控制器,这个上面的算法目前来讲是保密的,整个卡的生产是在美国完成的,没有任何厂商帮助我们,都是我们自己来做的。

那你会看到SAN存储后端的磁盘,这个卡上面浓缩了所有SAN阵列的模式。对外宣称的卡大概4K的话读的话大概是14万IOPS。高IOPS,高带宽,数十万IOPS,性能超过配置了上千块硬盘的高端存储。低延时,微秒级访问延时,相当于传统SAN存储的几百万之一。 我们公司不是一个单独厂商来跟大家合作的,我们是全球大概所有IT领先厂商的他们都是我们的OEM伙伴,今天在会场的所有厂商基本上都是我们的合作伙伴,刚才的HDS也是我们其中的一个,他们有一个非常重要的部件就是我们的产品。

包括惠普、IBM等等都有我们的卡,帮助用户加速你的数据库访问,加速你的虚拟化访问,包括加速你的VDI也好,我们在这些方面都和所有的厂商都会有很好的合作,保证了商品的兼容性。如果你们的产品,如果你们的数据中心里面用惯了谁的产品,用惯HP的或者IBM的产品,因为有些产品如果你要开箱插进去的话,原厂商可能会有保修的问题,这里我们是不存在这些问题的。

那分布在各行各业的客户,包括金融行业,包括科技、包括WEB,所以他们的德意志银行对我们非常满意,未来在很多系统上都布置相应的I/0加速的解决方案。 国内来讲,大部分的.com公司都是我们的客户。包括我们大家每天都回用的淘宝、QQ、还有新浪微博。谈到这里的话我想讲一下淘宝,我不知道大家在双11有没有抢购的,双11那天一天有两百亿人民币的交易。如果这么大的交易量,网银点不开是因为跟银行的接口有问题,但是你们会发现他们的数据库那天没有瘫,但是周边的东西可能有问题,因为它跟招行也好、或者建行也好,银证通里面会有一些网络的繁忙也好还是交易也好,但是整个的交易是健康的。

那么我们在突发性的大规模的交易模式下,我们可以帮助大家做很多的东西。 现在每个企业都在用所有跟哈纳有关的地方都会有Fusion-io。其实我们Fusion-io是卖解决方案的,解决方案的目的是为了加速用户的I/O性能。 我们给大家提供了三个解决方案。我们现在可以把磁盘阵列上的数据库可以直接牵到Fusion-io的卡上,直接插到服务器上,这样的低速是最快的,可以提速到20倍左右。

或者说原来的数据库比较小,或者是原来用的内置磁盘加Read卡的模式,我们建议你牵到这里可以得到很大的速度的提升。我们想不影响架构的情况下进行提速的话怎么办,我们把我们的卡加入到服务器里面进行使用,我们可以动态的帮你把热数据移到这个卡上来,热数据的访问在卡上,可以提高一部分的I/O访问性能,大概是10倍左右。

如果原有的磁盘阵列来讲的话,不能满足高并发的访问,一般在存储上面配硬盘,对用户的预期来讲也是没有达到他对I/O访问的要求,我们可以把存储放到你的卡上面,达到你的需求。我们除了卡以后,还有相应的智能的软件,包括针对虚拟化的软件,还有全方位的监控平台。包括我们的一些服务,一些软件的升级,我们可以保证5年的质保期,这个期限是经过测算的。包括芯片也是有寿命的。

所以我们综合了现有所有用户的基础上,我们给大家定了一个五年的保修。一般的企业级的应用,在一般的访问模式下,不要像淘宝那么集中的模式下,大概五年之内的保修完全都可以做到。 这是我们硬件的卡,我们有两代。 整个解决方案来讲卡不是重点。第一个重点就是我们的解决方案,第二就是我们的卡怎么跟你的操作系统进行结合。所以我们有一个虚拟存储层,大家可以理解为win7的时候装一个应用程序。这里面有很多功能,如果芯片坏掉的话可以保证你的数据不丢,企业级应用我们可以达到5个9,为什么用户尝试的时候不愿意第一个买,就是不想尝试到新产品带来的隐患,让他们成为第一个吃螃蟹的人。

我们通过在整个卡上做类似的处理,软件上面我们有相应的机制帮助你保证数据不丢失。第二内存数据库和我们的卡有什么样的区别。我们有一个相应的功能叫Power-cut,如果电掉了的话我们可以帮助你的数据不会丢失,同时我们现在推荐用Oracle本身自带的方式来做。 我们不是一个黑盒子,很多友商都说自己是黑盒子,你有原来的服务,然后买我们的软件把它们组合在一起就可以,最大程度上保护你们原有资源的投资。 这是戴尔的910,可以插十块卡,对外装上我们的软件,就可以满足你的服务需求。

因为大家会发现,现在业界正在往这个方向走,现在在网络上有SDN,可以看到更多的模式在向软件驱动的硬件来走,让这些软件支持你的更多的多样化的需求。 我们整个的机器才需要810瓦,对于整个中心的电力也好都会有很大的减少。 同时我们ION还支持高可用,同时在两个存储之间做镜像。所以在基础的对外接口上来讲的话,我们的存储也是相对来说领先于其他友商的,因为现在除了DDN以外,目前对外来讲的话应该没有任何一个厂商可以提供40GB的互联接口。 在ION上来讲的话,使用ION部署Oracle RAC的数据库。它支持SNMP,SMIS,CLI,这些卡可以帮助你做工作状态的检测、负载的检测,它会告诉你的利用率不是百分之百,可能是90%,这样的话可能你的芯片坏了,可以联系你的厂商帮助你去更换,但是数据是没有任何问题。 虚拟化上来讲的话,我们有一个软件叫做IOTurbine。

尽量不要把负载比较重的应用放在一台物理机上用,怕抢夺你的计算资源和后端的I/O资源。我们可以装一个相应的软件,按照业务的需求去部署相应的虚拟化的颗粒度。然后你会发现我们可以把一台物理机上所有的服务全部进行加速,也可以把一台物理机上其中的一个服务进行加速。 整体的IOTURBINE部署架构,需要提速的装一个小的软件,这样的话就可以同时工作了。同时为虚拟机无缝地提供IOPS。 每天早晨九点上班的时候大家一起开桌面,就会导致后台有一个争抢的过程。

我们把相应的卡控制在整个平台上,我们在今年美国的大会上,看到一个服务插了我们的卡之后,最多可以支持到六千的桌面。原来的时候会发现什么样的问题,起三十个桌面就非常不容易了。在实际的应用中,会发现大家抱怨VDI很不好用,虽然这是一个很好的技术但是现在推广不下去有一个很大的因素在里面。我们可以帮助用户在这方面很好地部署你的解决方案。 Fusion-io不是一个封闭的厂商,同时对全球的开发者提供SDK,让你更快的通过操作系统跟硬件进行互操作,我们有非常健全的文档。现在国内有一些软件开发商在做很多方面的应用,这些东西我们都可以提供给大家,帮助大家怎么样在这个平台上进行大数据量的访问,提高用户的使用效能。

包括中科软这样的公司我们都在合作,在他们的数据中心里面都有相应的联合的开发。我们现在大部分人拿的笔记本大部分都是SSD了,我们的工作站上也需要同样的模式做I/O的加速。像电视台的线编,像军队军事地图的楼顶,军事地图跟我们平时看到的地图是非常不一样的,大概它的精密度是普通地图的一千倍。所以在军方也好我们都有很好的应用。比如说在汽车这方面,一汽大众也是我们很好的合作伙伴。

ioFX,主要是为工作站而设计的。 我们根据现有用户的一些反馈,或者在数据中心比较多的应用做了一个简单的分类,大概是怎样的情况,性能的优势在哪里,我们大概有一个总结。 ORACLE RAC的高可用性,ORACLE真实应用集群RAC所提供的软件,实现ORACLE数据库环境的集群化效应。

我今天讲的东西可能就这么多,后面还有几页是我们架构的一些介绍,这里就不讲了。 谢谢大家。

主持人:谢谢您的演讲。 下面有请国际商业机器(中国)有限公司存储产品线经理韩冰先生。 他为我们今天带来的演讲是《IBM存储虚拟化解决方案》。

韩冰:为什么要说存储虚拟化了,因为虚拟化是云计算的必由之路。我相信有可能你可以通过其他的途径也实现云计算,但那不是一个正道。我相信很多技巧非常高超的人可以用初等数学的方法解决高等数学的问题,一定有这样的人存在。

所以我们今天不讨论你不用虚拟化的方法解决云计算的情况,我们只说我们用虚拟化。

有些人比如说如何管理海量数据的增长,还有未来数据的增长不可预期性这个角度讲,有些人可能会从基础设施架构的优化方面讲,还有人会从云计算的角度讲,当然不管从哪个角度讲都能讲到一定的道理。但是我今天想提醒大家的是我们在解决了为什么要做虚拟化的时候,我们还要考察你做完了以后是不是你的目的真正实现了。

现在我们发现在存储虚拟化的过程中,我们会遇到很多新的问题,比如说在云计算的时候,我们也会遇到一些新的问题。我不能告诉你云计算今天是不是一个恰当的时机,但是我可以告诉大家存储虚拟化的时机已经成熟了。

这个图是Gartenr is IT存储技术市场时钟图,三点钟方向的技术是比较先进的,到了八九点钟那边的技术已经慢慢要过时了,这是一个顺时针走向的图。

03-08年我们这个产品的销售是非常平坦的,确实有一定的销量,但是很难讲存储虚拟化的概念在中国被广泛的用户接受了,但是今天跟五年前已经完全不一样了。

存储虚拟化这个技术本身应该给我们带来哪些好处呢,第一我觉得它必须给我们带来的一个好处是提升资源利用率,这点不用说,因为这是做存储虚拟化最根本的一个需求,也是我们所有人的出发点。

大家可以发现同样是做虚拟化技术,你在服务器这个角度做虚拟化和在存储角度你的路线是完全相反的,当然最终达到的效果是一定的。你是把一台服务器切成几份,你的目的是提升资源的利用率。但是存储你要做虚拟化,恰恰是把多台存储合并在一起,从而提升资源的利用率。

我有一个客户我去拜访他的时候,有一个现象非常有意思,他是一个团队,维护着几十套直连系统,很简单我们聊存储,我说您有多少数据量,如果数据量只有几个T那我们今天就不用谈,他们几个人大概商量了十几二十秒钟,我们有一个PB的数据,他们有这么多的存储空间,这么多的容量。我说你这里实际存放了多少数据呢,他们商量了30多秒钟,他说我们大概有500个T的实际的数据,但是实事求是地讲他们自己对这个答案也不是非常有信心的。我非常理解,如果你一个人要维护几十套这样的竖井式的系统,你一样回答不了这样的问题。而且我们事先也没有办法预期某一项业务实际增长的速度。这就是第一个问题,提高资源利用率,降低成本、节能降耗。

第二,要消除平台差异。如果能够把这些系统变成一个系统来统一管理的话,我相信它的管理员有大把时间去干一些更有价值的工作。而不是整天干这个,干那个,给这个扩个容。

第三,我们的存储虚拟化应该可以增强数据流动性。数据往往要通过分享或者叫共享也好,它的价值才能够最大化。而有些情况下我们需要数据在一个更大的范围之间流动,比如说数据迁移,或者说远程异构容灾等等类似这样的环境。

我们觉得如果你的存储虚拟化技术可以帮助你解决这三点,那说明你的目的达到了。

但是我今天想强调的是SVC这个产品在本身存储虚拟化来说,是我目前看到的最好的一个产品。因为我在上述三点,每一点都比别人做得更好。理论上来说,只要把所有的存储资源划到一个池里面,你的资源利用率就已经提升了,好像所有的方案都可以帮助你做到的,但是我们可以做得更好,在此基础上我们进一步压榨你数据里面的水分,我们使用过程中对未来的数据增长的不确定性造成的这部分误差,通过我们的技术可以把这个误差消除掉。同时我们可以让你的数据更精简,提高资源的利用率。

原来可能1M放1M的数据,现在可能放3M、5M都有可能。 消除平台的差异带来的好处就是降低管理的复杂度。

但是这里有一个问题,就是说你消除管理的复杂度,用一个统一的界面替代原有的管理界面,降低了管理的复杂度一定有一个前提,新的管理界面比原来的产品的界面更好。现在加了一个新设备进来,如果这个界面还不如原来的界面用的顺手,或者说有的功能还不具备,那么对我来说不是一个好的选择,虽然不得不用你,但是肯定不会对你的产品产生喜欢的理由。

我前两天买了一个ipad4,可能有很多理由你不喜欢,但是有一个理由可以让你非常喜欢。

第三,增加数据的流动性和可用性。可能有些存储支持外部存储的能力,有具备一些存储虚拟化的能力,而且是一些高端产品,但是产品和产品之间是有差异的。而我们SVC的体系结构,在这方面可以得到别人不具备的一些好处。

首先我要把SVC的架构给大家介绍一下。 SVC是我个人觉得非常有特点的一个产品。我觉得可以说它的体系架构,它整个的产品的设计结构可以说是面向未来的。首先它采用的是非常灵活的模块化的设计,这种模块化带来的好处是可复制性非常强,如果一对节点的能力不够怎么办呢,我可以水平地扩容。当然目前来说这个节点可以水平扩加四对,现在这样的一套SVC搭建的虚拟化系统,可以对外面提供IOPS的能力,是我们所有指标里面最好的。大家知道SPC可以说是这个行业里面唯一的公开性能的基准测试。我们也同样提供45万的IOPS,但是我们只用了HP四分之三不到的盘。

而SVC和V7000组成的一套系统,这个指标可以达到70几万,这是任何一个单台存储所不能达到的水平。 这个产品有一个非常开放的体系结构,使得它能够灵活、也非常积极地利用行业里面已经发展得来的一些成果。比如固态硬盘,SSD,只要有这样现成的技术可以在我的系统里面马上得到应用。

面向未来的一个网络技术是FCOE,所有看到的主流的和非主流的网络技术,在SVC里面都有非常好的支持,这是开放性的架构所带来的好处。你的设备几乎永远不会过时的。 讲SVC的一个重点,就是一个产品的新特性叫实时压缩。实时压缩这个事情看上去很美,但是实际用起来总是觉得心里不是那么特别舒服。所以我在很多场合我问过我下面的同事也好,听众也好,我说你们第一次听到IBM有一个实时压缩技术,对于第一级的存储有这么一个技术的时候你是什么感觉。有的人可能觉得数据不会丢掉,但是可能有性能的问题。

有一个客户问了我一个问题,会不会720P的视频压缩完了,变成了一个标准的东西了。这里我要说,第一所有的数据压缩技术都是无损压缩的,你的数据不会丢的。我刚开始看到这个技术出现的时候我也是这样的态度,前面跟大家讲了我是一个比较保守的人,我第一反应就是这个东西能不能用呢,我们看它算法的成熟度。SVC这个算法是基于业界非常成熟的IOZ的算法,包括磁带上的2:1的压缩算法的核心技术是一模一样的,它压缩的原理是一样的,当然每一些算法作为IOZ的变种有一些改进的地方。所以算法本身是我们大家每天都在用的,我相信我们从网上下载一个软件没有不被压缩的,所以数据丢这个问题大家不用担心。

第二,会不会影响性能呢。答案是不会。这个图里面所有比较好的指标都是压缩之后的。这是对于随机访问I/O的基于应用的基本测试。 我们可以看到这个图,使用了实时压缩的SVC维持或改善了应用原有的响应时间和吞吐率。压缩之后不管是读还是写,每秒钟的I/O的数量都增加了。压缩会不会影响性能,结论是不影响。那么为什么没有影响性能,大家凭感觉去想一下也可以知道,压缩是开销CPU资源的,占用系统的CPU和内存的,但是为什么没有影响性能呢,有三点原因。

在存储里面一般来说瓶颈永远来自于磁盘的I/O,最简单的一个道理大家可以想,压缩之后数据量变少了,对于磁盘的压力也降低了,所以性能有可能提升,磁盘做一次I/O可能存储更多的数据,所以性能是有可能提升的。

第二,传统的数据压缩算法,前面说的道理是对所有的产品都适用的,但是没有回答这个问题,为什么IBM这样做呢,为什么别人没有在他们的一级存储里面做压缩,甚至他们不建议这么做,那是因为第二个问题为什么压缩会带来性能下降呢,是因为你对压缩的数据做修改,这是一个非常悲惨的事情。

大家想你把一个文件压缩完了之后放在本地没有任何问题的,但是如果把这个问题打开再编辑一下,再把这个文件完整地从磁盘里面读出来,解压缩、修改、重新压缩、再写回去,它怎么可能不慢呢。 IBM有一个专利就是很有效地解决了对于已经压缩的数据做修改这么一件事。实际上我们就是把压缩的数据,你修改的那部分重新压缩之后追加在原来的文件后面,然后以一个指针的方式连接过去,通过这样的一种技术。那别人为什么不这么做呢,跟大家对我们压缩数据的处理有关系,比如我们有一些预处理要分段、切片等等有关。

第三,为什么压缩会提升性能?磁盘有一个最不喜欢的事情是什么呢,就是你给我的数据不连续,以至于这个磁盘没有办法非常顺畅地连续地去往那个磁盘上面写。而我们在做数据压缩的时候可以对数据流进行一个预处理,使得大量地随机的I/O过来的时候,当它落到盘上的时候它可能以一个连续的方式写到磁盘上的,我们通过这种方式也改善了CPU的开销带来了性能的降低。从这个角度讲,IBM的实时压缩技术没有影响性能,某种程度来说甚至对性能有帮助。而这样的一个技术我觉得完全可以用了,第一数据是安全的,不会被破坏。第二性能又很好。

第三,其实价格也不贵。 还有一个问题就是你这个东西用起来好不好用呢。其实用起来是非常方便的,你只要创建一组卷,这个卷的类型是压缩的卷,那它上面的所有数据都是被压缩的。因为很多客户可能会这么想,虽然实时压缩的技术很好,但是我可能只是想在小范围内用一下,那你这个功能一旦启用之后,对所有的数据都压缩,还是只限定一部分数据进行压缩,之只有压缩的卷上面的数据才被压缩,普通卷上的数据是不受影响的。而有一个限定的条件,压缩的卷必须是一个精简配置的卷,这是有道理的。

因为我觉得精简配置可以更有效地提高资源的利用率,如果这个都不做,干吗还要压缩。对于系统里面已经有了的数据是不是可以享受到这个好处的,答案也是可以的,你只要创建一个精简压缩的卷,然后通过我们SVC的一个功能叫虚拟卷进项VDM,就可以把普通卷上的数据在后台一点一点拷贝到虚拟卷上,而这个过程中对你的主机是可以实时访问的,直到所有的卷、数据都被迁移过来之后,而所有的数据都在新的卷里面被压缩过了,所以用起来是很简单的。 基于VDM的解决方案是我们SVC里面卖的最好的一个解决方案。很多客户讲,你说不影响性能我也同意,你说有效果我也同意,但是我希望了解系统当中发生的状况。我们不担心数据增长,我们担心数据增长超出我们的控制能力。而SVC的管理界面可以让你非常清楚地了解到这个系统里面都发生了什么,尤其在压缩和没有压缩之后,比如CPU的占用率等等等等,你所有的资源,你的数据实际占用空间是多少,所有的数据都是一目了然的。

我听过这么一件事,我们有一个工程师在去客户那里交流的时候,客户提了一个问题,那个客户真牛,我们那个工程师在前面讲产品,然后客户说,你这不对,英特尔的CPU我很熟,某个型号的CPU是六核的,你怎么只写四核呢,后来我们的工程师回来之后,他遇到这个问题之后咨询很多人,有一个售后的工程师确实发现那个东西显示是四核,一旦激活启用了压缩功能之后一看变六核了,我们原来预留了两个核专门做压缩的,所以启动压缩之后不会对原有的吞吐率有影响。 关于压缩我要回答最后一个问题是压缩的效果怎么样。

我还是SAN交换机的产品经理,大家知道交换机上有一个功能,你数据通过中间的链路走,先经过压缩再传过去,不同的产品标压缩比是多少,有一个工程师说我要卖一个产品,然后我要进行压缩,他说高端的压缩比可以达到3:1,我说你这个指标写的是2:1,我这里要澄清的一个概念,所有压缩算法的压缩比例是一个期望,那是一个平均值,不是基于实际数据得出来的一个平均值,它是一个期望。而这个数据是怎么来的呢,所有评价压缩算法的时候我们应该针对一个公开的相同的数据的样本集合,这个样本是一个组织做的,这里面有很多的不同类型的数据,而每种不同类型数据存在的比例跟这个世界上真实的数据存在的比例是相同的,而每种压缩算法得出一个结论的时候都是针对相同的数据样本得出的压缩比,理论来说你把全世界所有的数据加在一起全都压缩了,最后的压缩比是2:1。

但是不同类型的数据得到的压缩比完全不同。而你压缩一个可执行文件,有可能得到介于1.5:1,或者是2:1之间的这个值,因为可执行文件往往已经经过压缩了。如果用它压缩jpg或者一个视频媒体格式,那个文件可能没有变小,反而扩大了,因为已经加密过的数据再进行压缩的时候,那个算法会带来结果的恶化。

所以压缩算法是因数据而异的,我们一般说的2:1只是一个平均水平,如果压缩一个数据库,你应该期待4:1到6:1之间的压缩比。不同类型的数据压缩比完全不一样。对于Office2003可能压缩比高达75%,对于2007可能只达到25%。因为Office本身已经对这种文件进行了压缩。所以告诉我们另外一个问题,已经压缩过的数据压缩的效果往往会变差。 你如何去期待一个压缩产品的性能表现?等于再用这个产品之前我对你的压缩效果完全没有办法去评估,从一定程度上来说是这样的,所以我们提供了一个模拟器,所以这个事情就可以变得预知了。

虚拟卷镜像,可以做数据迁移,一旦完成之后可以把不用的拷贝去掉,这是一个非常好用的功能。 所有的这些功能SVC都支持,甚至可以异构的平台之间完成比较高级的数据服务,所有的这些都是SVC可以给大家带来的好处。 我想告诉大家的是SVC所采用的图形界面是非常非常好的。它不在于说提供你系统里面多少多少细节,而是把这一切变得非常地友好。 前两天电话里一个人问我,ipad有什么用,因为即便是一个两三岁的孩子,拿起ipad的来说都可以非常流畅地使用,以至于我女儿现在养成一个毛病,她看见大的液晶的显示屏,她就在上面点,然后划来划去的,她就认为所有的东西都具备这样的能力。

一个非常友好直观的界面可以非常大的改善用户体验的。而SVC所采用的风格的管理界面的图形化非常好。这个软件目前有IOS的版本。 非中断式卷迁移,跟着我们实时压缩一起推出的一个比较重要的功能。以前一个卷被一对节点所管理的,那么这一对节点本身是完全冗余的。我曾经跟我们售后的工程师聊过,我说你们的体验,或者你从客户那边得到的反馈,你觉得SVC产品怎么样,他说这个产品不能说一点问题都没有,没有任何产品是不坏的,但是放在客户那儿不坏是不可能的,每个产品得可能坏,但是我们要求故障之后仍然能够维持对外服务的连续性,也就是它的可用性。可靠性是这个话筒掉地上了没有坏,拿起来还可以接着说。可用性是拿起来掉了坏了,还可以再用另外一个。

SVC,不会因为某一个服务坏了而影响I/O,这个从来没有。现在你可以在线的在一个盘还在被应用访问的时候,把它的管理移到另外一对节点上去,我们叫做I/O group。而是实实在在地把这些数据的管理权限挪到另外一对节点。因为我们确实有共享的数据和交换的数据流。 所以前面讲的这些告诉我们什么,SVC确实在提升资源的使用率、消除平台的差异和还原数据的流动性和可用性方面做得比别的产品更加出色。

简单地说,SVC有几种用法。第一是存储整合。原来可能有很多异构的存储,然后通过SVC统一到一个管理平台之下,简化你的管理,然后空间连续搭建一个资源池。第二个用法可以做数据迁移。这个功能是我个人比较喜欢的。其实我个人建议很多集成商买这么一个东西,回去之后可以帮助你的客户提供数据迁移的服务,而且是在线的。

假如说一个客户他有一个卷要迁移到另外一个存储上面,对你来说只需要把SVC加进去,然后再用SVC的一个逻辑复制的能力把这个卷复制一份拷贝到另外一个盘上,然后把这个卷断掉,把SVC拿走,这件事就做完了。但是这里有一个前提,SVC管理的卷可能不需要对那个卷的数据重新进行格式化,原来卷上已经有数据了,我SVC管理之后重新映射出去的时候可以不用卷上原来的数据,这是一个前提。 本地高可用,VDisk Mirror功能,这个是我们卖的很好的一个功能,就是很简单,把两个不同的存储通过SVC做一个镜像。 总的来说,SVC有非常丰富的用途可以满足我们多方面的业务管理的需求。

SVC它有今天的能力不是今天一夜之间诞生的,2003年开始到现在已经经历了七代产品,我们在全球的装机量也是非常非常大的,全球装机可能有三万多个引擎。 另外,我们从实际装机的环境里面得到一个统计结果,我们可以打造5个9的可能性,而且我们的产品对于第三方设备的兼容性是目前认证最为广泛的,我们大概支持多达130多个不同厂家的产品。 SVC这个产品把存储虚拟化本身这件事情做得非常非常好。

做什么事情如果用一个比较专业的设备,如果你想让一个设备发挥到最好的作用,你就不要用组合的。作为手机来说,信号好、通话效果好、发短信是它最根本的功能,你如果用它来拍照也可以,就是应个急,但是不能跟其他的相机拍照的效果比。

最后要说,虚拟化是云的必由之路,而做虚拟化最好的选择就是IBM的SVC。

主持人:下面有请甲骨文中国系统事业部销售咨询总监肖淑男先生,给我们做有关《云计算之大数据存储》的演讲。

肖淑男:第一我是来自甲骨文公司的,我叫肖淑男,所以在我以下的演讲当中肯定有我对技术的偏好,或多或少会带有甲骨文的色彩或者痕迹。

我尽量保持一个中立的姿态来做我的演讲。 刚开始我们讲大数据可能是互联网企业,也可能是飞机制造的企业,大家知道波音飞机的飞行也可能产生大数据等等,或者只有政府会关注我们的大数据。但是我们自己本身行业是不是应该关注大数据,当然应该关注。举个简单的例子,现在北京这么堵,我们的GPS导航仪卖的非常好。

但是来到今天这个时代,我们说这一点的数据,这一点的应用几乎是我们企业应该用的数据的10%或者只有5%,更有95%的数据是我们的非结构化的数据。这些非结构化数据来源于哪里,社交网络,一些机器设备,一些探测器,或者一些video,等等等等。

第一数据特别大,第二随时随地都产生数据,而且数据的消失也很快,有的数据瞬间就过期了,比方说我们的股票信息,股票价格每秒钟都在变,这些都是变化非常快的数据。还有变化的类型特别多。

第一,非结构化的数据,包括一些文档类、video之类等等的。

第二,半结构化数据。比如说邮件,还有一些机器产生的数据。 第三,就是我们的结构化数据。 我们谈数据,就不能不谈到这些数据的价值。就像石油,如果不开采出来就是没用的,如果开采出来之后不变成石油、柴油的话还是没有用。第一,要获取大数据,要找到大数据在哪里。第二,我们还要有序地组织起来。 第三,要对大数据进行分析。最后大数据变成我们企业决策的依据。

数据如果不变成企业决策的依据,那么数据就是垃圾。大数据一定要为企业的决策服务。包括所有的数据更灵活的开发,以及更大的扩展性、以及实时地一些结果,我们需要这些大数据给我们带来这些好处,同时大数据也拥有这些特点。 讲到大数据,不能不讲存储,只有数据没有存储,数据就不得其所。2011年增加了1.8个ZB。我们企业也是以35%的速度在增长我们的数据。

我们的云计算、我们做的一些数据分析,都需要大量的数据来支撑。所以我们说共求两旺,一个是对数据需求量很大,那么就需要存储,存储带来的挑战是什么,因为我们的数据增长是爆炸性的增长,而且我们有很多新型的数据出现。我们现在的存储和网络需要如何地再利用也是我们今天需要考虑的一个问题。

第三,我们所有的数据都需要保存。可能今天大家看到几乎所有的企业在过去的运营当中其实丢失了很多很多的数据,这些数据被我们丢失之后,其实对我们企业是有影响的,只是我们现在没有感觉到而已,因为我们的竞争环境是这样的。

当某些人关注我们过去曾经丢掉某些数据的时候,你的企业不关注这些数据,那么你就可能落后。所以我们今天要保留所有的数据。把一些大的数据和应用集成起来,才能发挥大数据的优势。

最后一点是性能。今天大数据时代更离不开性能。当一个量变产生的时候积累到今天很可能产生质变了。 我们讲到存储第一功能是什么,就是保存数据。第一保存的数据要安全,不会丢失。所以传统的存储厂商应用了大量的技术,复制的技术、快照的技术等等等等,都是为了把数据保存的安全。 第二,还要有效率。所以我们又研发出更多的别的技术,刚刚讲的虚拟化技术,还有压缩技术,都是在更小的空间当中存储更多的数据,使存储变得更有效率。大家想想,你们的存储系统是不是一直在讲这些,或者是不是一直拘泥于这些。

有哪个存储厂商站到前面说,你买一个存储是为了哪些应用,数据如果不提供应用的话它就是死的。我们怎么样最好地最恰当地性能把数据从存储当中提升、提供给我们的应用或者我们的用户,这是我们今天讲存储的时候应该考虑的第二个方面。所以大家知道Oracle要把数据存好,要以怎样恰当的性能提供给我们的应用,要提供这种性能花费的代价要小于应用本身的价值。我们要把正确的数据以正确的方式提供给正确的应用或者我们的用户。 今天在大数据时代来讲大数据存储的话,几乎所有的传统的存储基本上都归零了,不适合了。所以我们说大数据需要大智慧,大数据里面拥有大智慧,同时存储大智慧的话要运用大智慧的存储,才能存储。

第一,我们要新的存储技术面对大数据,那么我们现在大数据一种是结构化的、一种是非结构化的,那么我们传统存储又不行了,那么我们需要怎样的存储。我是要普通的存储,还是要分而治之不同的存储,所以我们必须得知道应用的I/O的模式或者应用的逻辑,我才能把最有效率的数据提供给你。

所以我们要讲究以什么样的应用对应什么样的存储。如果是规格比较相同的存储放在同一个空间里可以很好地管理,如果是不同规格的放在一个空间里就需要我们进行管理。 对于结构化数据来说,数据的类型、数据的结构,以及来自数据的量和操作几乎都是可以预知的,甚至是已经定义的,还有一种是非结构化的数据,它的数据的管理以及数据的定义都是不一样的。要知道为什么这件事会发生,或者将来会发生什么。

同时要具有很高的灵活性,体现在我们对数据的使用,可能有的是用来读,有的是用来做关联,还有的是要做挖掘。同时我们需要极大地可扩展性,我们还要实时地洞察我们这些数据。所以结构化数据和非结构化数据,完全是两个世界。我们用一些新的技术和传统技术比较的话,应该说我们会变得更加有效。

比方说我们传统的关系数据库和今天的数据库里比较的话,传统数据库要保证ACID,要保证它的一致性,等等等等,我们有很多很多的限制。还有我们在传统数据库当中要做大量的表的交易,这都是影响我们今天的数据库的扩展,都是一些瓶颈。我们用NoSQL来解决很方便,因为我们去除了额外的限制性的工作,所以它会变得更加高效。大家看到我们的workloads都是不一样的。比如说跟传统的订单、报表查询都是不一样的。

比方说面对的是大量的动态的非结构化的存储,数据的访问模式是大的文件或者大量的文件,以及一些流失的访问,尤其是巨量数据的装载等等。在这个架构当中我们一定要没有单点故障,面对如此大的数据量,如果因为一个单点故障让所有数据崩溃的话,可能是所有人都不能承受的。同时需要一些很便宜的商品构建我这个系统。

所以我们要做到: 第一,简单的管理。 第二,企业级的support。 所以说,在大数据时代我们的存储结构应该是这样的,既然做一个存储的完整架构的话,一定是有一个生命周期的管理。有Hadoop的和NoSQL的,还有存储的。

对于Oracle技术发展的一个理念来说,在工厂做研发的时候就会把集成融合到里面去了。在这里做DIY,如果做一个实验性的可能还行,但是要考虑你的时间、你的成本、你的扩展性,还有管理的复杂性的话,大家都不会走这条路。 因为我们的IT从规划到建设到管理到最后扩容等等等等,每一步我们都要简单化起来,从原始到结束是一站到底。 当一套新的系统上线的时候,我们在心里默默念叨的是:千万千万要正常地运行,这是我们的最高目标。它能够正常运行我就能过关了,至于运行的效率怎么样,这是第二步需要调整的。

一旦它能正常地运行,就是我最大的胜利。大家知道其实每执行一次IT的建设或者运行的时候,大家都承载着很大的风险,大家都祈祷自己能够成功。 我们该祈祷的不是说我们能不能运行,而是运行的性能是今天的多少倍,运气好的话几百倍,运气差的话几十倍,所以风险会大大降低,所以你担心的只是性能提高多少倍的问题。在大数据时代,数据量太大了,大到现在的I/O系统已经无能为力地承受了。

如果你行驶的速度,你用两条腿行驶的话,你的生活半径就是五公里内,如果你开汽车的话可能是五百公里,如果能坐上飞机的话你就能环绕地球。你的性能其实决定了你的境界,在IT当中决定你能做什么。你骑再快的自行车也不能飞跃太平洋,你坐飞机永远也不能到达月球。所以我们更强调做性能。 其实在Oracle当中Optimized只是指它的存储部分。刚才那位同志说,到今天为止世界上只有DDN的存储有40GB的交换,但是我们两年前已经达到40GB了。

大家看这个图,这个同样有40GB的外部连接的接口,大家看这个名字就可以知道,The BIg Data Appliance,这个柜子有18个节点,这些节点随便你去配置,处理一些非结构化数据非常合适,这个柜子就600多个TB,而且几个柜子可以互联起来,所以它的扩充性非常强大,而且非常灵活,随心所欲。大家可以看到它所容纳的软件,包括Linux、Java等等。 今天跟大家沟通的主要是两点,一是我们大数据怎么看存储,第二我们选存储的时候应该怎么做。

Oracle SAM,第一效率最高、第二性能最好,第三我们还能够实现数据的一个流失的管理和操作,能够把我们这些来自大数据的到数据中心、到数据库,然后可以到我们的带库等等。 第一,我们要面向所有的数据以及所有的数据源,同时我们要进行全方位的分析,第三,我们要应用,Oracle一定会问你你这个存储要跑什么应用,我们为不同的应用会有不同的存储技术。第四,为云服务,为移动服务。

今天我们几乎所有的存储管理都可以基于移动服务。 我们看到Oracle为大数据提供了全套的解决方案,我们有Oracle BIg Data Connector,有Oracle NoSQLDB,有Oracle (OLTP)。 为什么选Oracle?到现在为止,人类的数据最大的存储量还是在Oracle数据当中,同时Oracle今天可以提供一个完整的解决方案,从大数据的搜集、分析、组织,以及到我们最后作出的可视化的决策的解决方案全都有。

为什么选Oracle?比方说更高的效率,Oracle可以节省40%的存储,更高的性能、更简单的管理等等等等。同时大数据的存储当中我们应该分而治之,没有一个技术可以面对所有的数据类型和所有的应用,我们关注存储的时候不要再仅仅停留在这个存储支持什么阅读、支持什么拷贝、支持什么快照、支持什么压缩,这些都是一些常用的功能,在Oracle当中全都有。同时以什么样的性能提供给我们的数据。

大家再想想,我们当初刚刚用PC机的时候,几乎到中关村去,这里拿主板,那里买键盘,这里买屏幕,等等等等。但是今天都不会这么做了,第一我买的东西比你更便宜,而且更可靠,同时提供很好的服务。 我一直说大数据多么多么有用,所以在900多年前北宋的沈括就说到,石油的名字是沈括说出来的,当时石油也没有什么用,当时是燃之如麻,其烟甚浓,沈括他当时说石油必定今后大有用处。但是今天我们讲大数据也是一样,跟沈括说的一样,今后必定大有用处。

谢谢大家。