最近几年很多IT业内人士都表示超融合非常火,据说国内市场上大概有700家企业宣称自己在做超融合,超融合是个竞争激烈的市场,超融合的特性对用户有非常大的吸引力,易于部署,快速交付,扩展性高,可管理性好,由于采用了非专有设备,成本也相对低很多。基于以上种种优势,超融合俘获了大批用户的芳心。
2018年中国存储与数据峰会期间,Bigtera总经理游宗霖在Bigtera VirtualStor Extreme发布会上回顾了数据中心基础架构的发展变化,阐述了软件定义数据中心所倡导的理念,梳理了超融合架构存在的一些问题,也介绍了更为先进的可组合架构的优势,当然还有一些Bigtera在超融合产品设计上的创新点。
服务器的数据计算,存储系统的数据存储以及网络的数据传输功能,最终都是是要服务于企业的业务。人们对数据中的要求越来越高,最急迫的需求就是快速上线,软件定义数据中心便由此而生。“软件定义数据中心就是希望用软件的方式,在既有硬件基础上,快速提供用户所需的计算资源、网络资源以及存储资源”,游宗霖总结道。
软件定义数据中心并没有解决数据中心管理复杂的问题。随着用户应用的变化,不同时期,不同应用对于存储的需求是不一样的,用户遇到的问题可能是IOPS不够,也可能是容量不够,用户对存储数据保护等级的要求不同,每次不同需求可能都需要购置新的存储,长此以往就形成各种数据孤岛,也让管理的复杂性水涨船高。
有调查数据显示,由于存储数据孤岛非常普遍,使得存储系统复杂度提升,带来最直接的问题就是资源浪费。有调查报告提供的数据显示,数据中心里的存储空间有50%以上是闲置或者未使用的。管理的复杂度最后也将转化为企业的运营成本。存储系统只能被动地跟着应用跑,效率很低下。
于是软件定义存储跟超融合出现了,但是仍然沒有很好的解决所有的问题。
超融合HCI就是为了解决用户遇到的这些问题,超融合把计算、网络、存储放在同一个物理设备上,用软件的方式将计算、网络、存储变成资源池,以增加节点的方式扩展资源,最后根据应用的需要去分配这些资源。
超融合本身也存在问题。游宗霖介绍说,超融合为了降低计算和存储两者之间的物理延迟,所以才将两者紧紧放在一起,但由于分布式存储需要将副本放到多个节点上,最后还是需要跨设备的网络传输,还是会有延迟。
在实际应用中,用户需要多种存储类型,块存储,文件存储还有对象存储,然而,超融合通常只是提供SAN块存储,对于文件存储的支持比较困难,对于对象存储的支持更少。
第三个问题也很关键,通常,超融合只提供(二)三副本的数据保护方案,但并不是所有应用都能用(二)三副本来满足。
所以,很多时候,超融合本身存在的问题需要用别的手段来弥补,这些手段通常不是超融合。作为数据中心基础架构,只靠超融合是不行的。在游宗霖看来,这需要再度创新,这就是SCI(Software Composable Infrastructure-软件可组合架构)
可组合架构Software Composable Infrastructure
如果说超融合费尽心机把计算、存储和网络组合在一起,那么SCI则是又把三者进行了拆分,拆分的同时还把各种资源打散,切成小碎块然后用软件组合在一起,这就是SCI的核心思想。
在游宗霖看来,闪存是新变化的根本动因。因为以前磁盘慢延迟高,所以才将存储与计算结合在了一起,但现在闪存动辄几千几万甚至几十万的IOPS简直不要太快。闪存这么快,还要靠CPU的配合,磁盘存储时代,人们总说CPU过剩,而随着闪存的兴起,所有人都在抱怨CPU不够用了,很多人在做闪存加速方案,究其根本就是闪存存储太吃CPU资源了。
几年前,笔者在采访某全球超融合领先厂商的专家时问道,为什么现在超融合这么火,闪存也这么火,为什么没有人说全闪存的超融合呢?对方表示,闪存对CPU的占用太高,无力正常支持超融合各种的软件计算任务。
回过头来一想,闪存是基础层面上的创新,如今闪存的容量越来越大,性能越来越高,价格越来越低,从磁盘到闪存的变化已断无回头路,CPU也不是说变就变的,后摩尔定律时代,CPU的发展步伐越来越稳定。所以,要变的只有架构上的创新——超融合了。
NVMe over Fabrics的出现为存储网络打开一扇新的大门,很多业内TOP级厂商都在致力于做基于NVMe over Fabrics的闪存存储系统,性能上也有质的飞跃,能大大降低存储延迟。NVMe over Fabrics的出现也让存储与计算再度分离成为可能,既然有这么快的网络了,存储也没必要非得跟计算靠那么近了,这为SCI的发展制造了客观条件。
Bigtera是慧荣(SMI)旗下的一家存储系统公司,2010年就开始做软件定义存储,2013年开始陆续推出软件定义存储的产品,他们推出的分布式软件定义存储产品VirtualStor Scaler,以软件定义的方式来做大量数据的存储,作为分布式存储的核心Bigtera的分布式存储核心都是自研的,支持的Ceph的原生协议。
作为分布式存储最主流的产品形态,Bigtera也自然会有超融合产品线。Bigtera从2013年第一款产品就开始做融合存储,融合SAN块和NAS文件存储,降低存储复杂度,Bigtera可提供高性能、高效率的数据保护机制,较好的异构特性可纳管用户原有的存储资产。
Bigtera在SCI方面软件组合的能力最为引人瞩目。游宗霖介绍说,Bigtera在2014年已经具备了软件组合的能力,可以根据用户需要划分资源,如果需要跑数据库那么就用块存储;如果重视安全性,可以选择配置双副本,有需要的还能做跨数据中心多活。所有的应用都共用同一个存储基础建设,同一个存储集群可以支持各种不同应用。
分布式全闪存延续SCI
在2018中国存储与数据峰会上,Bigtera新发布了分布式全闪存产品VirtualStor Extreme,通常常见的全闪存都是双控存储,而像Bigtera所说的分布式全闪存则非常少,游宗霖表示,目之所及,只有DELL EMC,PureStorage提供相关产品。
与之相比Bigtera的产品思路也有不同,Bigtera是把原来的可组合架构的思想延伸到了闪存产品的设计上,同样是以一套架构来满足各种需求,支持多种协议,不限于块存储,还有文件共享存储,能把数据放在同一个命名空间下。
Bigtera的异构特性能很好的兼容别的系统,非常神奇的是,如果说用户原来就有存储,新买了闪存之后,在Bigtera系统的帮助下,系统可以自动帮用户完成数据迁移,将数据从原有系统迁移到新的闪存系统中,能做到业务无中断。
说起闪存系统,免不了会讲讲性能和稳定性的问题。
虽然Bigtera是一家软件为主的存储公司,但在硬件设计方面也颇有心得。得益于慧荣科技在存储控制器业务领域的领导地位,及同为慧荣科技子公司的宝存在企业级SSD市场的表现,Bigtera的闪存产品可以基于闪存底层控制器级别进行通信与设计,所以在一些黑科技的表现上显得尤为抢眼。比如Bigtera VirtualStor Extreme在减少写放大方面表现优异,在传统的闪存设备7.31倍的写放大表现上,Bigtera的新产品可以做到1.05倍的写放大,写放大能降低7倍,这足以使Bigtera敢于承诺闪存系统可持续稳定运行3-5年。
VirtualStor Extreme能实现性能线性扩展,游宗霖介绍说,一台2U 24盘位的闪存系统能提供80万IOPS,如果买14台设备,那么就会有1000多万IOPS,横向扩展的性能,VirtualStor Extreme不是双控系统,不存在性能瓶颈,当然,有些用户可能用不了这么高的性能,但是当企业的应用数量多的时候,分布式的闪存存储给了充足的灵活性。
Bigtera VirtualStor Extreme的延迟非常稳定,与分布式存储Ceph相比优势还是很明显的,Ceph的延迟抖动范围覆盖到40ms,而VirtualStor Extreme的延迟则稳定的低于1ms。据游宗霖介绍说VirtualStor Extreme是用了SCM(存储级内存)技术,SCM技术作为缓存用的话,对于上文提到的减少写放大也大有裨益。
结语
作为一家以软件为核心能力的存储公司,Bigtera在硬件上的创新性还是挺让人惊喜。不过,最核心和与众不同的能力还是软件,还是在SCI架构上的领先性。讲可组合架构Composable Infrastructure的不Bigtera只一家,但是Bigtera是软件的可组合架构,软件定义的概念深入人心,进一步的软件定义则能带来更高的自由度和灵活性。
随着未来闪存价格的不断降低,NVMe over Fabric技术的逐步成熟,Bigtera所推崇的SCI架构将有更大的发展空间。采访中,游宗霖表示,Bigtera承载着慧荣科技集团从底层控制器芯片拓展到上层系统的战略任务,在发展中有慧荣作为支撑可以给Bigtera带来很大帮助。