在存储领域,谁能占据行业高地的标志之一就是如何展现出自身的性能优势。为此,诸多存储厂商都一直非常看重存储性能优化方面的进展,在大数据、云计算、以及移动互联等多重因素的驱使下,用户对于存储性能要求到了一个新的阶段。
既然用户大数据存储已经成了当前的热点,那么用户如何提升自己在数据爆炸式增长情况下的存储速度和性能,被大家首要看重的就是借助闪存盘的优势来获取更高的存储性能。特别是在一些重要场景下,用户的性能要求更为突出:
一是On-Line Transaction Processing联机事务处理系统(OLTP),也称为面向核心交易的处理系统,衡量联机事务处理系统的一个重要性能指标是系统性能,具体体现为实时响应时间(Response Time),即用户在终端上送入数据之后,到计算机对这个请求给出答复所需要的时间。用户往往在借助传统磁盘存储系统上无法满足OLTP下的性能需求,急需更快的数据存储与处理。
二是数据仓库,它是决策支持系统(dss)和联机分析应用数据源的结构化数据环境。数据仓库研究和解决从数据库中获取信息的问题。这就必然要求在存储数据的交付速度方面有着更高的表现,如何更高就是问题所在。
三是大数据(bigdata),用户大数据存储最新需求就是要求在合理时间内达到读取、管理、处理数据、并整理成为帮助企业经营决策的信息。这样的过程对存储性能的要求不是传统磁盘的延时性可以满足的。
EasyTier带来磁盘和闪存的理想融合
显然,对于企业级用户来说,传统磁盘带来的性能低下已经不能满足大家对性能更高的苛求,现阶段,对于闪存依然还是处于高端价位的水平,因而如何更好地利用磁盘与闪存盘的融合带来更高的性能就显得非常重要。
大家所熟知的,与传统磁盘相比,闪存盘的优势非常明显,包括更好的性能、更短的响应时间、更低的延时、更低的能耗、更小的尺寸等等。但是,只是闪存盘的堆叠还不能完全达到用户对于存储的容量需求。为此,业界早已出现了一种比较折衷的方法论:“ 主流分层架构的存储,引入少量的固态盘并实现好钢用在刀刃上是比较理想的做法。”其目的也是希望达到性能与容量的平衡。
不过,传统的分层方式采用的存储架构,实现分层 的有效性和时效性相对都比较低,并且还需要人工手动干预,这就显得太没技术含量了,关键是早已不适合用户在存储分层技术上的应用需求,失去了分层的原有意义。而IBM V7000存储的数据自动分层技术(EasyTier),“其技术原理更加类似于手自一体的汽车,对于绝大多数的驾驶员来说只需要踩着油门向前行驶就可以了,与之对应的是数据往存储池内一丢,自动的存放到最合适的位置,且可以动态自动调整,无需人工干预,当然对于一些迷恋手动操作的老司机,依然可以切换到手动档去操作。”其目的非常直接,就是要:提升数据存储性能,达到或超越用户的性能需求。
对此,业界有人对V7000存储的数据自动分层技术做了“3个最和1个自动”的总结,目标就是将最合适的数据,在最合适的时间,自动的存放到最合适的存储介质之上。这个意思不难理解,似乎与某友商的自动分层技术似曾相识,但需要指出的是:“V7000存储目前支持3种不同类型磁盘,包括SSD磁盘,SAS磁盘和近线SAS磁盘,动态分层技术可以实现不同繁忙程度的数据自动分布在这3种不同服务能力的磁盘介质之上,实现数据的最优化部署和资源的最优化使用。”这便是用户在闪存与磁盘之间实现了动态的平衡利用,达到容量与性能的和谐统一——“要速度,有速度;要容量,有容量。”
V7000 1:2再次彰显RtC新价值
然而,想要实现用户在大数据环境下的更好的性能,仅仅依靠自动分层技术还不足以满足用户的最佳需求,因此,IBM在V7000存储中采用IBM独有的专用压缩引擎。在最新推出的IBM Storwize V7000 1:2方面,可以至少提供优于友商产品两倍的特性。这样的特性如何得来,这与IBM 实时数据压缩(Real-time Compression)技术有着密切的关系。
IBM RtC实时在线压缩技术内置于Storwize V7000控制器,并借助专用协处理器卸载计算密集型的压缩解压运算。 V7000 RtC采用LZH压缩算法,利用独有的随机访问技术提供高性能和高压缩比,在对已压缩数据少量更改时,随机访问技术仅需读取/更改单个变更数据块而非所有数据,大幅降低了压缩解压过程对后端磁盘I/O的要求。正是借助专用压缩协处理器以及独有的LZH压缩算法,V7000 RtC的压缩方式为在线处理方式,压缩率可高达80%。启用RtC后,不仅对V7000性能无影响,对于I/O密集型的应用如Exchange,SQL Server等,由于后端只需要处理更少的数据,其控制器的CPU处理的数据更少、负荷大大降低,磁盘上存取的数据更少,磁盘的IO次数、磁头的移动次数要求都大大减少,性能反而较压缩前有一定提升。
“友商为了降低数据压缩对阵列性能的影响,往往采用后处理压缩方式,即先写入原始数据,在后台根据策略触发对写入数据的压缩,比如数据变化量达到10%或10GB的增量。但这种间断的处理方式也导致了需要的存储空间更大,在进行后台压缩处理时,占用存储控制器处理器与缓存,对性能的影响较大并且持续时间较长。”这对于要求性能更高的大数据存储用户来说确实是个问题。
事实上,在IBM系统中心对东软PACS系统进行实测 ,使用RTC功能对 DICOM医学图像数据格式进行处理,对图片类型数据压缩率居然达到42.3%,远远高于IBM公开的发布值。在客户收益方面,对于相同投资情况下,帮助用户延长系统的规划时间,或降低系统建设的初次投资,有着明显的效果。当然对于ISV收益来说,利用新技术和高磁盘使用率,达到了提高客户满意度和行业形象。从而也实现了IBM与客户、合作伙伴三赢的局面。
不过,需要指出的是,据说IBM V7000 1:2 可以为用户提供两倍以上的性能。效果非常明显:一是降低数据中心50%的空间;二是单台提供高达128GB缓存,4台集群实现提供521GB缓存;三是减少50%的电力开销。这些结果也是用户所苛求的。
阿明点评:进一步分析来看,RtC与IBM的SVC存储虚拟化技术结合,使旧的设备也具有了压缩功能。RtC可减少物理存储购买成本,RtC可减少设备占地空间;RtC可减少电源和冷却系统能耗;RtC可降低按物理容量收费的软件许可证成本;RtC可减少因磁盘损坏而带来的数据丢失风险。再加之IBM EasyTier可以为用户实现性能的自我优化,合理规划存储环境的部署规模,无需为了处理高峰期工作,优化性能和成本;自动管理性能优调,存储系统能够持续分析数据接入模式并且将数据自动转移到适当的存储层中,在存储系统内部和之间转移,提高管理员生产率;轻松增长用户的虚拟服务器基础架构,自动优化整个基础架构上的I/O吞吐量,从而充分利用用户的服务器和存储器,虚拟化更多的基础架构组件。
由此可见,IBM在帮助用户在大数据新环境下提升存储性能方面,将SVC、EasyTier与RtC相互作用,互相发挥出各自独特优势,从而达到用户对存储性能的更高要求。从这里可以遇见,IBM存储的发展路线一定是一个融会贯通了多种存储技术、满足用户性能与容量、效率与成本等多个方面的综合需求,在走向更为独立的存储之路上,永续性能神话将成其为必然的趋势。(阿明)