IBM XIV,高端存储的榴莲哥

西瓜哥 发表于:13年08月19日 13:00 [原创] DOIT.com.cn

  • 分享:
[导读]XIV是罗马数字十四的意思,关于XIV名字的由来,一种说法是指Yanai和他的创业同学曾是以色列军队精英Talpiot技术项目的第14届毕业生的高材生。另外一种说法代表他们对法国国王路易十四的敬仰。

XIV销售下滑这个趋势也是我分析数据的时候不小心发现的,我也很意外。我提出了我的观点,认为XIV靠一招鲜赢得了第一波客户,但由于本身的固有缺陷,因此回头客不多,这是我的猜测。另外,一个热心网友分享了他的观点:

这个是有可能的。毕竟DS8000的双控架构天天被EMC/HDS打击,但XIV的理念确实和DS8000差距太大,IBM要融合谈何容易。

另外一个网友也反馈了一个有用的信息,XIV曾经和大机的LINUX系统对接过。

联想到目前网络上工信部调研PRISM门事件和金融行业讨论去IOE(IBM/ORACLE/EMC)化,我就想,最困难是大机环境,因为所有的国产存储都不支持大机。但是,我们可以变通一下,如让HW HVS考虑支持大机的Linux环境,这样很多金融和公安购买的大机可以更换为Linux操作系统继续发挥作用,后面接国产存储。也许我异想天开了,哈。
感谢两位热心网友提供的反馈。

今天我们来简单看一下IBM XIV的系统架构和特点。

XIV是我见过的最简单的高端存储了,结构和功能都感觉很简单。感觉真是大道至简。

这个一个满配的XIV,一个机柜搞定。所有的Module都带12块盘。你可以理解为12盘位的机架服务器,但只有6个Module可以插接口卡。

至于逻辑图,也更简单了。典型的网格MPP计算架构。节点之间通过InfiniBand交换机互连在一起。理论上应该可以支持很多的节点,但IBM XIV目前最多支持15个节点而已。估计是算法太复杂了?

大家可以看一下,InfiniBand交换机的连接方式和以太网交换机一样,但和传统的FC交换机的组网不同,即交换机之间有两条直连线路。(大家想想为什么,不明白可以私信问我)

节点每3个组成一组,用USB转串口线交叉连接,作为备份的心跳线。这块我不是特别理解,以前做IBM小机双机的时候,用串口线做备份心跳很正常,为啥把USB也牵涉进来?可能结构上更加可靠,做硬件设计的网友帮忙看看为啥这么设计?可能由于串口只有一个,无法支持3个节点,但USB口有很多啊,全部用USB也可以啊?


每个节点有一块CF卡,XIV的OS(据说是基于Linux)就安装在上面。

IBM最新发布了新款的节点类型,CPU、内存都得到了提升,而且支持10GE接口卡了。

从每个节点的后视图可以看到,每个节点都支持插SSD卡,但所有的节点都必须同时插才行。

但是这个SSD没有做任何冗余,不能用来保存数据,只是用来做读Cache使用。XIV发布了最新的版本XIV Software V11.2,号称采用SSD后,对数据库的加速提高了4.5倍(上一个版本是3倍),估计是采用了DS8000的一些复杂的Cache算法,因为 DS8000的Cache的管理是DS8000的最大亮点。

但是读Cache只针对随机I/O,大的I/O和顺序I/O就直接读NL-SAS盘,而不放到SSD中。Cache算法会识别这些I/O而不把热点数据复制到SSD中。

至于和主机的连接,由于XIV最多有6个I/O节点,因此每台主机可以支持12个路径到一个LUN,XIV测试性能的时候就这么连接,但最佳实践使用IBM建议每个交换机连接3个I/O节点就可以了。


至 于支持的硬盘,IBM也耍滑头,全部文档的都说是SAS盘,不提SATA和NL-SAS字样。因此,你标书写要求支持FC/SAS盘,XIV肯定答复满 足,哈哈。但你一看容量,你肯定知道这是NL-SAS盘。因此,如果你写要支持15K转的高速硬盘,XIV只能答不支持了。

至于XIV的RAID 2.0-(前面的帖子我这么称呼),其实非常简单。就是XIV彻底抛弃RAID,所有的硬盘都切成1M大小的块(XIV叫Partition),然后采用伪随机算法,数据保存在两个分区上。有一点像RAID 10的味道。


IBM的算法,数据Partition和它的副本绝对不能位于1个节点内,因此,坏了一个节点(12块硬盘),数据是不会丢失的。IBM的红皮书说系统最多支持坏1个节点和另外任意3块盘(不能同时坏),而整个系统数据不丢失。但 在RAID 2.0可靠性分析我也分析过了,XIV的可靠性其实是比较差的,本身SATA盘的可靠性就不如SAS,而且RAID 10的可靠性不如RAID 6,加上XIV不能控制LUN的分布,LUN都分布在所有的磁盘上,因此,整个系统同时坏两块盘(不在一个节点)的概率还是比较大的,因此数据丢失的风险 很大,江湖上也有XIV丢数据的传闻。

IBM XIV的Thin和Thick LUN的分配粒度都是17GB(准确来说是16GiB)。17GB是XIV一个神奇的数字,IBM的红皮书一直没有说如何计算出来是17GB的,只是说这是网格架构的一个自然属性,保证每个LUN平均分配到各个节点中。有谁知道17GB怎么来的网友麻烦告诉一下,我一直没有想通为什么是这个颗粒度?

好,相信通过我的分析,大家对XIV的架构有了一个基本的了解。另外,XIV支持QoS,可以对IOPS和带宽做限制,不支持数据完整性标准DIF(据说现在叫PI了)、磁盘加密、Tier等这些传统的高端存储的特性。

至于快照,采用COW方式,前面我们分析过了。远程复制方面,XIV最多支持1对8复制,而且RPO应该比较大,复制的间隔最少在20s以上。

XIV其实没有太多的东西,卖点我前面总结过了,但我相信还是有些人不接受XIV是一个高端存储的,但肯定也有人喜欢XIV的。XIV就像榴莲,喜欢的人爱得不得了,不喜欢的连碰都不碰。因此我把XIV比做高端存储的榴莲哥,大家就印象深刻了。

我总结一下,高端存储架构里面,按照架构的保守和激进程度,我排一个序:

保守度---DS8000--HDS VSP--EMC VMAX--HW HVS--XIV--激进度

IBM处于两头,难为IBM的销售了,必须学会老顽童周伯通的左右互搏之术,才能把两个高端存储卖好。

最后,我看到IBM正在招募XIV新版本红皮书的作者,好像XIV有新的硬件和软件特性要发布,RAS,GUI和镜像方面好像有增强。等我拿到红皮书会第一时间给大家解读。

如果你爱她,请送她XIV,因为那是天堂;

如果你恨她,就送她XIV,因为那是地狱。

[责任编辑:西瓜哥]
从VNX2的指标看,其实可以达到高端存储的性能水平和容量水平了,除了还是两控外,因此,VNX2出来后,所有的中端厂商包括部分高端厂商都会很难看。
官方微信
weixin
精彩专题更多
存储风云榜”是由DOIT传媒主办的年度大型活动。回顾2014年,存储作为IT系统架构中最基础的元素,已经成为了推动信息产业发展的核心动力,存储产业的发展迈向成熟,数据经济的概念顺势而为的提出。
华为OceanStor V3系列存储系统是面向企业级应用的新一代统一存储产品。在功能、性能、效率、可靠性和易用性上都达到业界领先水平,很好的满足了大型数据库OLTP/OLAP、文件共享、云计算等各种应用下的数据存储需求。
联想携ThinkServer+System+七大行业解决方案惊艳第十六届高交会
 

公司简介 | 媒体优势 | 广告服务 | 客户寄语 | DOIT历程 | 诚聘英才 | 联系我们 | 会员注册 | 订阅中心

Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技术有限公司 版权所有.