IDF15:Xeon D被阉割?SSD性能的“色子效应”

  • admin
  • 2015-04-09 19:29:57
  • 黄亮/企业存储技术

[导读]记得去年在美国举行2014秋季IDF期间,存储圈内一位英文好的首席专家曾表示:在中国办的IDF上讲的内容,基本就是半年前美国讲过的那些,没啥新东西。我觉得也有些例外的情况,那就是Intel在这半年之中发布了新产品。

记得去年在美国举行2014秋季IDF期间,存储圈内一位英文好的首席专家曾表示:在中国办的IDF上讲的内容,基本就是半年前美国讲过的那些,没啥新东西。

我觉得也有些例外的情况,那就是Intel在这半年之中发布了新产品。比如当年第一代Xeon E5——毕竟IDF上讲的都是公开的东西,像PCIe(最早叫过3GIO,还有人记得这个名字吗?)之类的规范、标准可以预热宣传,但具体产品是不能在这个场合上提前泄露的。

所以,在本届IDF之前我查看技术课程目录时,就多长了个心眼——有哪些新鲜东西?我看到了不久前正式发布的Xeon Processor D相关的课程,这款BGA封装的SoC处理器已经不再需要PCH南桥,特别适合存储控制器这样的嵌入式平台设计。然而,当我在今天下班再次刷新IDF网页时,却看不到这一节课程了??

 

类似消失的情况,好像还有一节ServerSAN相关的。

从去年春季IDF开始,Intel就将主办地从持续了多年的北京搬到深圳,意图也很明显——Intel近几年的战略重点在移动端,无论平板还是手机处理器,这些产品的制造集中于广东。另一方面,企业级市场Intel绝对优势,而且服务器和存储在中国市场的所占全球的比例,显然不如个人消费产品(毕竟十几亿人摆在那里)。

我无意猜测Xeon D技术课程由于什么原因被取消,只能对此表示遗憾!毕竟它应该是本届IDF数据中心特别是存储领域为数不多的新内容。

吐槽归吐槽,技术的东西还是要写。我就给大家分享下今天看pdf资料的心得,其中也加入了我尘封多年的测试结果,作为一个花絮吧。

数据中心SSD市场分析、Intel要退出?


 

这张slide列出了2014年第四季度调研报告中的3项数字:服务器内配置的SSD数量——到2018年之前预计增长幅度略有放缓;平均容量上升则比较快——增幅比硬盘快,这里得益于半导体制程的发展和3D NAND闪存等技术;但数据中心级SSD的价格不断走低——2014年已经开始降到每GB 1美元以下,我觉得这个应该针对DC S3500这类出货量最大的SATA型号——也是Intel目前占优的领域,PCIe Flash还没有这么便宜。

 

尽管在单季度11亿美金的市场中总共占据了40%,但这两天我还是听到Intel可能要退出SSD领域的传言。是三星发起价格战了?还是美光要自己玩?

掷色子理论:队列深度与IOPS不是完全线性

 

这张的slide提到了“色子理论”。我想了一种比较极端的情况,如果掷2枚硬币(因为只有2个面),那么它们不同面朝上的平均比例正好是50%。当闪存颗粒的数量为6时,并发的6个随机IO操作平均只能命中其中4个,而达不到理想中的完全并发效果。

 

上面这个图表只是一个理论的假设,NAND并发达到50时,IOPS就会达到单个NAND50倍吗?

 

实测情况是,这条“加载曲线”在队列深度(也就是主机访问并发度)256时才达到单个NAND颗粒50倍左右的IOPS,而50队列深度实际产生的并发效果约等于32

 

这里开始告诉大家“防忽悠”了,SSD厂商宣传的最高IOPS一般都是用各种极限测试方法压出来的,而更多典型应用发生在1-64队列深度这个区间。

 

那么以上2SSD哪个更好呢,如果只看厂商给的spec数字应该是绿色曲线的高,而大部分实际应用中蓝色表现应该更好吧。

 

如上表,HadoopTPC-CHPC以及ZFS文件系统写日志等产生的队列深度都不算高(10以内最多);只有TPC-H例外,甚至有相当一部分比例达到260以上。

平均延时与最大延时

 

队列深度增长,带来的一个副作用就是延时的上升。SSD在这方面不是明显优于硬盘吗?这并不代表在所有特定环境下SSD都能100%满足延时需求,反而由于写放大/垃圾回收带来的抖动引入了需要关注的新参数。


这里我列出一个几年前测试机械硬盘的情况,2.5寸的希捷Savvio 15K.2已经超出了人们一般的经验值——15000转硬盘180 IOPS,因为它的纯机械平均访问时间已经低于5ms(平均寻道+旋转等待)。我们可以通过队列深度(而不是短击)来将它的IOPS提高到500以上——尽管没有SSD颗粒并发度的效果好,但代价是延时以接近1倍的幅度不断翻番,实际环境中20ms以上许多应用已经无法接受了。

更多的NCQ优化硬盘寻道的原理在这里不详细讨论,留给大家思考吧,我们还是回过头来看SSD

 

前面只列出了平均延时,而最大延时在许多情况下也会影响用户体验。闪存在这方面的一致性就没有硬盘好了,还记得Oracleredo log吗?

 

举个例子,某SSDIOPS稳定性很好,队列深度64时稳定在20万,但响应时间无法控制到这个水平——如右图,90%以上在1ms以内,大约99.99999%10ms以内,但还是有极少的比例超过了10ms

 

当队列深度增加到128,只有大约99.999%I/O延时在10ms以内,这一点比64队列深度差了2个数量级。

 

现在回到前面那2款对比的SSD,我理解是在A表现更出色的区域,由于绿色曲线(SSD A)达到同样IOPS需要更高的队列深度,所以延时就相应更高;反之亦然。

读写混合效应:实测低于理论

 

真实应用下往往不是100%读或者写,而是混合访问。我们看到这款SSD在队列深度较低时写IOPS比读高,应该是写缓存的作用,一定程度上触发了NAND颗粒的并行操作。

 

以这个简单的公式计算混合IOPS可以吗?当然不行,因为70%的读操作要“等待”那30%的写操作按比例地完成。

 

这个公式应该是对的,然而实际情况就是这样吗?

 

答案是No,实测结果低于前面的2条曲线,大概是SSD的闪存读写操作之间有一些干扰吧。

参考资料《将固态盘融入数据中心需要考虑的要素》可以点击“阅读原文”或者从 http://pan.baidu.com/s/1mgmTaNQ 下载,里面还有不小的篇幅写了如何用ECC还解决SSD的“静默读错误”,以及宇宙射线的模拟测试方法,我想发一条微博来简单讨论下,欢迎关注@唐僧_huangliang

感谢您的阅读和支持!《企业存储技术》微信公众号:huangliang_storage

热点文章

精彩专题

微信公众平台:搜索"doitmedia"
或扫描下面的二维码:


  1. 公司简介 | 媒体优势 | 广告服务 | 客户寄语 | DOIT历程 | 诚聘英才 | 联系我们 | 会员注册 | 订阅中心
  2. Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技术有限公司 版权所有.
  3. 电信与信息服务业经营许可证:030972号 电信业务审批 [2009]字第572号
  4. 京ICP备13004627号-3   京公网安备: 110105001105