DOITAPP
DOIT数据智能产业媒体与服务平台
立即打开
DOITAPP
DOIT数据智能产业媒体与服务平台
立即打开

张泰乐:2018-2022数据中心SSD的新故事

2018中国存储与数据峰会现场,Memblaze产品副总裁张泰乐发表了题为《2018-2022数据中心SSD的新故事》的主题演讲,从介质,协议这两个SSD的关键发展要素入手,介绍了当前市场上介质和协议的发展历史和发展现状,并对优劣势进行了一些简要分析。

以下是内容根据现场速记整理:

十年前苹果突然发布了iPhone,从此开启移动互联时代,全球一年产生的数据是7万亿GB,十年以后,我们正处于大数据时代,大概一年要产生差不多22万亿,我们预计这个数据会爆炸性增长,2020年,万物互联时代来临,每年可以产出62万亿GB数据,这是一个什么数字?

我简单的介绍一下。

全球大概有70亿人,从刚出生一个字不认识得到年纪很大退休的人,全球加起来70亿人,62万亿差不多每人每年要产生一万GB,现在一个光盘差不多存4GB,所有的设备、所有的汽车都在产生数据,而这些数据会催生整个数据产业的发展。

SSD的发展也很多元化,我主要讲两个事情的变化:一个是闪存和介质,讲一讲我们对于TLC、QLC的看法。第二,我想介绍一下NVMe协议,因为大家都认为NVMe是一个非常非常好的协议,那么NVMe有什么问题?下一步怎么发展,有什么新的协议?

首先来看一下闪存,左图来自Gartner,蓝色线是他们预测的价格的化,这个红色的曲线是整个年度的价格变化,大家看到,从2016到2017年期间,整个NAND价格没有下降反而还上升了,原因在于从2D到3D的过渡不那么平滑,但未来预期是非常非常好的。

预计到2022年,整个NAND的价格会下降的非常平滑,平均每年下降20%左右,大家可以想象到SSD会非常便宜,因为SSD主要成本来自于NAND,SSD会进一步普及,华为提到更多行业会看到全闪存的应用,我们也非常相信。

IDC报告里说,截止到2018年,全球大概有2700万片SSD,只需三年后,到2021年这一数字将增长到3700万片,每一片的容量也几乎要翻倍,所以,整个的SSD疯涨是非常非常快的,我们认为SSD发展会非常快。

发展的过程里,我们怎么演进?

我们看到的情况是这样的,最下面红色的MLC会快速消失,TLC特性在2D的时候比MLC差很多,但3D时代和MLC很接近,很多大厂已经不再提供3D MLC NAND,所以MLC下降的非常快,TLC很快就会成为绝对主流,但现在最新的技术是QLC,是指一个Cell可以放4个比特,比之前TLC便宜25,但会不会成为主流呢?这是我们未来要去仔细研究的一个问题。

从目前预测来看,QLC会有明显增加,但未来三五年时间不太可能取代TLC,一个重要的原因是QLC的寿命上太弱了,它的性能也太差了,性能差到什么程度?

它的读延迟是2D MLC的3倍,也是TLC的2倍以上,它的写入性能大概只有TLC的四分之一到五分之一的样子。每个厂家可能不一样,整体来看,它的寿命也大概不到TLC的五分之一,所以,很多应用并不适合他,它的成本也只是下降25%,QLC更适用于以读为主的,对延迟不是特别敏感的应用。

所以,TLC会成为绝对的主流,QLC会占有明显的市场份额,大概有百分之十几,但是不太可能取代TLC。

在SSD协议演进的方面,2008到2014年是一个阶段,以Legacy SATA和私有的PCIe为主,2009年,我们开始开发PCIe SSD,当时整个世界上还没有NVMe的产品,2014年的时候还只有两类产品,一方面,SAS和SATA SSD是绝对的主流,另一个是私有的PCle,我们也有自己的协议。

后来大家逐渐的意识到NVMe才是主流,2014年6月有一个标志性的事件,就是Fusion-io以一个比较低的价格被收购了,整个世界快速进入了NVMe,NVMe开始一家独大,以至于所有人相信数据中心领域主要就是NVMe。不过,SATA还没有完全消失,还有一些企业在使用,存储系统里,我同意华为说的未来三五年,主要的还是SAS,但是整个NVMe在数据中心领域,在系统里,已经是一个绝对主流的协议了。

为什么NVMe能成为绝对的主流呢?

NVMe有很多优势,最大的优势就是它是多核友好型的,因为现在的CPU单核性能发展的非常慢,为了继续推进摩尔定律,大家使用多核,多并发,这方面NVMe比传统做法好很多。

NVMe已成了绝对主流,有哪些需要进步和提高的地方吗?

有的,最大的问题在于,对上层来讲它是个黑盒子,它看到的就是块设备,至于你的块和你的NAND之间的关系它是看不到的,你的NAND什么时候被擦被写都是不知道的,这使得你的Latency处于不可控或者不完全可控的状态,这是NVMe的瓶颈。

下一步怎么变迁?

有这样几个趋势,这是NVMe自身的演进。比如NVMe有一个IO Determation,它可以让Host来控制底层什么时候做GC什么时候不做,以达到Latency相对可控的状态。

另一个,现在一些公司在推进的NVMe集成更多的计算能力,通过网络上传NVMe协议,实现远端的计算存储分离,这些都是在NVMe框架下做的,都在考虑和NVMe的通用性和兼容性做得,他们之间是互相紧密配合。如果你要兼容性,就不可避免的无法做到极致,你想做到极致有没有办法呢?另外一条路就是深度定制,第一个是OpenChannel,不用考虑和NVMe的兼容性,也就是跨越了NVMe的兼容性,可以做到极致。比如还有Computing SSD,有很多的公司在做,再比如说AWS的Fabric SSD,可以直接把SSD拉到远端使用。

选深度定制还是标准NVMe?这个选择其实比较难拿的,你想达到极致的定制,你就必须要有极致的投入,右边的投入是非常非常高的,而且非常非常危险的,有些人成功了,比如AWS通过收购公司,他们开始有实际部署,有些公司投入了很多年,其实还没有太成功,但是我非常敬佩这些公司,如果说你并不是追求最极致的结果,你没有足够的资金准备,我说的资金都是亿美金级的,可能基于NVMe框架型的通用型的解决方案会是更好的。

最后,我简单介绍一下PCIe的发展,其实已经很多年了,马上会出PCIe 4.0,最快就是在2019年,在我们看来5.0也会很快,会比3.0时间短很多。介质工艺很快会到七纳米,到时候就会看到PCIe 5.0。

为什么大家会不停的推进PCIe的速度呢,因为我们可以减少CPU的数量,因万物互联大数据的时代,PCIe要更少的占用NVMe,有足够的动力让人们使用PCIe,当然我们需要更高工艺的纳米制程技术,我们预计最快在未来五年,大家可以看到PCIe是彻底的落后,未来三到五年我们可以乐观的预期PCIe会成为主流,甚至都可以看到5.0早期的样品。

从介质来讲,我们认为介质价格会下降,3D的QLC在未来是绝对的主流,QLC份额会明显的增加,但是不可能完全取代TLC,3DXpoint等新介质值得关注,但需要寻求新的程序模型与生态,NVMe是当之无愧的主流,NVMe在不停的完善自己,现在有各种定制化的协议会出现,但是投入产出风险非常大,大家一定要小心,PCIe未来四到五年会进入到4.0和5.0阶段。

我今天的演讲就这些,谢谢大家。

未经允许不得转载:DOIT » 张泰乐:2018-2022数据中心SSD的新故事