华为发布三款AI SSD,容量最大245TB,性能比PCIe 6.0的盘还快

近日,华为数据存储发布三款AI SSD新品。其中一款产品在性能上达到了目前市面上的最高水平,超过一款基于PCIe 6.0的产品。另外一款产品容量高达245TB,追平市面上已有的最大容量的企业级固态盘。

极致性能,提高AI训练效率

Huawei OceanDisk EX 560主打极致性能,随机写性能非常强悍,不仅随机写时延低于7µs,而且最高可达1500K IOPS,这一性能参数超过了基于PCIe 6.0企业级SSD的产品,后者仅为900 KIOPS。

考虑到这样的性能,还有60 DWPD的耐久性,可以确定是一款SLC的盘。此外,这块硬盘的容量规格有1.6TB、3.2TB以及6.4TB三个版本可选。

4K随机读写性能对于AI训练前的数据加载,还有训练过程中的小文件访问中尤其重要,能显著减少GPU等待数据加载的情况,让昂贵的计算资源利用率更高。

华为公开的资料显示,该硬盘适用于AI一体机训练场景,它能将单机可微调的模型参数扩大6倍,可以对千亿参数大模型进行微调。

高性能提高AI推理效率

Huawei OceanDisk SP 560也是一款高性能的盘,随机写性能最高可达600K IOPS,随机写时延低于7µs,耐久性1 DWPD。

华为公开资料显示,该硬盘适用于一体机和集群的推理场景,可推理序列长度提升2.5倍,进一步优化推理体验和成本,实现TPS提升1~2倍,首Token时延降低75%。

为什么高性能SSD能提高AI推理序列长度呢?这是因为当SSD速度足够快,推理系统就可以把显存当中不活跃的KV数据下沉到SSD里。

以前因为SSD存储比较慢,所以只能在显存里跑较短的序列。现在当SSD足够快的时候,序列变得更长的时候也不会导致较长的等待时间,不影响用户体验,所以长度上限提升。

超大容量SSD,提高数据预处理效率

Huawei OceanDisk LC 560是一款超大容量的盘,最大单盘物理容量245TB,与市面上已有最大容量SSD持平,更大的容量意味着可以减少硬盘数量和存储集群复杂度。

该硬盘的读带宽可达14.7GB/s,适用于集群训练场景,帮助数据采集预处理效率提升6.6倍,帮助训练前的数据加工更快完成,从而缩短模型开发周期、降低整体成本。

华为强调这三款硬盘是面向AI场景的AI SSD,这三款SSD设计到数据摄取、数据预处理以及模型训练和推理的各个阶段。

为了更好地适应AI场景需求,华为还推出DiskBooster驱动软件,支持AI SSD与HBM、DDR内存智能协同,通过内存扩展技术实现虚拟池化内存20倍扩展。

同时该软件还具备智能多流技术,与上层应用配合,有效降低写放大效应,进一步提升AI SSD寿命。

TrendForce最新调查显示,随着北美地区主要云厂商持续投入AI,预计将推动2025年第三季度企业级SSD需求大幅增长。国内的云服务商也在加大AI相关投入,也会带动对于SSD的相关需求。