AI进入规模化推理阶段后,推理作为一项长期在线服务,背后涉及模型加载、知识库检索、缓存调用、日志写入和结果存储…随着这些环节持续运行,SSD需求正在从容量增长走向结构分化。

这种变化可以从两个方向来看。
方向一、减少“时间”差价,让SSD靠近GPU
即缩短GPU和SSD之间的数据路径。
AI大模型训练和推理要持续读取模型权重、输入数据、中间状态和缓存数据,算力要充分释放离不开存储的配合。最靠近GPU的是HBM(高带宽内存),通过多层DRAM芯片垂直堆叠,还有更宽的数据通道来与GPU连接,从而提供远高于传统DDR内存的带宽。对GPU来说,HBM是距离计算核心最近的高速工作区,适合承载最热、最频繁访问的数据。
但HBM也有明显限制——容量有限、成本高,无法无限扩展。随着大模型参数、长上下文、KV Cache和多模态数据持续增长,行业开始探索更多层级的存储补充。再往下一层,就是NVMe SSD,其速度和延迟虽然不能取代HBM,但可以部分承担更大容量的数据传输和分层存储需求。
那么如何减少这些层级之间的数据中转呢?英伟达GPU Direct Storage(存储直连 GPU技术)就是这一思路的代表之一。GDS是一套数据路径优化技术,不是让CPU完全退出,而是让数据传输路径更短。CPU或主机软件栈仍负责发起和管理I/O请求,但数据可以通过DMA传输,减少CPU内存中转,从而降低CPU开销、降低延迟并提升吞吐。
这类技术也表明AI负载对数据读取越来越敏感,以及SSD数据传输速度的重要性。近期业内围绕英伟达和亚马逊云推出的GPU直接存储访问(GIDS,由GPU侧发起存储访问)讨论,进一步把这一思路向前推进。如果这类方式在未来能成熟,GPU对SSD资源的调用可能会更快。
这类场景对SSD的要求会明显提高,靠近GPU就会更看重随机读取、低延迟、稳定QoS、高并发和系统适配。比如高并发推理、长上下文任务、部分KV Cache分层和加速计算应用,都更接近这个方向。
方向二、同步强化CPU侧需求,让GPU更专注计算
不是所有企业AI架构都会立刻走GPU直接访问SSD的方向。还需要考虑实际成本问题,因此更现实的路线是让CPU服务器、存储、网络和软件系统承担更多外围工作,让GPU更专注训练和推理。
一次AI推理请求包括用户请求接入、权限判断、数据脱敏、RAG检索、向量数据库查询、上下文拼接、结果存储、日志记录和业务系统回写等。这些工作大多会发生在CPU侧或数据服务层。
想让GPU处理最核心的训练和推理任务,就要把更多调度、检索、预处理、缓存和数据管理工作放到CPU服务器或是存储系统上。这样一来,为了承担更多的数据组织和调度功能,则会拉动CPU服务器需求增加。
如果CPU侧服务器承载RAG检索、向量数据库、缓存、日志、索引管理和业务数据预处理等任务,就需要本地或近端SSD支撑高并发读写和稳定访问。以RAG为例,它整体上更偏大容量存储需求,但其中的热点数据、索引和向量数据库也需要一定随机读性能和稳定响应,因此需要高性能SSD与大容量SSD协同。
因此,SSD未来需求不只来自GPU通路,也来自CPU侧数据服务层的扩展。AI推理正在重新分配GPU、CPU和SSD的工作。
存储涨价放大SSD需求细分
这两条路线最终都会提高系统对企业级SSD的依赖,但指向的不是同一种SSD能力。
越靠近GPU,越需要高性能。越靠近数据底座,越需要大容量和成本效率。处在CPU侧数据服务层,则既需要一定性能,也需要容量和稳定性。
今年无论消费级还是企业级存储涨价都不是什么新鲜事。2026年5月,TrendForce指出,全球云服务商在2026年一季度显著增加企业级SSD需求,主要来自AI服务器基础设施对高速传输和大容量存储的需求,同时传统HDD结构性短缺也推动部分订单转向QLC企业级SSD。1
这也意味着,AI对SSD的拉动同时发生在高性能和大容量两个方向。而价格上行会让企业更重视把SSD放在合适的位置。如果都选择最高性能SSD,长期成本会过高,如果所需的推理链路中只补充低成本容量,系统效率又可能受影响。
存储涨价也会放大错误配置的代价,倒逼企业按数据存储层级选择SSD。由此可见,AI推理规模化正在把SSD推向AI存储架构的核心圈层,而高性能与大容量的分工,将成为企业构建AI数据基础设施的重要逻辑。
面对HBM之下的分层需求,不同类型的企业级SSD要选对位置。以闪迪企业级SSD布局为例,SANDISK® SN861 NVMe SSD更适合承接靠近计算侧的高性能数据通路,面向低时延、高随机读和稳定响应需求;SANDISK® SN670 NVMe SSD则更适合面向AI数据湖、数据准备和大规模数据沉淀等存储密集型场景,强调大容量、高能效和总体成本控制。
1.资料来源:
https://www.trendforce.com/presscenter/news/20260525-13058.html
本文来源于DOIT传媒,文章内容仅供参考,不构成投资建议。
评论列表