CXL能否进入AI存储层级?

CXL正在从概念验证走向产品化和真实部署

AI服务器的内存瓶颈正在突显。大模型训练、长上下文推理等场景持续放大服务器对内存容量、带宽和调度能力的需求。围绕AI基础设施的数据层级,也在发生变化。

在HBM、本地DRAM之外,GPU直连存储、高性能企业级SSD、NAND扩展方案正在进入AI数据通路。与此同时,CXL作为一种扩展内存与内存池化技术,也被视为可能进入AI基础设施层级的方案之一。

CXL是一种开放的高速互连标准,基于PCIe物理层发展而来,主要用于连接CPU、内存扩展设备、加速器和其他高速设备。随着标准升级,CXL的能力也从单机内存扩展,逐步走向内存池化、多主机共享和Fabric互连。它的目标不是替代HBM或本地DRAM,而是在保证可接受性能的前提下,提供更灵活的内存容量扩展与资源调度能力。

近期几条海外CXL消息反映了这一趋势——Marvell推出Structera CXL产品线;Panmnesia推进低延迟CXL控制器与Fabric Switch;Meta采用自研CXL ASIC Vistara,在生产环境中复用旧服务器中的DDR4内存。

不过,CXL路线并未形成绝对共识。FADU、群联电子等企业对CXL持谨慎态度,认为AI内存瓶颈未必要通过CXL DRAM池化解决,高性能SSD/NAND同样可以成为重要补充层级。其争议核心不是AI是否需要扩展内存,而是不同类型的数据,究竟应该放在CXL内存池里,还是放在更低成本、更大容量的SSD/NAND层中。

Marvell:从内存扩展到机架级池化

Marvell Structera系列的核心思路,是通过CXL把内存扩展、硬件压缩、近内存计算和机架级池化放到CPU外部完成。

其中,Structera X面向内存扩展,可通过CXL接入更多DDR4或DDR5内存,降低对CPU本地DIMM插槽的依赖。DDR4版本的价值在于,可以复用旧服务器中的内存,为数据中心提供低成本扩容路径。

Structera A则在内存扩展基础上加入近内存计算能力。它在CXL控制器中集成计算核心,使部分数据预处理、数据搬运和压缩处理可以在靠近内存的位置完成,减少数据反复回传主机CPU的开销。

Structera S面向CXL交换和内存池化,目标是把CXL内存资源扩展到机架级,让多台CPU、GPU或加速器共享内存池,并根据不同负载动态分配容量。

也就是说,Marvell不仅要给服务器多加内存,还想让内存从单台服务器的固定资源,变成可扩展、可压缩、可共享和可调度的基础设施资源。

Panmnesia:推动CXL Fabric架构升级

早期CXL设计与PCIe共享物理接口,很多实现沿用了PCIe的层级结构和IP设计。这类设计更像树状拓扑,连接方式相对固定,也可能带来额外缓冲同步和时序管理开销。

Panmnesia的新一代CXL控制器,通过共享缓冲区、减少同步开销和优化内部数据路径来降低延迟。其CXL Fabric Switch引入Port-Based Routing,也就是基于端口的路由方式。

其根据设备端口ID转发数据,能支持更灵活的互联拓扑。换句话说,CXL不只是在CPU下面外挂几个内存扩展设备,还有机会演进为连接CPU、GPU、内存扩展器和加速器的Fabric网络。

Meta:让CXL进入真实生产环境

Meta则展示了CXL在超大规模数据中心中的实际应用方向。

Meta面对的问题很现实——内存供应紧张、DDR5价格上涨,同时旧服务器中存在大量DDR4 DIMM。如果能通过CXL把旧DDR4接入新服务器,就可以用较低成本提升内存容量,并减少服务器替换带来的资源浪费。

但Meta也指出,CXL扩展内存存在带宽低于本地内存、延迟高于本地内存的问题,不是所有工作负载都适合使用。

因此,Meta采用软硬件协同设计。硬件上,自研CXL ASIC Vistara,面向旧DRAM复用、能效和低延迟优化。软件上,通过透明页放置机制,为不同负载配置本地内存和扩展内存比例。对于无法容忍额外延迟的负载,则关闭扩展内存。

这也表明CXL落地不是单纯的硬件问题。真正决定效果的,是系统能否识别哪些数据适合放在本地内存,哪些数据适合放在CXL扩展层。

CXL还需谨慎观望

对CXL保持谨慎观望的当然也有,FADU的态度变化具有代表性。去年12月底有相关报道称,FADU降低了CXL Switch方向投入,原因包括CXL市场发展速度不及预期,以及英伟达NVLink等GPU体系内互连技术在AI集群中更具优势。

也就是说,在GPU服务器和AI集群场景中,CXL能否进入核心内存链路,不只取决于自身技术,也取决于GPU平台、软件生态和系统厂商的采用意愿。

群联电子则代表另一种思路。其观点更强调通过SSD作为DRAM补充和内存扩展,用高容量NAND缓解AI推理和缓存数据存放压力。相比CXL DRAM池化,高性能SSD/NAND在容量成本、供应链成熟度和模块化部署方面具备优势。

因此,CXL与SSD/NAND之间可能存在的是AI数据通路中的数据争夺。不过,CXL更偏向需要内存语义、较低延迟和资源池化的数据。SSD/NAND更适合容量更大、成本更敏感、可接受更高访问延迟的数据。但目前数据层级是模糊未定的。

最后

CXL正在从概念验证走向产品化和真实部署。Marvell展示了完整产品线,Panmnesia推进CXL Fabric架构,Meta证明了超大规模数据中心存在实际需求。

但谨慎观点也提醒我们,SSD/NAND、高IOPS SSD、GPU直连存储、NVLink以及未来HBF等路线,同样会参与AI数据通路的重构。

我认为CXL能否在AI存储/内存层级中真正占据一席之地,最终取决于四类力量的选择——超大规模云和互联网公司是否大规模部署,GPU/AI加速器平台是否支持,服务器/OEM/ODM厂商是否能提供稳定系统,高数据密度行业用户是否愿意在真实业务中采用。

2026年8月26日,全球闪存峰会将在武汉召开举行,聚焦以闪存和内存芯片为核心的存储器产业生态,覆盖存储制造、控制器、固态硬盘、闪存系统、闪存应用等全产业链。其中,CXL技术论坛也将同期举办,欢迎大家来到武汉,线下了解 CXL 技术的最新进展与应用实践,共同探讨CXL在未来AI存储与内存层级中的定位与价值,敬请期待!

本文来源于DOIT传媒,文章内容仅供参考,不构成投资建议。

赞 ()

相关推荐

发表回复

评论列表

点击查看更多

    联系我们

    微信:百易小助手

    邮件:contact@doit.com.cn

    工作时间:周一至周五,9:30-18:30,节假日休息

    微信