生成式 AI 驱动的数据基础设施重塑

有研究机构 Silicon Angle 指出,生成式 AI 浪潮正推动数据中心加速转型,从传统架构迈向更具加速性与可扩展性的新阶段,催生出类似“AI 工厂”的先进数据中心形态。

这些数据中心的技术栈正在经历从以通用 CPU 为核心向以 GPU 为中心的加速计算系统转变,架构更加贴合 AI 需求,专为并行操作优化,旨在满足新一代 AI 工作负载及大规模 AI 吞吐需求。

在此背景下,数据中心的存储架构逐步呈现出解耦趋势——高性能 I/O 层依托 NVMe 与并行文件系统,执行检查点与分片读取操作。非活跃数据则存入成本更低的对象存储,主要保存数据集与模型。归档层则专注于存储版本谱系和快照。为确保 GPU 的高效利用率,超高性能数据 mover 会预加载数据,优先处理小文件与元数据,保障整体数据流畅性。

大多数企业级组织更倾向于通过 OpenAI、Anthropic PBC 等公司或云服务商构建的 API 与软件对接 AI 应用,而非自建 AI 工厂。这类模式的优势在于其软件层可以不去关注底层源代码与复杂工具,不过如果涉及专有或敏感数据,企业也可能选择部署微型 AI 工厂以增强安全性与控制力。

从存储系统视角,多家厂商在构建 AI 工厂方面的优势:

DDN:与英伟达及 AI 计算服务供应商关系密切,且获得黑石集团 3 亿美元私募股权投资,用于 AI 开发。

戴尔科技:拥有全面的硬件产品与 AI 数据平台,其“闪电计划”为 PowerScale 和 ObjectScale 存储系统引入并行访问能力,以满足 AI 与 HPC 对高性能、高并发、低延迟存储的需求。

NetApp:拥有 AFX 分布式阵列和 AIDE 软件。

HPE:通过 Alletra Storage MP 实现存储计算解耦,并具备支持 AI 所需的计算与网络能力。

Hitachi Vantara:AI 相关产品频频释出消息,但尚未推出分布式存储。

IBM:紧密围绕大型机客户群开展 AI 战略部署。

Pure Storage:通过 FlashBlade//EXA 实现分布式架构,并倡导以 AI 为中心的数据集管理。

VAST Data:打造 AI 操作系统与 DASE 存储架构,保持技术领先。

WEKA:依赖神经网格与增强内存网格实现高速数据传输,尽管上层 AI 数据堆栈尚未明显推进。

闪迪:在 FMS 2025 展示了 256TB 容量的 DC SN670 NVMe SSD,采用 BiCS8 QLC NAND 闪存与 UltraQLC 技术,面向 AI 场景深度优化,树立超大容量闪存新标杆。

西部数据:凭借 HAMR(热辅助磁记录)技术提供大容量存储,助力 AI 工厂高效管理海量数据。

此外,Cloudian、MinIO、Scality 等对象存储厂商正加快布局,将 S3-over-RDMA 纳入核心功能,并将 AI 数据管道能力纳入技术路线图。数据保护领域,主流供应商亦纷纷发力,增加 AI 数据管道功能,并推出 AI 数据网络弹性解决方案。

最后

存储与数据保护厂商正围绕 AI 场景深度优化其架构与能力,催生出一场全方位的数据基础设施重塑浪潮。这场变革不仅涉及技术迭代,更重塑了企业构建与运用 AI 的方式,存储系统将在未来AI工厂中发挥关键性作用。

更多AI存储话题内容,欢迎锁定2025年11月18日即将在北京召开,以“释放数据潜能,加速智能涌现”为主题的2025中国数据与存储峰会,敬请期待!