过去一年,生成式AI和智能体技术突飞猛进,模型规模、多模态能力和自主决策水平不断跃升。与此同时,基础设施层的压力正快速传导至“存储”这一常被忽视的环节。在大模型走向商业化与多场景落地的过程中,存储系统正经历一场由性能边界、架构形态、资源调度共同推动的深刻重构。
生成式AI:从“投喂模型”到“驱动数据闭环”的存储挑战
生成式AI的爆发,首先是一个数据总量与处理方式改变的问题。无论是文本生成、图像合成还是多模态大模型,其底层都依赖海量异构数据和高频访问的存储支持。
过去训练阶段以“顺序读写、离线处理”为主,但今天的大模型迭代更强调:
- 快速并发的数据调用
- 多版本模型的并行训练
- 推理时对多个数据切片的低延迟调用
这意味着:
- 带宽瓶颈突出:数据加载已成为训练与推理的“隐性刹车点”,如大模型热启动时的TB级权重加载,存储如果响应不过来,算力资源只能空转。
- 并发访问压力剧增:多模型并行+多用户接入推理+微调任务叠加,正在突破传统NAS和分布式文件系统的IOPS承载能力。
- 冷热数据管理失衡:训练数据、缓存参数、推理结果、提示词上下文等数据在生命周期上差异极大,需要更敏捷的存储分层与调度策略。
简而言之,生成式AI将“读多写少”的AI存储模型推向极限,高性能、分层调度、低延迟成为基础要求。
智能体时代:从“管模型”到“管行为”的存储重构
如果说生成式AI需要的是“高效的数据加载”,那么智能体时代(Agentic AI)则提出了一个更复杂的命题:“持久、可追溯、可互动”的数据与行为记录系统。
智能体不同于传统模型调用,其核心特征是:
- 长期运行(Long-lived)
- 自主感知与行动(Autonomous)
- 状态持续更新(Stateful)
- 任务交互复杂(Multi-agent collaboration)
这对存储系统提出了四类全新要求:
- 日志型写入负载(Write-intensive)
- 每个Agent的行为过程、状态变更、交互信息都需要持续写入和持久化,形成完整的Agent记忆和行为日志。
- 类似数据库,但量级远高于传统系统,类似“行为级时间数据库”。
- 高频读写混合(Mixed IO)
- 智能体需要频繁读历史信息、写入新决策,数据访问模式呈现高度不规律的“热跳变”特征。
- 版本管理与回溯
- 每一个Agent的状态演进、模型调用、结果评估都需留痕,实现任务可追溯、状态可回滚。
- 协同访问和分布式共享
- 多智能体协同任务下,数据需要在不同Agent间共享,同时保持隔离、并发一致性。
这意味着:传统以“模型调度”为核心的数据架构,必须升级为以“行为持久化与交互协同”为目标的Agent-native存储体系。
未来趋势:AI时代的存储,必须具备哪些“新基建”能力?
结合上述生成式AI和智能体双向演进,我们认为未来AI基础设施中的“存储底座”需具备以下六大核心能力:
高并发低延迟的访问性能
支持上万个模型/Agent的同时调用,读写IOPS数量级需上升两个维度。
横向扩展与云边协同能力
支持大规模并行训练与推理任务的灵活扩展,适配GPU集群与边缘节点部署。
数据分层与生命周期感知
自动识别数据冷热,动态迁移至不同介质(高性能SSD/QLC/磁带等),优化成本与访问效率。
原生多协议支持(对象/块/文件)
同时支撑AI数据湖、推理缓存、日志写入等多种数据类型。
可观测性与智能调度能力
实时掌握数据流动与存储瓶颈,配合AIOps实现资源智能分配。
安全合规与数据主权保护
在多Agent/多模型/跨域部署场景下,确保数据隔离、访问审计与隐私保护。
最后
我们正在步入一个模型不再“冷启动”,而是持续运行、动态演化的AI时代。生成式AI让算力成为焦点,但智能体的兴起正在让“存力”成为关键支柱。
在这个过程中,存储不再只是数据仓库或缓存中转站,而是变成了支撑AI行为逻辑、决策协同与知识记忆的核心基础设施。未来真正强大的AI系统,不仅要拥有强算力,更需要一套“懂行为、会协作、有记忆”的存储体系。
以“释放数据潜能,加速智能涌现”为主题的2025中国数据与存储峰会将于11月18日在北京举行,共探AI时代的数据基础设施演进、存储技术创新、智能应用实践及未来发展趋势,迎接智能时代新机遇。