AIIC2026：焱融科技CTO张文涛详解AI存储如何筑牢Agentic AI底座

2026人工智能基础设施峰会圆满落幕

4月17日，由DOIT主办的“智算筑基，生态共生”2026人工智能基础设施峰会在上海举行。在AI加速迈向智能体（Agentic AI）的关键拐点，存储正从被动承载升级为智能体的 “核心记忆中枢”。在下午举办的存力底座应用论坛上，焱融科技CTO张文涛以AI Storage For Agentic AI为主题，深度解析智能体时代的存储变革、技术趋势与落地实践，提出以存算协同重塑存储栈，携手产业共筑支撑AGI发展的高性能、高性价比存力底座。

Agentic AI 范式跃迁：存储成为智能体 “海马体”

当前AI正从被动交互的大语言模型，向自主感知、规划执行、闭环迭代的Agentic AI进化。以OpenClaw为代表的智能体，如同具备任务目标的数字员工，可完成复杂推理、多工具调用与持续学习，彻底颠覆传统 “一问一答” 模式。

智能体的闭环能力高度依赖高效记忆体系：短期记忆需低延迟、高吞吐，长期记忆需海量语义检索与快速召回。存储不再只是 “数据容器”，而是决定智能体决策效率的海马体。传统通用存储架构面临严峻挑战：

多路并发与超长上下文：海量Token与KV Cache快速膨胀，易撑爆GPU显存，数据在HBM、内存、本地盘、G3.5/G4层频繁搬运，造成算力严重浪费；
随机检索与文件遍历：智能体深度挖掘历史数据时，传统分布式存储性能瓶颈导致 “思考卡顿”；
记忆生命周期管理：新记忆生成与旧信息遗忘需智能分层，否则将陷入 “高成本” 与 “低响应” 的两难困境。

存算协同成破局关键，英伟达STX指明方向

张文涛指出面对行业痛点，存算协同+协议卸载成为AI存储核心演进方向。英伟达最新发布的STX模块化参考架构，释放明确信号：传统CPU-centric存储已无法适配Agentic AI需求。

STX核心价值在于极致存算分离与协议卸载：依托DPU旁路CPU，将存储服务直抵GPU侧，大幅缩短IO路径，为KV Cache瓶颈、大规模并发访问提供硬件级解决方案。但STX并非 “即插即用”，需上层存储与缓存系统深度适配，才能将硬件红利转化为业务价值。

焱融科技技术路线与英伟达高度契合，以旁路CPU、极致性能为核心，打造全栈AI存储解决方案，让GPU持续 “有数据可算”，充分释放算力潜能。

焱融全栈方案：精准匹配Agentic AI全场景需求

焱融全栈AI存储方案围绕AI数据全生命周期进行的系统化设计，该方案由焱融高性能分布式文件系统YRCloudFile、YRCache推理存储系统，以及DataInsight智能检索与统一数据管理平台组成，覆盖从数据采集、训练与推理加速，到数据治理与持续演进的完整链路。通过统一架构与内在协同，焱融帮助用户构建一套真正连续运转的“AI数据工厂”。

- YRCloudFile+全闪 F9000X：模型训练的强力数据基座

面向AI训练场景，YRCloudFile针对真实AI工作负载深度优化，提供高带宽、高吞吐、低延迟的稳定I/O能力，有效消除瓶颈，保障GPU算力持续高效运行。基于YRCloudFile打造的全闪一体机F9000X，在全球权威基准测试 MLPerf Storage中持续取得领先成绩，验证了其在大规模AI训练场景下的工程成熟度与性能优势。

- YRCache：智能长期记忆底座，推理性能量级提升

焱融YRCache针对KV Cache深度优化，通过多级KVCache架构，将KVCache缓存能力从显存中释放，TTFT和TPOT可降低 97%，token吞吐量提升22倍，中低端GPU性能可对标高端型号，大幅释放算力，降低推理成本。

- Datainsight：全域数据服务，赋能AI生命周期管理

DataInsight是专为海量非结构化数据设计的智能数据管理平台。其打破了异构存储间的数据孤岛，具备百亿级文件规模下的秒级查询能力。通过多维度的目录透视与元数据分析帮助企业全面掌控数据资产，结合强大的动作策略引擎，实现数据从发现、分析到流转（分层、迁移、清洗）的全生命周期自动化编排；支持UI 管理，并可通过API灵活对接第三方AI平台。

落地成果显著：两大标杆案例验证价值

焱融科技AI存储解决方案已在多行业实现标杆落地，以硬核技术实力为AI产业高效发展注入强劲动能。

在某头部大模型厂商大模型训练场景中，焱融存储方案自2019年落地以来，成功攻克存储容量、性能与可靠性多重挑战，稳定支撑超280PB训练数据高效运转，大幅缩短模型训练周期，全面加速大模型研发迭代进程。在金融领域出口信用证智能审单场景中，焱融科技通过YRCache深度优化KVCache管理与数据访问路径，实现Token吞吐量提升30%以上，更将业务响应时间从30秒大幅缩短至13秒，同步提升业务并发度与GPU利用率，让金融AI应用效率实现质的飞跃。

凭借在AI大模型训练、行业智能应用等场景的成熟落地实践，焱融科技持续推动算力基础设施与产业落地深度融合，以高性能、高可靠的AI存储能力，为新质生产力筑牢坚实数字基座。