AIIC2026:焱融科技CTO张文涛详解AI存储如何筑牢Agentic AI底座

图片
图片

  2026人工智能基础设施峰会圆满落幕

4月17日,由DOIT主办的“智算筑基,生态共生”2026人工智能基础设施峰会在上海举行。在AI加速迈向智能体(Agentic AI)的关键拐点,存储正从被动承载升级为智能体的 “核心记忆中枢”。在下午举办的存力底座应用论坛上,焱融科技CTO张文涛以AI Storage For Agentic AI为主题,深度解析智能体时代的存储变革、技术趋势与落地实践,提出以存算协同重塑存储栈,携手产业共筑支撑AGI发展的高性能、高性价比存力底座。


Agentic AI 范式跃迁:存储成为智能体 “海马体”







图片







当前AI正从被动交互的大语言模型,向自主感知、规划执行、闭环迭代的Agentic AI进化。以OpenClaw为代表的智能体,如同具备任务目标的数字员工,可完成复杂推理、多工具调用与持续学习,彻底颠覆传统 “一问一答” 模式。

智能体的闭环能力高度依赖高效记忆体系:短期记忆需低延迟、高吞吐,长期记忆需海量语义检索与快速召回。存储不再只是 “数据容器”,而是决定智能体决策效率的海马体。传统通用存储架构面临严峻挑战:



  1. 多路并发与超长上下文:海量Token与KV Cache快速膨胀,易撑爆GPU显存,数据在HBM、内存、本地盘、G3.5/G4层频繁搬运,造成算力严重浪费;

  2. 随机检索与文件遍历:智能体深度挖掘历史数据时,传统分布式存储性能瓶颈导致 “思考卡顿”;

  3. 记忆生命周期管理:新记忆生成与旧信息遗忘需智能分层,否则将陷入 “高成本” 与 “低响应” 的两难困境。










存算协同成破局关键,英伟达STX指明方向







图片







张文涛指出面对行业痛点,存算协同+协议卸载成为AI存储核心演进方向。英伟达最新发布的STX模块化参考架构,释放明确信号:传统CPU-centric存储已无法适配Agentic AI需求。

STX核心价值在于极致存算分离与协议卸载:依托DPU旁路CPU,将存储服务直抵GPU侧,大幅缩短IO路径,为KV Cache瓶颈、大规模并发访问提供硬件级解决方案。但STX并非 “即插即用”,需上层存储与缓存系统深度适配,才能将硬件红利转化为业务价值。

焱融科技技术路线与英伟达高度契合,以旁路CPU、极致性能为核心,打造全栈AI存储解决方案,让GPU持续 “有数据可算”,充分释放算力潜能。


焱融全栈方案:精准匹配Agentic AI全场景需求


焱融全栈AI存储方案围绕AI数据全生命周期进行的系统化设计,该方案由焱融高性能分布式文件系统YRCloudFile、YRCache推理存储系统,以及DataInsight智能检索与统一数据管理平台组成,覆盖从数据采集、训练与推理加速,到数据治理与持续演进的完整链路。通过统一架构与内在协同,焱融帮助用户构建一套真正连续运转的“AI数据工厂”。
- YRCloudFile+全闪 F9000X:模型训练的强力数据基座
面向AI训练场景,YRCloudFile针对真实AI工作负载深度优化,提供高带宽、高吞吐、低延迟的稳定I/O能力,有效消除瓶颈,保障GPU算力持续高效运行。基于YRCloudFile打造的全闪一体机F9000X,在全球权威基准测试 MLPerf Storage中持续取得领先成绩,验证了其在大规模AI训练场景下的工程成熟度与性能优势。
- YRCache:智能长期记忆底座,推理性能量级提升
焱融YRCache针对KV Cache深度优化,通过多级KVCache架构,将KVCache缓存能力从显存中释放,TTFT和TPOT可降低 97%,token吞吐量提升22倍,中低端GPU性能可对标高端型号,大幅释放算力,降低推理成本。
- Datainsight:全域数据服务,赋能AI生命周期管理
DataInsight是专为海量非结构化数据设计的智能数据管理平台。其打破了异构存储间的数据孤岛,具备百亿级文件规模下的秒级查询能力。通过多维度的目录透视与元数据分析帮助企业全面掌控数据资产,结合强大的动作策略引擎,实现数据从发现、分析到流转(分层、迁移、清洗)的全生命周期自动化编排;支持UI 管理,并可通过API灵活对接第三方AI平台。










落地成果显著:两大标杆案例验证价值







图片







焱融科技AI存储解决方案已在多行业实现标杆落地,以硬核技术实力为AI产业高效发展注入强劲动能。

在某头部大模型厂商大模型训练场景中,焱融存储方案自2019年落地以来,成功攻克存储容量、性能与可靠性多重挑战,稳定支撑超280PB训练数据高效运转,大幅缩短模型训练周期,全面加速大模型研发迭代进程。在金融领域出口信用证智能审单场景中,焱融科技通过YRCache深度优化KVCache管理与数据访问路径,实现Token吞吐量提升30%以上,更将业务响应时间从30秒大幅缩短至13秒,同步提升业务并发度与GPU利用率,让金融AI应用效率实现质的飞跃。

凭借在AI大模型训练、行业智能应用等场景的成熟落地实践,焱融科技持续推动算力基础设施与产业落地深度融合,以高性能、高可靠的AI存储能力,为新质生产力筑牢坚实数字基座。











焱融科技CTO张文涛指出,Agentic AI规模化落地,存储是核心基石;以英伟达STX/CMX 为代表的技术方向,印证存算协同已成为行业必然选择。

面向万亿,十万亿级大模型与多智能体协作时代,焱融科技将持续深耕AI存储领域,以全栈解决方案为产业提供高性能、高可靠、低成本的存力支撑,与生态伙伴携手,夯实AI基础设施,共同托举AGI未来。


本文来源于DOIT传媒,文章内容仅供参考,不构成投资建议。

赞 ()

相关推荐

发表回复

评论列表

点击查看更多

    联系我们

    微信:百易小助手

    邮件:contact@doit.com.cn

    工作时间:周一至周五,9:30-18:30,节假日休息

    微信