华为首创“3+1”AI数据平台,提升企业AI推理体验

原标题:华为发布AI数据平台,全面重塑AI数据基础设施

3月2日,在MWC26巴塞罗那期间,华为数据存储产品线总裁袁远在产品与解决方案发布会上正式发布AI数据平台。通过提供知识生成与检索、KV Cache加速、记忆萃取与召回三大能力和UCM(Unified Cache Manager)推理记忆数据管理技术,AI数据平台可搭建起智能体与商业价值间的关键桥梁,助力推理应用落地。

华为数据存储产品线总裁袁远发表演讲

当下,大多模型尚未深入运营商核心业务,其原因在于行业普遍“重训练、轻推理”。而推理才是AI应用落地的关键。为解决推理业务中幻觉频发、响应体验不佳及推理记忆缺失的瓶颈,华为首创“3+1”AI数据平台,针对知识、KV Cache和记忆进行存储与优化,并通过UCM技术实现调度与管理,助力用户推理体验提升。

| 知识库提供高精度多模知识,让检索更精准

在智能查询场景中,该技术通过多模无损解析、Token级编码等方式,将文本、图片、视频等资源转化成海量细粒度的知识,结合多维度检索与比对,实现超95%检索准确率。

| PB级KV Cache容纳海量历史数据,让推理更高效

在AI客服场景中,该技术不仅能在单次对话时大幅扩展上下文窗口,还能在多轮对话中复用历史KV Cache,避免重复计算,实现首Token时延降低90%,模型响应速度显著提升。

| 记忆库提供上下文记忆管理,让模型越用越聪明

在商业数据洞察场景中,该技术可精准萃取历史数据与经验,并沉淀成可召回的记忆。记得更多,推理就更精准,便可实现“越用越聪明”的持续进化。

| UCM推理记忆数据管理技术,全生命周期管理与调度记忆数据

通过三层缓存架构,对知识库、KV Cache和记忆库进行分级管理与智能调度,进一步优化推理能力。

本次发布的AI数据平台可提供一体化和分离式两大部署模式。一体化部署以OceanStor A800为底座,集成上述能力,同时兼具极致性能与灵活扩展性;分离式部署采用“数据引擎节点+OceanStor Dorado”架构,可在现有系统上新增数据引擎节点,保护历史投资,支撑业务平滑转型。

“华为将继续深耕技术创新,以AI数据平台为桥梁,让模型能力真正转化为可落地的商业价值,推动智能技术加速进化,共赴智慧未来。”袁远表示。