智能体时代算力新图景:鲲鹏与昇腾共筑全栈创新底座

当前AI模型迭代进入周级节奏、多模态与Agent原生成为主流,Token经济快速落地,产业正加速迈向Agentic AI智能体时代。面对大模型训练推理、智能体自主决策带来的全新算力挑战,鲲鹏与昇腾依托芯片、架构、软件与生态的持续创新,为开发者与千行百业打造更高效、更开放、更易用的算力底座。

昇腾:超节点重构训推范式,开源开放走向好用易用

大模型规模从千亿稠密走向万亿稀疏,对集群规模、通信效率与系统可靠性提出极高要求,超节点已成为应对大规模算力需求的关键选择。昇腾是业内最早提出并实现超节点规模化商用的算力平台,384超节点已在互联网、金融、能源、教育等行业批量落地,依托灵衢高速互联实现统一内存编址,训练效率最高达传统集群3倍,推理吞吐达到业界单卡4倍。

芯片层面,昇腾950系列持续突破,作为国内唯一支持FB4、FB8数据格式的AI芯片,互联带宽提升至2TB,算力与内存容量全面升级,可充分支撑万亿参数模型训练与推理。

软件层面,CANN全面开源开放,安装包体积大幅降低78%,算子、通信、图引擎等核心能力全面向社区开放,同时支持PyTorch、TileLang等多种编程范式,实现主流开源模型0day适配,让昇腾平台从可用走向好用、易用。昇腾坚持将技术特性贡献至全球开源社区,深度兼容主流训练框架,目前已服务5000余家企业,成为国产大模型训推的核心底座。

昇腾专家明确指出,KV Cache对带宽与时延要求极高,外挂存储受消息语义开销限制难以满足需求,优先在节点内采用内存语义访问更具优势,超节点架构凭借统一内存编址能力,是支撑KV Cache高效运行的理想方案。

昇腾专家进一步说明,昇腾以全面开源开放为长期目标,通过分层解耦设计开放Runtime、驱动、编程语言与编译能力,兼顾新手易用性与资深开发者深度定制需求,持续降低适配与迁移门槛,助力国产AI底座自主创新并参与全球标准共建。

鲲鹏:通算智算协同发力,夯实智能体硅基黑土地

智能体时代让通算与智算的协同变得前所未有的重要,CPU在AI业务端到端流程中承担的任务占比高达40%–90%,直接决定时延与用户体验。鲲鹏在国内ARM服务器市场份额领先,国产化算力占比超70%,广泛服务于运营商、金融、政府、互联网、生命科学等关键领域,支撑300多个核心应用稳定运行。

面对新的产业趋势,鲲鹏坚持扎根硅基黑土地,以硬件创新与全栈软件开源开放为核心方向。芯片持续迭代演进,鲲鹏950已规模上量,下一代产品将分高性能单核与多核高密两条路线;920增强型在单核性能与内存效率上显著优化,可有效降低用户部署成本。

依托灵衢互联技术,鲲鹏推出通算超节点,实现内存与设备池化管理、高带宽低时延访问与统一编程,在数据库、云服务虚拟化、互联网搜推广、金融低时延交易等场景实现大幅性能提升,已与头部企业开展联合创新。软件层面,鲲鹏围绕openEuler、openGauss、openFuyao持续构筑竞争力,面向智能体重点打造沙箱、记忆管理与安全可信能力,为各类Agent提供稳定高效的运行环境。

鲲鹏专家表示,内存池化的核心是灵衢协议提供的内存语义直接访问能力,而非简单资源整合,灵衢协议已对外开放,生态正逐步完善;通过外接控制器兼容现有设备与灵衢原生支持属于不同技术路线,现阶段难以实现同等效率与体验,未来将持续推进灵衢生态普及,让更多设备受益于池化能力。

在被问及CPU对AI推理集群的重要性时,鲲鹏专家强调,优秀CPU通过单核性能、核存比与核宽比优化、低时延互联等能力,支撑Agent编排、调度、KV Cache管理等关键环节,是保障AI集群整体效率与用户体验的核心基石。

生态与开发者双轮驱动,共迎智能体时代新机遇

面向高校、中小企业与独立开发者,鲲鹏与昇腾持续降低技术门槛,强化生态赋能。鲲鹏开发者数量已接近400万,未来将进一步扩大与高校的合作,拓展智能基座覆盖范围,搭建创新平台鼓励前沿技术探索。昇腾则通过Skill体系、全流程工具链与完善的技术文档,让开发者可快速完成模型迁移、算子开发、性能调优与推理部署,同时以算子挑战赛激发创新活力。

在智能体时代,鲲鹏与昇腾将继续以芯片架构创新、超节点系统革新、全栈软件开源协同,为开发者提供高效易用的开发平台,与全行业携手迈向智能计算新未来。

鲲鹏昇腾开发者大会2026(KADC2026)将于5月22日—23日在北京举办,以心怀挚爱,共绽光芒为主题,汇聚全球开发者、技术专家、生态伙伴与行业领袖,聚焦芯片架构、超节点、灵衢互联、开源生态与AI创新实践,打造一场集前沿技术、实战体验、生态共建于一体的年度科技盛典。