智能体时代算力新图景：鲲鹏与昇腾共筑全栈创新底座

当前AI模型迭代进入周级节奏、多模态与Agent原生成为主流，Token经济快速落地，产业正加速迈向Agentic AI智能体时代。面对大模型训练推理、智能体自主决策带来的全新算力挑战，鲲鹏与昇腾依托芯片、架构、软件与生态的持续创新，为开发者与千行百业打造更高效、更开放、更易用的算力底座。

昇腾：超节点重构训推范式，开源开放走向好用易用

大模型规模从千亿稠密走向万亿稀疏，对集群规模、通信效率与系统可靠性提出极高要求，超节点已成为应对大规模算力需求的关键选择。昇腾是业内最早提出并实现超节点规模化商用的算力平台，384超节点已在互联网、金融、能源、教育等行业批量落地，依托灵衢高速互联实现统一内存编址，训练效率最高达传统集群3倍，推理吞吐达到业界单卡4倍。

芯片层面，昇腾950系列持续突破，作为国内唯一支持FB4、FB8数据格式的AI芯片，互联带宽提升至2TB，算力与内存容量全面升级，可充分支撑万亿参数模型训练与推理。

软件层面，CANN全面开源开放，安装包体积大幅降低78%，算子、通信、图引擎等核心能力全面向社区开放，同时支持PyTorch、TileLang等多种编程范式，实现主流开源模型0day适配，让昇腾平台从可用走向好用、易用。昇腾坚持将技术特性贡献至全球开源社区，深度兼容主流训练框架，目前已服务5000余家企业，成为国产大模型训推的核心底座。

昇腾专家明确指出，KV Cache对带宽与时延要求极高，外挂存储受消息语义开销限制难以满足需求，优先在节点内采用内存语义访问更具优势，超节点架构凭借统一内存编址能力，是支撑KV Cache高效运行的理想方案。

昇腾专家进一步说明，昇腾以全面开源开放为长期目标，通过分层解耦设计开放Runtime、驱动、编程语言与编译能力，兼顾新手易用性与资深开发者深度定制需求，持续降低适配与迁移门槛，助力国产AI底座自主创新并参与全球标准共建。

鲲鹏：通算智算协同发力，夯实智能体硅基黑土地

智能体时代让通算与智算的协同变得前所未有的重要，CPU在AI业务端到端流程中承担的任务占比高达40%–90%，直接决定时延与用户体验。鲲鹏在国内ARM服务器市场份额领先，国产化算力占比超70%，广泛服务于运营商、金融、政府、互联网、生命科学等关键领域，支撑300多个核心应用稳定运行。

面对新的产业趋势，鲲鹏坚持扎根硅基黑土地，以硬件创新与全栈软件开源开放为核心方向。芯片持续迭代演进，鲲鹏950已规模上量，下一代产品将分高性能单核与多核高密两条路线；920增强型在单核性能与内存效率上显著优化，可有效降低用户部署成本。

依托灵衢互联技术，鲲鹏推出通算超节点，实现内存与设备池化管理、高带宽低时延访问与统一编程，在数据库、云服务虚拟化、互联网搜推广、金融低时延交易等场景实现大幅性能提升，已与头部企业开展联合创新。软件层面，鲲鹏围绕openEuler、openGauss、openFuyao持续构筑竞争力，面向智能体重点打造沙箱、记忆管理与安全可信能力，为各类Agent提供稳定高效的运行环境。

鲲鹏专家表示，内存池化的核心是灵衢协议提供的内存语义直接访问能力，而非简单资源整合，灵衢协议已对外开放，生态正逐步完善；通过外接控制器兼容现有设备与灵衢原生支持属于不同技术路线，现阶段难以实现同等效率与体验，未来将持续推进灵衢生态普及，让更多设备受益于池化能力。

在被问及CPU对AI推理集群的重要性时，鲲鹏专家强调，优秀CPU通过单核性能、核存比与核宽比优化、低时延互联等能力，支撑Agent编排、调度、KV Cache管理等关键环节，是保障AI集群整体效率与用户体验的核心基石。

生态与开发者双轮驱动，共迎智能体时代新机遇

面向高校、中小企业与独立开发者，鲲鹏与昇腾持续降低技术门槛，强化生态赋能。鲲鹏开发者数量已接近400万，未来将进一步扩大与高校的合作，拓展智能基座覆盖范围，搭建创新平台鼓励前沿技术探索。昇腾则通过Skill体系、全流程工具链与完善的技术文档，让开发者可快速完成模型迁移、算子开发、性能调优与推理部署，同时以算子挑战赛激发创新活力。

在智能体时代，鲲鹏与昇腾将继续以芯片架构创新、超节点系统革新、全栈软件开源协同，为开发者提供高效易用的开发平台，与全行业携手迈向智能计算新未来。