亮剑!华为全联接大会2025公布未来三年昇腾产品路线图,全球最强算力的“超节点”和集群来了

导读

2025年9月18日,在上海举行的华为全联接大会2025上,华为轮值董事长徐直军发表了题为“以开创的超节点互联技术,引领AI基础设施新范式”的主题演讲。

他在演讲中旗帜鲜明地指出:“算力,过去是,未来也将继续是人工智能的关键,更是中国人工智能的关键。”。基于这一理念,徐直军正式发布了华为昇腾AI芯片未来三年的产品路线图,以及一系列面向AI时代的创新成果,包括全球最强算力的“超节点”和集群解决方案,引发业界高度关注。

文字编辑|宋雨涵

1

华为昇腾芯片路线图全景:

从950到970的三年规划

在全球人工智能竞赛日趋激烈的背景下,算力被视为决定胜负的核心要素。徐直军选择在此时公布华为昇腾芯片的详细规划,无疑是向外界传递出明确信号:华为正加速构建自主可控的AI算力底座,以应对不断增长的AI需求。这一举措不仅回应了国内对高端AI芯片的迫切期待,也展示了华为在逆境中通过技术创新实现突破的决心。

徐直军在大会上公布了华为昇腾AI芯片未来三年的产品规划路线图,清晰地描绘了从2026年至2028年的产品发布节奏。根据规划,华为将陆续推出昇腾950系列(包含950PR和950DT两个型号)、昇腾960以及昇腾970三大系列产品,以满足AI算力爆发式增长的需求。

华为未来三年芯片规划

对于昇腾950PR/950DT:计划于2026年推出,其中950PR将于2026年第一季度率先面世。这两款芯片是昇腾910系列的下一代产品,定位为面向训练和推理的高性能AI加速芯片。据介绍,昇腾950系列将支持更低精度的数据格式和增强的向量计算能力,并将芯片间互联带宽提升2.5倍,以适应大模型训练对高带宽低延迟通信的需求。

华为昇腾950系列芯片架构

值得一提的是,950PR将采用华为自研的高带宽内存(HBM)技术,以显著提升推理预填充(Prefill)阶段的性能,特别有利于推荐系统等应用;而950DT则着重提升推理解码(Decode)性能和训练性能,并进一步扩大内存容量和带宽。

昇腾950PR

而950DT则着重提升推理解码(Decode)性能和训练性能,并进一步扩大内存容量和带宽。

昇腾950DT

据徐直军介绍,华为昇腾芯片的演进将围绕“算力一年翻一番”的目标来推进,并兼顾更易用、更多数值类型支持、更高互联带宽等方向持续改进。这表明华为不仅追求绝对算力的提升,也注重提升芯片的软件生态友好性和系统集成能力,使昇腾芯片能够更好地适配多样化的AI应用场景。

2

“超节点+集群”:

以架构创新弥补单芯片差距

正如徐直军所言,美国制裁导致华为无法采用最先进工艺制造单颗芯片,使其单芯片算力与英伟达等存在差距。但华为凭借三十多年在联接技术上的深厚积累,通过架构创新打造“万卡级超节点”,依然能够提供世界最强的算力。这一策略被业内视为中国科技企业在高端芯片受限下实现“弯道超车”的关键路径。

在本次大会上,华为正式发布了最新一代超节点产品——Atlas 950 SuperPoDAtlas 960 SuperPoD。其中,Atlas 950 SuperPoD可支持8192张昇腾加速卡组成一个超节点,Atlas 960 SuperPoD则可支持多达15488张昇腾卡。这两款超节点在总算力、内存容量、互联带宽等关键指标上全面领先业界现有产品,在未来多年都将是全球算力最强的AI超节点。基于这些超节点,华为进一步构建了超节点集群:Atlas 950 SuperCluster集群的总算力规模超过50万张卡,而Atlas 960 SuperCluster更是达到了百万张卡的规模,堪称“全世界最强算力集群”。如此庞大的算力集群,将为大规模AI模型训练和复杂应用提供充裕的、可持续的算力支撑。

华为之所以能够实现万卡级的超大规模AI计算,得益于其在高速互联技术上的突破。徐直军透露,华为基于三十多年在联接领域的技术积累,自主研发了面向超节点的互联协议——灵衢”(UnifiedBus)。

灵衢协议创新性地解决了大规模集群互联的技术难题,实现了超节点内部各计算节点之间的高速、低延迟通信,从而让整个超节点像单一计算机般高效运行。

据介绍,灵衢协议的最新版本2.0已经开放技术规范,华为欢迎产业界伙伴基于灵衢协议研发相关产品和部件,共同构建开放的“灵衢生态”。这种开放合作的态度,有助于加速超节点技术的普及,推动整个行业的创新。

值得注意的是,华为的“超节点+集群”方案并非仅适用于AI训练领域。徐直军宣布,华为率先将超节点技术引入通用计算领域,推出了全球首个通用计算超节点——TaiShan 950 SuperPoD。该超节点结合华为GaussDB分布式数据库,能够彻底取代传统大型机、小型机以及Exadata等数据库一体机,成为各类大型商用系统的新选择。这意味着,华为正将其在AI超算领域的架构创新拓展到更广泛的企业级计算场景,为客户提供高性能、高可靠且可扩展的通用算力解决方案。

3

通算与AI融合:

鲲鹏芯片同步演进

除了AI加速芯片,华为在通用计算芯片领域也有长远布局。徐直军在大会上同步公布了华为鲲鹏通用处理器的路线图,以配合AI时代对通用算力的需求。根据规划,华为将推出鲲鹏950和鲲鹏960两款新一代通用CPU,分别计划于2026年第四季度和2028年第一季度上市。这两款芯片将围绕支持超节点架构、更大核心数、更高单核性能的方向持续演进。

鲲鹏950作为下一代通用CPU,预计将在核心规模和性能上相比上一代鲲鹏930有显著提升。据业内消息,鲲鹏950可能采用更加先进的制程工艺(尽管受限于制裁,具体工艺节点尚未公布),核心数有望从当前的64核提升到96核甚至更高,并支持双线程超线程技术,以提供更强的并行处理能力。同时,鲲鹏950将针对超节点架构进行优化设计,使其能够更好地与昇腾AI芯片协同工作,在大规模分布式计算场景下发挥出整体效能。

鲲鹏960则是面向2028年的旗舰通用CPU,定位为高性能和高核数两个版本:高性能版本预计拥有96核心/192线程,着重提升单核性能(目标是较上一代提升50%以上),面向AI主机、大型数据库等对单线程性能要求极高的场景;高核数版本则计划集成256核心/512线程以上,主打虚拟化、容器云、大数据和数据仓库等需要大规模并发的场景。通过这两种版本,鲲鹏960将实现对不同应用负载的全面覆盖,既满足需要极致单核性能的任务,也满足需要海量并发的任务需求。

结语:拥抱全面智能化时代

徐直军在华为全联接大会2025上的演讲,不仅是一次新品发布,更是华为面向未来的一次战略宣示。通过公布昇腾芯片的三年路线图和“超节点+集群”的创新方案,华为向世界展示了其在AI算力领域的雄心和实力。

对于中国AI产业而言,华为的突破具有里程碑意义。它意味着我们拥有了自主的高端AI芯片和计算架构,能够在新一轮科技革命中掌握更多主动权。在全球科技竞争日趋激烈的背景下,这种自主创新能力弥足珍贵。当然,我们也应清醒地认识到,实现科技自立自强是一个长期过程,需要持续的投入和积累。华为的成功经验告诉我们,核心技术要不来、买不来,只能靠自己干出来。在制裁压力下,华为选择了迎难而上,通过技术创新和生态构建突出重围,这种精神值得整个科技界学习。

展望未来,随着昇腾950、960、970等新一代芯片的陆续推出,以及超节点集群在更多领域的部署应用,我们有理由相信中国将在AI算力领域取得更大的突破。一个算力充沛、技术自主、生态繁荣的AI时代正加速到来。正如徐直军所说:“人工智能已成为对行业发展影响最大的变量”。华为正以自己的方式拥抱这个全面智能化的时代,并将与产业伙伴一道,推动人工智能技术在千行百业的广泛应用,创造更大的价值。