单芯片工艺受限又如何,全球领先集群算力拿来吧你!

 导读

2025年9月18日,在上海举行的华为全联接大会2025上,华为轮值董事长徐直军发表了题为“以开创的超节点互联技术,引领AI基础设施新范式”的主题演讲,正式发布了全球最强算力的“超节点”产品以及由其构成的大规模算力集群

徐直军在演讲中强调,算力过去是、未来也将继续是人工智能发展的关键,尤其对于中国的人工智能而言更是如此。基于中国现有可获得的芯片制造工艺,华为正努力打造“超节点+集群”的算力解决方案,以满足持续高速增长的AI算力需求。

文字编辑|宋雨涵

1

全球最强“超节点+集群”

深度解读其内涵

“超节点”:逻辑上的单一超级计算机

华为提出的“超节点”概念,是指由多台物理服务器通过高速互联紧密耦合而成的一个逻辑上的单一计算节点。虽然在物理上由多台机器组成,但通过先进的互联和协同技术,这个超节点可以像一台超级计算机那样统一地进行机器学习、思考和推理。简单来说,超节点实现了大规模分布式硬件在软件层面的高度集成与协同,让成百上千个计算单元如同一个整体般高效运作。

在此次大会上,华为发布了最新一代的AI超节点产品——Atlas 950 SuperPoD和Atlas 960 SuperPoD。其中,Atlas 950 SuperPoD可支持多达8192张昇腾AI加速卡,Atlas 960 SuperPoD则支持高达15488张昇腾卡。

这两款超节点在总算力、内存容量、互联带宽等关键指标上均处于全球领先地位,在未来多年都将是世界上算力最强的超节点。发布了两款重磅超节点产品,代表当前全球最高算力水平:

产品型号Atlas 950 SuperPoDAtlas 960 SuperPoD
支持昇腾卡数量8192张15488张
FP8算力8 EFLOPS30 EFLOPS
FP4算力16 EFLOPS60 EFLOPS
互联带宽16.3 PB/s34 PB/s
机柜数量160个未披露
典型性能训练:491万tokens/秒<br>推理:1960万tokens/秒未披露
上市时间已发布2026年

Atlas SuperCluster超级集群

基于上述超节点,华为进一步构建了规模更为庞大的超级集群系统:

  • Atlas 950 SuperCluster:由64个Atlas 950 SuperPoD组成,包含超过52万张NPU,总算力达524 EFLOPS FP8,华为宣称其性能将超过Elon Musk的xAI Colossus和NVIDIA即将推出的NVL576部署方案。
  • Atlas 960 SuperCluster:计划于2027年推出,预计将达到2 ZFLOPS FP8的算力规模,定位为全球最强算力集群。

2

“灵衢”互联协议:

突破大规模互联瓶颈

要将成千上万台服务器、数十万颗芯片整合成一个协同工作的整体,高速互联网络是关键中的关键。传统数据中心网络多采用以太网或InfiniBand交换机级联,随着节点数量增加,网络延迟和带宽瓶颈会愈发明显。

华为此次发布的“灵衢”(UnifiedBus)高速互联协议,正是为了解决大规模AI集群的互联难题。灵衢协议是一种面向超节点的全新互联架构,它采用了跨机柜全光互联技术,将传统的电信号互联升级为光互联,大幅提升了带宽并降低了延迟。

据介绍,灵衢2.0在Atlas 950 SuperPoD中实现了34 PB/s的总互联带宽。这意味着集群内部任意两个计算节点之间都能以接近“无限带宽”的方式通信,数据在超节点内的传输几乎不受瓶颈限制。

同时,全光互联避免了传统电缆传输中的信号衰减和电磁干扰问题,使延迟降低到极致。华为宣称,灵衢互联的速度比当前互联网骨干网快了一个数量级,在连接数千颗加速器时依然能够保持可靠的高速低延迟通信。这种“网络即总线”的设计,使得整个超节点如同拥有一个全局共享的高速总线,所有计算单元都可以像访问本地内存一样高效地交换数据。

更值得称道的是,华为选择开放灵衢2.0的技术规范,邀请产业链伙伴共同参与生态建设。这意味着未来其他厂商也可以基于灵衢协议开发光模块、交换芯片、网卡等相关产品,从而形成一个围绕高速互联的开放产业生态。

在当前全球科技竞争加剧的背景下,华为的这一举措显示出战略眼光:通过开放标准来壮大自身生态,既可降低对外部技术的依赖,又能吸引更多合作伙伴,共同做大中国自主的AI基础设施蛋糕。灵衢协议的推出和开放,有望逐步打破美国厂商在高端数据中心互联领域的垄断,为中国乃至全球的算力网络提供一个新的选择。

3

产业影响:

重塑AI算力版图

华为此次发布的“超节点+集群”算力方案,在全球AI产业界引发了巨大震动,其影响将是多方面的:

长期以来,美国企业在AI芯片和算力基础设施领域占据主导地位,英伟达的GPU几乎成为AI训练的代名词。然而,华为的Ascend昇腾芯片和Atlas超算方案正迅速崛起,打破了这一格局。凭借Atlas 950/960 SuperCluster所展示的算力实力,华为已经站到了全球AI算力金字塔的顶端。这不仅提升了中国在全球AI竞赛中的话语权,也让其他国家看到了除美国方案之外的另一种可能。

其次,它加速了中国AI产业的自主化进程。在中美科技摩擦背景下,获取最先进的半导体工艺和芯片受到限制,这一度被认为是中国AI发展的短板。然而华为通过“以规模补性能”的创新路径,成功绕开了部分限制,用现有工艺实现了世界领先的算力水平。

这极大地提振了中国科技界的信心:即便在高端芯片制造上暂时落后,也可以通过系统创新和协同优化来弥补差距。此次发布的超节点和集群,其核心部件(如昇腾芯片、鲲鹏CPU、灵衢互联等)均为国产自主设计,标志着中国在AI基础设施核心技术上的自主可控取得了重大进展。这将进一步带动上下游产业链的发展,包括国产芯片制造、光通信器件、基础软件等领域,形成良性循环。

华为的方案在架构上大胆创新,将原本用于超级计算机的大规模并行技术引入商用数据中心领域,开创了“超节点”这一新的基础设施形态。这一创新可能引发行业的跟随和模仿,促使更多厂商探索通过系统级架构创新来提升算力的方法。例如,全光互联、液冷高密度集成、软硬件深度协同等技术,未来有望在业界得到更广泛的应用。

未来展望:华为的算力雄心

面对此次发布的震撼成果,华为对未来充满信心。徐直军表示,依托全球最强算力的超节点和集群,华为有能力为人工智能的长期快速发展提供可持续且充裕的算力支持。

按照华为公布的Ascend昇腾芯片路线图,其新一代AI芯片Ascend 950、960系列将在2026-2027年陆续推出,每代芯片的算力性能都将实现倍增。同时,华为计划将Atlas超节点集群规模在2027年扩展到百万卡级别,届时算力规模相比目前又将实现数量级的提升。可以想见,华为的算力版图将随着芯片迭代和集群扩张而不断壮大,持续巩固其在AI算力领域的领先地位。

华为在发布会上也明确了自身的战略定位:做智能世界的“黑土地”,即专注于打造底层的算力基础设施和平台,让各行各业的AI应用在上面生根发芽。这意味着华为未来将更加开放合作,联合产业伙伴共同繁荣AI生态。

例如,通过“灵衢”开放生态,华为希望吸引更多厂商参与高速互联技术的研发;通过MindSpore开源AI框架和ModelArts平台,华为正打造从芯片、框架到应用的全栈开放生态。在可预见的未来,华为将继续加大研发投入(2024年研发投入达1797亿元人民币,占收入20.8%),在先进芯片设计、新型计算架构、基础软件等方面持续攻关,以保持技术领先优势。