导读
11月6日,2025世界互联网大会乌镇峰会现场,中科曙光揭开了全球首个单机柜级640卡超节点scaleX640的神秘面纱。这不仅是一个技术产品的发布,更是对当前AI算力瓶颈的强力突破。
在人工智能驱动全球产业格局重塑的当下,算力基础设施能否跨越从“技术可行”到“商业可用”的鸿沟,成为规模化落地的关键。

中科曙光高级副总裁李斌表示,scaleX640超节点的推出承载双重关键意义:一是通过开放架构创新突破算力瓶颈;二是支撑前沿大模型持续创新,为各行业“人工智能+”打造坚实高效、好用易用的智算基础设施。
文字编辑|宋雨涵
1
从“万卡互联”到“单柜640卡:
AI算力“新宠”
大模型训练正在推动算力集群跑步迈入“万卡协同”时代,传统算力架构已难以满足高效、低耗、大规模协同的AI训练需求。
在scaleX640出现之前,AI算力领域面临着一个核心矛盾:一边是算力中心利用率不足,资源闲置;另一边是中小企业、科研团队为满足碎片化的算力需求四处奔走。这种结构性矛盾暴露了算力资源调度机制缺失、技术适配不足等多重壁垒。
超节点为什么这么火?
超节点技术正是这一背景下的产物。作为英伟达率先提出的Scale Up(纵向扩展)解决方案,超节点凭借其高性能、低成本、高能效等优势,迅速成为全球科技巨头竞逐的“新战场”。
值得一提的是,在算力效率上,超节点架构也展现出独特优势。以GPU集群为例,传统方案中不同节点间的数据交换需要通过外部网络,这会引入网络延迟和带宽瓶颈,并且需要额外的网络设备。而超节点将大量GPU整合在同一机柜内,数据在节点内部直接通信,大大减少了网络开销。
中科曙光通过系统工程创新,实现算、存、网、电、冷的一体化紧耦合系统设计,采用超高速正交架构、超高密度刀片、浸没相变液冷、高压直流供电等创新技术,实现了软硬件协同的全局优化。
1
超高速正交架构:
scaleX640采用了独特的“一拖二”高密架构,在单机柜内同时部署两套完整的计算系统,实现了16个主板的紧密集成。每个主板配置40张加速卡,通过高速总线互连,构建了一个大规模、高带宽、低时延的超节点通信域。这种正交架构确保数据在各卡间高速传输,消除了传统集群中因节点互联导致的瓶颈。
2
超高密度刀片
智在有限的机柜空间内,scaleX640通过创新的高密度刀片设计,将640张加速卡集中部署在一个标准机柜中,相比业界同类产品单机柜算力密度提升了20倍。这意味着每立方米机柜空间可容纳的算力是过去的20倍,大幅降低了单位算力的成本和空间占用。
3
浸没相变液冷:
为了解决大规模芯片集群的散热难题,scaleX640采用了浸没相变液冷技术。通过将主板浸没在绝缘冷却液中,利用液体汽化吸热带走热量,实现高效散热。相较传统风冷,液冷能够大幅降低温度和噪音,提高系统稳定性。同时,曙光还推出了C7000-F相变间接液冷整体解决方案,首次将相变间接液冷技术实现产品化落地,进一步提升了散热效率和可靠性。
4
高压直流供电:
为了满足高功耗芯片集群的供电需求,scaleX640采用了高压直流供电方案。通过将供电电压提升,减少线路损耗,提高供电效率,从而支撑起如此高密度的计算负载。
5
开放架构与多卡兼容
scaleX640超节点采用了AI计算开放架构,在硬件层面支持多品牌加速卡,软件层面兼容主流计算生态。这意味着不同厂商的GPU、AI加速卡可以无缝接入该超节点,无需更换服务器平台。同时,软件上兼容NVIDIA CUDA等主流框架,降低了开发者的使用门槛。这种开放兼容的设计为国产智算集群构建提供了新范式,推动产业链从单点创新走向生态协同。
2
中科曙光640卡单机柜超节点
系统级创新的三重突破
scaleX640的超凡之处在于其实现了三重突破:密度突破、性能突破和生态突破。
密度方面,scaleX640采用“一拖二”高密架构设计,实现了单机柜640卡超高速总线互连,构建了大规模、高带宽、低时延的超节点通信域。单机柜算力密度比业界同类产品提升20倍,这堪称智算基础设施的一次“密度革命”。
性能方面,相比传统方案,scaleX640可实现MoE万亿参数大模型训练推理场景30%-40%的性能提升。通过30天+长稳运行可靠性测试验证,可保障10万卡级超大规模集群扩展部署。
生态方面,scaleX640采用AI计算开放架构,在硬件层面支持多品牌加速卡,软件层面兼容主流计算生态,构建了一个“软硬协同、生态兼容”的国产智算新范式。
3
超节点竞赛:
全球巨头角逐的新战场
超节点作为智能算力时代的新兴领域,吸引了全球科技巨头和国内厂商的竞相布局。目前,国际上英伟达等公司已在超节点领域取得领先地位,而中国企业也在加速追赶,形成了一定的竞争格局。
国际方面,英伟达是超节点技术的先行者和引领者。
英伟达早在2019年就推出了DGX SuperPOD方案,将数百张GPU集中于一个数据中心模块,通过NVLink交换机和高速网络连接,实现接近线性的算力扩展。随后,英伟达不断完善其超节点生态,包括发布新一代GPU芯片(如A100、H100)和NVSwitch互联技术,以及配套的软件优化。
除了英伟达,AMD和谷歌等公司也在探索超节点技术。
AMD在推出MI250/MI250X GPU时,也提供了用于多GPU互联的Instinct NVLink交换机,支持8-16卡GPU服务器的高速连接。谷歌则自研了TPU Pod,将数百颗TPU芯片连接成一个集群,用于训练其大规模AI模型。这些国际巨头的参与,使得超节点技术不断演进,同时也加剧了全球范围内的算力军备竞赛。
国内方面,在国家政策支持和市场需求驱动下,一批科技公司和科研机构积极投入超节点技术的研发,呈现出百花齐放的态势。
华为
今年3月,华为正式推出了Atlas 900超节点,开启了华为AI超节点的征程。在2025世界人工智能大会上,华为首次展示了昇腾384超节点真机。
9月18日,华为全联接大会2025上,华为展出全液冷数据中心AI超节点Atlas 950 SuperPoD,并发布了“全世界最强算力集群”——Atlas 950 SuperCluster和Atlas 960 SuperCluster超节点集群,算力规模分别超过50万卡和达到百万卡,拉开算力“百万卡”时代的序幕。
此外在在2025人工智能计算大会上,浪潮信息基于元脑SD200超节点AI服务器交出了一份亮眼成绩单——推动DeepSeek R1大模型的token生成速度大幅提升至仅需8.9毫秒,创造了国内大模型最快token生成速度纪录。
与此同时,燧原科技的云燧ESL超节点系统,在测试中表现出良好性能,单节点最高64卡全带宽互联,采用液冷方案,目标是高性价比、高密度、高能效。
沐曦发布的旗舰GPU曦云C600,则支持MetaXLink超节点扩展技术。中国企业在超节点领域的全面开花,标志着AI基础设施的竞争已从单点突破升级为系统工程级的生态较量。
写在最后:
在国家“东数西算”等工程的推动下,国内将出现更多超大规模智算中心和超节点集群,形成百花齐放的竞争格局。中科曙光scaleX640的发布,标志着中国企业在全球智算基础设施赛道上已经具备了系统级创新的能力。
随着“东数西算”工程的深入推进,算力资源调度机制逐步完善,一个既自主可控、又开放共赢的算力新生态正在形成。
可以预见,在不远的将来,“超节点”将成为数据中心和智算中心的标配单元,中国也将凭借自身的技术优势,在全球智能计算版图中占据重要地位。让我们拭目以待吧!





