AICC 2025开放智算中心技术创新论坛召开:GW级智算中心工作组成立,全产业链共探算力基础设施革新

近日,作为2025人工智能计算大会(AICC 2025)的核心分论坛之一,由OCP中国社区与中电标协OCTC联合主办的“开放智算中心技术创新论坛”在北京圆满落幕。

论坛以“筑基·开放·燎原”为核心导向,聚焦GW(吉瓦,也即百万千瓦级)级开放智算中心(Open AIDC)的技术突破与产业落地,汇聚阿里云、百度、中国移动、快手、世纪互联、电子标准院、浪潮信息、广东省连接器协会、立讯技术、安澜万锦、亿纬锂能、中航光电等12家产业链核心企业与机构代表,共同参与“GW级开放智算中心OCP中国社区小组”成立仪式,并围绕智算基础设施的异构计算、高速互连、散热、供电和备电等关键领域展开深度研讨,为全球AI算力密集型发展阶段提供“中国方案”。

重磅启动:GW级开放智算中心工作组成立,构建全球协同创新生态

随着OpenAI、xAI、微软、阿里等AI领军企业加速布局GW级智算中心,国内AI产业对高密度、低时延、绿色化算力基础设施的需求愈发迫切。论坛开篇即迎来核心议程——“GW级开放智算中心OCP中国社区小组”成立仪式,阿里云、百度、中国移动、快手、世纪互联、电子标准院、浪潮信息、广东省连接器协会、立讯技术、安澜万锦、亿纬锂能、中航光电等12家创始成员单位代表共同上台启动工作组,标志着我国在GW级智算中心标准化建设与全球生态协同领域迈出关键一步。

OCP中国社区负责人、论坛主持人叶毓睿介绍,该工作组是OCP全球“Open Systems for AI”战略倡议在国内的延伸与互补,将重点聚焦三大方向:一是以场景驱动为核心,结合国内智能体爆发、超大规模应用落地等领先优势,突破智算基础设施技术瓶颈;二是推动跨域协同,既覆盖不同领域的算力需求,也支持跨数据中心的AI资源调度;三是构建从技术标准到测试认证的完整产业闭环。

“中国在实体产业的场景丰富度、清洁电力(光伏、风电、水电占比超50%)、高压直流输电网络等方面具备独特优势。”叶毓睿强调,工作组将先期完成框架白皮书的编制,计划推动高速互连等AI组件,以及超节点方案等纳入OCP国际标准,让中国智算方案成为全球开放计算生态的重要组成部分。

作为对标OCP国际生态的国内社团组织,中电标协OCTC长期聚焦数据中心基础设施标准化研制与推广应用,过往已联合产业链企业取得显著成果,例如将液冷整机柜标准从团体标准推进至国家标准报批阶段,并同步配套研发液冷部件、零部件相关国标,为国内智算基础设施技术规范化奠定基础。

针对GW级开放智算中心发展趋势,OCTC秘书长陈海强调OCTC将积极配合OCP中国社区,深度参与GW级开放智算中心OCP中国社区小组的前瞻技术攻关与研究,核心目标是推动国内成熟的智算解决方案与技术 “走出去”,融入全球开放计算生态。在OCP框架下,联合产业链伙伴探索由中国牵头的技术路线,提升国内产业在全球智算基础设施领域的话语权,实现从“参与国际标准”到“主导中国方案输出”的跨越,让“中国OCTC成员”身份成为国际合作中的重要技术标识。

技术深探:从集群到组件,全产业链破解GW级智算痛点

论坛期间,来自产业链上下游的8位技术专家先后登台,分享GW级智算中心建设中的实践经验与前沿探索,覆盖算力集群架构、高密液冷、新型能源、高速互连、备用电源等核心环节,展现我国智算基础设施技术的全维度突破。

算力集群:突破“剪刀差”与异构生态难题

中国移动研究院网络与IT技术研究所副所长张晓光率先带来主题为“面向大规模集群的新型智算创新实践”的报告。他指出,当前智算集群面临两大核心挑战:一是集群有效算力无法随规模线性提升,二是异构算力“资源墙”和弹性使用问题。对此,中国移动提出OISA卡间互联协议,将互联规模从8卡提升至128卡,点对点带宽从50-60G增至800G,时延从几十微秒降至几百纳秒;同时推出“芯合”算力原生平台,通过异构算力中间件实现“一次开发、多平台迁移”,已支持“2类异构CPU+9家厂商XPU”,应用热迁移时间小于20秒,CUDA应用源码转译效率超95%,百亿参数模型跨五家厂商混合训练加速比超95%。

张晓光还透露,中国移动正推动智算中心“三个统一”标准——基础设施(机柜、供电、制冷)统一、超节点基线能力统一、系统逻辑架构统一,为GW级集群建设奠定基础。

开放计算:加速GW级AIDC基础设施创新

浪潮信息开放计算产品线总经理Bean Zhang以“开放计算加速GW级AIDC基础设施创新发展”为主题,深入剖析开源开放趋势下智算中心的技术演进路径。他指出,当前AI算力需求呈指数级增长。据麦肯锡报告预测,2025-2030年全球AI算力基础设施投资将达5.2万亿美元,新建设施带来的电力增量将达125GW,约相当于雅江下游水电站满负荷供电的两倍。在此背景下,开放计算成为降低算力成本、加速技术落地的关键。

针对AI芯片功耗激增(当前普遍突破1千瓦,2028年预计突破3千瓦)与超大规模集群需求,Bean Zhang分享了浪潮信息的两大核心突破:一是推出MW级泵驱两相液冷整机柜方案,通过微纳米尺度仿生结构、绿色低压冷媒、瞬态多参数协同调控等技术,实现单芯片3000瓦散热能力,200颗AI芯片负载跳变时流量分配偏差低于10%、温度偏差低于2度;二是研发超节点AI服务器“元脑SD200”,基于自研Open Fabric Switch实现64路国内GPU高速互联,通过远端GPU虚拟映射技术将显存扩展至4TB,支持万亿参数大模型训练与多开源模型并行运行,已率先实现商用。

“GW级AIDC建设需要全产业链协同。”Bean Zhang表示,浪潮信息将联合工作组成员,推动超节点架构、液冷标准、算力调度等领域的开放创新,助力中国方案纳入国际标准体系。

高密制冷:液冷技术从“适配”到“引领”

百度智能云与快手分别从厂商与用户视角,解读液冷技术在高密智算场景的落地突破。百度智能云AI架构师武正辉分享“昆仑芯片超节点-百度天池高密液冷整机柜”实践,该方案采用21英寸机柜设计,支持64张GPU卡高密度部署,通过模块化供电、风冷/液冷兼容CDU(冷水机组),实现单机柜交付效率提升数倍,且运维时可实时监控GPU负载与故障状态。“针对模型‘装不下、算不尽’的问题,超节点通过高带宽互联域实现显存共享,时延较行业平均水平降低50%。

快手IDC系统架构师杨琪则聚焦液冷痛点,提出“风液同源”架构与产品化解决方案:将冷源侧水泵、真空脱气等设备集成于一体,实现快速部署;室内侧采用侧走管与分集水器设计,解决传统地板下走管的运维难题。他特别强调,液冷连接器的“责任界面认定”与软管材质寿命(当前EPDM软管寿命8年,需适配数据中心10-15年生命周期)是行业亟待解决的共性问题,快手正联合产业链推动标准化。

高速互连:从铜缆到光互联,突破传输性能边界

江苏安澜万锦电子股份有限公司技术总监张军萍与立讯技术产品管理部高级经理金龙,分别从高速线缆与机柜互联方案维度,解读GW级智算中心的“传输命脉”技术。

张军萍以“高速互连传输线缆在GW级智算中心的应用和发展趋势”为主题,详细介绍了不同速率线缆的技术演进与产业现状。她指出,当前全球高速线缆需求呈爆发式增长,2023-2025年安澜万锦相关产品交付金额翻番,其中224G线缆占比从2023年的0飙升至2024年的60%,2025年预计达70%。从技术层面看,线缆结构已从单层绝缘优化为双层绝缘、实心绝缘升级为发泡绝缘,导体从单芯挤出演进为双芯共挤,通过这些优化可提升信号传输性能与抗干扰能力。

针对下一代448G线缆的研发挑战,张军萍提出三大方向:一是新材料突破,如优化镀银铜导体表面粗糙度、研发低Dk/Df值绝缘材料(目标将FEP的Df值从万分之四降至万分之一的可能性)、探索石墨烯铜与新型屏蔽材料;二是工艺革新,如实现双芯共挤发泡绝缘、研发喷涂式屏蔽工艺替代传统包带;三是测试能力升级,推动测试带宽从67GHz提升至120GHz。“安澜万锦已推出448G线缆样品,测试到110GHz时衰减性能平滑,期待与产业链协同验证,加速技术落地。”张军萍强调。

立讯技术金龙则聚焦“超节点机柜互连解决方案”,指出当前超节点发展呈现“更高速(224G普及、448G标准制定中)、更高密(单机柜GPU从16卡增至128卡)、更大规模”三大趋势。针对不同互连场景,立讯技术提供全维度方案:短距互连采用铜缆方案,通过近芯片铜连接取代PCB走线降低损耗;长距互连则结合LPO与光模块,解决10米以上传输难题。同时,立讯技术在机柜互连的高密Cable Cartridge设计上实现X/Y/Z方向3毫米浮动,搭配多级导向结构,确保万根级线缆盲插的可靠性,已支持ETHX超节点等主流架构。

金龙还展望了全光互连趋势,提出“NPC与NPO兼容”的创新思路,通过同一连接器接口支持铜与光两种连接方式,帮助客户根据场景灵活配置,平衡成本与性能。

能源与备电:绿色化与可靠性双轮驱动

世纪互联与亿纬锂能则从能源供给与备用保障维度,提供GW级智算中心的“能源方案”。世纪互联集团高级副总裁、能源创新事业部总经理鲍益指出,GW级智算中心年用电量可达70亿度,相当于一个地县年用电规模,传统供电架构面临“六高”挑战(高电力需求、高闲置、高损耗、高成本、高绿电、高密度适配难)。为此,世纪互联创新提出AI原生“电粒世界(Powerlet Universe)”新物种,并联合清华大学共同发起“SPEAR”全球协同创新倡议。该倡议是在国家新型电力系统的战略指引下,以绿色能源和AI深度融合为核心,面向高质量发展型配电网、主动平衡电力新基建,推出绿电直连、直流微电网、虚拟电厂等创新模式,目标是将数据中心从“单一用电载体”转变为“新型电力系统重要组成部分”。世纪互联正在全力打造超大规模数据中心集群,从Hyperscale 1.0向Hyperscale 2.0升级。

亿纬锂能产品总监贡昀博士则针对备用电源需求,发布BBU(备用电池单元)全面解决方案。该方案通过“材料-电极-结构”三重优化,将单电芯功率密度提升100%,同时通过四重防护(电芯、模组、电柜、系统)实现“零火灾、零蔓延、零中断”。“GW级智算中心断电损失难以估量,BBU可实现毫秒级响应,搭配UPS与储能电站,形成‘瞬时-短期-长期’三级备电体系,”贡昀表示,亿纬锂能还在研发LMX新电池材料体系,能量密度较磷酸铁锂提升10%-20%。

生态聚力:全链条对话打破壁垒,加速技术落地

除技术分享外,论坛设置圆桌讨论环节,12家创始成员单位代表与现场观众围绕“GW级智算中心对城市电网的影响”“铜缆与光互联的未来边界”“液冷温度标准协同”等议题展开热烈互动。

广东省连接器协会秘书长梁宇彤指出,当前国内高速铜缆(224G)应用较海外滞后2-3年,但随着国产GPU芯片突破,2026年后有望进入规模化放量阶段;浪潮信息开放计算产品线总经理Bean Zhang则提出,超节点服务器需突破“更大显存空间、更大互联域、更高计算性能”三大需求,元脑SD200超节点已实现64路GPU互联,支持4TB显存扩展。

结语

本次论坛不仅展现了我国在GW级智算中心技术领域的全产业链优势——从中国移动的互联协议、浪潮信息的超节点AI服务器、百度的液冷整机柜、立讯技术的高速互连,到世纪互联的绿电方案、亿纬锂能的备电技术,还通过工作组的成立搭建了“产学研用”协同平台,架设了开放智算技术“引进来”、“走出去”的桥梁。

未来,随着白皮书编制、测试认证体系建设的推进,我国有望在智算基础设施标准制定中掌握更多话语权,为全球AI产业发展提供绿色、高效、可扩展的“中国样本”。