华为李义:突破·共进,鲲鹏引领算力新征途

[中国,上海,2025年9月18日] 数字时代奔涌向前,算力正成为重塑产业格局的核心力量。在华为全联接大会2025——鲲鹏计算产业峰会上,华为鲲鹏计算业务总裁李义发表《突破·共进,鲲鹏引领算力新征途》主题演讲。

华为鲲鹏计算业务总裁李义

以下为演讲全文:

各位来宾,大家下午好!

六年来,鲲鹏以突破性创新和持续开源开放,引领通用算力迈入全新阶段。感谢学界专家、行业客户及合作伙伴的一路同行。鲲鹏始终聚焦根技术,助力伙伴打造优质产品,并与各界共同推进计算产业生态建设,已在政务、运营商、金融、互联网、气象、制造等领域实现广泛应用。目前,鲲鹏已与7000多家伙伴合作孵化超过20000个解决方案,openEuler开源操作系统累计部署超1260万套,openGauss开源数据库下载量达480万次。

坚持硬件开放,伙伴无界创新,鲲鹏无处不在

鲲鹏坚持硬件开放战略,以主板、部件与模组等形式,助力伙伴推出多样化产品。13家OEM伙伴推出300余款产品,50多家KPN伙伴基于鲲鹏模组开发80多款产品,全面覆盖数据中心与边缘计算业务场景。今天,我们将带来更多新产品,持续赋能伙伴无界创新。

1、鲲鹏920软硬协同,使能行业规模商用

鲲鹏920能力进一步提升:性能上,通过IO增强与KAE加速,全面提升处理能力;安全方面,支持virtCCA与PCIPC,降低应用接入安全环境的成本,扩展安全域至xPU,保护端云协同推理场景的数据安全,实现即插即用即安全;可靠性上,支持内存镜像,增强系统韧性。通过鲲鹏“一码多芯,同辕开发”,鲲鹏920在各行业应用场景表现卓越,已广泛应用于千行百业关键业务系统。

2、发布全球首款通用计算超节点TaiShan 950 SuperPoD

采用新一代鲲鹏服务器,依托华为自研灵衢互联协议,TaiShan 950 SuperPoD具备超低时延、超大带宽和内存池化能力,同时可分可合,通过线缆连接即可实现超节点构建,不改变通用服务器形态、不改变机房部署形态,实现资源池化共享与高效通信,释放极致算力,使能大数据、数据库、虚拟化与容器云等通用场景及搜推广、证券极速交易等行业场景性能跃升。以数据库为例,通过构建数据库全局Buffer Pool,解耦数据库计算与内存,支持数据库多主架构,从而有效消除写性能瓶颈,提升写扩展能力。此外,通过超大容量内存借用、大带宽与内存低时延访问及内存语义等创新技术,可实现大数据Spark数据处理时延降低30%+、提升虚拟化与容器云资源利用率提升70%,搜推广在线推荐请求处理时延降低40%,证券极速交易报文处理时长缩短至百纳秒级。

鲲鹏基础软件:全面使能灵衢互联,通算智算场景能力全面提升

1、鲲鹏基础软件全面支持灵衢

鲲鹏基础软件全面使能灵衢,聚焦超节点异构算力融合,驱动通算智算业务场景效能跃迁:openGauss发布了灵衢亲和的高性能数据库,也是业界首个开源的多写架构数据库oGRAC。基于灵衢的低时延全局事务一致性内存共享能力,TPCH测试数据处理时间节省50%;openFuyao代码仓库此次正式全面开源,支持灵衢互联设备极简接入K8s容器生态,结合在离线业务混部等能力使资源利用率提升20%;openEuler实现支持超节点的异构融合操作系统,通过设备池化统一管理,资源可按需匹配灵活组合,达成系统高性能、高资源利用率,充分发挥算力优势;毕昇编译器兼容主流语言生态,针对大数据、数据库等关键场景进行灵衢编译优化,性能可提升20%

2、鲲鹏软件全面开源开放 让鲲鹏创新技术触手可及

2019年至今,鲲鹏坚持软件开源,已经陆续开源openEuler操作系统、openGauss数据库、openUBMC算力设备管理软件、openFuyao算力集群软件,以及毕昇JDK、GCC for openEuler等多款编译器。今年,我们将进一步多年积累的解决方案优化实践开源,包括鲲鹏BoostKit应用使能套件、鲲鹏统一并行编程KUPL,以及三款编译器:GCC for openEuler、LLVM for openEuler和高性能图编译器ANNC。

· 鲲鹏BoostKit:面向数据中心主要场景陆续全面开源,使能场景极致性能

鲲鹏BoostKit通过充分运用ARM特有的指令集以及鲲鹏KAE等硬件加速能力,发挥硬件算力潜能,助力伙伴和客户打造极具竞争力的水平解决方案。在今年9月,我们首批开源大数据加速软件。后续将陆续开源其他场景及基础加速组件,便于客户和开发者更自主、便捷地集成使用,实现更优演进与维护体验。欢迎访问鲲鹏社区BoostKit开源专区获取最新信息。

· 高性能计算:统一并行编程框架KUPL全面开源

高性能计算作为鲲鹏持续深耕的算力高地,始终以卓越性能、高可靠性与极致易用助力科研与产业数智化升级。为充分释放算力,鲲鹏统一并行编程KUPL将全面开源,实现“一套框架、统一语言”开发,覆盖科学及智能计算,发挥鲲鹏众核与向量/矩阵加速优势,帮助企业与开发者降低使用门槛、提升研发效率。在实际落地中,电磁仿真LASPCEM通过GEMM优化,使能矩阵加速,应用性能提升8倍;生命科学领域,AlphaFold2基于KUPL优化共享内存通信,使能向量/矩阵加速,多进程并行优化,对比主流GPU性能提升80%。

· 鲲鹏DevKit :AI加持实现智能化迁移、开发与调优

鲲鹏DevKit全新推出AI插件,结合大模型构建鲲鹏本地知识库,通过自然语言交互实现智能问答、迁移流程自动执行、源码迁移与优化等功能,显著降低技术门槛,提升开发与迁移效率。

一码多芯 同辕开发联合构筑行业场景化解决方案

六年来,鲲鹏与行业软件伙伴持续联合创新,为千行万业用户提供更高效、可靠的行业应用与解决方案。今年,我们进一步深化同辕开发计划,基于全新鲲鹏DevKit和鲲鹏BoostKit,通过一套代码、一条流水线构建多平台版本,面向行业场景提供出厂即用、开箱即优的行业场景化解决方案,实现平均开发效率提升30%,应用性能提升30%以上,助力用户应用在鲲鹏平台上运行更高效、更稳定。

一路走来,鲲鹏的成长离不开学界、客户与伙伴的持续支持。通过携手共建,我们已形成覆盖硬件、基础软件、水平软件与行业应用的鲲鹏产业生态。从数据中心到边缘计算,硬件伙伴持续创新,开发出丰富的产品;操作系统、云、虚拟化、大数据、数据库、存储与中间件等水平软件与鲲鹏深度适配、协同优化;行业客户与伙伴支撑鲲鹏在关键业务场景全面落地,与鲲鹏一同高效、稳定地服务千行百业。

今天,作为坚实的世界第二算力底座,鲲鹏将与各位继续坚定同行,共赴新程,为世界提供新选择!