迁移应用怕性能损失?优化找不到方向?这本「实战指南」把答案和代码都给你了。
上海交通大学网络信息中心副主任、计算机学院博士生导师林新华教授携新作《算力珠玑:鲲鹏昇腾应用开发案例详解》亮相华为全联接大会 2025 并举办签书会。该书由林新华、王一超、管海兵共同主编,人民邮电出版社出版发行,围绕鲲鹏与昇腾两大自主计算生态,系统梳理了基于自主算力平台的应用开发与优化路径,旨在为开发者提供兼具理论高度与实践深度的技术参考。
当前,全球算力竞争持续深化,掌握自主计算技术已成为推动产业升级与科技创新的关键。然而,开发者在将应用迁移至鲲鹏、昇腾等平台的过程中,常面临架构适配难、性能优化门槛高等现实挑战。《算力珠玑》一书以「理论结合实践」为定位,聚焦实际开发痛点,通过十个来自真实场景的典型案例,深入解析从传统主流平台至自主算力平台的代码迁移、性能调优及算子开发等全流程关键技术,助力开发者提升开发效率,降低迁移成本。
在鲲鹏平台应用案例中,本书聚焦高性能计算场景,展示如何通过架构感知优化释放算力潜能。以上海交通大学研发的 SuperMan 多体构型仿真软件为例,该软件用于自主大飞机气动仿真,需在多节点协同环境下完成复杂流体力学计算。开发团队针对鲲鹏采用的集群化多核架构,设计了负载均衡策略与动态任务调度机制,有效减少跨集群通信开销,实现计算效率的近线性扩展。在分子动力学软件 LAMMPS 的优化案例中,则通过 MPI 并行结合 NEON 向量化技术,显著提升分子间作用力的计算吞吐量。此外,在新材料模拟领域的 PPCG 与 CheFSI 本征值求解器优化中,书中详解了如何通过毕昇编译器与鲲鹏专用数学库突破第一性原理计算的性能瓶颈。

在昇腾平台方面,本书重点阐释 AI 模型训练与推理的端到端优化方案。针对视频生成大模型 Open-Sora Plan,开发团队采用稀疏注意力机制、「数据桶」批处理策略以及自适应异常检测方法,在昇腾平台上实现训练速度的显著提升。在船脸识别应用的部署案例中,则通过关键算子的深度优化,如 BatchNorm2d、SiLU 和 MaxPool2d 在 MindSpore 框架下的高效实现,全面提升模型在昇腾 NPU 上的推理性能与精度。此外,书中还介绍了基于联邦学习的风机故障诊断系统在昇腾平台上的隐私保护与协同训练方案,体现其在边缘计算场景中的实用价值。

在每个案例的介绍中,不仅涵盖应用背景,还深入讲解核心算法,细致剖析代码移植过程及性能优化策略等内容,全方位呈现基于鲲鹏和昇腾平台的应用迁移优化实践过程。通过这种方式,帮助读者从案例背景出发,深入理解研究思路,直至明晰应用效果,系统掌握鲲鹏和昇腾平台在各行业的应用实践要点。



《算力珠玑》不仅是一部技术著作,更是推动自主算力生态建设的重要实践总结。该书依托鲲鹏昇腾科教创新卓越中心,将卓越中心的科研团队在自主算力应用开发中的一线经验,转化为可复用的方法论,为高校科研人员、企业工程师及广大开发者提供了扎实的学习资料和实战指南。随着鲲鹏、昇腾生态的持续完善,书中所汇集的案例经验有望在材料科学、航空航天、人工智能、工业诊断等领域发挥更广泛的示范效应,推动自主算力技术真正实现「用好用活」,为我国在全球算力竞争中夯实基础、积累动能。