并行科技张小琼:基于用户视角的算力服务和算力网服务

随着大模型训练、工业仿真、气象预测等场景对算力需求的爆发式增长,如何让用户高效、低成本地获取适配算力,成为行业亟待解决的关键问题。

在2025全球闪存峰会期间召开的“AI智能体与行业应用”分论坛上,北京并行科技股份有限公司高级方案架构师张小琼基于用户视角,对算力服务与算力网服务的实践路径展开了系统性阐述,为行业发展提供了重要参考。

算力服务的发展背景与行业现状

算力需求的爆发并非偶然,而是技术革命与产业升级的必然结果。从应用层面看,AI大模型的参数规模从百亿级跃升至千亿级,训练一次需消耗数万卡时;工业仿真领域,车企的碰撞测试、气动分析需每秒数十亿次的计算支撑;生命科学中,基因测序的数据处理量年均增长50%,这些场景共同构成了算力需求的“刚需池”。

IDC数据显示,2021至2026年,中国智能算力规模的复合增长率将达52.3%,到2026年将突破1271.4 EFLOPS,而通用算力的复合增长率为18.5%,呈现出“智算领跑、通用跟进”的格局。

面对激增的需求,不同类型的算力供应商采取了差异化策略。国家超算中心聚焦尖端科研,服务于探月工程、气象模拟等“国之重器”项目;云计算厂商则通过规模化部署,满足中小企业的通用算力需求;而并行科技等专业服务商则另辟蹊径,以用户视角重构服务逻辑,将算力从“资源租赁”升级为“全流程服务”。这种转型的核心在于,用户需要的不仅是硬件资源,更是“能完成计算、能快速计算、能低成本计算”的解决方案——这也成为算力服务行业的发展共识。

值得注意的是,算力的本质并非传统意义上的资源业,而是服务业。正如并行科技所提出的,早期的算力租赁类似“租车”,用户需自行承担闲置风险;而成熟的算力服务则像“专车”,不仅提供硬件,还包含调试、优化等增值服务。这种定位转变,推动行业从“卖资源”向“卖服务”转型。

智算用户需求的精准满足路径

面向智算用户的多元化需求,并行科技构建了以“应用运行特征”为核心的服务体系,其关键在于解决三个问题:如何让不同芯片适配应用、如何通过实证增强信心、如何通过方法论实现降本增效。

智算芯片的生态适配存在显著差异。英伟达凭借成熟的软件栈,在移植、调试、优化等环节的工作量最小;国产芯片如昇腾、海光虽在硬件性能上追赶迅速,但生态适配需投入更多精力——从“跑起来”到“跑得快”,再到“跑得划算”,每个阶段的工作量呈阶梯式增长。并行科技通过建立跨芯片测试矩阵,帮助用户选择最优方案:例如某AI企业的推理场景,在4090与5090的对比中,后者性能提升1.5倍,性价比提高1.4倍,最终选择5090实现成本优化。

为增强用户信心,并行科技以真实场景的优化结果为依据。例如某1300亿参数模型训练,优化前GPU利用率仅75%,节点间通信带宽未达瓶颈,存在明显优化空间。通过调整CPU负载分配、优化GPU算子调度,最终GPU利用率提升至95%,性能提高40%,相当于节省40%的成本。类似案例还包括B200与H200的对比:在13B Llama模型训练中,B200性能达H200的2.62倍,虽价格更高,但综合性价比反而更优。

超算应用运行特征方法论是服务的核心工具。该方法通过采集GPU利用率、显存带宽、NVLink通信等20余项指标,绘制“应用运行特征雷达图”,快速定位瓶颈类型(计算密集型、访存密集型等),再针对性优化。目前已覆盖计算化学、环境科学、影视动漫等10余个行业,形成可复用的“行业特征图谱”。例如在工业仿真中,ANSYS应用的瓶颈在于内存带宽,通过升级DDR5内存,计算效率提升30%。

ParaSelect服务:算力选型的智能解决方案

ParaSelect服务是并行科技基于应用运行特征的精准选型工具,其核心价值在于让用户“用对算力、用好算力”。该服务通过四步流程实现闭环:首先明确应用场景(训练/推理、模型参数、精度要求等);其次采集关键特征(Tensor Core利用率、PCIe带宽等);再通过回归模型预测性能,误差率可低至1.9%;最后输出最高性能与最高性价比方案。

以某10B模型训练为例,ParaSelect预测其在H20平台的性能为21.56 samples/s,实测值为21.2 samples/s,误差仅1.7%。这种高精度预测源于特征设计的科学性——选取Tensor Core算力、显存带宽等4个核心参数,通过均方根误差最小化训练权重系数,确保不同平台的性能可比。

基于ParaSelect,并行科技打造了“算力买手模式”。该模式整合全国17个智算中心、12个超算中心的资源(2万卡GPU、200万核CPU),像“滴滴调度车辆”一样匹配算力。用户只需提供应用描述,系统便会自动推荐方案:例如千级卡训练需求,匹配某智算中心的B200集群,测试通过后直接调度资源;中小规模推理则推荐5090集群,平衡性能与成本。这种模式解决了用户“找资源难、选资源盲”的痛点,实现算力的“按需分配、即取即用”。

发展历程与未来愿景

凭借18年的技术积累,并行科技在中国高性能计算市场已形成独特的竞争优势。据沙利文报告,2021年并行科技在通用超算云业务的市场份额达20.3%,位列独立服务商第一,服务覆盖高校、科研院所、企业等全类型客户,构建了从“尖端科研”到“产业应用”的全场景服务能力。

并行科技成立于2007年,十八年来专注于超算与智算服务,2023年在北交所上市(股票代码:839493),是国家级专精特新“小巨人”企业。公司愿景是“助力科技强国,让计算更简单”。这一愿景的核心在于“普惠算力”——通过算力网整合分散资源,降低科研与企业的计算门槛。

从超算到智算,从资源到服务,并行科技以用户视角重新定义了算力服务的内涵。在数字经济加速演进的今天,这种“以用为核心”的理念,或许正是破解算力供需矛盾的关键所在。

【根据速记整理,未经本人审定】