近日,天翼云基础架构事业部(操作系统技术部)智算网络创新实验室取得重要突破:以第一单位身份完成的两篇智算网络基础设施论文,同登计算机网络领域国际顶级会议IEEE INFOCOM 2026。这是天翼云在智算网络领域的研究成果首次获得中国计算机学会(CCF)A类顶级会议权威背书。研究成果已在多个生产集群中稳定运行,有效支撑了AI训练、超算仿真等对“超低时延、超高带宽”有严苛需求的业务场景,构建了“自研技术—解决业务痛点—规模商用落地—凝练学术成果”的完整闭环,成功实现了从产业实践到学术前沿的双向跨越。
IEEE INFOCOM作为全球通信与网络领域的标志性顶会,长期位列CCF-A类会议榜单,代表着所属细分领域的全球最高学术水准。其评审体系兼具严苛性与专业性,既聚焦理论创新的前沿性,更强调成果的项目可行性与产业影响力,在学界与业界均享有广泛且高度的认可。
本次INFOCOM的评选竞争尤为激烈。《SF-STACK: Streamlining RDMA for Heterogeneous Telecom Storage》与《Budget-Constrained Federated Bandits for Mobile Applications》从千余份高质量投稿中脱颖而出,成功入选,不仅是国际学术界对天翼云技术创新能力的权威认证,更印证了天翼云紫金智算网络研究“源于实践、解决真问题”的务实基因——研究直面电信级业务场景的真实挑战,相关成果均历经大规模生产环境的检验与锤炼。
自研落地:SF-STACK超融合协议栈,从“行业难题”到“规模商用”的突破
《SF-STACK: Streamlining RDMA for Heterogeneous Telecom Storage》的核心成果——自研SF-STACK超融合协议栈,是天翼云紫金智算网络技术实力的集中体现。该成果的诞生,离不开天翼云对电信级存储集群的深度洞察:当前智算分布式存储场景中,网络配置异构、管理权限分散等问题,已成为高性能网络(RDMA、远程直接内存访问)技术规模化部署的关键挑战。
针对这一痛点,天翼云创新性地将内核态TCP、用户态TCP与RDMA协议深度融合,从根本上解决了传统全连接拓扑“连接爆炸”等问题。SF-STACK经过三年生产环境验证,已应用于紫金DPU云主机、天翼云智算HPFS高性能文件存储、XSSD超高性能云硬盘等核心产品中。实测数据显示,SF-STACK部署后,存储业务IO访问性能相比传统TCP/IP协议栈提升100%,端到端网络时延降低60%。系统同时可稳定支持高达20万可靠连接,为开放异构的算力场景,提供了高吞吐、高并发、低时延的核心技术保障。

图1 SF-STACK系统架构图
该论文在国际学术界首次系统梳理了电信级存储服务的技术特征,并完整呈现了天翼云在异构环境中大规模部署RDMA的实战经验,涵盖资源调度、成本控制与运维优化等关键环节,为全球行业提供了经过生产验证的落地方案。
协同创新:不止于存储智算网络,跨域调度全面布局
《Budget-Constrained Federated Bandits for Mobile Applications》,则聚焦智算网络跨域协同的核心痛点。针对分布式学习中“资源受限、数据隐私保护”的双重需求,天翼云首次将带预算约束的线性老虎机模型引入联邦学习,提出高效算法FedUCBwK。

图2 FedUCBwK系统架构图
该算法通过统一策略更新阈值,在保障原始数据不泄露的前提下,实现了“收益最大化、开销最小化”的平衡。从理论层面证明其通信与计算复杂度仅为对数级,真实数据集实验中性能持续优于现有方法,为智算网络中资源敏感型分布式任务(如边缘AI调度、跨域协同训练)提供了可证明、高可靠的算法支撑。
未来,天翼云将持续加强智算网络基础设施的自主研发,推动学术成果向产品竞争力的高效转化,围绕“技术坚实、落地可靠”构建天翼云紫金智算网络高性能底座,为数字中国高质量发展贡献国云力量。







