2025年12月4日,亚马逊云科技发布新一代自研Arm处理器Graviton5以及基于基于该处理器的M9g实例,Graviton5处理器每个核心的性能都提升了25%,而对应的M9g实例性能也提升了高达25%。

Graviton5基于台积电的3nm工艺打造,先进的制程节点,使得Graviton5能够在单个封装内集成惊人的192个物理核心。上一代Graviton4提供96个Neoverse V2核心,而这次则升级到了192个Neoverse V3。

Graviton5单路就能提供192个核心,虽然双路的Graviton4也行,但两者最大的区别在于,后者需要一致性互连结构,它能让两块CPU像访问本地内存一样访问对方的内存,这会带来延迟,而当所有核心都在一个封装,这部分延迟就消失了。
官方资料提到,这种设计将核心间通信延迟降低高达33%,同时提高了带宽。这对于实时游戏、高性能数据库、大数据分析、应用服务器和电子设计自动化 (EDA) 等场景非常有帮助。
开了盖的192核Graviton5,可以继续用风冷散热
尽管工艺很先进,但这么多核心还是会让人担心其散热表现。
Ali Saidi在采访中表示,为了控制温度,保持稳定的性能,Graviton通常都运行在较低的主频之下,这次Graviton5也会继续保持克制。与此同时,它去掉了CPU的金属散热顶盖,而是直接让裸片直接接触散热设备,每少一层都会加快一点热量传递的效率,从而缓解积热现象。


在正式发布环节,亚马逊云科技计算兼机器学习服务产品线副总裁Dave Brown用图片形象地展示了去掉CPU金属散热顶盖的画面,同时也少了一层散热硅脂(TIM-导热界面材料)。最终,在提高散热效率的同时,让CPU散热风扇的功耗降低了33%。

Dave这里展示的是风冷的方案,结合Ali Saidi的介绍可以认为,192核的Gravion5还可以用这种方式继续用风冷散热。遗憾的是,我在大会现场没有看到开了盖的Gravion5,只看到了采用水冷方案的Trn3 UltraServer的计算节点。
内存墙?大可以不用担心
每当核心增多时,很多用户都会想到内存墙的问题。
对此,Ali Saidi介绍则表示,192个核心不会撞上内存墙,因为Graviton5不仅提供了更大的三级缓存,也支持更强的内存子系统。Graviton5把L3缓存提升了5.3倍,相当于Graviton4的2.6 倍,这意味着更少的等待数据延迟和更快的应用程序响应速度。
Graviton4时代,当时主要提升的是每个核心独享的L2 Cache来提升性能,从Graviton3的1MB变成了2MB。作为取舍,L3缓存的提升幅度较小,由于核心数50%的增长,每核心平均拥有的L3缓存有所降低,但当时性能提升的效果很明显。
而现在的Graviton5,核心数翻倍的同时,不仅保留了每核心2MB的独享L2 Cache,L3缓存直接变成5.3倍,每个内核现在能获得高达 2.6 倍的 L3 缓存,更大的三级缓存可以带来更高的性能上限和性能稳定性。
此外,Graviton5采用了升级的DDR5内存,支持最高8800MT/s的内存频率。在新发布的基于Graviton5打造的EC2 M9g中,平均到每个核心可以拿到高达4G的内存容量,与此前的EC2 M8g一样让CPU与内存容量保持1:4的比例。
亚马逊云科技让AI加速计算与通用计算相互成就
2025年,生成式AI是关注度最高的话题,对Graviton这种通用处理器的关注似乎相应的降低了,这看起来很合乎情理。
然而,Ali Saidi则认为,AI实际上正在推动通用计算的发展。比如,当大模型生成更多代码之后,还是需要CPU来运行;又比如,在做强化学习训练时,AI模型需要在一个模拟环境,运行这些模拟环境也是由CPU来完成的。
从整体市场来看,AI加速计算的发展确实可以推动通用计算的发展,而在亚马逊云科技内部,通用计算和AI加速计算的协作也达到了新的阶段。

我们看到,亚马逊云科技不仅研发了Graviton5处理器,也自研了AI芯片Trainium芯片,而这带来了很强的自主性。
在这次re:Invent上,亚马逊云科技宣布发布同时搭载Graviton5和Trainium3的系统,同时,系统还将搭载Nitro系统,三大自研的芯片第一次同时使用。目前,全亚马逊云科技自研芯片的方案出现在了Trn3 UltraServers中的计算单元中,这是亚马逊云科技在AI算力设施中的关键组成部分。
对于亚马逊云科技来说,这不仅获得了更高的技术自主权,更高的供应链掌控力,也为客户提供了从底层芯片到上层应用的最优整合方案。
广受认可,亚马逊云科技上一半的新增主机都来采用Graviton
与Graviton5同时发布的还有基于该处理器的M9g实例。与M8g相比,它们在数据库处理速度上提升高达30%,在Web应用处理速度上提升高达35%,在机器学习工作负载处理速度上提升高达35%。

目前Graviton的用户群体还在不断壮大。目前已经有超过90,000家客户在使用Graviton。在EC2最大的前1000家客户中,有98%都在用Graviton,包括 Adobe、Airbnb、Epic Games、F1、Pinterest、SAP、Siemens、Snowflake等知名企业。

Dave Brown介绍称,升级到基于Graviton5的M9g实例后,Airbnb 性能提升高达 25%,Atlassian 延迟降低 20%,Honeycomb IO 每内核性能提升 36%,而 SAP 的 SAP HANA在OLTP查询上的性能更是惊人地提升了 60%。
Swift是苹果iOS应用的编程语言,它运行在苹果的Arm处理器上,如今苹果也把服务器上的代码用Swift重写了一遍。苹果公司云系统与平台副总裁Payam Mirrashidi介绍称,当把服务器端运行在亚马逊云科技的Graviton(Arm)处理器上,带来了40%的性能提升和30%的成本降低。
有第三方数据显示,截至到2024年年底,亚马逊云科技平台上,基于Graviton的云主机占比约为25%。而这次大会上,亚马逊云科技宣称,过去三年中,平台上新增CPU中,有一半以上都是Graviton,看来Graviton处理器的占比还在继续提升。
2018年,在所有人都不看好Arm处理器的年代,亚马逊云科技发布了第一款Arm自研处理器Graviton,2019年发布了Graviton2。此后,每两年发布一代,每次性能大约提升25%到30%,这次Graviton5提升25%也属正常范围内。
Ali Saidi介绍说,之所以选定两年作为发布周期是经过深思熟虑的选择。如果每年更新只提供很小的提升,客户其实并不会买账,因为升级是有迁移成本的,而每两年带来一次较大的提升则更值得升级。
结束语
从2018年的备受质疑,到2025年占据半壁江山,Graviton取得了显著的市场成功。而这次Graviton5的发布不仅是性能的再一次跃升,更标志着亚马逊云科技在自研芯片战略上取得重要进展。





