Ampere正式发布192核处理器,将虚拟机密度提升至x86的4.3倍

2023年5月下旬,Ampere正式发布AmpereOne系列处理器,单颗处理器支持最高192个物理核心,远远超过目前AMD最多96核心的EPYC和英特尔60核的至强处理器。

与之前的Ampere Altra和Ampere Altra Max一样,AmpereOne也是单物理核单线程的设计,这样设计的好处是可以避免双线程之间,相互争抢资源造成的性能抖动。

由于延续了这一思路,使得它与之前的Ampere Altra系列一样,也可以提供可预测的高性能,提供较强的弹性和可扩展性,具备高能效和可持续性优势。

AmpereOne的基本参数信息

AmpereOne出现以前,Ampere Altra系列最多128核心,新的AmpereOne则是从136核起步,最多192核心。所以,AmpereOne可以看做是Ampere Altra的补充,两者将长期共存。

Ampere Computing首席产品官Jeff Wittich表示,当用户需要在边缘计算场景部署时,可以选择32核、功耗40瓦的Ampere Altra处理器,对于算力需求更大的数据中心用户,可以选择核数更多,性能更好的处理器。

Ampere Altra系列采用的是7nm,而AmpereOne系列采用的是台积电5nm。核心方面,Ampere强调核心是自研的,由Ampere自有IP全新打造(Arm ISA没变,所以不存在兼容性问题),这使得Ampere可以根据需求做更多改动。

AmpereOne的部分参数规格(L2 Cache翻倍)

能看到,AmpereOne的核心规格有明显变化,每个核心专有L2缓存从原来的1MB提升到了2MB,对性能提升应该很有帮助。但L1的指令缓存从原来的64KB,缩小为16KB。

功耗方面,Ampere Altra的TDP为40-180瓦,而AmpereOne则是200-350瓦。算下来,每个核心的平均TDP相较于之前有所增长。

AmpereAltra的部分参数规格

AmpereOne支持PCIe Gen5和DDR5内存。PCIe通道数还是128个,内存通道依然是8通道。DDR5最大容量翻倍,而AmpereOne支持的最大内存容量也从4TB提升到了8TB。

此外,Ampere Altra的最高主频为3G,AmpereOne也完全保持一致。较低的主频,带来较低的工作电压和较低的功耗,还能让核心持续稳定在固定频率上,从而带来稳定的性能表现。

以更少的功耗输出更多性能

AmpereOne跟隔壁x86处理器完全不一样套路,单机架可提供的性能远高于x86处理器。同时,在节省能耗和节省占地空间方面也有非常大的优势。

Ampere将能效比优势视为一大亮点。有调研数据显示,数据中心贡献了3%以上的碳排放量,是不折不扣的排放大户,从节能减排的角度讲,AmpereOne非常有优势。

Ampere还提到了全球多地能源价格飞涨的现状,这些也都会直接影响数据中心的运营成本,对于这些地区的数据中心运营者来说,能效比占优的Ampere非常具有吸引力。

新增BF16计算精度,提高AI推理能力

Ampere还提到了AmpereOne在AI推理方面的优势,这得益于在FP16,Int16,Int8基础上新增的对BF16的支持。

在运行文生图的模型Stable Diffusion时,AmpereOne每秒生成的图片帧率是AMD EPYC 9654的2.3倍。

在运行智能推荐模型DLRM(Deep Learning Recommendation Model)时,AmpereOne每秒能处理的推荐次数是AMD EPYC 9654的2倍以上。

Jeff Wittich表示,AmpereOne系列处理器设计过程中考虑到了AI的需求。

软件层面,Ampere收购了AI软件公司OnSpecta,从而让Ampere处理器更好地运行AI相关负载。硬件层面,AmpereOne系列处理器新增了对于BF16计算精度的支持。

据了解,目前已经有许多企业都在使用Ampere Altra系列处理器做AI推理,用着Ampere官方Library库,包括TensorFlow、PyTorch、ONNX等主流框架。

更适合云计算场景的处理器

Ampere一直喜欢强调自家做的叫云原生处理器,意在凸显它非常适合用在公有云的场景。然而,最能体现它适合云场景就是对虚拟机的支持。

如上图所示,由于核心比较多,单个Rack能支持更多的虚拟机,更多的虚拟机可以卖给更多的用户,能帮云厂商产生更多经济效益。

为了用如此之多的核心稳定地支持更多用户,Ampere在内存管理上做了很多优化。

在面对内存墙和可能存在的内存不均衡问题时,Jeff Wittich表示,AmpereOne拥有更高的内存带宽,更好的带宽管理技术,新的Chiplet技术,新的网格拥塞管理(Mesh Congestion Management)等技术,这都有助于让每个用户都公平地使用内存资源。

从Jeff Wittich的介绍中了解到,下一阶段,Ampere将推出12内存通道版本的ApmereOne。同时,为了扩大在云原生领域的优势,Ampere在未来还将推出更多核心的处理器。

多核处理器将会让单路服务器市场走向繁荣

Ampere的多核处理器确实为服务器市场带来了一些变化,比如,Ampere这种级别的处理器会让单路服务器走向繁荣。

Jeff Wittich认为,单路服务器市场有明显的增长动力。

多路服务器通常是为了弥补算力、核数、内存、IO的不足。然而,多路服务器不仅会提高设计复杂度和成本,在使用方面也会有一些损失。

而当单颗处理器核心足够多的时候,用户就没必要用双路以及多路服务器了。

成立短短几年以来,Ampere 的客户群正在不断扩大,包括谷歌云、微软 Azure、甲骨文云、阿里云、百度云、京东云、腾讯云、火山引擎、UCloud等云服务提供商(CSP),以及 HPE 和 Supermicro、华勤等等OEM厂商都在使用Ampere的Arm处理器。