2025年3月,英伟达发布了DGX B300 AI加速计算平台。2025年5月,英特尔发布了三款全新英特尔至强6性能核处理器,其中一款6776P被用作是DGX B300的主控CPU,这款处理器究竟有什么特殊之处呢?
AI加速系统为何看重CPU主控能力?

作为造价极高的AI加速系统,DGX B300可以不计成本地选任何CPU,只要它能充分的发挥整套系统的性能。选择英特尔至强6作为默认推荐的CPU配置,这意味着它能很好地满足需求,也意味大量AI加速系统会搭载这款英特尔处理器。
在AI服务器中,CPU其实很重要,它不仅要运行操作系统,还要负责协调GPU的工作、管理系统资源,支撑整个AI系统稳定运行。此前,来自IDC的数据显示,有73%的GPU加速服务器都在使用英特尔至强处理器作为主控CPU。
从技术细节看,主控CPU需要和GPU协同工作。因此,CPU在I/O、核心性能、内存(容量和带宽)、CPU上的预处理或卸载(offload)能力、RAS特性,以及对于多种形态的AI服务器架构的支持,都会影响整个AI系统的性能。
英特尔至强6:理想主控CPU的优势解析

首先,我们从产品角度来简要介绍一下,为什么英伟达会选择英特尔至强6处理器作为推荐配置?
首先,在I/O部分,英特尔至强6性能核处理器最多支持96个PCIe 5.0通道,相较于第五代至强可扩展处理器增加了20%。像DGX B300这种双路服务器系统,PCIe总数能来到192个。
在CPU核心部分,英特尔至强6支持最多128个性能核心,相较于上代直接翻倍。平均单核性能提升20%,平均每瓦性能提升高达1.6倍,同等性能水平下平均可以节省30%的TCO。并且还具备卓越的单线程能力。
在内存部分,英特尔至强6支持DDR5-6400MT/s、最高达8800MT/s的MRDIMM内存以及CXL技术,可提供更大内存带宽和更大内存容量。其中,英特尔至强6性能核还将内存通道数从8个提升到了12个,整体内存带宽和内存容量都有了大幅提升。
英特尔至强6可以更好地支持在CPU上做预处理和卸载,这一部分会用到高级矩阵扩展(AMX)。因为现在的MoE模型越来越多,在CPU上做一些卸载工作现在变成了很热点的话题,英特尔和很多合作伙伴也在进行积极探索。
英特尔至强6支持专门的RAS(Reliability, Availability, Serviceability)功能,它可以减少系统宕机时间。这次英伟达的DGX B300采用的是双路服务器,丰富的RAS特性支持可以显著减少宕机时间,提高系统资源的利用率。
因此,不管是英伟达的DGX(英伟达的一体化平台)、MGX(英伟达开放给合作伙伴的模块化服务器设计规范),还是DC-MHS全球标准(英特尔牵头的模块化标准架构),英特尔至强6都可以灵活支持。

2025年5月下旬,英特尔发布了三款新的性能核处理器,分别是6962P、6776P以及6774P。其中,6776P被用作英伟达的DGX B300系统的主控CPU,为什么要选择这款处理器呢?
为什么选英特尔至强6776P做DGX B300的主控CPU?
此前,推荐作为英伟达DGX主控的CPU型号是6767P,这是一个64核的处理器,它的基础频率是2.4GHz,全核睿频是3.6GHz,最大睿频来到了3.9GHz。
6776P也是一块64核的处理器,基础频率是2.3GHz,全核睿频是3.6GHz,最大睿频是3.9GHz。得益于英特尔创新的PCT技术,最高主频提升到了4.6GHz,更高的主频可以让数据更快传递到GPU,从而提高GPU在高强度工作负载下的性能。
PCT指的是英特尔Priority Core Turbo技术,它让部分核心成为高优先级的核心,相应的,其他的核心就是低优先级。搭配英特尔Speed Select睿频频率(Intel SST-TF)技术,让高优先级的核心以更高的主频工作。
英特尔官方用这种方式把少数核心拉到更高频率,意味着用户可以不用额外考虑散热等问题,还能保证可以长时间稳定运行。

英特尔此次发布的3款支持PCT的至强处理器当中,6774P是单路CPU,6776P和6962P是双路CPU。为了获得更高的4.6GHz PCT频率,又因为要支持双路服务器,所以要选6776P。
双路的DGX B300可以提供176条Gen 5.0通道。内存部分,在DGX B300系统中,它只支持8个内存通道,为了追求更大容量,这里采用了2 DPC的设置,每个通道配置2个DIMM,双路理论最高容量为8TB,可以更好地应对未来更大数据规模。

上方在AI系统中使用至强6为主控CPU的示意图中,有两块CPU带着8块GPU,8块GPU之间通过NVLink互连,两块CPU之间通过UPI互连。
6776P最多支持8个PCT核心,也就是让8个核心运行在高频率,用户可以根据需求选择8个、6个、4个或2个。
PCT核心的设置也比较简单,一种是在BIOS里进行设置,把一定数量的核心设定为PCT高核心。另外一种是通过SST的TF工具进行设置,在系统运行时可以动态配置调整,这种方式更便捷。
从英特尔专家的介绍中了解到,这三款处理器都是英特尔至强常规产品路线图中的一部分,三款产品都是可以面向所有客户开放的标准产品,而不是为特定用户特定场景定制的特殊方案。
对于选择DGX B300的用户来说,6776P已是默认选项。如果是MGX用户,则可以使用此前已发布的6767P。理论上,英特尔至强6的所有型号都支持作为AI加速计算系统的主控CPU,用户在选用时可以根据实际需求作出选择。