这两年但凡跟AI数据中心沾边的东西,几乎没有不涨价、不缺货的。在这种背景下,怎么用更少的服务器、更少的电,扛住更多的负载,成了所有人数据中心所有者最关心的事。
6月1日,英特尔正式发布至强6+,它最诱人的卖点其实就是能省资源,原来要9台服务器干的活,现在1台就够了,物理空间省下80%,能耗省下73%。对机房资源已经见底的数据中心来说,这个整合比比任何性能跑分都更诱人。
当然,至强6+不只是省资源。AI时代,英特尔自然也得是磨拳霍霍,这一代CPU除了也能用于AI智能体的负载,同时也顺手还发了一颗面向AI数据中心的GPU。下面我们一个一个来看。
288核至强6+处理器
今年三月份,英特尔首次提到了代号为Clearwater Forest的至强6+处理器,它是第一款采用18A制程工艺(1.8 纳米级)制造的数据中心CPU。6月1日,英特尔宣布正式发布至强6+。

首先,至强6+走的是能效核(E-core)路线,英特尔至强现在的产品分为性能核处理器和能效核处理器,能效核处理适合智能体的工作负载,当然也针对5G网络基础设施,媒体业务,Web及微服务以及存储场景做了很多优化。
主要规格方面。至强6+单个SoC做到288个E-core(能效核),这是英特尔第一款单SoC就支持288核的架构,双路配置下能提供576个物理核心,性能密度拉满。

同时,IO配置也拉的很满,12通道DDR5内存,速率最高8000 MT/s,末级缓存高达576MB,比上一代直接提升了五倍多。此外,它还有96条PCIe Gen5通道。
工艺层面,至强6+用上了18A的两个招牌技术:PowerVia背面供电技术让供电路径更短,从而降低功耗。而RibbonFET环绕栅极晶体管可以降低待机功耗。

性能部分,对比上一代产品,主流数据中心负载下整体性能最高2.26倍,每瓦性能最高1.55倍。对标主流竞品,每线程性能和每线程每瓦性能各都提高了1.3倍。新增的密码学指令集,性能比上一代快15倍,比竞品快6倍。

性能很重要,对用户来说,在一整柜能塞多少个核心、能省多少电更重要。
英特尔反复强调,至强6+的整合比,从第二代至强升级到至强6+,原来需求9台,现在只需要1台服务器,直接省下80%的物理空间,还有73%的能耗。在数据中心资源紧缺的背景下,这很重要。
至强6+还发布了一个叫AET(应用能效遥测)的新功能,能在工作负载层级实时看到核心的功耗与运行状态。这东西听起来不起眼,但对要做精细化成本管理和资源调度的云厂商来说,是真有用的,能直接体现在TCO上。

实际部署里,爱立信已经在运营商环境测了至强6+的5G分组核心网,5G核心网就是典型的高密度、看能效的负载。实际数据显示,同样核心数下性能提升30%,每瓦性能提升超过60%,机架功耗降低38%。
封装和芯片封装技术的新高度,一块由29个小芯片拼起来的处理器

在第四代至强可扩展处理器之前,至强都是单裸片产品,第四代和第五代至强采用了多个计算包含了CPU核心、LLC缓存、内存控制器和PCIe控制器的Tile,第六代至强则进一步区分了计算Tile和I/O Tile,拼接技术越玩儿越溜。
现在的至强6+延续了独立的I/O Tile和Compute Tile的架构设计,这次用29个小芯片拼起来组成的,包括12个计算Tile和2个IO Tile。此外,还有3个有源基底Tile和12个EMIB连接Tile。
12个计算Tile每个24核,算下来正好288核。这12个计算Tile用的是18A工艺,它堆叠在3颗Intel 3工艺的基底Tile上面。基底Tile集成了片上网状互联、末级缓存和内存子系统。IO Tile则沿用了上一代至强6设计。
计算Tile和基底Tile之间的垂直对接用的是Foveros Direct 3D技术,而Tile横向之间,再用EMIB封装连起来。这一代处理器把封装技术做的这么强,可以在一定程度上对台积电的CoWoS带来压力。
智能体时代,CPU又回到AI系统的舞台中央了
过去两三年,大家都觉得GPU是AI时代的绝对主角,CPU几乎沦为打杂的角色。但现在,随着AI从训练转向推理、再向智能体发展,AI服务器中的CPU:GPU需求比例正在从过去的1:8逐步向1:1靠近。
智能体时代,CPU又回到了AI系统的中心。英特尔公司执行副总裁兼数据中心事业部(DCG)总经理Kevork Kechichian说,“到2030年,现有数据中心底层架构仍将持续发挥价值,且会承载近50% 的工作负载”。
在英特尔看来,当前绝大多数工作负载均以x86架构为核心。传统工作负载自不必说,新兴的智能体负载,无论是编排、调度、反复执行,这些工作也全靠CPU。尽管智能体是新兴技术,但英特尔的x86产品技术也能满足其需求。

这意味着,英特尔原有的产品规划、路线图制定及远期布局还会继续执行,不会有什么明显变化。有意思的是,英特尔也不愿意蹭热点,强行说至强6+是一款面向智能体设计的CPU,因为现在的技术就能满足智能体的需求。
比如,IAA内存压缩解压缩技术推出了好几年,但客户兴趣一直不大。而现在内存又贵,智能体又需要频繁的内存Swap,IAA突然就成了香饽饽。英特尔专家认为,把已有的很多技术用好,对用户就会有很大帮助。
在谈到288核的至强6+到底能跑多少个智能体时?英特尔专家按2核配4G内存、或者1核配2G内存的配置计算,认为288核的至强6+能轻松跑400到500个以上的智能体,其上限取决于客户要保证什么样的SLA。
除了至强6+,英特尔还介绍了新一代的数据中心GPU
新的GPU是数据中心GPU,代号Crescent Island,这是英特尔首款基于Xe3P架构、专门为AI推理和智能体工作负载优化的产品。

它用了LPDDR5内存堆容量,单卡内存做到480GB,LPDDR的功耗低,所以它的TDP压在了350W,能在现有的风冷数据中心直接用。它用的是常见的PCIe卡的形态,所以部署起来比较灵活。
什么叫为AI场景优化呢?英特尔专家特意提到,为了腾出晶体管面积强化AI性能,他们砍掉了一些功能。不过,他们也保留了AI场景不太用的FP64,所以这卡还能拿去做HPC加速,就业市场挺广的。
显存容量大的好处就太多了。以1.6万亿参数的DeepSeek V4标准版为例,在FP8精度下,4张Crescent Island就能撑起这个模型的部署。具体的性能如何,专家这次没说,还得等后续的测试数据在说。
最后说两点
第一点,至强6+为用户分忧。AI时代什么资源都缺,英特尔至强6+凭借技术优势,实现服务器9:1的整合,对数据中心用户有很强的吸引力。
第二点,至强6+对英特尔很重要。作为第一款用上18A(1.8纳米)工艺的数据中心CPU,又是29颗小芯片的作品,至强6+对英特尔芯片制造业务也有显而易见的提振作用。
本文来源于DOIT传媒,文章内容仅供参考,不构成投资建议。
评论列表