装上这颗英特尔288核处理器,一台服务器顶九台

 

这两年但凡跟AI数据中心沾边的东西,几乎没有不涨价、不缺货的。在这种背景下,怎么用更少的服务器、更少的电,扛住更多的负载,成了所有人数据中心所有者最关心的事。

6月1日,英特尔正式发布至强6+,它最诱人的卖点其实就资源原来要9台服务器干的活,现在1台就够了,物理空间省下80%,能耗省下73%。对机房资源已经见底的数据中心来说,这个整合比比任何性能跑分都更诱人

当然,至强6+不只是省资源AI时代英特尔自然磨拳霍霍这一代CPU用于AI智能体的负载同时顺手还发了一颗面向AI数据中心的GPU。下面我们一个一个来看。

 

288至强6+处理器

今年三月份,英特尔首次提到了代号为Clearwater Forest至强6+处理器,它是第一款采用18A制程工艺(1.8 纳米级)制造的数据中心CPU。6月1日,英特尔宣布正式发布至强6+

首先,至强6+走的是能效核(E-core)路线,英特尔至强现在的产品分为性能核处理器和能效核处理器,能效核处理适合智能体的工作负载,当然也针对5G网络基础设施媒体业务Web及微服务以及存储场景做了很多优化。

主要规格方面。至强6+单SoC做到288E-core(能效核),这是英特尔第一款单SoC就支持288核的架构,双路配置下能提供576个物理核心性能密度拉满


同时,IO配置也拉的很满,12通道DDR5内存,速率最高8000 MT/s,末级缓存高达576MB,比上一代直接提升了五倍多。此外,它还有96条PCIe Gen5通道

工艺层面至强6+用上了18A的两个招牌技术PowerVia背面供电技术让供电路径更短,从而降低功耗。而RibbonFET环绕栅极晶体管可以降低待机功耗。


性能部分,对比上一代产品,主流数据中心负载下整体性能最高2.26倍,每瓦性能最高1.55倍。对标主流竞品,每线程性能和每线程每瓦性能各都提高了1.3倍。新增的密码学指令集,性能比上一代快15倍,比竞品快6倍。


性能很重要对用户来说,在一整柜能塞多少多少更重要

英特尔反复强调至强6+整合比,从第二代至强升级至强6+,原来需求9台,现在只需要1服务器直接80%的物理空间,还有73%的能耗。数据中心资源紧缺背景这很重要

至强6+还发布了一个叫AET(应用能效遥测)的功能,能在工作负载层级实时看到核的功耗运行状态。这东西听起来不起眼,但对要做精细化成本管理和资源调度的云厂商来说,是真有用的,能直接体现TCO上。


实际部署里,爱立信已经在运营商环境测了至强6+的5G分组核心网,5G核心网就是典型的高密度、看能效的负载。实际数据显示,同样核心数下性能提升30%,每瓦性能提升超过60%,机架功耗降低38%。

 

封装芯片封装技术高度一块29个小芯片起来处理器



第四代至强可扩展处理器之前至强都是裸片产品第四代和第五代至强采用了多个计算包含CPU核心LLC缓存内存控制器PCIe控制器Tile第六代至强进一步区分计算TileI/O Tile拼接技术玩儿

现在至强6+延续独立I/O Tile和Compute Tile架构设计这次29个小芯片拼起来组成的,包括12个计算Tile2个IO Tile。此外,还有3个有源基底Tile和12个EMIB连接Tile。

12个计算Tile每个24核,算下来正好288核。这12个计算Tile用的是18A工艺,堆叠在3颗Intel 3工艺基底Tile上面基底Tile集成了片上网状互联、末级缓存和内存子系统。IO Tile则沿用了上一代至强6设计。

计算Tile和基底Tile之间的垂直对接用的是Foveros Direct 3D技术Tile横向之间,再用EMIB封装连起来。这一代处理器封装技术这么可以一定程度台积电CoWoS带来压力

 

智能体时代CPU又回到AI系统舞台中央了

过去两三年大家觉得GPUAI时代绝对主角CPU几乎沦为打杂的角色但现在随着AI从训练转向推理、再向智能体发展,AI服务器中的CPU:GPU需求比例正在从过去的1:8逐步向1:1靠近。

智能体时代,CPU又回到了AI系统的中心。英特尔公司执行副总裁兼数据中心事业部(DCG)总经理Kevork Kechichian说,“到2030年,现有数据中心底层架构仍将持续发挥价值,且会承载近50% 的工作负载”。

在英特尔看来,当前绝大多数工作负载均以x86架构为核心。传统工作负载自不必说,新兴的智能体负载无论编排、调度、反复执行,这些工作全靠CPU。尽管智能体是新兴技术,但英特尔的x86产品技术也能满足其需求

这意味着,英特尔原有的产品规划、路线图制定及远期布局还会继续执行,不会有什么明显变化。有意思的是,英特尔不愿意蹭热点,强行说至强6+一款面向智能体设计CPU因为现在的技术就满足智能体需求

比如IAA内存压缩解压缩技术推出好几年但客户兴趣一直不大现在内存又贵智能体又需要频繁内存SwapIAA突然就成了香饽饽。英特尔专家认为已有的很多技术用好对用户就很大帮助

谈到288核至强6+到底能跑多少个智能体英特尔专家按2核配4G内存、或者1核配2G内存的配置计算认为288核的至强6+轻松跑400到500个以上的智能体,上限取决于客户要保证什么样的SLA

 

除了至强6+,英特尔还介绍了新一代数据中心GPU

GPU是数据中心GPU,代号Crescent Island,这是英特尔首款基于Xe3P架构、专门为AI推理和智能体工作负载优化的产品。



它用LPDDR5内存堆容量,单卡内存做到480GB,LPDDR功耗低所以TDP压在350W,能在现有的风冷数据中心直接用。它常见PCIe形态,所以部署起来比较灵活。

什么AI场景优化英特尔专家特意提,为了腾出晶体管面积强化AI性能,他们砍掉了一些功能不过他们保留了AI场景不FP64所以这卡还能拿去做HPC加速就业市场广

显存容量大的好处就太多1.6万亿参数DeepSeek V4标准版为例,在FP8精度下,4张Crescent Island就能撑起这个模型的部署。具体性能如何专家这次,还后续测试数据

最后说两点

第一点,至强6+为用户分忧。AI时代什么资源都英特尔至强6+凭借技术优势实现服务器9:1整合数据中心用户很强吸引力

第二点,至强6+对英特尔很重要。作为第一款用上18A1.8纳米)工艺的数据中心CPU,又是29颗小芯片作品至强6+对英特尔芯片制造业务有显而易见的提振作用

 

 

【速记】英特尔至强6+处理器媒体沟通会

 


本文来源于DOIT传媒,文章内容仅供参考,不构成投资建议。

赞 ()

相关推荐

发表回复

评论列表

点击查看更多

    联系我们

    微信:百易小助手

    邮件:contact@doit.com.cn

    工作时间:周一至周五,9:30-18:30,节假日休息

    微信