至强6+登场:英特尔用18A打造近年来“最重要”的服务器芯片

2025年10月,英特尔向外界公布了基于Intel 18A工艺的全新至强6+处理器,其代号为Clearwater Forest,是Sierra Forest的后续产品。它同样属于能效核处理器,但核心数从最高144个提升到了288个。

它依然属于至强6家族,之所以把它命名为至强6+处理器,是因为它可以直接安装到为至强6性能核处理器(代号为Granite Rapids AP)开发的现有服务器系统中,体现它跟至强6其他产品之间的兼容性。

Clearwater Forest的至强6+,其架构更为复杂,在一个非常小空间堆叠了29个芯片,实现了相当高的算力和密度。翻倍的核心数和性能、576MB的更大三级缓存、1.9倍的内存带宽,17%的IPC提升,相较于Sierra Forest,它有难以抗拒的吸引力。

核心规格固然重要,但对于英特尔来说,Intel 18A工艺上的进展更为重要,18A大致相当于1.8nm到2nm的水平,这是英特尔证明制造技术水平重回领先地位的里程碑,也关系到未来代工业务能否正常开展,这可能是英特尔近年来最重要的至强处理器。

288核至强6+全新能效核处理器,让服务器一台顶8

由于单一内核架构很难同时在性能和能耗上都优化,于是从至强6开始,英特尔在在性能核处理器的基础上,引入了能效核产品线。性能核主打性能,超线程以及AVX-512等一个都不少,而能效核主打核心多,能效高,代价是砍掉了超线程等特性。

2024年6月,英特尔发布第一款能效核至强处理器,它就是代号为Sierra Forest的至强6。目前,它在国内外主流云厂商、电信运营商进行了大规模的部署,它带来了3.8倍的能效比提升,在运营商环境中,能将单台服务器的吞吐量增加5倍。

全新发布的Clearwater Forest,将核心数从144提升到了288个,带来2倍的性能提升。虽然此前Sierra Forest也有288核的版本,但在并没有在官方的SKU列表里放出来,应该是只给部分云厂商提供,而这次应该会大面积售卖288核版本。

这次内核数暴增的同时,内存通道数从8个升级为12个,内存频率从DDR5-6400MT/s升级到了DDR5-8000MT/s,算下来内存带宽提升了1.9倍,几乎与核心增长同频,用户不用担心内存墙的问题。

此外,有消息显示,Clearwater Forest这次不支持MRDIMM,无法将内存频率进行进一步提升。不过,它的LLC三级缓存的容量提升到了576MB,可以增强数据密集型场景的性能表现。

核心数的增长意味着可以用较少的服务器,提供相同的算力。现在使用20台机架180台Clearwater Forest服务器就可以替代70个机架1400台第二代英特尔至强服务器,两者提供相同的算力,完成了8:1的服务器整合比例,降低71%的数据中心占用空间。

处理器架构非常复杂,但带来1.9倍的性能提升

Clearwater Forest的内核架构(代号Darkmont)看起来比以往都更复杂,整个设计是在一个非常小的尺寸里面堆叠了29个芯片,包括12个计算单元,3个有源硅基板,2个I/O单元和12个EMIB单元,最后实现了相当高的算力和密度。

从图中可以看到,它需要12个计算单元,计算单元采用的是最新的Intel 18A工艺,12个计算模块通过3D混合键合技术,焊接在三个有源硅基板上。有源硅基板也采用了相对先进的Intel 3工艺,其中还放置了很多三级缓存。

三个有源硅基板和分布在左右的两个I/O单元,通过EMIB形成2.5D的互联。其中,这里使用的I/O单元和至强6的性能核处理器的I/O单元是一致的,因此可以实现平台兼容性的无缝升级。

看得出来,Clearwater Forest采用了一个极度复杂的Chiplet架构,代表了Intel在高密度封装上的最新水平。但也带来了制造复杂性和良率风险,任何一个环节的缺陷都可能导致整个处理器报废。

在这样一番复杂的设计操作下来,它在指令解码、分配、微操作队列、缓存窗口以及指令派发等方面都带来了30%-50%不等的提高。最终在相同功耗下,每核IPC性能相较于此前的Sierra Forest提升了17%。

相较于此前Sierra Forest的Crestmont,现在Clearwater Forest的Darkmont核心,也就是至强6+处理器,不仅可以带来1.9倍以上的性能提升,同时,在整体负载范围之内带来高达23%的能效提升,带来服务器和机架功率降低。

至强6+与Intel 18A工艺的成败深度绑定

Clearwater Forest产品的推出不只是一个更强的处理器,这是英特尔在向业界证明了其在先进制程上的成熟度和稳定性。如此一来,Clearwater Forest(至强6+)处理器的成败,与Intel 18A工艺的成败深度绑定。

Intel 18A是业界首个将全环绕栅极(RibbonFET)与背面供电(PowerVia)两项技术同时落地的制程节点。这两项技术一个管“如何更好地开关晶体管”,一个负责“如何更高效地供电”,最终提高了核心密度和能效。

首先,RibbonFET改变了传统晶体管的二维布局方式,把沟道堆叠成了三维结构,并让栅极从四周360°包裹沟道。这种设计让晶体管实现了更好的电流控制,同时降低了漏电与功耗。简单说,RibbonFET让晶体管既能跑得快,能耗还更低。

传统芯片用于电源与信号的金属层都挤在正面,容易出现电力和信号相互抢资源的问题。PowerVia把电源金属层从晶体管正面移到背面,让电源和信号分开走。这样既能减少信号干扰和布线拥堵,又能提高单元利用率。

同时,通过纳米级TSV(通孔)让电流从背面更短路径直达晶体管,进一步降低能量损耗。根据测算,结合RibbonFET和PowerVia,可以将单元利用率提高10%,可以在相同功耗下性能提高4%。

制程进步只是第一步,Foveros Direct 3D则让Clearwater Forest在封装层面实现了结构性突破。

Clearwater Forest采用了Foveros Direct 3D技术,将计算单元与下方的有源硅基板(Base Chiplet) 通过铜对铜混合键合垂直连接,有源硅基板再通过EMIB 2.5D与 I/O芯片互联,形成一种类似3.5D的封装架构。

Foveros Direct 3D封装支持9微米间距的高密度互联,中间的有源基板还能集成逻辑和缓存,从而实现更快的跨芯片通信、更大的三级缓存。而且,整体互联功耗仅0.05 pJ/bit,约为传统2.5D封装的十分之一,极大提升了能效与带宽密度。

因此利用Intel 18A和Foveros Direct 3D技术,可以将Clearwater Forest的能效比达到前所未有的新高度。

结束语

能感受出来,英特尔在Clearwater Forest在还是非常用力的。它将英特尔最尖端的制程、先进的封装和复杂的架构设计融于一体,它不仅是一款芯片产品,更是对英特尔未来命运有深远影响的事件。

尽管英特尔在Clearwater Forest上描绘的技术蓝图令人振奋,但本次发布会因缺乏一些具体的信息,比如,SKU型号、真实基准测试以及与AMD产品的直接对比,也让部分市场观察者感到了一点困惑。

Clearwater Forest计划在2026年上半年交付,如果能如期交付,而且有出色的性能和能效表现,不仅将帮助英特尔在数据中心市场投入重磅炸弹,对于英特尔的芯片代工业务也是极大的利好消息,所以说,这可能是英特尔近年来最重要的处理器了。