美国时间3月6日,Intel(英特尔)正式推出了新一代Xeon(至强)E5服务器CPU及开发代号为Romley的相关平台,今天就是北京的发布会。
整合PCIe 3.0、SAS控制器,内存支持创纪录
Intel在Romley平台中加入了较多新特性,推出时间也从最初计划的去年下半年调整为今天。其中包括处理器集成的PCIe 3.0控制器,目前已经支持的设备包括显卡(PCI Express x16)、40/56Gb InfiniBand HCA、6Gb/s和12Gb/s SAS HBA以及RAID、10/40Gb以太网和16Gb/s光纤通道控制器等。笔者在《PCIe 3.0只待至强E5:I/O带宽翻倍提升》一文中曾经介绍过,由于数据传输率从PCIe 2.0的5GT/s提高到8GT/s,同时为了达到带宽基本翻倍的效率,PCIe 3.0的编码方式由原来的8b/10b改为128b/130b。因此Intel和周边设备厂商应该是在兼容性的测试和信号设计调整方面花了不少精力。
另外一点重要变化来自于代号为Patsburg的C600芯片组(PCH),该芯片在设计时加入了8端口的6Gb/s SAS控制器。此前,Intel在3Gb/s的SAS 1.0时代就推出过IOP348 RoC芯片,这个高性价比的单芯片方案曾被包括Adaptec、Promise在内的多家RAID卡厂商所追捧,此外还有不带RAID功能的SAS控制器IOP340。因此,我们认为Intel在6Gb/s SAS控制器硬件方面不应存在困难,只是还要同时提供6个SATA接口(按照桌面版本的X79芯片组来看,其中有2个6Gb/s和4个3Gb/s SATA)。
据悉,初期量产出货的Xeon E5主板被限制到支持3Gb/s SAS。

Intel Xeon E5/E7平台路线图
之前已有国外媒体报道过,面向主流双路服务器和工作站平台的Xeon E5-2600(代号Romley-EP)率先发布,而其四路版本——E5-4600(代号Romley-EP 4S)和入门级双路E5-2400(代号Romley-EN)大约会在6月前后推出。LGA2011插槽的E5-2600/4600以及LGA1356插槽(明显是Xeon 5500/5600使用的LGA1366的变种)的E5-2400各自的特点笔者也曾在早些时候叙述过。
再往后,明年Intel计划将Xeon E5全面升级到v2版本,另外平台代号Brickland,面向高端RAS(可靠性、可管理性和可维护性)2/4/8插槽及以上服务器的Xeon E7-8800/4800/2800处理器也会推出第二版。可以想象它们将全面应用22nm工艺的Ivy Bridge内核技术,进一步增加CPU中的核心数量并提高能效比。

Intel Xeon E5-2600模块示意简图
如上图,我们看到本次推出的E5-2600最多可以有8个物理CPU核心,配合Hyper-Threading超线程技术一共就是16个线程;整合内存控制器支持4个通道和最高DDR3 1600MHz的内存频率,每通道3个插槽/双CPU配置下最多24个插槽,再加上和现在Xeon E7平台相同的最大单条容量32GB,E5-2600满配可以达到768GB内存——这应该是双路x86平台的新纪录。尽管我们认为从原有的3通道增加到4通道,内存带宽在多数应用中不一定会带来明显的性能提升,但对容量的意义则不言而喻。
由于整合的PCIe 3.0控制器从每个CPU插槽中都能引出40个lane,这样仅凭2颗处理器,无需原来的Intel 5520 IOH,就能支持4个全带宽运行的PCI Express 3.0 x16显卡/通用计算GPU,或者更多的x4/x8 PCIe插槽。需要注意的是,如果只安装一颗CPU的话,主板上的部分插槽可能无法使用。
Intel称Xeon E5为“第一款具备集成式PCIe的服务器CPU”,可将I/O延时缩短30%,同时支持PCI Express 3.0几乎将I/O带宽提高一倍。
为什么说Intel通过Xeon E5进一步细分x86服务器的市场呢?这就是我们后面一页要讨论的内容。
两种CPU插槽细分市场,用户选择更多
在Intel Xeon 5500平台上(Xeon 5600只是更换了CPU,最多6核/12MB缓存),如下图,2个CPU之间通过一条QPI连接,而另外一条需要连接到5520芯片组以支持PCIe I/O并连接南桥等外设。而Xeon E5-2600的2条QPI都可以用于2颗CPU之间的通信,或者使用其中一条单独扩展I/O,可以说整合PCIe控制器的设计也为高性价比的 E5-4600入门级四路平台打下了基础。

在Xeon 5500平台上,每颗CPU集成3通道内存控制器一共最多18个插槽,根据两款不同的IOH来区分高低端定位:上图中的Intel 5520 IOH提供了36个PCIe 2.0信道,而另有一款Intel 5500 IOH支持24个PCIe 2.0 lane。而它们都可以支持相同的LGA1366 Xeon 5500/5600处理器。
为什么Xeon E5的发布表明Intel在进一步细分DP/MP(双/四路)x86服务器市场呢?简单回顾一下其实不难理解。Intel在上一代Xeon 5500/5600平台通过2款IOH芯片组不同的PCIe扩展能力来区分定位,而CPU的支持上是一样的;再往前说,Xeon 5000/5400平台也曾有一款低端的Intel 5100芯片组,支持相对廉价的双通道DDR2内存而不像5000系列/5400芯片组那样使用FBD(全缓冲内存),搭配的南桥降级为没有PCI-X控制器的ICH9R,但CPU插槽也是相同的。
直到Xeon E5,PCIe控制器开始整合到处理器中,Intel可以细分CPU支持不同的内存通道/插槽,以及PCIe lane数量,同时搭配2种不同Socket插座的主板,组成高/低定位的两套服务器平台。E5-2600和E5-2400就是这样诞生的。
笔者曾经想过这样一个问题:市场中出货量最大的产品往往是性价比良好,而非高规格/高性能的型号,尤其是在对成本比较敏感的发展中国家和中小企业用户。如果我们用不到E5-2600的四通道内存及大容量支持等、闲置较多的PCIe扩展能力,还要为之买单并面对较高的最大TDP(热设计功耗)时,规格相对受限的E5-2400正是合适的选择。
Intel Xeon E5-2400集成了3通道内存控制器(速度也会低于E5-2600),每通道最多2条/双CPU可以提供12个插槽,单处理器支持24个PCIe 3.0信道(双CPU一共48 lane),同时最大功耗不超过95W。这样的规格其实能满足相当多用户的需求。

笔者曾经在《从Xeon E7评测展望四路至强E5-4600》一文中出示过这张Intel Xeon 7500/E7平台IO结构参考图。单个Xeon 7500/E7处理器提供4条QPI,因此在四路配置中任意2颗CPU之间都有点对点连接,并且还有一条可以连接到IOH芯片。将上图中红圈部分代表的QPI连接去掉就是Sandy Bridge-EP的4插槽配置方式。Xeon E5-4600集成了PCIe 3.0控制器因此不需要IOH来提供PCIe连接扩展,整个平台与双路一样只用1个C600 PCH芯片组来实现传统南桥的功能即可。
而对于MP市场的Xeon E7来说,E5-4600显然也是一种补充和经济型的替代选择。除了SAP HANA内存计算那样海量的DRAM需求之外,Xeon E5支持的768GB内存可以满足大多数用户的需求。而对角线上的CPU(以上面示意图为例)之间的“2跳”NUMA(非一致性内存访问)架构对于延迟要求不是特别苛刻的应用场合完全可以接受,AMD的四路服务器一直以来就是类似的设计。此外E5-4600还有两个好处,一方面CPU直接控制内存而不像至强7500/E7那样需要通过内存缓冲芯片来连接DDR3内存,能降低一些成本;另外集成PCIe 3.0控制器简化了平台设计,减少1~2颗IOH芯片的需要。

Intel Xeon E5-2600全系列服务器CPU规格表 (据了解还有一款针对工作站的2687W,3.1GHz、150W功耗)
根据这个表格,用于服务器的Xeon E5-2600系列CPU的原始时钟频率从1.8GHz到最高的E5-2643 3.3GHz(只有4核心,8核最高为2.9GHz的E5-2690);L3 Cache按照每2个核心5MB的配置,8核心最大20MB。Intel仍然通过不同的QPI连接速率来区分产品定位,不过是从之前最高的6.4GT/s起步,上面有7.2GT/s和8.0GT/s两档,按照Xeon 5500平台单QPI最大25.6GB/s的带宽来推算,E5应该能达到32GB/s。除了4核8线程、6核12线程和8核16线程之外,还有一款比较“特殊”的双核型号E5-2637;除了定位最低的两款E5-2603、2609之外,都能支持Turbo Boost 2.0睿频加速。功耗从80W到135W不等,只有用于工作站的E5-2687W达到了150W,2款低功耗版本分别为6核60W的E5-2630L和8核70W的E5-2650L。最大DDR3内存速度1066、1333和1600MHz与QPI之间存在对应关系,只有E5-2637例外。
写到这里,本文没有列出Xeon E5的官方性能测试数据,但凭借Sandy Bridge架构的优秀设计,我们相信又将有多项双路x86服务器的Benchmark纪录要被刷新了。无论它们由来自IBM、惠普、戴尔或者哪个厂商的主机创造,Intel都应该算是赢家吧?