DOITAPP
DOIT数据智能产业媒体与服务平台
立即打开
DOITAPP
DOIT数据智能产业媒体与服务平台
立即打开

IBM eX5升级:性能与可靠性双创新高

DOIT多易网 4月25日原创报道: IBM System X eX5服务器在搭载了英特尔至强E7后,一出场就表现不俗,在4月5日提交的SAP SD Benchmark测试成绩中,一套System x3850 X5搭载四颗至强E7-4870,跑出了14000个测试用户在线,平均对话反应时间0.92秒的业界最好成绩,与此同时,另一套System x3850 X5八路系统,在同一天创造了业界最高的TPC-H 1000GB测试成绩:173961.8 QphH,且平均每QphH@1000GB只有1.37美元,而这也是迄今为止非集群服务器所创造的最高TPC-H基准测试值。

在英特尔发布至强E7处理器之后,IBM同时升级了针对四路及四路以上应用的四款主要产品,此次升级的新系统包括System x3950 X5、System x3850 X5、System x3690 X5,以及IBM BladeCenter HX5,由于采用了新的英特尔至强E7处理器,相比上一代至强7500处理器的性能,处理器性能提升了40%左右——在同样的四处理器和内存配置下测试SAP SD Benchmark,来自友商的至强X7560系统的测试成绩为10055个在线测试用户。

除了性能方面的提升,借助内存技术的提升,eX5系统的内存容量也相比前一代有了一倍的跃升,System x3950 X5、System x3850 X5、System x3690 X5,以及IBM BladeCenter HX5的最大内存容量分别达到了6TB、3TB、2TB和640GB,第一代IBM eX5服务器支持2/4/8/16GB规格的内存,而新一代eX5提供了对32GB DIMM的支持,并且HX5刀片也增加了对16GB DIMM的支持,这让IBM eX5系统在内存容量上提升了一倍——这同时得益于IBM的MAX5性能优化技术(内存扩展套件),使得IBM的至强E7平台服务器,能够达到超过一般设计的容量的50%。

但此次跟随IBM eX5系统升级的还远不仅仅是这些,IBM同期升级了eX5的附加组件,并同时新增了面向SAP内存应用数据库“HANA”的解决方案,将eX5从性能、组件到应用解决方案方面都进行了质的提升,将IBM eX5系统再度推上了RISC-关键业务替换的风口浪尖。

在此期间,DOIT记者采访了IBM系统与科技部System x全球高端产品总监Jay Holbrook、IBM系统与科技部System x全球市场经理Michelle G. Brunk及IBM系统与科技部System x大中华区品牌总监徐行三人,详细的了解了新的IBM eX5到底新在哪里?新的组件升级又强在哪里?以及有关SAP内存应用数据库HANA解决方案的情况。

多方面升级:IBM eX5到底有多快?

2010年4月,IBM宣布将System X服务器平台架构升级到eX5架构,借助新的升级的eX5架构,IBM的System X服务器在过去一年获得了超过20项业界基准测试的首位,一年之后,随着英特尔至强E7处理器的升级,eX5进行了平台和产品功能方面的提升。

借助至强E7对低电压处理器的支持,新的eX5平台,增加了对低电压DIMM的支持,同时,System x3950 X5、System x3850 X5、System x3690 X5三款产品的最高单条内存支持提高到了32GB DIMM,不过据徐行表示,由于IBM HX5刀片的厚度只有30mm,过于狭小的宽度限制了IBM只能够使用特制的Micro版本内存,因此只有16GB的内存支持,但徐行表示,由于在IBM刀片机箱中,能够装入超过竞争对手密度的刀片服务器,因此,IBM通过密度解决了这一问题。

与eX5紧密相连的IBM eXFlash(极速存储套件)和MAX5(性能优化中心)此次也获得了升级,IBM为eXFlash(极速存储套件)配置了全新的50GB和200GB固态硬盘,带来高达1000倍的性能提升和4倍以上的内部SSD存储容量升级,而上一代的eXFlash极速存储套件只能够支持一块50GB SLC固态硬盘,虽然性能有所提升,但较小的容量限制了性能的表现。

MAX5(性能优化中心)为每个基于eX5架构的System x服务器提供额外的DIMM插槽,使用户在无需购买额外处理器的情况下,增加服务器内存,此功能还将帮助用户节省软件许可费用,目前在System x3950 X5、System x3850 X5、System x3690 X5,以及IBM BladeCenter HX5中,MAX5都是处于可用状态。在本次升级中,IBM通过灵动分区技术,使得双节点x3850 X5添加了2个MAX5性能优化中心,从而获得了节点故障切换的能力。

在看过性能升级之后,我们来回答eX5到底有多快这个问题。首先从SAP SD Benchmark基准测试来看,我们发现在最新的2011年编号11的测试结果中,一套IBM Power 730通过搭载双Power 7处理器获得了8704个在线测试用户的成绩,虽然不能够简单的双倍处理器获得双倍性能,但这也能够看出IBM公布的四路x3850服务器测试14000个用户的成绩的平均水平。

其次,我们不妨来看下TPC-H的测试成绩,在TPC-H @1000GB的测试中,恰好有来自IBM、HP和Oracle的七套系统位居前列,这其中包括了IBM Power、IBM Sytem X、HP Superdome 2、Oracle Sun SPARC的四个类型的系统,这在一定程度上代表了目前关键业务服务器的市场格局,具有非常显著的参照意义。

而与此同时,我们也看到了一份TPC-H SF 1000测试结果,其中包括部分AMD处理器的测试成绩:

The figure table below shows TPC-H SF 1000 results for the 8-way 6-core Opteron 8439 on SQL Server and Sybase, the 16-way quad-core Itanium 9350 on Oracle, the 4-way Xeon 7560 on SQL Server and the 8-way POWER7 on Sybase.

从这些图中我们不难得出一个结论:eX5系统的性能以及直追目前部分RISC架构的高端系统的性能,而随着至强E7系列处理器在RAS方面的提升,System x3950 X5、System x3850 X5、System x3690 X5,以及IBM BladeCenter HX5在关键业务服务器领域已经占据了市场的高端。

关键应用高可靠:不能只靠CPU

IBM eX5架构面向高性能、高可靠性的应用,这也是其采用英特尔的RISC替换级别至强处理器EX系列——至强E7(代号Westme-EX)及之前采用至强7500(代号Nehalem-EX)的重要原因,但在系统可靠性方面,处理器、服务器平台架构和系统整体构成了可靠性的三个要素,处理器方面的可靠性在此不再赘述,英特尔不断将安腾的RAS特性移植到至强EX系列处理器上,而eX5架构和System X服务器可靠性则由IBM给予了充分的保证。

在系统级可靠性方面,eX5架构主要表现在Memory ProteXion技术的采用,它使得内存保护力度高达业界标准的4倍,它集成到eX5中与现成的DIMM配合工作。一般来说,不同DRAM的2个坏位便可导致Nehalem EP处理器发生故障。

Nehalem EX处理器在x8和x4 DIMM上面都支持SDDC+1,这样当一个DRAM芯片坏掉、另一个完成纠错时,系统仍可继续运行。而eX5与Memory ProteXion组合时,即使在两个DRAM完全坏掉时也可继续运行并且检测错误。

IBM预测性故障警报等高可用性特性能够最大限度地延长应用的正常运行时间。它能提前发出潜在硬件故障警报,触发预防行动,并维护应用可用性。其监控并预警的组件涵盖了硬盘、内存、处理器、风扇、电源等。

“总体而言,基于eX5架构的IBM全新服务器具备了高可靠性,并能进行预测性的故障警报和快速恢复等特性,还配备了Vmcontrol等软件,已经能完全承担起企业的关键任务应用。”Jay Holbrook表示。

针对在关键业务方面的应用,IBM系统与科技部System x全球高端产品总监Jay Holbrook表示,当我们把越来越重要的工作负载跑在x86平台上的时候,可靠性和可用性变得非常关键,IBM认为高可用性有四个组成部分,一是最可靠的硬件,IBM提供业界最好的硬件平台。二是在这个硬件平台有一个预测故障分析,有一个很好的诊断工具,可以在硬件出现故障出现之前就检测到故障。三是更加智慧的软件,是可以根据以前设置好的规则或者是根据我们诊断分析得来的信息及时采取相应的行动,比如通知管理员或者是采取冗余的设置。四是怎么从故障当中尽快的恢复,这也是提高可用性的重要手段,在出现故障之后可以很快的恢复正常。

他表示,基于eX5目前在业界受到的广泛支持——像网络的厂家EMULEX,操作系统像微软、Redhat,还有SAP和VMWare都在广泛支持eX5的架构——让eX5成为了X86市场上最适合RISC-关键业务替换的X86计算系统。

“IBM采用了eX5的技术,目前是唯一的x86的平台可以提供现在的内存扩展技术和I/O的扩展能力,从而使得内存和I/O的扩展性不局限于目前x86的架构,从而得到进一步扩展。eX5是性能优化中心用于扩展内存的,Virtual Fabric是刚才谈到的虚拟网络连接的架构,从而使得I/O的扩展性得到进一步的提高。”Jay Holbrook认为,性能的提升只是eX5平台特性的一个方面,最重要的是,IBM为eX5平台设计了大量的应用解决方案和附加功能/组件,以及业界伙伴的普遍支持,他表示,IBM此次推出了业界第一个也是目前仅有的SAP认证的HANA,这就是最好的“认证”。

SAP HANA:IBM eX5开进

eX5此次的升级加之原有特性,异常丰富,这些内容可以留待后面去讲——技术并非是所有关心eX5的人的重点,而面向SAP内存设备“SAP HANA”的全新的工作负载优化型解决方案,却一定能够吊起很多人的胃口。

随着SAP高性能分析应用软件(SAP High-Performance Analytic Appliance ,简称SAP HANA)的推出,SAP在利用基于内存计算推动革新的历程中又取得了一项具有里程碑意义的重大突破。去年12月,SAP正式宣布了HANA解决方案,及其配套的硬件方案的准入门槛。

HANA的特点是基于大内存进行内存计算,并完全针对多核处理器开发,由于采用了独特的多核处理算法,SAP HANA在不到一分钟的时间内就可以基于5000亿条销售点记录生成非常复杂的分析报告并可以进行查询。取得该测试结果的硬件平台为10台刀片处理器组成的系统,每台处理器配备32个内核。

而对于IBM的System X eX5服务器平台来说,最重要的一点是,SAP HANA的性能指标随硬件升级而线性扩展,因此客户在未来可以通过部署配备1000个或更多内核的系统实现更复杂的实时分析。

考虑到性能方面的需要以及产品定位的问题,IBM主要利用x3950 X5和x3690 X5服务器组建了四套系统和一套可升级选项套件,采用IBM的通用并行文件系统(GPFS),基于Novell SLES for SAP运行。“它是一个完整的软件加硬件以及可选择的服务的解决方案。” Jay Holbrook表示,除IBM硬件、操作系统、GPFS存储文件系统之外,SAP提供了HANA预配置软件,用户唯一需要二次购买的就是SAP的License,而基于软硬件集成的解决方案,让采购后的部署异常简单。

据Jay Holbrook透露,该系统解决方案得到SAP的认证,可使基于SAP的ERP数据分析应用达到每秒处理1.3TB的数据量,以及每小时进行10000次复杂的组合查询分析报告。此外,eXFlash(极速存储套件)和像MAX5性能优化中心这些新的技术,在IBM HANA解决方案中也有所提供。

“我们定制了五种不同的型号,从比较小规模和特别大规模的可扩展的型号配置。这里面随着业务需求的不同,我们有不同的配置,有些是传统的硬盘,有的是有极速存储套件的SSD。还有是FusionIO的SSD的卡,不同的配置带来的不同的性能的SAP HANA的解决方案。” Jay Holbrook所展示的图表中,显示了不同配置的五个型号,而这其中的一些问题,笔者也与Jay Holbrook及徐行进行了深入的交流。

在这个型号列表中,最引人瞩目的就是x3690 X5的SSD(7147-H3X)版本,这是一个采用10个200GB SSD的特别版本,纯粹利用SSD来进行RAID5的数据保护并同时提供存储容量,也因此可用容量只有1.6TB,而其他的型号都采用Flash(SSD或FusionIO)保护日志+传统磁盘提供数据存储容量的模式。

而另一方面,在较高端的三个型号,只采用了FusionIO的320GB或640GB PCIe卡来存储日志存储容量,由于显然此方案中FusionIO卡为非冗余配置,且FusionIO也不可能为全部的320GB或640GB容量进行超量配置,高端型号的FusionIO卡的可靠性就成了一个隐患。

“SAP也在讨论在做性能测试的时候发现eXFlash极速存储套件是很好的,我们希望有一个型号是纯SSD的配置,对于高端来讲,再往上的配置用FusionIO的原因是当容量提升之后,后面的数据存储是4个T以上,放了8个盘以后,系统的扩展能力就不再能够放eXFlash极速存储套件了,所以就转到了FusionIO。”Jay Holbrook的意思实际上可以理解为,在提供了8块硬盘的之后,eXFlash无法再增加8个更大容量的超过50GB(这应该是上一代eXFlash所提供的SSD容量版本)的SSD,因此转向了FusionIO,而全配SSD的版本,则是和SAP沟通的结果,认为应当有一个高性能的全SSD的版本。

此外,Jay Holbrook表示,FusionIO的卡将SSD芯片和控制单元进行整合在一起,本身的控制单元考虑了冗余的机制,由于大部分的数据还是写在外部的硬盘上,FusionIO卡主要是用来存放日志数据,而之所有所有的HANA方案都有采用SSD或FusionIO卡,主要就是考虑“日志对于速度更敏感,而硬盘存储数据的保护性则更重要。”

但最主要的是两点,徐行表示,一是同时在一个eX5系统中装入两块卡的话空间方面比较困难,但FusionIO的卡的可靠性非常高,IBM经过了严格的验证;二是,大部分用户的HANA应用模式,都会是HA的高可用性架构,从这一点来看,日志数据已经获得了很好的保护。

此外,除最低端的S(7147-H2X)型号之外,IBM为其他四个型号都提供了升级选项,实际上这也是L选项(M + SK*) (7143-H3X)的主要作用:用作升级连接模块,IBM的HANA解决方案支持通过L选项(M + SK*) (7143-H3X)的双节点配置,让用户可以通过内部连接获得更高的单节点性能。

功能组件与技术亮点:从MAX5、eXFlash说起

在eX5架构中,IBM最为突出的就是MAX5和eXFlash功能,前者为eX5架构的服务器提供了扩展的内存容量,利用至强E7的一条QPI通道,在用户后续上线虚拟化应用之后,提升系统的容量,而对于没有虚拟化需求的用户则满足了更小的四路及八路服务器的空间尺寸;eXFlash则让用户能够通过扩展SSD获得高性能的启动及前端处理速度,更适合前端接入应用的业务环境。

在本次升级中,通过灵动分区技术使双节点x3850 X5添加了2个MAX5性能优化中心,从而提供了节点故障切换能力,不过主要的变化,实际上是应用模式的变化,从下面两张图可以看出,传统的应用模式只有1台服务器+1个MAX5扩展的模式或两台服务器的双节点模式,而在新的应用中,IBM允许用户实现双节点同时搭配MAX5扩展。

随着至强E7和eX5芯片组的支持,目前MAX5性能优化中心组件已经可以支持32GB DIMM以及低电压DIMM,不过,其主要的应用领域,还是通过利用一条QPI带宽,在未配置满全部的处理器的情况下,获得内存的大容量的提升,打破原有所限制的内存容量,“无需为了获得最大内存来购买4个昂贵的处理器。”

eXFlash极速存储套件,主要是通过SSD和高速控制器结合,提供更高的性能替换传统的机械硬盘,目前x3850 X5和x3690 X5分别最多支持2个和3个eXFlash套件(每个套件支持8个SSD)。

据IBM方面表示,其能够提供顺序读/写250MB/s,随机读/写4K数据块30K和20K IOPS的性能,而每个eXFlash极速套件现在通过使用新的200GB的SSD(1.8寸 HS SAS SSD背板,使用6Gb SSD HBA,IBM提供50GB和200GB的1.8寸SATA MLC SSD),大幅度提升了可加速的容量——与一年前相比,更大容量的600GB 10K SAS硬盘已经普及。

“用新的eXFlash极速存储套件,我们可以只用3%的成本,就是说比以前便宜97%,而且电力仅仅是以前的1%,降低了99%的功耗,就可以实现相同速度的IOPS,每秒钟24万的IO。” IBM系统与科技部System x全球高端产品总监Jay Holbrook表示,传统的技术如果达到同样的240K,就是24万IOPS的话需要用80个存储柜,就相当于有800个盘,每个磁盘是300个IOPS,总共是24万。eXFlash大幅度的提升了系统IOPS的性能。

全面面向虚拟化应用

“可以在一个机器里面部署很多的虚拟机和更大的虚拟机,内存的扩展能力也够多,这是对虚拟化的应用能力很强的。我们在设计eX5的时候,考虑到虚拟化和数据库的应用,这也是刚才谈到在现在的业务当中发展最快和应用最广的两种,一是虚拟化、一个是数据库,也看到越来越多的关键业务应用跑在X86上,而这些关键应用最需要的是可靠性,eX5带来的是最可靠的x86的平台。”Jay Holbrook表示,虚拟化在四路、八路及以上的系统更为普及,因为虚拟化更能够发挥出这些系统的性能水平,因此eX5服务器的设计重点之一就是虚拟化。

“虚拟化的普及和工作负载规模的增加使内存和I/O变成了新瓶颈,虽然每个CPU的内核数量逐代增加,但系统内存和I/O灵活性并未跟上发展步伐。现在,虚拟化需要系统提供大容量内存和灵活的I/O来支持最大的VM灵活性。”Jay Holbrook向记者表示。

虚拟化的问题之一就是复杂的网络连接所造成的数据孤岛问题,IBM在eX5架构中采用了虚拟交换架构(Virtual Fabric)打破I/O瓶颈并且简化部署流程,其基于Emulex所提供的CAN网络聚合技术,能够在一块CAN卡上,实现以太网(10GbE无损以太网)、FCoE及iSCSI的能力,避免了复杂的LAN和SAN容量规划和网络孤岛问题。

同时鉴于数据中心内HBA和NIC卡的冗余问题,实际上CAN卡还解决了冗余的多块卡所带来的成本问题——IBM虚拟交换架构技术可减少用于支持相同工作负载所需的适配器和交换机数量,从而降低成本。目前,在x3850 X5、x3690 X5及HX5、HS22和HS22V刀片中IBM都有所提供。

VMControl则瞄准了虚拟机的可靠性问题,IBM VMControl能够监控硬件并且在硬件故障发生之前自动转移工作负载,VMControl提供了单一工具来同时管理和虚拟服务器。假如用户配备的是VMControl Express版本,就可以免费下载Systems Director插件。System Director具备自动化功能,以便向VMwareVMotion发送物理警报。

作为可靠性的保障,VMControl会跟踪硬件的运行状况,而且自动可以把系统的虚拟机从不可靠的硬件上或者有可能出现问题的硬件上迁移到另一个机器上并且启动虚拟机。主要利用虚拟化平台的迁移功能,如VMware的VMotion技术实现。

去年IBM正式向市场推出了IBM Systems Director VMControl 2.1,并作为Systems Director的一个组件提供Express Edtion。其中VMControl标准版捕获来自活动系统的信息,然后将捕获到的信息存储到一个可重复使用的系统镜像资料库中,也称为虚拟设备,IBM Systems Director VMControl标准版提供从一个中央位置管理虚拟设备和自动部署虚拟设备的支持。

“现在已经有50%多的工作负载已经被虚拟化了。中国还没有那么成熟的虚拟化的应用,但是我们看到这个趋势是非常明显的,我们相信中国IT的发展会很快的跟上全球步伐。”Jay Holbrook最后向记者表示。

此外,灵动分区(FlexNode灵动分区)故障切换功能引起了媒体的关注,由于这项技术面向“多路服务器中出现的不可恢复的故障,”力图提升“eX5为最可靠的多节点系统”,但是,由于双节点运行情况下,出现宕机的系统会自动重启,尚与HA有较大的差距,灵动分区(FlexNode灵动分区)故障切换的功用到底面向何种情况,引发了一场讨论。

“HA实现的可用性的级别不太一样,HA是在应用层面,在两台机器上实现,这个是在一台机器内部实现,而如果是两台机器中的一台宕掉了,另外一台的负载就会很大,灵动分区提供了另外一个级别,就是不完全宕掉还有一半能用。” Jay Holbrook表示,确实存在其中一个节点重启过程中,另一正常节点负载压力过大的情况,但是这项技术毕竟提供了一定程度上的保护,结合HA来用,等于有两个级别的保护——“Activ-Active情况下,灵动分区还是很有用的,它提供了更高级别的可用性。”

作为IBM的智慧计算的一部分,eX5提升了System X的“智慧水平”,Jay Holbrook表示,“在2011 IBM论坛上,IBM正式发布了‘智慧的运算’(Smarter Computing)战略。‘智慧的运算’是帮助客户实践‘智慧的地球’理念的重要战略,包含大规模数据整合、优化的系统,以及云计算等新兴服务交付模式。”

他认为,对于IBM System x服务器平台,IBM拥有业界先进的第五代X架构(eX5),通过MAX5(性能优化中心)、eXFlash(极速存储套件)、FlexNode(灵动分区)、Systems Director、IMM and uEFI等先进技术,IBM System x平台提供了更高的性能、系统利用率和内存扩展,以及更低的成本和更简单的部署。此次推出的System x服务器专为数据应用而设计,全新的工作负载优化系统将有效的帮助用户提升处理海量数据的能力,从而加快其云计算实践的进程。

未经允许不得转载:DOIT » IBM eX5升级:性能与可靠性双创新高