DOITAPP
DOIT数据智能产业媒体与服务平台
立即打开
DOITAPP
DOIT数据智能产业媒体与服务平台
立即打开

从山大高性能集群看HPC的发展趋势

HPC市场正发生着微妙变化。近日,浪潮为山东高性能计算中心提供的基于刀片集群的天梭TS10000高性能集群系统已正式投入使用,承担着国家"211工程"、"985工程"等山东大学重大科研项目的计算工作。在计算平台部署时用户并未采用RISC产品做胖节点,而是选择了浪潮八路服务器天梭TS850。自nehalem-EX发布以来,多路IA服务器取代non-x86服务器一直广为人道,该项目作为这一趋势的微小注脚,或许意味着,用不了多久,HPC市场将成为x86一家独享的舞台。

HPC的经济约束凸显

山东高性能计算中心位于山东大学,不仅要承担山大不同学科的高性能计算服务,还对社会开放,涉及物理、化学、生物、医学等领域的十几款应用软件,不同软件的应用特点千差万别。如何根据不同的应用特点设计好系统,对客户、对厂商来说是一个重大的挑战。

其实山东高性能计算中心比较典型的反映了当前高性能客户的需求特点。随着中国快速步入HPC普及阶段,科研、生产等应用领域对HPC依赖加深,高性能设备爆发式增长,HPC的投资效率、TCO等经济因素也纳入客户考虑范畴。

基于对高性能计算领域的深耕,浪潮为山东高性能计算中心提供了基于刀片集群的天梭TS10000高性能集群系统,涵盖双路、四路、八路、GPU服务器丰富节点,能够促进系统内部服务器、存储、应用之间最大限度趋近协同运算,全面满足了山东大学不同科研项目对不同应用的高计算需求,计算峰值可达10万亿次。该项目具有水冷化、刀片化以及八路IA三个技术特点,最明显的当属多路IA服务器天梭TS850的采用。

HPC迎来Nehalem-EX

相比于以往的IA平台,Nehalem-EX更多内核、更大内存带宽、更快直连架构、更强RAS性能的注入,使多路X86有了质的提升,综合表现越来越接近于以往高高在上的小型机系统。多路X86势如破竹,迅速攻占HPC高地,从各大OEM厂商不断推出系列产品的热情度也可见一斑。山大该项目的胖节点天梭TS850,就是中国第一款自主设计的八路服务器,采用紧耦合共享内存、硬件分区等高端服务器技术,有64核心,128线程,性能强大,可用性极高。IA与Non-x86的新一轮战争打响了。

X86已经把non-X86几乎挤出了高性能计算领域,从今年的top500排行榜看,只有IBM的产品部分采用POWER处理器,安腾以及SPARC几乎从这个领域消失了。当前只有极少数的高性能应用需要SMP并行共享式内存,比如ANSYS、ABAQUS等软件,这虽然属于HPC的边角市场,但是也一直是小型机的固守市场,RISC的高扩展技术门槛把X86牢牢的堵在了门外。但是,多路nehalem-EX让RISC的这块阵地有失手的可能,从公开的数据看,Nehalem-EX在SPECint-rate 2006、SPECfp-rate2006两项测试中,成绩是UltraSPARCT的2倍多,是power7的0.75倍,nehalem-EX已经具有与non-X86同台竞技的能力。

但是从性价比角度来看,优势十分明显。据intel的数据,采用nehalem-EX的高端系统总成本可以降低20%。而且根据市场整体数据也可以进行大体的推算,X86服务器和non-86服务器各占整体市场销售额的半壁江山,但是x86服务器贡献了整体销量的95%以上,不难得出,non-86服务器的均价与X86的均价相差10多倍。而且,购买高性能计算的通常是高校、动漫基地、工业设计等客户,并不像金融、电信等高端客户那样预算充足,不会单纯追求计算速度,这就让IA服务器的价格竞争力得到了充分发挥。

更为直接的是,nehalem-EX可以通过添加第三方控制芯片的方式扩展到256路,在单机计算上X86的扩展性技术门槛也不复存在,RISC的最后一块领地有可能丧失。

IA在高性能领域一统天下的势头,与其说是刻意与RISC竞争的结果,不如说是客户抛弃了RISC。在计算技术还不发达的上世纪,用户对于性能的追求超出了一切,所以,高扩展的RISC体系一直垄断了整个高性能市场、甚至服务器市场。当高性能计算开始普及,当用户开始成熟,当计算力供给过剩、HPC从卖方市场变成买方市场的时候,RISC在固守封闭体系,仍然希望捆绑用户以牟取高利润,结果就是成本居高不下,自然被用户所抛弃。

未经允许不得转载:DOIT » 从山大高性能集群看HPC的发展趋势