DOITAPP
DOIT数据智能产业媒体与服务平台
立即打开
DOITAPP
DOIT数据智能产业媒体与服务平台
立即打开

高性能计算机(HPC)刀片服务器集群解决方案

行业应用

高性能计算多年来一直是科技综合实力竞争的制高点,也在一定程度上反映了各大公司在系统研发方面的实力。作为行业的技术领先者,IBM 公司在这一领域占主导地位。在 2007年 07月最新公布的全球500强超级计算机中,192套来自IBM,其中6套位于前10名,45套位于前100名,其每秒钟的运算能力总和达到了3121万亿次,是500强所有系统运算能力总和的 41.66%,占绝对领先地位。

在高性能刀片集群的的市场中,IBM 也一直处于领先地位。目前速度最快的刀片式 Linux 群集,位于欧洲巴塞罗那超级计算中心的 MareNostrum(94TFlops),采用 IBM JS21 刀片,在目前500强超级计算机中排名第九。在中国高性能计算机前十强中IBM 占据4席。其中包括基于POWER 刀片的南开大学"南开之星"集群系统(基于JS20 刀片4.7TFlops)。

JS21 的强大的向量运算功能,在某些领域中具有突出的性能优势,如生命科学、计算化学,同时也适用于地震资料处理、信号与数字影像处理,自主开发的应用等方面。

高性能计算(以下简称 HPC)类型一般分为SMP 和集群式两种,集群式的解决方案主要面向一些计算密集型的应用。

系统结构和部署

刀片式HPC 集群通常由以下几个部分组成:

管理节点,管理节点是集群的控制中心,作用包括整个集群的软硬件管理、计算节点的快速远程部署、提供用户登陆接口、任务调度与提交。管理节点可以考虑采用p505、p510 或者p520 服务器。

计算节点,集群中用来计算的资源。 在我们的方案中,每片 JS21 就是一个计算节点。

存储节点,集群中可以采用专门的服务器连接存储。然后通过各种网络文件系统协议(如GPFS、NFS),给计算节点提供网络文件系统服务。存储节点可以根据集群的大小部署多个,实现负载均衡或冗余。

管理网络,管理节点与计算节点中专门用于软硬件管理通 讯的网络。通常为以太网络。

计算网络,集群中专为计算节点间通信的网络,根据不同计算类型对网络延迟带宽的要求不同,有高速以太网,Infiniband 网络,Myrinet 网络等各种高速交换网络可供选择。

 

概括来说,JS21 刀片优势在于其出色的浮点运算能力、优秀的硬件品质、以及丰富的软硬件支持。

优势分析

 

出色的性能

JS21刀片与IBM 超级计算系统深蓝一样,采用了IBM PowerPC RISC 处理器,PowerPC 其中的PC 即Performance Computing,是基于 POWER 专为计算而设计的 CPU,JS21刀 片采用了IBM PowerPC970 RISC 处理器,支持IBM AIX 5L 和Linux 两种操作系统,完全兼容 64位/32 位高性能计算应用。根据Linpack 高性能计算机基准程序测试,单台采用四核 2.5GHz 处理器的JS21 服务器的实测浮点运算能力可以达到33.7 GFlops,远远领先于其它4路RISC系统 。

IBM PowerPC970 芯片上具有独特向量处理单元,能够在一条指令周期内对多条数据进行操作。如下图所示:

 

如果应用程序针对向量(或称为 AltiVec)进行优化,则可以成倍地提高计算效率。以在 HMMER 2.3.2(一种通过隐马尔可夫链模型进行生物序列分析的软件)为例,如果采用了优化版本,计算时间可以缩短 3到 4倍。编译也支持对应用程序的自动向量化编译,无需客户更改代码,即可获得 altivec 更您带来的性能提高。

 

更快更稳定

构建高性能计算系统是对于操作系统、编译器、互联设备驱动、作业管理调度以及文件系统管理等等涉及各个系统层面的软硬件的整合。对商业运行的集群系统其可靠性和可用性更被放在第一重要的位置。

IBM 针对 JS21 刀片集群有非常成熟的高性能解决方案,集成了众多 IBM 的先进的软硬件技术和强大的技术服务支持。IBM POWER 家族的一贯的优秀品质,值得您的信赖。

丰富高效的交换网络

在高性能系统的搭建过程中,选择一个正确高效的数据交换网络是能否达到甚至超过您对集群性能预期的关键。IBM BladeCenter JS21 所支持的外部连接极为丰富,除了常见的千兆以太网和 SAN 存储交换网络以外,JS21 还支持适用于高性能的计算的 10Gb 以太网,Infiniband 网络,以及 Myrinet 网络。

JS21 建议配置

针对一个 5000亿次的高性能解决方案,IBM 提供的建议 BladeCenter JS21 刀片服务器 HPC 集群配置如下:

 

简述:

该方案是较常见的 HPC 配置。其中一共配置了 1个 IBM BladeCenter H 刀片中心,14个 IBM JS21 服务器,56颗 IBM PowerPC970/2.5GHz 处理器;内存容量为 112GB。

配置 1台 IBM System p520 服务器,同时作为管理节点和 I/O节点;1台套 IBM DS4000 系列存储作为 HPC 的 SAN 存储,解决整个高性能计算的大容量存储需求。是否配置存储及 IO节点取决于客户对存储容量的需求,不是必要配置。

JS21 集群管理软件

既可选择商业软件,也可以选择开源软件。如下表:

未经允许不得转载:DOIT » 高性能计算机(HPC)刀片服务器集群解决方案