初窥华为一小步新Tecal服务器锐意创新

刘禹发表于：12年03月26日 14:41 [转载] 比特网

分享：

[导读]E5家族产品涵盖了单路、双路乃至四路服务器。对整个服务器市场而言，毫无疑问双路产品的出货量和用户需求都是最大的。

Linpack测试

之后我们进行了Linpack测试用来体现E5的AVX指令集对于浮点性能的巨大提升。测试环境为红帽的RHEL6.1，2.6.32内核，支持AVX指令集。处理器则是双路8核16线程主频为2.0GHz可Turbo到2.4GHz具有20MB三级缓存的E5-2650工程样片。测试中关闭超线程，根据系统内存容量我们选择了N=89000的运算阶数(测试过程中运算没有用到虚拟内存)。在计算点数以及计算次数方面，我们指定为1，没有进行调优。

Linpack在国际上已经成为最流行的用于测试高性能计算机系统浮点性能的benchmark。通过利用高性能计算机，用高斯消元法求解一元N次稠密线性代数方程组的测试，评价高性能计算机的浮点性能。

HPL是针对现代并行计算机提出的测试方式。用户在不修改任意测试程序的基础上，可以调节问题规模大小N(矩阵大小)、使用到的CPU数目、使用各种优化方法等来执行该测试程序，以获取最佳的性能。HPL采用高斯消元法求解线性方程组。当求解问题规模为N时，浮点运算次数为(2/3 * N^3-2*N^2)。因此，只要给出问题规模N，测得系统计算时间T，峰值=计算量(2/3 * N^3-2*N^2)/计算时间T，测试结果以浮点运算每秒(Flops)给出。

由于在计算的过程中，会分配、占有一定的内存空间，因此依据内存容量合适的设置N的数值，会得到较为准确的计算性能数据。如果N设置较小，内存不能充分利用，则处理能力不能发挥;如果N设置较大，内存空间不能满足需求，则需要经常的执行硬盘读写，从而会有处理器的等待时间，计算时间会延长，测试得到计算性能结果也会受到影响。

CPU相关信息支持AVX指令集

我们也在现场测试了华为上一代基于英特尔5600系列的产品，对比发现新一代的华为Tecal V2服务器的浮点计算性能得到了大幅度提升，接近两倍。

理论浮点峰值是该计算机理论上能达到的每秒钟能完成浮点计算最大次数，它主要是由CPU的主频决定的，理论浮点峰值=CPU主频×CPU每个时钟周期执行浮点运算的次数×系统中CPU核心数目。

在本次测试中的理论浮点峰值=2.4GHz*8*16=307.2GFLOPS

而实际测试数据为279.6097GFLOPS。约为理论峰值的91%。

实测浮点峰值是指Linpack测试值，也就是说在这台机器上运行Linpack测试程序，通过各种调优方法得到的最优的测试结果。实际上在实际程序运行过程中，几乎不可能达到实测浮点峰值，更不用说达到理论浮点峰值了。这两个值只是作为衡量机器性能的一个指标，用来表明机器处理能力的一个标尺和潜能的度量。

[责任编辑：周晓丽]

王胜航:云计算是IBM 核心发展计划

第四届中国云计算大会今日在国家会议中心开幕。据介绍，本届大会在以往产业与技术研讨主题之外，还将通过云计算示范应用案例系列发布的形式，重点展现多年来中国云计算技术创新和应用示范成就，交流云计算应用实践的经验和方法，从而推动我国云计算在各行各业的发展。

官方微信

相关阅读

精彩专题更多

2014企业级IT风云榜

存储风云榜”是由DOIT传媒主办的年度大型活动。回顾2014年，存储作为IT系统架构中最基础的元素，已经成为了推动信息产业发展的核心动力，存储产业的发展迈向成熟，数据经济的概念顺势而为的提出。

华为OceanStor V3开启全融合数据架构时代

华为OceanStor V3系列存储系统是面向企业级应用的新一代统一存储产品。在功能、性能、效率、可靠性和易用性上都达到业界领先水平，很好的满足了大型数据库OLTP/OLAP、文件共享、云计算等各种应用下的数据存储需求。

联想亮相高交会

联想携ThinkServer+System+七大行业解决方案惊艳第十六届高交会