DOITAPP
DOIT数据智能产业媒体与服务平台
立即打开
DOITAPP
DOIT数据智能产业媒体与服务平台
立即打开

旁观看法:曙光5000A的现实意义

曙光5000A进入全球高性能计算TOP500榜单实际上在半年前就已无悬念,当时人们谈论的是这款目前中国境内部署的最高性能的计算机群到底能够在半年后,也就是刚刚发布的2008年11月TOP500榜单中排行第几——现在,这一切已经尘埃落定,以0.6万亿次之差领先第十一名的,是曙光5000A而不是IBM另一套蓝色基因,而TOP10的成绩,让大部分行业从业者们相信,中国在HPC领域已经处于“世界领先水平”,或者,至少已经和世界领先水平很接近了。

而与此同时,中国市场共计部署了15套位列TOP500榜单之中HPC系统的成绩,也同时以从12到15的轻微数量变化,裹挟着今年中国高性能计算TOP100的大幅度Linpack数值提升,被少部分人解读为中国市场的HPC应用环境正趋向成熟,且整个市场日益受到重视。

但在我眼里,我们应该解读更多的有关中国TOP100和曙光5000A产品的现实意义。

现实意义之一:优化水平提升

首先我要提到的,是一位媒体朋友采访曙光总裁历军时的一个小发现,这位细心地发现:‘曙光5000A申报TOP 500的Linpack成绩是180.6万亿次每秒,其实第11位IBM的另一套蓝色基因是180万亿次,相差仅0.6万亿次每秒,而此前11月初国内TOP 100公布的曙光5000A成绩是174.9万亿次每秒,时间上相差不过半个月。’

对于这一发现,我不禁暗暗叫好,他的细心令我非常感动而且感激,虽然0.6万亿次的领先不能说明太多问题——这一点历军承认,“高性能计算机的Linpack测试性能是可以不断优化的,每次测试在系统配置、驱动和测试算例等方面都有进一步优化的空间,业内其他厂商也都是这么做的。”

历军还向媒体谈到,“其实曙光5000A最初测出的成绩是165万亿次每秒,中间我们也是在不断的进行软硬件的优化,每一次都有5%左右的提升,虽然我们申报TOP500的成绩是180.6万亿次,但从我个人的经验判断,曙光5000A的成绩还有提升的空间,如果再有一个星期的时间,应该可以测到190万亿次。”

但在这一点变化上,我看到了对中国HPC行业的一次极大促进,其意义远远超过TOP10的排名,从我对HPC的理解来看,硬件架构的实施难度随着内部互连技术、虚拟化技术以及业内产品标准化的进步正逐步减小,这也就意味着,关乎HPC最大的问题在于优化,其中核心包括硬件层面的性能调优和软件层面的性能优化,而在此前这两方面是中国HPC制造商最欠缺的地方——我曾记得IBM的一位工程师为我演示的集群系统经过调优之后所获得的30%的性能提升,这让我大大吃了一惊,而这位工程师的“法器”是IBM专门为HPC开发的一套性能调优工具包,据说,包括Cray、SGI等HPC领域顶级厂商在内的供应商都具有自己独特的调优工具包。

因此,从优化即系统调优角度,我认为曙光5000A具有极强的现实意义。

现实意义之二:个人HPC

提起曙光的HPC,我不得不谈起他们推出的桌面级HPC,抑或称之为个人HPC,这个产品从去年我就从曙光的不同渠道有所耳闻,并翘首以待。其实,直到现在,我也没有听到或看到高性能计算机到底以什么计算量数量级来进行划分,但是更加廉价的计算量是业内人士一直在追求的,在处理器性能不断提高,集群效率不断跃升的今天,更加廉价的计算实际上需要突破一重将HPC划归“贵族”或“高端”运算的迷雾——高性能计算,只是从客观角度说明了其性能的“高”而从未将应用领域和价格区间束之高阁。

从2008年中国TOP100来看,北京水晶石影视动画科技有限公司、北京快网科技有限公司、好莱坞(中国)数码艺术研发中心(HD)(江苏)以及惠普建设的无数个“游戏公司”项目,是最令人感兴趣的,从2005年还是2006开始,我们就已经在TOP100榜单上看到游戏、动画设计等应用在建构基于集群技术的高性能计算机,这说明,HPC在中国的应用已经正逐步走下物理、气象、数学等科研领域的神坛——虽然这得益于过去几年虽然火爆却也备受苛责的网络游戏和动漫产业。

在IT行业中,金字塔效应同样有效,正如我之前在2008年6月的榜单发布时所谈的“法拉利与F1故事一样”:

单壳车身结构、通风碟式煞车、TDI涡轮增压柴油机、全时四轮驱动这些技术现在看起来都已经是承载普罗大众的普通民用车技术中的简单搭配,但是,在几年,甚至十几年以前,这些技术却仅仅是栖身于F1方程式、勒芒耐力赛和WRC世界拉力锦标赛等高端赛车运动中的核心技术,虽然在大部分抵制赛车运动的人看来,像F1方程式赛车这样的极速运动,应该被彻底取缔,从而减少大量浪费的燃油与金钱,投入到对民用级轿车的安全性研发之上,但是,他们却忽视了一个决不可忽视的问题:我们所乘坐的民用车实际上早已经承袭了大量高端赛车运动所倾力研发的技术,而在未来几年中,这些高端赛车运动为了提升速度、节省燃油以及保证赛车手安全性的研发成果,还将持续的下移到我们的"真实生活"中来。

个人HPC(桌面HPC)的出现,尤其是出现在曙光的手中,说明我们的HPC企业已经能且正在进行将高端技术下移的战略决策和产品研发,这对于未来中国服务器产业的促进绝对具有极其重要的意义——对此,历军表示“我们和Cray公司之间都不知道对方在开发这类产品,但产品出来之后,发现有很多相似之处,这说明我们都看到了这样一个发展趋势。”我认为,他的说法十分正确,高端技术的下移是一种必然。

但是,对于中国服务器及高性能计算市场来说,我一直认为曙光的成功有些“凌空高阁”,本着“辩证看问题”的一贯思路,我必须要对曙光5000A及中国的HPC行业挑一些问题。

TOP100:仍应冷眼旁观

从TOP100来看,有曙光虽以20余台位列前茅,但除曙光之外,包括联想、宝德、浪潮在内的中国厂商,基本上以3、4套居多,这很显然反映了一个市场上普遍承认的事实:在中国曙光在HPC市场一家独大。但是,我的看法却可能给曙光和中国HPC市场泼一盆冷水,首先,曙光在HPC市场上的优势毫无疑问,但是在通用服务器市场上,无论是曙光、浪潮还是宝德、联想,其业务范围和业务等级仍然难与国外企业相抗衡。

以曙光为角度来看的话,我们看到,这实际上说明其并未在除HPC之外的业务上充分的利用其在HPC业务上的优势;而反观浪潮等企业来看,HPC领域的萧条并不能说明中国HPC市场处在萧条期或是市场初期——否则我们不会看到在2008年的TOP100中,有88套HPC系统是在2007~2008两年中建立和实施的,因此,我是否可以说在HPC市场上,浪潮、联想和宝德仍然未予以足够重视和技术投入度?

说完供应商们的问题,我想或许会有许多人跳出来与我争辩,好,我现在想谈谈另外一个问题:软件。

从应用软件的移植与优化方面来看,据我所知目前只有中国某石油石化企业有自己所开发的适用于高性能计算系统的软件系统,并已经投入到应用中,在物理研究、数学演算、工程计算、石油矿藏地质勘探和气象图形学研究中,大量的外国软件仍然占据着几乎整个市场。

在这个问题上,历军也做了相应的回应,他谈到:“但就今天而言,我们的应用程序开发、数学模型还不够好,能够把机器性能跑满的应用还很少。只有一些科学家们自己开发的模型才有可能用到100T、200T这么大的规模。”不过,由于曙光的定位问题,历军表示,“曙光的定位决定我们不会去开发应用软件,我们要做的是怎么帮助用户在计算机中提高其算法的运行效率。比如,过去是用程序叠代的方式来优化,我们可以用硬件来固化,将一个算法用逻辑门的方式来实现,这可以大大提高效率。”

前不久我记得有媒体表示,对于曙光5000A来说,处理器的国产化是目前最紧迫的问题,并由此质疑曙光的曙光5000A“国产性”,对于这个问题,我觉得并不值得质疑,首先,曙光是服务器厂商,处理器只是拿来用的几十个配件中的一个,是否是龙芯或是“汉芯”无足轻重,另外,处理器的研发是一个漫长的过程,IBM能做出cell这样的产品,要归功于其数十年的芯片研究和庞大的人才队伍,在中国,人才队伍和技术积累仍处于初级阶段。

但这并不表示我认为曙光5000A已经完美,在我看来,曙光5000A在曙光的研发中,有一个重要的一环被缺失掉了,且目前尚未有人提及,那就是内部互连技术。

在我之前的文章《HPC TOP榜:安腾与Infiniband很受“伤”》中曾提到, HPC的问题已经从Linpack值转向效率和能耗,而目前最能够解决效率的办法是内部互连技术的改进,这对于历军所认为的市场未来走向下的产品更是尤为重要——历军认为,“目前集群结构已经走到头了,你能看到今天TOP10中的系统都不是传统上完全对称的Cluster,而是一些变形的架构。我认为高端高性能计算机的下一步趋势主要会表现三个方面:一是通用与专用相结合的系统,二是专用处理器会得到大规模应用,三是针对专门问题和应用软件去设计机器。”

这里面就存在一个问题,在TOP500中,越来越多的高性能计算高端企业,在倾向于使用自己开发的内部互连技术,如第二名的千万亿次机CRAY XT5美洲虎就采用了采用CRAY公司自有的互连技术MPP架构,而Numalink、Proprietary等内部互连技术也正在逐步被其各自的拥有者所采用,而且,我们也清楚的看到了包括Cray在内的企业在应用自有内部互连技术之后,对原有的Infiniband技术的补充和对效率的提升,而在这一点上,曙光还差的很远——Infiniband不是全部,什么时候曙光有了自己的“NUMAlink或是Proprietary”,曙光在HPC领域才算真正与国际接轨了。

当然,我们在此刻对于曙光5000A仍应给予更多的鼓励和关怀,只是,当我想起曙光5000A的前辈4000A时,不免有些唏嘘:2004年,部署在上海超级计算中心的曙光4000A,以11.2万亿次Linpack测试值历史性地闯入TOP500前十名,但是更多人在将精力集中在TOP10上之后,我们并未看到一次“跃进”似的发展,一直到今天,5000A才再次闯进前十,并将IBM在中国市场稳坐多年的No.1拉下马来。

如果我们再次经历一个如此平淡的HPC周期的话,此次曙光5000A的记录将与他的兄弟一样,寂寞的落满灰尘,我相信,这是所有人都不希望看到的结果。

未经允许不得转载:DOIT » 旁观看法:曙光5000A的现实意义