DOITAPP
DOIT数据智能产业媒体与服务平台
立即打开
DOITAPP
DOIT数据智能产业媒体与服务平台
立即打开

Doserv.com分析:高性能计算当前如何冲出瓶颈

英特尔公司高性能计算部门的高级主管Stephen Wheat于上月在高性能计算大会上做了一个报告。Wheat以对于英特尔这家世界最大芯片制造商领先领域的回顾以及将面临的挑战作为报告的开头。而他报告的总结部分则更为出彩:介绍了高性能计算业及其作为一个独立市场的未来风险。

问题之一在于市场空间的识别。Wheat在近期的一次谈话中说,"越来越多的高性能计算配置行为完全没有进行任何市场研发。"如果期望高性能计算仍为一个可识别的市场领域,则需要有其自身的研发行为。

高性能计算的研发有两大阻力:其一是高端计算的投资仍然缺乏,而行业集团和政务也在重复确认对于增加资金和合作的需要。由于缺乏进行核心计算研发的外部投资,高性能计算技术的供应商已经停止对高性能计算技术研发的投资,开始投资于提高业务利润的创新行为。

就其自身,这一改变没有很明显的不利。很多行业都在进行与其业务无关的研发,不是吗?

尽管高性能计算也经历了其产品经济的戏剧化转变及用户的变化,在过去的十年中,FLOPS价格持续下降,因而企业配置了大量FLOPS,形成了FLOPS的军备竞赛。"在实施过程中,安装的成功不仅仅是由应用软件的性能来测定的,而是由解决方案的Linpack实施来决定。"

用户经常期望对配置的明确说明,他们或者是缺乏好的工具或者是缺乏词汇来评估配置的有效性,因此他们通常关注一个可以明确说明的测量方式。而供应商没有对关注此项技术的用户做出回应,因此导致产品价格下跌、产品设计日趋基于普通技术。一位业内人士告诉我说,高性能计算硬件行业的利润下跌了300%,原因是普通技术用于了高性能计算行业。

你可能看到的情况是如果公司并未对这一技术方式做出回应,而价格并未下跌。你是对的。自由竞争市场的情况是公司得到了他们所期望的回报;如果他们不进行研发投资,则既无投资也无收益。问题在于超级计算不仅仅是一项技术。

如果消费者不希望支付研发费用,则供应商需要将六个刀片都装在新吉列剃须刀上,这样每个人都将有更好的感受,因为他们的期望本是五个刀片的效果。但是,正如已经指出很多次,超级计算是很多基础科学(这些科学是促进社会发展的关键,无论是医药还是能源)采用的核心技术。正如Dan Reed–当前是微软公司Scalable和多核计算战略主管–在很多年前的一次大会陈述中所指出,高性能计算是一项"全球智力放大器"。高性能计算所面临的问题(如软件的几百万线程问题,多核工具和编译器的问题,内存和输入输出系统带宽的问题等等)需要解决,这样才可以使得依赖于高性能计算技术的学科继续发展。

SGI的高级副总和产品经理Dave Parry指出,公司在评估大型采购过程中所面临的一个问题是将其设定为了核心问题,而只考虑特定系统所提供的价格。这排除了所有公司需要支出以维持运行以及给超负荷工作工程师的补助等等其他众多费用。一家公司或许愿意在一个或两个采购中支付这些资金,以表明自身的市场地位。但是当公司的大部分用户都开始要求价格均等,平衡就被打破了。

对于这一利薄而具竞争力的价格,或许更大的问题在于,尽管大公司或许经历一些困难,小公司则完全被拦在了这一市场的门槛之外。Scalable Informatics 公司的创建者和CEO Joe Landman是这样说的,"如果由于等待一项大业务的付款,一家小公司的收益降低,因此他们则无法给其他小业务抽出资金和工作量以实现更多收益,在这种状况下,小公司将很可能处于困境。或持市场观望态度,或是缩小业务范围,同时延缓更新速度。

为什么这些都会有影响,为什么英特尔会讨论这些内容?按Stephen Wheat所说,英特尔已经开始了其高性能计算业务新一轮的发展。公司当前看到了与我们协会合作的一个机会,目的是通过使高端获益以及平行计算的方式来推动芯片技术发展。在我们协会的高性能计算技术研发还处于低迷阶段,英特尔就已经准备好深入高性能计算技术的研发。

当然,很快很多供应商指出他们正在进行革新。比如,戴尔公司的Kevin Noreen指出戴尔正在进行数据中心的整体革新。但是这些革新都延伸了价值链,且有利于市场发展。更重要的是,由于当前高性能计算技术硬件和软件的内在固有问题,因此在这些阶段未能解决高性能计算技术用户所面临的最基本问题。

可行的解决方案是什么?Wheat有几个可选方案。

他的一个建议是使市场摆脱收购的"胜者通吃"局面。对于某些特定的方案,无论多少个供应商在投标,只有一个会夺标。由于没有成本恢复的机会,投标失败的企业实际是亏损的:基准测试的支出,标书的编写,业务分析,以及定价,而准备一个大型投标则需要一年到一年半时间。SGI的Dave Parry说供应商准备一个大型投标的支出最高可达到一百万美元。

Wheat提出的另一个建议是结束长期投标以及过于细节化的技术说明书和对于性能缺失的严格处罚。很多高性能计算技术采购的时间当前超过了大的芯片厂商制作一款新的芯片所需时间,而这意味着这一供应商计划设定特殊的性能参数以适应这一情况。很多厂商推荐一系列更频繁、时间更短的收购(使供应商更有效地估计和管理风险,同时对市场变化做出更快捷的反应)。

另一种方法是什么?为一次收购做出明确地投资计划并计算无收益的工程成本。这可以通过先提出简洁的计划,以选出少数种子企业,接着让这些种子企业做深入计划书。进入第二轮竞标的供应商应该被作为顾问,同时退回以下几部分资金:一是基准测试资金,二是将大型系统计划进行合并所付出的工程成本,三是用户网站用于支持提议系统的设备计划。这很明显仅对于大型收购有意义,或许是前15的系统。然而尽管这种方式对于我们是全新的,但在其他领域已经存在,比如企业计算领域。

很多我采访过的人,包括SGI的Dave Parry和惠普公司的Ed Turkel,强调协作收购–建立起供应商和被收购企业之间的合作团队,同时更多地实行奖励而非惩罚措施。惠普的Turkel将ASCI Q的收购看作协作的紧密模式。在这一案例中,DOE将惠普介绍给了Quadrics,及其他三个流程厂商,共同构建了一个解决方案。

这些建议的目的都是提高奖励或者减少购买程序的风险,但是这一过程会使被收购企业处于困难的境地,特别是联盟的被收购企业支付税款。购买者对于其企业有一个信托责任,以确保供应商供应其所承诺提供的产品。将条款和限定放宽松,减少惩罚,给供应商付款以递交标书,这样被收购企业和联盟机构可花费更多资金用于产品,而企业在缺少激励的情况下也愿意参与进来。

Dan Reed建议说需要一个完全不同的方法来直接处理基础问题(例如缺乏高性能计算的研发支持)而非通过收购程序。据他说,我们所需要的是一个长期战略整合研发项目,并非更好的收购模式。

惠普公司的高性能计算部门产品和技术营销经理Ed Turkel重复了这一观点,同时强调了对高性能计算研发的支持也可实现对于商业可行性技术的开发。

现已存在的众多材料都支持高性能计算技术进一步研发。所需的仅为领军企业在HEC RTF和PITAC报告中采取行动,同时就高性能计算研发活动达成联盟协作。当然核心是这一协作不仅仅关注购买行为,更重要是在研发活动上进行协作。已经有一部分机构参与到购买流程和收购活动的同盟级协作。正如Reed所观察到的,这没有提高高性能计算市场的活力。"你无法仅通过一系列收购活动来构建一个国家战略。"

我所采访过的企业人员都强烈希望研发方面有新的政府支持,并且不仅仅是关注大型或者小型项目小范围的投资组合。大部分人的看法是我们需要的不仅仅是一个或两个HPCS类型的活动,这是完全不够的。一个均衡的投资组合,在众多机构(无论是小型、中型和少量包括行业和学术的大型活动)之间进行协作最可能使得技术不仅仅适应了高性能计算协会的需要,也可以适应普通硬件市场动态发展的需要。

当前的局势很好,因为成百万计的普通软件开发商开始投资于多核软件开发工具,进行相关研究和协作,目的是满足市场需求。正如最近所宣布的微软/英特尔公司进行协作,这些未来的努力将很可能集中在一个插槽上的内核,这使得几百万桌面用户的系统有了明显提高,但是对于高端用户来说则提高并不明显。

当然,在完全没有激励的情况下,大多数致力于提高高性能计算业务利润的企业也在积极建立一个高性能计算市场。

风险并不在于高性能计算市场将崩溃。事实上,如果真的是这样,他们将一致采取实际的措施即刻拯救这一市场,同时政府也将进行支持。实际上危险在于高性能计算基数市场将不再存在,一段时期一个公司会慢慢退出这一技术领域,整个市场慢慢消失。高性能计算技术的消费者已被证明他们希望为这一传统的高差别定制技术买单。正如Joe Landman所说,"我们处在一个黄金时期,我们可用最低的价格买到最高性能的产品。"在企业的技术更新人员规划一条完全不同的路之前,或许这就是我们可以期待的一切了。

未经允许不得转载:DOIT » Doserv.com分析:高性能计算当前如何冲出瓶颈