DOITAPP
DOIT数据智能产业媒体与服务平台
立即打开
DOITAPP
DOIT数据智能产业媒体与服务平台
立即打开

曙光助力清华大学构建集群科学运算系统

教育信息化是我国教育实现现代化和适度超前发展的重要途径。服务器作为教育信息化建设的基础设备,其应用涉及校园网络平台的建设、电子教室、教育管理、文件打印、数据库、信息发布、多媒体等方方面面,高性能服务器已经成为我国实现教育信息化的重要途径。 而随着高校应用领域需求的不断扩大,尤其是承载着重大科研计划的领域高校,高性能计算机集群系统成为他们不二的选择。据了解,为此曙光将在今年下半年举行全国教育行业解决巡展,与全国教育行业用户共同分享曙光教育领域成功解决方案及产品。

各大高校对集群科学运算系统需求巨大

进入二十一世纪,集群系统已成为高性能计算机系统的主流体系结构之一,它具有系统性能价格比高、兼容性强、可靠性高、可维护性好、应用领域宽等特点。它采用商品化部件,通过高速标准化网络实现结点间互连,对外提供单一的系统映像,不仅支持大规模科学工程计算、信息服务、事务处理等,更能为用户提供百亿次到万亿次的计算能力。科研领域一直是集群技术,特别是并行计算技术应用最为广泛的领域。

随着社会的发展和信息化技术的不断提升,教育信息化成为各界呼声最高的应用行业。近两年来,许多高校为了提升教学质量和科研实力,相继采用了集群科学运算系统,满足日益增长的庞大的科学计算需求,进一步保持在科学和技术领域的领先地位。

清华大学解决方案基于曙光5000集群架构

清华大学作为中国教育界的顶尖名校,为了提升教育质量和拓展科学研究课题的进度。清华大学材料系携手国内知名的服务器厂商、解决方案供应商曙光公司建设高性能集群计算系统。

曙光公司针对清华大学材料系的实际情况进行了全面的分析、了解,并结合多年的行业经验,为清华大学提供了一套集高性能、高可靠性、高扩展能力、高可管理性于一身的解决方案。该方案采用曙光专为百万亿次大型计算系统设计的5000集群,集群系统由硬件层、系统软件层、集群管理系统、应用层组成。

作为满足清华大学需求的曙光5000A高性能计算集群系统,由20台CB85-F(4路AMD四核)计算刀片、1台A620(2路AMD四核)管理存储节点组成,网络采用Infiniband高速计算网。

集群操作系统采用Linux 64位系统(SUSE Linux Enterprise 10 update 2 64bit),同时配备GNU编译器和应用开发环境,MPICH集群并行环境。

软件管理由曙光Gridview服务器综合管理系统v2.0组成,该管理系统采用模块化设计,能够提供机群部署恢复中心、综合监控管理系统、统一告警平台、统计报表系统、作业调度调度中间件、IPMI管理等多种机群管理功能。

曙光5000A集群系统技术优势

曙光5000A高性能计算机是曙光公司在国家863计划"高性能计算机及其核心软件"重大专项的支持下,与中科院计算所共同成功研发的。曙光5000A采用新型"超并行"体系结构(Hyper Parallel Processing,简称HPP),是中国自主知识产权产品,具有高性能、高效率、高密度、高性价比、低功耗以及广泛适用等特点。曙光5000A适用于各个领域的大规模科学工程计算、商务计算,还可以作为各种数据中心、云计算中心的支撑平台。

体系架构:为适应高效能计算机的要求,曙光5000A在基础架构上进行了创新和改进,采用HPP体系架构,融合了Cluster和MPP两种计算机的优势,使得曙光5000A可以用来构建百万亿次的计算系统,同时保持系统的高效率、易用性、高产出率、低功耗等特性。

计算节点:曙光5000A的计算节点以TC2600系列刀片产品为主,也可以配置曙光其他服务器产品。TC2600刀片产品包含:配置Intel双路处理器的CB60-F、配置AMD双路处理器的CB65-F、配置AMD四路处理器的CB85-F;

Gridview是曙光5000A的核心组件之一:Gridview大型机操作系统继承了曙光DCMM2、DCAS等产品的主要功能和技术特色,基于B/S架构,提供统一的集中管理和监控,主要实现了系统的状态监控、告警管理、统计报表、作业调度、统一操作、系统配置等功能;

可选水冷机柜或风冷机柜两种散热方案:曙光天潮机柜系统(风冷方案)采用业内领先的铝镁合金整体型材结构设计,具有强度高、重量轻、可靠性高以及模块化、拆装便捷等特点;

曙光水冷机柜系统(水冷方案)采用水作为冷媒,由外部水冷机组提供冷却水经由管道输送到机柜内的热交换设备,冷却水在热交换设备内与服务器产生的热空气进行高效率的热交换,可以有效解决大功率高密度服务器所产生的热量。

网络方案灵活:曙光5000A可以根据客户的应用需求选配不同的网络,既可以使用全无阻塞的Infiniband CLOS网络构建计算存储网络,也可以使用冗余万兆级联的分区无阻塞Ethernet互联网络和FC SAN网络构建计算存储网络;

存储系统方案多样:曙光5000A可以根据应用需要配置存储系统,既可以配置简单易用的DAS存储,又可以构建高性能的FC或Infiniband SAN存储,提供较高的聚合I/O带宽;

清华大学建设曙光5000A高性能计算集群系统的意义

曙光5000A集群系统能够满足清华大学材料系庞大的计算需求,该方案集成并融合了计算系统、存储系统、网络系统、电源系统、散热系统、监控管理系统、KVM等模块于一身,通过管理模块的自动优化调节,能够达到最佳的运行状态,发挥出最优的整体性能。

目前,曙光5000A高性能计算集群系统已经部署完毕并且投入正常的使用当中,正在为清华大学材料系的分析研究和学科研究带去精准、高效的计算支持,为清华大学教学质量的提高和研究进度的推进起到了重要的作用。

曙光公司作为国内知名的服务器厂商,长期以来专注于服务器领域的研发、生产与应用,依托超级计算机的扎实功底,立足与自主研发,通过不断技术创新,构建出拥有完全自主知识产权的全系列精品服务器,全面满足了用户从超级计算机到普通PC服务器的各项应用需求,在互联网、金融、电信、生物、气象、石油、科研、电力等多个行业有着大量成功应用。

此次曙光为清华大学所提供的的解决方案,将有效助力清华大学推进行业领域的科研力度与科研成果,为国内顶尖名校再添科技筹码!

关于曙光:

公司是一家在科技部、信息产业部、中科院大力推动下,以国家"863"计划重大科研成果为基础组建的高新技术企业。它以中科院计算所、国家智能计算机研究开发中心和国家高性能计算机工程中心为技术依托,拥有强大的技术实力。曙光系列产品的问世,为推动我国高性能计算机的发展做出了不可磨灭的贡献。2008年6月,国内每秒运算233万亿次的首台国产百万亿次超级计算机曙光5000A研制成功,位列全球第十。2010年6月, 曙光推出了国内首台超千万亿次的高性能计算机系统曙光星云,获得了第35届全球TOP500排行榜中第二名,创造了中国历年参选机器中的最好成绩。

2010年,曙光天津产业基地二期落成投产,不仅进一步提升了曙光公司企业的竞争力,更进一步推动了民族高性能计算机产业的发展。曙光高性能计算机连续15年稳居国产高性能计算机市场第一,拥有国产高性能70%以上的份额,并在高性能集群领域实现了国产机对进口产品的超越。曙光公司生产的系列服务器以技术先进、性能卓越、服务优良见长,曾获"国家科技进步一等奖、二等奖"、"中科院科技创新特等奖"、"2001、2003、2004中国十大科技进展"等多项国家级殊荣。

长期以来,曙光始终专注于服务器领域的研发、生产与应用,依托超级计算机的扎实功底,立足自主研发,通过不断技术创新,构建出拥有完全自主知识产权的全系列精品服务器,能全面满足用户从超级计算机到普通PC服务器的各项应用需求,在互联网、金融、电信、生物、气象、石油、科研、电力等多个行业有着大量成功应用。

未经允许不得转载:DOIT » 曙光助力清华大学构建集群科学运算系统