英特尔:为大数据重构数据中心,提供全分析周期的支持

周建丁 发表于:14年09月04日 15:30 [原创] DOIT.com.cn

  • 分享:
[导读]在英特尔看来,端到端的大数据解决方案,既要有实时分析的能力,也要能够支持海量历史数据的挖掘。为此,不仅为产业链合作伙伴提供端到端的“芯”动力,还搭建了一个英特尔云创新中心,用来验证、测试和优化新的解决方案,使之稳定、可靠、可行,加速用户从创新技术中获益。

为数据处理而重构数据中心,英特尔公司已经取得初步的进展。

重构数据中心是英特尔在2013年的主题,目的是打造一个软件定义的基础架构,以更好地应对云计算、大数据、移动化和社交化应用带来的挑战。但重构不可能毕其功于一役,英特尔今年仍然走在这条路上。

在英特尔看来,端到端的大数据解决方案,既要有实时分析的能力,也要能够支持海量历史数据的挖掘。为此,不仅为产业链合作伙伴提供端到端的“芯”动力,还搭建了一个英特尔云创新中心,用来验证、测试和优化新的解决方案,使之稳定、可靠、可行,加速用户从创新技术中获益。

涵盖整个数据生命周期

时至今日,大数据的重要性已经不言而喻。在英特尔看来,掘金大数据面临的挑战是传统的架构。英特尔(中国)有限公司数据中心及云计算业务产品市场总监贺晓东认为,小机+光纤存储的架构,缺乏足够的扩展能力,阻碍了TB级历史数据的价值的挖掘。英特尔认为,支持数据处理的数据中心需要重构,需要更快、支持更大的数据量和更高的性价比的解决方案。

英特尔(中国)有限公司数据中心及云计算业务产品市场总监贺晓东

“我们希望和业界的合作伙伴一起,把传统的RISC架构挪到英特尔的更加廉价、开放、标准化的标准的服务器平台上来降低成本。”贺晓东说。

通过至强E7、E5等产品,英特尔为数据分析提供了涵盖整个数据生命周期的支撑,首先是核心业务系统、数据库、业务数据的收集,比如传统的CRM、ERP等,英特尔都可以提供至强E7这样的高可用、稳定性的平台来给用户提供数据分析。我们知道,最新的E7 v2,具备5个9的可用性,4路内存可达6TB。

而在数据进一步的抽取、梳理,然后把它存档,再进行深度挖掘分析时,需要可弹性扩充的平台,这是E5平台的用武之地。(说句题外话,根据此前爆出的英特尔产品路线图,基于Haswell-EP架构的新一代至强E5 v3将会在近期发布,届时DOIT也会有相关报道,敬请关注。)

此外,数据中心角度来讲,如何降低数据的存储、处理,整个流程数据中心的功耗等等,英特尔在可管理性方面也会做很多平台化的工作。

“英特尔的产品线,我们认为从性能、可扩展性、能耗、成本方面是涵盖整个数据的全生命周期的支撑的。”贺晓东说。

为SAP HANA优化应对实时分析

提到大数据,通常我们会想到Hadoop,用它可以存储PB级的数据量,可以应对数据量不断膨胀、数据的种类、样式非常多的情况。

不过,SAP公司数据库及技术平台部售前总监、数据管理技术首席架构师宋一平指出,在整个数据的存储量到PB级的时候,在Hadoop上做很多的查询和计算时,效率会有很大的折扣。但如果利用内存、利用芯片本身的一些最新的技术,就可以很好地加速分析能力。

SAP公司数据库及技术平台部售前总监、数据管理技术首席架构师宋一平

SAP恰好有HANA的内存的实时计算环境,可以加速在大数据上的一些计算事和实时处理能力。宋一平认为,HANA与Hadoop两方面的结合是非常好的开端。

SAP通过平台、上面的应用、数据科学(一种提供如何做模型的服务)三个方面来切入大数据,其中的平台,也就是HANA+Hadoop,正是和英特尔联手打造的。

我们知道英特尔曾经自己开发Hadoop发行版,后来选择与Cloudera强强联合。而在HANA端,宋一平介绍,SAP每次推出HANA,它的版本研发一定是跟英特尔的具体工程师在做一些底层的优化。这个优化涉及到芯片上的态势、具体的指令等等方面的能力,都作了很多拓展。

英特尔云创新中心加速创新应用落地

好的技术,也要有适合的场景才能产生效果,如果用户想尝试,又担心测试环境的投资,怎么办?英特尔说,我们还有云创新中心。

贺晓东表示,大数据、及时分析、SAPHANA等相对较新,同时解决方案的复杂度又比较高,硬件平台集成度要求也比较复杂的项目,英特尔希望通过云创新中心这样一个平台把它落地,更重要的是把落地的速度给提起来,让用户更好、更提前地来享受到这些新的技术、新的创新,为生产运营做支撑的服务。

英特尔云创新中心解决方案架构师程从超介绍,英特尔在云创新中心里面大概用了十台机器做了一个整个的端对端的环境,计算平台和存储平台统一用Cloudera来实现(当然所有的Hadoop),用了9台E5的2680来做Hadoop scale-out服务器,主要是两路的。SAP HANA装了一个4路的,E7的4890V2的平台上用了450G内存,6块SSD的硬盘,模拟了电信的系统分析平台,把详单数据加载到ClouderaHadoop平台之后,通过ClouderaMapReduce作了汇总,把这个详单形成轻度汇总的数据,加载到HANA里面去。通过BO和开源的spring来访问HANA里面的数据,是传统的BI工具和spring的结合。

英特尔云创新中心解决方案架构师程从超

模拟了某个省2011年两天的移动数据(共40亿条记录,汇总大概3.8亿条数据存在SAPHANA上)的结果显示,任意的即席查询,可以达到秒级响应。这是HANA的传统的内存数据仓库加上RDB架构,保证即席查询。而HBase的Scale-out架构和单键查询的测试,也可以做到分钟级响应。

据英特尔透露,目前已经有一些敏感客户在使用这个平台进行测试项目。

[责任编辑:周建丁]
雷霆
实时分析平台,需要多方面的融合,譬如业务与技术的融合,OLTP与OLAP的融合,存储与计算的融合,硬件与软件的融合,开源平台与商业套件的融合等。当然,这种融合不是说简单地把软硬件捆绑到一个盒子里,而是要处处体现了分工与协作相统一的经济学理论。
官方微信
weixin
精彩专题更多
存储风云榜”是由DOIT传媒主办的年度大型活动。回顾2014年,存储作为IT系统架构中最基础的元素,已经成为了推动信息产业发展的核心动力,存储产业的发展迈向成熟,数据经济的概念顺势而为的提出。
华为OceanStor V3系列存储系统是面向企业级应用的新一代统一存储产品。在功能、性能、效率、可靠性和易用性上都达到业界领先水平,很好的满足了大型数据库OLTP/OLAP、文件共享、云计算等各种应用下的数据存储需求。
联想携ThinkServer+System+七大行业解决方案惊艳第十六届高交会
 

公司简介 | 媒体优势 | 广告服务 | 客户寄语 | DOIT历程 | 诚聘英才 | 联系我们 | 会员注册 | 订阅中心

Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技术有限公司 版权所有.