DOITAPP
DOIT数据智能产业媒体与服务平台
立即打开
DOITAPP
DOIT数据智能产业媒体与服务平台
立即打开

浪潮信息郭志翔:以全闪存储加速数据中心

7月28日,主题为“闪耀数字经济新引擎”的2022全球闪存峰会(Flash Memory World)在线上盛大召开。 

峰会为期三天,共设置开幕式、主题演讲以及11 场分论坛。 在7月29日上午举行的“高端全闪存存储阵列论坛”上,浪潮信息存储产品线集中式存储营销总监郭志翔以“全闪存储 加速数据中心”发表演讲。

以下内容根据速记整理, 未经本人审定。

郭志翔:尊敬的各位来宾,朋友们,大家好。我是来自浪潮信息存储产品线的郭志翔,很荣幸再次参加全球全闪存峰会。我今天演讲的主题是“全闪存储加速数据中心”。

在接下来的一小段时间里,我将为从浪潮存储的视角大家分享如何看待全闪存储的发展、浪潮存储围绕全闪存储布局了怎样的新产品和新的技术,以及这些技术和产品是怎么的结合,以这个为基础结合是什么样的新的模式,为用户创造了哪些更大的价值。

浪潮信息存储产品线的郭志翔

党的十九届四中全会首次提出将数据纳入生产要素,提出了要健全数据等生产要素由市场评价贡献,按贡献决定报酬的机制,在2020年4月中共中央国务院发布的《关于构建更加完善的要素市场化配置体制机制的意见》提出,要加快培育数据要素市场等任务。

数据成为新的生产要素

数据应用已经渗透到了经济社会各个领域,作为数字经济时代核心生产要素,相比能源、材料等传统生产要素,数据正以独特的生产要素属性正在对经济社会发展产生更为重大的深刻影响。发挥好数据生产要素的这种创新引擎作用,可以加快构建以数据为关键要素的数字经济,有助于推动经济发展质量变革、效率变革、动力变革,实现经济高质量发展。

一个典型的例子就是从2020年疫情开始以来,我们的医疗大数据技术在不断地发展,行程码、健康码、健康宝,包括核酸检测、动态弹窗等,对精准防控动态清零起到了非常大的作用。这都是基于数据的应用和数据价值的体现和发挥。

刚才提到,数据资产,或者说数据已经成为生产要素的一个概念。在当下数字经济时代,传统的客户应用系统也出现了更多的应用需求。

比如在通信行业,5G的大规模应用,给全行业的带来了巨大的业务变革和挑战。从5G时代开始,因为速率越来越快,无论是通话,还是流量的计费,整个的话单数据量增大了7.5倍。与此同时,高清化带来了数据10倍的增长。过去在线可能看标清的视频,现在可以去看高清甚至是4K、8K的数据视频,带来的数据量增长非常高,而且对于分析的效率要求更高。同时,计费出账的时长也从过去的10个小时缩减到3个小时,整体缩短70%左右。

在医疗行业,大家去医院看病的时候,都会首选头部的三甲医院,尽量享受更好的医疗资源。三甲医院每年的诊疗量都在500万人次以上,每天有超过1万名的患者去就诊和治疗。假设每位患者都去做CT、做核磁,每次约产生500MB的影像数据,每年的数据量都是海量而且是快速增长。同时,患者在诊疗的时候可能会有复诊或者其他需求,需要在一段时间内实时高效的访问,不能影响诊疗的效率。这对存储的性能也是一个非常巨大的挑战。

在金融行业,约80%以上业务都已经是在线办理,对于系统的挑战也非常大。同时现在金融的风控、反欺诈的场景,账号交易安全保护,包括身份验证、信用卡欺诈等问题需求很大。

例如,用户的注册身份验证,传统都是通过人工的审核方式,效率比较低,审核周期很长,导致一部分的用户流失。使用AI技术之后,可以自动验证。现在,短信的这种动态验证码,人脸识别等不同的技术加快用户在注册和其他流程上的验证的时间。另外,面对海量用户的数据,肉眼无法做出精细的判断,柜员每个人去识别每个客户,没有办法精细化的判断。在某些环节如果出现漏洞,可能会出现这种被攻击的风险。比如不法分子使用软件合成的人脸图片,或者三维模型,并盗取他人身份证来去进行批量注册,赚取新人红包,去刷单甚至去盗取他人账号。

采取AI+存储的这种解决方案使用活体检测加上证卡识别,加人脸识别,加图片防伪这样的一些技术,可确保注册用户的真实性,提升用户体验。

现在采集用户的身份信息也很方便,用户通过互联网或者移动端的扫描身份证,可快速提取用户的信息并完成卡片文字OCR识别转换,极大地减少录入的时间,确保高准确性。另外还可以使用交互式的验证方式,比如说眨眼、张嘴、点头、摇头来判断图片是否是真人注册。这一系列操作下来,对于整个银行业的系统,效率的提升是非常非常高的。

传统数据中心面临新技术的挑战

我们注意到,数据中心呈现如下技术趋势。

一是全闪化,在数据中心里,中高端存储基本上70%以上都是全闪存储。这种全闪化的配置已经非常普遍,而且全闪的这些应用也更加普及人心。随着全闪存的价格不断下降,性价比接近HDD,全闪化的趋势也更加明显。

二是敏捷的扩展。客户的数据会随着业务的增长会有爆发性的快速增长,但他们不可能针对业务的这些变更不断地去调整业务架构,否则成本会非常高。所以就需要我们的产品可以敏捷地扩展,根据客户的需求动态扩展容量和性能、传输带宽,适应客户这种快速变化的业务需求。

三是软件定义。软件定义存储在整个数据中心里的应用越来越广泛。大规模的海量数据的部署,包括数据采集这些类边缘端的应用。

四是云化的能力,要求也是非常高。很多的企业,无论是传统的金融行业,还是新兴的初创企业,都会有很多偏互联网级的应用,面临庞大的客户需求,对于云化能力要求是非常强的。我们把它部署在公有云上,去解决互联网化应用的需求。这对于客户来说,IT的投入会更少,只在本地的数据中心部署简单的一些存储去满足最核心的应用。

举个例子,我们在本地的数据中心去部署这些CRM、下单的客户管理这些系统,在互联网上去部署一些查询相关业务,在阿里或者在腾讯或者是在AWS公有云上去部署这互联网化的应用,就能够用很少的成本承接非常大的海量互联网化的应用需求。这是我们的存储的能力,我们需要有这种构建混合云的能力。

五是安全可靠。数据保存到存储设备上,必须保证数据是安全可靠,实时可用的。这样,客户才会去购买我们的存储,这也是鞭策我们不断地去提升性能或者说稳定性的一个很重要的因素。

最后是AI和机器学习。基于AI和机器学习的这种功能对整个的应用系统,包括存储系统或者未来的一些服务体系都会有巨大的变革。

这是数据中心的技术趋势, 同时我们还会看到一些对基础设施的新的要求。

首先是亘久不变的稳定和高效、安全、高效是永远存的需求,不同的阶段会有更高的需求。还有敏捷扩展,客户需要随着业务的需求能够快速地扩容,不需要推倒方案重建就能够快速地提升业务的承载能力。同时,云化的对接也是一个新的需求。

未来混合云的架构会是最主要的场景。大家或多或少都会有这样的互联网化的应用,把它部署在公有云上,重要的核心业务部署在本地,我们去打通这种本地和远端公有云的数据中心,去做混合云的解决方案的架构,这是未来的一个趋势,也是客户重要的诉求。

全闪集中式的浪潮解决之道

基于上述诉求,我们推出的是全闪集中式存储的平台。浪潮从2000年开始,建立研发团队,开发存储集中式的存储产品产品不断地迭代演进。基于过去20年在存储市场上的积累,顺应全闪化的趋势,在产品上有很多的新改进和更新。

刚才提到的这些极致可靠,我们设计产品,要做到故障无影响,提升整个存储的性能,讲集中式存储的时候,其实更多的是性能和可靠性,满足客户的需求,这是最核心的两个点,也是我们在设计产品的时候,很重要的一个点。浪潮的全闪集中式存储平台,产品线覆盖非常丰富。从中端入门级到高端全部覆盖。

刚才提到性能,浪潮高端的全闪性能已经成为了全球的标杆。在2021年8月份, HF18000G5-I在全球SPC-1的评测当中获得了2300万的IOPS的性能,在全球所有的存储产品里面评测里面是全球第一。这个第一,不仅仅是说性能很高,同时还有一个非常低的响应时延,0.29毫秒,是头部的厂商里面时延是最低的。同时IOPS的性价比的指标也是在全球性能前10的厂商里面是排名最靠前的。

重点提一下,浪潮产品的价格,其实并不很高。

iTurbo2.0 加速引擎提升系统性能

为什么浪潮可以获得全球性能第一的成绩?主要是基于浪潮统一全闪存储里集成的iTurbo2.0的加速引擎。通过这个加速引擎去提升整个系统的性能。

这里面有四个模块:智能IO感知,智能快路径,智能资源调度和智能数据组织。智能IO感知,比如说北京12月圣诞节的时候,像三里屯重点的商区,都会遇到巨大的人流。交管部门也会提前预警,我们预判到这个时间会有巨大的人流,针对性的去做一些调配;智能快路径,还是用交通举例,每天上下班的时候,都会看一下导航,找到一条最快的路径,数据存储也一样,通过哪一块盘,或者哪一块缓存的区间,去把数据快速地写到最终的盘上,这也是找到一条最快的路径,确保响应效率;智能资源调度,交管部门预判到了交通人流量的时候,会提前去调配资源,触发预警,避免周边可能会遇到堵车,同时会调配资源,延长公交车和地铁延长运营时间,引导更多出租车过去。

一系列的算法和功能,确保了iTurbo2.0对于整个系统性能巨大的的提升。

极致安全设计,实现数据全生命周期保护

回到安全可靠的这块,刚才提到我们在整个这些产品设计里,都基于数据从采集、传输、交换、处理、存储和销毁整个全生命周期不同阶段进行保护。

举个例子,现在大家都会有很多的数据,在长期不用之后它还占着存储空间,这是非常浪费的。浪潮会提供这种基于字节级的数据销毁,确保数据销毁,不会被复制,被窃取。除此之外,浪潮的存储全部按照国标的GBT、GAT和ISO标准漏洞清零,所有的存储产品不存在任何的风险漏洞。整个系统可能被攻击的可能性大大地降低。浪潮95%以上的存储设备内的数据都可以通过异构纳管的方式纳管过来,同时迁移到现在新的存储设备上。用我们自己内部的话讲叫“删得净,防得住,接得住”,确保数据是整个在生命周期里面确实是安全可靠的。

在数据的保护上,我们还有更多的设计。比如数据的整个保护体系有三块内容。

第一,长期无故障,部件很多都是使用定制化的部件。通过和上游合作伙伴的深度定制来保证产品的高可靠性和稳定性,部件失效率下降了50%。

第二,故障无影响。通过一系列的手段,系统一旦出现故障,不会对客户的业务产生影响。大家都知道,硬件产品很难去确保100%的安全稳定可靠,一旦出现故障,我们可确保客户没有影响。

第三,更高一个层级,我们实现了故障早知道。通过AI这样的技术,去提前预判到设备的一些故障,提前做准备。

在这提一下,我们有一个部件健康管理的设定。每个人体检的时候,会提到有一个状态叫亚健康。其实身体没有生病,但不是很健康的状态。存储系统也一样,也会有部件的亚健康状态。浪潮实时监测部件的状态,当出现亚健康状态的时候,会让这种状态的部件提前下线,或者其他的方式确保整个系统安全可靠,不至于说因为某一个部件的影响,导致整个系统的宕机。

刚才提到的是一些技术和设计的理念,包括全生命周期的数据防护,还有像亚健康状态等。在一些具体的功能特性方面,还会有更多的设计,比如一些故障自动修复的功能,包括慢盘自动修复、链路自动修复,BUFF自动监测等一系列的功能。

在部件级的设计里,除了全冗余的设计,还有IO模块热插拔,缓存二次备电,全局动态磨损等一系列的功能设计、设定,确保整个的系统安全。

在系统级,除了亚健康状态监测以外,还有静默数据监测、多控、后端介质共享、RAID并发均衡一系列功能,来保证系统级的设定。包括在降低故障影响方面,有升级微码不影响业务、故障切换小于10秒钟,双活业务切换30秒以内,都确保了客户的业务实时高可用,保证客户的这些系统可靠性,数据实时可用。

除了产品部分,浪潮还有更多的解决方案。比如集中式存储会有两地三中心的解决方案、同城双活,一个站点宕掉的时候,另外一个站点还可以继续对外提供服务,确保业务实时高可靠。当北两个数据中心都遇到故障问题,不能启动提供业务的时候,第三站点的灾备中心也可以对外去提供持续的服务,确保我们客户的RTO、RPO等于零。

浪潮还会有云化的对接功能,集中式全闪的存储在这种多云对接方面也是做了很多的努力和工作。比方说数据中心的云化。浪潮就在做浪潮云。有很多的政务云,或者各种云在做,可以和主流的AWS、阿里云、腾讯云这样子公有云平台,包括OpenStack的云平台做对接,做云备份、云归档、云分层这样一些功能。

同时可以异构业界95%以上的存储型号,主流的设备都可以去异构纳管、数据迁移。还可以确保客户之前的一些投资不会被浪费。

集中式存储,两地三中心

除此之外,浪潮还可以提供更多基于数据系的基础解决方案。包括全生命周期的管理,像迁移、集群、双活、三中心、容灾、备份、分级、存储、归档这样不同的存储功能,数据管理的功能特性,我们都会支持,也提供完整的解决方案,确保客户在数据的收集、处理、保存、使用、共享、归档和再利用的时候都可以有完整的解决方案提供给客户,让这些数据都是实时可用,且在一个相对低廉的成本。

新存储之道

浪潮之所以能做到这些,主要是基于过去的研发上的投入。

浪潮全球部署研发,在北京、济南、郑州、台北和硅谷有有千人级的研发中心,产品全面自主研发,无论是集中式的全闪还是说混闪。同时浪潮还是一些核心产业组织、存储产业技术创新战略联盟理事长的单位,牵头建立了很多国家存储相关的标准,包括磁盘阵列、网络存储、备份存储等行业标准。

在过去几年里面,很多的头部客户都选择浪潮的存储。看看成功案例墙,浪潮在金融、政府、医疗、能源、交通、教育和制造业都会有很多的客户;越来越多的客户主动找到浪潮,了解浪潮的产品、采购浪潮的产品,在过去几年累计出货了大概15万台存储的装机量。

以上是我今天想要跟大家分享的内容,谢谢大家!

未经允许不得转载:DOIT » 浪潮信息郭志翔:以全闪存储加速数据中心