阿里云智能李飞飞:集中式、分布式数据库已经过时,未来只有云原生数据库

数据库已经成为云计算时代汇聚数据最核心、最重要的形态;而云原生数据库提供了传统数据库所不具备的高可用、高可靠弹性的能力。

作为云原生数据库的领军者,阿里云瑶池数据库始终践行云原生技术理念,打造一站式数据管理与服务。

瑶池,在中国的古代神话里是汇聚宝藏的地方;数据是云计算时代、数字化时代、智能时代毫无争议的最重要的宝藏。这也就是阿里云数据库被命名为“瑶池”数据库的原因。

“希望汇聚各方、多种类型数据,让数据业务持续在线、让数据价值不断放大。”3月24日,在北京召开的阿里云瑶池数据库峰会上,阿里巴巴集团副总裁、阿里云智能数据库产品事业部负责人李飞飞如是说。

据悉,阿里云瑶池数据库拥有全球领先的技术和认证,中国市场份额第一,连续三年进入Gartner领导魔力象限,产品多次获得国家奖项特别是信创领域的权威认证。

40年前,中国启动了四个现代化建设目标;40年坎坷征程后,云数据库也开启了新的“四化”进程,势必掀起未来五到十年波澜壮阔的新篇章。

云数据库发展趋势的四化与阿里云的四做和四更

云原生数据库正在快速驶向的“四化”,是云原生化、平台化、一体化、智能化。李飞飞对云数据库的“四化”趋势进行了详细解释。

1.云原生化

时至今日,数据库向云原生化演进的必要性和现实的紧迫感已经得到广泛认同。存储计算分离技术已经非常成熟,存储和计算池化带来高可用、高可靠弹性,秒级弹性、智能的负载预测、跨机的能力,正在推进云原生进入2.0时代。

2.平台化

数据量爆发式的增长,数据形态的多元化,以及客户业务的多样化,传统、单一的数据库产品包打天下解决所有问题的时代已经结束,需要用平台化的思维去构建多个引擎,提供一个一整套的、一站式的能力和解决方案。平台化思想已经成为业界共识。

从商业角度,坚持平台化才可能降低边际成本。具体到数据库,需要和云平台打通,实现软硬协同创新,联动底层硬件的基础设施,才能解决客户的实际问题。

平台化的另一个逻辑是要支持标准的API。随着AI的发展,人机交互很有可能变成机器和机器的交互,人只是来构建机器和机器交互整个流程。API接口的定义、标准化及稳定成熟非常重要。

3.一体化

数据库类别众多,不论是TP、AP、NoSQL还是传统大数据,在数据PaaS层就是云原生化、平台化,基于平台化才能实现一体化,通过Zaro-ETL等核心技术实现离在线一体化、处理分析一体化、多模数据一体化、集中分布一体化等,取代业务调度、ETL数据迁移等复杂流程,消除数据孤岛。

4.智能化

数据库的智能化有两个角度:AI For DB和DB For AI。AI For DB就是用智能化技术运维数据库,进行异常检测、HA切换、参数调参等;DB For AI方面,Lindorm将时序、文档、宽表,结构化和非结构化数据融合在一起,具备了多模数据处理一体化的能力,为做AIGC的应用打下坚实基础。AIGC不仅需要多模态数据,还需要丰富、强大的模型。作为非AI专业公司,阿里云不会去做模型,而是提供模型灵活的导入的能力与接口,把第三方以及客户研发的模型一键导入到内核,便于各类应用所需要的推理。

两年前还有人对数据库的智能化心存疑虑,如今OpenAI一扫疑云。

要在这个竞争激烈的赛道上走到下一个春天,数据库就必须全面拥抱“四化”。

为此,阿里云提出了让数据库“更快、更稳、更安全、更好用”这一目标的四做对策:深基础、做强核心、做精场景、做好体验:做深基础,就是承载云原生化和平台化理念,与云平台深度结合;做强核心,就是在云原生赛道上持续做全球数据库的领导者,加强核心产品的核心能力;做精场景,是指结合运营商、金融、互联网等各行各业不同的场景,打造解决业务痛点能力的数据能力;做好体验,统一API,简化客户用户使用以及开发者使用数据库的门槛,以智能化不断提升数据库的应用。

瑶池数据库三大核心产品

在瑶池数据库产品组合中,包含云原生数据仓库AnalyticDB、云原生数据库PolarDB,以及云原生多模数据库Lindorm这三个最核心的产品,面对不同的场景,为新时代的云计算提供数据基础设施。

AnalyticDB面向MTP数仓离在线一体化的复杂数据分析的能力;PolarDB提供云原生的HTAP、Serverless、多主多写能力,100%兼容MySQL与PG,并且提供高度兼容Oracle,用极低的成本提供4到6倍的开源以及商业数据库的性能,是目前中国市场上增速最快的数据库产品;Lindorm是多模AI时代AIGC数据重要的基础设施。

这三款核心产品包括主力的开源托管产品RDS,全面支持Serverless能力,在公共云上已经对外开始提供商业化的服务。

1. 定义云原生数据库发展方向的PolarDB

PolarDB是阿里云2017年开始自研的核心云原生数据库,堪称定义云原生数据库发展方向的产品。

PolarDB基于平台化做深基础理念,结合阿里云的基础设施开展软硬协同,提供基于SmartSSD智能硬盘,以3倍常规压缩比提供100%加密的能力;基于首创的三层解耦架构进一步将计算层的内存和CPU进行解耦,做到秒级弹性。

IMCI技术是阿里云去年推出的一项基于内存池化的轻量级技术,它可以选择性的对行列进行转换,减轻分析系统和TB系统打通的复杂性;结合AI的能力以及工作负载的特性,自动判断采用存储计算分离的云原生架构,准确把握分布式架构的最佳时机,并在二者之间无缝切换。

最新的Zaro-ETL技术,内置同步链路,在PolarDB和AnalyticDB之间实现数据同步,通过逻辑复制、增量同步以及物理复制的技术,能够将两个数据行转列从TP数据库到(MPP)复杂分析型数仓完全无缝打通,提供一站式体验。

基于多项性能特点,PolarDB取得了非常突出的成绩:交易和分析性能是同类开源数据库的6倍和100倍,TCO低于自建数据库50%,大查询的性能提高150%;通过了国家金融认证中心的分布式数据库标准金融级的严苛测试。

好的产品需要市场的检验。在真实的游戏的客户场景,PolarDB用50%的成本达到2倍的性能,可彻底替换掉传统数据库和传数仓的复杂架构。PolarDB蝉联了国内云数据库市场份额的第一名,遥遥领先所有的竞争对手。

2.Lindorm:应对AIGC带来的巨大商机

Lindorm多模数据库提供了多模数据处理能力,为应对AI时代的挑战提供了坚实支撑,成为AIGC时代的数据基础设施。通过灵活的导入模型,结合多模数据处理能力,导入所需要生成图片模型的文字描述后,几秒钟之内可一键智能化完成不同风格的图片转换。

获得耶鲁大学榜单全球第一名的NL2SQL——这个改变用户与数据库交互方式的技术已经应用于PolarDB上,借助智能的人机接口大大简化开发者用户和数据库交互,新产品将于今年下半年发布。

“人们过去经常听到集中式数据库、分布式数据库,我认为这些概念及引发的争论毫无疑义。未来的数据库只有一种生态,那就是云原生数据库。”李飞飞说:“客户、业务再也不用关心什么时候需要分库、分表,什么时候需要集中式,什么时候需要分布式。所有这些概念都将过时!”

进一步拥抱云原生时代

瑶池数据库品牌的发布,把OLTP、OLAP、NoSQL三个产品赛道清晰组合在一起,为客户提供一体化的平台化的解决方案:通过TP的数据库,可以让数据业务永远在线,通过OLAP业务和NoSQL业务,让数据价值不断放大,加上Zero-ETL解决方案,把客户HTAP复杂场景结合起来,与DMS产品提供一站式数据资产管理与服务,最终形成一个为企业解决从数据服务在线、到数据价值放大,以及数据资产管理、数据安全控制等方面端到端的解决方案。

这个解决方案赢得了政府、金融电信、企业等众多行业客户的认可,如PolarDB就支撑着全国16个省市国家部委的医保平台。

可以说,阿里云数据库做好了拥抱智能时代一切的准备。借助此次品牌的发布,阿里云瑶池数据库将携手客户进一步拥抱云原生时代。