连续10年稳定支撑双11,OceanBase又迎来新的发展阶段

30-50年前的人绝对想不到,互联网的兴起会对IT技术架构带来如此大的变化。

向下看,在硬件层面,x86的崛起,让前辈大型机和小型机都归类为“非主流”,虚拟化和容器化技术以及云计算的模式,让资源利用的效率和敏捷性提升,达到了前所未有的高度。

向上看,在应用层面,从传统的单体架构逐渐向服务化转型,随后又进入到了云原生时代,应用的规模和复杂性,又是一个前所未有的提升。

按照如今云计算时代的逻辑来梳理,底层硬件资源层叫IaaS,上层业务应用层叫SaaS,中间的通常叫PaaS,在OceanBase CEO杨冰看来,对PaaS层的改造是最难的,特别是数据库。

因为,PaaS与业务相关,而且是有状态的,作为中间层,它既要能向上适应应用向分布式方向发展的趋势,也要往下适应容器化和云化的特点,自身更要随业务场景而不断演进。

作为新一代数据库的代表,OceanBase连续10年稳定支撑双11,承受住了世界级的流量洪峰和稳定性考验,还刷新TPC-C和TPC-H“数据库世界杯”测试纪录。

目前,OceanBase不仅支持了支付宝核心系统,还服务了1/4的头部金融机构,及政务、能源、通信、交通、互联网等海内外企业。

2023外滩大会上,OceanBase CEO 杨冰介绍了分布式数据库的技术难点,也介绍了OceanBase的发展历程。眼下,OceanBase又迎来了新的发展阶段。

被场景驱动的数据库发展史

或许每个做数据库的人心里都想在某个层面超越Oracle,都想在核心业务场景上有所突破。杨冰认为,由于需要支撑核心业务系统,所以,OceanBase一定要具备稳定可靠性。

再看看业务现状,数据库除了要负责交易型应用以外,还要具备洞察驱动的融合分析能力,要具备应对海量数据挑战的弹性,最后,还要具备低成本和极致性能的特点。

数据库的难,只有做数据库的人最懂。回顾数据库的发展历程,不难发现,数据库产业一步步发展到现在,其变迁与应用场景的变化密不可分。

上世纪60年代,当时的人们想象不到有互联网之后的世界,数据库以集中式架构为主,代表产品是Oracle和DB2两大商业数据库。

到了上世纪90年代,发现集中式弊端之后,业界逐渐发展出了嵌入业务的分布式架构,不过,它依然基于传统集中式架构,由业务层负责解决分布式事务的相关问题。

90年代,虽然出现了SQL Server这样的商业数据库软件,出现了PostgreSQL和MySQL这种开源的数据库软件,但现在看来,从1996年以后,业界再也没有出现新的主流的OLTP数据库。

2000年以来,互联网产业开始步入高速发展期,业内出现了基于中间件方案的分布式架构数据库中间件,典型代表有Cobar,MyCAT以及DRDS,主要用于解决MySQL等关系数据库在处理大规模数据、高并发访问等场景下的瓶颈问题。

进入2010年以来,伴随着移动互联网的爆发式发展期,数据库产业迎来新的变革时期——原生的分布式架构数据库时期。典型产品有来自谷歌的Spanner和来自蚂蚁集团的OceanBase,经过数十年的发展后也逐步成熟,也都开启了商业化的旅程。

作为经历了互联网规模应用考验的核心数据库,OceanBase没有停滞不前,现在正在走向更广泛的使用场景,在传统企业场景中落地。作为分布式数据库架构的又一次进化,OceanBase提出了单机分布式一体化的架构,支持VLDB,是一种可以存储大量数据的数据库。

Cceanbase发展的三个阶段

回顾OceanBase的发展历程,杨冰总结了三个阶段:

第一阶段,主要用在互联网领域,对于互联网场景中量很大,但相对简单的SQL进行了分布式改造,并且实现了ACID特性。另外,也从非金融场景开始一步步涉及到一些金融场景。

第二阶段,主要是在简单的OLTP之上增加了大量传统的OLTP,另外,还增加了简单的数据分析OLAP能力,开始服务大中型企业,包括很多金融,通信和能源行业用户。

第三阶段,OceanBase开启了单机分布式一体化架构,开始承载更多通用场景,被应用于包括中小型企业、泛互联网和公有云等企业。

在三个阶段的发展历程中,OceanBase从多个层面了做了深度优化工作。

首先,在稳定性和安全性方面,OceanBase提供合规性和更高的业务连续性。

在OceanBase 4.0发布时,实现了RPO=0,并且,RTO从原来的不到30秒的水平,提升到了小于8秒的新水平,成为业内首个将RTO做到8秒以内的数据库。

OceanBase通过跨地域的分布式架构来保证可用性,因此需要机房间同步大量数据。为了减少传输数据量,OceanBase将数据量压缩了30%-40%的水平。即使用户只有普通的网络环境,也能享受更高的可用性,这对于没有骨干网的城商行或者没有上云的企业很受用。

OceanBase提供多种容灾模式可选,除了同城双机房架构以外,也支持两地三中心,甚至还有三地五中心的多活架构,在业务连续性方面下足了功夫。

第二,OceanBase不断完善数据库平滑迁移方案。一方面,向上不断提高对MySQL和Oracle等数据库的兼容性,向下支持更多更多计算平台和软件操作系统,提高整体兼容性,降低迁移代价。一方面,还在持续完善迁移方案,不仅要做好数据迁移,还要做到架构融合。

此外,OceanBase创新性地打造了单机分布式一体化架构,拓展多元化的场景。当用户的规模相对较小时,OceanBase能提供更小的部署选项,更小的部署规模意味着成本的降低,也意味着除了服务大型银行,也可以服务小规模企业。

OceanBase还通过优化多租户和高压缩的特性,帮助用户充分利用资源。通过拓展交易引擎的边界,打造了更强大的复杂查询分析能力。每一项优化都对应实际的用户需求,过程中,OceanBase像滚雪球一样累积了很多用户。

坚持长期主义的CceanBase

从杨冰的介绍中了解到,OceanBase在三年前还只有18个客户,而现在,OceanBase服务了1000多家企业。

OceanBase在商业化发展的同时,也推出了开源版本,如今,有一半以上的用户用的是开源版本,另外一半则是企业级客户。这些客户当中,有超过三成用户将OceanBase用于核心业务系统。

可以看到,在OceanBase的用户群体中,既有头部银行,也包括城商行、农商行、证券、保险等金融用户,也有政企行业用户,泛互联网行业用户。值得一提的是,一些金融用户也将OceanBase用在关键核心系统上,对于OceanBase是非常有分量的背书。

如今的OceanBase已经准备好面对更多用户了。因为4.0版本之前主要服务于大型成熟机构,4.0开始服务于更有增长潜力的用户。技术上,4.0版本是让自身变得更小,从而服务于更多场景。生态上,OceanBase也在积极建立开发社区,用生态注入活力。

OceanBase一路走来并不容易,杨冰认为,需要核心场景上的实践突破,需要持续不断的资金投入,还需要足够长时间的坚持,这三者齐备才可能构筑核心竞争力,这也是不容易被超越的核心竞争力。

具体到OceanBase本身,杨冰表示,在构筑核心竞争力的过程中,要自研、要创新,也要开放,并且要坚持长期主义,只有这样,才能厚积薄发,跨越深水区。