2025年6月19日,在“中国国际金融展”期间,由《金融电子化》杂志主办的金融数据库技术创新与实践活动于上海成功举办。深算院YashanDB研发总监吴良智带来题为《崖山共享集群:面向金融关键业务系统的规模化替代方案》的主题演讲,与逾200位银行、证券、基金业专家共话金融数据库规模化替代路径。

*以下为演讲主要内容
金融关键系统规模化替代与成本困境
自2019年起,金融行业逐步推进安全、稳定、可靠的信息化系统升级。吴良智认为,发展至今,金融数据库呈现出两大显著特征:其一,替换升级已迈入深水区,除外围和非核心系统外,关键业务系统替换升级的步伐明显加快,对产品的可用性和性能提出更高要求;其二,规模化替代阶段全面开启,原有“试点”阶段高成本投入的方式难以适应规模化需求,市场亟需在性能、高可用性、兼容性、可靠性及综合成本方面具备显著优势的解决方案。
在演讲中,吴良智分享了对金融关键业务系统规模化替代技术路径的理解。他指出,当前的解决方案虽有积极探索,但与规模化复制仍有一些差距,当前有四大不可忽视的挑战。

首先是迁移与兼容性成本高。金融业务系统普遍依赖 PL/SQL 存储过程、自定义函数、包等高级特性,这些与业务逻辑深度绑定的功能,现有解决方案如无法在语法规则、功能实现上实现高度兼容,将迫使金融机构投入巨大人力进行代码重构与适配,不仅增加技术对接难度,更导致项目周期延长、改造成本飙升。
其次是产品性能瓶颈。基于开源二次开发的数据库产品其单机内核性能天花板显著,难以与国际主流数据库匹敌,同时复杂查询依赖的优化器能力不足,成为数据处理效率的瓶颈;在事务密集型场景(如核心交易系统)下,面临时延和抖动问题。分布式架构虽被视为破局方向,却面临新挑战,例如节点间网络通信延迟影响响应速度,分布式事务为满足 ACID特性会产生性能损耗,数据分布策略会直接影响查询效率,其在高并发、低延迟的核心交易场景面临天然挑战。
最后是架构复杂度陡增。无论是分布式架构,还是交易和分析系统的拆分,均会导致复杂度变高。一方面,由于业务改造涉及数据拆分、路由配置等工作,增加了系统复杂度,对应用的设计和开发也造成非常大的挑战。另一方面,由于产品能力瓶颈,导致在同一系统无法同时处理交易型业务、复杂查询、跑批业务等,被迫通过系统拆分的方式来满足多业务诉求。
总体而言,从总体拥有成本(TCO)角度,分布式数据库的硬件、基础设施资源和运维成本均高于集中式架构。硬件方面,以满足省级金融单位要求为例,集中式架构灾备仅需四到六台机柜,而同等规模分布式需数十倍的服务器,也导致网络设备、机房与电力成本激增;技能要求和人力成本方面,由于需要学习全新的技术栈,将会要求高技能团队和持续的运维人力。
基于开源二次开发的产品虽能短期满足外围系统需求,但受限于内核能力,难以在金融等核心场景规模替代,并不是解决我国安全可控的可行技术路线。另一方面,国产数据库寄希望于分布式技术路线弯道超车,而分布式架构也并非“银弹”。
共享集群为金融关键系统提供规模化替代路径
如何去比较好的解决上述提到的痛点呢?吴良智指出,我们是希望能够通过“1:1平替Oracle”的方式去实现规模化复制。这里说的“平替”是指“平滑替换”,是兼容性、功能、性能、高可用、运维的全面平滑替换,而不仅仅是兼容和功能的平滑替换,更不是很多人理解的“平价替换”。这有根本的区别,因为后者很容易让客户先入为主产生低价替换的认知。

针对金融关键业务系统规模化替代的痛点,崖山主要从三个方向考虑:一是架构、应用和运维层面提供对等的能力和体验;二是面向关键业务系统的产品能力打磨,在性能和可用可靠性上满足严苛要求;三是安全可靠能力做扎实。
首先是架构、应用、运维“三不变”。这直接决定能否实现规模化、低成本、无痛式的平滑替换。
在架构层面,崖山共享集群采用了自研的技术路线,除了自研事务引擎设计、MVCC、表索引存储等内核技术,同时原创了聚合内存技术、集群文件系统、集群管理服务等共享集群关键技术,实现了与Oracle RAC的架构对等设计。

在应用层面,崖山共享集群产品提供面向应用无状态的计算扩展能力,其透明多写多读特性让用户如同使用集中式系统般简单便捷。此外,YashanDB的核心突破在于对PL/SQL存储过程、自定义函数、包等高级特性的全面兼容。吴良智指出,仅实现语法兼容尚不足够,语义兼容机制确保了结果正确性,而完善的PL/SQL支持则意味着极低的迁移代价。YashanDB通过全向深度兼容,确保替换过程中上层应用代码基本无需改造,实现真正的业务无感式迁移。

最后是在运维层面,崖山数据库提供从技术兼容、智能工具到知识赋能的完整解决方案,如DBA熟悉的Oracle运维利器如Hint/Outline、AWR报告、yasrman (类比RMAN)、exp/imp、FlashBack等均得到支持,Oracle DBA 技能实现平迁,大幅降低原有技术团队学习曲线和运维切换成本。

其次是做到“性能、可用可靠性两对等”。
性能决定了方案能否支撑核心业务,并直接影响替代成本。在性能方面,YashanDB原创性地采用细粒度多版本并发管理机制、自适应异步事务调度、全局资源运行时调度、去中心化事务管理等技术,突破分布式数据库硬件依赖瓶颈,在TPC-C测试中,其4节点集群性能达618万tpmC,单节点扩展比超70%,这意味着每秒可以承载数千笔交易,可满足大多数金融机构关键系统的业务处理要求。
核心替换对业务连续性提出极致要求。崖山数据库可用可靠性对标国际标准,依托“主备共享集群”及“两地三中心”方案,在确保集群级高可用的前提下,实现机房级故障、区域级故障的无损容灾,达成业务零中断与数据零丢失,故障恢复时间(RTO)与数据恢复点(RPO)均达到行业顶尖水平。
最后是打造“安全性更优”的自主可控方案。YashanDB选择全栈自研技术路线,从零构建第一行代码,保障技术的自主可控与可持续演进;产品取得网络关键设备和网络安全专用产品安全认证、商用密码产品认证、IT产品信息安全认证EAL4增强级(EAL4+)、等保三级认证等安全认证,构建起包含100项以上安全防护机制的全方位防御体系。
吴良智认为,目前,关键业务系统替代更多还是国有大行等大企业先行尝试,中小企业还不敢贸然在核心系统替换上迈出太大的步子。只有规模平替,才能让中小企业在高端场景也用得起、用得上、用得好数据库。崖山共享集群在综合成本(TCO)方面的显著优势,成为破解这一局面的关键突破口。以共享集群为核心的解决方案,凭借“1:1替代”技术路径,打破了传统国产化方案依赖“业务重构与高额改造成本”的困局,从应用改造、软硬件投入、基础设施资源消耗到服务支出实现全面降本,至少释放50%以上的成本,让更多的资源可以投入到业务创新。

在某城商行A类核心系统替换项目中,崖山共享集群实现了从Oracle RAC的零代码迁移且性能不降级。迁移方面,两个核心系统仅修改一行代码,两周内完成全量数据迁移与验证;性能方面,上线后各业务模块响应时间与Oracle环境完全持平,满足实时支付与清算需求。
“金融关键业务系统的国产化替代,绝非简单的‘换马甲’,而是要在性能、生态、安全上实现对等替换甚至超越。”吴良智总结道。深算院以打造中国原创的基础软件品牌为使命,投入数百人研发团队,在共享集群这一数据库技术皇冠上取得突破。YashanDB崖山共享集群的推出及应用,标志着国产数据库正式跨越了“可用”阶段,大步迈入“好用”时代。
随着金融业进入关键业务系统规模化替代阶段,崖山共享集群以其独特的“三不变、两对等、一更优”能力和显著的TCO优势,为行业提供了一条可复制、可验证、可落地的规模化替代路径。