阿里云登顶NL2SQL权威榜单,数据开发分析效率平均提升35%

9月2日消息,NL2SQL(自然语言转SQL)领域权威榜单Spider 2.0-Snow公布了最新测试结果,阿里云研发的DB-Surfer以59.78%的准确率登顶榜单,这一成绩代表了NL2SQL 技术在复杂真实场景中的最高水平。

NL2SQL诞生于上世纪九十年代,旨在打破数据查询的壁垒,让非专业用户通过自然语言的方式访问和处理数据,例如用户输入「查询某电商平台数码产品的日均销售额」,可帮助用户自动查询并将计算结果返回。近两年大语言模型的成熟大幅提升了NL2SQL系统的准确率,但面向复杂的真实数据分析场景,NL2SQL的任务解决率依旧较低。

作为该领域”最接近真实企业场景”评测集,Spider 2.0基于 632 个真实企业数据库工作流问题构建,覆盖金融、医疗、电商等 18 个垂直领域,并全面考察NL2SQL产品的多表关联、长上下文理解、复杂逻辑推理等能力,也是检验NL2SQL产品商业化能力的重要标准。

测试结果显示,阿里云研发NL2SQL Agent——DB-Surfer以59.78% 的执行准确率斩获冠军,超越了国内外多个基于商业大模型的Agent方法,并显著优于基于固定工作流的 ReFoRCE (37.11%) 和基线智能体方法 Spider-Agent (31.08%)。

据介绍,为满足超大规模、高复杂度的数据库查询任务需求,阿里云DB-Surfer设计了查询意图预处理、代码智能体执行和多源路径后处理三个模块,通过“先规划、后执行”的机制显著提升了Agent查询和处理的效率,可以更好地解决数据库结构复杂、SQL方言多样、查询逻辑深度嵌套等难题。

该范式还支持集成多样化的外部工具,并自主学习海量新知识,可进一步推动NL2SQL技术从单一的查询生成工具,向更具挑战性的、能在开放场景下泛化的数据分析助手演进。

DataWorks Copilot – Agent 模式演示

目前,DB-Surfer已深度集成至阿里云大数据开发治理平台DataWorks的Copilot,并广泛应用于游戏、在线教育、零售、文化传媒和金融等领域企业,数据开发分析效率平均提升35%。