8月2日,由 CIO 时代主办,蚂蚁集团协办,新基建创新研究院作为智库支持的“央国企十五五数智化战略与机遇 | 首届央国企CIO及数科公司数智创新峰会”圆满举办!主题演讲环节,腾讯云大数据首席架构师宋企皋带来“Data x AI构建数据管理新范式”主题分享。

腾讯云大数据首席架构师 宋企皋
精彩观点
AI与数据治理的深度融合将成为未来数据多模态管理、深度洞察与统计分析的重要发展方向。腾讯提出”AI for Data”技术方案,通过部署数据分析智能体与数据工程Agent,实现多模态数据的高效处理,降低业务人员数据开发门槛并提升质量效率。
在 AI 技术飞速发展的今天,大模型应用的效果越来越多地被归因于数据质量 —— 当算力瓶颈逐步缓解、通用大模型日益普及,数据资产的质量与管理能力正成为决定 AI 落地成效的核心变量。从 “Data + AI” 到 “DataXAI”,数据与人工智能的融合已进入深度协同阶段,这不仅带来了业务价值的重构,更对传统数据治理模式提出了颠覆性挑战。
技术架构升级:
支撑人机协同的数据底座
AI 与数据的深度融合,对基础设施提出了更高要求。传统私有化大数据平台以结构化数据存储为主,难以应对多模态数据的爆发式增长与算力需求的弹性波动。因此,数据平台向云原生架构演进成为必然:通过存算分离实现资源弹性调度,依托统一元数据管理打通数据孤岛,最终构建能支撑多样化 AI 场景的技术底座。
组织架构的协同同样关键。过去,企业的数据团队与 AI 团队往往独立运作,形成 “两套工具、两份数据” 的割裂状态。而从去年下半年开始,越来越多的企业将两支团队整合,实现 “一个团队、一个工具、一份数据” 的协同模式,这一调整不仅大幅提升了 AI 应用开发效率,更保障了数据资产的一致性与安全性。
2022 年起,腾讯启动数据智能升级项目,核心解决三大问题:让 AI 精准理解业务需求、让 AI 高效识别与调用数据、让 AI 生成高质量代码以快速响应需求。具体措施包括:
一、构建 “人机共懂” 的数据资产体系。通过大模型识别通用业务特征,沉淀核心数据的标准化代码片段,让 AI 可直接调用成熟模块;同时搭建数据资产语义层,将业务含义、指标与代码有机关联,提升自然语言到机器语言的转化精度。
二、建立 “人机协同” 的工程体系。在传统 “人 – 流程” 协作模式中引入多 Agent 协同机制,让业务人员可实时参与 AI 生成过程并基于经验修正,形成 “越用越好” 的正向迭代循环。
智能数据湖:
面向未来的数据治理方案
基于上述实践,腾讯云将大数据平台升级为 “智能数据湖” 方案,核心包含四大能力:
数据分析智能体:以类 ChatBI 能力为核心,支持自然语言转 SQL 或代码,目前在国际数据集测试中排名全球第三、国内第一。通过多轨并行解析(基础需求、Excel 需求、路径分析等),进一步提升代码生成的准确性与效率。
数据工程 Agent:聚焦数据开发质量提升,可快速定位代码问题,同时将 AI 能力融入数据分类分级环节,强化数据安全识别与风险监测。
Data 与 AI 一体化平台:弥补传统 AI 平台在数据安全管控、资产管理上的短板,通过原有数据开发平台的能力复用,实现大模型训练与应用开发的全流程高效支撑。
多模态数据管理与智能运维:提前布局多模态数据存储与治理能力,通过统一元数据管理(涵盖技术元数据、业务元数据、模型及自定义函数)实现跨应用数据服务;引入大模型辅助平台运维,提升大规模任务的稳定性保障效率。
写在最后
尽管AI 与数据治理的融合仍处于探索阶段,但在未来,随着多模态数据的持续涌入,数据治理将迎来新一轮升级,AI 在深度洞察与统计分析中的作用将更加凸显。腾讯云期待与更多企业携手,共同完善数据智能体系,让数据更好地支撑 AI 时代的业务创新与发展。