跑AI应用 先把你的数据带上

5月27日,星环科技主办“AI × Data:新一代 AI Infra”2025年度产品发布会,星环科技正式发布AI-Ready Data Platform概念,并全面展示其构建新一代AI基础设施的核心能力。

一、从“AI Data”迈向“AIData AI与Data的关系演进

当前,AI技术正经历从工具性应用向深度融合的转变。星环科技在发布会上清晰地勾勒了AI演进的四个阶段:从最初的内容生成(Step 0),到自然语言与知识库的简单交互(Step 1),再到AI成为共事者、重构应用的乘法阶段(Step 2),最终迈向人类进入AI时代的指数级跃迁(Step 3)。

这一演进过程可以用公式表达为:从AI生成Data,到AI + Data的简单加法,再到AI × Data的乘法效应,最终达到(AI × Data)^n的指数级增长。其中,AI × Data不仅仅是简单叠加,而是AI与数据处理、数据治理、数据分析的深度融合与相互赋能。

正如Gartner最新研究报告《Data Management Is the Sole Differentiator in a Commoditized and Multipolar LLM World》所指出的:”特定的LLM将不再被视为企业成功的主要区别因素。取而代之的是,其他企业很难获得或复制的独特内部数据将成为成功AI旅程的唯一竞争力来源。”在AI技术深度普及的今天,数据管理能力将成为企业差异化竞争的关键。

二、大模型落地的多重挑战:数据与应用的双重困境

在企业大规模落地AI的进程中,数据挑战和应用挑战成为制约高效落地和高ROI的两大关键因素。星环科技在发布会上深入剖析了这些挑战,为企业智能化转型提供了清晰的问题视角。

   数据挑战:从沉淀到应用的全链路痛点。

数据挑战主要体现在四个方面:首先是数据资产沉淀不足,企业数据割裂,形成严重的信息孤岛;其次是数据存储模型单一,不同模型分离存放,无法统一存储;第三是数据质量问题,包括数据杂乱、质量差,缺乏数据标准和自动化治理工具;最后是数据应用层面的挑战,如数据安全性低、时效性差、共享流通存在壁垒等。

这些挑战不仅影响了企业数据资产的价值发挥,也直接制约了AI技术的落地效果。

   应用挑战:碎片化与集成难题。

在应用层面,企业面临的主要挑战是应用爆发成百上千,单点建设成本高,与现有系统对接困难,以及AI Safety等问题。这些挑战导致企业在AI应用建设过程中投入大量资源,却难以获得理想的回报。

面对这些挑战,企业需要一个能够统一管理数据和AI的基础设施,以降低建设成本,提升AI应用质量,确保AI应用的安全可控。这正是星环科技新一代AI Infra的核心价值所在。

三、星环科技新一代AI Infra:重构企业AI基础设施

星环科技在此次发布会上推出的新一代AI Infra,不仅是一套完整的人工智能基础设施技术架构,更是一次关于未来企业智能化如何落地的系统性思考。新一代AI Infra旨在解决企业在AI落地过程中面临的数据和应用挑战。这一架构包含四大核心平台: Knowledge Platform(知识平台)、AI Platform(AI平台)、AI-Ready Data Platform(AI 就绪数据平台)和Resources Platform(资源平台)。

    AI Infra整体架构:四层协同,全赋能

星环科技新一代AI Infra采用分层设计,从底层资源到上层应用形成完整闭环。

Resources Platform作为基础,提供统一的资源管理能力,支持多种异构计算资源;

AI-Ready Data Platform作为核心,提供多模型数据的统一存储和处理能力;

AI Platform提供模型训练、推理和应用开发能力;

Knowledge Platform则负责知识管理和工程化,将数据转化为知识资产。

这四层架构不是简单叠加,而是深度融合、相互赋能,形成了一个完整的AI基础设施生态。

通过这一架构,企业可以实现从数据到知识、从模型到应用的全链路智能化转型。

四、AI-Ready Data Platform:数据平台的革命性创新

作为AI Infra的核心构成,AI-Ready Data Platform是一个AI赋能的数据平台,为AI生产和提供高质量数据。该数据平台以关系型、向量、图、全文、时序等多模型数据统一存储管理为基础,提供多模态数据自动处理、高效数据治理、特定领域知识构建以及全流程的实时数据洞察能力,实现从数据产生到应用于AI的全过程数据管理,一站式助力企业更高效地运用AI释放数据价值。它具有五大核心能力:

  1.AI-Ready Data多模型数据:支持向量、图、文档、全文索引、关系型表等多种数据模型,为AI应用提供丰富的数据基础;

  2.非结构化数据处理:能够将非结构化数据转化为半结构化、结构化数据,解决企业80%以上的非结构化数据难以利用的问题;

  3.数据治理:提供高效数据治理能力,确保数据的准确性、一致性和可用性;

  4.特定领域知识:将数据模型转化为知识,提取和沉淀领域知识,为AI应用提供知识基础;

  5.全流程实时数据洞察:支持实时接入、实时处理、实时分析,满足企业对数据时效性的高要求。

这些能力通过星环科技的多款产品得以实现,包括Transwarp Corpus Studio(星环语料开发工具)、Transwarp Data Studio星环数据开发工具)、Transwarp Data Hub(星环一站式多模型大数据平台)和Transwarp Knowledge Hub(星环知识平台)。

    多模型统一架构:AI-Ready Data Platform的技术核心

星环科技的AI-Ready Data Platform支持向量、图、全文索引、文档、时序数据等多数据模型,并实现了统一接口、统一计算引擎、统一存储到和一资源管理,形成了完整的统一技术架构,用户可以在接口和计算层屏蔽所有异构数据带来的差异化,以统一形态满足目前以及未来各类垂直大模型场景的落地需求。星环科技自2020年实现多模型统一架构以后,不断拓展多模型能力,到2023年发布分布式向量数据库后已完整支持业内主流的11种数据模型,连续2年入选Gartner“数据库产品品类最多的厂商之一”,并成为国内首个通过信通院”多模数据库产品评测”的厂商。

    全流程实时数据洞察,加速数据价值创新

星环科技湖仓集统一平台,端到端秒级数据分析:星环科技湖仓集统一数据平台,基于统一的存储、统一的资源管理、统一的计算引擎和统一的接口,一个平台能够同时支持批处理、交互式分析、实时数据处理和在线数据服务四类场景。基于星环科技一体化的数据平台,端到端数据处理延时从过去的T+1天提速到T+1秒,实现数据落地即分析。并且,在数据处理分析性能方面相比业内同类产品均都数倍的提升,例如在100TB TPC-DS测试场景中,数据分析性能相比Databricks(Photon)提升1倍,硬件成本降低一倍。星环科技自2017年实现湖仓一体架构后,在实时、高并发数据写入以及数据处理分析方面不断创新突破,在2022年实现了湖仓集一体的架构,并且数据集市性能能够达到甚至超越单独的数据集市,帮助数百个客户构建统一的数据平台,加速实时数据创新。

高性能分布式时序数据库,PB级实时时序数据秒级分析:星环科技分布式时序数据库Timelyre9.3版本实现了10倍的分析性能提升,能够秒级分析PB级实时时序数据,助力企业用户实时处理传感器、金融交易、系统日志、生产设备等实时产生的海量时序数据,快速识别风险或者定位故障原因。同时,分布式架构可以线性扩展,满足PB级到EB级数据的存储需求,结合5-20倍的无损数据压缩能力,有效减少存储节点数据量,大幅降低成本。

五、Sophon LLMOps 1.6:四维进化,催化AI × Data融合

星环科技在此次发布会上重点介绍了Sophon LLMOps 1.6平台的四维进化,作为企业级AI基础设施Sophon LLMOps统一支撑空间管理、模型、算力管理、数据管理、通用工具,实现智能体驱动的AI全流程运营,实现了从数据到智能、从模型到应用的闭环升级,全面催化 AI × Data 的深度融合。

    四大模块协同:全生命周期统一管理

Sophon LLMOps平台包含四大核心模块:

星铸(Model Foundry模型开发):支持主流HuggingFace大模型的一键导入、纳管与部署,具备自动量化与推理加速能力。兼容多种国产GPU与推理引擎,适配企业级模型多环境管理需求。助力企业构建稳定、安全、高效的模型基础能力;

星典(Knowledge Lodge知识工程):提供从知识构建、审核、发布到优化的全流程管理能力,支持多源知识融合与企业级知识体系建设。强化知识治理与问答应用的支撑能力,是AI理解业务语义的核心模块;

星解(Corpus Studio语料工程):新增数据资产化、文件编目与分布式语料处理能力,帮助企业快速准备训练数据。支持语料标准化、自动标注、协同审核,是高质量数据供给的核心支撑平台;

星构(Agent Go应用开发):支持智能体(Agent)、应用链与插件的灵活编排与部署,全面兼容MCP协议。新增数据解析、知识工程等智能体,让模型能力快速集成进业务系统,推动AI在各类场景中真正落地。

Sophon LLMOps还具备企业级AI基础设施管理能力,提供对空间、工具、算力、模型、数据的统一管理,支撑大模型从开发到部署全过程的有序运行。这一能力使得AI能力成为企业级资产,具备可监管、可配置、可复用等特性。

    一站式解决企业大痛点

Sophon LLMOps平台通过全生命周期统一管理,一站式解决了企业在AI应用开发过程中面临的六大痛点:

「难」:多模型适配难:通过统一的模型管理和适配机制,简化了多模型的使用和集成;

「缺」:算力永远缺:提供高效的算力管理和调度能力,优化算力资源利用。;

「难」:语料供给难:通过星解模块提供专业的语料工程能力,解决语料供给问题;

「差」:准确度差:结合知识工程和模型优化,提高AI应用的准确度和可靠性;

「难」:新需求VS旧能力:大模型人工智能硬件需求、软件开发、应用、人才要求和传统软件都不一样;

「贵」:应用分散建设成本高。

通过这一平台,企业可以构建各种智能应用,如客服助手、合规助手、财务分析、数据分析和决策助手等,满足不同部门的业务需求。企业级管理能力,让AI从分散开发走向统一运营,实现资源可控、流程可管、资产可用,加速AI在企业中的规模化落地。

六、星环科技新一代AI Infra的行业应用案例

从理论到实践 星环科技的新一代AI Infra不仅在技术上实现了突破,更在实际应用中展现了强大的价值。

    实时湖仓集一体:一体化构建AI × Data 实现端到端秒级数据分析

在此之前,用户使用CDH、Hbase、Hive、Clickhouse等多个开源产品来实现多业务场景,存在数据冗余、处理链路长、时效性差等问题,通过星环科技构建实时湖仓集一体平台,可以基于一个平台同时支持传统数据应用、实时数据洞察和AI大模型应用。

迁移到星环实时湖仓集一体平台后,在传统数据应用方面,整体性能大幅提升。例如在交易报表场景中,批处理性能提升1倍,在大屏驾驶舱场景中,OLAP分析性能提升高达10倍。

同时,星环科技实时湖仓集一体平台的实时入库、秒级分析能力可以助力金融机构实现实时数据洞察,例如在实时风控场景,可以实现秒级延时,数据落地即分析,助力金融更快地识别风险和采取应对措施;在手机银行场景,每服务器可支持2000QPS的高并发在线数据服务;在CRM等场景,星环科技实时湖仓集一体可支持HTAP的混合负载能力,避免数据搬迁带来的延时,助力金融机构实现更快的服务响应。

此外,用户可以AI-ready data platform快速构建大模型应用,例如基于星环科技数据分析助手无涯·问数,可以实现自然语言做数据分析,并且准确率达到95%以上;在智能营销方面,过去需要几天来做的数据处理和报告整理,基于星环科技知识平台构建营销助手只需要几分钟即可实现数据处理和报告生成,大幅提高金融机构营销效率。

    金融机构:打造企业级知识库,为大模型应用输送高质量语料

在银行业的应用中,星环科技帮助某银行打造了企业级知识库,解决了数据治理工程复杂、企业构建应用中缺乏高质量数据与语料、数据孤岛和领域知识匮乏等挑战。

通过星典Knowledge Lodge和星解Corpus Studio,结合Sophon LLMOps平台,构建了统一 的企业级知识工程平台,实现了知识资产的定义、管理、构建和存储全流程管理。最终形成了”4+1″知识库体系,包括指标、制度、运营、客服四大场景知识库和金融行业通用知识库, 支持智能问答、信贷助手、行业研究、代码生成、财务分析、风险分析、智能营销、智能软件工程、数字办公和科研检索等多种知识应用。

这一案例充分体现了”AI × 企业私有数据”的核心理念,通过高质量的企业知识库,打造了银行业的核心竞争力。

   数据治理AI赋能,实现全面自动化

星环科技在 AI 数据治理领域,以知识工程为核心,构建了一套全面自动化、高效且精准的解决方案,助力企业实现数据价值的深度挖掘与高效利用。星环科技语料平台星解Corpus Studio,支持多源数据采集 ,PDF、Word 文档及其他多种格式文件,无论来自网站公布的行业动态,还是企业内部规范,都能一站式汇聚,为后续的数据处理提供丰富素材,同时可以对采集到的语料进行深度解析,精准提取标准名称、编号、发布单位等关键信息,并依据内容类别进行智能分类,形成高质量语料。

星环科技知识工程平台星典Knowledge Lodge进一步解析语料正文、表格、图片等信息,运用先进的 AI 技术精准抽取数据项、数据定义等关键知识要素,抽取的知识被整合进知识库,形成标准化、体系化的知识资产。知识库涵盖数据字典、数据质量规则等丰富内容,为企业数据治理提供知识支撑,同时支持知识的更新与维护,确保知识的时效性与准确性。

星环科技将各类数据治理工具封装为 AI 数据治理 MCP Server,实现 AI 与数据治理的无缝融合。凭借深度智能驱动,数据治理工具得以高效运作,这不仅突破了传统数据治理的局限,更将智能化水准推向新高度,极大地提升了整体工作效率,为数据治理领域树立了智能化的新标杆。

  M域和O域统一视角高效融合实现价值创新

星环科技时序数据库Timelyre可以实现PB级实时时序数据分析,并且可以直接进行机器学习。

不仅如此,基于星环科技统一技术架构,实现时序数据和关系型数据的统一存储和库内跨模型融合分析,帮助企业构建M域(如ERP、CRM)和O域(如运维、监控、设备)的统一数据视角,更好地支撑经营决策、质量管控、供应链优化与运维监控等多种场景的数据和业务价值实现。

这一案例场景展示了星环科技多模数据融合与实时分析如何为企业创造新的价值,通过打破数据孤岛,实现了管理和生产的深度协同。

环科技引领新一代企业AI基础设施新时代

星环科技此次发布的新一代AI Infra,不仅是一系列技术产品,更是企业竞争力重构的重要支撑。通过”AI × Data”的创新理念,星环科技为企业提供了从数据到知识、从模型到应用的全链路解决方案,帮助企业在AI时代重构竞争力。

在当前大模型技术日益普及的背景下,星环科技敏锐地洞察到高质量数据将成为企业差异化竞争的关键。通过AI-Ready Data Platform的五大核心能力,实现从数据产生到应用于AI的全过程数据管理,一站式助力企业更高效地运用AI释放数据价值;通过Sophon LLMOps平台的四维进化,企业可以构建高质量的AI应用,解决多模型适配难、算力永远缺、语料供给难、准确度差和企业架构规划难、应用分散建设成本高等六大痛点。

从银行业的企业级知识库建设,到数据治理的全面自动化,再到M域和O域的统一视角,星环科技的解决方案已在多个行业展现了强大的价值。这些成功案例不仅验证了星环科技新一代AI Infra的可落地性,更展示了AI与数据融合为企业创造的实际价值。

展望未来,随着AI技术的不断发展和数据管理能力的持续提升,AI与数据的深度融合将重塑企业竞争格局。星环科技的新一代AI Infra为这一趋势提供了技术基础和实践路径,帮助企业在 AI时代赢得未来。

“企业落地AI是竞争力重构”,在这个过程中,星环科技将继续发挥技术引领者的作用,为企业提供全栈式的AI基础设施解决方案,助力企业实现真正的智能化转型。