AI智能体时代,Cohesity的数据保护和管理攻略

这是数据保护与管理厂商Cohesity的最新动态。

乍一看,还挺秃然,早几年曾整理过一些存储初创公司,Cohesity就是其中之一,2017年创立,那时候是专注二级存储,同期还有智能数据存储初创公司Komprise,容器存储初创公司Portworx,后者被Pure收购了,Komprise也还在,2024年年初Cohesity官宣了收购Veritas的数据保护业务,因此,今年顺理成章变成了数据保护与管理公司。

讲完起源,现在了解一下Cohesity在AI成为企业核心战力的当下,高效调用企业海量数据的策略。

在AI成为企业核心战力的当下,如何高效调用企业内的海量数据,支撑生成式AI(如RAG、智能体)的落地,正在成为新战场。而在这场竞赛中,一类此前被视为“幕后角色”的厂商正在突围——数据保护与管理公司,其中Cohesity的策略尤为值得关注。

企业部署AI的关键环节之一,是构建数据通路,尤其在引入RAG(Retrieval-Augmented Generation)等AI能力时,需要接入结构化和非结构化数据,完成数据筛选、向量化和检索,从而为AI模型提供“企业上下文”。

但实际的数据架构不是一条通路能解:

首先,实时业务数据分布在数据库、ERP系统、数据湖、本地与云端;

其次,大量历史数据存在备份系统和归档系统,AI访问有难度;

企业还常给每类数据建立一条独立的数据通路,最终形成实时数据管道、备份数据管道、归档数据管道三足鼎立。

这也带来了成本高、效率低、管理复杂等难题,比如构建与维护三条并行通路,资源投入大,多源异构的数据节点遍布边缘、云、数据中心,处理延迟高,数据调用路径分散,难以统一治理与优化等。

Cohesity的核心策略是构建一个“通用数据访问层”,实现实时、备份和归档数据的一体化连接与调度,避免重复建设冗余通路。

一方面,Cohesity原本就具备连接本地、云端多种数据源的能力——在备份时已经了解企业的所有系统。现在,通过反向调用这些连接器,从备份路径反向触达实时数据源,不再需要为AI另建通路。

还有就是Cohesity将多年来备份系统积累的庞大元数据与自研AI引擎Gaia结合,生成上下文元数据,辅助AI模型在数据向量化和召回中更准确地“理解业务”。

Cohesity还逐步实现了非结构化数据的向量化处理能力,并能将其映射进统一语义空间,最终服务于RAG和多模态AI模型的检索与生成。

这一整套体系,使得Cohesity从一个备份厂商,跃升为企业AI的数据输入管家——一个为AI提供“视野”与“语境”的智能透镜。

Cohesity也进一步使得数据保护厂商获得了重新定义价值链的位置。在AI成为企业“中台”的过程中,数据访问的质量直接决定了智能体的执行力。而Cohesity正试图抓住这个入口。

行业新博弈

目前来看,行业正在形成两个阵营:

以Cohesity、Rubrik、Commvault等为代表的数据保护厂商,依托其“全量数据快照能力”,由后向前延伸,打通AI数据入口;

还有以实时数据通路厂商为代表的传统AI集成商,拥有丰富的API对接经验,但没办法覆盖“封存的数据”。

Cohesity的优势在于它原生具备连接性+元数据+治理结构,并且围绕AI构建独立研发体系。其自研AI引擎 Gaia不是一个通用模型,而是专门服务于企业数据语义理解与上下文管理的“辅助智能”。

最后

Cohesity的通用数据访问层思路,让我们知道,数据保护不是“灾难备份”的配角,而是正在走向AI数据基础设施的中心。