因为AI的原因,存储市场迎来了新一轮的繁荣期。有预测数据显示,全球AI驱动存储市场在2024年的规模大约是287.1亿美元。预计2025年将增长到359.5亿美元,并在2034年达到大约2552.4亿美元,年均复合增长率大约是24.42%。

从2025年来看,AI与数据存储的关系已经发生了变化。原本存储只是支持AI工作负载运行的数据基础设施,在现在的实践中,两者已经升级成了一种相互促进,相互成就的共生关系。
一方面,如今的AI不仅是存储系统支撑的一种负载,也逐渐成为存储系统的核心智能组件。另一方面,存储系统所提供的海量高质量数据,以及对数据管理能力,已成为决定AI模型成败的关键因素之一,存储系统本身也在发生变化。
首先,AI正在为数据存储注入智能化能力
通过AIOps技术,存储基础设施获得了更高的自动化管理水平。AI不仅能够预测硬件故障、自动诊断性能瓶颈,还能智能优化资源分配,将人工运维从繁琐的被动响应中解放出来。
AIOps超越了基于规则的被动式IT管理模式,利用先进算法分析海量的数据流,从而识别出人眼难以察觉的复杂模式和异常行为。这种方式,使得IT运营从被动响应,转变为主动预测和预防。
通过对历史数据和实时传感器数据的学习,能够在设备发生故障前提前预警。比如,AI能够持续分析SSD内置的SMART信息,从而预测SSD的剩余寿命,然后在出现问题前有计划地进行更换,从而避免不必要的问题。
现代IT环境的复杂性使得故障排查变得异常困难,而AIOps平台能够从整个IT堆栈中采集并关联数据,自动诊断性能下降或服务中断的根本原因。它的优势在于能迅速定位问题源头,而无需工程师手动在数不清的监控系统里排查。
类似的,传统监控系统常常产生大量低价值的告警,导致运维团队进入告警疲劳状态。而AIOps能将数千个相关告警进行聚合,形成一个具有明确根源和影响范围的核心事件,从而大幅缩短平均解决时间。
基于AIOps进行资源优化与容量规划也非常实用。通过分析资源使用模式,AIOps能够预测需求,帮助企业更精准地规划,避免浪费。在存储管理中,AIOps能根据数据的实际访问频率自动迁移数据到成本更低的存储层,从而降低存储开支。
除此之外,由机器学习增强的压缩与去重以及异常安全行为检测,都在极大的提升存储的成本效益和安全性。总之,有了AI之后,存储系统正从一个被动的数据大仓库转变为一个具备自我管理和自我保护能力的智能数据平台。
其次,数据存储行业正在面向AI进行自我重塑
Garbage In, Garbage Out,这句古老格言在AI时代被赋予了新的内涵——低质量的数据是导致AI项目失败的重要原因。于是,为了满足AI对数据在规模、性能和多样性上的要求,数据存储系统的架构、存储硬件和数据管理范式都有新的要求。
首先,数据规模的重要性不难理解,数据的规模直接决定了AI的能力上限。数据越大,模型能学到的模式和细节就越丰富,训练出的AI也更精准、更智能。同时,大规模数据还能覆盖更多场景,避免模型产生偏差。
同时,数据的多样性对AI表现的影响也非常大。比如,早期的面部识别系统主要使用白人面孔训练,导致其在识别深色皮肤个体时准确率极低。因此,一个强大的AI模型必须在多元化的数据上进行训练。
存储系统需要规模庞大的、多种多样的数据,存储架构也需要发生变化。从数据存储架构的趋势来看,当前,存储架构正从孤立的数据仓库和数据湖,转向统一的数据湖仓一体化的架构。
这是因为,原本企业通常维护两套数据系统,一个是用于支持BI和报表的数据仓库,里面存的是结构化数据。另一套是用于数据科学和机器学习的数据湖,里面都是非结构化数据。这种双层架构导致了严重的数据孤岛问题,系统间进行ETL会有很多问题。
数据湖仓一体将数据湖与数据仓库结合在了一起,它统一了结构化、半结构化和非结构化数据,它消除了数据孤岛,为企业创建了一个单一的可信数据源,减少了因数据冗余带来的成本和管理开销,也加速了从数据到模型再到洞察的迭代进程。
在硬件层面,一方面,以NVMe SSD为代表的高性能存储层,可以最大化GPU的利用率。另一方面,以大容量HDD和磁带为代表的高容量存储层,则以极低的单位成本存储海量训练数据。
为了更好地服务于AI数据存储的I/O模式,市场上出现了“AI原生”的存储平台。这类平台强调大规模并行与可扩展性、极致的低延迟、与AI生态的深度集成、对统一多协议访问的支持。
AI与数据存储之间形成了一个牢固的创新循环
我们看到,AI与数据存储之间形成了一个创新循环,这一个创新循环能带来哪些价值呢?
对于存储厂商而言,AI与数据平台的融合,推动存储厂商的商业模式从静态、基于产品销售的模式,向动态、基于数据洞察和服务的模式转型。从产品到预测性服务的转变,让存储厂商从一次性销售产品转向提供可预测的成果或服务,创造持续价值流。
存储架构的数据湖仓一体架构汇集了所有数据,而AI模型则能从中挖掘出每个个体的独特偏好。二者的结合使得大规模提供深度个性化体验成为可能,而个性化的服务能够显著提升用户粘性,为企业创造更多价值。
那些拥有较高治理水平数据的组织,可以利用AI将其转化为有价值的产品。比如,向市场销售匿名的行业趋势数据;为金融机构提供预测性的信用风险评分服务;或者提供在特定领域数据上预训练好的、开箱即用的AI模型。
随着智能体技术的兴起,AI会变得更加自主。在这些模式中,AI代理能够以极少的人工干预执行复杂任务,它们能直接与数据系统交互以完成工作流。这是今年以来最为广受关注的技术趋势,这种模式将自动化提升到了全新的高度,也带来了很多可能。

2025年11月18日,以“释放数据潜能,加速智能涌现”为主题的2025中国数据与存储峰会将于在北京举行,大会将共同探讨AI时代的数据基础设施演进、存储技术创新、智能应用实践及未来发展趋势,希望帮助企业构建AI与数据存储螺旋上升的良性循环。