华存智谷:AI时代,存储正在从“仓库”向“AI数据供给平台“转变

文:DOIT朱朋博

在存储圈,华存智谷是一家颇为独特的公司。

它年轻,成立于2022年;它来历不简单,源于四川省存储产业规划中的”存储谷“项目,背靠成都高投和华为两大巨人的肩膀;它已取得阶段成果,在短时间内交付了150PB的全闪AI存储,在赛迪顾问《中国分布式存储市场研究报告(2025H1)》的报告中拿下了“AI存储市场第三名”的成绩,并在在AI存储市场、互联网市场、政府市场三项细分领域跻身领导者象限。

2025年11月19日,在数据存储产业大会上,华存智谷介绍了其作为存储系统厂商,为什么在短时间里取得丰硕的市场成果?在AI这波泼天富贵面前,作为存储厂商如何面对新的机遇和挑战?

华存智谷认为,AI时代存储的角色已被重新定义——它必须成为算力引擎的“高产油田”。GPU算力如同一个巨大发动机,需要存储系统持续、稳定地高速供给数据燃料。任何数据I/O的延迟或波动都会导致昂贵的GPU算力闲置,直接拉长训练时间,影响推理体验。万卡集群训练场景下,存储系统除了提供TB级聚合带宽、AI推理落地行业应用场景,更需要微秒级时延。

除了数据吞吐能力之外,AI高度依赖于数据的规模和质量。更多更高质量的数据通常意味着更精确的模型、更强的泛化能力和更可靠的推理结果。AI对数据量的渴求没有上限,10PB甚至100PB级数据湖集群正在成为常态。在这个常态之下有两个矛盾日益凸显:一是数据“应存尽存”与“存不下、存不起”的矛盾,高性能密度和容量密度、高存储利用率的存储系统,有助于缓解这一矛盾。另一方面,现代企业数据栈中数据与应用生态多元,业务负载运行在数据中心内,以及云端和边缘,割裂成数据孤岛,存储系统要能够支持数据全域统一视图汇聚、治理、共享和流动,数据在任何地方都能被高效访问。

AI时代的核心需求是数据。存储系统不仅是工具,如何把数据管理好,如何给算力资源供应好数据才是关键。AI时代的数据存储系统应当从“高吞吐仓库”的被动角色向“以数据为中心”的数据供给平台转变。

华存智谷在2024年推出TGStor 9800 AI高性能存储,单节点(2U设备)带宽高达175GB/s,并且具备IOPS 300万的性能密度和2PB超高存储密度。2025年Q1推出的HDM全局数据管理服务,是华存智谷打造“AI数据供给平台”迈出的关键一步。HDM基于全局元数据引擎构建统一命名空间,具备数据全局快速索引、智能化驱动数据编排流动的基本能力,既能横向整合汇聚跨域和异构数据源,打破数据孤岛,构建全域汇聚、统一调度的AI数据湖,又能垂直调度数据在多个性能分层之间的预热、缓存和流动。

在过去两年的市场上,华存参与了全国多地的大型智算中心建设项目,与一些云伙伴推进大型智算中心的交付。自2024年至今,整体交付量已经累计达到150PB全闪AI存储。大会现场,华存智谷介绍了两个典型案例,体现华存智谷在AI时代对存储系统如何演进的思考。

其中一个案例是,某重点实验室国产GPU万卡集群项目。华存提供一套由15个全闪存储节点组成的TGStor 9800 AI存储集群,单节点容量密度高达1PB,聚合总带宽达到2.6TB/s。为使整个算力中心具备可扩展性,万卡集群上千台GPU算力主机分布在多个网段,AI存储服务所有算力主机,必须要适应这种多网段混合组网的需求。TGStor 9800动态路由能力,聚合多网卡带宽,强化网络弹性,无损扩展带宽,为AI训练和HPDA负载提供高吞吐与零中断的网络保障。TGStor 9800的多协议数据互通以及全局数据统一命名空间纳管异构存储的能力,为算力中心构建全域数据汇聚、统一调度的AI数据湖。

另一个案例则是西部某城市的超智算数据存力中心。项目业主和运营方特别重视数据要素的潜力,要求存力系统不光为算力集群提供高带宽吞吐,还要服务于算力资源和数据要素集中流通的一站式运营模式,数据要素流通和算力资源消纳互相促进,以算聚数,以数促算,支撑人工智能驱动的重大科技创新和新兴产业发展。华存通过HDM全局元数据服务整合这三个算力中心的同构/异构数据源,构建一个百PB规模数据统一管理视图,数据在统一安全和权限管控策略下,跨层跨域、跨业务实体流通。

结束语

面对AI时代的全新挑战,华存智谷的选择很明确:不再留恋单纯“卖硬件盒子”的旧时代,而是向“AI数据供给平台”突围转型,深耕数据供给服务软实力。在AI算力狂飙的时代,这或许正是存储系统厂商穿越周期、在激流中站稳脚跟的唯一答案。