
如今,专家、学者都在呼吁要像重视智算中心或者算力中心一样,重视存力中心的建设,但什么是存力中心?存力中心应该具备哪些衡量指标?对此,并没有一个业内的共识,很多时候,会与存储数据中心混为一谈。为此,中国电子工业标准化技术协会数据存储专委会(简称:数据存储专委会)特邀业内专家进行研讨和交流,并通过《数存连线》栏目对外传播。
我非常荣幸受邀,与华为数据存储产业发展总监翟爽、中国移动研究院项目经理闫晗、数据存储专委会秘书长孙钢等专家参与第1期沙龙研讨,也因此迸发了“有存,有力,才是存力中心”的观点。
存力中心不能仅用存储容量考评
在我看来“有存”非常好理解,数据要存下来,保护好,基本等同于存储数据中心,数据在这里保存、使用,甚至交易。
相比“有力”应该怎么理解呢?对此,不妨对比一下算力,所谓算力可通过1PFLOPS(千万亿次/秒)或者10PFLOPS等GPU算力的指标进行衡量;那么,存力中心如果也用100PB/1EB数据存储的能力进行界定是否可以呢?我认为千万不可以!
为什么存力中心不可以照方抓药呢?
之所以可以用1PFLOPS或者10PFLOPS等算力指标界定智算中心,是因为算力基本决定了AI大模型训练、推理的能力和水平;相比,100PB/1EB存储数据容量,只能够代表数据的多与少,并不代表就此可以释放数据的价值。借用数学的逻辑表述,存储数据的能力是必要条件,却并不是释放数据价值的充要条件。
从数据到数据价值释放,缺少了数据要素这个中间环节。
数据要素是存力中心非常重要的核心内容。这从数据要素的表述就可以体现出来,数据要素是指从数据中提炼出的、可用于生产经营并创造价值的资源,是数字经济时代的核心生产要素之一。
应该说,数据要素才是存力中心建设的灵魂,也是“存力”的力量源泉。
存力如何进行衡量?
从数据到数据要素,再到数据价值的释放,离不开生产力工具的使用,其中包括大数据以及AI大模型。AI大模型的使用已得到了广泛的认可和重视,数据要素也不可避免地与AI大模型技术紧密结合,激发新的生产力。因此,数据要素对AI大模型的支持能力,完全可以作为存力的衡量指标。
未经处理的原始记录(如日志、文本、图像),也就是我们说的数据,一般不直接参与交易,也不能被AI大模型直接使用,这也是为什么100PB或者1EB的存储容量不能说明问题的原因。这些原始数据要能够被AI大模型使用,必须先经过清洗、加工、分析和处理,其中,向量化就是一个最为基础的操作。既然如此,完全可以将向量化数据量作为数据要素的衡量指标,如果数据要素占比过低,则不宜称为存力中心。
存力中心建设应该集中体现出数据要素的加速能力,加快数据价值的使用和释放,这理应成为存力中心建设的重要使用目标,如果背离了这个初衷,存力中心建设极有可能成为数据中心建设的翻版。
存力中心建设是否应该像智算中心一样单独立项呢?
存力中心应该与智算中心一样得到重视,但这并不意味着一定要单独构建一个存力中心,这是因为数据要素不应离开生产力单独存在(这里生产力应该是算力),智算中心和存力中心不应该割裂。因为数据量庞大,存力中心很难依靠网络传输远程连接智算中心。存力中心应该紧邻智算中心,或者干脆就在同一个数据中心。二者的关系是:存力中心应该是智算中心,但是智算中心未必是存力中心。这是由数据价值释放的这个性质决定的。
一切应该以数据价值释放作为前提,存力中心建设应该体现出这个原则和宗旨。
存力中心存储应该具备的能力
以释放数据价值作为前提,这也对存储基础设施运作提出了新的要求。
无论是存储容量、闪介质占比、高速网络、分层存储管理等等,都应该有明确的要求和衡量的指标。
考虑闪存介质占比,主要是AI大模型对数据存储的需求,从模型训练中的CheckPoint加载,到模型推理中的数据处理,都对存储系统的性能有很高的要求,而闪存介质占比,可以作为主要衡量指标。其中,高速网络也是保障性能不可或缺的技术,也可以作为衡量指标之一。
性能之外,数据分层存储的管理水平也是重要的衡量指标,其中牵涉到的技术,如多协议融合互通、多元异构集群纳管,目的是同一份数据,实现文件系统、对象存储、大数据共享访问,支持AI、数据交易、数据分析等上层应用。避免了数据的拷贝来,拷贝去,最大程度上体现数据的管理水平。
在此需要认真思考的问题是:数据流动并不等同于数据的自由拷贝、复制,相反,更多的数据拷贝、复制,不仅带来存储成本的增加,同时也恰恰反映出数据共享水平的低下。因此,存力中心需要的是高水平的数据管理,以及高效的成本控制,这应该成为存力建设的最基本的原则。
小结
以上是我对存力中心建设的一点思考,存力中心应该以数据价值释放为根本目标,综合考虑数据要素占比,以及存储基础设施的专业化。希望通过数据存储专委会等专业机构,从专业的角度给出完整的存力中心建设衡量标准,促进存力中心的健康发展。