AI时代下,铨兴科技的数据存储创新实践

近期,2025年全球闪存峰会在南京召开,众多业界技术专家与行业用户齐聚一堂,探讨最新技术产品与实践成果,让大家可以从中了解闪存行业最新动态与趋势,这里推荐其中一位技术专家——铨兴科技副总经理邱创隆的演讲,铨兴科技总部在深圳,长期深耕存储领域,如今带着新的企业级SSD产品迈入AI基础设施市场。演讲人具备研发与产品规划双重背景,因而对AI应用场景下的存储挑战有深入的理解和认知。

数据洪流下的存储压力

生成式AI的快速崛起使得算力芯片和模型算法成为热点,也让存储逐渐成为制约AI效率与成本的关键变量之一。在大模型训练与推理过程中,如何提供高性能、高密度、低能耗、稳定可靠的存储解决方案成为AI基础设施设计的核心命题。

以大语言模型为例,其训练数据主要来自互联网爬虫。从2008年起,大概每隔三四个月就进行一次大规模数据采集,已经累积了13或15PB以上的文本内容。因此,随着模型参数的指数级增长,数据的清洗、存取与调用能力面临挑战。

而且在AI服务器BOM成本构成中,GPU等算力单元占比约6到9成,是整机中最昂贵的部分。为了充分释放算力价值,存储系统必须有相应的吞吐能力。同时,AI任务运行周期长,系统稳定性要求极高,任何存储故障都可能引发训练中断,造成巨大损失。因此,性能与稳定性是存储系统不可妥协的底层要求。

斯坦福大学一份报告显示,多个AI模型训练中,存储系统的能耗约占整体的三分之一。此外,数据中心空间利用率也直接影响运维与TCO成本。综上所述,“内存+闪存”组合架构逐步成为主流选择,为大模型高效调用提供可扩展性支撑,强化了存储在AI基础设施中的战略地位。

训练与推理阶段的存储挑战

AI训练阶段,存储要负责“检查点保存”和“恢复重启”任务。训练系统通常涉及网络、GPU、CPU、内存与存储等多个组件,结构复杂,崩溃风险较高。为了避免从头开始训练,互联网厂商训练大模型通常每几小时进行一次训练参数和状态存储,一旦崩溃不用从头开始训练,和游戏存档类似。

这对存储系统提出极高的要求。邱总现场分享了一个大模型检查点读写的存储带宽计算方式,让我们可以直观了解大模型对存储的严苛要求。假设训练一个175B参数的大模型,单次检查点大小约为175×14=2.4T(2450GB),每参数大小为2B,再加上12B暂时状态,因此就是要考虑14倍扩展,然后存档,2小时训练过程,如果这个存档要在3分钟内写入完,也就是占用整体2.5%的时间,2450GB除以180秒就是带宽13.6GB/s。读取速度算法类似但是读取可以并发读取,带宽需求没有写入那么大。

此外,训练后的验证、量化、微调与RAG结合部署也需频繁访问数据。特别是推理阶段,为引入企业自身数据来适配具体业务,要求存储系统既能高效处理小数据训练,又要支持低延迟推理交互。

RAG(检索增强生成)是把企业数据向量化后放到数据库,给出提示词之后先询问数据库,比对提问的向量和数据库有没有相同性,有就直接抓取相关资料,这部分也可以放到存储里,也需要高容量、高读性能的存储系统。

QLC固态硬盘就能发挥重要作用,它有大容量与较低成本优势,适合作为RAG数据库的承载介质。还有DeepSee的硬盘缓存技术,把之前问过的答案提前存储下来,下次遇到类似问题直接从缓存中提取,无需再次调用大模型,大幅降低功耗与算力消耗,据说响应时间能从10秒缩短至500毫秒,显著提升用户体验。

这些应用场景都强化了高容量、高性能、低功耗存储的战略地位。

铨兴科技的企业级QLC SSD设计考量

面向上述需求,铨兴科技围绕企业级QLC SSD提出了四大核心设计考量:

提升ECC容错能力。QLC每个单元需表示16种电压状态(TLC为8),电压间距更小,识别难度显著增加。温度波动、电荷泄露、读写干扰等因素均可能导致误码。因此,铨兴通过主控优化ECC能力,提升数据完整性保障,确保在复杂AI任务中稳定运行。

确保断电数据完整。大容量QLC SSD的数据写入频繁,为保障关键数据在断电后的安全写入,必须引入高效超级电容,支撑缓存数据的及时回写,提升整体数据安全等级。

优化系统级数据重构机制。在系统读取过程出现异常需重建数据时,QLC写入速度有瓶颈。对此,铨兴通过主控路径优化及块大小的调整,实现写入效率提升,缓解系统级写入延迟。

突破缓存瓶颈与空间约束。闪存密度快速增长,但DRAM及超级电容因工艺限制,容量密度难以同步扩展,造成PCB空间约束压力加大。为此,铨兴通过增加主控固件IU大小、搭配高密度内存颗粒,平衡容量、成本与性能三者之间的关系。

目前,铨兴科技已推出多款基于PCIe 5.0的企业级SSD产品,其中,122.88TB的QLC SSD是当前市场最高容量的代表作,已进入送样阶段。该产品采用Dual Port设计,读多写少特性与AI推理场景高度契合。另有TLC版本PCIe 5.0 eSSD,覆盖2TB至32TB容量,读写性能可达1018量级,是AI训练/高性能计算(HPC)等应用的存储优先选项!

在SATA接口方面,铨兴也突破传统上限,将单盘容量提升至15.36TB,DWPD超过3,满足高频次写入场景需求。

为降低大模型训练门槛,铨兴还推出训推一体机解决方案。例如DeepSeek 671B模型训练通常需部署数百张高端显卡,成本高达千万级。铨兴方案通过16张中阶显卡搭配8张扩展卡,即可实现高精度、全参数大模型训练,整体训练成本可降低90%。该平台涵盖PC、工作站等形态,支持从大模型蒸馏到小模型部署的完整任务链,为AI开发者提供更灵活高效的交付路径。

结语

从高密度、高性能、高容量企业级SSD到打破显存墙的训推一体机,铨兴科技正持续拓展企业级AI基础设施的能力边界,以强大的存储产品力与系统解决方案,助力智能计算全面提速,在AI时代释放更大的数据价值。