2025年,DeepSeek掀起了本地部署大模型的热潮,某电视总局基于DeepSeek构建了RAG(检索增强生成)系统,面向用户提供了一个AI助手。在融科联创和Solidigm的帮助下,将系统准确率从50-60%提升到了95%左右,存储在其中起到了重要作用。
存储性能对于企业DeepSeek落地很重要
融科联创解决方案事业部经理杨磊介绍称,该用户最初使用的是开源的RAG软件系统,不仅准确率仅为50-60%的水平,而且幻觉很高。当使用了融科联创开发的RAG系统后,准确率提高到了70-80%,幻觉的概率也大大降低。
然而,这样的准确率仍旧没能达到用户预期。当采用了融科联创的软硬件一体机解决方案后,存储系统由原来的混闪架构升级到全闪方案,存储性能的提升大幅提高了做微调的效率。最终,配合微调技术,将系统的准确率提高到了95%的水平。
这是闪存存储赋能AI应用的典型场景。在这一案例中,基于原来存储方案进行微调时,一次微调需要一天甚至好几天的时间,而当换成全闪存的方案后,一些微调任务都能缩短到一天以内,这显著提升了系统的迭代效率和智能水平。
无独有偶,某某高校为上千名师生部署了DeepSeek 70B蒸馏版,该方案的存储系统采用了HDD,仅有少量SSD做缓存,读写性能较弱,导致模型响应速度性能只有3-5Token/s,体验较差。经排查,发现算力和网络资源都没有问题,瓶颈就在存储。
当系统更换融科联创的高性能存储,底层采用Solidigm D5-P5430后,存储系统的性能带动整体系统性能的显著提升,在约200人同时访问下,可实现20 Token/s的响应速度,大幅优化了使用体验。
绝大多数企业用户本地部署DeepSeek模型时,首先都会部署一套RAG系统。这两个案例让我们意识到了存储性能对于RAG系统的重要价值,存储系统的性能直接影响到了RAG的使用体验。
杨磊还给出了一组数据:如果用没有优化过的常规NVMe SSD,从硬盘中调取并解析一本30万字的书,整个流程往往需要约2-5分钟。
如果使用的是传统机械硬盘,即便只是一个十几页的Word文档,也可能需要十几秒才能完成读取。而当系统升级为全闪存系统解决方案后,调取同样的文档可能只需2秒,解析过程也能缩短至5-10秒,大幅提升了响应速度。
融科联创加速AI在企业落地
融科联创专注智能计算13年,是国家级专精特新”小巨人”企业,专注于为客户提供智能计算应用解决方案。总部位于天津,拥有年产能20万台的定制化服务器生产基地,分支机构遍布全国8大核心城市及东南亚地区,已服务行业应用领域客户3000余家。除了服务器产品以外,该公司也提供AI大模型智算一体机解决方案。2025年初,随着DeepSeek爆火,融科联创在很短的时间内就推出了DeepSeek一体机。

在服务企业客户的时候,杨磊注意到,有很多企业投入了大量资金买最先进的GPU,但最终发现效果并不如预期。深入排查后会发现,问题大多并不出在算力,而是出在存储:IOPS不足、延迟高、带宽不够,经常会拖慢整套系统。
AI大模型技术在企业落地的过程中,需要对接企业自己的专有数据,这些数据的管理、处理、调用都需要存储系统的支持,对存储系统提出了更高要求。然而,AI工作流的不同阶段对存储的性能、容量等方面的要求都有不同的侧重点。
比如,在数据存储与预处理阶段。需要对用来做训练的数据进行反复清洗、预处理。这个过程对存储系统的多协议支持、高吞吐量、大容量都有很高要求。一旦数据处理速度慢了,就会拖慢整个集群的效率。
都知道模型训练阶段对GPU的消耗极大,而GPU想要火力全开,还需要有高带宽、低延迟的存储系统做配合。这一阶段对IOPS、吞吐、延迟控制要求都非常高,存储性能一旦跟不上,就会浪费宝贵的GPU资源。
在模型落地应用的阶段,也就是模型推理阶段,整体对于存储的要求相对低了一点,但不同行业之间也有一些区别。比如,金融风控领域对延迟要求极高,医疗影像场景则需要快速加载数据。

为了解决模型落地部署过程中存在的问题,融科联创推出了DeepSeek一体机。它解决了传统服务器厂商不懂AI模型、不懂应用,而AI模型开发者、应用开发者不懂硬件的问题,将一系列硬件和软件全部集成,以一体化的形式支持用户“一键式部署”。
融科联创的DeepSeek场景提供两个版本,一种是在同一个服务器里集成了存储和算力。第二种是分离式的方案,针对人数2000人以上的大型机构,会用上满血版671B DeepSeek模型,对集群并发和性能要求都很高。
融科联创与Solidigm的紧密合作
融科联创是一家服务器厂商,但在超融合以及存储等领域也都有布局,还有自主研发的分布式存储方案。可以注意到,融科联创的很多技术方案中都选择了Solidigm的固态盘。从杨磊的介绍中了解到,融科联创和融科联创的很多客户都非常认可Solidigm的固态盘,目前每年出库的数千个节点当中大部分都采用了Solidigm的固态盘。下图是一个2U 24盘位的NVMe全闪存储方案,支持Solidigm D7-PS1010(Gen 5.0)、D7-P5510和P5530等硬盘。

融科联创将SSD分为两大类。一类是高性能SSD,这些场景中对存储空间需求不大,但对IOPS和带宽要求高。另一类是大容量型 SSD(比如QLC的P5430),用于数据量大的场景,这类应用对容量需求高,但对性能没有特别要求,更注重性价比。
融科联创在两大类场景中都用了Solidigm的方案。杨磊介绍称,选择Solidigm的一个核心原因就是看中了它的兼容性和硬盘的整体稳定性。一些硬盘可能会不支持某项功能,比如不支持带外管理,而使用Solidigm的过程中从没有出现此类问题。
与原本笔者想象中企业用户只关心存储系统不同,很多企业客户也都关注具体使用的固态盘。
杨磊表示,融科联创的一位客户最初习惯于使用某品牌的硬盘,与融科接触早期间也坚持沿用这一品牌,并要求融科提供同样配置的三台2U 24盘全闪产品。
然而,不久后却出现了状况。首先是带外管理识别问题,让融科不得不临时将硬盘更换为Solidigm的产品,更换后带外管理的问题迎刃而解。但故事并未就此结束,随后又出现了硬盘频繁掉线的新挑战,频率一度达到“一个月掉一块”的程度。
面对这一棘手情况,融科联创与Solidigm的工程师们迅速展开了联合排查。经过深入分析,最终排除了硬盘的问题并找到了问题的根源。Solidigm团队在此过程中展现出的强大技术支持和协同解决问题的能力,给杨磊留下了深刻印象。
融科联创与Solidigm的合作由来已久。Solidigm的前身是英特尔的SSD业务部门,当时融科联创的服务器和存储系统中就用上了很多英特尔的SSD。Solidigm成立后双方保持了原有的合作关系。
从英特尔到Solidigm的转型过程中,Solidigm团队提供了大量支持,从借样品、测试验证,到与客户沟通和售后服务,全流程协同紧密,推动多个大型项目成功落地。杨磊提到,“Solidigm解决了我们很多实际问题,Solidigm的盘是我们最常用、最信赖的产品。”