全国产算力深度推理模型讯飞星火X1升级:4张华为910B即可部署满血版,重新定义国产AI技术标杆

 导读

4月20日,科大讯飞旗下的深度推理大模型——讯飞星火X1,正式宣布完成全新升级。作为当前业界中唯一一款基于全国产算力进行训练的深度推理大模型,升级后的星火X1在多个通用任务领域均取得了显著的性能提升。具体而言,该模型在数学计算、代码编写、逻辑推理、文本生成、语言理解以及知识问答等任务上的表现均有了大幅提升。尤为值得一提的是,在模型参数规模较业界同类模型缩小一个数量级的情况下,星火X1的整体性能已经能够与OpenAI的o1模型以及DeepSeek的R1模型相媲美。这一成果再次印证了基于国产算力训练的全栈自主可控大模型不仅具备登顶业界最高水平的实力,更展现出持续创新的巨大潜力。

文字编辑|宋雨涵

1

讯飞星火X1技术突破

三大创新驱动国产大模型登顶

讯飞星火X1的升级聚焦于推理能力与泛化性的全面提升,其核心技术突破包括:

快慢思考统一模型

首创“直觉快思考”与“深度慢思考”双模式融合架构。快思考模式支持实时翻译、百科问答等低延迟任务;慢思考模式则通过多步骤逻辑链拆解复杂问题(如数学证明、法律条文解析),模拟人类专家级推理过程。

大规模多阶段强化学习

针对复杂场景数据稀缺问题,提出基于问题难度的分阶段训练框架。通过动态调整强化学习更新速度,显著提升长思维链(如50步推理)的稳定性和准确性,在数学竞赛题(如AIME、MATH 500)上的准确率较前代提升12%。

国产算力适配工程优化

联合华为昇腾团队攻克显存动态卸载、训推共卡协同等技术难题,实现集群推理性能翻番。例如,通过异步双发射技术,服务请求调度耗时降低10%,为国产算力平台的高效运行提供系统性解决方案。

通用能力比肩国际顶尖模型水平

通用能力比肩国际顶尖模型水平

全新升级后的讯飞星火X1,在多个任务效果上继续突破,性能表现优异。根据最新测试集评测结果,星火X1在通用任务效果评测中全面对标OpenAI o1和DeepSeek R1,在数学和知识问答等方面表现尤为突出。

性能对标国际:

小参数量下的“降维打击”:

在数学答题与数理逻辑推理领域,星火X1展现出了卓越的能力。它能够精准识别复杂的数学公式,不仅提供全面细致的解题思路,而且输出结果严谨清晰,令人信服。在逻辑推理方面,星火X1更是能够全方位考量,深入探索各种潜在假设,其严谨性和准确性令人印象深刻。

在代码能力上,星火X1实现了显著提升。它不仅提高了代码生成的准确率,还加深了对生成代码逻辑的理解,从而能够轻松应对更为复杂的编程挑战,助力开发者快速高效地实现功能。在语言理解层面,星火X1的输出内容更加贴合用户指令,格式规范,且生成的内容连贯准确,极大地提升了用户体验。

此外,星火X1还具备出色的长思维链能力,并支持图像输入。它能够对输入的图像进行深度关联思考,细致探究图像中的多种复杂元素,实现深层次的信息整合与推理,展现出强大的智能处理潜力。

尽管星火X1的模型参数规模较业界同类模型有所缩减,但其整体性能却毫不逊色,已经能够与OpenAI的o1模型及DeepSeek的R1模型相抗衡。这一成就再次有力证明了,基于国产算力训练的大模型不仅具备跻身业界顶尖水平的实力,更拥有着持续创新、不断突破的巨大潜力。

3

行业领先,简化部署流程

4张华为910B实现“轻量化部署”

讯飞星火X1经过全新升级,在行业实际应用中展现出显著优势。在技术创新与模型部署层面,星火X1率先推出了“快思考、慢思考统一模型”,实现了通过一个模型即可灵活支持两种思考模式,极大地增强了模型处理不同复杂度任务的能力。此外,满血版的星火X1部署需求极为精简,仅需4张华为910B显卡即可完成,显著简化了私有化部署的流程。

与此同时,星火X1还全面升级了模型定制优化工具链,现支持SFT(监督微调)与强化学习两种定制优化方案。企业仅需16张华为910B显卡,即可完成针对特定行业的模型定制优化,极大地降低了AI定制化的门槛。这一举措使得各行业能够更加便捷地实现AI应用价值的落地,推动了AI技术的普及与应用。

在中美科技竞争日趋激烈的背景下,星火X1选择的全国产化技术路径具有深远意义。正如科大讯飞董事长刘庆峰所说:“讯飞星火大模型代表了完全自主可控大模型中国能达到的高度。”科大讯飞董事长刘庆峰

结语

国产AI的“破局”与“立新”

此次讯飞星火X1的全面升级,彰显了中国人工智能技术在国产算力平台上的卓越创新,为各行业的数字化转型开辟了崭新的路径。作为国产算力训练的大模型典范,星火X1的卓越表现充分证明,中国在技术自主可控的征途上,其AI技术已经具备了与国际顶尖模型一较高下的实力。