导读
深夜时分,DeepSeek-R1-0528的模型权重悄然现身于HuggingFace平台,瞬间在全球开发者社区中掀起了一阵热潮。此次版本号标注为“5月28日”的更新,虽被官方定义为“小版本试升级”,却在性能上取得了令人瞩目的进展,几乎达到了与OpenAI顶级闭源模型o3相媲美的水平。

在代码生成测试平台LiveCodeBench上,DeepSeek-R1-0528的表现堪称惊艳,几乎与o3的高版本不相上下,甚至在某些任务中超越了Claude 4 Sonnet。开发者们在测试后纷纷惊叹不已,直呼其“编程能力强大得超乎想象”。
没有盛大的发布会,没有铺天盖地的宣传,一家中国AI企业用一行行代码再次改写了全球大模型竞争格局。
文字编辑| 宋雨涵
1
中国大模型迎来“o3时刻”
性能飞跃
目前,DeepSeek尚未针对DeepSeek-R1-0528发布详细的模型卡来介绍其更多功能。然而,这一新版本已在开发者群体中引发了热烈反响,众多开发者在体验后纷纷表示,DeepSeek-R1-0528在编程、逻辑推理以及交互能力等方面均展现出了显著的提升。
已有开发者对DeepSeek-R1-0528进行了基准测试,并称这是开源领域的一次重大突破。代码测试平台Live CodeBench的数据显示,其性能已接近OpenAI在4月中旬发布的o4 mini和o3模型的高版本。
同时,文本召回测试的结果也表明,在32k以内的文本处理上,DeepSeek-R1-0528相较于之前的R1版本有了显著提升,但在60k时性能则有所下降。这意味着,在32k以内的文本范围内,使用新R1模型根据给定材料进行提问并获取回答时,其准确度会更高。
多位开发者通过实际案例体验后表示,DeepSeek-R1-0528的效果已基本与Claude 4持平,甚至在某些情况下表现更佳。“从实际效果来看,我注意到平面的橙色漫反射以及控制面板的美观程度。这两者都是使用同一个提示词一次性生成的,Claude 4 sonnet生成了542行代码,而DeepSeek-R1-0528则生成了728行。此外,帧率和运动角度的细节也值得关注。”一位开发者在X平台上分享道。
还有开发者让DeepSeek-R1-0528、Claude 4和DeepSeek-V3-0324在飞机大战游戏中生成对比效果。结果显示,新版R1在之前的基础上新增了许多道具,画面质量也有了显著提升。
2
技术亮点
128K上下文与推理能力双重突破
本次升级不仅体现在性能指标上,更在核心架构上实现了创新突破。
模型支持高达128K token的超长上下文窗口,使其能够流畅处理整本技术手册、复杂项目代码库等长文档任务。测试显示,在32K token内的召回准确度大幅优于前代。
推理能力实现结构化升级。用户明显感受到新版R1的思维链(Chain-of-Thought)更加清晰、逻辑更加严密。在解决“农夫过河”等经典逻辑难题时,模型能够逐步拆解问题,展示出接近人类专家的推理路径。
“它是唯一能够持续正确回答‘9.9减9.11是多少’的模型,这种看似简单但容易混淆的问题最能考验模型的严谨性。”开发者Yuchen Jin在社交平台上指出。
DeepSeek团队延续了其一贯的“加量不加价”策略,在实现性能跃升的同时,保持了模型的开源属性和免费API策略。
未来展望
R2模型引发业界期待:
尽管R1-0528表现出色,行业更期待的是DeepSeek的下一代R2模型。
参数规模革命性跃迁方面,从当前R1的67亿(6.7B)参数跃升至预期的1.2万亿(1.2T),实现近180倍的量级突破,这不仅是简单的规模扩张,更是通过MoE(专家混合)与稀疏激活技术的深度整合,在万亿参数层级维持可控推理成本的核心创新,其目标直指GPT-5与Claude 4 Opus等下一代闭源旗舰。
推理能力质变临界点上,基于Scaling Law的预测,万亿参数突破或将触发三大能力涌现——解决跨学科复杂科学推导、构建物理规则认知的世界模型(如流体力学仿真与机械设计)、实现代码生成→测试→优化的全闭环自我迭代,推动AI从工具向协作伙伴进化;国产算力里程碑维度,结合华为昇腾910B芯片已实现R1模型90%推理效率的实测表现,R2有望成为全球首个完全运行于国产算力生态的万亿模型,并将推理成本压缩至OpenAI API的1/5(当前R1成本仅为GPT-4-turbo的17%),形成“性能跃升+成本断崖”的双重势能。
结语:
DeepSeek-R1-0528的发布,不仅是对自身技术实力的展示,也为全球AI行业注入了新的活力。作为一款性能直逼OpenAI o3的开源模型,R1-0528以更低的成本和更高的灵活性挑战了传统闭源模型的霸主地位。业内人士认为,DeepSeek的持续创新将进一步推动开源AI生态的发展,促使更多企业与开发者拥抱开源技术。
与此同时,R1-0528的免费API策略也为中小型企业和独立开发者提供了宝贵机会,使其能够以较低成本构建高质量的AI应用。这无疑将加速AI技术的普及,助力全球AI生态的繁荣。