导读
超长文本理解与低成本推理的时代大门,被一家中国公司一脚踹开。

2025年6月17日,中国AI领域迎来一场技术地震。国内AI六小虎之一的MiniMax正式开源其新一代推理大模型MiniMax-M1,以100万token上下文窗口和仅53万美元的训练成本,在AI基础模型领域树立全新标杆。
这款模型不仅将长文本处理能力提升至Google Gemini 2.5 Pro级别,更以惊人的算力效率,在同等推理任务中仅需DeepSeek R1约30%的计算资源,真正实现了“性能跃升、成本腰斩”的双重突破。
文字编辑|宋雨涵
1
技术核爆:
百万上下文背后的架构革命
此次开源的MiniMax-M1并非传统Transformer架构的延续,而是全球首个大规模混合架构推理模型。其核心创新在于将线性注意力(Linear Attention)与标准Softmax注意力有机融合,形成独特的“闪电注意力”机制。
这一设计让M1在保持长序列处理效率的同时,解决了纯线性注意力在信息检索上的固有缺陷。
技术参数彰显野心:

- 原生支持100万token的输入长度,是DeepSeek R1的约8倍。
- 同时支持8万输出token,超过Gemini 2.5 Pro的6.4万,成为世界最长输出。
- 生成10万token时,推理算力只需要DeepSeek R1的25%。
在处理400页技术文档或十万行代码库时,传统模型需反复切分上下文,而M1可整体消化、连贯推理,为Agent智能体发展铺平道路。
在强化学习领域,MiniMax同样取得了突破,提出了全新的CISPO算法。该算法通过优化重要性采样权重,极大地提升了强化学习的训练效率。在AIME实验中,CISPO算法的收敛速度较其他算法,包括字节最新提出的DAPO,快了一倍,甚至超越了DeepSeek早期采用的GRPO算法。这些技术创新使得MiniMax-M1的强化训练过程异常高效,训练成本大幅降低,仅用了512块H800三周的时间,租赁成本远低于预期。
2
性能屠榜:
17项测试碾压开源界
在评测成绩方面,MiniMax – M1的表现堪称亮眼,在业内主流的17个评测集中均斩获佳绩,不负大众期待。尤其是在软件工程、长上下文理解以及工具使用这类复杂且对生产力要求较高的场景中,MiniMax – M1展现出了令人瞩目的压倒性优势。
在SWE – bench基准测试里,MiniMax – M1 – 40k和MiniMax – M1 – 80k分别取得了55.6%和56.0%的高分。尽管这一成绩比DeepSeek – R1 – 0528的57.6%稍低,但相较于其他开源模型,MiniMax – M1的表现可谓遥遥领先。凭借其百万级的上下文窗口,MiniMax – M1在长上下文理解任务中表现卓越,不仅超越了所有开源模型,还在部分指标上接近OpenAI o3和Claude4Opus,在全球范围内位居第二。
在代理工具使用场景(TAU – bench)的评测中,MiniMax – M1同样成绩斐然。它不仅在所有开源模型中脱颖而出,还成功战胜了Gemini – 2.5Pro。此外,MiniMax – M1 – 80k在多数基准测试中的表现都优于MiniMax – M1 – 40k,这有力地证明了增加计算资源对于提升模型性能有着显著作用。
成本革命:
53万美元训练出顶级模型
当OpenAI花费上亿美元训练GPT-4、DeepSeek R1耗费500-600万美元时,MiniMax-M1仅用53.47万美元即完成训练。这相当于用经济型轿车的价格造出了超级跑车。
成本优势源于两大技术创新:
CISPO强化学习算法:优化重要性采样权重,训练效率较字节DAPO提升2倍,超越DeepSeek的GRPO算法。
闪电注意力机制为主的混合架构,从而在计算长的上下文输入以及深度推理的时候显著高效。例如,在用8万Token深度推理的时候,只需要使用DeepSeek R1约30%的算力。这个特性使得我们在训练和推理的时候都有很大的算力效率优势。
编者观察
此次发布恰逢MiniMax的“关键证明时刻”。2025年以来,随着“AI六小虎”概念淡化、“基模五强”(阿里、字节、DeepSeek、阶跃星辰、智谱AI)兴起,MiniMax一度被排除在头部阵营之外。
行业观察人士指出:“M1的成败决定MiniMax能否继续坐在牌桌旁”。而此次开源的激进策略,可视为其对市场地位的全力捍卫。
更深远的影响在于技术路线竞争。当全球聚焦于Transformer架构优化时,MiniMax用规模化验证了混合架构的可行性。
结语:
此刻开源的MiniMax-M1,不仅是技术里程碑,更是AI民主化进程的加速器。当百万token上下文不再是天价服务,当53万美元能训练顶尖模型,创新的大门已向全球开发者敞开。
DeepSeek在1月用R1定义了推理模型的标准,而5个月后的今天,MiniMax用M1重新书写了规则——这场中国AI双雄的架构之争,赢家将是整个产业。