导读
2025年7月28日晚,北京智谱华章科技股份有限公司(以下简称“智谱”)正式发布新一代旗舰模型GLM-4.5,并在Hugging Face与ModelScope平台同步开源。作为专为智能体应用设计的基础模型,GLM-4.5在推理、代码、智能体综合能力上达到开源领域“最优水平”(State-of-the-Art,SOTA),并在真实代码智能体的人工对比评测中位列国内第一,标志着国产大模型技术实现重大突破。

文字编辑|宋雨涵
1
技术突破
模型综合性能SOTA
在Hugging Face平台,开发者们连夜下载的模型文件包揭示着这场革命的技术内核。采用混合专家(MoE)架构的GLM-4.5系列包含两个版本:旗舰版以3550亿参数实现320亿激活参数,轻量版GLM-4.5-Air则保持1060亿总参数与120亿激活参数。这种精妙设计让模型在维持强大性能的同时,大幅降低了计算成本。
“这是首次有模型将三大核心能力在架构层面实现原生统一,”智谱首席架构师在技术白皮书中强调。传统方案需要组合多个专用模型才能实现的复杂任务,如今在单一模型中即可完成闭环。在权威的12项综合评测中,GLM-4.5交出了震撼业界的答卷:GLM-4.5取得了全球模型第三、国产模型第一、开源模型第一的优异成绩。
- MMLU Pro综合理解测试得分89.7%,超越GPT-4 Turbo
- LiveCodeBench编程任务完成率92.3%,刷新开源模型纪录
- AgentBench智能体评测中,任务规划准确率达95.1%
更惊人的是新一代GLM-4.5实现了更高参数效率:
其参数量为DeepSeek-R1的1/2、Kimi-K2的1/3,但在多项标准基准测试中表现得更为出色。在衡量模型代码能力的SWE-benchVerified榜单上,GLM-4.5系列位于性能/参数比帕累托前沿,表明在相同规模下GLM-4.5系列实现了最佳性能。
低成本、高速度:
除性能优化外,GLM-4.5系列在成本控制与效率提升方面同样表现卓越,其API定价显著低于行业主流水平:输入价格低至0.8元/百万tokens,输出价格仅2元/百万tokens。
在响应速度上,高速版本实测生成速率突破100 tokens/秒,可充分满足低延迟、高并发的实际部署场景需求,实现成本效益与交互流畅性的双重保障。
2
双模引擎
重构人机协作逻辑
GLM-4.5引入革命性的混合推理架构,如同为AI装上“双模式变速器”:
思考模式(Thinking Mode):深度启动链式推理,自主分解复杂任务,调用工具完成多步操作。
非思考模式(Non-Thinking Mode):极速响应即时需求,对话延迟降至毫秒级。
实际演示中,模型展现了令人惊叹的自主任务闭环能力。当用户要求“制作一份人工智能安全的PPT”时,GLM-4.5自动完成资料搜索、配图筛选、HTML代码编写全过程,最终输出专业排版的演示文档。
在编程智能体实测中,面对52个涵盖全栈开发的真实任务,GLM-4.5在任务完成度和工具调用可靠性上超越同类开源模型,部分场景甚至可平替Claude-4-Sonnet。
开发效率的提升更为直观:通过Three.js构建3D交互地球、设计可记录数据的“量子功德箱”等应用,开发周期从小时级压缩至分钟级。
三、开源博弈重构AI产业权力版图
GLM-4.5的发布恰逢中国大模型格局剧变时刻。2025年WAIC大会显露了残酷的行业洗牌:“大模型六小虎”中,百川智能转向医疗赛道,零一万物聚焦企业服务,仅剩智谱、阶跃星辰、MiniMax、月之暗面四家坚守基础模型研发。
阶跃星辰在同一周发布Step-3模型,其CEO姜大昕坦言:“坚持做基础大模型的公司会越来越少,这非常艰苦且投入巨大”。
企业名称 | 最新动向 | 技术特点 |
智谱AI | 发布GLM-4.5开源模型 | 原生三能力融合,MoE架构 |
阶跃星辰 | 推出Step-3模型 | 3210亿参数,全年目标营收10亿 |
月之暗面 | 展示Kimi2模型 | 强化代码与Agentic能力 |
MiniMax | 展示多款AI原生应用 | 聚焦多Agent系统开发 |
百川智能 | 转向医疗领域 | 放弃基础模型研发 |
零一万物 | 聚焦企业服务 | 推出法律智算云服务 |
经过先前的AI领域“百模争锋”的激烈角逐,智谱GLM-4.5的惊艳亮相,无疑为这场竞赛的下半场确立了全新的标杆。
它不仅在多个核心评测项目中摘得国产与开源领域的桂冠,更引人注目的是,它为我们揭示了一条更为高效、集成且富有远见的技术发展路径。在众多厂商竞相追逐千亿乃至万亿参数规模的“技术军备赛”背景下,智谱展现出了独到的战略眼光。
更值得关注的是资本市场的动向。2025年智谱融资节奏明显加快:杭州、珠海、成都国资相继战略投资,7月初获浦东创投与张江集团10亿元注资。今年4月在北京证监局完成的上市辅导备案,则预示着中国或将诞生首家本土大模型上市公司。
结语:
GLM-4.5的发布不仅是一次技术里程碑,更是AI产业发展的分水岭。其三重能力的原生融合标志着大模型正式跨越工具属性,进化为可自主完成复杂任务的智能体基座;突破性的成本控制则彻底打破算力垄断,使千亿级模型首次具备规模化落地可能。