智谱AI发布GLM-4.5大模型:推理、编码、智能体三重能力原生融合,国产开源模型刷新SOTA纪录

导读

2025年7月28日晚,北京智谱华章科技股份有限公司(以下简称“智谱”)正式发布新一代旗舰模型GLM-4.5,并在Hugging Face与ModelScope平台同步开源。作为专为智能体应用设计的基础模型,GLM-4.5在推理、代码、智能体综合能力上达到开源领域“最优水平”(State-of-the-Art,SOTA),并在真实代码智能体的人工对比评测中位列国内第一,标志着国产大模型技术实现重大突破。

文字编辑|宋雨涵

1

技术突破

模型综合性能SOTA

在Hugging Face平台,开发者们连夜下载的模型文件包揭示着这场革命的技术内核。采用混合专家(MoE)架构的GLM-4.5系列包含两个版本:旗舰版以3550亿参数实现320亿激活参数,轻量版GLM-4.5-Air则保持1060亿总参数与120亿激活参数。这种精妙设计让模型在维持强大性能的同时,大幅降低了计算成本。

“这是首次有模型将三大核心能力在架构层面实现原生统一,”智谱首席架构师在技术白皮书中强调。传统方案需要组合多个专用模型才能实现的复杂任务,如今在单一模型中即可完成闭环。在权威的12项综合评测中,GLM-4.5交出了震撼业界的答卷:GLM-4.5取得了全球模型第三、国产模型第一、开源模型第一的优异成绩。

  • MMLU Pro综合理解测试得分89.7%,超越GPT-4 Turbo
  • LiveCodeBench编程任务完成率92.3%,刷新开源模型纪录
  • AgentBench智能体评测中,任务规划准确率达95.1%

更惊人的是新一代GLM-4.5实现了更高参数效率:

其参数量为DeepSeek-R1的1/2、Kimi-K2的1/3,但在多项标准基准测试中表现得更为出色。在衡量模型代码能力的SWE-benchVerified榜单上,GLM-4.5系列位于性能/参数比帕累托前沿,表明在相同规模下GLM-4.5系列实现了最佳性能。

低成本、高速度:

除性能优化外,GLM-4.5系列在成本控制与效率提升方面同样表现卓越,其API定价显著低于行业主流水平:输入价格低至0.8元/百万tokens,输出价格仅2元/百万tokens。

在响应速度上,高速版本实测生成速率突破100 tokens/秒,可充分满足低延迟、高并发的实际部署场景需求,实现成本效益与交互流畅性的双重保障。

2

双模引擎

重构人机协作逻辑

GLM-4.5引入革命性的混合推理架构,如同为AI装上“双模式变速器”:

思考模式(Thinking Mode):深度启动链式推理,自主分解复杂任务,调用工具完成多步操作。

非思考模式(Non-Thinking Mode):极速响应即时需求,对话延迟降至毫秒级。

实际演示中,模型展现了令人惊叹的自主任务闭环能力。当用户要求“制作一份人工智能安全的PPT”时,GLM-4.5自动完成资料搜索、配图筛选、HTML代码编写全过程,最终输出专业排版的演示文档。

在编程智能体实测中,面对52个涵盖全栈开发的真实任务,GLM-4.5在任务完成度和工具调用可靠性上超越同类开源模型,部分场景甚至可平替Claude-4-Sonnet。

开发效率的提升更为直观:通过Three.js构建3D交互地球、设计可记录数据的“量子功德箱”等应用,开发周期从小时级压缩至分钟级。

三、开源博弈重构AI产业权力版图

GLM-4.5的发布恰逢中国大模型格局剧变时刻。2025年WAIC大会显露了残酷的行业洗牌:“大模型六小虎”中,百川智能转向医疗赛道,零一万物聚焦企业服务,仅剩智谱、阶跃星辰、MiniMax、月之暗面四家坚守基础模型研发。

阶跃星辰在同一周发布Step-3模型,其CEO姜大昕坦言:“坚持做基础大模型的公司会越来越少,这非常艰苦且投入巨大”。

企业名称最新动向技术特点
智谱AI发布GLM-4.5开源模型原生三能力融合,MoE架构
阶跃星辰推出Step-3模型3210亿参数,全年目标营收10亿
月之暗面展示Kimi2模型强化代码与Agentic能力
MiniMax展示多款AI原生应用聚焦多Agent系统开发
百川智能转向医疗领域放弃基础模型研发
零一万物聚焦企业服务推出法律智算云服务

经过先前的AI领域“百模争锋”的激烈角逐,智谱GLM-4.5的惊艳亮相,无疑为这场竞赛的下半场确立了全新的标杆。

它不仅在多个核心评测项目中摘得国产与开源领域的桂冠,更引人注目的是,它为我们揭示了一条更为高效、集成且富有远见的技术发展路径。在众多厂商竞相追逐千亿乃至万亿参数规模的“技术军备赛”背景下,智谱展现出了独到的战略眼光。

更值得关注的是资本市场的动向。2025年智谱融资节奏明显加快:杭州、珠海、成都国资相继战略投资,7月初获浦东创投与张江集团10亿元注资。今年4月在北京证监局完成的上市辅导备案,则预示着中国或将诞生首家本土大模型上市公司。

结语:

GLM-4.5的发布不仅是一次技术里程碑,更是AI产业发展的分水岭。其三重能力的原生融合标志着大模型正式跨越工具属性,进化为可自主完成复杂任务的智能体基座;突破性的成本控制则彻底打破算力垄断,使千亿级模型首次具备规模化落地可能。