导读
今年,OpenAI备受大众瞩目的重磅产品终于登场。北京时间今天凌晨一点,OpenAI正式对外宣布,推出新一代旗舰级人工智能(AI)模型——GPT-5。这款模型堪称OpenAI首个“一体化”的AI系统,它创新性地将o系列模型的强大推理能力与GPT系列模型的快速响应特性完美融合。

但万众瞩目下GPT-5的升级远远没达到大众的预期,尽管奥特曼宣称GPT-5是“迈向AGI的关键一步”,实际却没有什么颠覆性的改变。其改进幅度无法媲美GPT-3到GPT-4的飞跃。而这恰恰折射出数据狂飙背后,本质问题渐渐浮现。
文字编辑|宋雨涵
1
GPT-5如期而至
带您速览更新内容
奥特曼以三个身份形象地类比了OpenAI推出的三代模型:GPT-3就如同高中生,偶尔能展现出令人眼前一亮的灵光,但更多时候还是伴随着处理问题时的挫败感;GPT-4则好似大学生,已然具备了真正的智慧和实际可用的价值;而GPT-5,就如同能按需召唤来的各领域博士级专家,随时都能助力人们达成目标。
奥特曼还提到,GPT-5是OpenAI迈向通用人工智能(AGI)征程中的一个重要里程碑。
从发布会上展示的情况来看,GPT-5在编程、数理逻辑、文本创作、健康咨询以及视觉感知等多个维度上,整体智能水平相较于前代产品都有了显著的提升。
其中最让人眼前一亮的莫属架构设计上的更新:
与以往不同,GPT-5是一个统一系统,不再分为常规模型和单独的推理模型,而是由三个核心部分构成:一个智能高效的基础模型,能够回答大多数问题;一个用于解决更复杂问题的深度推理模型(GPT‑5 Thinking);以及一个实时路由器(智能分流系统),可根据对话类型、复杂度、工具需求以及用户的明确指示(例如提示中写道“请深入思考这个问题”)快速判断应使用哪个模型。
还新推出了四种全新的「人格」模式:
OpenAI还宣布一项新功能,面向付费用户推出更加定制化的ChatGPT,支持自定义聊天功能,可调整模型的性格,四项初始选项包括:愤世嫉俗者、机器人、倾听者和书呆子,还能改变聊天界面的颜色。
不过这次更新后的版本略微复杂:
它包含了GPT-5、GPT-5-mini、GPT-5-nano以及GPT-5-pro这四个版本。对于免费用户而言,GPT-5的使用量是有限制的,一旦超出限额,系统将自动切换至GPT-5-mini。而GPT-5-pro则专为Pro订阅用户打造,凭借其扩展推理能力,能够为用户提供更为全面、精准的答案。
再来看看定价策略:
GPT-5、GPT-5-mini和GPT-5-nano这三款模型也均提供API服务。具体价格方面,GPT-5的输入、输出价格分别为每百万token 1.25美元和10美元;GPT-5-mini的定价则是GPT-5的五分之一;而GPT-5-nano的定价更低,仅为GPT-5的二十五分之一。与主要竞争对手Anthropic和谷歌的同类产品相比,OpenAI的GPT-5模型在开发人员使用成本上相当甚至更具优势。值得一提的是,免费版ChatGPT也可以使用GPT-5,不过会有额度限制,达到限制后可使用GPT-5-mini版本。
2
能力重磅升级
多项性能实现提升
1
告别AI幻视,AI更可靠了
AI幻觉问题长期饱受大众诟病,堪称被吐槽的“重灾地带”。不过,现在有个好消息:GPT-5在解决这一问题上投入了大量精力,官方明确表示其产生幻觉的可能性“大幅降低”。具体表现为:在进行联网搜索时,GPT-5回答出现事实性错误的概率,相较于GPT-4o降低了45%。
在独立思考时,其回答出错的概率更是比OpenAI o3低了 80%
2
地表最强编程能力
研发人员表示,GPT-5堪称目前最出色的编程模型。有这样一个实例:研发人员指令GPT-5搭建一个用于学习法语的网络应用,并要求在其中嵌入一款教育游戏。仅仅约两分钟过后,GPT-5就生成了一个功能完备的应用,涵盖了标签、抽认卡、测试等功能,还成功嵌入了一款贪吃蛇游戏。
为更充分地展示GPT-5在生产场景中的编程实力,OpenAI特意邀请了知名AI编程创业公司Cursor的联合创始人兼首席执行官Michael Truell进行现场演示。Truell打开OpenAI API GitHub页面上的一个待修复问题(PR),该问题历经3周仍未得到解决,可见其修复难度不小。
此外,OpenAI在官网分享了更多GPT-5的编程案例。其开发出的小游戏不仅画面精致,游戏机制也十分合理。而且,GPT-5还能按照用户指令,打造出Lofi视觉化效果器。从官方展示的Demo来看,GPT-5的前端能力相较于OpenAI此前的模型有了显著提升。
3
测试成绩十分优异
多项基准测试中,GPT-5超过了OpenAI o3、GPT-4o等OpenAI最强大的模型,在数学、编码、视觉感知和健康方面表现尤其出色。凭借GPT-5-pro的扩展推理,该模型还在科学知识基准测试GPQA上获得了新的SOTA,无需工具即可得分88.4%。
三、数据狂飙下的冷思考
GPT-5的发布,归根结底来说没有颠覆性的“新能力”,甚至没有AGI的承诺,连奥特曼这样的营销大师也变得务实起来了——这场曾被营销造势到“改变游戏规则”的发布会,最终交出了一份“产品化升级”的答卷。这背后,是AI行业从“狂飙时代”向“平凡时代”转场的信号,也迫使我们重新审视:当数据性能的“狂飙”逐渐放缓,我们究竟该为何种“进步”买单?
技术:从“颠覆”到“迭代”,增长的天花板若隐若现
GPT-5的“小步快跑”,本质上是技术瓶颈的显化。材料中提到的参数Scaling Law(规模定律)放缓、评估基准接近饱和(“高中生做初中题”),揭示了一个残酷现实:过去靠算力堆叠、数据投喂就能快速提升的“红利期”已近尾声。即使投入10倍算力强化学习的Grok-4,也未带来颠覆性体验;而GPT-5的“更稳”,更像是对现有能力的查漏补缺——解决卡顿、优化成本,而非突破认知边界。
这种放缓并非偶然。当模型在通用任务中普遍达到90%以上的准确率,评估体系的“天花板”便开始显现:现有的测试集已无法有效衡量模型的“真实智能”,技术的“边际效益”逐渐递减。正如行业人士所言:“我们不再需要‘能写诗的AI’,而是需要‘能精准诊断癌症、设计无缺陷芯片’的AI。”但后者所需的,是跨学科知识融合、逻辑推理的深度突破,而非单纯的参数扩张。
未来:从“狂飙”到“深耕”,AGI需要的是“耐心”而非“神话”
GPT-5的发布,也让“AGI(通用人工智能)何时到来”的讨论回归理性。过去几年,公众被“AI将取代人类”“两年内实现AGI”的预言包围,但现实是,即使参数规模突破万亿,模型仍在“知其然不知其所以然”的阶段——无法真正理解因果、缺乏常识推理、难以迁移复杂场景。这些“硬伤”的解决,需要的不是单纯的算力叠加,而是架构创新(如类脑计算)、训练方法革命(如具身学习)、甚至认知科学的突破。
AI行业的下一轮突破,可能需要跳出“数据-模型-应用”的线性思维,转向多学科交叉的“深水区”。这既需要技术工作者的耐心,也需要公众的理解:AGI不是“必然到来的终点”,而是一条充满未知的长路;数据性能的“狂飙”终会过去,但对“有用、可靠、安全”AI的追求,才是行业永恒的主题。