不止是代码补全：OpenAI GPT-5-Codex发布，软件开发的“智能体”时代来临-DOIT-数据产业媒体与服务平台

导读

2025年9月16日，OpenAI正式发布了专为编程任务设计的新模型GPT-5-Codex1。这不是一次普通的迭代更新，而是对AI编程能力的全面重新定义。

作为GPT-5的特殊版本，GPT-5-Codex专为“智能体编程”（agentic coding）重新设计，具备双模式特长：既能与开发者实时协作，快速回答问题和修复小bug，又能长时间自主推进复杂任务。

OpenAI内部测试表明，该模型可连续7小时完成大规模重构任务。这种能力的突破让我们不得不重新思考：到2030年，软件开发将不再是“人写代码+工具辅助”，而是“AI写大部分代码+人类监督和设计架构”。

文字编辑｜宋雨涵

解码GPT-5-Codex

它究竟“新”在何处？

GPT-5-Codex的发布，并非简单的性能参数提升，而是在模型的设计哲学和核心能力上实现了质的飞跃。要理解其颠覆性，我们必须深入其架构内部，剖析那些使其区别于前代模型（包括标准版GPT-5和GPT-4）的关键创新。这些创新共同构筑了其作为“AI工程师”的技术基石。

我们先来看看GPT-5-Codex的性能表现吧！

在SWE-bench验证和代码重构任务上，GPT-5-Codex都超过了目前最先进的GPT-5-high。
GPT-5-Codex能根据任务复杂度动态调整思考时间。OpenAI分享了他们的内部使用数据：

用户请求中，用户交互中token数量（包括隐藏的推理和最终的输出）最少的10%情况下，GPT-5-Codex的token消耗比GPT-5少93.7%（红色箭头处）。
用户交互中token数量最多的10%情况下，GPT‑5-Codex会投入更多时间，其代码推理、编辑、测试和迭代的耗时达到两倍（黄色箭头处）。

GPT‑5-Codex经过专门训练，非常擅于执行代码审查和发现关键缺陷。OpenAI用热门开源项目的最新提交（commit）做了评估，并让经验丰富的工程师进行了验证，结果发现：GPT-5-Codex的审查意见更少出现错误或无关内容，更能把注意力集中在关键问题上。

支撑以上数据进化的核心变革就是：“智能体式编程” (Agentic Coding) 的实现

“智能体”（Agent）是理解GPT-5-Codex的第一把钥匙。在传统的AI编程辅助工具中，模型扮演的是一个被动的角色：你输入一个指令或部分代码，它返回一个补全或建议。而一个“智能体”，则具备了自主性。它能够理解一个高层次的目标（例如，“重构用户认证模块以支持OAuth 2.0”），然后自主地将其分解为一系列子任务：分析现有代码、编写新接口、实现认证逻辑、添加单元测试、更新相关文档。在整个过程中，它能主动执行代码、评估结果、调试错误，并根据反馈调整计划，直到最终目标达成。

根据 OpenAI的官方介绍，GPT-5-Codex正是为此而生。它被专门训练用于处理真实世界的复杂工程任务，例如：

从零构建项目：根据需求文档，自主创建项目结构、编写核心模块并配置环境。

执行大规模重构：在大型代码库中，安全地进行跨文件的代码现代化和结构优化。

添加功能与测试：理解现有功能，并为其补充新的业务逻辑和相应的测试用例，确保代码质量。

全面升级的Codex生态系统

重新定义编程工作流

另外为了使Codex成为更出色的编程伙伴，OpenAI对其整个生态系统进行了全面升级。

新版本的Codex CLI完全重建了架构，支持直接附加和分享截图、线框图和设计稿，提供智能任务跟踪功能，并简化了审批模式。

IDE扩展现在能够深度集成到VS Code、Cursor及其他VS Code分支中。开发者可以在本地环境和云端之间无缝切换工作，而不会丢失上下文。

云端代理的性能也得到大幅提升，通过容器缓存技术，新任务和后续操作的中位完成时间缩短了90%。Codex现在会自动扫描并执行项目中的设置脚本，如pip install，以配置运行环境和依赖。

重新定义编程工作流

GPT-5-Codex的发布不仅仅是技术的进步，更是对编程工作流的重新定义。OpenAI提出了一个名为“Harness”的概念，这个词原意是马具、缰绳，用来把马与车或骑手连接起来，使力量可以被控制和发挥。

在编程场景下，Harness的重要性几乎和模型本身的智能同等关键，它决定了模型是否真的可用。OpenAI所谓的harness，是把模型与其余的基础设施整合起来，让模型能够真正地对环境采取行动。

这种理念在GPT-5-Codex中得到了充分体现。它现在支持多种交互模式：终端vibe coding、IDE编辑、GitHub集成、Cursor集成等，满足不同开发习惯。

三、终极愿景与伦理边界
GPT-5-Codex无疑是通往一个更宏大愿景的重要里程碑。这个终极愿景可能是：自主软件生成。在未来，我们或许只需要提供一份高层次的商业计划书、一套产品原型图和一些核心业务规则，AI就能自主完成整个应用的分析、设计、开发、部署、测试和后期迭代。

这个愿景令人兴奋，但也带来了深刻的社会、经济和伦理挑战：

大规模的职业置换： 如果软件开发的全流程都可以高度自动化，这将对全球数千万软件从业者的职业生涯构成怎样的冲击？社会需要如何应对这种结构性的就业变迁？
创新的中心化风险： 拥有最强大AI模型和算力的少数几家巨头，是否会垄断软件创新的能力，从而扼杀小型初创企业和开源社区的活力？
责任归属的难题： 当一个由AI自主开发的金融交易系统出现故障，造成巨大经济损失时，责任应该由谁承担？是AI的所有者，是使用者，还是AI本身？
偏见与安全的放大： AI在训练数据中学习到的偏见，可能会在自主生成的软件中被系统性地放大。一个微小的安全漏洞，也可能被AI在无意中复制到成千上万个应用里。

这些问题没有简单的答案。但我们必须现在就开始进行广泛而深入的公共讨论，并着手构建相应的法律、伦理和技术治理框架。确保技术的发展始终服务于人类的共同利益，而不是失控地奔向一个不确定的未来，是我们这一代人不可推卸的责任。

结语：

到2030年，软件开发将不再是“人写代码+工具辅助”，而是“AI写大部分代码+人类监督和设计架构”。

开发者将更像是团队的指挥官，专注于战略性问题和创意设计，而繁琐、重复、危险的工作则由AI智能体承担。

这种转变不仅会提高开发效率，还会降低软件开发的准入门槛，使更多人能够参与到创造性的软件开发过程中来。然而，这也对开发者的技能提出了新的要求，需要更多架构设计、系统思考和安全审查方面的能力。

不止是代码补全：OpenAI GPT-5-Codex发布，软件开发的“智能体”时代来临

lixiangjing

相关推荐

近期文章

热门标签