Claude 4 可长时间独立处理复杂任务,目前已上架Amazon Bedrock

昨晚深夜,Claude突然发布Claude Opus 4和Sonnet 4两个最强模型,新模型在写代码、高级推理和AI智能体上的能力进一步提升。

此次发布,Claude Opus 4不仅成了最擅长写代码的模型,而且,还具备长时间稳定处理复杂任务和智能体工作流的能力,也就是具备了更强的生产力。

几乎同一时间,作为Anthropic最“铁”的合作伙伴之一,亚马逊云科技马上宣布这两个新模型上架了Amazon Bedrock,云用户第一时间就能用上。

大杯Claude Opus 4,具备长时间稳定处理复杂任务的能力

这次发布的Opus 4和Sonnet 4的编码能力都很强,不仅大幅超越了上一代的Claude Sonnet 3.7,还超越了OpenAI o3和Gemini 2.5 pro,上演了王者归来的戏码。

值得划重点的是,Claude Opus 4具备用较长时间来处理复杂任务的能力,这需要模型在更大的上下文环境中规划并执行多步骤流程,在较长的时间跨度内整合多轮输入而不混乱。

Anthropic表示,Claude Opus 4在需要专注投入,在需要数千个步骤的长时间复杂任务中表现出色,它能够连续工作数小时。

比如,在编码场景,Claude Opus 4能独立完成从规划到执行的复杂编码项目和agent工作流,开发者能用它来重构或转换大型项目。

Claude独立自行工作的能力在快速提升,有体验过的网友表示,已经让Claude自主编码了近七个小时。

此外,Claude Opus 4长周期处理任务的能力还能用于整合研究成果。比如,金融行业客户可利用Claude Opus 4进行agent搜索与研究,例如连接海量市场报告以获取行业洞察。

Claude Opus 4 擅长编码和解决复杂问题,为前沿代理产品提供动力。著名AI编程工具Cursor称其为编码领域的最新技术,并在复杂代码库理解方面实现了飞跃。

Cognition指出 ,Opus 4擅长解决其他模型无法解决的复杂挑战,成功处理了以前的模型遗漏的关键操作。

Block首席数据和机器学习工程师Bradley Axen表示:Claude Opus 4第一个在其代理中在编辑和调试过程中提高代码质量,同时保持完整性能和可靠性的模型。

Claude Sonnet 4的编码能力也很强,适合大规模日常使用

Claude Opus4 和Sonnet 4在SWE-bench Verified(真实软件工程任务性能基准测试)上也大幅领先此前的Claude Sonnet 3.7、OpenAI最新的Codex-1、o3以及谷歌的Gemini 2.5 Pro。

与Opus 4不同,Sonnet 4平衡了性能与成本,特别适合高吞吐量的业务场景。在多Agents系统中,Sonnet 4非常适合作为专门处理特定任务的子Agent。

作为Claude Sonnet 3.7的升级版本,它不仅提供很强的编码和推理能力,同时,还能准确地响应用户的指令。

对于开发者来说,Claude Sonnet 4能够高效完成代码审查、漏洞修复、新功能开发等工作,还能使用Sonnet 4来管理CI/CD流程、执行漏洞分类等工作。

此外,Anthropic认为,旅游与酒店行业客户可使用Claude Sonnet 4近乎实时处理客户请求并提供个性化响应。

Claude Opus 4 与Claude Sonnet 4的相同和不同

总结一下:Opus 4注重细节,性能优先,具备处理复杂任务的能力,擅长复杂工作流程和深度分析,更侧重深度研究和长期任务。

而Sonnet 4注重效率,平衡了性能与成本,适合大规模部署。适用于大多数场景,适合高吞吐量的日常业务场景、实时应用和多任务处理。

两款新模型均能在扩展思考过程中使用工具(如网络搜索),交替进行推理与工具调用,持续优化答案质量。

此外,开发者提供本地文件访问权限后,模型能显著提升记忆力,提取和保存关键信息,以长期保持连贯性并积累隐性知识。

两款模型均支持200K token上下文窗口,可高质量处理或生成长篇内容,较长的回复对于生成丰富的代码和长篇内容会有帮助。

Claude Opus 4和Sonnet 4都是混合模型,提供两种工作模式,一种可以快速响应,另外一种提供深度思考推理能力,两种模式可自由切换。

由于这些模型可以在快速直接回答与分步深度思考模式间切换,从而在关键行业基准测试中大幅提升多步骤工作流程的表现。

Anthropic增长与营收负责人Kate Jensen表示:“Claude Opus 4和Claude Sonnet 4将AI从工具变为真正的协作伙伴。我们的客户将体验到项目周期的大幅缩短——将原本需要数周完成的项目压缩至数小时。”

如何从现在开始立刻用上Claude 4

现在普通个人用户可以通过网页版或者手机客户端使用,包括免费用户也可以用Claude Sonnet 4,开发者可以使用Anthropic API和Amazon Bedrock提供的API开发应用。

不过,随着新模型的推出,免费用户现在只能用Claude Sonnet 4了,新的Claude Opus 4和此前的旧版本模型都需要Pro版才能用上,想体验Claude Opus 4的用户可以试试Amazon Bedrock。

下载上图中的Amazon Bedrock Client客户端,在亚马逊云科技的后台申请访问Claude Opus 4和Claude Sonnet 4之后,再配置一下Access Key和Secret Key,就能在模型列表里选择你需要的模型了。

Claude Opus 4和Claude Sonnet 4在Amazon Bedrock的推出,进一步丰富了客户使用最先进模型的选择,帮助客户打造创新应用,同时,它具备的企业级安全防护和负责任的AI管控体系,也更适合企业用户提供负责任的AI服务。

此次模型只升级不加价。定价与之前一样,Opus 4 为每百万Token输入需要15美元,输出需要75美元,Sonnet 4每百万Token输入需要3美元,输出需要15美元。亚马逊云科技Amazon Bedrock的价格也一样。