re:Invent观察:生成式AI下半场,亚马逊云科技死磕Agent

12月3日,亚马逊云科技第二场主题演讲,亚马逊云科技Agentic AI 副总裁Swami Sivasubramanian发布了一系列用来构建和运行Agents的专业服务,这或许是云厂商在生成式AI时代下半场最重要的云服务。

生成式AI下半场,云厂商的“新战场”在哪里?

re:Invent上亚马逊云CEO Matt Garman宣布,我们正在进入一个有着数十亿Agents的新时代。为了凸显Agent的重要性,Swami的职位从原来的数据与AI副总裁变成了Agentic AI副总裁,显示出亚马逊云正努力成为最适合Agent的云。

过去的AI,比如ChatGPT主要靠人类持续的提示词来驱动,比较被动。而Swami所定义的Agentic AI,则具备了自主性(Autonomy),能利用AI来进行推理、规划和调整,以完成用户指定的任务,代表人类或其他系统执行工作。

如何成为最适合Agent的云呢?是从更强的大语言模型开始吗?作为负责AI相关业务的最高业务负责人,Swami这次没有阐述如何为Amazon构建更强的大语言模型。

长远看来,单纯追求更强的模型并不见得会获得最大的商业成功,因为大模型会越来越强,靠模型本身很难构建稳定的商业模式。而如果能帮助别人更快的构建和运行Agent,则是一条更稳妥的商业模式。

2024年,亚马逊发布了Amazon Nova系列模型,时隔一年后,Amazon Nova 2.0发布。在我看来,Amazon Nova模型更主要的价值是让亚马逊云科技熟悉生成式AI的技术生态,挖掘其中的痛点,然后基于云服务来解决这些痛点。

对于企业用户来说,更智能的大语言模型,更强的AI硬件都备受关注,但考虑到实际落地时,AI Agent则是最受关注的。想要构建AI Agent或许有很多种方式,但在FOMO的情绪下,利用云服务应该是最高效的方式。

过去两年以来,亚马逊云科技陆续发布了大模型托管服务平台Amazon Bedrock、Amazon Sagemaker AI,基于这两项服务延展出了更多专业服务,比如,Amazon Bedrock AgentCore以及Strands Agents SDK等。

其中,Amazon Bedrock AgentCore是智能体关联度最高的服务之一,它为Agent提供了运行时环境、记忆能力、调用工具的方式等一系列能力。除了定义Agent,亚马逊云科技也试着用 AgentCore为AI Agent定义一套标准化的系统。

这此活动上,AgentCore新增一些新功能来完善其服务,比如,新增了一个负责制定策略的功能,用来主动拦截未授权的操作。另外一个是评估功能,评估Agent是否正确,是否有帮助,根据真实世界的行为监控Agent的质量。

此外,AgentCore Memory 还新增了一个情景式功能,让智能体从过去的经验中学习,并将这些洞察应用于未来的交互。通过结构化的情景自动分析模式,改进决策。当智能体遇到类似任务时,它们可以快速访问相关的历史数据,从而缩短处理时间。

如何让模型真正懂业务?亚马逊云科技给出了新解法

模型的表现对于Agent的影响还是很大的,想要模型在具体的场景中有更好表现,最好还是要输入场景相关的数据。但是,具体要如何向模型输入数据,让模型更好地理解和运用这些数据呢?

从技术上分析,常规的方式有提示词工程和RAG都有问题,但这种方式在将专业知识嵌入模型核心理解方面存在根本性的局限性。监督式微调和强化学习有助于定制模型,但它们在开发生命周期中的作用过晚,很难让其在特定领域产生价值。

而当企业尝试仅使用自有数据通过持续预训练 (CPT) 进行深度定制时,往往会遭遇灾难性遗忘——模型在学习新内容的过程中会丧失其基础能力。与此同时,从零开始训练模型所需的数据、计算资源和成本对大多数企业而言仍然是难以逾越的障碍。

为了向更多企业提供早期就注入自己数据的服务,并克服各种障碍,亚马逊云科技推出了Amazon Nova Forge。在亚马逊云科技看来,Nova Forge是企业构建专属大语言模型最便捷、最具成本效益的方式。

Amazon Nova Forge将自己的数据集与Amazon Nova精选的训练数据相结合,利用Amazon Nova早期训练阶段的Checkpoint来进行训练,从而让企业用户开发出最懂某些场景的大语言模型。

亚马逊云科技的一些专家也认为,直接选用别人训练好的模型,就好比是找一个刚毕业的应届大学生,而使用自己数据训练而来的模型,则像是企业从中学甚至小学就开始培养的管培生,后者更容易受到企业特有数据的影响,更容易在特定场景发挥价值。

Amazon Nova Forge提出了一个开放训练模型的概念,区别于传统别人训练好的开放权重模型,它等于是开放了训练早期阶段的让别人继续做训练的模型。换言之,别人开放的是训练结果,它开放的是中间过程,开放程度更高。

云大厂的工程暴力美学AI模型优化效率不断提升

Amazon Nova Forge是亚马逊的首创,我觉得这非常有价值。除此之外,为了帮助更多企业高效地构建模型,Swami还介绍了Amazon Bedrock的强化微调、SageMaker AI的模型定制化服务以及SageMaker AI的无检查点训练功能,这几个也非常有用。

首先,Bedrock强化微调支持让模型从反馈中学习,并针对特定的业务需求提供更好的输出,平均准确率能提高66%。强化微调采用反馈驱动的方法,模型会根据奖励信号迭代改进,即使是普通开发人员无需专业AI知识也能定制模型。

Amazon SageMaker AI使AI者在几天内使用强化学习等最新技术定制Amazon Nova、Llama、Qwen、DeepSeek等热门模型。通过UI引导的界面快速指定需求、生成合成数据、分析数据质量并评估模型准确性,整套服务都是基于Serverless打造而来。

最后一个是SageMaker AI HyperPod的无检查点的训练,它支持即使在系统出现故障时也能继续完成训练,将恢复时间从数小时缩短至数分钟。以此来加速AI模型的开发,节省数天的开发时间。

这三项服务让我看到了亚马逊云科技在帮助用户提高训练效率时的非常极致的创新,这并非石破天惊的领先技术,而是基于实际痛点总结而来,并利用超强的工程实力打造的服务,这点尤为重要。