谷歌最近“杀疯了”,开源AI智能体框架Gemini CLI,掀起终端革命

导读

北京时间2025年6月26日凌晨,谷歌正式开源AI智能体框架Gemini CLI,首次将Gemini大模型的完整能力深度融入命令行终端(CLI)。这一工具被开发者誉为“终端里的AI革命”,通过自然语言指令即可完成代码编写、系统调试、任务自动化等复杂操作,同时支持内容生成、实时搜索与研究协作。Apache 2.0协议开源、免费调用顶级模型、无缝衔接现有工具链——谷歌正以“开放生态”战略挑战微软Cursor、Anthropic Claude等闭源方案的市场地位。

文字编辑|宋雨涵

1

当终端成为“AI智能体”

零成本调用顶级模型

Gemini CLI最大亮点之一就是可以直接调用,谷歌最新发布的视频模型Veo和图像模型Imagen,同时集成了MCP、谷歌搜索、自定义自动化等众多实用功能。

对于个体开发者来说,只需使用个人谷歌账号完成登录,就能免费获取Gemini Code Assist许可。该许可不仅包含对Gemini 2.5 Pro的访问权限,还配备了高达100万token的上下文窗口,同时提供每分钟60次、每日1000次的免费请求额度,充分满足日常开发需求。

而对于有运行多个智能体或指定模型需求的专业开发者,谷歌提供了灵活的选择方案:既可以选择AI Studio/Vertex AI密钥(按实际使用量计费),也可以直接购买Gemini Code Assist的标准版或企业版许可,以适应不同规模和复杂度的项目。

Gemini CLI(预览版)在设计上紧密贴合开发者的实际工作场景,从代码理解、文件操作,到命令执行与动态故障排查,全流程为开发者提供高效辅助。其内置的强大功能包括:联网搜索,借助谷歌搜索实时获取网页内容,为模型提供丰富的外部上下文;协议扩展,支持模型上下文协议(MCP)及捆绑扩展,持续增强工具的功能性;指令定制,开发者可根据个人需求和工作流,灵活调整提示词模板;以及脚本集成,支持非交互式调用,实现任务自动化,并与现有工作流无缝对接。

Gemini CLI的功能远不止于编程辅助,它还是一款功能多样的本地工具,能够满足内容生成、问题解决、深度研究及任务管理等多样化需求。例如,开发者可以利用Veo和Imagen等工具,轻松制作出关于橘猫在澳大利亚冒险故事的短视频,为创意工作提供有力支持。

Gemini CLI遵循Apache 2.0开源协议,这意味着开发者可以随时审查代码实现、验证安全机制,确保工具的透明度和可靠性。该工具基于MCP等标准构建,支持通过GEMINI.md文件配置系统提示词,并提供个人和团队两级设置,满足不同用户的需求。全球开发者都可以通过提交漏洞报告、功能建议、安全强化方案及代码优化等方式,积极参与到Gemini CLI的社区共建中来,共同推动这一工具的持续发展和完善。

2

谷歌的“生态注入”哲学

战略意图分析

谷歌通过零门槛工具占领开发者入口,推动Gemini模型生态渗透。Gemini Code Assist的免费策略降低了开发者的使用门槛,让更多开发者能够体验到AI带来的效率提升。而Gemini CLI的开源协议则允许开发者随时审查代码实现、验证安全机制,增强了工具的透明度和可靠性。

这一策略不仅为开发者带来了便利,更为谷歌AI Studio/Vertex AI企业版引流。随着开发者对Gemini模型的依赖加深,他们更有可能升级至企业版,享受更专业的服务和支持。这种从免费到付费的转化路径,为谷歌构建了一个可持续的开发者生态。

对抗闭源竞争:以开源优势构建社区护城河

在AI编码助手市场,谷歌面临着微软+OpenAI、Anthropic等闭源竞争对手的挑战。然而,谷歌通过开源策略构建了社区护城河。Gemini CLI遵循Apache 2.0开源协议,全球开发者都可以通过提交漏洞报告、功能建议、安全强化方案及代码优化等方式,参与到Gemini CLI的社区共建中来。

这种开源模式不仅增强了工具的可靠性和功能性,更让谷歌在开发者社区中建立了良好的口碑和品牌形象。与闭源竞争对手相比,谷歌的开源策略更具吸引力和竞争力,能够吸引更多开发者加入其生态体系。

谷歌近期战略动向

Gemini模型能力扩展

Gemini 2.5 Pro/Flash稳定版发布(6月17日):优化推理效率与长上下文处理能力(百万Token窗口),强化代码生成与复杂任务支持。

具身智能突破(6月24日):展示Gemini 2.5在机器人控制领域的新能力,包括视觉定位、跨帧物体跟踪及零样本生成控制代码,推动AI向物理世界交互迈进。

AI搜索全球化推进

印度上线AI Mode(6月24日):在印度推出问答式AI搜索工具,支持英语复杂查询(如多步骤育儿建议),集成语音与图像搜索功能,由定制版Gemini 2.5驱动。印度成为继美国后第二大AI Mode落地市场,瞄准超8.7亿互联网用户。

终端智能体框架开源

Gemini CLI重磅发布(6月26日):

通过npm全局安装,命令行直接调用Gemini 2.5 Pro模型,免费额度达每日1000次请求。

支持代码生成、故障排查、文件操作,无缝衔接VS Code及CI/CD流程。

Apache 2.0协议开源,支持插件扩展(MCP协议)与提示词定制(GEMINI.md文件),构建开发者社区生态。

结语:

Gemini模型的能力扩展正深刻改变着AI行业的格局。从Gemini 2.5 Pro/Flash稳定版的发布到具身智能领域的突破,从AI搜索全球化的推进到终端智能体框架的开源,Gemini系列模型正以其强大的技术实力与创新能力,引领着AI行业向更加智能、便捷、高效的方向发展。未来,随着Gemini模型的持续迭代与升级,我们有理由相信,AI将在更多领域发挥重要作用,为人类社会的发展带来更加深远的影响。