导读
继微软之后,谷歌也紧跟步伐,全方位拥抱人工智能(AI)智能体(Agent)技术。在其开发者大会上,谷歌郑重宣布,将推动智能体全面融入其核心业务——搜索领域,以及旗下的AI助手Gemini。通过将Gemini与搜索功能深度融合,谷歌还创新性地推出了全新AI模式搜索体验。

谷歌2025年度I/O开发者大会的主题演讲环节精彩纷呈,集中展示了谷歌在AI、多模态模型、跨设备整合以及开发者工具等领域的最新突破与成果。从升级版的Gemini 2.5 Pro模型,到智能眼镜的XR应用,再到AI赋能的搜索与网页浏览新体验,谷歌所呈现的,不仅是模型性能的显著提升,更是AI从单纯的“信息工具”向“通用智能体”跨越式的进化。
文字编辑|宋雨涵
1
Gemini 2.5 Pro
通用AI模型的“深度思考”革命
作为大会的明星模型,Gemini 2.5 Pro凭借其“深度思考”(Deep Think)模式和多模态能力,重新定义了AI的认知边界。该模型支持100万token的上下文窗口(计划扩展至200万),能够处理整本书籍或复杂代码库级别的信息,并通过分层推理解决高等数学、编程等专业问题。在权威测评中,其代码生成能力超越Claude 3.7 Sonnet和GPT-4.1 Turbo,并在GPQA(全球问题解答评估)中位列榜首。
此外,Gemini 2.5 Pro实现了跨模态的统一处理框架,可无缝整合文本、图像、音频和视频数据,例如实时解析摄像头画面生成AR导航建议,或通过语音对话同步完成代码调试。配套推出的Gemini 2.5 Flash则以更低成本和更高效率,为常规任务提供轻量化解决方案。
2
搜索升级
从信息检索到任务执行的跃迁
谷歌搜索的AI Mode功能成为全场焦点。这一由Gemini 2.5 Pro驱动的模式,彻底改变了传统搜索逻辑:
谷歌在近期积极应对新生代AI搜索应用的冲击,对其核心搜索业务进行了多项升级。在I/O开发者大会上,谷歌宣布其搜索中的AI概览功能已覆盖200多个国家和地区,支持40多种语言,并新增了对多种语言的支持,旨在改进用户搜索体验,提供更快速、准确的搜索结果。此外,谷歌还将在美国的AI概览中引入Gemini 2.5的定制版本,以提升搜索解决复杂问题的能力。
同时,谷歌正式在美国推出无需注册Labs的AI模式,该模式具备更先进的推理和多模态分析能力,能够通过后续问题和网络链接进行深入探索。AI模式采用查询扇出技术,能更深入地挖掘网络内容,帮助用户发现更多相关资源。谷歌还宣布将深度研究功能引入AI模式,通过发起数百次搜索和推理,快速创建专家级引用报告,节省用户研究时间。
谷歌还为搜索引入了实时功能,通过Project Astra的实时技术,用户可使用摄像头与搜索实时交流所看到的内容。此外,谷歌将Project Mariner的智能体功能融入AI模式,帮助用户节省购票等任务的时间,通过跨网站分析门票选项并提供实时价格和库存,简化购买流程。
最后,谷歌还为搜索的AI模式引入了个人上下文与定制图表等能力,以进一步提升用户体验。
三、智能体模式:
跨平台任务代理系统
谷歌CEO皮查伊正式宣布,谷歌将在Chrome浏览器、搜索服务以及Gemini应用程序中引入智能体模式(Agent Mode)。这一模式下,智能体能够与浏览器及其他软件进行高效交互与操作。目前,谷歌研发的AI智能体Mariner已具备同时处理多达10项任务的能力,用户仅需向其展示一次任务流程,智能体便能迅速学习,并将所学经验应用于未来的类似场景。
智能体模式的实验版本即将面向Gemini App的订阅用户开放。在现场演示环节,皮查伊展示了Gemini App中智能体模式的强大功能,他要求智能体协助用户寻找合适的公寓。接到指令后,Gemini迅速访问房产网站Zillow,利用电脑自动调整筛选条件,并通过模型上下文协议(MCP)成功预约了看房时间。
皮查伊对此评价道:“我们正步入一个全新的时代。将研究成果转化为实际应用的最有效途径,就是让它们真正服务于人们的生活。”他还透露,在获得用户许可的前提下,Gemini现已能够在各类应用程序中以“私密且安全”的方式使用用户的个人信息。
4
硬件创新
XR眼镜与3D通信重塑交互
Android XR平台与AR眼镜
谷歌工程主管Shahram Izadi透露,谷歌计划在未来几个月内将Gemini AI功能的应用范围从手机扩展至智能手表、汽车中控台、电视乃至眼镜等更多设备。
Izadi指出,谷歌推出的安卓XR平台专为AI眼镜设备设计,预示着未来用户可能会拥有不止一副AI眼镜。比如,在观影或工作时,用户可能更倾向于使用具备沉浸式体验的头戴式设备;而在出行购物时,轻便的眼镜则能提供实时信息,满足用户的不同需求。
安卓XR平台由谷歌、三星和高通联合开发,自去年项目公布以来,已有数百家软件开发商为该平台提供了适配支持。其中,三星的Project Moohan将成为首款安卓XR设备,并计划于今年晚些时候上市销售。
此外,谷歌还宣布与中国AR品牌Xreal达成战略合作,双方将以Project Aura为名义,共同推出第二款安卓XR设备。这款设备将是首款搭载安卓XR平台的AR眼镜,有望为用户带来全新的交互体验。
Beam 3D通信系统
谷歌发布名为Google Beam的新产品。它是一个AI驱动的视频通信平台,让人们的视频感觉如同面对面聊天。它是谷歌3D视频会议系统项目Starline技术的升级版。谷歌与惠普合作,将Google Beam系统商业化,今年晚些时候,惠普将推出首批Google Beam设备。Google Beam采用六个摄像头阵列,从不同角度捕捉拍摄对象、比如人物。AI视频模型将实时拼接这些视图,渲染成类似3D的画面,从而创建3D人物。谷歌表示,该系统拥有近乎完美的头部追踪技术,精度可达毫米级,以视频帧率每秒60 帧(fps)的实时渲染速度呈现。
谷歌I/O 2025:
AI智能体全面渗透
谷歌作为人工智能(AI)研究领域的先锋,早在Transformer架构与AlphaGo的辉煌时代,便已筑牢了坚实的技术基石。然而,在近年来AI应用层面的激烈角逐中,谷歌略显审慎,未能如竞争对手般在用户体验上实现同步飞跃。不过,在2025年的I/O大会上,谷歌凭借一系列重大发布,彰显了其在AI应用领域的强势复兴。
从AI Mode彻底革新搜索体验,再到Gemini 2.5展现的深度推理能力以及Project Mariner的智能体功能,谷歌不仅成功追赶上了AI应用的潮流,更在多个核心领域实现了跨越式发展。此次大会,不仅是谷歌技术实力的集中展现,更是其向未来发出的坚定宣言:在AI驱动的新纪元里,谷歌将持续引领潮流,致力于构建一个更加智能、更加互联的世界。