谷歌I/O 2025：Gemini大模型全面爆发！AI智能体全面渗透

导读

继微软之后，谷歌也紧跟步伐，全方位拥抱人工智能（AI）智能体（Agent）技术。在其开发者大会上，谷歌郑重宣布，将推动智能体全面融入其核心业务——搜索领域，以及旗下的AI助手Gemini。通过将Gemini与搜索功能深度融合，谷歌还创新性地推出了全新AI模式搜索体验。

谷歌2025年度I/O开发者大会的主题演讲环节精彩纷呈，集中展示了谷歌在AI、多模态模型、跨设备整合以及开发者工具等领域的最新突破与成果。从升级版的Gemini 2.5 Pro模型，到智能眼镜的XR应用，再到AI赋能的搜索与网页浏览新体验，谷歌所呈现的，不仅是模型性能的显著提升，更是AI从单纯的“信息工具”向“通用智能体”跨越式的进化。

文字编辑｜宋雨涵

Gemini 2.5 Pro

通用AI模型的“深度思考”革命

作为大会的明星模型，Gemini 2.5 Pro凭借其“深度思考”（Deep Think）模式和多模态能力，重新定义了AI的认知边界。该模型支持100万token的上下文窗口（计划扩展至200万），能够处理整本书籍或复杂代码库级别的信息，并通过分层推理解决高等数学、编程等专业问题。在权威测评中，其代码生成能力超越Claude 3.7 Sonnet和GPT-4.1 Turbo，并在GPQA（全球问题解答评估）中位列榜首。

此外，Gemini 2.5 Pro实现了跨模态的统一处理框架，可无缝整合文本、图像、音频和视频数据，例如实时解析摄像头画面生成AR导航建议，或通过语音对话同步完成代码调试。配套推出的Gemini 2.5 Flash则以更低成本和更高效率，为常规任务提供轻量化解决方案。

搜索升级

从信息检索到任务执行的跃迁

谷歌搜索的AI Mode功能成为全场焦点。这一由Gemini 2.5 Pro驱动的模式，彻底改变了传统搜索逻辑：

谷歌在近期积极应对新生代AI搜索应用的冲击，对其核心搜索业务进行了多项升级。在I/O开发者大会上，谷歌宣布其搜索中的AI概览功能已覆盖200多个国家和地区，支持40多种语言，并新增了对多种语言的支持，旨在改进用户搜索体验，提供更快速、准确的搜索结果。此外，谷歌还将在美国的AI概览中引入Gemini 2.5的定制版本，以提升搜索解决复杂问题的能力。

同时，谷歌正式在美国推出无需注册Labs的AI模式，该模式具备更先进的推理和多模态分析能力，能够通过后续问题和网络链接进行深入探索。AI模式采用查询扇出技术，能更深入地挖掘网络内容，帮助用户发现更多相关资源。谷歌还宣布将深度研究功能引入AI模式，通过发起数百次搜索和推理，快速创建专家级引用报告，节省用户研究时间。

谷歌还为搜索引入了实时功能，通过Project Astra的实时技术，用户可使用摄像头与搜索实时交流所看到的内容。此外，谷歌将Project Mariner的智能体功能融入AI模式，帮助用户节省购票等任务的时间，通过跨网站分析门票选项并提供实时价格和库存，简化购买流程。

最后，谷歌还为搜索的AI模式引入了个人上下文与定制图表等能力，以进一步提升用户体验。

三、智能体模式：

跨平台任务代理系统

谷歌CEO皮查伊正式宣布，谷歌将在Chrome浏览器、搜索服务以及Gemini应用程序中引入智能体模式（Agent Mode）。这一模式下，智能体能够与浏览器及其他软件进行高效交互与操作。目前，谷歌研发的AI智能体Mariner已具备同时处理多达10项任务的能力，用户仅需向其展示一次任务流程，智能体便能迅速学习，并将所学经验应用于未来的类似场景。

智能体模式的实验版本即将面向Gemini App的订阅用户开放。在现场演示环节，皮查伊展示了Gemini App中智能体模式的强大功能，他要求智能体协助用户寻找合适的公寓。接到指令后，Gemini迅速访问房产网站Zillow，利用电脑自动调整筛选条件，并通过模型上下文协议（MCP）成功预约了看房时间。

皮查伊对此评价道：“我们正步入一个全新的时代。将研究成果转化为实际应用的最有效途径，就是让它们真正服务于人们的生活。”他还透露，在获得用户许可的前提下，Gemini现已能够在各类应用程序中以“私密且安全”的方式使用用户的个人信息。

硬件创新

XR眼镜与3D通信重塑交互

Android XR平台与AR眼镜

谷歌工程主管Shahram Izadi透露，谷歌计划在未来几个月内将Gemini AI功能的应用范围从手机扩展至智能手表、汽车中控台、电视乃至眼镜等更多设备。

Izadi指出，谷歌推出的安卓XR平台专为AI眼镜设备设计，预示着未来用户可能会拥有不止一副AI眼镜。比如，在观影或工作时，用户可能更倾向于使用具备沉浸式体验的头戴式设备；而在出行购物时，轻便的眼镜则能提供实时信息，满足用户的不同需求。

安卓XR平台由谷歌、三星和高通联合开发，自去年项目公布以来，已有数百家软件开发商为该平台提供了适配支持。其中，三星的Project Moohan将成为首款安卓XR设备，并计划于今年晚些时候上市销售。

此外，谷歌还宣布与中国AR品牌Xreal达成战略合作，双方将以Project Aura为名义，共同推出第二款安卓XR设备。这款设备将是首款搭载安卓XR平台的AR眼镜，有望为用户带来全新的交互体验。

Beam 3D通信系统

谷歌发布名为Google Beam的新产品。它是一个AI驱动的视频通信平台，让人们的视频感觉如同面对面聊天。它是谷歌3D视频会议系统项目Starline技术的升级版。谷歌与惠普合作，将Google Beam系统商业化，今年晚些时候，惠普将推出首批Google Beam设备。Google Beam采用六个摄像头阵列，从不同角度捕捉拍摄对象、比如人物。AI视频模型将实时拼接这些视图，渲染成类似3D的画面，从而创建3D人物。谷歌表示，该系统拥有近乎完美的头部追踪技术，精度可达毫米级，以视频帧率每秒60 帧（fps）的实时渲染速度呈现。

谷歌I/O 2025：

AI智能体全面渗透

谷歌作为人工智能（AI）研究领域的先锋，早在Transformer架构与AlphaGo的辉煌时代，便已筑牢了坚实的技术基石。然而，在近年来AI应用层面的激烈角逐中，谷歌略显审慎，未能如竞争对手般在用户体验上实现同步飞跃。不过，在2025年的I/O大会上，谷歌凭借一系列重大发布，彰显了其在AI应用领域的强势复兴。

从AI Mode彻底革新搜索体验，再到Gemini 2.5展现的深度推理能力以及Project Mariner的智能体功能，谷歌不仅成功追赶上了AI应用的潮流，更在多个核心领域实现了跨越式发展。此次大会，不仅是谷歌技术实力的集中展现，更是其向未来发出的坚定宣言：在AI驱动的新纪元里，谷歌将持续引领潮流，致力于构建一个更加智能、更加互联的世界。

本文来源于DOIT传媒，文章内容仅供参考，不构成投资建议。