2026年5月的谷歌I/O开发者大会,主题词只有一个:代理式AI。从Gemini 3.5 Flash到全天候AI代理Spark,谷歌正在试图重新定义人与AI的交互方式。
Gemini 3.5 Flash:速度与成本的再平衡
新模型最引人注目的不是某个单项指标的突破,而是综合性能的提升。编码和代理任务基准测试中超越上一代3.1 Pro,处理速度是其他前沿模型的4倍,运营成本仅为一半——这三个数字组合在一起,意味着企业级应用的门槛被大幅降低。
即日起成为Gemini应用和搜索AI模式的默认选择,这一决策表明谷歌对这款模型的信心。当技术足够成熟,推广策略便从"让用户选择"转向"直接成为默认"。
Gemini Omni:多模态的终极形态
支持文本、图像、音频和视频输入,能够生成视频内容——Omni模型的发布,标志着多模态能力从"加分项"变为"基础配置"。面向AI订阅用户及YouTube Shorts创作者开放,显示出谷歌在内容创作领域的布局意图。
Spark:全天候个人AI代理的野心
本次大会最具颠覆性的创新,当属Gemini Spark。这款基于云端的全天候AI代理,深度集成Gmail、文档等Workspace应用,核心功能包括自动解析信用卡账单、监控学校邮件截止日期、生成每日个性化摘要。
更具前瞻性的是"代理支付协议"的设计——未来可代表用户安全完成支付操作。这意味着AI代理的权限边界正在从"信息处理"向"交易执行"拓展。
已向信任测试者开放,预计下周向美国AI Ultra订阅用户推出测试版——这样的推进节奏,显示出谷歌在代理式AI领域的紧迫感。
订阅策略调整:从按量计费到按算力计费
AI Ultra新入门档定价100美元/月,原档位从250美元降至200美元,计费模式从按日提示词限制转向基于"计算量"模式。配合Gemini月活跃用户已超9亿的数据,谷歌正在构建一个规模化的AI服务生态。
Daily Brief功能的加入——根据用户日历和邮件生成个性化每日简报——则进一步强化了AI作为"个人助手"的定位。
结语
谷歌I/O 2026传递的信号明确:AI竞争已进入"代理式"阶段。不再是模型能力的单一比拼,而是如何将AI深度嵌入用户的工作流和生活流。当AI代理可以处理账单、监控邮件、甚至完成支付,它就不再是一个"工具",而更像是一个"数字分身"。
这场操作系统之争,争夺的是用户每天打开AI的第一秒。谷歌、OpenAI、Anthropic,以及中国的字节、阿里、腾讯、百度,都在为这个位置激烈角逐。