Google在I/O 2026上正式发布了Gemini 3.5系列,包括针对Agent场景优化的Flash模型和全能型的Omni模型。这次更新的核心信息很明确:让AI Agent真正跑得起。
Gemini 3.5 Flash:快到Agent能用了
Gemini 3.5 Flash最大的卖点是速度——接近每秒300个token的输出速度,而基准测试成绩和上一代3.1 Pro差不多。这意味着什么?以前跑一个复杂的Agent任务,模型要反复调用工具、生成中间结果、再推理,光等模型吐字就要等半天。现在速度快了4倍,整个Agent循环的时间大幅缩短。
Google的说法是,使用最多AI token的公司如果把任务迁移到Gemini 3.5 Flash,每年能省下10亿美元。API定价也比上一代Flash更便宜。对站长来说,如果你在用Gemini API做自动化任务,成本会明显下降。
Gemini Omni:一个模型干所有事
Omni是这次发布的另一个重头戏。它是一个多模态模型,能处理文本、图片、音频、视频,甚至可以生成图像。Google把它定位成”什么都行”的通用模型。
从发布节奏来看,Google从去年的2.5系列跳到了3.0、3.1,现在直接到3.5,更新速度比OpenAI快不少。Anthropic的Claude和Google的Gemini现在在Agent赛道上是你追我赶的状态。
对站长和开发者意味着什么
如果你在做AI相关的工具或服务,Gemini 3.5 Flash值得试试。几个实际场景:
- 自动化内容处理:批量处理文档、翻译、摘要,速度快成本低
- Agent工作流:多步骤任务的延迟明显降低,用户体验提升
- 实时交互:聊天机器人、客服系统的响应速度更快
API已经在Google AI Studio和Vertex AI上线。Flash模型的定价比Pro便宜很多,适合跑量的场景。











Timothy Gowers Blog – A Recent Experience with ChatGPT 5.5 Pro



暂无评论内容