Google 于 3 月 11 日正式推出 Gemini 3.1 Flash-Lite,这是 Gemini 3.1 系列中定位最轻量的生产级模型,通过 Gemini API 和 Google AI Studio 向开发者开放。
规格与定价:
- 输入价格:$0.25/M tokens
- 输出价格:$1.50/M tokens
- 支持多模态能力(文本、图像、音频、视频)
- 速度定位:Gemini 3 系列中延迟最低的选项
适用场景: Gemini 3.1 Flash-Lite 的目标用户是需要高吞吐量、低延迟的开发者,典型场景包括:实时推理、大规模内容处理、轻量 Agent 框架等。
背景: Google DeepMind 在 2026 年 2-3 月密集发布 Gemini 3.1 系列:2 月 19 日先发 Gemini 3.1 Pro(顶级 flagship),3 月 3 日推出 Flash-Lite 补全低端生态。与 OpenAI GPT-5.4 在定价上的大幅下调类似,这一波定价竞争正在将高质量 AI 推理的边际成本压至历史最低点。
已有多家企业的早期开发者在公告后立即接入生产系统,显示出市场对低价高速模型的强烈需求。