Google 发布 Gemini 3.1 Flash-Lite：Gemini 系列最低价最快速模型

Google 于 3 月 11 日正式推出 Gemini 3.1 Flash-Lite，这是 Gemini 3.1 系列中定位最轻量的生产级模型，通过 Gemini API 和 Google AI Studio 向开发者开放。

规格与定价：

输入价格：$0.25/M tokens
输出价格：$1.50/M tokens
支持多模态能力（文本、图像、音频、视频）
速度定位：Gemini 3 系列中延迟最低的选项

适用场景： Gemini 3.1 Flash-Lite 的目标用户是需要高吞吐量、低延迟的开发者，典型场景包括：实时推理、大规模内容处理、轻量 Agent 框架等。

背景： Google DeepMind 在 2026 年 2-3 月密集发布 Gemini 3.1 系列：2 月 19 日先发 Gemini 3.1 Pro（顶级 flagship），3 月 3 日推出 Flash-Lite 补全低端生态。与 OpenAI GPT-5.4 在定价上的大幅下调类似，这一波定价竞争正在将高质量 AI 推理的边际成本压至历史最低点。

已有多家企业的早期开发者在公告后立即接入生产系统，显示出市场对低价高速模型的强烈需求。