Gemini 3.1 Flash-Lite

极速低成本 — $0.25/1M,比 2.5 Flash 快 2.5 倍

Gemini 3.1 Flash-Lite 简介

极速低成本 — $0.25/1M,比 2.5 Flash 快 2.5 倍。基于 MoE 混合专家架构,支持三级思考系统(快速/Thinking/Deep Think)和 1M token 长上下文。在多项权威基准测试中表现卓越。

Gemini Omni Gemini 3.1 Flash-Lite

技术规格

架构MoE 混合专家
上下文1M tokens
速度比 2.5 Flash 快 2.5 倍
API 定价$0.25/$1.50 per 1M

性能表现

86.9%
GPQA Diamond
84.3%
MMLU-Pro
$0.25/1M
成本
Preview
状态

最佳适用场景

大规模处理

极高性价比

聊天机器人

低成本高并发

内容生成

批量文案创作

数据标注

大规模数据处理

怎么选择这个模型

适合谁

适合预算敏感、大批量处理和轻量自动化任务。

核心优势

成本更低、速度更快,适合作为高频调用的基础模型。

何时不选

如果你对复杂推理、精细生成和多轮稳定性要求更高,建议升级。

推荐搭配

适合承担预处理、分类、提取和首轮草稿生成任务。

和其他模型怎么选

与 Gemini 3 Flash 对比

Flash-Lite 更强调低成本和高频调用,Flash 更强调综合平衡与更稳定的主流程表现。

与 Gemini 3.1 Pro 对比

Lite 适合基础处理和轻量自动化,3.1 Pro 更适合高难度推理、复杂生成和核心决策任务。

与 Gemini 2.5 Pro 对比

如果你要的是低成本和吞吐量,Lite 更合适;如果你要的是成熟稳定与复杂任务能力,可继续考虑 2.5 Pro。

实际选型建议

让 Lite 负责分类、抽取、预处理和草稿生成,再把关键任务交给更强模型完成。

准备好体验 Gemini Omni 了吗?

立即访问官网或查看更多教程