Gemini Omni Gemini 3.1 Flash-Lite模型介绍 - 技术规格与性能基准

Gemini 3.1 Flash-Lite 简介

极速低成本 — $0.25/1M，比 2.5 Flash 快 2.5 倍。基于 MoE 混合专家架构，支持三级思考系统（快速/Thinking/Deep Think）和 1M token 长上下文。在多项权威基准测试中表现卓越。

技术规格

架构	MoE 混合专家
上下文	1M tokens
速度	比 2.5 Flash 快 2.5 倍
API 定价	$0.25/$1.50 per 1M

性能表现

86.9%

GPQA Diamond

84.3%

MMLU-Pro

$0.25/1M

成本

Preview

状态

最佳适用场景

大规模处理

极高性价比

聊天机器人

低成本高并发

内容生成

批量文案创作

数据标注

大规模数据处理

怎么选择这个模型

适合谁

适合预算敏感、大批量处理和轻量自动化任务。

核心优势

成本更低、速度更快，适合作为高频调用的基础模型。

何时不选

如果你对复杂推理、精细生成和多轮稳定性要求更高，建议升级。

和其他模型怎么选

与 Gemini 3 Flash 对比

Flash-Lite 更强调低成本和高频调用，Flash 更强调综合平衡与更稳定的主流程表现。

与 Gemini 3.1 Pro 对比

Lite 适合基础处理和轻量自动化，3.1 Pro 更适合高难度推理、复杂生成和核心决策任务。

与 Gemini 2.5 Pro 对比

如果你要的是低成本和吞吐量，Lite 更合适；如果你要的是成熟稳定与复杂任务能力，可继续考虑 2.5 Pro。

实际选型建议

让 Lite 负责分类、抽取、预处理和草稿生成，再把关键任务交给更强模型完成。

准备好体验 Gemini Omni 了吗？

立即访问官网或查看更多教程

访问官网查看教程

Gemini 3.1 Flash-Lite