技术规格
| 架构 | MoE 混合专家 |
| 上下文 | 1M tokens |
| 速度 | 比 2.5 Flash 快 2.5 倍 |
| API 定价 | $0.25/$1.50 per 1M |
性能表现
86.9%
GPQA Diamond
84.3%
MMLU-Pro
$0.25/1M
成本
Preview
状态
最佳适用场景
大规模处理
极高性价比
聊天机器人
低成本高并发
内容生成
批量文案创作
数据标注
大规模数据处理
怎么选择这个模型
适合谁
适合预算敏感、大批量处理和轻量自动化任务。
核心优势
成本更低、速度更快,适合作为高频调用的基础模型。
何时不选
如果你对复杂推理、精细生成和多轮稳定性要求更高,建议升级。
推荐搭配
适合承担预处理、分类、提取和首轮草稿生成任务。
和其他模型怎么选
与 Gemini 3 Flash 对比
Flash-Lite 更强调低成本和高频调用,Flash 更强调综合平衡与更稳定的主流程表现。
与 Gemini 3.1 Pro 对比
Lite 适合基础处理和轻量自动化,3.1 Pro 更适合高难度推理、复杂生成和核心决策任务。
与 Gemini 2.5 Pro 对比
如果你要的是低成本和吞吐量,Lite 更合适;如果你要的是成熟稳定与复杂任务能力,可继续考虑 2.5 Pro。
实际选型建议
让 Lite 负责分类、抽取、预处理和草稿生成,再把关键任务交给更强模型完成。
