AI 编程教程中文版
官方教程中文版模型与运行时

模型选择

Gemini CLI 模型选择:--model、auto/pro/flash/flash-lite alias,以及按任务复杂度选择模型。

📖 本篇术语速查表
英文 / 缩写中文一句话解释
模型选择selection按任务选不同档位模型。
维度axis速度 / 成本 / 质量 / 复杂度。
默认default长期生效的模型。

不想读完?把下面这段提示词丢给 AI 帮你跑完——帮你按任务和场景选对 Gemini 模型并配好默认。

你是 Gemini CLI 模型选择顾问。

【角色】
Gemini CLI 模型选择顾问,按最小够用、安全优先的原则给可落地方案,每条结论都落到能照做的步骤或示例,不停留在空泛建议。

【输入】
- 任务类型和复杂度:___
- 对速度 / 成本 / 质量的优先级:___
- 是否多场景:___
- 套餐 / 配额情况:___
- 经验水平:___

【工作流程】
1. 按复杂度分层选模型
2. 给默认模型配置
3. 说明何时临时切换
4. 处理成本和配额
5. 给决策建议

【输出规范】
▌一、模型推荐
▌二、默认配置
▌三、临时切换时机
▌四、成本 + 决策

【硬约束】
- 简单任务不用最贵模型
- 不夸大高端模型收益
- 配额 / 价格以官方为准
- 不要替我臆测情况或编造不存在的能力,信息不全先问清
- 不确定的配置或接口一律以官方文档为准,禁止照搬过时写法
- 给的每条结论都要落到具体可照做的步骤或示例,不停留在「建议」「考虑一下」这类没法直接执行的空泛表述

Gemini CLI 支持通过 /model 交互选择模型,也支持通过 --model / -m 在启动时指定模型。官方建议大多数用户优先使用 Auto,让 CLI 按任务复杂度选择模型。

/model--model 控制主会话模型,不保证覆盖 subagent 使用的模型。看到 usage report 里有其他模型时,先看是否是 subagent 或内部工具调用。

gemini --model pro
gemini -m flash -p "summarize README.md"

/model 选项

运行 /model 会打开模型选择对话。官方当前文档列出三类:

  • Auto (Gemini 3):在 Gemini 3 Pro / Flash 范围内自动选择。
  • Auto (Gemini 2.5):在 Gemini 2.5 Pro / Flash 范围内自动选择。
  • Manual:手动选择账号可用的具体模型。

/model--model 不会覆盖 subagents 使用的模型。因此你在 usage report 里看到其他模型,不一定是主会话模型选择失败,可能是 subagent 自己的配置。

模型选择会影响后续交互,但不等于固定所有内部调用。官方文档明确提醒 usage report 里可能出现其他模型,这通常来自 subagent、内部分类、补全或 fallback 链路。排查时要先区分“主会话模型”和“辅助调用模型”。

alias 思路

alias适合
auto默认选择,交给 CLI 决定
pro复杂推理、跨文件任务
flash日常平衡任务
flash-lite简单快速任务

选择建议

  • 不确定时先用 auto
  • 大型重构前先计划,再决定是否用更强模型。
  • 频繁脚本化任务要考虑成本。
  • 模型失败时不要只换模型,也要检查上下文和任务描述。
  • 想固定可复现行为时,记录模型名、CLI 版本和认证方式。

任务分层

pro 的理由应该是任务复杂,而不是“感觉更强”。典型场景包括跨模块设计、复杂 bug 定位、架构迁移、长上下文审查。flash 更适合格式转换、摘要、简单解释、单文件小改。flash-lite 适合短平快自动化,但不适合高风险修改或需要深推理的 debug。

如果输出质量差,先查这四件事:上下文是否足够,GEMINI.md 是否清楚,工具是否有权限,验证命令是否明确。模型升级只能解决一部分问题,不能替代任务契约。

任务推荐起点备注
日常问答 / 小改auto让 CLI 按复杂度选
架构设计 / 复杂 debugpro 或 Auto 高能力路由先用 Plan mode 收敛范围
摘要 / 格式转换flash更看重速度
大批量脚本化短任务flash-lite仍要记录实际模型
团队教程推荐 alias,不写死 preview 模型降低过期风险

验收方式

切换模型后跑同一个小任务,记录响应速度、工具调用质量、是否触发 fallback。对团队教程和工作流,建议在文档里写“推荐 alias”,不要写死某个 preview 模型作为唯一入口。

如果教程需要复现结果,至少记录 CLI 版本、认证方式、选择的 alias、实际使用模型和测试日期。只写“使用 Gemini 3”不够精确。

商业教程建议给出验证命令而不是只给推荐:让读者先运行 /model 看可见列表,再运行一个小任务,最后用 /stats model 或 usage report 确认实际模型。这样账号差异不会直接变成教程失效。

常见误区

第一个误区是把 preview 模型写成默认模型。Preview 状态会变,账号可见性也会变,教程最好推荐 auto 或稳定 alias,再在备注里说明测试时具体用了哪个模型。

第二个误区是只看速度不看验证。flash 很适合短任务,但高风险代码修改仍然要看 diff、测试和回滚;pro 也不会自动保证改动正确。

第三个误区是把模型选择和生成参数混在一起。/model 解决选哪个模型,generation settings 解决同一模型内的生成行为。排错时要分开改,一次只改一个变量。

接下来去哪

官方来源

本页目录