配额与费用
Gemini CLI 配额与费用:Google 账号、Google AI Pro/Ultra、Gemini API Key、Vertex AI、Workspace 和 Code Assist 版本怎么理解。
Gemini CLI 的配额、费用和隐私条款都跟认证方式绑定。最容易出错的不是“不知道多少钱”,而是把 Google 账号、Gemini API key、Vertex AI、Code Assist subscription 和 Workspace plan 混在一起比较。
不要硬背额度数字:Google 官方 quota、pricing、模型可用性和套餐边界会变。本文只保留选择逻辑;具体数字、价格、区域和套餐必须回官方 quota and pricing 页面核验。
1. 三类成本模型
| 模型 | 适合场景 | 主要风险 |
|---|---|---|
| Free usage | 体验、轻量个人使用、课程试跑 | 额度耗尽、模型/能力受限(详见下文 § 1a Free 层关键限制) |
| Fixed price paid tier | 个人或企业需要更可预测的日额度 | 套餐边界和资格条件会变化 |
| Pay-as-you-go | 长任务、专业工作流、不中断自动化 | 成本随调用、token、模型和任务范围增长 |
1a. Free 层关键限制(新手最容易踩坑)
不同 Free 入口的限制差异很大,按官方 quota-and-pricing 当前页:
- Google 账号登录(Code Assist for Individuals):每用户每天约 1,000 次模型请求,模型由 Gemini CLI 在 Gemini family 内自动选。
- Gemini API key 免费层:每用户每天约 250 次请求,只能用 Flash 模型。要 Pro 或更高,必须切付费。
- Vertex AI Express mode:免费但 90 天后必须 enable billing,否则停止。
常见误判:很多新手以为"用免费 API key 也能用 Pro 模型" —— 实际只能 Flash。要长期用 Pro,要么走 Google AI Pro / Ultra 订阅(个人)、Code Assist Standard / Enterprise(组织),要么走 API key Pay-as-you-go。
1b. 哪些套餐不支持 Gemini CLI
按官方 quota-and-pricing 页,下面这些计划目前不支持 Gemini CLI(避免报错时找不到原因):
- Google AI Plus(个人订阅,但官方未列入 Gemini CLI 支持矩阵)
- Google Workspace AI Standard / Plus / Expanded(这些只覆盖 Gemini web app 等产品,不覆盖 Gemini CLI 背后的 API)
- Gemini for Workspace 计划:这些计划只适用于 Google web 产品(如 Gemini web app、Flow),不适用于 Gemini CLI。Google 官方说"Supporting these plans is under active consideration for future support"。
flowchart TD
Auth["认证方式"] --> Google["Google account / Code Assist"]
Auth --> API["Gemini API key"]
Auth --> Vertex["Vertex AI"]
Google --> Fixed["免费或固定订阅额度"]
API --> PayGo["免费 tier 或按量付费"]
Vertex --> Cloud["Express / regular mode / Cloud billing"]
Fixed --> Terms["对应隐私和 ToS"]
PayGo --> Terms
Cloud --> Terms
style Auth fill:#dbeafe,stroke:#3b82f6,stroke-width:2px
style PayGo fill:#fef3c7,stroke:#f59e0b
style Cloud fill:#fee2e2,stroke:#ef4444
2. 认证方式决定费用路径
| 认证方式 | 费用/额度判断入口 | 更适合谁 |
|---|---|---|
| Google account / Code Assist | Code Assist limits、Google AI Pro / Ultra、Standard / Enterprise | 个人本机、团队席位、固定额度 |
| Gemini API key | Gemini API rate limits 和 pricing | headless、脚本化、明确 API 计费 |
| Vertex AI | Vertex AI quota、dynamic shared quota、pricing、provisioned throughput | 企业、生产、IAM 和 Cloud 治理 |
| Cloud Shell | 当前 Cloud project、账号许可和组织策略 | Cloud 学习和轻量项目任务 |
同一个人换认证方式,quota、费用和隐私条款可能都变。排障时先问“当前 CLI 到底用什么身份在调用”,不要只看模型名。
3. 个人用户怎么选
个人开发者通常先用 Google 账号登录。好处是:
- 不用管理 API key。
- 更适合交互式使用。
- 成本更可预测。
- 对教程复现更简单。
如果你已经有 Google AI Pro / Ultra 或 Code Assist 权益,用对应账号登录,再回官方 quota 页面确认当前权益是否覆盖 Gemini CLI。
4. API Key 和 Vertex AI 怎么选
API Key 适合:
- headless mode。
- 脚本化。
- 想明确使用 Gemini API。
- 不方便浏览器登录。
Vertex AI 适合:
- 企业。
- 生产环境。
- 需要 IAM、治理、安全、合规和 Cloud 生态。
按量付费前先收窄任务范围:长上下文、大仓库扫描、反复失败的自动化、CI 循环和大规模重构都会推高调用成本。先用只读计划确认范围,再执行。
5. 隐私条款也随认证方式变化
官方 Terms and Privacy 页面把认证方式拆成四类:个人 Google account、Standard/Enterprise Google account、Gemini Developer API key、Vertex AI GenAI API key。每类适用的 ToS、privacy notice 和是否用于模型改进的规则不同。
这对教程用户很重要:个人体验可以用个人账号,企业代码和客户数据不应该默认走个人免费路径。团队上线前要确认:
- 账号类型。
- 是否 Standard / Enterprise。
- 是否通过 API key 或 Vertex AI。
- usage statistics 是否开启。
- prompts、answers、code 是否可能被用于产品改进或模型训练。
6. 查当前用量
官方文档推荐:
/stats model它会显示当前 session token 使用情况,以及当前 quota/模型相关信息。退出 session 时也会展示模型使用摘要。
7. 降低成本的基本方法
- 先问清楚再让它执行,不要用模糊大任务来回试。
- 大范围重构先让它列计划。
- 付费 API Key 场景要监控
/stats model。 - 使用 token caching 相关能力前,先理解缓存对当前任务是否真的有收益。
- CI/headless 任务要设置明确范围,不要让它扫描不必要目录。
8. 接下来去哪
术语表
如果 Code Assist、Vertex AI、MCP、headless、token caching 还混淆,先补术语。
模型选择
费用和 quota 只是入口,具体任务还要按模型、上下文和速度选。
Terms and privacy
继续看不同认证方式对应的 ToS、隐私和 usage statistics 边界。