AI 编程教程中文版
官方教程中文版入门

配额与费用

Gemini CLI 配额与费用:Google 账号、Google AI Pro/Ultra、Gemini API Key、Vertex AI、Workspace 和 Code Assist 版本怎么理解。

📖 本篇术语速查表
英文 / 缩写中文一句话解释
配额quota免费 / 付费的用量额度。
定价pricing按用量产生的费用规则。
超额overage用超配额后的处理。

不想读完?把下面这段提示词丢给 AI 帮你跑完——帮你理解 Gemini CLI 的配额和定价、控好用量和成本。

你是 Gemini CLI 配额与成本顾问,帮我理解配额机制、控好用量和花费,把每条建议落到能照做的动作。

【角色】
你清楚 Gemini CLI 的免费和付费配额、用量怎么算、超额怎么办、怎么省着用。

【输入】
- 我用免费配额还是付费:___
- 典型任务和频率:___
- 最担心的成本点:___
- 任务上下文大小:___

【工作流程】
1. 拆解我的用量主要来自哪
2. 说明配额机制和超额应对
3. 给降用量、不太损质量的做法
4. 给务实的预算建议

【输出规范】
▌一、用量来源拆解
▌二、配额机制与超额应对
▌三、降用量做法
▌四、预算建议

【硬约束】
- 配额和价格以官方为准,不给死数字
- 降本不牺牲必要质量
- 不要臆测计费规则,不确定的查官方文档
- 禁止照搬过时定价信息
- 给的省钱做法按收益排序,先做省得最多又最不影响质量的,不要为省钱牺牲必要的模型能力
- 涉及账号配额和计费的操作以官方控制台为准,不替我臆测额度,禁止给无依据的具体数字

Gemini CLI 的配额、费用和隐私条款都跟认证方式绑定。最容易出错的不是“不知道多少钱”,而是把 Google 账号、Gemini API key、Vertex AI、Code Assist subscription 和 Workspace plan 混在一起比较。

不要硬背额度数字:Google 官方 quota、pricing、模型可用性和套餐边界会变。本文只保留选择逻辑;具体数字、价格、区域和套餐必须回官方 quota and pricing 页面核验。

1. 三类成本模型

模型适合场景主要风险
Free usage体验、轻量个人使用、课程试跑额度耗尽、模型/能力受限(详见下文 § 1a Free 层关键限制)
Fixed price paid tier个人或企业需要更可预测的日额度套餐边界和资格条件会变化
Pay-as-you-go长任务、专业工作流、不中断自动化成本随调用、token、模型和任务范围增长

1a. Free 层关键限制(新手最容易踩坑)

不同 Free 入口的限制差异很大,按官方 quota-and-pricing 当前页:

  • Google 账号登录(Code Assist for Individuals):每用户每天约 1,000 次模型请求,模型由 Gemini CLI 在 Gemini family 内自动选。
  • Gemini API key 免费层:每用户每天约 250 次请求,只能用 Flash 模型。要 Pro 或更高,必须切付费。
  • Vertex AI Express mode:免费但 90 天后必须 enable billing,否则停止。

常见误判:很多新手以为"用免费 API key 也能用 Pro 模型" —— 实际只能 Flash。要长期用 Pro,要么走 Google AI Pro / Ultra 订阅(个人)、Code Assist Standard / Enterprise(组织),要么走 API key Pay-as-you-go。

1b. 哪些套餐不支持 Gemini CLI

按官方 quota-and-pricing 页,下面这些计划目前不支持 Gemini CLI(避免报错时找不到原因):

  • Google AI Plus(个人订阅,但官方未列入 Gemini CLI 支持矩阵)
  • Google Workspace AI Standard / Plus / Expanded(这些只覆盖 Gemini web app 等产品,不覆盖 Gemini CLI 背后的 API)
  • Gemini for Workspace 计划:这些计划只适用于 Google web 产品(如 Gemini web app、Flow),不适用于 Gemini CLI。Google 官方说"Supporting these plans is under active consideration for future support"。
flowchart TD
    Auth["认证方式"] --> Google["Google account / Code Assist"]
    Auth --> API["Gemini API key"]
    Auth --> Vertex["Vertex AI"]
    Google --> Fixed["免费或固定订阅额度"]
    API --> PayGo["免费 tier 或按量付费"]
    Vertex --> Cloud["Express / regular mode / Cloud billing"]
    Fixed --> Terms["对应隐私和 ToS"]
    PayGo --> Terms
    Cloud --> Terms

    style Auth fill:#dbeafe,stroke:#3b82f6,stroke-width:2px
    style PayGo fill:#fef3c7,stroke:#f59e0b
    style Cloud fill:#fee2e2,stroke:#ef4444

2. 认证方式决定费用路径

认证方式费用/额度判断入口更适合谁
Google account / Code AssistCode Assist limits、Google AI Pro / Ultra、Standard / Enterprise个人本机、团队席位、固定额度
Gemini API keyGemini API rate limits 和 pricingheadless、脚本化、明确 API 计费
Vertex AIVertex AI quota、dynamic shared quota、pricing、provisioned throughput企业、生产、IAM 和 Cloud 治理
Cloud Shell当前 Cloud project、账号许可和组织策略Cloud 学习和轻量项目任务

同一个人换认证方式,quota、费用和隐私条款可能都变。排障时先问“当前 CLI 到底用什么身份在调用”,不要只看模型名。

3. 个人用户怎么选

个人开发者通常先用 Google 账号登录。好处是:

  • 不用管理 API key。
  • 更适合交互式使用。
  • 成本更可预测。
  • 对教程复现更简单。

如果你已经有 Google AI Pro / Ultra 或 Code Assist 权益,用对应账号登录,再回官方 quota 页面确认当前权益是否覆盖 Gemini CLI。

4. API Key 和 Vertex AI 怎么选

API Key 适合:

  • headless mode。
  • 脚本化。
  • 想明确使用 Gemini API。
  • 不方便浏览器登录。

Vertex AI 适合:

  • 企业。
  • 生产环境。
  • 需要 IAM、治理、安全、合规和 Cloud 生态。

按量付费前先收窄任务范围:长上下文、大仓库扫描、反复失败的自动化、CI 循环和大规模重构都会推高调用成本。先用只读计划确认范围,再执行。

5. 隐私条款也随认证方式变化

官方 Terms and Privacy 页面把认证方式拆成四类:个人 Google account、Standard/Enterprise Google account、Gemini Developer API key、Vertex AI GenAI API key。每类适用的 ToS、privacy notice 和是否用于模型改进的规则不同。

这对教程用户很重要:个人体验可以用个人账号,企业代码和客户数据不应该默认走个人免费路径。团队上线前要确认:

  • 账号类型。
  • 是否 Standard / Enterprise。
  • 是否通过 API key 或 Vertex AI。
  • usage statistics 是否开启。
  • prompts、answers、code 是否可能被用于产品改进或模型训练。

6. 查当前用量

官方文档推荐:

/stats model

它会显示当前 session token 使用情况,以及当前 quota/模型相关信息。退出 session 时也会展示模型使用摘要。

7. 降低成本的基本方法

  • 先问清楚再让它执行,不要用模糊大任务来回试。
  • 大范围重构先让它列计划。
  • 付费 API Key 场景要监控 /stats model
  • 使用 token caching 相关能力前,先理解缓存对当前任务是否真的有收益。
  • CI/headless 任务要设置明确范围,不要让它扫描不必要目录。

8. 接下来去哪

官方来源

本页目录