配额与费用

📖 本篇术语速查表

英文 / 缩写	中文	一句话解释
配额	quota	免费 / 付费的用量额度。
定价	pricing	按用量产生的费用规则。
超额	overage	用超配额后的处理。

不想读完？把下面这段提示词丢给 AI 帮你跑完——帮你理解 Gemini CLI 的配额和定价、控好用量和成本。

你是 Gemini CLI 配额与成本顾问，帮我理解配额机制、控好用量和花费，把每条建议落到能照做的动作。

【角色】
你清楚 Gemini CLI 的免费和付费配额、用量怎么算、超额怎么办、怎么省着用。

【输入】
- 我用免费配额还是付费：___
- 典型任务和频率：___
- 最担心的成本点：___
- 任务上下文大小：___

【工作流程】
1. 拆解我的用量主要来自哪
2. 说明配额机制和超额应对
3. 给降用量、不太损质量的做法
4. 给务实的预算建议

【输出规范】
▌一、用量来源拆解
▌二、配额机制与超额应对
▌三、降用量做法
▌四、预算建议

【硬约束】
- 配额和价格以官方为准，不给死数字
- 降本不牺牲必要质量
- 不要臆测计费规则，不确定的查官方文档
- 禁止照搬过时定价信息
- 给的省钱做法按收益排序，先做省得最多又最不影响质量的，不要为省钱牺牲必要的模型能力
- 涉及账号配额和计费的操作以官方控制台为准，不替我臆测额度，禁止给无依据的具体数字

Gemini CLI 的配额、费用和隐私条款都跟认证方式绑定。最容易出错的不是“不知道多少钱”，而是把 Google 账号、Gemini API key、Vertex AI、Code Assist subscription 和 Workspace plan 混在一起比较。

不要硬背额度数字：Google 官方 quota、pricing、模型可用性和套餐边界会变。本文只保留选择逻辑；具体数字、价格、区域和套餐必须回官方 quota and pricing 页面核验。

1. 三类成本模型

模型	适合场景	主要风险
Free usage	体验、轻量个人使用、课程试跑	额度耗尽、模型/能力受限（详见下文 § 1a Free 层关键限制）
Fixed price paid tier	个人或企业需要更可预测的日额度	套餐边界和资格条件会变化
Pay-as-you-go	长任务、专业工作流、不中断自动化	成本随调用、token、模型和任务范围增长

1a. Free 层关键限制（新手最容易踩坑）

不同 Free 入口的限制差异很大，按官方 quota-and-pricing 当前页：

Google 账号登录（Code Assist for Individuals）：每用户每天约 1,000 次模型请求，模型由 Gemini CLI 在 Gemini family 内自动选。
Gemini API key 免费层：每用户每天约 250 次请求，只能用 Flash 模型。要 Pro 或更高，必须切付费。
Vertex AI Express mode：免费但 90 天后必须 enable billing，否则停止。

常见误判：很多新手以为"用免费 API key 也能用 Pro 模型" —— 实际只能 Flash。要长期用 Pro，要么走 Google AI Pro / Ultra 订阅（个人）、Code Assist Standard / Enterprise（组织），要么走 API key Pay-as-you-go。

1b. 哪些套餐不支持 Gemini CLI

按官方 quota-and-pricing 页，下面这些计划目前不支持 Gemini CLI（避免报错时找不到原因）：

Google AI Plus（个人订阅，但官方未列入 Gemini CLI 支持矩阵）
Google Workspace AI Standard / Plus / Expanded（这些只覆盖 Gemini web app 等产品，不覆盖 Gemini CLI 背后的 API）
Gemini for Workspace 计划：这些计划只适用于 Google web 产品（如 Gemini web app、Flow），不适用于 Gemini CLI。Google 官方说"Supporting these plans is under active consideration for future support"。

flowchart TD
    Auth["认证方式"] --> Google["Google account / Code Assist"]
    Auth --> API["Gemini API key"]
    Auth --> Vertex["Vertex AI"]
    Google --> Fixed["免费或固定订阅额度"]
    API --> PayGo["免费 tier 或按量付费"]
    Vertex --> Cloud["Express / regular mode / Cloud billing"]
    Fixed --> Terms["对应隐私和 ToS"]
    PayGo --> Terms
    Cloud --> Terms

    style Auth fill:#dbeafe,stroke:#3b82f6,stroke-width:2px
    style PayGo fill:#fef3c7,stroke:#f59e0b
    style Cloud fill:#fee2e2,stroke:#ef4444

2. 认证方式决定费用路径

认证方式	费用/额度判断入口	更适合谁
Google account / Code Assist	Code Assist limits、Google AI Pro / Ultra、Standard / Enterprise	个人本机、团队席位、固定额度
Gemini API key	Gemini API rate limits 和 pricing	headless、脚本化、明确 API 计费
Vertex AI	Vertex AI quota、dynamic shared quota、pricing、provisioned throughput	企业、生产、IAM 和 Cloud 治理
Cloud Shell	当前 Cloud project、账号许可和组织策略	Cloud 学习和轻量项目任务

同一个人换认证方式，quota、费用和隐私条款可能都变。排障时先问“当前 CLI 到底用什么身份在调用”，不要只看模型名。

3. 个人用户怎么选

个人开发者通常先用 Google 账号登录。好处是：

不用管理 API key。
更适合交互式使用。
成本更可预测。
对教程复现更简单。

如果你已经有 Google AI Pro / Ultra 或 Code Assist 权益，用对应账号登录，再回官方 quota 页面确认当前权益是否覆盖 Gemini CLI。

4. API Key 和 Vertex AI 怎么选

API Key 适合：

headless mode。
脚本化。
想明确使用 Gemini API。
不方便浏览器登录。

Vertex AI 适合：

企业。
生产环境。
需要 IAM、治理、安全、合规和 Cloud 生态。

按量付费前先收窄任务范围：长上下文、大仓库扫描、反复失败的自动化、CI 循环和大规模重构都会推高调用成本。先用只读计划确认范围，再执行。

5. 隐私条款也随认证方式变化

官方 Terms and Privacy 页面把认证方式拆成四类：个人 Google account、Standard/Enterprise Google account、Gemini Developer API key、Vertex AI GenAI API key。每类适用的 ToS、privacy notice 和是否用于模型改进的规则不同。

这对教程用户很重要：个人体验可以用个人账号，企业代码和客户数据不应该默认走个人免费路径。团队上线前要确认：

账号类型。
是否 Standard / Enterprise。
是否通过 API key 或 Vertex AI。
usage statistics 是否开启。
prompts、answers、code 是否可能被用于产品改进或模型训练。

6. 查当前用量

官方文档推荐：

/stats model

它会显示当前 session token 使用情况，以及当前 quota/模型相关信息。退出 session 时也会展示模型使用摘要。

7. 降低成本的基本方法

先问清楚再让它执行，不要用模糊大任务来回试。
大范围重构先让它列计划。
付费 API Key 场景要监控 /stats model。
使用 token caching 相关能力前，先理解缓存对当前任务是否真的有收益。
CI/headless 任务要设置明确范围，不要让它扫描不必要目录。

配额与费用

1. 三类成本模型

1a. Free 层关键限制（新手最容易踩坑）

1b. 哪些套餐不支持 Gemini CLI

2. 认证方式决定费用路径

3. 个人用户怎么选

4. API Key 和 Vertex AI 怎么选

5. 隐私条款也随认证方式变化

6. 查当前用量

7. 降低成本的基本方法

8. 接下来去哪

术语表

模型选择

Terms and privacy

官方来源

本页目录