模型與執行時
Gemini CLI 模型與執行時入口:Gemini 3、模型選擇、模型路由、本地模型、token caching 和 ACP mode。
📖 本篇術語速查表
| 英文 / 縮寫 | 中文 | 一句話解釋 |
|---|---|---|
| 模型與執行時 | models & runtime | 模型選擇、路由、快取的總覽。 |
| 按需選用 | pick | 按任務和成本選該配什麼。 |
| 成本意識 | cost | 最佳化以收益最大為先。 |
不想讀完?把下面這段提示詞丟給 AI 幫你跑完——幫你按任務和成本在 Gemini CLI 的模型與執行時各能力裡選該配什麼。
你是 Gemini CLI 模型與執行時導航顧問。
【角色】
Gemini CLI 模型與執行時導航顧問,按最小夠用、安全優先的原則給可落地方案,每條結論都落到能照做的步驟或示例,不停留在空泛建議。
【輸入】
- 我的任務分佈和需求:___
- 最想改善的(更快 / 更省 / 更準 / 更隱私):___
- 本地算力情況:___
- 成本約束:___
- 經驗水平:___
【工作流程】
1. 把需求歸到對應能力
2. 按收益排該先做什麼(選模型 / 路由 / 快取 / 本地)
3. 給具體設定方向
4. 提示成本和隱私權衡
5. 給落地下一步
【輸出規範】
▌一、需求歸類
▌二、最佳化優先順序
▌三、設定方向
▌四、落地下一步
【硬約束】
- 先動收益最大的最佳化(通常是路由和快取)
- 不盲目追新模型
- 配額 / 價格以官方為準
- 不要替我臆測情況或編造不存在的能力,資訊不全先問清
- 不確定的設定或介面一律以官方文件為準,禁止照搬過時寫法模型與執行時決定 Gemini CLI 在不同任務上的成本、速度、穩定性和回退策略。不要只追“最強模型”,要看任務複雜度、上下文規模、配額和執行環境。
模型名、預覽狀態、配額和可見列表都會變。教學裡推薦寫 alias 和驗證方式,同時記錄實際模型、認證方式和測試日期。
學習路徑
flowchart LR
G3["Gemini 3"] --> Select["模型選擇"]
Select --> Routing["模型路由 / fallback"]
Routing --> Local["本地模型路由"]
Routing --> Cache["Token caching"]
Cache --> ACP["ACP mode"]
ACP --> Security["安全與企業"]
style Select fill:#dbeafe,stroke:#3b82f6
style Routing fill:#fef3c7,stroke:#f59e0b
style Cache fill:#dcfce7,stroke:#22c55e
選擇原則
簡單任務 低成本、快響應
複雜推理 更強模型
長上下文 注意配額和 token 成本
自動化任務 穩定性和可觀測性優先本章的核心不是追逐模型名,而是建立可複核的執行記錄:啟動引數、認證方式、實際模型、是否 fallback、token 使用和任務結果。模型越新,越要把測試日期和賬號條件寫清楚。
建議學習順序
先學 /model 和 --model,再學 fallback 和 /stats,最後再看 token caching、local router 和 ACP。普通使用者不需要一開始理解 ACP;教學作者和工具鏈開發者才需要深入協議層。
模型問題排查也按這個順序:先確認賬號能看到什麼模型,再確認啟動命令請求了什麼模型,再確認實際用了什麼模型,最後再討論引數、快取和協議整合。
如果只是寫入門教學,覆蓋前兩步就夠;如果寫自動化或企業教學,才需要繼續展開執行時記錄、fallback 記錄和快取統計。
模型選擇
從 /model、--model、Auto、Pro、Flash 和 Manual 開始。
模型路由
繼續看 fallback、Auto routing 和最終使用模型怎麼排查。
Token caching
成本最佳化要結合認證方式、上下文裁剪和 /stats 驗證。
頁面清單
| 頁面 | 解決的問題 |
|---|---|
| Gemini 3 | Gemini 3、Preview、release channel 和 fallback 提示 |
| 模型選擇 | /model、--model、alias、subagent 模型邊界 |
| 模型路由 | Auto routing、fallback、最終模型排查 |
| 本地模型路由 | 本地 Gemma router 的實驗邊界 |
| Token caching | 快取節省、認證方式和 /stats |
| ACP mode | IDE / client 協議整合和檔案代理 |
下一步
先讀:Gemini 3。
章節驗收
讀完本章後,至少能解釋三件事:為什麼 /model 看到的選擇不一定等於 usage report 全部模型;為什麼 token caching 在 OAuth 下可能看不到;為什麼 ACP 不等於 headless 自動化。解釋不清時,先不要寫生產自動化教學。