模型與執行時
Gemini CLI 模型與執行時入口:Gemini 3、模型選擇、模型路由、本地模型、token caching 和 ACP mode。
模型與執行時決定 Gemini CLI 在不同任務上的成本、速度、穩定性和回退策略。不要只追“最強模型”,要看任務複雜度、上下文規模、配額和執行環境。
模型名、預覽狀態、配額和可見列表都會變。教程裡推薦寫 alias 和驗證方式,同時記錄實際模型、認證方式和測試日期。
學習路徑
flowchart LR
G3["Gemini 3"] --> Select["模型選擇"]
Select --> Routing["模型路由 / fallback"]
Routing --> Local["本地模型路由"]
Routing --> Cache["Token caching"]
Cache --> ACP["ACP mode"]
ACP --> Security["安全與企業"]
style Select fill:#dbeafe,stroke:#3b82f6
style Routing fill:#fef3c7,stroke:#f59e0b
style Cache fill:#dcfce7,stroke:#22c55e
選擇原則
简单任务 低成本、快响应
复杂推理 更强模型
长上下文 注意配额和 token 成本
自动化任务 稳定性和可观测性优先本章的核心不是追逐模型名,而是建立可複核的執行記錄:啟動引數、認證方式、實際模型、是否 fallback、token 使用和任務結果。模型越新,越要把測試日期和賬號條件寫清楚。
建議學習順序
先學 /model 和 --model,再學 fallback 和 /stats,最後再看 token caching、local router 和 ACP。普通使用者不需要一開始理解 ACP;教程作者和工具鏈開發者才需要深入協議層。
模型問題排查也按這個順序:先確認賬號能看到什麼模型,再確認啟動命令請求了什麼模型,再確認實際用了什麼模型,最後再討論引數、快取和協議整合。
如果只是寫入門教程,覆蓋前兩步就夠;如果寫自動化或企業教程,才需要繼續展開執行時日誌、fallback 記錄和快取統計。
模型選擇
從 /model、--model、Auto、Pro、Flash 和 Manual 開始。
模型路由
繼續看 fallback、Auto routing 和最終使用模型怎麼排查。
Token caching
成本最佳化要結合認證方式、上下文裁剪和 /stats 驗證。
頁面清單
| 頁面 | 解決的問題 |
|---|---|
| Gemini 3 | Gemini 3、Preview、release channel 和 fallback 提示 |
| 模型選擇 | /model、--model、alias、subagent 模型邊界 |
| 模型路由 | Auto routing、fallback、最終模型排查 |
| 本地模型路由 | 本地 Gemma router 的實驗邊界 |
| Token caching | 快取節省、認證方式和 /stats |
| ACP mode | IDE / client 協議整合和檔案代理 |
下一步
先讀:Gemini 3。
章節驗收
讀完本章後,至少能解釋三件事:為什麼 /model 看到的選擇不一定等於 usage report 全部模型;為什麼 token caching 在 OAuth 下可能看不到;為什麼 ACP 不等於 headless 自動化。解釋不清時,先不要寫生產自動化教程。