模型與執行時

模型與執行時決定 Gemini CLI 在不同任務上的成本、速度、穩定性和回退策略。不要只追“最強模型”，要看任務複雜度、上下文規模、配額和執行環境。

模型名、預覽狀態、配額和可見列表都會變。教程裡推薦寫 alias 和驗證方式，同時記錄實際模型、認證方式和測試日期。

學習路徑

flowchart LR
    G3["Gemini 3"] --> Select["模型選擇"]
    Select --> Routing["模型路由 / fallback"]
    Routing --> Local["本地模型路由"]
    Routing --> Cache["Token caching"]
    Cache --> ACP["ACP mode"]
    ACP --> Security["安全與企業"]

    style Select fill:#dbeafe,stroke:#3b82f6
    style Routing fill:#fef3c7,stroke:#f59e0b
    style Cache fill:#dcfce7,stroke:#22c55e

選擇原則

简单任务     低成本、快响应
复杂推理     更强模型
长上下文     注意配额和 token 成本
自动化任务   稳定性和可观测性优先

本章的核心不是追逐模型名，而是建立可複核的執行記錄：啟動引數、認證方式、實際模型、是否 fallback、token 使用和任務結果。模型越新，越要把測試日期和賬號條件寫清楚。

建議學習順序

先學 /model 和 --model，再學 fallback 和 /stats，最後再看 token caching、local router 和 ACP。普通使用者不需要一開始理解 ACP；教程作者和工具鏈開發者才需要深入協議層。

模型問題排查也按這個順序：先確認賬號能看到什麼模型，再確認啟動命令請求了什麼模型，再確認實際用了什麼模型，最後再討論引數、快取和協議整合。

如果只是寫入門教程，覆蓋前兩步就夠；如果寫自動化或企業教程，才需要繼續展開執行時日誌、fallback 記錄和快取統計。

模型選擇

從 /model、--model、Auto、Pro、Flash 和 Manual 開始。

模型路由

繼續看 fallback、Auto routing 和最終使用模型怎麼排查。

Token caching

成本最佳化要結合認證方式、上下文裁剪和 /stats 驗證。

頁面清單

頁面	解決的問題
Gemini 3	Gemini 3、Preview、release channel 和 fallback 提示
模型選擇	`/model`、`--model`、alias、subagent 模型邊界
模型路由	Auto routing、fallback、最終模型排查
本地模型路由	本地 Gemma router 的實驗邊界
Token caching	快取節省、認證方式和 `/stats`
ACP mode	IDE / client 協議整合和檔案代理

下一步

先讀：Gemini 3。

章節驗收

讀完本章後，至少能解釋三件事：為什麼 /model 看到的選擇不一定等於 usage report 全部模型；為什麼 token caching 在 OAuth 下可能看不到；為什麼 ACP 不等於 headless 自動化。解釋不清時，先不要寫生產自動化教程。