AI 程式設計教學中文版
官方教學中文版上下文與設定

Generation settings

Gemini CLI generation settings:模型生成引數、temperature、thinking budget 等設定應該怎麼理解和使用。

📖 本篇術語速查表
英文 / 縮寫中文一句話解釋
Generation settings生成設定控制模型輸出的引數。
temperature溫度控制輸出隨機性 / 確定性。
任務匹配match按任務型別調引數。

不想讀完?把下面這段提示詞丟給 AI 幫你跑完——幫你按任務型別調好 Gemini CLI 的生成引數(溫度等)。

你是 Gemini CLI 生成引數顧問。

【角色】
Gemini CLI 生成引數顧問,按最小夠用、安全優先的原則給可落地方案,每條結論都落到能照做的步驟或示例,不停留在空泛建議。

【輸入】
- 任務型別(寫程式碼 / 改 bug / 生成文件 / 頭腦風暴):___
- 想要更確定還是更發散:___
- 對一致性的要求:___
- 目前的引數設定:___
- 經驗水平:___

【工作流程】
1. 說明各生成引數的作用
2. 按任務型別推薦引數
3. 解釋確定性 vs 發散的權衡
4. 給不同任務的引數模板
5. 給驗證效果的方式

【輸出規範】
▌一、引數作用說明
▌二、按任務的推薦引數
▌三、確定性 vs 發散權衡
▌四、引數模板 + 驗證

【硬約束】
- 程式碼 / 嚴謹任務用低溫度,創意任務可調高
- 不盲目調參,先理解作用
- 改引數後驗證效果
- 不要替我臆測情況或編造不存在的設定項,資訊不全先問清
- 不確定的設定或欄位一律以官方文件為準,禁止照搬過時寫法

Generation settings 控制模型生成行為。官方 docs 把它作為模型設定的一部分,用來微調 temperature、thinking budget 等引數。

不要一上來調引數:新手優先把任務說明、上下文和驗證做好。引數是後手,不是第一解法。

什麼時候需要調

  • 同類任務輸出風格不穩定。
  • 需要更保守或更發散。
  • 長任務需要控制推理預算。
  • 團隊要固定生成行為。
  • 不同 agent 或不同任務需要不同模型引數。

什麼時候不該調

  • 問題其實是上下文不足。
  • GEMINI.md 沒寫清規則。
  • prompt 太模糊。
  • 沒有驗證命令。

推薦順序

先明確任務
再補上下文
再寫專案規則
再固定驗證命令
最後才調 generation settings

設定機制

Gemini CLI 的高階模型設定位於 modelConfigs。它有兩個核心概念:

  • customAliases:給一組模型引數起別名,可以 extends 另一個 alias。
  • overrides:按執行上下文注入引數,例如匹配某個 model 或某個 overrideScope

常見引數會直接傳給 Gemini SDK 的 GenerateContentConfig,例如 temperaturetopPmaxOutputTokensthinkingConfig.thinkingBudget。官方也明確提醒:這是高階功能,錯誤引數組合可能直接導致 API runtime error。

這裡的關鍵風險是“最小校驗”。Gemini CLI 不會替你判斷某個 provider、某個模型、某個日期是否支援所有欄位;它會把設定傳給模型供應商。教學裡給引數示例時,必須把驗證命令和回退方式寫出來,不能只說“把 thinking budget 調高”。

典型模板

保守、可復現的程式碼審查場景,可以定義低溫 alias:

{
  "modelConfigs": {
    "customAliases": {
      "precise-review": {
        "extends": "chat-base",
        "modelConfig": {
          "generateContentConfig": {
            "temperature": 0.0,
            "topP": 1.0
          }
        }
      }
    }
  }
}

如果只想讓某個 agent 使用更高 thinking budget,用 overrides 匹配 overrideScope,不要改全域預設值。全域調參會影響所有任務,排錯成本最高。

引數決策表

現象先檢查再考慮
輸出太發散prompt 是否明確、上下文是否足夠降低 temperature
輸出太短是否要求了結構和細節調整輸出長度相關引數
推理不夠深入任務是否需要計劃和驗證thinking budget
同任務結果不穩定輸入是否固定、規則是否寫入檔案低溫 alias
API 報引數錯誤最近新增的欄位是否合法回退 alias / override

引數只能影響生成傾向,不能替代事實來源、專案上下文和測試。程式碼任務裡,穩定性更多來自固定輸入、明確驗收和小步 diff,而不是把引數調成某個“萬能值”。

生產專案建議至少保留一個低風險 alias,例如 precise-reviewdocs-polish,只覆蓋少量引數。不要把所有任務都改成同一套高 thinking、高輸出長度設定;這會增加消耗,也會讓簡單任務變慢。

解析順序

Gemini CLI 會先解析 alias:父 alias 先合併,子 alias 覆蓋父級。然後應用 overrides:更具體的匹配優先;具體程度相同則按定義順序處理,後面的覆蓋前面的。

這意味著設定要從“寬預設”到“窄覆蓋”組織。不要為同一 agent 寫多條含義相近的 override,否則後續維護者很難判斷哪個最終生效。

排錯時按這個順序反推:目前 model 是什麼、命中了哪個 alias、有哪些 overrides 匹配、最後一條同等具體度 override 是否覆蓋了前面的值。不要靠肉眼只看 settings 頂層欄位。

驗收方式

每改一個 alias 或 override,只用一個小任務驗證:同一 prompt 連續執行兩次,看輸出穩定性、長度和推理行為是否符合預期。出現 API 引數錯誤時,不要改 prompt 規避,先回退最近新增的 generateContentConfig 欄位。

接下來去哪

官方來源

本頁目錄