模型與用量策略
用任務風險、上下文規模、Adaptive 路由、quota 和團隊治理來制定 Windsurf 模型使用策略。
Windsurf 的模型策略不要從“哪個模型最強”開始,而要從任務風險開始。解釋程式碼、生成測試、跨模組重構、線上排障和資料操作,不應該共享同一套模型、上下文和終端許可權。
官方頁面:AI Models、Adaptive、Quota-Based Usage、Plans and Usage。
先給結論:個人日常開發預設用 Adaptive;高風險任務固定更強模型並加 Plan gate;團隊場景不要讓個人 BYOK、無限終端自動執行和不受控 MCP 混在一起。
先按任務分級
模型不是獨立決策,它和上下文、工具許可權、人工確認一起決定風險。
flowchart TB
Task["當前任務"] --> Low["低風險:解釋 / 搜尋 / 文案 / 小補全"]
Task --> Mid["中風險:單檔案修改 / 測試生成 / 小 bug"]
Task --> High["高風險:跨模組重構 / 鑑權 / 支付 / 資料 / 部署"]
Low --> L["Adaptive 或 fast model"]
Mid --> M["Adaptive + 看 diff + 跑測試"]
High --> H["指定強模型 + Plan gate + 人工確認命令"]
低風險任務看速度。中風險任務看 diff。高風險任務看計劃質量、測試證據和回復路徑。
Adaptive 的正確位置
Windsurf 官方把 Adaptive 定位成智慧模型路由:在模型選擇器裡選中 Adaptive 後,Cascade 會按每次請求動態選擇底層模型。簡單任務走更輕的模型,複雜任務走更強的模型,目標是減少日常手動選模型和不必要的高價模型消耗。
預設用 Adaptive 的場景:
- 解釋一個函式或檔案。
- 找呼叫鏈、入口、配置位置。
- 改一個小範圍 bug。
- 寫一組區域性測試。
- 總結錯誤日誌。
- 讓 Cascade 先生成計劃或風險清單。
不建議完全交給 Adaptive 的場景:
- 團隊或客戶明確規定模型範圍。
- 要復現同一模型行為做 A/B 對比。
- 大規模遷移需要嚴格預算和審計。
- 涉及鑑權、支付、刪除資料、生產部署。
- 你要用某個模型特定的推理能力,而不是讓路由自動判斷。
不要把模型列表寫死
Windsurf 的 AI Models 頁面會更新模型、價格和可用性。官方也提示最準確的模型和價格以 IDE 內 Cascade 的 model selector 為準。因此教程裡不應該把某一天的完整模型清單當成長期事實。
更穩的記法是按職責分:
- Adaptive:日常預設路由。
- SWE 系列:Windsurf/Cognition 面向軟體工程的自研模型族。
- Frontier 模型:高複雜度任務、難推理、跨模組規劃。
- Fast 模型:低風險、頻繁、對延遲敏感的請求。
- BYOK 模型:個人賬號自帶 key 的補充入口,不是團隊合規方案。
這樣即使模型名稱變化,使用策略也不需要重寫。
Quota 現在按用量預算理解
Windsurf 在 2026 年 3 月把舊 credit-based system 遷移到 quota-based usage。現在更適合把它理解成“每日 / 每週用量預算”:每次請求按模型實際 token 消耗計入 quota,不同模型的 token 成本不同;部分 free models 不計入 quota;Pro、Teams、Max 在用完內含額度後可以購買 extra usage 繼續使用。
影響用量的因素主要有四個:
- 上下文裡塞了多少檔案和歷史對話。
- 選用的模型單價和速度配置。
- 是否反覆讓 agent 在長 session 裡迴圈。
- 是否命中 prompt caching。
管理 quota 的重點不是月底看賬單,而是任務開始前就控制輸入規模。
一套實際使用策略
個人開發可以按這個預設值走:
日常理解代码 -> Adaptive
单文件修改 -> Adaptive + diff review
跨文件修改 -> 先 Plan,再继续
生产相关命令 -> 人工确认
预算异常 -> 查 session、上下文和模型选择團隊開發要再加四條規則:
- 管理員規定哪些模型可用,哪些模型停用。
- 高消耗任務必須先拆成 plan、scope、validation 三段。
- MCP server 先從只讀能力接入,寫入能力單獨審批。
- 終端自動執行要有 allowlist、denylist 和審計日誌。
BYOK 不是省錢開關
BYOK 適合已經有供應商賬號、能管理賬單和 key 的個人使用者。Windsurf 官方說明 BYOK 只面向 individual users 的部分模型入口;如果沒有配置 key,選擇 BYOK 模型會報錯。
啟用前先回答三件事:
- 賬單歸誰負責。
- key 洩露後怎麼吊銷和輪換。
- 團隊是否允許個人 key 進入專案工作流。
如果答不清,不啟用。團隊場景優先用組織級賬戶、企業策略和統一審計,而不是每個人往 IDE 裡塞自己的 key。
用量異常時怎麼查
不要只看“今天用了多少”,要倒查是哪類任務吃掉了預算。
排查順序:
- 開啟 usage / quota 頁面,確認是否是單日還是單週額度觸頂。
- 回看最近幾個長 session,有沒有讓 Cascade 反覆讀大目錄或迴圈跑測試。
- 檢查是否把日誌、構建產物、生成目錄、供應商目錄放進上下文。
- 對大任務改成先讀少量檔案,確認計劃後再逐步擴大範圍。
- 對高頻任務固定一個模型或用 Adaptive,減少頻繁切換導致的快取收益下降。
一旦發現某類任務穩定高消耗,就應該沉澱成 workflow:輸入更窄、步驟更短、驗證更明確。
模型策略模板
可以直接把這段放進專案規則或團隊手冊:
Windsurf model policy:
- Default to Adaptive for routine work.
- Use Ask/Plan before editing security, billing, auth, deployment, or data code.
- Do not run destructive shell commands through Cascade without human approval.
- Keep generated files, secrets, build outputs, and vendor directories out of context.
- Use BYOK only for approved individual experiments, never as a team default.
- Review quota weekly and turn repeated high-cost tasks into scoped workflows.關鍵判斷
強模型不是許可權放大的理由。模型越能做事,越要有更清楚的邊界:上下文給多少、命令能不能自動跑、MCP 能不能寫入、失敗後怎麼回復。商業專案裡真正可靠的模型策略,是讓模型在正確邊界內穩定完成任務,而不是讓它一次拿到所有檔案、所有工具和所有許可權。
官方來源
- AI Models —— 官方模型清單、Adaptive 推薦、SWE 模型族、BYOK 模型入口、最新價格和可用性。
- Adaptive —— 官方智慧模型路由說明、選擇入口、pricing 依賴計劃。
- Quota-Based Usage —— 官方 quota 系統、daily / weekly allowance、token-based cost、extra usage、reset 和省用量建議。
- Plans and Usage —— 官方 5 plans(Free / Pro / Max / Teams / Enterprise)、ACU 與 legacy credits 邊界、用量檢視入口。
本篇自檢
讀完後,你應該能回答:
- 任務風險分級和模型選擇是怎麼聯動的?
- 什麼時候預設 Adaptive,什麼時候要固定指定模型?
- 為什麼不要把模型清單寫死在團隊文件裡?
- quota-based usage 下,影響用量的 4 個因素是什麼?
- BYOK 啟用前必須回答的三件事是什麼?