模型、Adaptive、BYOK 與用量
按官方文件整理 Windsurf 模型選擇、Adaptive、SWE 模型族、BYOK、quota、extra usage 和團隊計費邊界。
Windsurf 的模型、用量和價格變化很快。官方 AI Models 頁面也明確提示:最新 pricing 和 availability 要以 Windsurf IDE 裡 Cascade 的 model selector 為準(model selector 在哪:開啟 Cascade 面板,輸入框下方有一個模型下拉選單,那裡即時列出當前可用模型 + 價格)。教程只能講穩定機制,不能把某一天的模型表當成長期事實。
本章的重點是建立選型邊界:什麼時候預設 Adaptive,什麼時候指定模型,什麼時候啟用 BYOK,什麼時候查 quota,團隊什麼時候需要統一模型策略。
閱讀目標:讀完本章,你應該能在不死記價格表的情況下,判斷模型、quota、BYOK 和團隊預算分別該看哪裡。
1. 高波動事實只給查法
模型和用量類問題,先按這個順序核驗:
| 問題 | 首選來源 | 原因 |
|---|---|---|
| 當前可選模型 | Windsurf IDE 的 Cascade model selector | 官方說明這裡最及時 |
| 模型單價/額度消耗 | 官方 AI Models / Adaptive / Quota 頁面 | 頁面會隨套餐和計費方式變 |
| 當前剩餘額度 | Windsurf usage meter 或 plan page | 和個人賬號、團隊賬號繫結 |
| 團隊可用模型 | Admin Portal 的 Models Configuration | 管理員可按 model 或 provider 過濾 |
| 企業計費 | 合同、ACU 或 legacy credits 頁面 | 企業計劃可能和 self-serve 不同 |
不要在團隊文件裡寫死“某模型永遠最便宜”或“某套餐永遠夠用”。正確寫法是:寫清任務分層和查詢入口。
官方 AI Models 頁面本身會內嵌模型成本資料,但它仍然不是團隊長期文件的硬編碼來源。正確做法是:上線前從 model selector 和官方模型頁核一次,團隊文件只寫“允許的 provider/model、預設模型、預算負責人、超額處理方式”。
2. Adaptive 預設優先
官方模型頁和 Adaptive 頁面都推薦多數使用者使用 Adaptive。Adaptive 是 Cognition 的 intelligent model router:在 model picker 裡選中後,它會根據請求自動選擇底層模型,簡單任務走更輕的模型,複雜任務走更強的模型。
flowchart TD
Task["開發任務"] --> Adaptive{"預設 Adaptive?"}
Adaptive -->|日常解釋/小修/測試| Route["自動路由"]
Adaptive -->|有明確模型需求| Specific["手動選擇指定模型"]
Route --> Simple["簡單任務:輕量模型"]
Route --> Complex["複雜任務:更強模型"]
Specific --> Budget["確認 quota / extra usage / enterprise policy"]
Budget --> Run["執行並記錄原因"]
style Adaptive fill:#dbeafe,stroke:#2563eb,stroke-width:2px
style Budget fill:#fef3c7,stroke:#d97706,stroke-width:2px
適合 Adaptive:
- 解釋程式碼、定位入口、總結檔案職責。
- 小範圍 bug 修復。
- 寫測試和修普通 lint/type 錯。
- 讓 Cascade 探索專案並形成計劃。
適合指定模型:
- 複雜架構遷移。
- 需要特定模型推理能力的任務。
- 團隊需要可預測的成本和審計口徑。
- 企業合規要求只允許特定 provider 或模型。
官方 Adaptive 頁面還說明,它的定價依賴 billing plan;2026-05-06 核驗時,頁面列出過一個截至 2026-05-07 的 introductory promotional rate。這個細節說明價格資訊非常高波動,教程不應固化成長期規則。
3. 模型族的穩定理解
官方 AI Models 頁面會列出 Windsurf / Cognition 自有模型,以及 Anthropic、OpenAI、Google 等供應商模型。具體列表變化很快,教程只保留穩定分工。
你不需要背宣傳語,理解分工就夠:
| 型別 | 穩定職責 | 使用判斷 |
|---|---|---|
| Adaptive | 自動選擇底層模型 | 預設選項,適合多數日常任務 |
| SWE agentic coding 模型 | 面向軟體工程任務 | 複雜實現、修復、重構、長任務 |
| Fast / lighter variants | 更偏速度和成本控制 | 解釋、小改、常規測試和低風險任務 |
| Tab / autocomplete 模型 | 即時補全和跳轉建議 | 編輯器內被動輔助,不替代 Cascade 大任務 |
| Retrieval 模型,例如 SWE-grep | context retrieval 和 Fast Context | 找相關程式碼,減少上下文汙染 |
| 外部 frontier models | 特定推理、程式碼或上下文能力 | 只有明確理由時手動指定 |
真正影響結果的不是“永遠選最強”,而是任務是否有足夠上下文、是否拆得夠小、是否有測試和 diff 審查。
4. BYOK 只適合個人明確管理賬單
官方 AI Models 頁面說明 BYOK(Bring Your Own Key,自帶金鑰——用你自己在模型供應商那裡申請的 API key 付錢給模型,Windsurf 只收訂閱費不收模型費) 只面向 free 和 paid individual users。個人使用者會在 model dropdown 裡看到帶 BYOK 標記的模型;需要在 subscription settings 裡新增 API key。未配置 key 時,使用 BYOK 模型會報錯。
不要在教程裡寫死 BYOK 支援模型清單。它應以官方模型頁和 IDE model dropdown 為準。
BYOK 適合:
- 你已經有供應商額度。
- 希望把 Windsurf 訂閱和模型賬單分開。
- 個人專案需要特定模型。
BYOK 不適合:
- 團隊要求統一供應商和審計。
- 你無法監控供應商賬單。
- key 可能被寫入專案、截圖或日誌。
BYOK 不是省錢開關。它把一部分賬單和金鑰風險轉移到你的模型供應商賬號。不要把 key 寫進專案檔案、教程截圖或 mcp_config.json。
5. Quota、extra usage 和 legacy credits
官方 Quota-Based Usage 頁面說明:2026 年 3 月,Windsurf 對 self-serve customers 從 credit-based system(按 prompt 計費——每條請求扣固定積分,模型不同積分倍率不同)切到 quota-based usage system(按用量計費——按你這次請求實際消耗的 token 數算錢,token 越多扣越多;好處是低消耗任務更省錢,壞處是長會話會快速燒 quota)。計劃包含 daily 和 weekly usage allowance,並按模型請求使用的 tokens 計算;free models 不計入 quota。
關鍵機制:
| 機制 | 官方含義 | 實操影響 |
|---|---|---|
| daily / weekly quota | 每日和每週 allowance 自動重新整理 | 長任務要分批,不要一天燒完 |
| token-based cost | 請求消耗取決於模型和上下文 token | 少帶無關上下文,能省 quota |
| extra usage | Pro、Teams、Max 達到額度後可購買繼續使用 | 要有預算上限和負責人 |
| free limit | Free 達到限制後等下一次 reset | 適合試用,不適合穩定生產工作流 |
| enterprise | 可能走 ACU、legacy credits 或合同 | 以合同和管理員頁面為準 |
官方還給出讓 quota 更耐用的建議:指令更精確、移除不必要上下文、 routine tasks 使用 free models、避免不必要長會話、儘量在同一 frontier model 上利用 caching。
深讀:為什麼“繼續對話”也會影響成本
Agentic IDE 的成本不只來自你輸入了幾個字。共享 timeline、編輯器上下文、系統提示、工具呼叫、檔案讀取和輸出 tokens 都會參與計算。長會話會積累更多上下文,跨多檔案任務也會增加 token 使用。
所以商業專案裡要把任務切成可驗證階段。先讓 Cascade 只讀定位,再決定是否繼續;每一階段結束後審 diff 和測試,不要讓一個會話無限擴張。
6. 團隊模型策略
團隊不要讓每個人憑感覺選模型。管理員可以在 Admin Portal 配置模型訪問,官方 Guide for Admins 說明可按 model 或 provider 過濾,且只能同時強制一種 filter 型別;也可以設定預設 Cascade 模型,但使用者在會話中仍可切換到允許的模型。
推薦團隊規則:
| 任務 | 推薦策略 |
|---|---|
| 日常解釋、普通 bug、小改動 | Adaptive 或團隊預設模型 |
| 跨模組重構、複雜架構 | 指定強模型,先計劃後執行 |
| 高消耗批次 workflow | 加 review gate 和預算負責人 |
| 合規敏感專案 | 只開放允許 provider / model |
| 培訓和 onboarding | 禁止死記價格,教 model selector 和 quota page 查法 |
模型策略最好寫進團隊 onboarding 或專案 AGENTS.md。不是為了限制開發者,而是為了讓成本、合規和任務質量有統一口徑。
7. 使用量排查
當成員反饋“額度掉得太快”時,先按這個順序查:
- 是否在長會話裡帶了過多檔案、timeline 或無關上下文。
- 是否用 frontier model 做了大量 routine tasks。
- 是否頻繁切模型導致快取收益降低。
- 是否讓 Cascade 在一個 prompt 內連續 tool calls 和 continue。
- 是否啟用了 extra usage,但沒有預算上限。
- 是否存在團隊共享賬號、未離職回收或異常自動化。
官方 quota 頁面給出的 token pricing example 說明,同一次看似簡單的 refactor 會包含使用者輸入、共享 timeline、編輯器上下文、系統提示、tool call 輸入、cache read/write 和輸出 tokens。成本排查要看整條 trajectory,不只看使用者最後發了幾個字。
本章自檢
完成本章後,用這 5 個問題檢查:
- 當前模型可用性應該在哪裡核驗?
- 什麼時候預設 Adaptive,什麼時候手動選模型?
- BYOK 的賬單和金鑰風險由誰承擔?
- self-serve quota、extra usage、enterprise ACU/credits 的邊界是什麼?
- 團隊是否有 usage 異常排查順序?
透過標準:你能為個人和團隊分別寫出一條模型選擇規則,而不是背某一天的價格表。
官方來源
- AI Models —— 官方模型頁,說明 Adaptive 推薦、model selector、SWE 模型族、BYOK 和最新價格可用性查詢入口。
- Adaptive —— 官方 Adaptive 頁面,說明智慧路由、選擇入口、pricing 依賴計劃和使用建議。
- Quota-Based Usage —— 官方 quota 頁面,說明 2026 年 3 月後的 daily/weekly allowance、extra usage、reset 和省用量建議。
- Plans and Usage —— 官方 plans/usage 頁面,說明 Free、Pro、Max、Teams、Enterprise、usage 檢視和 enterprise credit 邊界。