AI 程式設計教程中文版
官方教程中文版

模型、Adaptive、BYOK 與用量

按官方文件整理 Windsurf 模型選擇、Adaptive、SWE 模型族、BYOK、quota、extra usage 和團隊計費邊界。

Windsurf 的模型、用量和價格變化很快。官方 AI Models 頁面也明確提示:最新 pricing 和 availability 要以 Windsurf IDE 裡 Cascade 的 model selector 為準(model selector 在哪:開啟 Cascade 面板,輸入框下方有一個模型下拉選單,那裡即時列出當前可用模型 + 價格)。教程只能講穩定機制,不能把某一天的模型表當成長期事實。

本章的重點是建立選型邊界:什麼時候預設 Adaptive,什麼時候指定模型,什麼時候啟用 BYOK,什麼時候查 quota,團隊什麼時候需要統一模型策略。

閱讀目標:讀完本章,你應該能在不死記價格表的情況下,判斷模型、quota、BYOK 和團隊預算分別該看哪裡。

1. 高波動事實只給查法

模型和用量類問題,先按這個順序核驗:

問題首選來源原因
當前可選模型Windsurf IDE 的 Cascade model selector官方說明這裡最及時
模型單價/額度消耗官方 AI Models / Adaptive / Quota 頁面頁面會隨套餐和計費方式變
當前剩餘額度Windsurf usage meter 或 plan page和個人賬號、團隊賬號繫結
團隊可用模型Admin Portal 的 Models Configuration管理員可按 model 或 provider 過濾
企業計費合同、ACU 或 legacy credits 頁面企業計劃可能和 self-serve 不同

不要在團隊文件裡寫死“某模型永遠最便宜”或“某套餐永遠夠用”。正確寫法是:寫清任務分層和查詢入口。

官方 AI Models 頁面本身會內嵌模型成本資料,但它仍然不是團隊長期文件的硬編碼來源。正確做法是:上線前從 model selector 和官方模型頁核一次,團隊文件只寫“允許的 provider/model、預設模型、預算負責人、超額處理方式”。

2. Adaptive 預設優先

官方模型頁和 Adaptive 頁面都推薦多數使用者使用 Adaptive。Adaptive 是 Cognition 的 intelligent model router:在 model picker 裡選中後,它會根據請求自動選擇底層模型,簡單任務走更輕的模型,複雜任務走更強的模型。

flowchart TD
    Task["開發任務"] --> Adaptive{"預設 Adaptive?"}
    Adaptive -->|日常解釋/小修/測試| Route["自動路由"]
    Adaptive -->|有明確模型需求| Specific["手動選擇指定模型"]
    Route --> Simple["簡單任務:輕量模型"]
    Route --> Complex["複雜任務:更強模型"]
    Specific --> Budget["確認 quota / extra usage / enterprise policy"]
    Budget --> Run["執行並記錄原因"]

    style Adaptive fill:#dbeafe,stroke:#2563eb,stroke-width:2px
    style Budget fill:#fef3c7,stroke:#d97706,stroke-width:2px

適合 Adaptive:

  • 解釋程式碼、定位入口、總結檔案職責。
  • 小範圍 bug 修復。
  • 寫測試和修普通 lint/type 錯。
  • 讓 Cascade 探索專案並形成計劃。

適合指定模型:

  • 複雜架構遷移。
  • 需要特定模型推理能力的任務。
  • 團隊需要可預測的成本和審計口徑。
  • 企業合規要求只允許特定 provider 或模型。

官方 Adaptive 頁面還說明,它的定價依賴 billing plan;2026-05-06 核驗時,頁面列出過一個截至 2026-05-07 的 introductory promotional rate。這個細節說明價格資訊非常高波動,教程不應固化成長期規則。

3. 模型族的穩定理解

官方 AI Models 頁面會列出 Windsurf / Cognition 自有模型,以及 Anthropic、OpenAI、Google 等供應商模型。具體列表變化很快,教程只保留穩定分工。

你不需要背宣傳語,理解分工就夠:

型別穩定職責使用判斷
Adaptive自動選擇底層模型預設選項,適合多數日常任務
SWE agentic coding 模型面向軟體工程任務複雜實現、修復、重構、長任務
Fast / lighter variants更偏速度和成本控制解釋、小改、常規測試和低風險任務
Tab / autocomplete 模型即時補全和跳轉建議編輯器內被動輔助,不替代 Cascade 大任務
Retrieval 模型,例如 SWE-grepcontext retrieval 和 Fast Context找相關程式碼,減少上下文汙染
外部 frontier models特定推理、程式碼或上下文能力只有明確理由時手動指定

真正影響結果的不是“永遠選最強”,而是任務是否有足夠上下文、是否拆得夠小、是否有測試和 diff 審查。

4. BYOK 只適合個人明確管理賬單

官方 AI Models 頁面說明 BYOK(Bring Your Own Key,自帶金鑰——用你自己在模型供應商那裡申請的 API key 付錢給模型,Windsurf 只收訂閱費不收模型費) 只面向 free 和 paid individual users。個人使用者會在 model dropdown 裡看到帶 BYOK 標記的模型;需要在 subscription settings 裡新增 API key。未配置 key 時,使用 BYOK 模型會報錯。

不要在教程裡寫死 BYOK 支援模型清單。它應以官方模型頁和 IDE model dropdown 為準。

BYOK 適合:

  • 你已經有供應商額度。
  • 希望把 Windsurf 訂閱和模型賬單分開。
  • 個人專案需要特定模型。

BYOK 不適合:

  • 團隊要求統一供應商和審計。
  • 你無法監控供應商賬單。
  • key 可能被寫入專案、截圖或日誌。

BYOK 不是省錢開關。它把一部分賬單和金鑰風險轉移到你的模型供應商賬號。不要把 key 寫進專案檔案、教程截圖或 mcp_config.json

5. Quota、extra usage 和 legacy credits

官方 Quota-Based Usage 頁面說明:2026 年 3 月,Windsurf 對 self-serve customers 從 credit-based system(按 prompt 計費——每條請求扣固定積分,模型不同積分倍率不同)切到 quota-based usage system(按用量計費——按你這次請求實際消耗的 token 數算錢,token 越多扣越多;好處是低消耗任務更省錢,壞處是長會話會快速燒 quota)。計劃包含 daily 和 weekly usage allowance,並按模型請求使用的 tokens 計算;free models 不計入 quota。

關鍵機制:

機制官方含義實操影響
daily / weekly quota每日和每週 allowance 自動重新整理長任務要分批,不要一天燒完
token-based cost請求消耗取決於模型和上下文 token少帶無關上下文,能省 quota
extra usagePro、Teams、Max 達到額度後可購買繼續使用要有預算上限和負責人
free limitFree 達到限制後等下一次 reset適合試用,不適合穩定生產工作流
enterprise可能走 ACU、legacy credits 或合同以合同和管理員頁面為準

官方還給出讓 quota 更耐用的建議:指令更精確、移除不必要上下文、 routine tasks 使用 free models、避免不必要長會話、儘量在同一 frontier model 上利用 caching。

深讀:為什麼“繼續對話”也會影響成本

Agentic IDE 的成本不只來自你輸入了幾個字。共享 timeline、編輯器上下文、系統提示、工具呼叫、檔案讀取和輸出 tokens 都會參與計算。長會話會積累更多上下文,跨多檔案任務也會增加 token 使用。

所以商業專案裡要把任務切成可驗證階段。先讓 Cascade 只讀定位,再決定是否繼續;每一階段結束後審 diff 和測試,不要讓一個會話無限擴張。

6. 團隊模型策略

團隊不要讓每個人憑感覺選模型。管理員可以在 Admin Portal 配置模型訪問,官方 Guide for Admins 說明可按 model 或 provider 過濾,且只能同時強制一種 filter 型別;也可以設定預設 Cascade 模型,但使用者在會話中仍可切換到允許的模型。

推薦團隊規則:

任務推薦策略
日常解釋、普通 bug、小改動Adaptive 或團隊預設模型
跨模組重構、複雜架構指定強模型,先計劃後執行
高消耗批次 workflow加 review gate 和預算負責人
合規敏感專案只開放允許 provider / model
培訓和 onboarding禁止死記價格,教 model selector 和 quota page 查法

模型策略最好寫進團隊 onboarding 或專案 AGENTS.md。不是為了限制開發者,而是為了讓成本、合規和任務質量有統一口徑。

7. 使用量排查

當成員反饋“額度掉得太快”時,先按這個順序查:

  1. 是否在長會話裡帶了過多檔案、timeline 或無關上下文。
  2. 是否用 frontier model 做了大量 routine tasks。
  3. 是否頻繁切模型導致快取收益降低。
  4. 是否讓 Cascade 在一個 prompt 內連續 tool calls 和 continue。
  5. 是否啟用了 extra usage,但沒有預算上限。
  6. 是否存在團隊共享賬號、未離職回收或異常自動化。

官方 quota 頁面給出的 token pricing example 說明,同一次看似簡單的 refactor 會包含使用者輸入、共享 timeline、編輯器上下文、系統提示、tool call 輸入、cache read/write 和輸出 tokens。成本排查要看整條 trajectory,不只看使用者最後發了幾個字。

本章自檢

完成本章後,用這 5 個問題檢查:

  1. 當前模型可用性應該在哪裡核驗?
  2. 什麼時候預設 Adaptive,什麼時候手動選模型?
  3. BYOK 的賬單和金鑰風險由誰承擔?
  4. self-serve quota、extra usage、enterprise ACU/credits 的邊界是什麼?
  5. 團隊是否有 usage 異常排查順序?

透過標準:你能為個人和團隊分別寫出一條模型選擇規則,而不是背某一天的價格表。

官方來源

  • AI Models —— 官方模型頁,說明 Adaptive 推薦、model selector、SWE 模型族、BYOK 和最新價格可用性查詢入口。
  • Adaptive —— 官方 Adaptive 頁面,說明智慧路由、選擇入口、pricing 依賴計劃和使用建議。
  • Quota-Based Usage —— 官方 quota 頁面,說明 2026 年 3 月後的 daily/weekly allowance、extra usage、reset 和省用量建議。
  • Plans and Usage —— 官方 plans/usage 頁面,說明 Free、Pro、Max、Teams、Enterprise、usage 檢視和 enterprise credit 邊界。

接下來去哪

本頁目錄