模型、Adaptive、BYOK 与用量

📖 本篇术语速查表

英文 / 缩写	中文	一句话解释
Models	模型	Windsurf 可用的模型。
Usage	用量	消耗和配额。
选型	choose	按任务和成本选。

不想读完？把下面这段提示词丢给 AI 帮你跑完——帮你给 Windsurf 选对模型并控住用量。

你是 Windsurf 模型用量顾问。

【角色】
Windsurf 模型用量顾问，按最小够用、安全优先的原则给可落地方案，每条结论都落到能照做的具体步骤或示例，不停留在「建议」「考虑一下」这类空泛表述。

【输入】
- 我的任务类型：___
- 偏好成本 / 速度 / 质量：___
- 用量预算：___
- 是否多任务混用：___
- 经验水平：___

【工作流程】
1. 梳理可用模型
2. 按任务给选型
3. 说明用量怎么算
4. 给成本控制
5. 给验证

【输出规范】
▌一、可用模型
▌二、选型
▌三、用量计算
▌四、成本控制 + 验证

【硬约束】
- 按任务选模型
- 简单任务用便宜的
- 配额 / 价格以官方为准
- 不要替我臆测情况或编造不存在的功能，信息不全先问清
- 不确定的配置或接口一律以官方文档为准，禁止照搬过时写法
- 给的每条结论都要落到具体可照做的步骤或示例，不停留在「建议」「考虑一下」这类没法直接执行的空泛表述

Windsurf 的模型、用量和价格变化很快。官方 AI Models 页面也明确提示：最新 pricing 和 availability 要以 Windsurf IDE 里 Cascade 的 model selector 为准（model selector 在哪：打开 Cascade 面板，输入框下方有一个模型下拉菜单，那里实时列出当前可用模型 + 价格）。教程只能讲稳定机制，不能把某一天的模型表当成长期事实。

本章的重点是建立选型边界：什么时候默认 Adaptive，什么时候指定模型，什么时候启用 BYOK，什么时候查 quota，团队什么时候需要统一模型策略。

阅读目标：读完本章，你应该能在不死记价格表的情况下，判断模型、quota、BYOK 和团队预算分别该看哪里。

1. 高波动事实只给查法

模型和用量类问题，先按这个顺序核验：

问题	首选来源	原因
当前可选模型	Windsurf IDE 的 Cascade model selector	官方说明这里最及时
模型单价/额度消耗	官方 AI Models / Adaptive / Quota 页面	页面会随套餐和计费方式变
当前剩余额度	Windsurf usage meter 或 plan page	和个人账号、团队账号绑定
团队可用模型	Admin Portal 的 Models Configuration	管理员可按 model 或 provider 过滤
企业计费	合同、ACU 或 legacy credits 页面	企业计划可能和 self-serve 不同

不要在团队文档里写死“某模型永远最便宜”或“某套餐永远够用”。正确写法是：写清任务分层和查询入口。

官方 AI Models 页面本身会内嵌模型成本数据，但它仍然不是团队长期文档的硬编码来源。正确做法是：上线前从 model selector 和官方模型页核一次，团队文档只写“允许的 provider/model、默认模型、预算负责人、超额处理方式”。

2. Adaptive 默认优先

官方模型页和 Adaptive 页面都推荐多数用户使用 Adaptive。Adaptive 是 Cognition 的 intelligent model router：在 model picker 里选中后，它会根据请求自动选择底层模型，简单任务走更轻的模型，复杂任务走更强的模型。

flowchart TD
    Task["开发任务"] --> Adaptive{"默认 Adaptive?"}
    Adaptive -->|日常解释/小修/测试| Route["自动路由"]
    Adaptive -->|有明确模型需求| Specific["手动选择指定模型"]
    Route --> Simple["简单任务：轻量模型"]
    Route --> Complex["复杂任务：更强模型"]
    Specific --> Budget["确认 quota / extra usage / enterprise policy"]
    Budget --> Run["执行并记录原因"]

    style Adaptive fill:#dbeafe,stroke:#2563eb,stroke-width:2px
    style Budget fill:#fef3c7,stroke:#d97706,stroke-width:2px

适合 Adaptive：

解释代码、定位入口、总结文件职责。
小范围 bug 修复。
写测试和修普通 lint/type 错。
让 Cascade 探索项目并形成计划。

适合指定模型：

复杂架构迁移。
需要特定模型推理能力的任务。
团队需要可预测的成本和审计口径。
企业合规要求只允许特定 provider 或模型。

官方 Adaptive 页面还说明，它的定价依赖 billing plan；2026-05-06 核验时，页面列出过一个截至 2026-05-07 的 introductory promotional rate。这个细节说明价格信息非常高波动，教程不应固化成长期规则。

3. 模型族的稳定理解

官方 AI Models 页面会列出 Windsurf / Cognition 自有模型，以及 Anthropic、OpenAI、Google 等供应商模型。具体列表变化很快，教程只保留稳定分工。

你不需要背宣传语，理解分工就够：

类型	稳定职责	使用判断
Adaptive	自动选择底层模型	默认选项，适合多数日常任务
SWE agentic coding 模型	面向软件工程任务	复杂实现、修复、重构、长任务
Fast / lighter variants	更偏速度和成本控制	解释、小改、常规测试和低风险任务
Tab / autocomplete 模型	实时补全和跳转建议	编辑器内被动辅助，不替代 Cascade 大任务
Retrieval 模型，例如 SWE-grep	context retrieval 和 Fast Context	找相关代码，减少上下文污染
外部 frontier models	特定推理、代码或上下文能力	只有明确理由时手动指定

真正影响结果的不是“永远选最强”，而是任务是否有足够上下文、是否拆得够小、是否有测试和 diff 审查。

4. BYOK 只适合个人明确管理账单

官方 AI Models 页面说明 BYOK（Bring Your Own Key，自带密钥——用你自己在模型供应商那里申请的 API key 付钱给模型，Windsurf 只收订阅费不收模型费） 只面向 free 和 paid individual users。个人用户会在 model dropdown 里看到带 BYOK 标记的模型；需要在 subscription settings 里添加 API key。未配置 key 时，使用 BYOK 模型会报错。

不要在教程里写死 BYOK 支持模型清单。它应以官方模型页和 IDE model dropdown 为准。

BYOK 适合：

你已经有供应商额度。
希望把 Windsurf 订阅和模型账单分开。
个人项目需要特定模型。

BYOK 不适合：

团队要求统一供应商和审计。
你无法监控供应商账单。
key 可能被写入项目、截图或日志。

BYOK 不是省钱开关。它把一部分账单和密钥风险转移到你的模型供应商账号。不要把 key 写进项目文件、教程截图或 mcp_config.json。

5. Quota、extra usage 和 legacy credits

官方 Quota-Based Usage 页面说明：2026 年 3 月，Windsurf 对 self-serve customers 从 credit-based system（按 prompt 计费——每条请求扣固定积分，模型不同积分倍率不同）切到 quota-based usage system（按用量计费——按你这次请求实际消耗的 token 数算钱，token 越多扣越多；好处是低消耗任务更省钱，坏处是长会话会快速烧 quota）。计划包含 daily 和 weekly usage allowance，并按模型请求使用的 tokens 计算；free models 不计入 quota。

关键机制：

机制	官方含义	实操影响
daily / weekly quota	每日和每周 allowance 自动刷新	长任务要分批，不要一天烧完
token-based cost	请求消耗取决于模型和上下文 token	少带无关上下文，能省 quota
extra usage	Pro、Teams、Max 达到额度后可购买继续使用	要有预算上限和负责人
free limit	Free 达到限制后等下一次 reset	适合试用，不适合稳定生产工作流
enterprise	可能走 ACU、legacy credits 或合同	以合同和管理员页面为准

官方还给出让 quota 更耐用的建议：指令更精确、移除不必要上下文、 routine tasks 使用 free models、避免不必要长会话、尽量在同一 frontier model 上利用 caching。

深读：为什么“继续对话”也会影响成本

Agentic IDE 的成本不只来自你输入了几个字。共享 timeline、编辑器上下文、系统提示、工具调用、文件读取和输出 tokens 都会参与计算。长会话会积累更多上下文，跨多文件任务也会增加 token 使用。

所以商业项目里要把任务切成可验证阶段。先让 Cascade 只读定位，再决定是否继续；每一阶段结束后审 diff 和测试，不要让一个会话无限扩张。

6. 团队模型策略

团队不要让每个人凭感觉选模型。管理员可以在 Admin Portal 配置模型访问，官方 Guide for Admins 说明可按 model 或 provider 过滤，且只能同时强制一种 filter 类型；也可以设置默认 Cascade 模型，但用户在会话中仍可切换到允许的模型。

推荐团队规则：

任务	推荐策略
日常解释、普通 bug、小改动	Adaptive 或团队默认模型
跨模块重构、复杂架构	指定强模型，先计划后执行
高消耗批量 workflow	加 review gate 和预算负责人
合规敏感项目	只开放允许 provider / model
培训和 onboarding	禁止死记价格，教 model selector 和 quota page 查法

模型策略最好写进团队 onboarding 或项目 AGENTS.md。不是为了限制开发者，而是为了让成本、合规和任务质量有统一口径。

7. 使用量排查

当成员反馈“额度掉得太快”时，先按这个顺序查：

是否在长会话里带了过多文件、timeline 或无关上下文。
是否用 frontier model 做了大量 routine tasks。
是否频繁切模型导致缓存收益降低。
是否让 Cascade 在一个 prompt 内连续 tool calls 和 continue。
是否启用了 extra usage，但没有预算上限。
是否存在团队共享账号、未离职回收或异常自动化。

官方 quota 页面给出的 token pricing example 说明，同一次看似简单的 refactor 会包含用户输入、共享 timeline、编辑器上下文、系统提示、tool call 输入、cache read/write 和输出 tokens。成本排查要看整条 trajectory，不只看用户最后发了几个字。

本章自检

完成本章后，用这 5 个问题检查：

当前模型可用性应该在哪里核验？
什么时候默认 Adaptive，什么时候手动选模型？
BYOK 的账单和密钥风险由谁承担？
self-serve quota、extra usage、enterprise ACU/credits 的边界是什么？
团队是否有 usage 异常排查顺序？

通过标准：你能为个人和团队分别写出一条模型选择规则，而不是背某一天的价格表。

官方来源

AI Models —— 官方模型页，说明 Adaptive 推荐、model selector、SWE 模型族、BYOK 和最新价格可用性查询入口。
Adaptive —— 官方 Adaptive 页面，说明智能路由、选择入口、pricing 依赖计划和使用建议。
Quota-Based Usage —— 官方 quota 页面，说明 2026 年 3 月后的 daily/weekly allowance、extra usage、reset 和省用量建议。
Plans and Usage —— 官方 plans/usage 页面，说明 Free、Pro、Max、Teams、Enterprise、usage 查看和 enterprise credit 边界。