模型与用量策略
用任务风险、上下文规模、Adaptive 路由、quota 和团队治理来制定 Windsurf 模型使用策略。
Windsurf 的模型策略不要从“哪个模型最强”开始,而要从任务风险开始。解释代码、生成测试、跨模块重构、线上排障和数据操作,不应该共享同一套模型、上下文和终端权限。
官方页面:AI Models、Adaptive、Quota-Based Usage、Plans and Usage。
先给结论:个人日常开发默认用 Adaptive;高风险任务固定更强模型并加 Plan gate;团队场景不要让个人 BYOK、无限终端自动执行和不受控 MCP 混在一起。
先按任务分级
模型不是独立决策,它和上下文、工具权限、人工确认一起决定风险。
flowchart TB
Task["当前任务"] --> Low["低风险:解释 / 搜索 / 文案 / 小补全"]
Task --> Mid["中风险:单文件修改 / 测试生成 / 小 bug"]
Task --> High["高风险:跨模块重构 / 鉴权 / 支付 / 数据 / 部署"]
Low --> L["Adaptive 或 fast model"]
Mid --> M["Adaptive + 看 diff + 跑测试"]
High --> H["指定强模型 + Plan gate + 人工确认命令"]
低风险任务看速度。中风险任务看 diff。高风险任务看计划质量、测试证据和回滚路径。
Adaptive 的正确位置
Windsurf 官方把 Adaptive 定位成智能模型路由:在模型选择器里选中 Adaptive 后,Cascade 会按每次请求动态选择底层模型。简单任务走更轻的模型,复杂任务走更强的模型,目标是减少日常手动选模型和不必要的高价模型消耗。
默认用 Adaptive 的场景:
- 解释一个函数或文件。
- 找调用链、入口、配置位置。
- 改一个小范围 bug。
- 写一组局部测试。
- 总结错误日志。
- 让 Cascade 先生成计划或风险清单。
不建议完全交给 Adaptive 的场景:
- 团队或客户明确规定模型范围。
- 要复现同一模型行为做 A/B 对比。
- 大规模迁移需要严格预算和审计。
- 涉及鉴权、支付、删除数据、生产部署。
- 你要用某个模型特定的推理能力,而不是让路由自动判断。
不要把模型列表写死
Windsurf 的 AI Models 页面会更新模型、价格和可用性。官方也提示最准确的模型和价格以 IDE 内 Cascade 的 model selector 为准。因此教程里不应该把某一天的完整模型清单当成长期事实。
更稳的记法是按职责分:
- Adaptive:日常默认路由。
- SWE 系列:Windsurf/Cognition 面向软件工程的自研模型族。
- Frontier 模型:高复杂度任务、难推理、跨模块规划。
- Fast 模型:低风险、频繁、对延迟敏感的请求。
- BYOK 模型:个人账号自带 key 的补充入口,不是团队合规方案。
这样即使模型名称变化,使用策略也不需要重写。
Quota 现在按用量预算理解
Windsurf 在 2026 年 3 月把旧 credit-based system 迁移到 quota-based usage。现在更适合把它理解成“每日 / 每周用量预算”:每次请求按模型实际 token 消耗计入 quota,不同模型的 token 成本不同;部分 free models 不计入 quota;Pro、Teams、Max 在用完内含额度后可以购买 extra usage 继续使用。
影响用量的因素主要有四个:
- 上下文里塞了多少文件和历史对话。
- 选用的模型单价和速度配置。
- 是否反复让 agent 在长 session 里循环。
- 是否命中 prompt caching。
管理 quota 的重点不是月底看账单,而是任务开始前就控制输入规模。
一套实际使用策略
个人开发可以按这个默认值走:
日常理解代码 -> Adaptive
单文件修改 -> Adaptive + diff review
跨文件修改 -> 先 Plan,再继续
生产相关命令 -> 人工确认
预算异常 -> 查 session、上下文和模型选择团队开发要再加四条规则:
- 管理员规定哪些模型可用,哪些模型禁用。
- 高消耗任务必须先拆成 plan、scope、validation 三段。
- MCP server 先从只读能力接入,写入能力单独审批。
- 终端自动执行要有 allowlist、denylist 和审计日志。
BYOK 不是省钱开关
BYOK 适合已经有供应商账号、能管理账单和 key 的个人用户。Windsurf 官方说明 BYOK 只面向 individual users 的部分模型入口;如果没有配置 key,选择 BYOK 模型会报错。
启用前先回答三件事:
- 账单归谁负责。
- key 泄露后怎么吊销和轮换。
- 团队是否允许个人 key 进入项目工作流。
如果答不清,不启用。团队场景优先用组织级账户、企业策略和统一审计,而不是每个人往 IDE 里塞自己的 key。
用量异常时怎么查
不要只看“今天用了多少”,要倒查是哪类任务吃掉了预算。
排查顺序:
- 打开 usage / quota 页面,确认是否是单日还是单周额度触顶。
- 回看最近几个长 session,有没有让 Cascade 反复读大目录或循环跑测试。
- 检查是否把日志、构建产物、生成目录、供应商目录放进上下文。
- 对大任务改成先读少量文件,确认计划后再逐步扩大范围。
- 对高频任务固定一个模型或用 Adaptive,减少频繁切换导致的缓存收益下降。
一旦发现某类任务稳定高消耗,就应该沉淀成 workflow:输入更窄、步骤更短、验证更明确。
模型策略模板
可以直接把这段放进项目规则或团队手册:
Windsurf model policy:
- Default to Adaptive for routine work.
- Use Ask/Plan before editing security, billing, auth, deployment, or data code.
- Do not run destructive shell commands through Cascade without human approval.
- Keep generated files, secrets, build outputs, and vendor directories out of context.
- Use BYOK only for approved individual experiments, never as a team default.
- Review quota weekly and turn repeated high-cost tasks into scoped workflows.关键判断
强模型不是权限放大的理由。模型越能做事,越要有更清楚的边界:上下文给多少、命令能不能自动跑、MCP 能不能写入、失败后怎么回滚。商业项目里真正可靠的模型策略,是让模型在正确边界内稳定完成任务,而不是让它一次拿到所有文件、所有工具和所有权限。
官方来源
- AI Models —— 官方模型清单、Adaptive 推荐、SWE 模型族、BYOK 模型入口、最新价格和可用性。
- Adaptive —— 官方智能模型路由说明、选择入口、pricing 依赖计划。
- Quota-Based Usage —— 官方 quota 系统、daily / weekly allowance、token-based cost、extra usage、reset 和省用量建议。
- Plans and Usage —— 官方 5 plans(Free / Pro / Max / Teams / Enterprise)、ACU 与 legacy credits 边界、用量查看入口。
本篇自检
读完后,你应该能回答:
- 任务风险分级和模型选择是怎么联动的?
- 什么时候默认 Adaptive,什么时候要固定指定模型?
- 为什么不要把模型清单写死在团队文档里?
- quota-based usage 下,影响用量的 4 个因素是什么?
- BYOK 启用前必须回答的三件事是什么?