AI 编程教程中文版
从原理到实战

模型与用量策略

用任务风险、上下文规模、Adaptive 路由、quota 和团队治理来制定 Windsurf 模型使用策略。

Windsurf 的模型策略不要从“哪个模型最强”开始,而要从任务风险开始。解释代码、生成测试、跨模块重构、线上排障和数据操作,不应该共享同一套模型、上下文和终端权限。

官方页面:AI ModelsAdaptiveQuota-Based UsagePlans and Usage

先给结论:个人日常开发默认用 Adaptive;高风险任务固定更强模型并加 Plan gate;团队场景不要让个人 BYOK、无限终端自动执行和不受控 MCP 混在一起。

先按任务分级

模型不是独立决策,它和上下文、工具权限、人工确认一起决定风险。

flowchart TB
    Task["当前任务"] --> Low["低风险:解释 / 搜索 / 文案 / 小补全"]
    Task --> Mid["中风险:单文件修改 / 测试生成 / 小 bug"]
    Task --> High["高风险:跨模块重构 / 鉴权 / 支付 / 数据 / 部署"]
    Low --> L["Adaptive 或 fast model"]
    Mid --> M["Adaptive + 看 diff + 跑测试"]
    High --> H["指定强模型 + Plan gate + 人工确认命令"]

低风险任务看速度。中风险任务看 diff。高风险任务看计划质量、测试证据和回滚路径。

Adaptive 的正确位置

Windsurf 官方把 Adaptive 定位成智能模型路由:在模型选择器里选中 Adaptive 后,Cascade 会按每次请求动态选择底层模型。简单任务走更轻的模型,复杂任务走更强的模型,目标是减少日常手动选模型和不必要的高价模型消耗。

默认用 Adaptive 的场景:

  • 解释一个函数或文件。
  • 找调用链、入口、配置位置。
  • 改一个小范围 bug。
  • 写一组局部测试。
  • 总结错误日志。
  • 让 Cascade 先生成计划或风险清单。

不建议完全交给 Adaptive 的场景:

  • 团队或客户明确规定模型范围。
  • 要复现同一模型行为做 A/B 对比。
  • 大规模迁移需要严格预算和审计。
  • 涉及鉴权、支付、删除数据、生产部署。
  • 你要用某个模型特定的推理能力,而不是让路由自动判断。

不要把模型列表写死

Windsurf 的 AI Models 页面会更新模型、价格和可用性。官方也提示最准确的模型和价格以 IDE 内 Cascade 的 model selector 为准。因此教程里不应该把某一天的完整模型清单当成长期事实。

更稳的记法是按职责分:

  • Adaptive:日常默认路由。
  • SWE 系列:Windsurf/Cognition 面向软件工程的自研模型族。
  • Frontier 模型:高复杂度任务、难推理、跨模块规划。
  • Fast 模型:低风险、频繁、对延迟敏感的请求。
  • BYOK 模型:个人账号自带 key 的补充入口,不是团队合规方案。

这样即使模型名称变化,使用策略也不需要重写。

Quota 现在按用量预算理解

Windsurf 在 2026 年 3 月把旧 credit-based system 迁移到 quota-based usage。现在更适合把它理解成“每日 / 每周用量预算”:每次请求按模型实际 token 消耗计入 quota,不同模型的 token 成本不同;部分 free models 不计入 quota;Pro、Teams、Max 在用完内含额度后可以购买 extra usage 继续使用。

影响用量的因素主要有四个:

  1. 上下文里塞了多少文件和历史对话。
  2. 选用的模型单价和速度配置。
  3. 是否反复让 agent 在长 session 里循环。
  4. 是否命中 prompt caching。

管理 quota 的重点不是月底看账单,而是任务开始前就控制输入规模。

一套实际使用策略

个人开发可以按这个默认值走:

日常理解代码        -> Adaptive
单文件修改          -> Adaptive + diff review
跨文件修改          -> 先 Plan,再继续
生产相关命令        -> 人工确认
预算异常            -> 查 session、上下文和模型选择

团队开发要再加四条规则:

  • 管理员规定哪些模型可用,哪些模型禁用。
  • 高消耗任务必须先拆成 plan、scope、validation 三段。
  • MCP server 先从只读能力接入,写入能力单独审批。
  • 终端自动执行要有 allowlist、denylist 和审计日志。

BYOK 不是省钱开关

BYOK 适合已经有供应商账号、能管理账单和 key 的个人用户。Windsurf 官方说明 BYOK 只面向 individual users 的部分模型入口;如果没有配置 key,选择 BYOK 模型会报错。

启用前先回答三件事:

  1. 账单归谁负责。
  2. key 泄露后怎么吊销和轮换。
  3. 团队是否允许个人 key 进入项目工作流。

如果答不清,不启用。团队场景优先用组织级账户、企业策略和统一审计,而不是每个人往 IDE 里塞自己的 key。

用量异常时怎么查

不要只看“今天用了多少”,要倒查是哪类任务吃掉了预算。

排查顺序:

  1. 打开 usage / quota 页面,确认是否是单日还是单周额度触顶。
  2. 回看最近几个长 session,有没有让 Cascade 反复读大目录或循环跑测试。
  3. 检查是否把日志、构建产物、生成目录、供应商目录放进上下文。
  4. 对大任务改成先读少量文件,确认计划后再逐步扩大范围。
  5. 对高频任务固定一个模型或用 Adaptive,减少频繁切换导致的缓存收益下降。

一旦发现某类任务稳定高消耗,就应该沉淀成 workflow:输入更窄、步骤更短、验证更明确。

模型策略模板

可以直接把这段放进项目规则或团队手册:

Windsurf model policy:
- Default to Adaptive for routine work.
- Use Ask/Plan before editing security, billing, auth, deployment, or data code.
- Do not run destructive shell commands through Cascade without human approval.
- Keep generated files, secrets, build outputs, and vendor directories out of context.
- Use BYOK only for approved individual experiments, never as a team default.
- Review quota weekly and turn repeated high-cost tasks into scoped workflows.

关键判断

强模型不是权限放大的理由。模型越能做事,越要有更清楚的边界:上下文给多少、命令能不能自动跑、MCP 能不能写入、失败后怎么回滚。商业项目里真正可靠的模型策略,是让模型在正确边界内稳定完成任务,而不是让它一次拿到所有文件、所有工具和所有权限。

官方来源

  • AI Models —— 官方模型清单、Adaptive 推荐、SWE 模型族、BYOK 模型入口、最新价格和可用性。
  • Adaptive —— 官方智能模型路由说明、选择入口、pricing 依赖计划。
  • Quota-Based Usage —— 官方 quota 系统、daily / weekly allowance、token-based cost、extra usage、reset 和省用量建议。
  • Plans and Usage —— 官方 5 plans(Free / Pro / Max / Teams / Enterprise)、ACU 与 legacy credits 边界、用量查看入口。

本篇自检

读完后,你应该能回答:

  1. 任务风险分级和模型选择是怎么联动的?
  2. 什么时候默认 Adaptive,什么时候要固定指定模型?
  3. 为什么不要把模型清单写死在团队文档里?
  4. quota-based usage 下,影响用量的 4 个因素是什么?
  5. BYOK 启用前必须回答的三件事是什么?

接下来去哪

本页目录