模型与用量策略

📖 本篇术语速查表

英文 / 缩写	中文	一句话解释
Models	模型	Windsurf 可用的模型。
Usage	用量	消耗和配额。
选型	choose	按任务和成本选。

不想读完？把下面这段提示词丢给 AI 帮你跑完——帮你给 Windsurf 规划模型选型和用量策略。

你是 Windsurf 模型用量顾问。

【角色】
Windsurf 模型用量顾问，按最小够用、安全优先的原则给可落地方案，每条结论都落到能照做的具体步骤或示例，不停留在「建议」「考虑一下」这类空泛表述。

【输入】
- 我的任务类型：___
- 偏好成本 / 速度 / 质量：___
- 用量预算：___
- 是否多任务混用：___
- 经验水平：___

【工作流程】
1. 梳理任务对模型的要求
2. 按取舍给选型
3. 说明用量怎么算
4. 给成本控制
5. 给验证

【输出规范】
▌一、任务要求
▌二、选型
▌三、用量计算
▌四、成本控制 + 验证

【硬约束】
- 按任务选模型
- 简单任务用便宜的
- 配额 / 价格以官方为准
- 不要替我臆测情况或编造不存在的功能，信息不全先问清
- 不确定的配置或接口一律以官方文档为准，禁止照搬过时写法
- 给的每条结论都要落到具体可照做的步骤或示例，不停留在「建议」「考虑一下」这类没法直接执行的空泛表述

Windsurf 的模型策略不要从“哪个模型最强”开始，而要从任务风险开始。解释代码、生成测试、跨模块重构、线上排障和数据操作，不应该共享同一套模型、上下文和终端权限。

官方页面：AI Models、Adaptive、Quota-Based Usage、Plans and Usage。

先给结论：个人日常开发默认用 Adaptive；高风险任务固定更强模型并加 Plan gate；团队场景不要让个人 BYOK、无限终端自动执行和不受控 MCP 混在一起。

先按任务分级

模型不是独立决策，它和上下文、工具权限、人工确认一起决定风险。

flowchart TB
    Task["当前任务"] --> Low["低风险：解释 / 搜索 / 文案 / 小补全"]
    Task --> Mid["中风险：单文件修改 / 测试生成 / 小 bug"]
    Task --> High["高风险：跨模块重构 / 鉴权 / 支付 / 数据 / 部署"]
    Low --> L["Adaptive 或 fast model"]
    Mid --> M["Adaptive + 看 diff + 跑测试"]
    High --> H["指定强模型 + Plan gate + 人工确认命令"]

低风险任务看速度。中风险任务看 diff。高风险任务看计划质量、测试证据和回滚路径。

Adaptive 的正确位置

Windsurf 官方把 Adaptive 定位成智能模型路由：在模型选择器里选中 Adaptive 后，Cascade 会按每次请求动态选择底层模型。简单任务走更轻的模型，复杂任务走更强的模型，目标是减少日常手动选模型和不必要的高价模型消耗。

默认用 Adaptive 的场景：

解释一个函数或文件。
找调用链、入口、配置位置。
改一个小范围 bug。
写一组局部测试。
总结错误日志。
让 Cascade 先生成计划或风险清单。

不建议完全交给 Adaptive 的场景：

团队或客户明确规定模型范围。
要复现同一模型行为做 A/B 对比。
大规模迁移需要严格预算和审计。
涉及鉴权、支付、删除数据、生产部署。
你要用某个模型特定的推理能力，而不是让路由自动判断。

不要把模型列表写死

Windsurf 的 AI Models 页面会更新模型、价格和可用性。官方也提示最准确的模型和价格以 IDE 内 Cascade 的 model selector 为准。因此教程里不应该把某一天的完整模型清单当成长期事实。

更稳的记法是按职责分：

Adaptive：日常默认路由。
SWE 系列：Windsurf/Cognition 面向软件工程的自研模型族。
Frontier 模型：高复杂度任务、难推理、跨模块规划。
Fast 模型：低风险、频繁、对延迟敏感的请求。
BYOK 模型：个人账号自带 key 的补充入口，不是团队合规方案。

这样即使模型名称变化，使用策略也不需要重写。

Windsurf 在 2026 年 3 月把旧 credit-based system 迁移到 quota-based usage。现在更适合把它理解成“每日 / 每周用量预算”：每次请求按模型实际 token 消耗计入 quota，不同模型的 token 成本不同；部分 free models 不计入 quota；Pro、Teams、Max 在用完内含额度后可以购买 extra usage 继续使用。

影响用量的因素主要有四个：

上下文里塞了多少文件和历史对话。
选用的模型单价和速度配置。
是否反复让 agent 在长 session 里循环。
是否命中 prompt caching。

管理 quota 的重点不是月底看账单，而是任务开始前就控制输入规模。

一套实际使用策略

个人开发可以按这个默认值走：

日常理解代码        -> Adaptive
单文件修改          -> Adaptive + diff review
跨文件修改          -> 先 Plan，再继续
生产相关命令        -> 人工确认
预算异常            -> 查 session、上下文和模型选择

团队开发要再加四条规则：

管理员规定哪些模型可用，哪些模型禁用。
高消耗任务必须先拆成 plan、scope、validation 三段。
MCP server 先从只读能力接入，写入能力单独审批。
终端自动执行要有 allowlist、denylist 和审计日志。

BYOK 不是省钱开关

BYOK 适合已经有供应商账号、能管理账单和 key 的个人用户。Windsurf 官方说明 BYOK 只面向 individual users 的部分模型入口；如果没有配置 key，选择 BYOK 模型会报错。

启用前先回答三件事：

账单归谁负责。
key 泄露后怎么吊销和轮换。
团队是否允许个人 key 进入项目工作流。

如果答不清，不启用。团队场景优先用组织级账户、企业策略和统一审计，而不是每个人往 IDE 里塞自己的 key。

用量异常时怎么查

不要只看“今天用了多少”，要倒查是哪类任务吃掉了预算。

排查顺序：

打开 usage / quota 页面，确认是否是单日还是单周额度触顶。
回看最近几个长 session，有没有让 Cascade 反复读大目录或循环跑测试。
检查是否把日志、构建产物、生成目录、供应商目录放进上下文。
对大任务改成先读少量文件，确认计划后再逐步扩大范围。
对高频任务固定一个模型或用 Adaptive，减少频繁切换导致的缓存收益下降。

一旦发现某类任务稳定高消耗，就应该沉淀成 workflow：输入更窄、步骤更短、验证更明确。

模型策略模板

可以直接把这段放进项目规则或团队手册：

Windsurf model policy:
- Default to Adaptive for routine work.
- Use Ask/Plan before editing security, billing, auth, deployment, or data code.
- Do not run destructive shell commands through Cascade without human approval.
- Keep generated files, secrets, build outputs, and vendor directories out of context.
- Use BYOK only for approved individual experiments, never as a team default.
- Review quota weekly and turn repeated high-cost tasks into scoped workflows.

关键判断

强模型不是权限放大的理由。模型越能做事，越要有更清楚的边界：上下文给多少、命令能不能自动跑、MCP 能不能写入、失败后怎么回滚。商业项目里真正可靠的模型策略，是让模型在正确边界内稳定完成任务，而不是让它一次拿到所有文件、所有工具和所有权限。

官方来源

AI Models —— 官方模型清单、Adaptive 推荐、SWE 模型族、BYOK 模型入口、最新价格和可用性。
Adaptive —— 官方智能模型路由说明、选择入口、pricing 依赖计划。
Quota-Based Usage —— 官方 quota 系统、daily / weekly allowance、token-based cost、extra usage、reset 和省用量建议。
Plans and Usage —— 官方 5 plans（Free / Pro / Max / Teams / Enterprise）、ACU 与 legacy credits 边界、用量查看入口。

本篇自检

读完后，你应该能回答：

任务风险分级和模型选择是怎么联动的？
什么时候默认 Adaptive，什么时候要固定指定模型？
为什么不要把模型清单写死在团队文档里？
quota-based usage 下，影响用量的 4 个因素是什么？
BYOK 启用前必须回答的三件事是什么？

模型与用量策略

先按任务分级

Adaptive 的正确位置

不要把模型列表写死

Quota 现在按用量预算理解

一套实际使用策略

BYOK 不是省钱开关

用量异常时怎么查

模型策略模板

关键判断

官方来源

本篇自检

接下来去哪

上下文 / Rules / AGENTS.md

MCP / Skills / Workflows

终端命令安全

官方 Models

官方团队治理

Understanding 总览

本页目录