Claude Code vs Codex：终端 AI 编程 Agent 怎么选（2026）

Claude Code 和 Codex CLI 是开发者讨论最多的一对终端 agent。看起来都是「在命令行里跑 AI 帮你写代码」，但用半天就会感到两者是完全不同的物种：

Claude Code 像一个贴身工程师——你打开终端，它就在那儿，盯着这个项目跑，配 CLAUDE.md 做长期记忆。
Codex 像一个受控外包——CLI 只是它的一个入口，它还住在 IDE、网页、桌面 App 和云端，靠 AGENTS.md 跨入口同步任务。

这篇用一个真实 bug 场景模拟两条 agent 的工作差异，再回答订阅哪家的问题。

本章目标：你会按「单兵贴身 vs 多入口受控」的心智模型做选择，而不是只看哪家模型当周跑分高。

1. 同一个 bug，两条 agent 的工作录像

假设场景：你的 Next.js 项目本地 dev 模式跑起来好好的，部署到 Vercel 后首屏挂掉，控制台报「Cannot read properties of undefined (reading 'map')」。你需要 AI 帮你排障。

Claude Code 的工作录像

sequenceDiagram
  participant U as 你
  participant C as Claude Code
  participant Repo as 项目仓库
  U->>C: claude
  C->>Repo: 读 CLAUDE.md / 项目结构 / 最近 git log
  U->>C: "首屏挂掉，报 reading 'map' of undefined，怀疑是 SSR/CSR 不一致"
  C->>C: ultrathink 模式分析
  C->>Repo: grep 引用 .map 的组件
  C->>Repo: 读出嫌疑组件源码
  C->>U: 提议在 X 文件 Y 行加 ?? [] 做兜底，问要不要改
  U->>C: 改
  C->>Repo: 直接 edit 文件
  C->>U: 改完。要不要跑测试？

体验关键词：单线条、贴身、慢工出细活。Claude Code 把你和它锁在一个项目里，从读 CLAUDE.md 到最终改文件，整条 loop 在同一个终端窗口完成。

Codex 的工作录像（同一个 bug）

sequenceDiagram
  participant U as 你
  participant CLI as Codex CLI
  participant Cloud as Codex Cloud
  participant Web as Codex 网页 / App
  participant Repo as 项目仓库
  U->>CLI: codex
  CLI->>Repo: 读 AGENTS.md / sandbox 设定
  U->>CLI: 同上 bug 描述
  CLI->>U: 我要读哪些文件？读完要不要改？等 approval
  U->>CLI: approve read
  CLI->>Repo: 读相关文件
  CLI->>U: 改 X 文件加 ?? [] 兜底，需要 write approval
  U->>CLI: approve write
  CLI->>Repo: 改文件
  Note over U,Cloud: 也可以把同个任务<br/>丢给 Codex Cloud 异步跑
  U->>Cloud: 派同样任务给 Cloud
  Cloud->>Cloud: 在隔离 sandbox 跑
  Cloud->>U: 返回 diff，让你 review

体验关键词：多入口、有 gate、可平行。Codex 把每一步都做成了 approval 闸门（read / write / shell exec / network 都可以分别配置），同时支持把任务异步丢给 Cloud 跑，你回头 review。

同样的 bug，Claude Code 的体验是「跟你坐一起调」，Codex 的体验是「我给你列清单，你逐项授权」。哪个更适合你，看你重视「丝滑」还是「可控」。

2. 心智模型：贴身工程师 vs 受控外包

讲清两个心智模型，下面 4 节就好理解了。

Claude Code 的产品哲学：终端 agent 应该贴着项目跑。你打开终端就进入 agent loop，agent 读 CLAUDE.md 知道这是什么项目，记得你之前讲过的偏好，知道哪些文件不能动。它的边界是「这台机器上、这个项目里」。

Codex 的产品哲学：agent 应该跨入口跑，但每一步都要有 approval。同一个 task 你可以在 CLI 起头、切到 IDE 看 diff、丢给 Cloud 跑长任务、在网页 review 结果——所有入口共享同一份 AGENTS.md 和 sandbox 设定，但每个动作都会回到「你允许吗」的 gate。

这不是「哪个先进」的问题，是两条不同设计哲学：

Claude Code 假设「信任你 vs agent 的搭档关系」，体验更顺滑，但代价是 agent 写文件相对自由（虽然也支持 permissions）。
Codex 假设「agent 默认不可完全信任」，体验有更多 gate，但代价是回到「我要批准什么」的频率更高。

3. 三层硬约束对比：配置 / 沙箱 / 审批

层	Claude Code	Codex
项目记忆	`CLAUDE.md`（项目根 / 父目录 / `~/.claude/CLAUDE.md` 多级合并）	`AGENTS.md`（项目根 / 子目录多级合并）
沙箱档位	`permissions` 字段 + Skills hooks	`read-only` / `workspace-write` / `danger-full-access` 三档
审批模型	`permissions` 控制 tool-level approval（默认询问 / 自动允许 / 拒绝）	`untrusted` / `on-failure` / `on-request` / `never` 四档 approval policy
Skills / Subagents / Hooks	三件套俱全（Skills / Subagents / Hooks），还支持 plugins	三件套俱全（Skills / Subagents / Hooks），生态 1.0 已发布
MCP 支持	一等公民	一等公民
Slash 命令	`/clear` / `/compact` / 用户自定义	`/diff` / `/exec` / 用户自定义

两家在 2025-2026 年的演进路径其实越来越像——都在 Skills + Subagents + Hooks + MCP 上达成共识，差异主要在「approval 默认强度」和「入口数量」两点。

4. 入口数量：1 个 vs 5 个

这是 Codex 跟 Claude Code 拉开的最大差距：

入口	Claude Code	Codex
终端 CLI	✅ 主入口	✅
IDE 扩展	✅ VS Code / JetBrains 扩展	✅ VS Code / Cursor / Windsurf 等
桌面 App	⚠️ macOS / Windows / Linux 版（与 CLI 共享上下文）	✅ macOS / Windows 桌面 App
网页	❌	✅ chatgpt.com / Codex Cloud 入口
Cloud 异步	⚠️ Claude Code Sandbox（GA 中）/ Claude Cowork	✅ Codex Cloud 成熟
GitHub PR	⚠️ Claude Cowork 接 GitHub	✅ Codex GitHub App

Claude Code 也在补入口，但核心心智仍然是「终端为主，其它入口围绕终端工作流」。Codex 的心智是**「五个入口都是一等公民，共享同一个 task」**——你可以在 CLI 起头、桌面 App 跟进、网页 review、Cloud 跑长任务、GitHub 自动合 PR。

如果你的工作流主要在一台机器一个项目里，Claude Code 的「单入口贴身」更舒服。如果你的工作流跨多台机器、多个项目、还要异步跑长任务，Codex 的「多入口共享」是真正的护城河。

5. 价格与订阅入口

两家的价格模型差异更大。

Claude Code

Claude Code 需要 Anthropic 订阅或 API：

档位	月费	包含什么
Pro	$20	Claude Code + Claude Pro 网页/桌面
Max 5×	$100	5 倍 Pro 用量
Max 20×	$200	20 倍 Pro 用量
API	按 token	完全弹性

Anthropic 用「5 小时滚动 + 周限」的双层 quota 模型。Pro 档够个人轻度用，Max 档是日常重度使用者的合理起点。没有真正的「免费档」——必须订阅或买 API credits。

Codex

Codex 走 ChatGPT 订阅或 OpenAI API：

档位	月费	包含什么
Free	$0	限额（Codex CLI / IDE 受限）
Go	$8	ChatGPT Go + Codex 入门额度
Plus	$20	ChatGPT Plus + Codex CLI / IDE / Cloud 全套
Pro	$100	介于 Plus 和 Pro 20× 之间（2026 年 4 月新档位）
Pro 20×	$200	旧 ChatGPT Pro，20 倍用量
Business / Enterprise	议价	组织级 SSO / Audit
API	按 token	完全弹性

Codex 在 2026 年 4 月加了 $100 Pro 中间档，价格分层变化频繁。订阅前必须以 OpenAI Codex 官方页和 Anthropic Claude Code 官方页为准。

性价比对比：同样 $20 / 月，Claude Code 拿到的是 Anthropic Pro 等级体验，Codex 拿到的是 ChatGPT Plus 等级体验。两者的 token 经济不一样，直接比贵贱意义不大。真正决定性价比的是你日常用 Claude 还是 GPT 多——如果你已经在用 Claude 做日常对话，Pro 订阅同时解锁 Claude Code 几乎是白送；同理 Codex 之于 ChatGPT。

6. 两类开发者的推荐

A 类：单兵作战 / 单项目深耕

特征：一台机器、一个主项目、CLI 是日常工作流第一公民、追求顺滑不要 gate。

推荐 Claude Code。Pro $20 / 月起步，重度后升 Max。CLAUDE.md 多级配置是这类用户的最佳工具。

B 类：多项目并行 / 跨机器 / 团队协作

特征：3 个以上项目同时活跃、需要把长任务丢给 Cloud 跑、团队 / 公司有合规要求。

推荐 Codex。Plus $20 起步，重度后升 Pro $100。多入口共享和 approval 闸门在这类场景下是真正的省心。

C 类：写代码占工作 30% 但管 5 个项目的技术 leader

特征：日常更多在 review、planning、答疑，写代码不是主线但要看得懂代码。

推荐 Codex 在 GitHub 上挂 Cloud Agent。让 Codex Cloud 接 issue 自动跑长任务、自己只 review diff。Claude Code 在这个场景下不如 Codex Cloud 自然。

7. 不要选 Claude Code 的理由（fairness）

跨入口工作多：你需要在 IDE、终端、网页、Cloud 之间频繁切换跑同一个任务——Codex 的多入口共享是 Claude Code 短期补不上的。
公司只有 OpenAI 合规白名单：很多企业的合规清单里 OpenAI 已经过审，Anthropic 还在过——直接选 Codex 省合规成本。
想用 ChatGPT 网页 + 终端 agent 共享上下文：Codex 在 chatgpt.com 网页和 Codex CLI 之间共享会话历史，Claude Code 还在补这条路径。

8. 不要选 Codex 的理由

重视「无打扰」流畅体验：Codex 默认 approval 比 Claude Code 多，对于喜欢 agent 自己跑完一个完整任务再回报的人不友好。
不在 OpenAI 生态：你的日常 LLM 调用都在 Anthropic Claude 上，订 ChatGPT Plus 只为 Codex 不划算——直接订 Claude Pro 拿 Claude Code 更顺。
Anthropic 模型口味更对：很多开发者反馈 Claude 在长代码理解和 refactor 上更稳——这是模型层差异，跟产品形态无关。