AI 编程教程中文版
两两对比

Claude Code vs Codex:终端 AI 编程 Agent 怎么选(2026)

Claude Code 和 Codex 都活在终端,但一个是贴身工程师,一个是多入口受控代理。用一个 bug 场景看清差异,再决定订阅哪家。

Claude Code 和 Codex CLI 是开发者讨论最多的一对终端 agent。看起来都是「在命令行里跑 AI 帮你写代码」,但用半天就会感到两者是完全不同的物种:

  • Claude Code 像一个贴身工程师——你打开终端,它就在那儿,盯着这个项目跑,配 CLAUDE.md 做长期记忆。
  • Codex 像一个受控外包——CLI 只是它的一个入口,它还住在 IDE、网页、桌面 App 和云端,靠 AGENTS.md 跨入口同步任务。

这篇用一个真实 bug 场景模拟两条 agent 的工作差异,再回答订阅哪家的问题。

本章目标:你会按「单兵贴身 vs 多入口受控」的心智模型做选择,而不是只看哪家模型当周跑分高。

1. 同一个 bug,两条 agent 的工作录像

假设场景:你的 Next.js 项目本地 dev 模式跑起来好好的,部署到 Vercel 后首屏挂掉,控制台报「Cannot read properties of undefined (reading 'map')」。你需要 AI 帮你排障。

Claude Code 的工作录像

sequenceDiagram
  participant U as 你
  participant C as Claude Code
  participant Repo as 项目仓库
  U->>C: claude
  C->>Repo: 读 CLAUDE.md / 项目结构 / 最近 git log
  U->>C: "首屏挂掉,报 reading 'map' of undefined,怀疑是 SSR/CSR 不一致"
  C->>C: ultrathink 模式分析
  C->>Repo: grep 引用 .map 的组件
  C->>Repo: 读出嫌疑组件源码
  C->>U: 提议在 X 文件 Y 行加 ?? [] 做兜底,问要不要改
  U->>C: 改
  C->>Repo: 直接 edit 文件
  C->>U: 改完。要不要跑测试?

体验关键词:单线条、贴身、慢工出细活。Claude Code 把你和它锁在一个项目里,从读 CLAUDE.md 到最终改文件,整条 loop 在同一个终端窗口完成。

Codex 的工作录像(同一个 bug)

sequenceDiagram
  participant U as 你
  participant CLI as Codex CLI
  participant Cloud as Codex Cloud
  participant Web as Codex 网页 / App
  participant Repo as 项目仓库
  U->>CLI: codex
  CLI->>Repo: 读 AGENTS.md / sandbox 设定
  U->>CLI: 同上 bug 描述
  CLI->>U: 我要读哪些文件?读完要不要改?等 approval
  U->>CLI: approve read
  CLI->>Repo: 读相关文件
  CLI->>U: 改 X 文件加 ?? [] 兜底,需要 write approval
  U->>CLI: approve write
  CLI->>Repo: 改文件
  Note over U,Cloud: 也可以把同个任务<br/>丢给 Codex Cloud 异步跑
  U->>Cloud: 派同样任务给 Cloud
  Cloud->>Cloud: 在隔离 sandbox 跑
  Cloud->>U: 返回 diff,让你 review

体验关键词:多入口、有 gate、可平行。Codex 把每一步都做成了 approval 闸门(read / write / shell exec / network 都可以分别配置),同时支持把任务异步丢给 Cloud 跑,你回头 review。

同样的 bug,Claude Code 的体验是「跟你坐一起调」,Codex 的体验是「我给你列清单,你逐项授权」。哪个更适合你,看你重视「丝滑」还是「可控」。

2. 心智模型:贴身工程师 vs 受控外包

讲清两个心智模型,下面 4 节就好理解了。

Claude Code 的产品哲学:终端 agent 应该贴着项目跑。你打开终端就进入 agent loop,agent 读 CLAUDE.md 知道这是什么项目,记得你之前讲过的偏好,知道哪些文件不能动。它的边界是「这台机器上、这个项目里」。

Codex 的产品哲学:agent 应该跨入口跑,但每一步都要有 approval。同一个 task 你可以在 CLI 起头、切到 IDE 看 diff、丢给 Cloud 跑长任务、在网页 review 结果——所有入口共享同一份 AGENTS.md 和 sandbox 设定,但每个动作都会回到「你允许吗」的 gate。

这不是「哪个先进」的问题,是两条不同设计哲学:

  • Claude Code 假设「信任你 vs agent 的搭档关系」,体验更顺滑,但代价是 agent 写文件相对自由(虽然也支持 permissions)。
  • Codex 假设「agent 默认不可完全信任」,体验有更多 gate,但代价是回到「我要批准什么」的频率更高。

3. 三层硬约束对比:配置 / 沙箱 / 审批

Claude CodeCodex
项目记忆CLAUDE.md(项目根 / 父目录 / ~/.claude/CLAUDE.md 多级合并)AGENTS.md(项目根 / 子目录多级合并)
沙箱档位permissions 字段 + Skills hooksread-only / workspace-write / danger-full-access 三档
审批模型permissions 控制 tool-level approval(默认询问 / 自动允许 / 拒绝)untrusted / on-failure / on-request / never 四档 approval policy
Skills / Subagents / Hooks三件套俱全(Skills / Subagents / Hooks),还支持 plugins三件套俱全(Skills / Subagents / Hooks),生态 1.0 已发布
MCP 支持一等公民一等公民
Slash 命令/clear / /compact / 用户自定义/diff / /exec / 用户自定义

两家在 2025-2026 年的演进路径其实越来越像——都在 Skills + Subagents + Hooks + MCP 上达成共识,差异主要在「approval 默认强度」和「入口数量」两点。

4. 入口数量:1 个 vs 5 个

这是 Codex 跟 Claude Code 拉开的最大差距:

入口Claude CodeCodex
终端 CLI✅ 主入口
IDE 扩展✅ VS Code / JetBrains 扩展✅ VS Code / Cursor / Windsurf 等
桌面 App⚠️ macOS / Windows / Linux 版(与 CLI 共享上下文)✅ macOS / Windows 桌面 App
网页✅ chatgpt.com / Codex Cloud 入口
Cloud 异步⚠️ Claude Code Sandbox(GA 中)/ Claude Cowork✅ Codex Cloud 成熟
GitHub PR⚠️ Claude Cowork 接 GitHub✅ Codex GitHub App

Claude Code 也在补入口,但核心心智仍然是「终端为主,其它入口围绕终端工作流」。Codex 的心智是**「五个入口都是一等公民,共享同一个 task」**——你可以在 CLI 起头、桌面 App 跟进、网页 review、Cloud 跑长任务、GitHub 自动合 PR。

如果你的工作流主要在一台机器一个项目里,Claude Code 的「单入口贴身」更舒服。 如果你的工作流跨多台机器、多个项目、还要异步跑长任务,Codex 的「多入口共享」是真正的护城河。

5. 价格与订阅入口

两家的价格模型差异更大。

Claude Code

Claude Code 需要 Anthropic 订阅或 API:

档位月费包含什么
Pro$20Claude Code + Claude Pro 网页/桌面
Max 5×$1005 倍 Pro 用量
Max 20×$20020 倍 Pro 用量
API按 token完全弹性

Anthropic 用「5 小时滚动 + 周限」的双层 quota 模型。Pro 档够个人轻度用,Max 档是日常重度使用者的合理起点。没有真正的「免费档」——必须订阅或买 API credits。

Codex

Codex 走 ChatGPT 订阅或 OpenAI API:

档位月费包含什么
Free$0限额(Codex CLI / IDE 受限)
Go$8ChatGPT Go + Codex 入门额度
Plus$20ChatGPT Plus + Codex CLI / IDE / Cloud 全套
Pro$100介于 Plus 和 Pro 20× 之间(2026 年 4 月新档位)
Pro 20×$200旧 ChatGPT Pro,20 倍用量
Business / Enterprise议价组织级 SSO / Audit
API按 token完全弹性

Codex 在 2026 年 4 月加了 $100 Pro 中间档,价格分层变化频繁。订阅前必须以 OpenAI Codex 官方页Anthropic Claude Code 官方页 为准。

性价比对比:同样 $20 / 月,Claude Code 拿到的是 Anthropic Pro 等级体验,Codex 拿到的是 ChatGPT Plus 等级体验。两者的 token 经济不一样,直接比贵贱意义不大。真正决定性价比的是你日常用 Claude 还是 GPT 多——如果你已经在用 Claude 做日常对话,Pro 订阅同时解锁 Claude Code 几乎是白送;同理 Codex 之于 ChatGPT。

6. 两类开发者的推荐

A 类:单兵作战 / 单项目深耕

特征:一台机器、一个主项目、CLI 是日常工作流第一公民、追求顺滑不要 gate。

推荐 Claude Code。Pro $20 / 月起步,重度后升 Max。CLAUDE.md 多级配置是这类用户的最佳工具。

B 类:多项目并行 / 跨机器 / 团队协作

特征:3 个以上项目同时活跃、需要把长任务丢给 Cloud 跑、团队 / 公司有合规要求。

推荐 Codex。Plus $20 起步,重度后升 Pro $100。多入口共享和 approval 闸门在这类场景下是真正的省心。

C 类:写代码占工作 30% 但管 5 个项目的技术 leader

特征:日常更多在 review、planning、答疑,写代码不是主线但要看得懂代码。

推荐 Codex 在 GitHub 上挂 Cloud Agent。让 Codex Cloud 接 issue 自动跑长任务、自己只 review diff。Claude Code 在这个场景下不如 Codex Cloud 自然。

7. 不要选 Claude Code 的理由(fairness)

  • 跨入口工作多:你需要在 IDE、终端、网页、Cloud 之间频繁切换跑同一个任务——Codex 的多入口共享是 Claude Code 短期补不上的。
  • 公司只有 OpenAI 合规白名单:很多企业的合规清单里 OpenAI 已经过审,Anthropic 还在过——直接选 Codex 省合规成本。
  • 想用 ChatGPT 网页 + 终端 agent 共享上下文:Codex 在 chatgpt.com 网页和 Codex CLI 之间共享会话历史,Claude Code 还在补这条路径。

8. 不要选 Codex 的理由

  • 重视「无打扰」流畅体验:Codex 默认 approval 比 Claude Code 多,对于喜欢 agent 自己跑完一个完整任务再回报的人不友好。
  • 不在 OpenAI 生态:你的日常 LLM 调用都在 Anthropic Claude 上,订 ChatGPT Plus 只为 Codex 不划算——直接订 Claude Pro 拿 Claude Code 更顺。
  • Anthropic 模型口味更对:很多开发者反馈 Claude 在长代码理解和 refactor 上更稳——这是模型层差异,跟产品形态无关。

9. 常见问题

Q1 · Claude Code 和 Codex 都开,会冲突吗?

不会冲突。两家的 *.md 配置文件不重名(CLAUDE.md vs AGENTS.md),可以共存于同一个项目根目录。但你的注意力只有一份,频繁切换两个 agent 会让上下文撕裂——更可靠的做法是按任务类型分段。

Q2 · Codex 现在的 AGENTS.md 可以被 Claude Code 读吗?

可以,反过来也可以。AGENTS.md 是开放标准,多家 agent(Codex、Claude Code、Cursor、Gemini CLI 等)都在朝它收敛。如果你想一份配置多家用,写在 AGENTS.md 里同时被读取概率最高。

Q3 · Claude Code 没有 Cloud Agent,是劣势吗?

短期是。但 Anthropic 已经推出 Claude Code Sandbox 和 Claude Cowork,2026 年这一块的差距在快速缩小。如果你现在选 Claude Code 又想要 Cloud Agent,可以观察这两个产品的 GA 进度。

Q4 · Codex 的 sandbox 三档具体是什么?

  • read-only:agent 只能读,不能改文件、不能跑命令。
  • workspace-write:agent 可以在工作目录里改文件、跑命令,但默认禁止网络。
  • danger-full-access:agent 完全自由,可以读写任意文件、访问网络。生产环境之外才能用。

详见 Codex 沙箱与审批教程

Q5 · Claude Code 的 permissions 跟 Codex 的 sandbox 是一回事吗?

不完全是。Claude Code 的 permissions 是 tool-level(每个工具单独 allow/ask/deny),Codex 的 sandbox 是 process-level(整体进程的文件 / 网络访问受限)。两层不矛盾,可以同时存在。

10. 选型决策清单

  1. 只有一台主开发机 + 一个主项目 → Yes 倾向 Claude Code。
  2. 我每周至少有 3 次让 agent 异步跑长任务 的需求 → Yes 倾向 Codex。
  3. 日常对话已经在用 Claude 网页或桌面 → Yes 倾向 Claude Code(Pro 订阅捎带)。
  4. 日常对话已经在用 ChatGPT → Yes 倾向 Codex(Plus 订阅捎带)。
  5. 公司 / 合规清单只允许其中一家 → 没得选,按白名单走。

5 题里 ≥ 3 题指向某一边就选那边。完全不确定,先订 ChatGPT Plus $20 / 月 试 30 天 Codex(含 Cloud 异步体验),不行再切 Claude Pro——Codex 的多入口能让你最快摸清自己实际工作流是哪一类。

11. 下一步去哪

本页目录