Claude Code vs Codex:终端 AI 编程 Agent 怎么选(2026)
Claude Code 和 Codex 都活在终端,但一个是贴身工程师,一个是多入口受控代理。用一个 bug 场景看清差异,再决定订阅哪家。
Claude Code 和 Codex CLI 是开发者讨论最多的一对终端 agent。看起来都是「在命令行里跑 AI 帮你写代码」,但用半天就会感到两者是完全不同的物种:
- Claude Code 像一个贴身工程师——你打开终端,它就在那儿,盯着这个项目跑,配
CLAUDE.md做长期记忆。 - Codex 像一个受控外包——CLI 只是它的一个入口,它还住在 IDE、网页、桌面 App 和云端,靠
AGENTS.md跨入口同步任务。
这篇用一个真实 bug 场景模拟两条 agent 的工作差异,再回答订阅哪家的问题。
本章目标:你会按「单兵贴身 vs 多入口受控」的心智模型做选择,而不是只看哪家模型当周跑分高。
1. 同一个 bug,两条 agent 的工作录像
假设场景:你的 Next.js 项目本地 dev 模式跑起来好好的,部署到 Vercel 后首屏挂掉,控制台报「Cannot read properties of undefined (reading 'map')」。你需要 AI 帮你排障。
Claude Code 的工作录像
sequenceDiagram
participant U as 你
participant C as Claude Code
participant Repo as 项目仓库
U->>C: claude
C->>Repo: 读 CLAUDE.md / 项目结构 / 最近 git log
U->>C: "首屏挂掉,报 reading 'map' of undefined,怀疑是 SSR/CSR 不一致"
C->>C: ultrathink 模式分析
C->>Repo: grep 引用 .map 的组件
C->>Repo: 读出嫌疑组件源码
C->>U: 提议在 X 文件 Y 行加 ?? [] 做兜底,问要不要改
U->>C: 改
C->>Repo: 直接 edit 文件
C->>U: 改完。要不要跑测试?
体验关键词:单线条、贴身、慢工出细活。Claude Code 把你和它锁在一个项目里,从读 CLAUDE.md 到最终改文件,整条 loop 在同一个终端窗口完成。
Codex 的工作录像(同一个 bug)
sequenceDiagram
participant U as 你
participant CLI as Codex CLI
participant Cloud as Codex Cloud
participant Web as Codex 网页 / App
participant Repo as 项目仓库
U->>CLI: codex
CLI->>Repo: 读 AGENTS.md / sandbox 设定
U->>CLI: 同上 bug 描述
CLI->>U: 我要读哪些文件?读完要不要改?等 approval
U->>CLI: approve read
CLI->>Repo: 读相关文件
CLI->>U: 改 X 文件加 ?? [] 兜底,需要 write approval
U->>CLI: approve write
CLI->>Repo: 改文件
Note over U,Cloud: 也可以把同个任务<br/>丢给 Codex Cloud 异步跑
U->>Cloud: 派同样任务给 Cloud
Cloud->>Cloud: 在隔离 sandbox 跑
Cloud->>U: 返回 diff,让你 review
体验关键词:多入口、有 gate、可平行。Codex 把每一步都做成了 approval 闸门(read / write / shell exec / network 都可以分别配置),同时支持把任务异步丢给 Cloud 跑,你回头 review。
同样的 bug,Claude Code 的体验是「跟你坐一起调」,Codex 的体验是「我给你列清单,你逐项授权」。哪个更适合你,看你重视「丝滑」还是「可控」。
2. 心智模型:贴身工程师 vs 受控外包
讲清两个心智模型,下面 4 节就好理解了。
Claude Code 的产品哲学:终端 agent 应该贴着项目跑。你打开终端就进入 agent loop,agent 读 CLAUDE.md 知道这是什么项目,记得你之前讲过的偏好,知道哪些文件不能动。它的边界是「这台机器上、这个项目里」。
Codex 的产品哲学:agent 应该跨入口跑,但每一步都要有 approval。同一个 task 你可以在 CLI 起头、切到 IDE 看 diff、丢给 Cloud 跑长任务、在网页 review 结果——所有入口共享同一份 AGENTS.md 和 sandbox 设定,但每个动作都会回到「你允许吗」的 gate。
这不是「哪个先进」的问题,是两条不同设计哲学:
- Claude Code 假设「信任你 vs agent 的搭档关系」,体验更顺滑,但代价是 agent 写文件相对自由(虽然也支持 permissions)。
- Codex 假设「agent 默认不可完全信任」,体验有更多 gate,但代价是回到「我要批准什么」的频率更高。
3. 三层硬约束对比:配置 / 沙箱 / 审批
| 层 | Claude Code | Codex |
|---|---|---|
| 项目记忆 | CLAUDE.md(项目根 / 父目录 / ~/.claude/CLAUDE.md 多级合并) | AGENTS.md(项目根 / 子目录多级合并) |
| 沙箱档位 | permissions 字段 + Skills hooks | read-only / workspace-write / danger-full-access 三档 |
| 审批模型 | permissions 控制 tool-level approval(默认询问 / 自动允许 / 拒绝) | untrusted / on-failure / on-request / never 四档 approval policy |
| Skills / Subagents / Hooks | 三件套俱全(Skills / Subagents / Hooks),还支持 plugins | 三件套俱全(Skills / Subagents / Hooks),生态 1.0 已发布 |
| MCP 支持 | 一等公民 | 一等公民 |
| Slash 命令 | /clear / /compact / 用户自定义 | /diff / /exec / 用户自定义 |
两家在 2025-2026 年的演进路径其实越来越像——都在 Skills + Subagents + Hooks + MCP 上达成共识,差异主要在「approval 默认强度」和「入口数量」两点。
4. 入口数量:1 个 vs 5 个
这是 Codex 跟 Claude Code 拉开的最大差距:
| 入口 | Claude Code | Codex |
|---|---|---|
| 终端 CLI | ✅ 主入口 | ✅ |
| IDE 扩展 | ✅ VS Code / JetBrains 扩展 | ✅ VS Code / Cursor / Windsurf 等 |
| 桌面 App | ⚠️ macOS / Windows / Linux 版(与 CLI 共享上下文) | ✅ macOS / Windows 桌面 App |
| 网页 | ❌ | ✅ chatgpt.com / Codex Cloud 入口 |
| Cloud 异步 | ⚠️ Claude Code Sandbox(GA 中)/ Claude Cowork | ✅ Codex Cloud 成熟 |
| GitHub PR | ⚠️ Claude Cowork 接 GitHub | ✅ Codex GitHub App |
Claude Code 也在补入口,但核心心智仍然是「终端为主,其它入口围绕终端工作流」。Codex 的心智是**「五个入口都是一等公民,共享同一个 task」**——你可以在 CLI 起头、桌面 App 跟进、网页 review、Cloud 跑长任务、GitHub 自动合 PR。
如果你的工作流主要在一台机器一个项目里,Claude Code 的「单入口贴身」更舒服。 如果你的工作流跨多台机器、多个项目、还要异步跑长任务,Codex 的「多入口共享」是真正的护城河。
5. 价格与订阅入口
两家的价格模型差异更大。
Claude Code
Claude Code 需要 Anthropic 订阅或 API:
| 档位 | 月费 | 包含什么 |
|---|---|---|
| Pro | $20 | Claude Code + Claude Pro 网页/桌面 |
| Max 5× | $100 | 5 倍 Pro 用量 |
| Max 20× | $200 | 20 倍 Pro 用量 |
| API | 按 token | 完全弹性 |
Anthropic 用「5 小时滚动 + 周限」的双层 quota 模型。Pro 档够个人轻度用,Max 档是日常重度使用者的合理起点。没有真正的「免费档」——必须订阅或买 API credits。
Codex
Codex 走 ChatGPT 订阅或 OpenAI API:
| 档位 | 月费 | 包含什么 |
|---|---|---|
| Free | $0 | 限额(Codex CLI / IDE 受限) |
| Go | $8 | ChatGPT Go + Codex 入门额度 |
| Plus | $20 | ChatGPT Plus + Codex CLI / IDE / Cloud 全套 |
| Pro | $100 | 介于 Plus 和 Pro 20× 之间(2026 年 4 月新档位) |
| Pro 20× | $200 | 旧 ChatGPT Pro,20 倍用量 |
| Business / Enterprise | 议价 | 组织级 SSO / Audit |
| API | 按 token | 完全弹性 |
Codex 在 2026 年 4 月加了 $100 Pro 中间档,价格分层变化频繁。订阅前必须以 OpenAI Codex 官方页 和 Anthropic Claude Code 官方页 为准。
性价比对比:同样 $20 / 月,Claude Code 拿到的是 Anthropic Pro 等级体验,Codex 拿到的是 ChatGPT Plus 等级体验。两者的 token 经济不一样,直接比贵贱意义不大。真正决定性价比的是你日常用 Claude 还是 GPT 多——如果你已经在用 Claude 做日常对话,Pro 订阅同时解锁 Claude Code 几乎是白送;同理 Codex 之于 ChatGPT。
6. 两类开发者的推荐
A 类:单兵作战 / 单项目深耕
特征:一台机器、一个主项目、CLI 是日常工作流第一公民、追求顺滑不要 gate。
推荐 Claude Code。Pro $20 / 月起步,重度后升 Max。CLAUDE.md 多级配置是这类用户的最佳工具。
B 类:多项目并行 / 跨机器 / 团队协作
特征:3 个以上项目同时活跃、需要把长任务丢给 Cloud 跑、团队 / 公司有合规要求。
推荐 Codex。Plus $20 起步,重度后升 Pro $100。多入口共享和 approval 闸门在这类场景下是真正的省心。
C 类:写代码占工作 30% 但管 5 个项目的技术 leader
特征:日常更多在 review、planning、答疑,写代码不是主线但要看得懂代码。
推荐 Codex 在 GitHub 上挂 Cloud Agent。让 Codex Cloud 接 issue 自动跑长任务、自己只 review diff。Claude Code 在这个场景下不如 Codex Cloud 自然。
7. 不要选 Claude Code 的理由(fairness)
- 跨入口工作多:你需要在 IDE、终端、网页、Cloud 之间频繁切换跑同一个任务——Codex 的多入口共享是 Claude Code 短期补不上的。
- 公司只有 OpenAI 合规白名单:很多企业的合规清单里 OpenAI 已经过审,Anthropic 还在过——直接选 Codex 省合规成本。
- 想用 ChatGPT 网页 + 终端 agent 共享上下文:Codex 在 chatgpt.com 网页和 Codex CLI 之间共享会话历史,Claude Code 还在补这条路径。
8. 不要选 Codex 的理由
- 重视「无打扰」流畅体验:Codex 默认 approval 比 Claude Code 多,对于喜欢 agent 自己跑完一个完整任务再回报的人不友好。
- 不在 OpenAI 生态:你的日常 LLM 调用都在 Anthropic Claude 上,订 ChatGPT Plus 只为 Codex 不划算——直接订 Claude Pro 拿 Claude Code 更顺。
- Anthropic 模型口味更对:很多开发者反馈 Claude 在长代码理解和 refactor 上更稳——这是模型层差异,跟产品形态无关。
9. 常见问题
Q1 · Claude Code 和 Codex 都开,会冲突吗?
不会冲突。两家的 *.md 配置文件不重名(CLAUDE.md vs AGENTS.md),可以共存于同一个项目根目录。但你的注意力只有一份,频繁切换两个 agent 会让上下文撕裂——更可靠的做法是按任务类型分段。
Q2 · Codex 现在的 AGENTS.md 可以被 Claude Code 读吗?
可以,反过来也可以。AGENTS.md 是开放标准,多家 agent(Codex、Claude Code、Cursor、Gemini CLI 等)都在朝它收敛。如果你想一份配置多家用,写在 AGENTS.md 里同时被读取概率最高。
Q3 · Claude Code 没有 Cloud Agent,是劣势吗?
短期是。但 Anthropic 已经推出 Claude Code Sandbox 和 Claude Cowork,2026 年这一块的差距在快速缩小。如果你现在选 Claude Code 又想要 Cloud Agent,可以观察这两个产品的 GA 进度。
Q4 · Codex 的 sandbox 三档具体是什么?
read-only:agent 只能读,不能改文件、不能跑命令。workspace-write:agent 可以在工作目录里改文件、跑命令,但默认禁止网络。danger-full-access:agent 完全自由,可以读写任意文件、访问网络。生产环境之外才能用。
详见 Codex 沙箱与审批教程。
Q5 · Claude Code 的 permissions 跟 Codex 的 sandbox 是一回事吗?
不完全是。Claude Code 的 permissions 是 tool-level(每个工具单独 allow/ask/deny),Codex 的 sandbox 是 process-level(整体进程的文件 / 网络访问受限)。两层不矛盾,可以同时存在。
10. 选型决策清单
- 我只有一台主开发机 + 一个主项目 → Yes 倾向 Claude Code。
- 我每周至少有 3 次让 agent 异步跑长任务 的需求 → Yes 倾向 Codex。
- 我日常对话已经在用 Claude 网页或桌面 → Yes 倾向 Claude Code(Pro 订阅捎带)。
- 我日常对话已经在用 ChatGPT → Yes 倾向 Codex(Plus 订阅捎带)。
- 公司 / 合规清单只允许其中一家 → 没得选,按白名单走。
5 题里 ≥ 3 题指向某一边就选那边。完全不确定,先订 ChatGPT Plus $20 / 月 试 30 天 Codex(含 Cloud 异步体验),不行再切 Claude Pro——Codex 的多入口能让你最快摸清自己实际工作流是哪一类。