Claude Code vs Codex:終端 AI 程式設計 Agent 怎麼選(2026)
Claude Code 和 Codex 都活在終端,但一個是貼身工程師,一個是多入口受控代理。用一個 bug 場景看清差異,再決定訂閱哪家。
Claude Code 和 Codex CLI 是開發者討論最多的一對終端 agent。看起來都是「在命令列裡跑 AI 幫你寫程式碼」,但用半天就會感到兩者是完全不同的物種:
- Claude Code 像一個貼身工程師——你開啟終端,它就在那兒,盯著這個專案跑,配
CLAUDE.md做長期記憶。 - Codex 像一個受控外包——CLI 只是它的一個入口,它還住在 IDE、網頁、桌面 App 和雲端,靠
AGENTS.md跨入口同步任務。
這篇用一個真實 bug 場景模擬兩條 agent 的工作差異,再回答訂閱哪家的問題。
本章目標:你會按「單兵貼身 vs 多入口受控」的心智模型做選擇,而不是隻看哪家模型當週跑分高。
1. 同一個 bug,兩條 agent 的工作錄影
假設場景:你的 Next.js 專案本地 dev 模式跑起來好好的,部署到 Vercel 後首屏掛掉,控制台報「Cannot read properties of undefined (reading 'map')」。你需要 AI 幫你排障。
Claude Code 的工作錄影
sequenceDiagram
participant U as 你
participant C as Claude Code
participant Repo as 專案儲存庫
U->>C: claude
C->>Repo: 讀 CLAUDE.md / 專案結構 / 最近 git log
U->>C: "首屏掛掉,報 reading 'map' of undefined,懷疑是 SSR/CSR 不一致"
C->>C: ultrathink 模式分析
C->>Repo: grep 引用 .map 的元件
C->>Repo: 讀出嫌疑元件原始碼
C->>U: 提議在 X 檔案 Y 行加 ?? [] 做兜底,問要不要改
U->>C: 改
C->>Repo: 直接 edit 檔案
C->>U: 改完。要不要跑測試?
體驗關鍵詞:單線條、貼身、慢工出細活。Claude Code 把你和它鎖在一個專案裡,從讀 CLAUDE.md 到最終改檔案,整條 loop 在同一個終端視窗完成。
Codex 的工作錄影(同一個 bug)
sequenceDiagram
participant U as 你
participant CLI as Codex CLI
participant Cloud as Codex Cloud
participant Web as Codex 網頁 / App
participant Repo as 專案儲存庫
U->>CLI: codex
CLI->>Repo: 讀 AGENTS.md / sandbox 設定
U->>CLI: 同上 bug 描述
CLI->>U: 我要讀哪些檔案?讀完要不要改?等 approval
U->>CLI: approve read
CLI->>Repo: 讀相關檔案
CLI->>U: 改 X 檔案加 ?? [] 兜底,需要 write approval
U->>CLI: approve write
CLI->>Repo: 改檔案
Note over U,Cloud: 也可以把同個任務<br/>丟給 Codex Cloud 非同步跑
U->>Cloud: 派同樣任務給 Cloud
Cloud->>Cloud: 在隔離 sandbox 跑
Cloud->>U: 返回 diff,讓你 review
體驗關鍵詞:多入口、有 gate、可平行。Codex 把每一步都做成了 approval 閘門(read / write / shell exec / network 都可以分別設定),同時支援把任務非同步丟給 Cloud 跑,你回頭 review。
同樣的 bug,Claude Code 的體驗是「跟你坐一起調」,Codex 的體驗是「我給你列清單,你逐項授權」。哪個更適合你,看你重視「絲滑」還是「可控」。
2. 心智模型:貼身工程師 vs 受控外包
講清兩個心智模型,下面 4 節就好理解了。
Claude Code 的產品哲學:終端 agent 應該貼著專案跑。你開啟終端就進入 agent loop,agent 讀 CLAUDE.md 知道這是什麼專案,記得你之前講過的偏好,知道哪些檔案不能動。它的邊界是「這臺機器上、這個專案裡」。
Codex 的產品哲學:agent 應該跨入口跑,但每一步都要有 approval。同一個 task 你可以在 CLI 起頭、切到 IDE 看 diff、丟給 Cloud 跑長任務、在網頁 review 結果——所有入口共享同一份 AGENTS.md 和 sandbox 設定,但每個動作都會回到「你允許嗎」的 gate。
這不是「哪個先進」的問題,是兩條不同設計哲學:
- Claude Code 假設「信任你 vs agent 的搭檔關係」,體驗更順滑,但代價是 agent 寫檔案相對自由(雖然也支援 permissions)。
- Codex 假設「agent 預設不可完全信任」,體驗有更多 gate,但代價是回到「我要批准什麼」的頻率更高。
3. 三層硬約束對比:設定 / 沙箱 / 審批
| 層 | Claude Code | Codex |
|---|---|---|
| 專案記憶 | CLAUDE.md(專案根 / 父目錄 / ~/.claude/CLAUDE.md 多級合併) | AGENTS.md(專案根 / 子目錄多級合併) |
| 沙箱檔位 | permissions 欄位 + Skills hooks | read-only / workspace-write / danger-full-access 三檔 |
| 審批模型 | permissions 控制 tool-level approval(預設詢問 / 自動允許 / 拒絕) | untrusted / on-failure / on-request / never 四檔 approval policy |
| Skills / Subagents / Hooks | 三件套俱全(Skills / Subagents / Hooks),還支援 plugins | 三件套俱全(Skills / Subagents / Hooks),生態 1.0 已釋出 |
| MCP 支援 | 一等公民 | 一等公民 |
| Slash 命令 | /clear / /compact / 使用者自定義 | /diff / /exec / 使用者自定義 |
兩家在 2025-2026 年的演進路徑其實越來越像——都在 Skills + Subagents + Hooks + MCP 上達成共識,差異主要在「approval 預設強度」和「入口數量」兩點。
4. 入口數量:1 個 vs 5 個
這是 Codex 跟 Claude Code 拉開的最大差距:
| 入口 | Claude Code | Codex |
|---|---|---|
| 終端 CLI | ✅ 主入口 | ✅ |
| IDE 擴充套件 | ✅ VS Code / JetBrains 擴充套件 | ✅ VS Code / Cursor / Windsurf 等 |
| 桌面 App | ⚠️ macOS / Windows / Linux 版(與 CLI 共享上下文) | ✅ macOS / Windows 桌面 App |
| 網頁 | ❌ | ✅ chatgpt.com / Codex Cloud 入口 |
| Cloud 非同步 | ⚠️ Claude Code Sandbox(GA 中)/ Claude Cowork | ✅ Codex Cloud 成熟 |
| GitHub PR | ⚠️ Claude Cowork 接 GitHub | ✅ Codex GitHub App |
Claude Code 也在補入口,但核心心智仍然是「終端為主,其它入口圍繞終端工作流」。Codex 的心智是**「五個入口都是一等公民,共享同一個 task」**——你可以在 CLI 起頭、桌面 App 跟進、網頁 review、Cloud 跑長任務、GitHub 自動合 PR。
如果你的工作流主要在一臺機器一個專案裡,Claude Code 的「單入口貼身」更舒服。 如果你的工作流跨多臺機器、多個專案、還要非同步跑長任務,Codex 的「多入口共享」是真正的護城河。
5. 價格與訂閱入口
兩家的價格模型差異更大。
Claude Code
Claude Code 需要 Anthropic 訂閱或 API:
| 檔位 | 月費 | 包含什麼 |
|---|---|---|
| Pro | $20 | Claude Code + Claude Pro 網頁/桌面 |
| Max 5× | $100 | 5 倍 Pro 用量 |
| Max 20× | $200 | 20 倍 Pro 用量 |
| API | 按 token | 完全彈性 |
Anthropic 用「5 小時滾動 + 周限」的雙層 quota 模型。Pro 檔夠個人輕度用,Max 檔是日常重度使用者的合理起點。沒有真正的「免費檔」——必須訂閱或買 API credits。
Codex
Codex 走 ChatGPT 訂閱或 OpenAI API:
| 檔位 | 月費 | 包含什麼 |
|---|---|---|
| Free | $0 | 限額(Codex CLI / IDE 受限) |
| Go | $8 | ChatGPT Go + Codex 入門額度 |
| Plus | $20 | ChatGPT Plus + Codex CLI / IDE / Cloud 全套 |
| Pro | $100 | 介於 Plus 和 Pro 20× 之間(2026 年 4 月新檔位) |
| Pro 20× | $200 | 舊 ChatGPT Pro,20 倍用量 |
| Business / Enterprise | 議價 | 組織級 SSO / Audit |
| API | 按 token | 完全彈性 |
Codex 在 2026 年 4 月加了 $100 Pro 中間檔,價格分層變化頻繁。訂閱前必須以 OpenAI Codex 官方頁 和 Anthropic Claude Code 官方頁 為準。
價效比對比:同樣 $20 / 月,Claude Code 拿到的是 Anthropic Pro 等級體驗,Codex 拿到的是 ChatGPT Plus 等級體驗。兩者的 token 經濟不一樣,直接比貴賤意義不大。真正決定價效比的是你日常用 Claude 還是 GPT 多——如果你已經在用 Claude 做日常對話,Pro 訂閱同時解鎖 Claude Code 幾乎是白送;同理 Codex 之於 ChatGPT。
6. 兩類開發者的推薦
A 類:單兵作戰 / 單專案深耕
特徵:一臺機器、一個主專案、CLI 是日常工作流第一公民、追求順滑不要 gate。
推薦 Claude Code。Pro $20 / 月起步,重度後升 Max。CLAUDE.md 多級設定是這類使用者的最佳工具。
B 類:多專案並行 / 跨機器 / 團隊協作
特徵:3 個以上專案同時活躍、需要把長任務丟給 Cloud 跑、團隊 / 公司有合規要求。
推薦 Codex。Plus $20 起步,重度後升 Pro $100。多入口共享和 approval 閘門在這類場景下是真正的省心。
C 類:寫程式碼佔工作 30% 但管 5 個專案的技術 leader
特徵:日常更多在 review、planning、答疑,寫程式碼不是主線但要看得懂程式碼。
推薦 Codex 在 GitHub 上掛 Cloud Agent。讓 Codex Cloud 接 issue 自動跑長任務、自己只 review diff。Claude Code 在這個場景下不如 Codex Cloud 自然。
7. 不要選 Claude Code 的理由(fairness)
- 跨入口工作多:你需要在 IDE、終端、網頁、Cloud 之間頻繁切換跑同一個任務——Codex 的多入口共享是 Claude Code 短期補不上的。
- 公司只有 OpenAI 合規白名單:很多企業的合規清單裡 OpenAI 已經過審,Anthropic 還在過——直接選 Codex 省合規成本。
- 想用 ChatGPT 網頁 + 終端 agent 共享上下文:Codex 在 chatgpt.com 網頁和 Codex CLI 之間共享會話歷史,Claude Code 還在補這條路徑。
8. 不要選 Codex 的理由
- 重視「無打擾」流暢體驗:Codex 預設 approval 比 Claude Code 多,對於喜歡 agent 自己跑完一個完整任務再回報的人不友好。
- 不在 OpenAI 生態:你的日常 LLM 呼叫都在 Anthropic Claude 上,訂 ChatGPT Plus 只為 Codex 不划算——直接訂 Claude Pro 拿 Claude Code 更順。
- Anthropic 模型口味更對:很多開發者反饋 Claude 在長程式碼理解和 refactor 上更穩——這是模型層差異,跟產品形態無關。
9. 常見問題
Q1 · Claude Code 和 Codex 都開,會衝突嗎?
不會衝突。兩家的 *.md 設定檔不重名(CLAUDE.md vs AGENTS.md),可以共存於同一個專案根目錄。但你的注意力只有一份,頻繁切換兩個 agent 會讓上下文撕裂——更可靠的做法是按任務型別分段。
Q2 · Codex 現在的 AGENTS.md 可以被 Claude Code 讀嗎?
可以,反過來也可以。AGENTS.md 是開放標準,多家 agent(Codex、Claude Code、Cursor、Gemini CLI 等)都在朝它收斂。如果你想一份設定多家用,寫在 AGENTS.md 裡同時被讀取機率最高。
Q3 · Claude Code 沒有 Cloud Agent,是劣勢嗎?
短期是。但 Anthropic 已經推出 Claude Code Sandbox 和 Claude Cowork,2026 年這一塊的差距在快速縮小。如果你現在選 Claude Code 又想要 Cloud Agent,可以觀察這兩個產品的 GA 進度。
Q4 · Codex 的 sandbox 三檔具體是什麼?
read-only:agent 只能讀,不能改檔案、不能跑命令。workspace-write:agent 可以在工作目錄裡改檔案、跑命令,但預設禁止網路。danger-full-access:agent 完全自由,可以讀寫任意檔案、訪問網路。生產環境之外才能用。
詳見 Codex 沙箱與審批教學。
Q5 · Claude Code 的 permissions 跟 Codex 的 sandbox 是一回事嗎?
不完全是。Claude Code 的 permissions 是 tool-level(每個工具單獨 allow/ask/deny),Codex 的 sandbox 是 process-level(整體程序的檔案 / 網路訪問受限)。兩層不矛盾,可以同時存在。
10. 選型決策清單
- 我只有一臺主開發機 + 一個主專案 → Yes 傾向 Claude Code。
- 我每週至少有 3 次讓 agent 非同步跑長任務 的需求 → Yes 傾向 Codex。
- 我日常對話已經在用 Claude 網頁或桌面 → Yes 傾向 Claude Code(Pro 訂閱捎帶)。
- 我日常對話已經在用 ChatGPT → Yes 傾向 Codex(Plus 訂閱捎帶)。
- 公司 / 合規清單隻允許其中一家 → 沒得選,按白名單走。
5 題裡 ≥ 3 題指向某一邊就選那邊。完全不確定,先訂 ChatGPT Plus $20 / 月 試 30 天 Codex(含 Cloud 非同步體驗),不行再切 Claude Pro——Codex 的多入口能讓你最快摸清自己實際工作流是哪一類。