Claude Code vs Codex：終端 AI 程式設計 Agent 怎麼選

📖 本篇術語速查表

英文 / 縮寫	中文	一句話解釋
Claude Code	A	對比的一方。
Codex	B	對比的另一方。
適用邊界	boundary	各自更適合的場景。

不想讀完？把下面這段提示詞丟給 AI 幫你跑完——幫你在 Claude Code 和 Codex 之間按你的真實場景做出選擇。

你是 Claude Code vs Codex 選型顧問。

【角色】
Claude Code vs Codex 選型顧問，按「按場景選而非按強弱選」「最小夠用」的原則給可落地建議，每條結論都落到能照做的具體判斷或步驟，不停留在「看情況」「各有優劣」這類空泛表述。

【輸入】
- 我的主要使用場景：___
- 最在意的點（能力 / 成本 / 安全 / 協作）：___
- 是否已在用 Claude Code 或 Codex：___
- 團隊還是個人：___
- 經驗水平：___

【工作流程】
1. 提煉 Claude Code 和 Codex 的核心差異
2. 按我的場景判斷更適合哪個
3. 給出明確推薦和理由
4. 說明什麼情況下換選擇
5. 給落地第一步

【輸出規範】
▌一、按你的情況判斷
▌二、推薦 + 理由
▌三、什麼情況下換選擇
▌四、落地第一步

【硬約束】
- 按場景選而非爭 Claude Code/Codex 誰更強
- 結論給到明確推薦而非「各有優劣」
- 兩者可組合時也說清
- 不要替我臆測我的情況或編造工具不存在的能力，資訊不全先問清
- 不確定的功能或價格一律以各工具官方為準，禁止照搬過時對比

Claude Code 和 Codex CLI 是開發者討論最多的一對終端 agent。看起來都是「在命令列裡跑 AI 幫你寫程式碼」，但用半天就會感到兩者是完全不同的物種：

Claude Code 像一個貼身工程師——你開啟終端，它就在那兒，盯著這個專案跑，配 CLAUDE.md 做長期記憶。
Codex 像一個受控外包——CLI 只是它的一個入口，它還住在 IDE、網頁、桌面 App 和雲端，靠 AGENTS.md 跨入口同步任務。

這篇用一個真實 bug 場景模擬兩條 agent 的工作差異，再回答訂閱哪家的問題。

本章目標：你會按「單兵貼身 vs 多入口受控」的心智模型做選擇，而不是隻看哪家模型當週跑分高。

1. 同一個 bug，兩條 agent 的工作錄影

假設場景：你的 Next.js 專案本地 dev 模式跑起來好好的，部署到 Vercel 後首屏掛掉，控制台報「Cannot read properties of undefined (reading 'map')」。你需要 AI 幫你排障。

Claude Code 的工作錄影

sequenceDiagram
  participant U as 你
  participant C as Claude Code
  participant Repo as 專案儲存庫
  U->>C: claude
  C->>Repo: 讀 CLAUDE.md / 專案結構 / 最近 git log
  U->>C: "首屏掛掉，報 reading 'map' of undefined，懷疑是 SSR/CSR 不一致"
  C->>C: ultrathink 模式分析
  C->>Repo: grep 引用 .map 的元件
  C->>Repo: 讀出嫌疑元件原始碼
  C->>U: 提議在 X 檔案 Y 行加 ?? [] 做兜底，問要不要改
  U->>C: 改
  C->>Repo: 直接 edit 檔案
  C->>U: 改完。要不要跑測試？

體驗關鍵詞：單線條、貼身、慢工出細活。Claude Code 把你和它鎖在一個專案裡，從讀 CLAUDE.md 到最終改檔案，整條 loop 在同一個終端視窗完成。

Codex 的工作錄影（同一個 bug）

sequenceDiagram
  participant U as 你
  participant CLI as Codex CLI
  participant Cloud as Codex Cloud
  participant Web as Codex 網頁 / App
  participant Repo as 專案儲存庫
  U->>CLI: codex
  CLI->>Repo: 讀 AGENTS.md / sandbox 設定
  U->>CLI: 同上 bug 描述
  CLI->>U: 我要讀哪些檔案？讀完要不要改？等 approval
  U->>CLI: approve read
  CLI->>Repo: 讀相關檔案
  CLI->>U: 改 X 檔案加 ?? [] 兜底，需要 write approval
  U->>CLI: approve write
  CLI->>Repo: 改檔案
  Note over U,Cloud: 也可以把同個任務<br/>丟給 Codex Cloud 非同步跑
  U->>Cloud: 派同樣任務給 Cloud
  Cloud->>Cloud: 在隔離 sandbox 跑
  Cloud->>U: 返回 diff，讓你 review

體驗關鍵詞：多入口、有 gate、可平行。Codex 把每一步都做成了 approval 閘門（read / write / shell exec / network 都可以分別設定），同時支援把任務非同步丟給 Cloud 跑，你回頭 review。

同樣的 bug，Claude Code 的體驗是「跟你坐一起調」，Codex 的體驗是「我給你列清單，你逐項授權」。哪個更適合你，看你重視「絲滑」還是「可控」。

2. 心智模型：貼身工程師 vs 受控外包

講清兩個心智模型，下面 4 節就好理解了。

Claude Code 的產品哲學：終端 agent 應該貼著專案跑。你開啟終端就進入 agent loop，agent 讀 CLAUDE.md 知道這是什麼專案，記得你之前講過的偏好，知道哪些檔案不能動。它的邊界是「這臺機器上、這個專案裡」。

Codex 的產品哲學：agent 應該跨入口跑，但每一步都要有 approval。同一個 task 你可以在 CLI 起頭、切到 IDE 看 diff、丟給 Cloud 跑長任務、在網頁 review 結果——所有入口共享同一份 AGENTS.md 和 sandbox 設定，但每個動作都會回到「你允許嗎」的 gate。

這不是「哪個先進」的問題，是兩條不同設計哲學：

Claude Code 假設「信任你 vs agent 的搭檔關係」，體驗更順滑，但代價是 agent 寫檔案相對自由（雖然也支援 permissions）。
Codex 假設「agent 預設不可完全信任」，體驗有更多 gate，但代價是回到「我要批准什麼」的頻率更高。

3. 三層硬約束對比：設定 / 沙箱 / 審批

層	Claude Code	Codex
專案記憶	`CLAUDE.md`（專案根 / 父目錄 / `~/.claude/CLAUDE.md` 多級合併）	`AGENTS.md`（專案根 / 子目錄多級合併）
沙箱檔位	`permissions` 欄位 + Skills hooks	`read-only` / `workspace-write` / `danger-full-access` 三檔
審批模型	`permissions` 控制 tool-level approval（預設詢問 / 自動允許 / 拒絕）	`untrusted` / `on-failure` / `on-request` / `never` 四檔 approval policy
Skills / Subagents / Hooks	三件套俱全（Skills / Subagents / Hooks），還支援 plugins	三件套俱全（Skills / Subagents / Hooks），生態 1.0 已釋出
MCP 支援	一等公民	一等公民
Slash 命令	`/clear` / `/compact` / 使用者自定義	`/diff` / `/exec` / 使用者自定義

兩家在 2025-2026 年的演進路徑其實越來越像——都在 Skills + Subagents + Hooks + MCP 上達成共識，差異主要在「approval 預設強度」和「入口數量」兩點。

4. 入口數量：1 個 vs 5 個

這是 Codex 跟 Claude Code 拉開的最大差距：

入口	Claude Code	Codex
終端 CLI	✅ 主入口	✅
IDE 擴充套件	✅ VS Code / JetBrains 擴充套件	✅ VS Code / Cursor / Windsurf 等
桌面 App	⚠️ macOS / Windows / Linux 版（與 CLI 共享上下文）	✅ macOS / Windows 桌面 App
網頁	❌	✅ chatgpt.com / Codex Cloud 入口
Cloud 非同步	⚠️ Claude Code Sandbox（GA 中）/ Claude Cowork	✅ Codex Cloud 成熟
GitHub PR	⚠️ Claude Cowork 接 GitHub	✅ Codex GitHub App

Claude Code 也在補入口，但核心心智仍然是「終端為主，其它入口圍繞終端工作流」。Codex 的心智是**「五個入口都是一等公民，共享同一個 task」**——你可以在 CLI 起頭、桌面 App 跟進、網頁 review、Cloud 跑長任務、GitHub 自動合 PR。

如果你的工作流主要在一臺機器一個專案裡，Claude Code 的「單入口貼身」更舒服。如果你的工作流跨多臺機器、多個專案、還要非同步跑長任務，Codex 的「多入口共享」是真正的護城河。

5. 價格與訂閱入口

兩家的價格模型差異更大。

Claude Code

Claude Code 需要 Anthropic 訂閱或 API：

檔位	月費	包含什麼
Pro	$20	Claude Code + Claude Pro 網頁/桌面
Max 5×	$100	5 倍 Pro 用量
Max 20×	$200	20 倍 Pro 用量
API	按 token	完全彈性

Anthropic 用「5 小時滾動 + 周限」的雙層 quota 模型。Pro 檔夠個人輕度用，Max 檔是日常重度使用者的合理起點。沒有真正的「免費檔」——必須訂閱或買 API credits。

Codex

Codex 走 ChatGPT 訂閱或 OpenAI API：

檔位	月費	包含什麼
Free	$0	限額（Codex CLI / IDE 受限）
Go	$8	ChatGPT Go + Codex 入門額度
Plus	$20	ChatGPT Plus + Codex CLI / IDE / Cloud 全套
Pro	$100	介於 Plus 和 Pro 20× 之間（2026 年 4 月新檔位）
Pro 20×	$200	舊 ChatGPT Pro，20 倍用量
Business / Enterprise	議價	組織級 SSO / Audit
API	按 token	完全彈性

Codex 在 2026 年 4 月加了 $100 Pro 中間檔，價格分層變化頻繁。訂閱前必須以 OpenAI Codex 官方頁和 Anthropic Claude Code 官方頁為準。

價效比對比：同樣 $20 / 月，Claude Code 拿到的是 Anthropic Pro 等級體驗，Codex 拿到的是 ChatGPT Plus 等級體驗。兩者的 token 經濟不一樣，直接比貴賤意義不大。真正決定價效比的是你日常用 Claude 還是 GPT 多——如果你已經在用 Claude 做日常對話，Pro 訂閱同時解鎖 Claude Code 幾乎是白送；同理 Codex 之於 ChatGPT。

6. 兩類開發者的推薦

A 類：單兵作戰 / 單專案深耕

特徵：一臺機器、一個主專案、CLI 是日常工作流第一公民、追求順滑不要 gate。

推薦 Claude Code。Pro $20 / 月起步，重度後升 Max。CLAUDE.md 多級設定是這類使用者的最佳工具。

B 類：多專案並行 / 跨機器 / 團隊協作

特徵：3 個以上專案同時活躍、需要把長任務丟給 Cloud 跑、團隊 / 公司有合規要求。

推薦 Codex。Plus $20 起步，重度後升 Pro $100。多入口共享和 approval 閘門在這類場景下是真正的省心。

C 類：寫程式碼佔工作 30% 但管 5 個專案的技術 leader

特徵：日常更多在 review、planning、答疑，寫程式碼不是主線但要看得懂程式碼。

推薦 Codex 在 GitHub 上掛 Cloud Agent。讓 Codex Cloud 接 issue 自動跑長任務、自己只 review diff。Claude Code 在這個場景下不如 Codex Cloud 自然。

7. 不要選 Claude Code 的理由（fairness）

跨入口工作多：你需要在 IDE、終端、網頁、Cloud 之間頻繁切換跑同一個任務——Codex 的多入口共享是 Claude Code 短期補不上的。
公司只有 OpenAI 合規白名單：很多企業的合規清單裡 OpenAI 已經過審，Anthropic 還在過——直接選 Codex 省合規成本。
想用 ChatGPT 網頁 + 終端 agent 共享上下文：Codex 在 chatgpt.com 網頁和 Codex CLI 之間共享會話歷史，Claude Code 還在補這條路徑。

8. 不要選 Codex 的理由

重視「無打擾」流暢體驗：Codex 預設 approval 比 Claude Code 多，對於喜歡 agent 自己跑完一個完整任務再回報的人不友好。
不在 OpenAI 生態：你的日常 LLM 呼叫都在 Anthropic Claude 上，訂 ChatGPT Plus 只為 Codex 不划算——直接訂 Claude Pro 拿 Claude Code 更順。
Anthropic 模型口味更對：很多開發者反饋 Claude 在長程式碼理解和 refactor 上更穩——這是模型層差異，跟產品形態無關。