12 · 一句话复盘 Codex 全貌 · AI 编程教程中文版

📖 本篇术语速查表

英文 / 缩写	中文	一句话解释
决策链	decision chain	从入口到验证把六件事串成的一条可复用判断路径。
全貌六件事	—	用好 Codex 的六个核心：入口、上下文、工具、边界、验证、团队落地。
工作树边界	working tree scope	多人协作时不碰别人改动、每批只改少量文件的约束。

不想读完？把下面这段提示词丢给 AI 帮你跑完——帮你自测是否真的会用 Codex，并补上薄弱环节。

你是 Codex 掌握度自测顾问，帮我检查是否真的会用 Codex，并指出该补的薄弱环节。

【角色】
你清楚用好 Codex 的全貌只有六件事——入口、上下文、工具、边界、验证、团队落地，能通过几个问题诊断我的真实掌握程度。

【输入】
- 我通常怎么给 Codex 任务：___
- 我会配置边界（sandbox / approval）吗：___
- 我怎么验证它做对了：___
- 我用过哪些入口和工具：___

【工作流程】
1. 对照六件事逐项评估我的掌握程度
2. 找出最薄弱的一两环
3. 给针对性的补强动作
4. 给一句话判断我是会用还是还在当玩具

【输出规范】
▌一、六件事逐项判断（会 / 半懂 / 不会）
▌二、最该补的薄弱环节
▌三、针对性补强动作
▌四、整体判断 + 下一步

【硬约束】
- 诊断基于我的实际回答，不给通用评语
- 薄弱环节要给可执行补法，不只指出问题
- 不夸我也不打击，务实判断
- 边界和验证的短板要重点提醒（最容易出事）

学完 Codex，最好的检验不是记住多少名词，而是能不能用一句话解释它。

Codex 交付的是建议、diff 和验证证据，不是免审结果。最后仍然要看 diff、看风险、看未验证项。

What is Codex

回到 Codex 的基本定位。

CLI App IDE Cloud

根据任务选择入口，而不是每个入口都乱用。

Team production

从个人使用升级到团队可治理流程。

一句话

Codex 是一个 AI Coding Agent：它读现场、改文件、调工具、跑验证、交结果。你的工作不是“让它写代码”，而是给它目标、上下文、边界和验证标准，然后审查它的交付。

全貌只有六件事

flowchart LR
    Goal["目标"] --> Context["上下文"]
    Context --> Tools["工具"]
    Tools --> Boundary["边界"]
    Boundary --> Verify["验证"]
    Verify --> Review["审查"]

第一，目标。你要让 Codex 知道这次任务到底解决什么问题，而不是只说“优化一下”。

第二，上下文。Codex 需要项目文件、AGENTS.md、配置、历史对话、工具输出和你补充的业务背景。

第三，工具。Codex 通过文件读写、shell、浏览器、MCP、skills、subagents 和 hooks 进入真实工程现场。

第四，边界。Sandbox 决定它能碰哪里，approval 决定高风险动作是否需要你确认。

第五，验证。测试、lint、diff、日志、截图、运行结果都属于验证证据。

第六，审查。Codex 完成后仍要 review，不要把最终回答当成事实完成。

你是否真的会用

能做到这些，才算开始工程化使用 Codex：

任务开始前说清目标、范围和禁止事项。
让 Codex 先理解项目，而不是一上来改代码。
根据风险选择 CLI、IDE、App 或 Cloud。
能解释 sandbox 和 approval 各自控制什么。
知道什么时候该用 MCP、Skill、Subagent、Hook。
完成后要求 diff、验证结果、未验证项和剩余风险。

如果这些做不到，不是“不会用 Codex”，而是还没有建立工程化使用习惯。

决策链

接到任何任务，按这条链走：

任务清楚吗？不清楚就分诊，先收集错误、现象、目标和验收标准。
规则齐吗？没有项目规则就先读或补 AGENTS.md。
入口对吗？本地小改动用 CLI / IDE，长任务用 Cloud，团队自动化用 codex exec 或 GitHub Action。
边界画了吗？先 read-only，需要写入再 workspace-write，危险操作必须审批。
需要外部工具吗？需要文档、数据库、内部 API，再接 MCP 或浏览器。
这是重复任务吗？重复流程沉淀成 Skill，独立探索交给 Subagent，必须执行的检查交给 Hook。
可以验证吗？不能验证就先补验证方式，再执行。

最后才让 Codex 执行，并要求它交验证证据。

新手最少必要能力

你不需要一开始学完所有功能。

先选一个入口。IDE 适合边看边改，CLI 适合终端用户，Cloud 适合异步长任务。

写一份 AGENTS.md。哪怕只有项目用途、启动命令、测试命令、禁止事项，也比每次口头解释强。

默认用 workspace-write + on-request 或更保守的 read-only 起步。不要一上来全权限。

每个任务先让 Codex 读现场，再让它改。不要把“马上动手”当效率。

每次结束都复盘，把稳定经验沉淀回 AGENTS.md、Skill 或 rules。

常见误区

装 4 个入口就算掌握。实际应先把一个入口用顺。
配 10 个 MCP 就更强。工具越多，权限和错误来源越多。
把 Subagent、Hook、Skill 一起上。真实重复问题出现后再加。
只看 Codex 最终回答。真正要看它读了什么、改了什么、验证了什么、没验证什么。
把 AGENTS.md 当文档。它是项目和 Agent 的协作接口，应该持续演进。

读完应能回答

Codex 和普通聊天机器人的差别是什么？
一次稳定任务为什么需要目标、上下文、边界和验证？
AGENTS.md 应该写什么，不该写什么？
Sandbox 和 approval 分别防什么风险？
App、IDE、CLI、Cloud 各适合什么人和任务？
MCP、Skill、Subagent、Hook 各自解决什么问题？
团队要如何从个人使用升级到可审查、可追溯、可治理？

下一步

选一个真实小任务，不要选玩具 demo。

先让 Codex 只读理解项目，输出项目用途、目录结构、运行方式、风险和建议小任务。

再选一个范围很小的改动，让它修改、验证、说明未验证项。

最后把这次任务中你反复提醒它的规则沉淀进 AGENTS.md。

学习闭环就是：任务、复盘、沉淀、下一个任务。

12 · 一句话复盘 Codex 全貌