AI 编程教程中文版
从原理到实战

12 · 一句话复盘 Codex 全貌

把 Codex 的入口、上下文、工具、边界、验证和团队落地压成一条新手能复用的决策链。

学完 Codex,最好的检验不是记住多少名词,而是能不能用一句话解释它。

Codex 交付的是建议、diff 和验证证据,不是免审结果。最后仍然要看 diff、看风险、看未验证项。

一句话

Codex 是一个 AI Coding Agent:它读现场、改文件、调工具、跑验证、交结果。你的工作不是“让它写代码”,而是给它目标、上下文、边界和验证标准,然后审查它的交付。

全貌只有六件事

flowchart LR
    Goal["目标"] --> Context["上下文"]
    Context --> Tools["工具"]
    Tools --> Boundary["边界"]
    Boundary --> Verify["验证"]
    Verify --> Review["审查"]

第一,目标。你要让 Codex 知道这次任务到底解决什么问题,而不是只说“优化一下”。

第二,上下文。Codex 需要项目文件、AGENTS.md、配置、历史对话、工具输出和你补充的业务背景。

第三,工具。Codex 通过文件读写、shell、浏览器、MCP、skills、subagents 和 hooks 进入真实工程现场。

第四,边界。Sandbox 决定它能碰哪里,approval 决定高风险动作是否需要你确认。

第五,验证。测试、lint、diff、日志、截图、运行结果都属于验证证据。

第六,审查。Codex 完成后仍要 review,不要把最终回答当成事实完成。

你是否真的会用

能做到这些,才算开始工程化使用 Codex:

  • 任务开始前说清目标、范围和禁止事项。
  • 让 Codex 先理解项目,而不是一上来改代码。
  • 根据风险选择 CLI、IDE、App 或 Cloud。
  • 能解释 sandbox 和 approval 各自控制什么。
  • 知道什么时候该用 MCP、Skill、Subagent、Hook。
  • 完成后要求 diff、验证结果、未验证项和剩余风险。

如果这些做不到,不是“不会用 Codex”,而是还没有建立工程化使用习惯。

决策链

接到任何任务,按这条链走:

  1. 任务清楚吗?不清楚就分诊,先收集错误、现象、目标和验收标准。
  2. 规则齐吗?没有项目规则就先读或补 AGENTS.md
  3. 入口对吗?本地小改动用 CLI / IDE,长任务用 Cloud,团队自动化用 codex exec 或 GitHub Action。
  4. 边界画了吗?先 read-only,需要写入再 workspace-write,危险操作必须审批。
  5. 需要外部工具吗?需要文档、数据库、内部 API,再接 MCP 或浏览器。
  6. 这是重复任务吗?重复流程沉淀成 Skill,独立探索交给 Subagent,必须执行的检查交给 Hook。
  7. 可以验证吗?不能验证就先补验证方式,再执行。

最后才让 Codex 执行,并要求它交验证证据。

新手最少必要能力

你不需要一开始学完所有功能。

先选一个入口。IDE 适合边看边改,CLI 适合终端用户,Cloud 适合异步长任务。

写一份 AGENTS.md。哪怕只有项目用途、启动命令、测试命令、禁止事项,也比每次口头解释强。

默认用 workspace-write + on-request 或更保守的 read-only 起步。不要一上来全权限。

每个任务先让 Codex 读现场,再让它改。不要把“马上动手”当效率。

每次结束都复盘,把稳定经验沉淀回 AGENTS.md、Skill 或 rules。

常见误区

  • 装 4 个入口就算掌握。实际应先把一个入口用顺。
  • 配 10 个 MCP 就更强。工具越多,权限和错误来源越多。
  • 把 Subagent、Hook、Skill 一起上。真实重复问题出现后再加。
  • 只看 Codex 最终回答。真正要看它读了什么、改了什么、验证了什么、没验证什么。
  • AGENTS.md 当文档。它是项目和 Agent 的协作接口,应该持续演进。

读完应能回答

  • Codex 和普通聊天机器人的差别是什么?
  • 一次稳定任务为什么需要目标、上下文、边界和验证?
  • AGENTS.md 应该写什么,不该写什么?
  • Sandbox 和 approval 分别防什么风险?
  • App、IDE、CLI、Cloud 各适合什么人和任务?
  • MCP、Skill、Subagent、Hook 各自解决什么问题?
  • 团队要如何从个人使用升级到可审查、可追溯、可治理?

下一步

选一个真实小任务,不要选玩具 demo。

先让 Codex 只读理解项目,输出项目用途、目录结构、运行方式、风险和建议小任务。

再选一个范围很小的改动,让它修改、验证、说明未验证项。

最后把这次任务中你反复提醒它的规则沉淀进 AGENTS.md

学习闭环就是:任务、复盘、沉淀、下一个任务。

官方资料

本页目录