AI 程式設計教學中文版
從原理到實戰

02 · 一次任務是怎麼完成的

把 Codex 的一次任務理解成從目標、上下文、計劃、執行到驗證交付的工程管線。

📖 本篇術語速查表
英文 / 縮寫中文一句話解釋
任務管線task pipeline一次任務從目標→上下文→計劃→執行→驗證→交付的完整流程。
Working Tree工作樹目前改動所在的檔案狀態,執行階段要保護它不被誤改。
驗證錨點verification anchor任務完成後用來確認是否真的做對的具體檢查點。

不想讀完?把下面這段提示詞丟給 AI 幫你跑完——幫你把一個任務拆成 Codex 能穩妥跑完的工程管線。

你是 Codex 任務管線規劃顧問,幫我把一個任務拆成「目標→上下文→計劃→執行→驗證→交付」的工程管線,確保能跑完且可驗收。

【角色】
你熟悉 Codex 一次任務的完整管線,知道任務要先變小、邊界要寫清、執行要保護工作樹、驗證要對應目標、交付要給證據。

【輸入】
- 我要讓 Codex 做的任務:___
- 任務目標(做完什麼樣算成功):___
- 涉及的檔案 / 模組範圍:___
- 我能用來驗證的方式(測試 / 命令 / 人工檢查):___

【工作流程】
1. 把任務拆小到一個可獨立驗證的範圍
2. 列出該寫清的三個邊界(能改什麼 / 不能碰什麼 / 何時停下問我)
3. 給執行計劃,並提示如何保護工作樹
4. 設計和目標對應的驗證錨點 + 交付證據

【輸出規範】
▌一、任務拆解:拆成的最小可驗證範圍
▌二、三個邊界:可改 / 禁碰 / 須確認
▌三、執行計劃 + 工作樹保護建議
▌四、驗證錨點 + 交付時該給的證據

【硬約束】
- 任務太大先建議拆分,不要一次吞下
- 不可逆操作(刪除 / force push / 改主分支)必須標註須人工確認
- 驗證方式必須和目標對應,不能只說跑通了
- 不替我臆測目標,目標不清先讓我補充

Codex 不是“發一句話然後等程式碼”的黑盒。一次可靠任務更像一條工程管線:定義目標、收集上下文、制定計劃、執行修改、執行驗證、交付審查。

如果你只說“做一個小遊戲”,它需要猜框架、位置、邊界、驗收方式。如果你把目標、範圍、禁止事項和驗證方式寫清楚,Codex 才能穩定推進。

Codex 最容易失敗的地方,通常不是寫程式碼本身,而是任務太寬、上下文不足、驗證標準缺失。先把任務管線控住,再談生成質量。

任務管線

一次 Codex 任務可以拆成七步:

flowchart TB
    A["1. 接收任務<br/>理解使用者目標"]
    B["2. 澄清邊界<br/>確認範圍和禁止事項"]
    C["3. 收集上下文<br/>讀取檔案、規則、報錯"]
    D["4. 制定計劃<br/>列出修改點和驗證方式"]
    E["5. 執行修改<br/>改檔案或呼叫工具"]
    F["6. 執行驗證<br/>測試、型別檢查、構建"]
    G{"驗證透過?"}
    H["7. 交付審查<br/>說明 diff、證據、風險"]

    A --> B --> C --> D --> E --> F --> G
    G -->|透過| H
    G -->|失敗| C

每一步都有對應風險:

  • 接收任務:目標過寬,導致改動失控。
  • 澄清邊界:你和 Codex 對“完成”的理解不同。
  • 收集上下文:讀錯檔案或漏掉專案規則。
  • 制定計劃:計劃跨度太大,不可審查。
  • 執行修改:順手重構或碰到無關檔案。
  • 執行驗證:驗證命令和目標不匹配。
  • 交付審查:只報喜,不說明未驗證和殘餘風險。

真正的質量控制,不是等 Codex 改完後再看,而是在每個節點提前設定約束。

為什麼任務要先變小

新手最適合從小任務開始,因為小任務可以審查。

適合起步的任務:

  • 一句話能說清目標。
  • 改動範圍不超過 1-3 個檔案。
  • 30 分鐘內能驗收。
  • 有明確測試、截圖、型別檢查或人工驗收標準。

不適合直接交給 Codex 的任務:

  • “最佳化整個專案”。
  • “重構所有頁面”。
  • “升級核心架構”。
  • “把全站風格弄高階一點”。

大任務不是不能做,而是要拆成一組小任務,每個小任務都能獨立驗證。

三個必須寫清楚的邊界

任務 prompt 至少要包含三類邊界。

mindmap
  root((任務邊界))
    檔案邊界
      只改哪些目錄
      哪些檔案不能碰
    行為邊界
      不新增依賴
      不做無關重構
      不改公共 API
    驗證邊界
      跑哪些命令
      什麼算透過
      哪些無法驗證要說明

檔案邊界控制改動範圍。行為邊界控制實現方式。驗證邊界控制交付標準。

缺檔案邊界,Codex 可能擴大修改面。缺行為邊界,它可能順手引入新依賴。缺驗證邊界,它可能只給“已完成”的文字結論。

計劃階段不是形式

很多人跳過計劃,直接讓 Codex 寫程式碼。短任務可以這樣做,但稍微複雜一點就容易失控。

一個合格計劃應該說明:

  • 要讀哪些檔案,為什麼相關。
  • 準備改哪些檔案。
  • 不會改哪些檔案。
  • 預期風險點是什麼。
  • 改完用什麼方式驗證。

計劃不是為了讓回答更長,而是給你一個提前攔截的機會。你可以在它動手前發現範圍太大、方向不對、驗證不夠。

執行階段要保護工作樹

Codex 執行任務時必須尊重目前工作樹。

執行前應確認:

  • 目標檔案是否已經有別人改動。
  • 目前 dirty files 中哪些和本任務有關。
  • 是否存在未提交生成物、記錄、構建產物。
  • 是否允許修改共享指令碼、設定或索引檔案。

如果有多個 agent 同時工作,任務邊界要更窄。最穩的方式是每批只處理少量檔案,驗證後再進入下一批。

驗證階段要和目標對應

驗證不是機械跑一個命令。它必須覆蓋任務目標。

例子:

  • 文件 MDX 改動:至少跑 MDX 型別生成或 types:check
  • 樣式改動:需要桌面和移動端截圖或視覺檢查。
  • 邏輯改動:需要相關單元測試、整合測試或可復現步驟。
  • 設定改動:需要啟動、lint、schema 或 dry-run。

如果驗證命令失敗,Codex 不能直接“忽略”。它應該說明失敗原因、是否由本次改動引入、還缺什麼環境或許可權。

交付階段要給證據

完成彙報至少包含:

  • 改了哪些檔案。
  • 每個檔案解決了什麼問題。
  • 跑了哪些驗證。
  • 哪些沒有驗證,為什麼。
  • 還剩哪些風險或後續候選。

這讓你能快速判斷任務是否真的完成,而不是隻看到一段樂觀描述。

可直接複用的任務模板

目標:
{具體要完成什麼}

範圍:
只改 {檔案或目錄}。
不要碰 {排除範圍}。

執行順序:
先只讀分析並列計劃;確認後再修改。

約束:
不新增依賴,不做無關重構,不覆蓋現有未提交改動。

驗證:
改完執行 {命令}。
如果失敗,說明失敗原因、是否與本次改動相關、替代驗證是什麼。

交付:
列出修改檔案、驗證結果、未驗證項和殘餘風險。

Codex 的任務質量,來自目標、邊界、上下文和反饋閉環。把這四件事寫清楚,它就更像工程協作者,而不是隨機程式碼生成器。

官方參考

以下為本頁涉及工具的權威來源,功能與價格以官方為準:

本頁目錄