02 · 一次任務是怎麼完成的
把 Codex 的一次任務理解成從目標、上下文、計劃、執行到驗證交付的工程管線。
📖 本篇術語速查表
| 英文 / 縮寫 | 中文 | 一句話解釋 |
|---|---|---|
| 任務管線 | task pipeline | 一次任務從目標→上下文→計劃→執行→驗證→交付的完整流程。 |
| Working Tree | 工作樹 | 目前改動所在的檔案狀態,執行階段要保護它不被誤改。 |
| 驗證錨點 | verification anchor | 任務完成後用來確認是否真的做對的具體檢查點。 |
不想讀完?把下面這段提示詞丟給 AI 幫你跑完——幫你把一個任務拆成 Codex 能穩妥跑完的工程管線。
你是 Codex 任務管線規劃顧問,幫我把一個任務拆成「目標→上下文→計劃→執行→驗證→交付」的工程管線,確保能跑完且可驗收。
【角色】
你熟悉 Codex 一次任務的完整管線,知道任務要先變小、邊界要寫清、執行要保護工作樹、驗證要對應目標、交付要給證據。
【輸入】
- 我要讓 Codex 做的任務:___
- 任務目標(做完什麼樣算成功):___
- 涉及的檔案 / 模組範圍:___
- 我能用來驗證的方式(測試 / 命令 / 人工檢查):___
【工作流程】
1. 把任務拆小到一個可獨立驗證的範圍
2. 列出該寫清的三個邊界(能改什麼 / 不能碰什麼 / 何時停下問我)
3. 給執行計劃,並提示如何保護工作樹
4. 設計和目標對應的驗證錨點 + 交付證據
【輸出規範】
▌一、任務拆解:拆成的最小可驗證範圍
▌二、三個邊界:可改 / 禁碰 / 須確認
▌三、執行計劃 + 工作樹保護建議
▌四、驗證錨點 + 交付時該給的證據
【硬約束】
- 任務太大先建議拆分,不要一次吞下
- 不可逆操作(刪除 / force push / 改主分支)必須標註須人工確認
- 驗證方式必須和目標對應,不能只說跑通了
- 不替我臆測目標,目標不清先讓我補充Codex 不是“發一句話然後等程式碼”的黑盒。一次可靠任務更像一條工程管線:定義目標、收集上下文、制定計劃、執行修改、執行驗證、交付審查。
如果你只說“做一個小遊戲”,它需要猜框架、位置、邊界、驗收方式。如果你把目標、範圍、禁止事項和驗證方式寫清楚,Codex 才能穩定推進。
Codex 最容易失敗的地方,通常不是寫程式碼本身,而是任務太寬、上下文不足、驗證標準缺失。先把任務管線控住,再談生成質量。
任務管線
一次 Codex 任務可以拆成七步:
flowchart TB
A["1. 接收任務<br/>理解使用者目標"]
B["2. 澄清邊界<br/>確認範圍和禁止事項"]
C["3. 收集上下文<br/>讀取檔案、規則、報錯"]
D["4. 制定計劃<br/>列出修改點和驗證方式"]
E["5. 執行修改<br/>改檔案或呼叫工具"]
F["6. 執行驗證<br/>測試、型別檢查、構建"]
G{"驗證透過?"}
H["7. 交付審查<br/>說明 diff、證據、風險"]
A --> B --> C --> D --> E --> F --> G
G -->|透過| H
G -->|失敗| C
每一步都有對應風險:
- 接收任務:目標過寬,導致改動失控。
- 澄清邊界:你和 Codex 對“完成”的理解不同。
- 收集上下文:讀錯檔案或漏掉專案規則。
- 制定計劃:計劃跨度太大,不可審查。
- 執行修改:順手重構或碰到無關檔案。
- 執行驗證:驗證命令和目標不匹配。
- 交付審查:只報喜,不說明未驗證和殘餘風險。
真正的質量控制,不是等 Codex 改完後再看,而是在每個節點提前設定約束。
為什麼任務要先變小
新手最適合從小任務開始,因為小任務可以審查。
適合起步的任務:
- 一句話能說清目標。
- 改動範圍不超過 1-3 個檔案。
- 30 分鐘內能驗收。
- 有明確測試、截圖、型別檢查或人工驗收標準。
不適合直接交給 Codex 的任務:
- “最佳化整個專案”。
- “重構所有頁面”。
- “升級核心架構”。
- “把全站風格弄高階一點”。
大任務不是不能做,而是要拆成一組小任務,每個小任務都能獨立驗證。
三個必須寫清楚的邊界
任務 prompt 至少要包含三類邊界。
mindmap
root((任務邊界))
檔案邊界
只改哪些目錄
哪些檔案不能碰
行為邊界
不新增依賴
不做無關重構
不改公共 API
驗證邊界
跑哪些命令
什麼算透過
哪些無法驗證要說明
檔案邊界控制改動範圍。行為邊界控制實現方式。驗證邊界控制交付標準。
缺檔案邊界,Codex 可能擴大修改面。缺行為邊界,它可能順手引入新依賴。缺驗證邊界,它可能只給“已完成”的文字結論。
計劃階段不是形式
很多人跳過計劃,直接讓 Codex 寫程式碼。短任務可以這樣做,但稍微複雜一點就容易失控。
一個合格計劃應該說明:
- 要讀哪些檔案,為什麼相關。
- 準備改哪些檔案。
- 不會改哪些檔案。
- 預期風險點是什麼。
- 改完用什麼方式驗證。
計劃不是為了讓回答更長,而是給你一個提前攔截的機會。你可以在它動手前發現範圍太大、方向不對、驗證不夠。
執行階段要保護工作樹
Codex 執行任務時必須尊重目前工作樹。
執行前應確認:
- 目標檔案是否已經有別人改動。
- 目前 dirty files 中哪些和本任務有關。
- 是否存在未提交生成物、記錄、構建產物。
- 是否允許修改共享指令碼、設定或索引檔案。
如果有多個 agent 同時工作,任務邊界要更窄。最穩的方式是每批只處理少量檔案,驗證後再進入下一批。
驗證階段要和目標對應
驗證不是機械跑一個命令。它必須覆蓋任務目標。
例子:
- 文件 MDX 改動:至少跑 MDX 型別生成或
types:check。 - 樣式改動:需要桌面和移動端截圖或視覺檢查。
- 邏輯改動:需要相關單元測試、整合測試或可復現步驟。
- 設定改動:需要啟動、lint、schema 或 dry-run。
如果驗證命令失敗,Codex 不能直接“忽略”。它應該說明失敗原因、是否由本次改動引入、還缺什麼環境或許可權。
交付階段要給證據
完成彙報至少包含:
- 改了哪些檔案。
- 每個檔案解決了什麼問題。
- 跑了哪些驗證。
- 哪些沒有驗證,為什麼。
- 還剩哪些風險或後續候選。
這讓你能快速判斷任務是否真的完成,而不是隻看到一段樂觀描述。
可直接複用的任務模板
目標:
{具體要完成什麼}
範圍:
只改 {檔案或目錄}。
不要碰 {排除範圍}。
執行順序:
先只讀分析並列計劃;確認後再修改。
約束:
不新增依賴,不做無關重構,不覆蓋現有未提交改動。
驗證:
改完執行 {命令}。
如果失敗,說明失敗原因、是否與本次改動相關、替代驗證是什麼。
交付:
列出修改檔案、驗證結果、未驗證項和殘餘風險。Codex 的任務質量,來自目標、邊界、上下文和反饋閉環。把這四件事寫清楚,它就更像工程協作者,而不是隨機程式碼生成器。
官方參考
以下為本頁涉及工具的權威來源,功能與價格以官方為準: