AI 程式設計教學中文版

04 · Antigravity 的 Agent 任務迴圈

拆解 Antigravity agent 的任務迴圈:目標、計劃、許可權、執行、觀察、驗證、Artifacts、反饋和回退。

📖 本篇術語速查表
英文 / 縮寫中文一句話解釋
Agent loop代理迴圈規劃、執行、檢查的迴圈。
計劃審查plan review執行前先看計劃。
工件留痕artifact每步產出可追溯。

不想讀完?把下面這段提示詞丟給 AI 幫你跑完——幫你理解 Antigravity agent 的執行迴圈,知道在哪幾步把關。

你是 Antigravity Agent 迴圈顧問。

【角色】
Antigravity Agent 迴圈顧問,按最小夠用、安全優先的原則給可落地方案,每條結論都落到能照做的具體步驟或示例,不停留在「建議」「考慮一下」這類空泛表述。

【輸入】
- 我想交給它的任務:___
- 成功標準:___
- 對執行過程的疑慮:___
- 可用的驗證手段:___
- 經驗水平:___

【工作流程】
1. 講清 plan-act-verify 迴圈
2. 說明它產出哪些工件
3. 針對我的任務說明它會怎麼做
4. 設定每環的把關點
5. 給驗證

【輸出規範】
▌一、執行迴圈
▌二、產出工件
▌三、針對我任務的流程
▌四、把關點 + 驗證

【硬約束】
- 理解迴圈再放手
- 關鍵步驟人工確認
- 不可逆操作前看工件
- 不要替我臆測情況或編造不存在的功能,資訊不全先問清
- 不確定的設定或介面一律以官方文件為準,禁止照搬過時寫法

Antigravity 的 agent 不應該被當成“長回覆生成器”。Google 官方把 Agent 定義為:由前沿 LLM 驅動的多步推理系統,能圍繞你已有的程式碼進行推理、呼叫包括瀏覽器在內的多種工具、並透過 tasks 和 artifacts 等方式與使用者溝通。換成實操語言,它的工作不是“回答你”,而是進入一個可審查的任務迴圈:理解目標、讀取上下文、制定計劃、請求許可權、執行、觀察結果、交付證據、等待反饋。

這一篇解決什麼問題:你要學會看 agent 在迴圈裡的每一步,而不是隻看最後一句“完成了”。

閱讀目標:讀完本章,你應該能把一次 Antigravity 任務拆成可驗收目標、plan、許可權、diff、測試、截圖、walkthrough 和回退點。

1. 迴圈圖

flowchart TD
    Goal["目標"] --> Context["讀取上下文"]
    Context --> Plan["Task list / implementation plan"]
    Plan --> Review{"需要人工審閱?"}
    Review -->|是| Human["人工評論 / 批准"]
    Review -->|否| Permission["許可權檢查"]
    Human --> Permission
    Permission --> Execute["執行:edit / terminal / browser / MCP"]
    Execute --> Observe["觀察輸出:diff / logs / DOM / screenshot"]
    Observe --> Verify["驗證:test / browser flow / artifact"]
    Verify --> Walkthrough["Walkthrough"]
    Walkthrough --> Feedback{"反饋或接受?"}
    Feedback -->|反饋| Plan
    Feedback -->|接受| Done["完成"]
    Feedback -->|不滿意| Undo["回退"]

這個迴圈裡最容易忽略的是 Verify(驗證)。沒有驗證的 agent 任務,只是生成了改動,不代表完成。Antigravity 的優勢在於它能把 plan(計劃)、task list(任務清單)、diff(程式碼差異)、screenshot(截圖)、recording(錄屏)、walkthrough(任務總結)變成 artifacts(產物證據);你的工作是把這些證據串成驗收鏈,而不是隻讀聊天記錄。

2. 官方元件如何落到迴圈裡

官方 Agent 文件列出四個核心元件:reasoning model(推理模型)、tools(工具集)、artifacts(產物證據)、knowledge(長期記憶 / 知識庫)。它們在任務迴圈裡分別承擔不同職責:

元件在迴圈裡的作用你的控制點
Reasoning model理解目標、拆步驟、判斷下一步選擇 Planning 或 Fast,給清晰驗收條件
Tools讀寫檔案、執行終端、控制瀏覽器、接 MCP只開放必要路徑、命令和 URL
Artifacts承載 task list、plan、diff、截圖、錄屏、walkthrough用評論和 Proceed 控制節奏
Knowledge沉澱長期專案事實和模式檢查是否寫入過時結論

一個成熟的提示詞要覆蓋這四層。只寫“幫我修一下”會讓 agent 自行猜測目標、工具和驗收標準;寫清邊界後,Antigravity 的 artifacts 才能真正發揮作用。

3. Goal 要寫成可驗收目標

差的目標:

最佳化一下這個頁面。

好的目標:

把設定頁儲存按鈕從無響應修到可點選儲存。
驗收:
1. 點選按鈕後顯示儲存成功狀態。
2. 重新整理頁面後設定仍保留。
3. 交付 screenshot 和 walkthrough。

Antigravity 有 browser 和 artifacts,prompt 裡就應該寫驗收證據。否則 agent 可能只交程式碼,不交證明。

更完整的目標可以這樣寫:

任務:修復設定頁儲存按鈕無反饋的問題。
範圍:只允許修改 app/settings/ 和相關測試檔案。
禁止:不要改認證邏輯,不要新增依賴,不要格式化無關檔案。
驗收:
1. 空輸入、有效輸入、儲存失敗三個路徑都有反饋。
2. 執行現有測試,並說明結果。
3. 用 browser 驗證 desktop 和 mobile。
4. 交付 diff、截圖、walkthrough 和剩餘風險。

這個寫法讓 agent 很難把任務擴散到無關區域,也讓你後續有標準判斷它是否完成。

4. Plan 要審三件事

看 implementation plan 時,別糾結每個詞,重點看三件事:

審查點問題
範圍是否碰到無關目錄、設定、依賴
驗證是否包含測試、瀏覽器、截圖或 walkthrough
回退是否知道改了哪些檔案,能否撤銷

如果 plan 沒有驗證步驟,不要批准。讓它補“如何證明完成”。

官方 Implementation Plan 文件說明,Agent 通常會在動手前請求 review,除非你的 Artifact Review Policy 設成 Always Proceed。這裡的 Proceed 不是禮貌按鈕,而是工程批准。點之前至少確認:

  1. 計劃沒有擴大範圍。
  2. 計劃沒有碰敏感檔案。
  3. 計劃說清了驗證方式。
  4. 計劃包含失敗後如何回退。
  5. 計劃和你最初的驗收條件一致。

5. Permission 是任務邊界

許可權請求不是煩人的彈出視窗,而是你控制風險的介面。看到 permission request 時問:

  1. 這個命令是否必要?
  2. 這個路徑是否在 workspace 內?
  3. 這個 URL 是否和任務有關?
  4. 這個 MCP tool 是否有外部副作用?
  5. 拒絕後能否換成更小動作?

第一次上真實專案,建議按這個順序放權:

只讀分析 -> 單檔案修改 -> 低風險測試命令 -> localhost 瀏覽器驗證 -> 外部系統只讀

不要第一天就給完整終端自動執行、workspace 外檔案訪問和外部網站自由瀏覽。Agent 能做的越多,越需要 artifacts 留證據。

6. Observe 不是隻讀記錄

agent 執行後會產生多個觀察物件:

  • terminal 輸出
  • test 結果
  • file diff
  • browser screenshot
  • console log
  • network 或頁面狀態
  • artifact

成熟用法是讓 agent 把這些觀察結果寫進 walkthrough,而不是散落在中間過程裡。

觀察階段最常見的誤判是“命令沒報錯,所以完成了”。正確順序是:

  1. 先看 diff 是否只改了授權範圍。
  2. 再看測試或構建是否真的執行。
  3. UI 任務看截圖和錄屏。
  4. 瀏覽器任務檢查 console。
  5. 最後讀 walkthrough,確認它和證據一致。

7. Feedback 要貼著 artifact

Antigravity 支援在 artifact 或 diff 上評論。反饋要具體:

差的反饋:

不太好,再改改。

好的反饋:

截圖裡 mobile 寬度下按鈕貼到了卡片邊緣。
請只調整 `.settings-actions` 的 spacing,不要改顏色和文案。
改完重新截圖驗證。

好的反饋有三個特點:指向具體 artifact,限定修改範圍,要求重新驗證。不要只說“再最佳化一下”,那會把 agent 重新推回猜測狀態。

8. Done 的標準

一個任務可以接受,至少滿足:

  1. diff 範圍合理。
  2. 沒有觸碰敏感檔案。
  3. 測試或瀏覽器驗收透過。
  4. walkthrough 說清做了什麼。
  5. 剩餘風險寫清楚。

如果只是“程式碼看起來沒問題”,還沒到 Done。

本章自檢

完成本章後,用這 3 個問題檢查自己是否真正理解:

  1. Antigravity Agent 的任務迴圈為什麼不能只看最後回覆?
  2. Implementation Plan 點 Proceed 前要檢查哪三類內容?
  3. UI 任務為什麼必須把 browser 驗證和 walkthrough 寫進驗收條件?

透過標準:你能給一個真實功能修復寫出目標、範圍、禁止項、驗證步驟和證據要求。

官方來源

接下來去哪

本頁目錄