AI 程式設計教程中文版

04 · Antigravity 的 Agent 任務迴圈

拆解 Antigravity agent 的任務迴圈:目標、計劃、許可權、執行、觀察、驗證、Artifacts、反饋和回退。

Antigravity 的 agent 不應該被當成“長回覆生成器”。Google 官方把 Agent 定義為:由前沿 LLM 驅動的多步推理系統,能圍繞你已有的程式碼進行推理、呼叫包括瀏覽器在內的多種工具、並透過 tasks 和 artifacts 等方式與使用者溝通。換成實操語言,它的工作不是“回答你”,而是進入一個可審查的任務迴圈:理解目標、讀取上下文、制定計劃、請求許可權、執行、觀察結果、交付證據、等待反饋。

這一篇解決什麼問題:你要學會看 agent 在迴圈裡的每一步,而不是隻看最後一句“完成了”。

閱讀目標:讀完本章,你應該能把一次 Antigravity 任務拆成可驗收目標、plan、許可權、diff、測試、截圖、walkthrough 和回退點。

1. 迴圈圖

flowchart TD
    Goal["目標"] --> Context["讀取上下文"]
    Context --> Plan["Task list / implementation plan"]
    Plan --> Review{"需要人工審閱?"}
    Review -->|是| Human["人工評論 / 批准"]
    Review -->|否| Permission["許可權檢查"]
    Human --> Permission
    Permission --> Execute["執行:edit / terminal / browser / MCP"]
    Execute --> Observe["觀察輸出:diff / logs / DOM / screenshot"]
    Observe --> Verify["驗證:test / browser flow / artifact"]
    Verify --> Walkthrough["Walkthrough"]
    Walkthrough --> Feedback{"反饋或接受?"}
    Feedback -->|反饋| Plan
    Feedback -->|接受| Done["完成"]
    Feedback -->|不滿意| Undo["回退"]

這個迴圈裡最容易忽略的是 Verify(驗證)。沒有驗證的 agent 任務,只是生成了改動,不代表完成。Antigravity 的優勢在於它能把 plan(計劃)、task list(任務清單)、diff(程式碼差異)、screenshot(截圖)、recording(錄屏)、walkthrough(任務總結)變成 artifacts(產物證據);你的工作是把這些證據串成驗收鏈,而不是隻讀聊天記錄。

2. 官方元件如何落到迴圈裡

官方 Agent 文件列出四個核心元件:reasoning model(推理模型)、tools(工具集)、artifacts(產物證據)、knowledge(長期記憶 / 知識庫)。它們在任務迴圈裡分別承擔不同職責:

元件在迴圈裡的作用你的控制點
Reasoning model理解目標、拆步驟、判斷下一步選擇 Planning 或 Fast,給清晰驗收條件
Tools讀寫檔案、執行終端、控制瀏覽器、接 MCP只開放必要路徑、命令和 URL
Artifacts承載 task list、plan、diff、截圖、錄屏、walkthrough用評論和 Proceed 控制節奏
Knowledge沉澱長期專案事實和模式檢查是否寫入過時結論

一個成熟的提示詞要覆蓋這四層。只寫“幫我修一下”會讓 agent 自行猜測目標、工具和驗收標準;寫清邊界後,Antigravity 的 artifacts 才能真正發揮作用。

3. Goal 要寫成可驗收目標

差的目標:

优化一下这个页面。

好的目標:

把设置页保存按钮从无响应修到可点击保存。
验收:
1. 点击按钮后显示保存成功状态。
2. 刷新页面后设置仍保留。
3. 交付 screenshot 和 walkthrough。

Antigravity 有 browser 和 artifacts,prompt 裡就應該寫驗收證據。否則 agent 可能只交程式碼,不交證明。

更完整的目標可以這樣寫:

任务:修复设置页保存按钮无反馈的问题。
范围:只允许修改 app/settings/ 和相关测试文件。
禁止:不要改认证逻辑,不要新增依赖,不要格式化无关文件。
验收:
1. 空输入、有效输入、保存失败三个路径都有反馈。
2. 运行现有测试,并说明结果。
3. 用 browser 验证 desktop 和 mobile。
4. 交付 diff、截图、walkthrough 和剩余风险。

這個寫法讓 agent 很難把任務擴散到無關區域,也讓你後續有標準判斷它是否完成。

4. Plan 要審三件事

看 implementation plan 時,別糾結每個詞,重點看三件事:

審查點問題
範圍是否碰到無關目錄、配置、依賴
驗證是否包含測試、瀏覽器、截圖或 walkthrough
回退是否知道改了哪些檔案,能否撤銷

如果 plan 沒有驗證步驟,不要批准。讓它補“如何證明完成”。

官方 Implementation Plan 文件說明,Agent 通常會在動手前請求 review,除非你的 Artifact Review Policy 設成 Always Proceed。這裡的 Proceed 不是禮貌按鈕,而是工程批准。點之前至少確認:

  1. 計劃沒有擴大範圍。
  2. 計劃沒有碰敏感檔案。
  3. 計劃說清了驗證方式。
  4. 計劃包含失敗後如何回退。
  5. 計劃和你最初的驗收條件一致。

5. Permission 是任務邊界

許可權請求不是煩人的彈出視窗,而是你控制風險的介面。看到 permission request 時問:

  1. 這個命令是否必要?
  2. 這個路徑是否在 workspace 內?
  3. 這個 URL 是否和任務有關?
  4. 這個 MCP tool 是否有外部副作用?
  5. 拒絕後能否換成更小動作?

第一次上真實專案,建議按這個順序放權:

只读分析 -> 单文件修改 -> 低风险测试命令 -> localhost 浏览器验证 -> 外部系统只读

不要第一天就給完整終端自動執行、workspace 外檔案訪問和外部網站自由瀏覽。Agent 能做的越多,越需要 artifacts 留證據。

6. Observe 不是隻讀日誌

agent 執行後會產生多個觀察物件:

  • terminal 輸出
  • test 結果
  • file diff
  • browser screenshot
  • console log
  • network 或頁面狀態
  • artifact

成熟用法是讓 agent 把這些觀察結果寫進 walkthrough,而不是散落在中間過程裡。

觀察階段最常見的誤判是“命令沒報錯,所以完成了”。正確順序是:

  1. 先看 diff 是否只改了授權範圍。
  2. 再看測試或構建是否真的執行。
  3. UI 任務看截圖和錄屏。
  4. 瀏覽器任務檢查 console。
  5. 最後讀 walkthrough,確認它和證據一致。

7. Feedback 要貼著 artifact

Antigravity 支援在 artifact 或 diff 上評論。反饋要具體:

差的反饋:

不太好,再改改。

好的反饋:

截图里 mobile 宽度下按钮贴到了卡片边缘。
请只调整 `.settings-actions` 的 spacing,不要改颜色和文案。
改完重新截图验证。

好的反饋有三個特點:指向具體 artifact,限定修改範圍,要求重新驗證。不要只說“再最佳化一下”,那會把 agent 重新推回猜測狀態。

8. Done 的標準

一個任務可以接受,至少滿足:

  1. diff 範圍合理。
  2. 沒有觸碰敏感檔案。
  3. 測試或瀏覽器驗收透過。
  4. walkthrough 說清做了什麼。
  5. 剩餘風險寫清楚。

如果只是“程式碼看起來沒問題”,還沒到 Done。

本章自檢

完成本章後,用這 3 個問題檢查自己是否真正理解:

  1. Antigravity Agent 的任務迴圈為什麼不能只看最後回覆?
  2. Implementation Plan 點 Proceed 前要檢查哪三類內容?
  3. UI 任務為什麼必須把 browser 驗證和 walkthrough 寫進驗收條件?

透過標準:你能給一個真實功能修復寫出目標、範圍、禁止項、驗證步驟和證據要求。

官方來源

接下來去哪

本頁目錄