Hermes Agent 中文教程
基於 Nous Research Hermes Agent 官方資料重寫的中文教程,作為開源 Agent 執行時的橫向研究資料。
Hermes Agent 中文教程基於 Nous Research 官方文件、llms.txt 和上游原始碼整理,覆蓋安裝、配置、工具、記憶、技能、訊息閘道器和自動化邊界。
Hermes 不是翔宇主站的核心產品詞。在這個教程站裡,它的價值是橫向參考:幫助中文開發者觀察一個開源 agent runtime(代理執行時)如何組織長期記憶、技能學習、多平臺接入、工具執行、終端後端和後臺任務。
先給結論:第一次讀 Hermes,不要從自動化開始。先跑通 CLI(命令列)、provider(推理服務商)和 session(會話),再理解 tools、memory、skills 和 Gateway(訊息閘道器)。
官方定位
Nous Research 官方把 Hermes Agent 定義為 self-improving AI agent(自我改進型 AI 代理)。它不是繫結在 IDE 裡的 coding copilot(編碼助理),也不是單個 API 外面包一層聊天介面,而是一個可以常駐在本機、VPS、GPU 叢集、Daytona、Modal 或容器環境裡的 autonomous agent(自主代理)。
官方 Hero 區把它定義為「當前唯一帶有 built-in learning loop(內建學習閉環)的代理」:Hermes 會從經驗裡建立 skills,在使用過程中改進 skills,主動提醒自己持久化知識,並跨 session 逐步形成使用者模型。這意味著它的學習重點不是「哪個按鈕能生成程式碼」,而是長期 agent runtime 如何儲存事實、複用流程、選擇執行環境和控制遠端入口——而且執行時間越長,能力越強(官方原話 "gets more capable the longer it runs")。
能力地圖
| 能力面 | 官方入口 | 中文學習重點 |
|---|---|---|
| CLI / TUI(命令列 / 終端 UI) | CLI、TUI、sessions | 先跑通普通對話、session 恢復和模型配置 |
| Provider(推理服務商) | Nous Portal、OpenRouter、OpenAI、Anthropic、Google、OpenAI 相容端點 | 把 key、model、fallback(備用鏈路)和 credential pool(憑據池)分清 |
| Terminal backend(終端後端) | local、Docker、SSH、Daytona、Singularity、Modal、Vercel Sandbox | 決定命令到底在哪個環境執行(按官方 Tools 頁 Backends 段 當前列表為準) |
| Tools(工具) | built-in tools、toolsets(工具集)、MCP(模型上下文協議) | 只開啟當前任務需要的工具集(數量按官方 Tools Reference 當前列表為準) |
| Memory(記憶) | MEMORY.md、USER.md、session_search、memory providers | 區分長期事實、歷史檢索和外部記憶外掛 |
| Skills(技能) | agent-created skills(代理自建技能)、Skills Hub、agentskills.io | 把可重複流程沉澱成可審查技能 |
| Messaging Gateway(訊息閘道器) | Telegram / Discord / Slack / WhatsApp / Signal / Matrix / Email / SMS / DingTalk / Feishu / WeCom / Microsoft Teams 等 15+ 平臺一站接入 | 遠端入口上線前先做 allowlist(允許名單)和會話隔離 |
| Automation(自動化) | cron(定時)、delegation(委派子代理)、kanban(看板)、persistent goals(持久目標)、hooks(生命週期鉤子)、batch processing(批次處理) | 後臺任務必須有許可權、日誌和回復邊界 |
這張表也是本系列的閱讀骨架。Hermes 的頁面很多,不能按官方目錄從頭機械翻譯。中文教程會按「可安全上手的順序」重新組織。
兩條閱讀路徑
適合誰讀
這組教程適合三類讀者:
- 想快速查 Hermes 安裝、配置、工具和訊息平臺接入的開發者。
- 想比較不同 agent runtime 設計取捨的中文開發者。
- 想把 memory、skills、toolsets、Gateway 和自動化邊界拆開理解的工作流設計者。
不適合的場景也要說清:如果你只是想學習主流 AI 程式設計工具,本教程不是第一入口。可以先讀 Codex、Claude Code、Cursor、Copilot 或 OpenClaw 系列,再回來看 Hermes 的執行時設計。
商業專案裡的使用邊界
Hermes 適合做長期助手、內部自動化、研究型 agent、遠端任務入口和技能系統樣板。它不適合作為團隊第一次接觸 AI 程式設計工具時的唯一入口,因為它的能力面同時覆蓋本地命令、遠端終端、訊息平臺、記憶、技能、MCP 和 cron,配置自由度高,也更容易把許可權邊界放大。
商業專案裡建議按這個順序接入:
- 只開 CLI,確認 provider、session、config(配置)和日誌。
- 再開 toolsets(工具集),明確哪些命令能跑、在哪個 terminal backend(終端後端)跑。
- 再開 memory 和 skills,只儲存可驗證的長期事實與可複用流程。
- 再接 Gateway,讓 Telegram、Slack、Discord 等入口先跑在 allowlist(允許名單)下。
- 最後才接 cron、delegation(委派)、hooks(鉤子)、persistent goals(持久目標)和 batch processing(批次處理)。
只要跳過前兩步,後面的排障都會變得困難:你無法判斷問題來自模型、配置、工具、遠端環境、記憶汙染還是訊息平臺授權。
三層分工
- 教程站:吸收 Hermes 官方資料並重寫中文教程,作為 Agent 框架研究資料。
- 翔宇主站:只在需要比較 Agent 框架、工作流設計和實戰取捨時引用 Hermes。
- GitHub:保留公開門面倉和樣章,完整內容源留在私有生產倉。
學習順序
先跑通
從 installation 和 quickstart 開始,確認 provider 與 session 能正常工作。
再理解
回到原理篇,建立定位、穩定閉環、配置和工具邊界。
再擴充套件
按需啟用記憶、skills、訊息閘道器和自動化,不一次性全開。
最後自動化
在 cron、background session 和遠端入口前先確認許可權邊界。
學完後的判斷標準
讀完 Hermes 系列,不要求你記住所有命令,但應該能回答這些問題:
- Hermes 和 IDE copilot 的邊界是什麼。
~/.hermes/config.yaml、.env、auth.json、SOUL.md分別負責什麼。- toolset 和 terminal backend 為什麼必須分開理解。
MEMORY.md、USER.md、session_search和外部 memory provider 分別解決什麼問題。- 什麼任務值得做成 skill,什麼任務只應該留在當前對話。
- Gateway 上線前需要哪些授權、allowlist 和日誌邊界。
- cron、delegation、hooks、persistent goals 什麼時候不該啟用。
官方資料
- 官方文件:https://hermes-agent.nousresearch.com/docs
- 官方
llms.txt:https://hermes-agent.nousresearch.com/docs/llms.txt - 上游原始碼:https://github.com/NousResearch/hermes-agent
不確定的實現細節以官方文件、llms.txt 和上游原始碼為準。本系列只在中文教程層面重寫和解釋,不替代官方參考文件。
延伸學習
- 翔宇工作流主站:xiangyugongzuoliu.com
- 翔宇 AI 程式設計實操課:檢視課程介紹與學習路徑
- Hermes Agent 教程公開儲存庫:github.com/xiangyugongzuoliu/hermes-agent-tutorial