规划 Hermes Agent 学习路径
按经验等级和使用场景选择 Hermes Agent 文档阅读顺序,先跑通基础闭环,再进入工具、记忆、消息网关和自动化。
Hermes Agent 的官方文档树很大:CLI、TUI、provider(推理服务商)、sessions(会话)、tools、memory、skills、context files(上下文文件)、MCP(模型上下文协议)、Gateway、cron、delegation(子代理委派)、hooks(生命周期钩子)、batch(批处理)、RL training(强化学习训练)、plugins、developer guide(开发者指南)全都在里面。学它不适合从第一篇一路扫到最后一篇——先完成基础闭环,再按你接下来要做的事深入。
官方资料:Learning Path、llms.txt、GitHub README。
先给结论:所有人先完成「安装 → provider 配置 → 第一次对话 → session 恢复」;之后再按「本地 CLI / 消息机器人 / 长期助手 / 自动化 / 开发扩展 / 研究训练」六类目标选择路径。基础不稳就开扩展,等于在裂缝上加压。
共同起点
无论你后面想做什么,都先完成这条链路:
Installation -> Quickstart -> first chat -> session resume
(安装 → 快速上手 → 第一次对话 → 会话恢复)对应入口:
安装 Hermes Agent
先确保命令可用、~/.hermes 目录存在、provider 配置入口正常。
快速上手 Hermes Agent
装好之后 5 分钟内完成 provider、第一次对话和 session 恢复。
如果这条链路还不稳定,不要先看 Gateway、cron、MCP、skills 或开发者扩展。
按经验等级走
官方学习路径页给了三档时间估算(Beginner ~1 小时 / Intermediate ~2–3 小时 / Advanced ~4–6 小时)。本文的中文路径比官方多一点:"为什么这一步" 的说明。
新手:跑起来、能对话、能恢复、能看懂报错(约 1 小时)
- 安装 Hermes Agent —— 命令可用、PATH 生效。
- 快速上手 Hermes Agent —— provider 配置 + 第一次对话。
- 配置 Hermes Agent —— 看清
~/.hermes/下各文件的分工。 - 第一个稳定闭环 —— 把上面三步压成可重复的最小流程。
- 工具系统与终端后端 —— 在开 toolset 之前先理解执行边界。
进阶:把 Hermes 从本地 CLI 扩展成长期助手或消息入口(约 2–3 小时)
- Sessions 与恢复 —— session 复用是后续所有功能的载体。
- 消息网关 —— 接平台前先理解 allowlist 和 DM pairing。
- 工具系统 —— 远程接入前控制工具权限。
- 技能系统 —— 把可复用流程沉淀为 skill。
- 记忆系统 —— 长期事实记忆的写入门槛。
- 自动化边界 —— 后台任务上线前的安全基线。
高级:扩展工具、开发插件、接 MCP、做批处理或研究训练(约 4–6 小时)
- 官方 Plugins / MCP / Hooks 文档
- 官方 Architecture / Agent Loop / Prompt Assembly 文档
- 官方 Adding Tools / Creating Skills 文档
- 官方 Batch Processing 文档
- 上游源码和测试:github.com/NousResearch/hermes-agent
高级路径不适合跳过基础闭环直接看源码。不了解 session、toolsets、memory 和 provider runtime(推理服务商运行时),源码阅读会很散,看到的是一堆类名而不是动作链路。
按使用场景走
与官方 By Use Case 段对照——挑一条贴近你目标的路径开干。
本地 CLI 编码助理
Installation -> Quickstart -> CLI Usage -> Code Execution -> Context Files -> Tips & Tricks
(安装 → 快速上手 → 配置 → 工具 → 上下文文件 → 安全)Telegram / Discord / Slack 机器人
Installation -> Configuration -> Messaging Gateway -> Telegram/Discord 子页 -> Voice Mode -> Security
(安装 → 配置 → 消息网关 → 选定平台 → 语音模式 → 安全)个人长期助手
Quickstart -> Memory -> Skills -> Sessions -> Gateway -> Cron
(快速上手 → 记忆 → 技能 → 会话 → 消息网关 → 定时)团队共享入口
Quickstart -> Messaging -> allowlist / DM pairing -> toolsets per platform -> logs
(快速上手 → 消息平台 → 允许名单与私聊配对 → 按平台设工具集 → 日志审计)自动化任务
Quickstart -> Cron -> Delegation -> Hooks -> Delivery -> rollback plan
(快速上手 → 定时 → 子代理委派 → 钩子 → 投递 → 回滚预案)自定义能力开发
Plugins -> Tools -> Skills -> MCP -> Architecture -> Tests
(插件 → 工具 → 技能 → MCP 集成 → 架构源码 → 测试)功能地图
Tools
文件、终端、浏览器、web、memory、cron、delegation 等可调用能力——按 toolset 分组按需启用。
Skills
把可复用流程和过程性知识沉淀为按需加载的 skill;外部 skill 装前必查密钥与脚本。
Memory
MEMORY.md(项目)、USER.md(用户)、session_search(历史检索)、外部 memory provider 各自解决不同时间尺度的记忆问题。
Messaging
通过 Gateway 接 Telegram、Discord、Slack、WhatsApp、Signal、Email、DingTalk、Feishu、WeCom 等 15+ 平台。
这组中文教程不复刻官方完整目录,而是把最关键的使用面重写成中文学习路径。遇到实现细节(命令参数、配置可选值、限额),以官方 docs、llms.txt 和 GitHub 源码为准——本站只是中文导航与判断指引,不是命令字典。
每读一页都问三件事
读 Hermes 文档容易"看完就忘",因为页面间联动密集、术语很多。每读完一页,强制自己回答下面三个问题:
- 这页解决的真实问题是什么?(不是"它在讲 cron",而是"它解决了我哪种实际场景下的什么痛点")
- 它依赖前面哪一层能力?(cron 依赖 session + 工具集 + 日志,session 不稳就开 cron 等于在流沙上盖楼)
- 今天启用它,最小验收动作是什么?(不是"配完就行",而是"配完后我跑哪条命令能确认它真的在工作")
能回答这三个问题,再进入下一页。不能回答,说明你是在堆功能,不是在搭稳定工作流——回头补这页或回退一层再读。
下一步
配置 Hermes Agent
继续读懂 ~/.hermes 下 config.yaml、.env、auth.json 各自的分工,以及 provider 和 terminal backend 怎么切换。
Hermes Agent 是什么
如果还没建立整体心智模型,先从原理篇第一篇开始——花 30 分钟比直接翻命令省一整天。