使用記憶系統

📖 本篇術語速查表

英文 / 縮寫	中文	一句話解釋
Memory	記憶	Hermes 的持久上下文。
分層	layers	不同範圍的記憶。
精簡	concise	記憶短而準。

不想讀完？把下面這段提示詞丟給 AI 幫你跑完——幫你配好 Hermes 的記憶，讓它記對該記的。

你是 Hermes 記憶設定顧問。

【角色】
Hermes 記憶設定顧問，按最小夠用、安全優先的原則給可落地方案，每條結論都落到能照做的具體步驟或示例，不停留在「建議」「考慮一下」這類空泛表述。

【輸入】
- 想讓它穩定記住什麼：___
- 適用範圍：___
- 敏感資訊情況：___
- 現有記憶：___
- 經驗水平：___

【工作流程】
1. 梳理記憶分層
2. 把內容放到合適層
3. 給精簡寫法
4. 標出不該進記憶的
5. 給驗證

【輸出規範】
▌一、記憶分層
▌二、內容歸層
▌三、精簡寫法
▌四、不該寫的 + 驗證

【硬約束】
- 敏感資訊不進記憶
- 記憶短而準
- 陳舊記憶及時更新
- 不要替我臆測情況或編造不存在的功能，資訊不全先問清
- 不確定的設定或介面一律以官方文件為準，禁止照搬過時寫法
- 給的每條結論都要落到具體可照做的步驟或示例，不停留在「建議」「考慮一下」這類沒法直接執行的空泛表述

Hermes 的內建記憶是 bounded curated memory（有界精選記憶）：容量有限，內容要精選。它不是無限記錄，也不是把所有聊天曆史塞進 prompt，而是讓新 session 一開始就知道關鍵偏好、環境事實和專案約定——記憶條目應該像精煉筆記，不是日記流水賬。

官方資料：Persistent Memory、Memory Providers、Sessions、Honcho、Context Files。

先給結論：MEMORY.md 存環境和專案事實，USER.md 存使用者偏好；兩者只在 session 啟動時注入為凍結快照（frozen snapshot，本輪對話內修改不會反映回目前 prompt）；歷史細節用 session_search（FTS5 全文檢索）查，不要硬塞進記憶。

兩個內建記憶檔案

內建記憶位於：

~/.hermes/memories/
├── MEMORY.md
└── USER.md

MEMORY.md

Agent 的個人筆記：環境事實、專案約定、工具坑、已驗證結論。預設 2200 字元左右。

USER.md

使用者畫像：溝通偏好、身份、習慣、明確要求。預設 1375 字元左右。

官方預設限制按目前 Memory 設定檔（截至本文核驗日：MEMORY.md ~2200 chars、USER.md ~1375 chars）。這個限制是設計，不是缺陷——它強迫記憶保持短、準、穩定。容量越大，每次啟動 system prompt 的"權威指令"越多，模型反而更容易被舊錯誤帶偏。

凍結快照機制

每個 session 啟動時，Hermes 會把記憶讀入 system prompt，形成凍結快照。目前 session 中新增、替換或刪除的記憶會立刻寫盤，但不會重新整理目前 prompt；新 session 才能看到。

這個設計的好處是保持 prompt prefix 穩定，減少執行中上下文漂移。代價是你不能指望“剛儲存的記憶”馬上影響目前對話。

實際使用時按這個原則：

目前任務需要立即生效：直接在目前對話說明。
長期事實需要下次也生效：寫入 memory。
歷史任務需要回查：用 session_search。

memory tool 的動作

Agent 用 memory tool 管理條目：

add：新增記憶。
replace：用 old_text 的唯一子串匹配並替換。
remove：用 old_text 的唯一子串匹配並刪除。

示例：

memory(
    action="replace",
    target="memory",
    old_text="dark mode",
    content="User prefers light mode in VS Code, dark mode in terminal",
)

replace 和 remove 依賴唯一子串。如果匹配到多條，工具會要求更具體的 old_text。這比整段複製更適合維護短記憶。

該儲存什麼

適合儲存到 MEMORY.md：

穩定環境事實，例如 OS、shell、主要工具、伺服器埠。
專案長期規則，例如測試命令、部署方式、目錄約定。
已驗證過的修復結論。
反覆出現的工具問題和 workaround。
任務完成後的高價值索引，而不是完整過程。

適合儲存到 USER.md：

溝通偏好。
格式偏好。
技術水平和工作習慣。
明確要求以後都遵守的規則。

不適合儲存：

大段記錄、程式碼、表格。
一次性臨時路徑。
能輕易重新查到的通用知識。
已經存在於 AGENTS.md、CLAUDE.md、SOUL.md 或專案文件裡的內容。
不確定、未驗證、可能過期的猜測。

錯誤記憶比沒有記憶更危險。錯但持久，會汙染後續 session。

官方文件說明，記憶寫入前會掃描 prompt injection（提示注入：惡意文本偽裝成系統指令）、credential exfiltration（憑據外洩：偷塞 token/密碼）、SSH backdoor（SSH 後門：植入未授權登入入口）、不可見 Unicode（用零寬字元藏惡意內容）等威脅模式。原因很直接：記憶會進入 system prompt（系統提示），惡意記憶等於長期注入——下次啟動模型仍會把它當權威讀取。

不要把外部網頁、issue、聊天記錄裡的原文直接儲存為記憶。先提煉成你驗證過的事實，再寫入。

session_search

session_search 是歷史會話檢索，不是 curated memory。

適合回查：

上次某個長期任務停在哪裡。
之前怎麼修過類似問題。
某個專案跑過哪些命令。
使用者曾經糾正過什麼。

Hermes 會把 CLI 和 messaging sessions 存到 SQLite，並用 FTS5 做全文檢索，再用模型總結相關結果。

hermes sessions list

簡單區分：

memory         -> 每個 session 都該知道的關鍵事實
session_search -> 需要時再查的歷史細節

外部 memory provider

Hermes 還支援 Honcho（AI 原生使用者建模，Nous Research 推薦）、OpenViking、Mem0（流行 AI 記憶服務）、Hindsight、Holographic、RetainDB、ByteRover、Supermemory 等外部 memory provider（記憶外掛）。它們提供更深的使用者建模、語義搜尋、知識圖譜或自動事實抽取。

它們和內建 memory 並行工作，不替代 MEMORY.md / USER.md。

hermes memory setup
hermes memory status

只有當內建 memory 和 session_search 的邊界已經清楚，再考慮外部 provider。否則只是把錯誤記憶擴散到更復雜的系統裡。

驗收清單

健康的記憶系統應該滿足下面 6 項。任何一項答不上來 = 記憶使用方式還需要調整：

新 session 啟動時能看到關鍵偏好和環境事實——驗證：開新 chat，問"你知道我用什麼 OS / 專案用什麼堆疊"
錯誤記憶能被 replace 或 remove——驗證：故意新增錯誤條目，再用唯一子串刪掉
容量長期不接近滿載（≤80%）——驗證：hermes memory status 看佔比
一次性記錄沒有進入 curated memory——驗證：grep MEMORY.md 看有沒有大段輸出貼上
需要回查歷史時用 session_search 工具（這是 agent 在對話裡自己呼叫的內部工具，不是 CLI 命令；使用者在 CLI 用 hermes sessions list / hermes sessions browse 看 session 清單，跨 session 全文檢索讓 agent 用 session_search 完成）
外部 provider 沒有替代人工判斷和安全審查——驗證：開了 Honcho 等仍然能解釋"為什麼這條資訊值得長期記"

官方資料

Persistent Memory
Memory Providers（外部 provider 完整列表）
Honcho（dialectic 使用者建模）
Sessions（session_search 來源 + sqlite/FTS5 實現）
Context Files（專案級 context vs 全域 SOUL.md / 長期 memory 的邊界）

使用記憶系統

兩個內建記憶檔案

MEMORY.md

USER.md

凍結快照機制

memory tool 的動作

該儲存什麼

容量管理

安全掃描

session_search

外部 memory provider

驗收清單

官方資料

下一步

技能系統

記憶與召回原理

本頁目錄