【Hermes Agent 完整教學】NousResearch 的自我成長型 AI 助手

大多數 AI 助手會忘記你說過的話,這要介紹的是 Hermes Agent 則是會從每次對話中累積技能、記住你的偏好,並在下一次互動時主動套用這些經驗。

NousResearch 把這個設計稱為「The agent that grows with you」。

這篇文章帶你從零開始安裝 Hermes Agent,設定你偏好的 LLM,串接 Telegram,並理解讓它持續進化的 Skills 系統。

什麼是 Hermes Agent?

Hermes Agent 是 NousResearch 開源的 AI Agent 框架,MIT 授權,與同名的 Hermes 3 LLM 是兩個不同的產品——Hermes 3 是語言模型,Hermes Agent 是可以在上面跑任意模型的 Agent 執行框架。

它的核心設計理念是閉環學習

  • Agent 在完成複雜任務後,會自動從過程中提取並儲存「技能(Skill)」
  • 這些技能在後續使用中持續自我優化
  • 跨對話的記憶透過 FTS5 全文搜尋索引,讓 Agent 能查詢自己的歷史對話
  • 使用者畫像透過 Honcho 方言建模,Agent 逐漸深化對你的了解

它不綁定任何單一模型或平台:可以跑在 5 美元的 VPS 上,也可以在 GPU 叢集或 Modal 無伺服器架構運行——你用 Telegram 傳訊息,它在雲端虛擬機上工作,閒置時幾乎零成本。

五大核心能力

1. 閉環學習系統

這是 Hermes Agent 最獨特的能力。一般 AI 助手的知識是靜態的;Hermes 會在每次完成複雜任務後,自動產生對應的 Skill 並儲存到個人技能庫:

  • 任務完成 → 自動建立 Skill:不需要手動整理,Agent 自己決定哪些經驗值得保留
  • Skills 在使用中自我改善:每次呼叫一個 Skill,Agent 可以在執行後優化它的定義
  • 定期 Nudge 機制:Agent 會主動提醒自己持久化重要知識,避免有價值的資訊流失在對話記錄中
  • 相容 agentskills.io 開放標準:技能可以跨 Agent 分享

2. 多平台整合

一個 Gateway 行程,同時處理所有通訊平台:

  • Telegram、Discord、Slack、WhatsApp、Signal
  • 語音備忘錄轉錄
  • 跨平台對話連續性(從 Telegram 切換到 CLI,對話記憶不中斷)
  • 完整 TUI 終端介面,支援多行編輯、Tab 自動補全指令、串流工具輸出

3. 任意 LLM 切換

hermes model

一個指令切換模型供應商,不需要改程式碼:

供應商說明
Nous PortalNousResearch 自家入口
OpenRouter200+ 模型,單一帳號統一計費
NVIDIA NIMNemotron 系列
OpenAIGPT-4o、o1 等
自訂端點任何相容 OpenAI API 格式的服務

4. 排程自動化

內建 Cron 排程器,用自然語言設定定期任務,結果推送至任何已設定的平台:

每天早上 8 點,用 Telegram 傳給我今天的行事曆摘要
每週日晚上,備份我的工作目錄並報告異常
每月 1 號,產出上個月的專案進度報告

不需要學 cron 語法,Agent 自動轉譯並排程。

5. 子代理與平行執行

  • Spawn 獨立子代理:主 Agent 可以派生隔離的子代理並行處理工作流程
  • Python RPC:寫 Python 腳本直接呼叫 Agent 的工具,將多步驟 pipeline 壓縮成零 context 成本的單一操作
  • 批次軌跡生成:支援 Atropos RL 環境,用於訓練下一代工具呼叫模型

安裝與快速上手

一行指令安裝

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

支援 Linux、macOS、WSL2 和 Android(Termux)。Windows 原生不支援,需透過 WSL2 安裝。

安裝完成後重新載入 Shell:

source ~/.bashrc    # 或 source ~/.zshrc(若使用 zsh)

初始設定

hermes setup    # 互動式設定精靈,一次設定好所有選項
hermes model    # 選擇 LLM 供應商與模型
hermes          # 開始對話

設定精靈會引導你完成:LLM 供應商選擇、API Key 設定、Telegram 等平台串接(可選)。

從 OpenClaw 遷移

若你原本使用 OpenClaw,Hermes 可以自動匯入所有設定:

hermes claw migrate              # 互動式遷移
hermes claw migrate --dry-run    # 預覽遷移內容,不實際執行

可遷移的內容包含:SOUL.md 人設、記憶檔案、自建 Skills、API Keys、平台設定。

CLI 日常使用

hermes              # 開啟互動 TUI
hermes tools        # 設定啟用哪些工具(40+ 工具可選)
hermes config set   # 設定個別設定值
hermes doctor       # 診斷問題
hermes update       # 更新至最新版本

對話中的常用斜線指令:

指令功能
/new/reset開新對話
/model [provider:model]切換模型
/personality [name]切換人設
/skills瀏覽技能庫
/compress壓縮 context
/usage查看 token 用量
Ctrl+C中斷當前工作並重新引導

Skills 系統:讓 Agent 從經驗中學習

Skills 是 Hermes Agent 最值得深入了解的機制。每個 Skill 是一段結構化的「程序性記憶」,定義了如何完成特定類型的任務。

Skills 的生命週期:

  1. 自動建立:Agent 完成複雜任務後,判斷這個流程值得保留,自動寫成 Skill
  2. 手動建立:使用 /skills 指令瀏覽或直接在對話中叫出 Skill(/<skill-name>
  3. 自我優化:每次執行後,Agent 可以更新 Skill 的定義使其更精確
  4. 社群分享:Skills 相容 agentskills.io 開放標準,可以發布或使用社群貢獻的 Skills

搭配記憶系統使用:

Hermes 的記憶不只是對話歷史,它會建立你的用戶畫像——你的工作方式、偏好的溝通風格、常用工具——並在每次互動中用這些資訊調整回應策略。

記憶系統由兩部分組成:

  • MEMORY.md:Agent 主動記住的重要事項(工作偏好、決策記錄等)
  • 跨對話搜尋:FTS5 索引讓 Agent 能查詢幾個月前的對話,找出相關背景

多平台整合與排程自動化

設定 Messaging Gateway

hermes gateway setup    # 設定各平台 Bot
hermes gateway start    # 啟動 Gateway 行程

Gateway 啟動後,從 Telegram(或其他平台)傳訊息給 Bot,即可在任何地方控制你的 Agent。Gateway 支援:

  • 語音備忘錄:自動轉錄語音訊息
  • 跨平台連續性:在 Telegram 開始的對話,可以在 CLI 繼續
  • /status 查看 Agent 狀態、/sethome 設定主要平台

七種執行環境

Hermes 支援七種 Terminal Backend,讓你的 Agent 不被綁定在本機:

Backend特點
Local最簡單,直接在本機執行
Docker容器隔離,安全沙箱
SSH遠端伺服器執行
ModalServerless,閒置近零成本
DaytonaServerless 持久化環境
Vercel Sandbox邊緣運算
SingularityHPC 叢集

對於一般開發者,建議從 LocalModal 開始:Modal 讓你的 Agent 在雲端持續運行,閒置時不計費,只需在使用時喚醒。


Hermes Agent 的真正價值不在於它能執行什麼,而在於它會記住如何把事情做得更好。每一次互動都在擴展它的能力——從第一天的通用 AI 助手,逐漸成為熟悉你工作方式的個人化工具。

hermes setup 開始,然後讓它自己成長。


參考資料

GitHub: NousResearch/hermes-agent · 文件: hermes-agent.nousresearch.com/docs