Hermes Agent 文档
由 Nous Research 打造的自我进化 AI agent。它是唯一内置学习闭环的 agent: 能从经验中创建技能、在使用中不断改进、推动自己把知识持久化下来,并在跨会话中逐步建立对你的更深入理解。
什么是 Hermes Agent?
它不是绑定在 IDE 里的代码副驾,也不是套在单一 API 外面的聊天机器人外壳。它是一个自治 agent,运行得越久,能力就越强。你可以把它放在任何地方: 5 美元的 VPS、GPU 集群,或空闲时几乎不花钱的无服务器基础设施(Daytona、Modal)。你甚至可以让它在自己从未手动 SSH 登录过的云端虚拟机上工作,再通过 Telegram 与它对话。它并不依赖你的笔记本电脑。
快速链接
| 🚀 安装 | 在 Linux、macOS 或 WSL2 上用 60 秒完成安装 |
| 📖 快速开始教程 | 完成第一次对话,并体验值得优先尝试的关键功能 |
| 🗺️ 学习路径 | 根据你的经验水平找到合适的文档阅读路径 |
| ⚙️ 配置 | 配置文件、大模型提供商(provider)、模型和各种选项 |
| 💬 消息网关 | 设置 Telegram、Discord、Slack 或 WhatsApp |
| 🔧 工具与工具集 | 47 个内置工具及其配置方式 |
| 🧠 记忆系统 | 会随着会话积累而持续增长的持久记忆系统 |
| 📚 技能系统 | 由 agent 创建并重复使用的程序性记忆 |
| 🔌 MCP 集成 | 连接 MCP 服务器、筛选其中的工具,并安全地扩展 Hermes |
| 🧭 在 Hermes 中使用 MCP | 实用的 MCP 配置模式、示例与教程 |
| 🎙️ 语音模式 | 在 CLI、Telegram、Discord 和 Discord VC 中进行实时语音交互 |
| 🗣️ 在 Hermes 中使用语音模式 | 面向 Hermes 语音工作流的实操配置与使用模式 |
| 🎭 个性与 SOUL.md | 通过全局 SOUL.md 定义 Hermes 的默认语气风格 |
| 📄 上下文文件 | 会影响每次对话的项目上下文文件 |
| 🔒 安全 | 命令审批、授权控制与容器隔离 |
| 💡 技巧与最佳实践 | 帮你更好发挥 Hermes 能力的实用技巧 |
| 🏗️ 架构 | 了解 Hermes 在底层是如何工作的 |
| ❓ 常见问题与故障排除 | 常见问题与解决方案 |
核心特性
- 闭环学习系统 — 包含由 agent 策展的记忆、周期性 nudges、自主创建技能、在使用过程中自我改进技能、结合 LLM 摘要的 FTS5 跨会话回忆,以及 Honcho 的辩证式用户建模
- 不仅能跑在笔记本上 — 支持 6 种终端后端: 本地、Docker、SSH、Daytona、Singularity、Modal。Daytona 和 Modal 提供无服务器持久化能力,环境空闲时会休眠,成本几乎可以忽略
- 你在哪工作,它就能在哪工作 — CLI、Telegram、Discord、Slack、WhatsApp、Signal、Matrix、Mattermost、Email、SMS、DingTalk、Feishu、WeCom、BlueBubbles、Home Assistant,一个网关覆盖 15+ 平台
- 由模型训练团队打造 — 出自 Nous Research,也就是 Hermes、Nomos 和 Psyche 背后的实验室。可配合 Nous Portal、OpenRouter、OpenAI 或任意兼容端点使用
- 定时自动化 — 内置 cron,可将任务投递到任意平台
- 支持委派与并行 — 可生成隔离的 subagent 来并行处理多个工作流;通过
execute_code的程序化工具调用,还能把多步骤流水线压缩成单次推理调用 - 开放标准的技能 — 兼容 agentskills.io。技能可移植、可共享,也能通过 Skills Hub 由社区共同贡献
- 完整的 Web 控制能力 — 支持搜索、提取、浏览、视觉、图像生成与 TTS
- 支持 MCP — 可连接任意 MCP 服务器,扩展工具能力
- 面向研究场景 — 提供批处理、轨迹导出,以及基于 Atropos 的强化学习训练能力。由 Nous Research 构建,也就是 Hermes、Nomos 和 Psyche 模型背后的实验室