可选技能目录
官方可选技能位于 hermes-agent 仓库的 optional-skills/ 下,但默认不会启用。需要显式安装:
hermes skills install official/<category>/<skill>
例如:
hermes skills install official/blockchain/solana
hermes skills install official/mlops/flash-attention
安装后,该技能会出现在 agent 的技能列表中,并在检测到相关任务时自动可加载。
如需卸载:
hermes skills uninstall <skill-name>
Autonomous AI Agents
| Skill | Description |
|---|---|
| blackbox | 将编码任务委派给 Blackbox AI CLI agent。它是一个带内置评审器的多模型 agent,会让多个 LLM 处理任务并选出最佳结果。 |
| honcho | 为 Hermes 配置并使用 Honcho 记忆,包括跨会话用户建模、多 profile 隔离、观察配置与辩证式推理。 |
Blockchain
| Skill | Description |
|---|---|
| base | 查询 Base(Ethereum L2)链上数据并附带美元定价,包括钱包余额、代币信息、交易详情、gas 分析、合约检查、巨鲸检测和实时网络状态。无需 API key。 |
| solana | 查询 Solana 链上数据并附带美元定价,包括钱包余额、代币组合、交易详情、NFT、巨鲸检测和实时网络状态。无需 API key。 |
Communication
| Skill | Description |
|---|---|
| one-three-one-rule | 用于提案与决策的结构化沟通框架。 |
Creative
| Skill | Description |
|---|---|
| blender-mcp | 通过与 blender-mcp 插件的 socket 连接,直接从 Hermes 控制 Blender。可创建 3D 对象、材质、动画,并运行任意 Blender Python(bpy)代码。 |
| concept-diagrams | 生成扁平、极简、支持明暗主题的 SVG 图,并以独立 HTML 文件输出,使用统一的教育类视觉语言(9 组语义色带,自动深色模式)。适合物理装置、化学机理、数学曲线、实体对象、平面图、剖面图、生命周期/流程叙事和中心辐射式系统图。附带 15 个示例图。 |
| meme-generation | 选择模板并用 Pillow 叠加文字,生成真正的 meme 图片,输出实际 .png 文件。 |
| touchdesigner-mcp | 通过 twozero MCP 插件控制运行中的 TouchDesigner,可创建 operator、设置参数、连接节点、执行 Python,并构建实时音频响应视觉和 GLSL 网络,共 36 个原生工具。 |
Dogfood
| Skill | Description |
|---|---|
| adversarial-ux-test | 扮演最难搞、最抗拒技术的产品用户,以角色化方式浏览和吐槽,再通过 RED/YELLOW/WHITE/GREEN 务实分层,只把真实 UX 摩擦转成工单。 |
DevOps
| Skill | Description |
|---|---|
| cli | 通过 inference.sh CLI(infsh)运行 150+ AI 应用,包括图像生成、视频创作、LLM、搜索、3D 和社交自动化。 |
| docker-management | 管理 Docker 容器、镜像、卷、网络和 Compose 栈,包括生命周期操作、调试、清理和 Dockerfile 优化。 |
Email
| Skill | Description |
|---|---|
| agentmail | 让 agent 拥有独立邮箱收件箱。可用 AgentMail 自主管理发送、接收与处理邮件。 |
Health
| Skill | Description |
|---|---|
| fitness-nutrition | 健身训练计划与营养追踪。通过 wger 搜索 690+ 动作,通过 USDA FoodData Central 查询 38 万+ 食物的营养数据,并计算 BMI、TDEE、单次最大重量、宏量营养分配和体脂。纯 Python,无需 pip 安装。 |
| neuroskill-bci | 面向神经科学研究流程的脑机接口(BCI)集成。 |
MCP
| Skill | Description |
|---|---|
| fastmcp | 用 FastMCP 在 Python 中构建、测试、检查、安装和部署 MCP server,涵盖 API/数据库封装为 MCP 工具、暴露资源或 prompts,以及部署流程。 |
| mcporter | mcporter CLI,可直接在终端列出、配置、认证并调用 MCP server/工具(HTTP 或 stdio)。适合临时 MCP 交互;如果需要始终在线的工具发现,请使用内置 native-mcp 客户端。 |
Migration
| Skill | Description |
|---|---|
| openclaw-migration | 将用户的 OpenClaw 定制迁移到 Hermes Agent,包括记忆、SOUL.md、命令 allowlist、用户技能和选定的工作区资产。 |
MLOps
这是最大的可选分类,覆盖从数据整理到生产推理的完整 ML 流水线。
| Skill | Description |
|---|---|
| accelerate | 最简分布式训练 API。只需 4 行就能为任意 PyTorch 脚本添加分布式支持,并统一 DeepSpeed/FSDP/Megatron/DDP。 |
| chroma | 开源 embedding 数据库。可存储 embedding 和元数据,并执行向量搜索与全文搜索,适合 RAG 和语义检索。 |
| clip | OpenAI 的视觉语言模型,连接图像与文本。支持零样本图像分类、图文匹配和跨模态检索,适合图像搜索、内容审核和视觉语言任务。 |
| faiss | Facebook 的高效向量相似度搜索与聚类库,支持十亿级向量、GPU 加速以及多种索引类型(Flat、IVF、HNSW)。 |
| flash-attention | 使用 Flash Attention 优化 Transformer 注意力计算,可实现 2-4 倍提速和 10-20 倍显存下降,支持 PyTorch SDPA、flash-attn、H100 FP8 和 sliding window。 |
| guidance | 使用正则和语法约束控制 LLM 输出,保证 JSON/XML/代码结构有效,并基于 Guidance 构建多步工作流。 |
| hermes-atropos-environments | 构建、测试和调试 Hermes Agent 的 Atropos RL 环境,涵盖 HermesAgentBaseEnv 接口、奖励函数、agent loop 集成和评测。 |
| huggingface-tokenizers | 基于 Rust 的高速 tokenizer,20 秒内可处理 1GB 文本,支持 BPE、WordPiece 和 Unigram。 |
| instructor | 使用 Pydantic 校验从 LLM 回复中提取结构化数据,并自动重试失败提取,还支持流式部分结果。 |
| lambda-labs | Lambda Labs 的保留式和按需 GPU 云实例,适合训练与推理,支持 SSH、持久化文件系统和多节点集群。 |
| llava | Large Language and Vision Assistant,将 CLIP 视觉能力与 LLaMA 语言模型结合,支持视觉指令微调与图像对话。 |
| modal | 无服务器 GPU 云平台,可按需运行 ML 工作负载、将模型部署为 API 或运行自动扩缩的批处理任务。 |
| nemo-curator | 面向 LLM 训练的 GPU 加速数据整理工具,支持模糊去重、质量过滤、语义去重与 PII 脱敏,并可借助 RAPIDS 扩展。 |
| peft-fine-tuning | 使用 LoRA、QLoRA 及 25+ 方法进行参数高效微调,在有限显存上以训练不到 1% 参数的方式微调 7B-70B 模型。 |
| pinecone | 面向生产 AI 的托管向量数据库,支持自动扩缩、混合检索、元数据过滤和低延迟。 |
| pytorch-fsdp | PyTorch FSDP 专家指南,涵盖参数分片、混合精度、CPU offloading 和 FSDP2。 |
| pytorch-lightning | 高层 PyTorch 框架,提供 Trainer、自动分布式训练(DDP/FSDP/DeepSpeed)、回调和极少样板代码。 |
| qdrant | 高性能向量相似度搜索引擎,基于 Rust,支持快速近邻搜索、带过滤的混合搜索和可扩展向量存储。 |
| saelens | 使用 SAELens 训练和分析 Sparse Autoencoder(SAE),把神经网络激活分解为可解释特征。 |
| simpo | Simple Preference Optimization,无需参考模型的 DPO 替代方案,在 AlpacaEval 2.0 上有更好表现。 |
| slime | 使用 Megatron+SGLang 框架进行 LLM 后训练 RL,支持自定义数据生成流程和紧耦合的 Megatron-LM 集成。 |
| stable-diffusion-image-generation | 使用 HuggingFace Diffusers 进行 Stable Diffusion 图像生成,支持文生图、图生图、局部重绘和自定义 diffusion pipeline。 |
| tensorrt-llm | 使用 NVIDIA TensorRT 优化 LLM 推理吞吐,在 A100/H100 上通过量化和飞行中批处理可比 PyTorch 快 10-100 倍。 |
| torchtitan | 基于 PyTorch 的原生分布式 LLM 预训练框架,支持 4D 并行(FSDP2、TP、PP、CP),可从 8 卡扩展到 512+ GPU。 |
| whisper | OpenAI 通用语音识别模型,支持 99 种语言、转写、翻译到英文以及语言识别,从 tiny 到 large 共 6 个模型尺寸。 |
Productivity
| Skill | Description |
|---|---|
| canvas | Canvas LMS 集成,可通过 API token 获取课程和作业。 |
| memento-flashcards | 用于学习与知识保持的间隔重复闪卡系统。 |
| siyuan | SiYuan Note API,可在自托管知识库中搜索、读取、创建和管理块与文档。 |
| telephony | 赋予 Hermes 电话能力,包括配置 Twilio 号码、发送/接收 SMS/MMS、拨打电话,以及通过 Bland.ai 或 Vapi 发起 AI 外呼。 |
Research
| Skill | Description |
|---|---|
| bioinformatics | 通往 400+ 生物信息学技能的入口,覆盖基因组学、转录组学、单细胞、变异检测、药物基因组学、宏基因组学和结构生物学。 |
| domain-intel | 使用 Python 标准库做被动域名侦察,包括子域发现、SSL 证书检查、WHOIS、DNS 记录和批量多域分析。无需 API key。 |
| duckduckgo-search | 通过 DuckDuckGo 进行免费 Web 搜索,支持文本、新闻、图片和视频。无需 API key。 |
| gitnexus-explorer | 用 GitNexus 为代码库建立索引,并通过 Web UI 和 Cloudflare tunnel 提供交互式知识图谱。 |
| parallel-cli | Parallel CLI 的 vendor 技能,提供 agent-native 的 Web 搜索、提取、深度研究、富化和监控。 |
| qmd | 使用 qmd 在本地搜索个人知识库、笔记、文档和会议记录,结合 BM25、向量检索和 LLM reranking。 |
| scrapling | 用 Scrapling 做网页抓取,支持 HTTP 获取、隐身浏览器自动化、Cloudflare 绕过,以及通过 CLI/Python 进行爬虫抓取。 |
Security
| Skill | Description |
|---|---|
| 1password | 安装并使用 1Password CLI(op),包括开启桌面集成、登录以及为命令读取/注入密钥。 |
| oss-forensics | 开源软件取证,分析包、依赖与供应链风险。 |
| sherlock | 在 400+ 社交网络上进行用户名 OSINT 搜索。 |
贡献可选技能
如果你想为仓库新增一个可选技能:
- 在
optional-skills/<category>/<skill-name>/下创建目录 - 添加一个
SKILL.md,包含标准 frontmatter(name、description、version、author) - 如有需要,把支撑文件放进
references/、templates/或scripts/子目录 - 提交 pull request;合并后该技能就会出现在本目录页中