跳到主要内容

可选技能目录

官方可选技能位于 hermes-agent 仓库的 optional-skills/ 下,但默认不会启用。需要显式安装:

hermes skills install official/<category>/<skill>

例如:

hermes skills install official/blockchain/solana
hermes skills install official/mlops/flash-attention

安装后,该技能会出现在 agent 的技能列表中,并在检测到相关任务时自动可加载。

如需卸载:

hermes skills uninstall <skill-name>

Autonomous AI Agents

SkillDescription
blackbox将编码任务委派给 Blackbox AI CLI agent。它是一个带内置评审器的多模型 agent,会让多个 LLM 处理任务并选出最佳结果。
honcho为 Hermes 配置并使用 Honcho 记忆,包括跨会话用户建模、多 profile 隔离、观察配置与辩证式推理。

Blockchain

SkillDescription
base查询 Base(Ethereum L2)链上数据并附带美元定价,包括钱包余额、代币信息、交易详情、gas 分析、合约检查、巨鲸检测和实时网络状态。无需 API key。
solana查询 Solana 链上数据并附带美元定价,包括钱包余额、代币组合、交易详情、NFT、巨鲸检测和实时网络状态。无需 API key。

Communication

SkillDescription
one-three-one-rule用于提案与决策的结构化沟通框架。

Creative

SkillDescription
blender-mcp通过与 blender-mcp 插件的 socket 连接,直接从 Hermes 控制 Blender。可创建 3D 对象、材质、动画,并运行任意 Blender Python(bpy)代码。
concept-diagrams生成扁平、极简、支持明暗主题的 SVG 图,并以独立 HTML 文件输出,使用统一的教育类视觉语言(9 组语义色带,自动深色模式)。适合物理装置、化学机理、数学曲线、实体对象、平面图、剖面图、生命周期/流程叙事和中心辐射式系统图。附带 15 个示例图。
meme-generation选择模板并用 Pillow 叠加文字,生成真正的 meme 图片,输出实际 .png 文件。
touchdesigner-mcp通过 twozero MCP 插件控制运行中的 TouchDesigner,可创建 operator、设置参数、连接节点、执行 Python,并构建实时音频响应视觉和 GLSL 网络,共 36 个原生工具。

Dogfood

SkillDescription
adversarial-ux-test扮演最难搞、最抗拒技术的产品用户,以角色化方式浏览和吐槽,再通过 RED/YELLOW/WHITE/GREEN 务实分层,只把真实 UX 摩擦转成工单。

DevOps

SkillDescription
cli通过 inference.sh CLI(infsh)运行 150+ AI 应用,包括图像生成、视频创作、LLM、搜索、3D 和社交自动化。
docker-management管理 Docker 容器、镜像、卷、网络和 Compose 栈,包括生命周期操作、调试、清理和 Dockerfile 优化。

Email

SkillDescription
agentmail让 agent 拥有独立邮箱收件箱。可用 AgentMail 自主管理发送、接收与处理邮件。

Health

SkillDescription
fitness-nutrition健身训练计划与营养追踪。通过 wger 搜索 690+ 动作,通过 USDA FoodData Central 查询 38 万+ 食物的营养数据,并计算 BMI、TDEE、单次最大重量、宏量营养分配和体脂。纯 Python,无需 pip 安装。
neuroskill-bci面向神经科学研究流程的脑机接口(BCI)集成。

MCP

SkillDescription
fastmcp用 FastMCP 在 Python 中构建、测试、检查、安装和部署 MCP server,涵盖 API/数据库封装为 MCP 工具、暴露资源或 prompts,以及部署流程。
mcportermcporter CLI,可直接在终端列出、配置、认证并调用 MCP server/工具(HTTP 或 stdio)。适合临时 MCP 交互;如果需要始终在线的工具发现,请使用内置 native-mcp 客户端。

Migration

SkillDescription
openclaw-migration将用户的 OpenClaw 定制迁移到 Hermes Agent,包括记忆、SOUL.md、命令 allowlist、用户技能和选定的工作区资产。

MLOps

这是最大的可选分类,覆盖从数据整理到生产推理的完整 ML 流水线。

SkillDescription
accelerate最简分布式训练 API。只需 4 行就能为任意 PyTorch 脚本添加分布式支持,并统一 DeepSpeed/FSDP/Megatron/DDP。
chroma开源 embedding 数据库。可存储 embedding 和元数据,并执行向量搜索与全文搜索,适合 RAG 和语义检索。
clipOpenAI 的视觉语言模型,连接图像与文本。支持零样本图像分类、图文匹配和跨模态检索,适合图像搜索、内容审核和视觉语言任务。
faissFacebook 的高效向量相似度搜索与聚类库,支持十亿级向量、GPU 加速以及多种索引类型(Flat、IVF、HNSW)。
flash-attention使用 Flash Attention 优化 Transformer 注意力计算,可实现 2-4 倍提速和 10-20 倍显存下降,支持 PyTorch SDPA、flash-attn、H100 FP8 和 sliding window。
guidance使用正则和语法约束控制 LLM 输出,保证 JSON/XML/代码结构有效,并基于 Guidance 构建多步工作流。
hermes-atropos-environments构建、测试和调试 Hermes Agent 的 Atropos RL 环境,涵盖 HermesAgentBaseEnv 接口、奖励函数、agent loop 集成和评测。
huggingface-tokenizers基于 Rust 的高速 tokenizer,20 秒内可处理 1GB 文本,支持 BPE、WordPiece 和 Unigram。
instructor使用 Pydantic 校验从 LLM 回复中提取结构化数据,并自动重试失败提取,还支持流式部分结果。
lambda-labsLambda Labs 的保留式和按需 GPU 云实例,适合训练与推理,支持 SSH、持久化文件系统和多节点集群。
llavaLarge Language and Vision Assistant,将 CLIP 视觉能力与 LLaMA 语言模型结合,支持视觉指令微调与图像对话。
modal无服务器 GPU 云平台,可按需运行 ML 工作负载、将模型部署为 API 或运行自动扩缩的批处理任务。
nemo-curator面向 LLM 训练的 GPU 加速数据整理工具,支持模糊去重、质量过滤、语义去重与 PII 脱敏,并可借助 RAPIDS 扩展。
peft-fine-tuning使用 LoRA、QLoRA 及 25+ 方法进行参数高效微调,在有限显存上以训练不到 1% 参数的方式微调 7B-70B 模型。
pinecone面向生产 AI 的托管向量数据库,支持自动扩缩、混合检索、元数据过滤和低延迟。
pytorch-fsdpPyTorch FSDP 专家指南,涵盖参数分片、混合精度、CPU offloading 和 FSDP2。
pytorch-lightning高层 PyTorch 框架,提供 Trainer、自动分布式训练(DDP/FSDP/DeepSpeed)、回调和极少样板代码。
qdrant高性能向量相似度搜索引擎,基于 Rust,支持快速近邻搜索、带过滤的混合搜索和可扩展向量存储。
saelens使用 SAELens 训练和分析 Sparse Autoencoder(SAE),把神经网络激活分解为可解释特征。
simpoSimple Preference Optimization,无需参考模型的 DPO 替代方案,在 AlpacaEval 2.0 上有更好表现。
slime使用 Megatron+SGLang 框架进行 LLM 后训练 RL,支持自定义数据生成流程和紧耦合的 Megatron-LM 集成。
stable-diffusion-image-generation使用 HuggingFace Diffusers 进行 Stable Diffusion 图像生成,支持文生图、图生图、局部重绘和自定义 diffusion pipeline。
tensorrt-llm使用 NVIDIA TensorRT 优化 LLM 推理吞吐,在 A100/H100 上通过量化和飞行中批处理可比 PyTorch 快 10-100 倍。
torchtitan基于 PyTorch 的原生分布式 LLM 预训练框架,支持 4D 并行(FSDP2、TP、PP、CP),可从 8 卡扩展到 512+ GPU。
whisperOpenAI 通用语音识别模型,支持 99 种语言、转写、翻译到英文以及语言识别,从 tiny 到 large 共 6 个模型尺寸。

Productivity

SkillDescription
canvasCanvas LMS 集成,可通过 API token 获取课程和作业。
memento-flashcards用于学习与知识保持的间隔重复闪卡系统。
siyuanSiYuan Note API,可在自托管知识库中搜索、读取、创建和管理块与文档。
telephony赋予 Hermes 电话能力,包括配置 Twilio 号码、发送/接收 SMS/MMS、拨打电话,以及通过 Bland.ai 或 Vapi 发起 AI 外呼。

Research

SkillDescription
bioinformatics通往 400+ 生物信息学技能的入口,覆盖基因组学、转录组学、单细胞、变异检测、药物基因组学、宏基因组学和结构生物学。
domain-intel使用 Python 标准库做被动域名侦察,包括子域发现、SSL 证书检查、WHOIS、DNS 记录和批量多域分析。无需 API key。
duckduckgo-search通过 DuckDuckGo 进行免费 Web 搜索,支持文本、新闻、图片和视频。无需 API key。
gitnexus-explorer用 GitNexus 为代码库建立索引,并通过 Web UI 和 Cloudflare tunnel 提供交互式知识图谱。
parallel-cliParallel CLI 的 vendor 技能,提供 agent-native 的 Web 搜索、提取、深度研究、富化和监控。
qmd使用 qmd 在本地搜索个人知识库、笔记、文档和会议记录,结合 BM25、向量检索和 LLM reranking。
scrapling用 Scrapling 做网页抓取,支持 HTTP 获取、隐身浏览器自动化、Cloudflare 绕过,以及通过 CLI/Python 进行爬虫抓取。

Security

SkillDescription
1password安装并使用 1Password CLI(op),包括开启桌面集成、登录以及为命令读取/注入密钥。
oss-forensics开源软件取证,分析包、依赖与供应链风险。
sherlock在 400+ 社交网络上进行用户名 OSINT 搜索。

贡献可选技能

如果你想为仓库新增一个可选技能:

  1. optional-skills/<category>/<skill-name>/ 下创建目录
  2. 添加一个 SKILL.md,包含标准 frontmatter(name、description、version、author)
  3. 如有需要,把支撑文件放进 references/templates/scripts/ 子目录
  4. 提交 pull request;合并后该技能就会出现在本目录页中