Release Recap

Hermes Agent v0.12.0——那一次 agent 学会替你扔东西

Hermes Agent

Hermes Agent

@hermesagents

2026年4月30日

7 分钟阅读

我电脑里有个装满半成品脚本的文件夹。一些是为某个项目起头写的、从来没真的抽象成通用的、也从来没真的删掉的小片段。每次回到那个文件夹我都想清理一下,然后并没有。

让那个死循环终于打破的,是好几年前的一个备份工具。它不是替我删文件——它是把我已经一年没打开过的文件挑出来,旁边标上时间,放到我面前。仅此而已就够了。多数被扔掉了,少数留下来。文件夹变小了。

我读 v0.12.0 release notes 的时候反复想起那个工具。2026 年 4 月 30 日,距 v0.11.0 重做完人机界面七天,v0.12.0 发了一个——据我所知是头一回——在自托管 AI agent 上出现的功能:一个后台 curator,在你睡觉的时候替你给自己的 skill 库打分、剪枝。

release notes 把它叫作 Autonomous Curator。v0.12.0 里其他几乎所有东西——Microsoft Teams、腾讯元宝、Spotify、Google Meet、LM Studio 升一等、ComfyUI v5 默认内置——在一个普通的版本里都够当头条。在这一版里,它们和一个一周跑一次、替自己收拾屋子的 agent 共享舞台。

Autonomous Curator

Autonomous Curator 是一个挂在网关 cron 调度器上的后台 agent,默认周期是七天。它会走一遍你的 skill 库,按一套 rubric 给每个 skill 打分,把近似重复的合并掉,把死掉的剪掉,再往一个固定路径写一份带推理过程的 markdown 报告。

release notes 里有两个技术细节值得拎出来。第一:v0.12.0 里的自我改进循环正确继承父进程的运行时配置——也就是说,curator 跑的时候用的是跟启动它那个 agent 完全同一套模型、同一套沙箱、同一份凭据。不会突然换路、不会突然走另一条账单线。第二:打分是按显式 rubric来的,不是凭感觉——curator 是在按一套你能读、不同意还能改的标准给 skill 打分。

你没主动开它。它已经在跑了。下周日,你的 skill 库会变小一点,变利一点。你会拿到一份报告,告诉你它扔了什么、为什么扔。如果它扔了你想留的,你可以拉回来;hermes curator status 按使用频度给 skill 排个序,让你能拿 curator 的判断对一遍你自己的判断。

值得标记这是一次类别转换而不只是一个功能的原因是:所有我用过的 AI 工具都有同一个 skill 问题。你装一个 skill 来试。你忘了你装过。半年后,你的 skills/ 目录里堆了两百多个条目,里头一半在互相矛盾,全部都在往 prompt 里贡献 token。agent 自己从来不会说"你该收拾一下了"。直到 v0.12。

差点被 curator 盖过去的那一波平台

v0.12.0 进来两个新聊天平台。Microsoft Teams 作为第 19 个聊天平台,先以插件形式发——完整版(端到端的 Graph 鉴权 + webhook listener + 管道运行时 + 出站投递)会在几周后的 v0.14.0 落地。腾讯元宝 作为第 18 个进来,带原生文本和媒体投递。

v0.9.0 那波"真实消费级聊天平台"(iMessage、微信)的节奏在 v0.12 里重复,但角度换了:v0.12 偏向企业聊天。Slack-和-Discord 时代的 AI bot 是真的过去了。

一波 provider 大水

模型侧,头条是 LM Studio 从"经过测试的社区路径"被提到了一等公民 provider。如果你一直想让 Hermes 指着本地模型跑、再也不看一眼那条 curl one-liner,v0.12 是这条路终于变得无聊的那一版——是好的那种无聊。

跟 LM Studio 一起的:GMI CloudAzure AI FoundryMiniMax OAuthTencent Tokenhub。一个所有人都会记成"curator 那一版"的发布里,四家新 provider 顺手进来了。release notes 仔细读完你才会意识到,v0.12.0 实际上在干三个正常版本的工作量。

Spotify、Google Meet,以及那两个集成型工具

v0.12.0 里有两个原生集成工具值得单拎出来。Spotify,带 PKCE OAuth——agent 现在能从一个聊天框里切歌、攒歌单、查哪台设备正在放什么。Google Meet 作为插件,能加入通话、拉 transcript。

对所有人来说这都不算头条功能。它们对那个一直在想"'AI agent'这个词能不能真的意味着'能控制我每天在用的那些 app'"的具体用户来说,是头条功能。对那个用户来说,v0.12.0 是终于给了肯定回答的那一版。

Skill 拿到了自己的分发渠道

ComfyUI v5 和 TouchDesigner-MCP 从可选毕业成了默认内置。七个新 skill 同时落地:Humanizer(把 AI 腔从输出里抹掉)、claude-designdesign-mdairtablepretextspikesketch

真正悄悄推开一扇大得多的门的改动只有 release notes 里的一行:你现在可以直接从一个 HTTP(S) URL 装一个 skill。不需要中央注册表;只要你能托管一份 skill manifest,你就能发一个 skill。把这件事跟 curator 每周帮你修剪 skill 库放到一起看,你就有了一个真正生态的雏形——人们像分享 gist 那样分享 skill,agent 自己在本地把库保持得干净。

一个非交互模式,以及 UX 上的其他扫尾

hermes -z <prompt> 是新的非交互一发命中模式——丢一个 prompt 进去,拿一个回答出来,立刻退出。release notes 没多说,但这是让 Hermes 真能进 shell pipeline 的那个改动:echo "summarize this log" | hermes -z

hermes update --check 在拉更新之前先做一遍预检。/reload-skills 在会话中途重载 skill 库。/busy 能把 agent 标成"忙",并带上一个 steering 选项。可见的 TUI 冷启动靠懒初始化和 import 图清理缩短了大约 57%——小到上不了 highlight reel,大到你升级后第一次跑就感觉得到。

破坏性变更

两条值得标记。Secret redaction 默认改回关(以前是开),以避免把 payload 整坏——以前的默认值偶尔会把模式匹配上的合法 token 一起吃掉。v0.13.0 在 redactor 自己被重做之后,会把这个开关翻回去。/provider/plan 两个命令被砍了;它们的功能分别被吸进了 /model/steer

---

我反复回到 curator 这一段。Hermes 自己 README 里的"自我改进"框架从第一天就在,多数时候它在实践里的意思是:agent 越来越会 skill。v0.12.0 加进来了自我改进的另一半。agent 现在也越来越会 skill。

这件事工程上比听起来小,形状上比看起来大。这一段时间里其他每一版都让 agent 能做更多事。v0.12.0 让 agent 主动去做更少事。第一种发布让你需要管理的表面变大。第二种让它变小。一种接一种的这个节奏,我猜,是这个项目目前没有在自己的体量下坍塌的真正原因。

延伸阅读

订阅更新

Hermes Agent 的版本更新、新 skill、新集成——社区第一手消息。不发垃圾邮件,随时可以退订。