Release Recap

Hermes Agent v0.13.0——那一次,agent 变得轴起来了

Hermes Agent

Hermes Agent

@hermesagents

2026年5月7日

8 分钟阅读

我第一次因为一次网络抽风丢掉一个 Hermes 会话的时候,重构刚跑到二十分钟,agent 在它脑子里搭起了一份我自己手上没有的代码库地图。网关断线,会话结束。地图跟着走了。

我不打算说那次经历就是 v0.13.0 出现的原因。release notes 把这一版叫作"the tenacity release"——这名字乍听像是从同义词词典里随手挑的,直到你意识到 v0.13.0 三个头条功能本质上是用三种方式回答同一个问题:agent 怎么把它起头做的事做完?

2026 年 5 月 7 日,距 v0.12.0 整整一周。这一版在周三落地。等周三过完,我服务器上那个 agent,多了三种"轴下去"的方式。

一块 Kanban 板,但服务对象是 AI worker

主打功能是 Multi-Agent Kanban——一块持久化的任务板,多个 Hermes worker 可以协作地认领、移交、完成任务。它底下那层基础设施不漂亮,但漂亮的就是这层基础设施本身:心跳监控僵尸检测、按任务的重试预算原子化状态写入

用大白话讲:一个 worker 干到一半挂了,另一个 worker 能接过去。网关重启了,看板回到它走时的样子。一个任务连续失败三次,重试预算说"够了",扔到一边给人看。所有这些铺管子的活儿是为了同一件事:你能把五个 Hermes 实例怼到一个 backlog 上,然后走开。

这个功能的另一半,没有那么花哨但对单实例部署其实更有用:一个 Hermes 实例自己也能当一个"看板 worker"加入到一个多进程计划里,一次拿一个任务往前推。某种意义上 agent 学会了当队列消费者。这件事改变了你能合理交给它的活儿的种类。

/goal 和 Ralph loop

/goal slash 命令是 agent 设计圈里被叫作 Ralph loop 的那种东西的实现——这是一种长期的设计模式,意思是告诉 agent 把目标咬住,跨多个对话回合都不许松口,不管用户在任何单个回合里把它往哪边带。

如果你曾经抓到过 Hermes 因为最近一条用户消息把它拽偏、从而漂离了最初的任务——"等等,我们刚才在干啥来着?"——/goal 就是修这个的。会话开始时把目标设一次,之后每一轮都按这个目标来评估。agent 可以绕道,但不准把目的地忘掉。

一周后 v0.14.0 会落地的 /subgoal,让你在跑到一半时插入成功判据。这两个加起来,是 chat 形态的 agent 离传统项目计划做的事最近的一次:一个目标,加上中途逐步细化。

会话持久化——网关重启不再等于对话清零

"做完它"系列的第三件事是会话持久化。对话在网关重启之后会自己续起来,上下文和线程路由都保留。底层是 checkpoints v2,加上原子化的会话持久化——和 Kanban 那一层心跳的本质是同一形状的工作。

用户侧的体感是几个月前我求之不得的那一行 bullet:网关重启不再意味着对话被重置。拉新版本,重启进程,对话从它停的地方接着走。自托管 Hermes 的 day-2 运维故事一下子简单了很多——而对那些 VPS 偶尔会因为内核更新自己重启的人来说,v0.13.0 是 agent 终于不再介意这件事的那一版。

Google Chat、DeepSeek v4 Pro,和那一波模型

Google Chat 作为第 20 个聊天平台进来。同时进来的还有一个可插拔的 provider 系统,让第三方适配器可以在核心仓库之外发布——和 v0.11.0 那次传输架构的工作是同一种形状,只不过这次延伸到了网关适配器层。下一个 iMessage 山寨货、下一个区域聊天 API、下一个加密聊天 app——没有一个必须再等核心 merge 了。

模型侧:DeepSeek v4 ProxAI Grok 4.3OpenRouter Owl-Alpha(免费档)、腾讯混元 Hy3 Preview 都是新条目。xAI Custom Voices 带语音克隆给 TTS 用。一个视频分析工具挂在 Gemini 和其他多模态能力的模型上跑,终于让 Hermes 能去看一段 30 秒的片子,而不是看一摞静帧。

如果你判断"这个项目跟没跟上模型前沿"的标准是"我这周想试的模型他们做没做支持",v0.13.0 几乎肯定通过。

国际化进来了

CLI 和文档拿到了七个语言的翻译——中文、日文、德文、西班牙文、法文、乌克兰文、土耳其文。一行 bullet 背后是一大堆工作。如果你最近三个月一直在看英文 CLI 输出,而你的脑子在累的时候会把英文当二外处理,v0.13.0 是那个让你能切回去的版本。

值得提一句的副作用:CLI 输出本地化了之后,错误信息也跟着本地化了。也就是说一个非英语使用者把错误粘进论坛的时候,回帖的人看见的是同样的字。翻译这事儿很多时候同时也是可调试性。

安全、ACP,以及 curator 的归档子命令

八个 P0 漏洞关掉——release notes 没逐条挂 CVE 编号,但模式覆盖很广:redaction 重新默认开启(v0.12 那次翻转翻回来了,因为 redactor 自己被重做过了)、Discord 角色白名单做到 guild 粒度、WhatsApp 默认拒绝未知联系人、鉴权系统里的 TOCTOU 窗口被关掉。

hermes curator archiveprunelist-archived 把 v0.12 的 curator 形式化成了正经子命令。/steer/queue 出现在 ACP 适配器里(VS Code、Zed、JetBrains)——如果你在编辑器里用 Hermes,你现在能从编辑器里给它推一把方向了,不用退回到终端。

"tenacity"到底买到了什么

这些功能任意一个单看,都已经在 release tracker 里挂了一阵子。但合起来它们给你买到的是同一件事:一个不会因为网络眨一下、模型 API 限流、网关重启或者用户走神,就忘了自己刚才在干啥的 Hermes。

这个 agent 一直挺聪明。v0.13 让它变得轴。聪明跟轴有区别。聪明的 agent 在被打断之后会优雅地恢复——通常是开始一个新任务,对旧任务没什么记忆。轴的 agent 会把旧任务做完。Kanban、目标锁、会话续传——它们都是同一种形状的功能:能撑过那些以前会摧毁它的东西的状态。

---

AI agent 这个行业这一个季度大半在比拼原始能力——更大的模型、更长的上下文、更多的 skill。v0.13.0 比的是另一根轴。2026 年自托管 agent 真正难的问题不是"它能不能做 X"——而是"它能不能在一次网络事件里连续三十分钟都做 X"。agent 的体验质量,相当大一部分其实就住在第二个问题的答案里。

这一版的名字是"tenacity"而不是带 durabilityreliability 那种词,本身就说明问题。tenacity 是个用来形容人的词。言下之意是这个团队是把 agent 当人那样看的。

延伸阅读

订阅更新

Hermes Agent 的版本更新、新 skill、新集成——社区第一手消息。不发垃圾邮件,随时可以退订。