我用一个下雨的周六,把 Hermes Agent 的七份 release notes 一口气读完了。这种周末活动说出来挺无聊,但如果你是那种喜欢看一个项目在众目睽睽下慢慢找到自己的人,它其实相当好玩。读完的时候,我墙上贴满了便签,喝了四杯咖啡,对这段时间到底发生了什么,已经有了一张相当清楚的形状图。
从 2026 年 3 月 12 日第一次打公开 tag,到 4 月 8 日发出 v0.8.0,Hermes Agent 在二十七天里发了七个带编号的版本。平均下来四天一版。把这些版本的 PR 数加起来,已经进了四位数。贡献者人数从首发时的六十三个,涨到了两百多。
这些数字不是有意思的那部分。有意思的那部分是:这七次发布看起来根本不是"一长串混在一起的 PR",它们自己就排成了四个很清楚的阶段。你能看到这个项目大概每隔一个礼拜,就把自己的注意力换到另一处。
阶段 1:打地基(v0.2.0)
3 月 12 日 发的 v0.2.0 是公开首发,它的任务是把一副能跑起来的骨架做出来:多平台消息网关(一个进程里同时接住 Telegram、Discord、Slack、WhatsApp、Signal、IMAP/SMTP、Home Assistant)、一个原生的 Model Context Protocol 客户端、一套带了七十多个预装技能的技能系统、一个集中式服务商路由器,只有一个 call_llm() 入口,以及git worktree 隔离 + 文件系统 checkpoint——给一个真的被允许改你机器的 agent 配的那张安全网。同时它和 VS Code、Zed、JetBrains 的 ACP 集成,让它从第一天起就不止是"终端里的那个玩意"。
这是"这东西到底是什么"那一版。后面所有的东西都是搭在这五个决定之上的。
阶段 2:铺面(v0.3.0 – v0.5.0)
接下来的三次发布,从 3 月 17 日 跨到 3 月 28 日,主题都是"往各个方向把表面积摊开"。
v0.3.0 是 3 月 17 日发的,加上了贯穿整个 agent 循环的流式输出、插件系统钩子,以及第一次大的记忆集成——把 Honcho 作为记忆 provider。就是这一版,把 Hermes 从"一个带着工具的进程"变成了"一个带着活的插件生态和一层记忆的进程"。
v0.4.0 在 3 月 23 日 发出,主题是平台扩张:WhatsApp Business API、带完整附件支持的 Signal,还有一小把别的网关适配器。给同一个 agent 装更多扇前门。
v0.5.0 是 3 月 28 日发的,是一次硬化性的版本。并发修复、会话竞态、工具返回结果的处理、各家服务商的怪癖。这类活儿剪不成高光片,但没有这一步,上面所有的东西都跑不起来。
把这三版放一起读,你能看到项目在回答一个问题:"现在我们有了一个内核,从它出发能摸到现实世界里的多少东西,又不把这个内核在过程中搞坏?" 到 v0.5.0 结束时,答案是:大部分都能摸到。
阶段 3:扛造(v0.6.0 – v0.7.0)
然后焦点就移动了。3 月 30 日 的 v0.6.0 和 4 月 3 日 的 v0.7.0,主题是让这个东西扛得住现实。
v0.6.0 加上了 Profiles——多实例的 Hermes,一套安装里可以跑几个完全隔离的 agent,每个都有自己的配置、记忆、会话、技能和网关服务。它还发了 MCP server 模式,让 Hermes 可以把自己暴露给别的 MCP 客户端,比如 Claude Desktop 或 Cursor;外加一个官方 Docker 容器。这一版还引入了有序的回退服务商链,"换服务商不用把整套东西重搭一遍"的故事从这里开始长牙齿。两个全新的消息平台——飞书(Lark) 和企业微信——接进了网关。
v0.7.0,那次韧性发布,是架构第一次真正进入防御姿态。可插拔的记忆 provider——记忆变成一套 provider ABC,第三方都可以去实现,Honcho 作为参考插件。同服务商的凭据池,线程安全地按"最少被用"策略轮转,遇到 401 时做故障转移。Camofox 反检测浏览器后端,给那些要藏身份的网页工作用。内联 diff 预览,给文件写入和补丁操作用。API 服务器的会话连续性,靠 X-Hermes-Session-Id 请求头实现。还有一轮针对密钥外泄的安全扫尾——对 LLM 的回应做扫描,查 base64 和 URL 编码过的凭据。
到 v0.7.0 结束时,这个项目不再像一个新东西了,它开始看起来像基础设施——那种你丢给 cron 跑完就不用去操心的那种基础设施。
阶段 4:变聪明(v0.8.0)
这就走到了 4 月 8 日 的 v0.8.0——前两篇里我已经讲过的那一版。头条是那条自优化的 GPT/Codex 工具调用指南循环——agent 通过自动行为基准测试,诊断并修复了自己在 OpenAI 模型上的失败模式。但把它放进这四阶段的弧线里来读,它在做的事情很具体:这是三周"一直往外铺"之后,项目第一次把注意力转回来,落到 agent 自己的推理质量上。会话中途的 /model 切换、免费的 Gemini、免费的 MiMo v2 Pro、后台任务完成通知、基于不活动的超时、审批按钮、MCP OAuth 2.1 PKCE、给 MCP 扩展做 OSV 恶意软件扫描。209 个 PR。82 个解决掉的 issue。距离 v0.7.0 过去五天。
这节奏告诉你什么
把这七版当成一段连贯的弧线来看,有三件事会跳出来。
每一次发布都有主题,而主题不重复。 地基、铺面、扛造、变聪明。好像没有谁专门宣布过"应该这么走"——但项目的表现就像它对"下一步该干什么"有一个明确的读数。通常这意味着有那么几个人把整个表面都盯得很紧,其他人朝同一个方向拉,因为方向已经明显到不用开会讨论。
PR 是从很多双手里出来的。 这不是"一个维护者加六个跟班"的样子。release notes 里满是我不认识的 handle。上个礼拜才冒出来的人发的匿名 PR。这个项目表现得更像一个"场景"(scene)而不是一个代码库。场景一旦跑起来,比团队发东西快得多。
这不是"发得多",这是在复利滚雪球。 v0.2.0 发了路由器。v0.6.0 在路由器之上发了回退链。v0.7.0 在回退链之上发了凭据池。v0.8.0 又在这三样之上发了会话中途的 /model 切换。每一次发布都不是一套全新的功能,而是一层假设"上一版是稳的"才能搭得上去的新东西。如果上一版其实不稳,你这样叠是叠不起来的。所以要么测试真的在起作用,要么这种速度早就把项目本身干掉了。它没有,这本身就在说明一点事情。
有必要说一句:我不是 Hermes 团队的人。我是一个把读 release notes 当乐趣的粉丝,我开这个站,是因为这个项目比它那层市场表皮看起来的样子要有意思得多。你正在看的,是这二十七天、七次发布的一份证据——2026 年 3、4 月间,开源那一层的 agent 工程,变得实打实地更好玩了。我不知道 v0.9.0 会是什么。但无论是什么,它发出来的那天我都会去读 notes。