看一个工具有多老,看它的 TUI 默认你不会多看一眼到什么程度,就行。
v0.11.0 之前的 Hermes 终端就是这么个东西。它好用——好用得像一台老 Linux 机子的纯文本安装界面好用:每一个按键都管用,每一个命令做的事都跟它说的一样,视觉布局是一层薄薄的礼貌,不算设计。我每天用它。但直到 v0.11.0 发出来,我才意识到我一直在替它绕路。
2026 年 4 月 23 日,距 v0.10.0 的 tool gateway 八天,Hermes Agent 发了 v0.11.0。release notes 自己叫它"the interface release"——这种名字听起来挺普通,直到你真的去读改动列表。一周之后回头看,你和 agent 之间的那一层,已经不是上一周那个程序了。
一个用 React 写的新 TUI,跟 Python 之间走 JSON-RPC
头条改动是 Ink 版 TUI——用 React/Ink 从头重写。React/Ink 是 React,但渲染目标不是 DOM 元素而是终端字符单元。底下挂着一个 Python JSON-RPC 后端。看得见的好处是:输出滚动时不会被顶上去的粘底输入框、带剪贴板支持的实时流式输出,外加一层把 agent 当下在做什么——哪一次调用、哪个工具、哪个模型——直接摊给你看的 observability 浮层。
看不见的好处更重要。TUI 和 agent 核心现在是两个进程,中间隔着一条干净的协议线。这是那种听着无聊、但下一段故事往往是"于是我们终于能发编辑器扩展了"的工程细节。这一版你不会真的看见编辑器扩展被发出来;你看见的是这一层架构让接下来这一切变成可能:v0.13.0 的 ACP 改动会骑在它上面;v0.14.0 的 hermes proxy 会骑在它上面;从 v0.9.0 开始的 dashboard 会在它上面长大。
传输架构:四个后端,五条新推理通道
v0.11.0 另一半工作,绝大多数用户永远不会直接看见。模型层围着一个可插拔的传输架构整个重写,四个后端:AnthropicTransport、ChatCompletionsTransport、ResponsesApiTransport、BedrockTransport。重点不是这个抽象本身。重点是从这个抽象里掉出来的东西。
走 Converse API 的原生 AWS Bedrock 这一版进来了。走 Codex OAuth 的 GPT-5.5 也进来了,模型选择器里带实时发现。NVIDIA NIM、Arcee AI、Step Plan、Google Gemini CLI OAuth、Vercel ai-gateway——五条新推理通道在同一个发布窗口着陆。换在传输层重构之前,这里随便哪一条都不是一个礼拜能搞定的活儿。
模型选择器本身也涨了一圈名单:Claude Opus 4.7,跨多家 provider 的 Kimi K2.6,小米 MiMo v2.5-pro 和 v2.5,xAI Grok 的 STT/TTS,Google Gemini TTS。如果你用 Hermes 的方式是"按手头任务挑模型",v0.11.0 让这份单子明显变长了。
还有一件小事,本来不该是小事:按 provider、按 model 的超时配置也在这一版进来。以前那套"一个 timeout 通吃"的策略,是一份让人挺不好意思的长时间任务失败原因里的常客。
/steer、shell hook,以及一份明显宽得多的插件接口
/steer <prompt> 是那个改变你跟一个正在跑的 agent 说话方式的小命令。v0.11.0 之前,给一个跑到一半的任务纠偏意味着取消、重发提示词——通常也意味着丢掉 agent 已经攒下的那份工作状态。有了 /steer,你可以边跑边推:agent 保留上下文,接住新方向,继续往前。输入侧同样小但同样响的另一项改动是审批提示上的数字快捷键——你按一个数字,不用打 /approve。
围着 /steer,插件接口拓宽到了一个让 Hermes 插件能干以前干不了的事的程度。v0.11.0 给 slash 命令、tool dispatch、执行拦截、结果变换都加了 hook 点。"一个加按钮的插件"和"一个真正能重塑 agent 行为的插件"之间过去是一堵墙,v0.11.0 把这堵墙改成了一扇门。
Shell hook 让你把 shell 脚本挂成生命周期回调,可以在会话开始、工具使用、完成、出错的时候点起来。Webhook 直送模式让你能把输出推到外部系统,路径里完全没有 LLM——agent 在这种模式里是路由器,不是生成器。动态 shell 补全(bash、zsh、fish)是那种"早就该有"的功能,只有等它真的有了之后,你才发现自己一直需要它。
QQBot、能开在手机上的 dashboard,以及钉钉的流式 AI 卡片
平台侧,v0.11.0 加了 QQBot 作为第 17 个聊天平台,走 QQ 官方 API v2,带一个端到端处理凭证的扫码安装向导。这一版还把现有平台几乎挨个升了一遍:Discord(论坛频道、基于角色的访问、slash 命令开关)、飞书(文档评论回复、reaction 状态)、钉钉(@提及保留,流式 AI 卡片——是的,agent 现在能直接往钉钉里一张实时刷新的卡片上写字了)、WhatsApp(语音消息、策略对齐)、企微/微信(扫码建 bot)。
从 v0.9.0 来的 Local Web Dashboard 在这一版长大了。它进了 i18n(中英文)、实时主题切换、插件系统、移动端响应式布局。dashboard 现在确实是那种你可以在手机上挂着、让 agent 在服务器上自己干活的东西。
看数字
v0.10.0 到 v0.11.0 之间的发布窗口大约覆盖了 1,556 个 commit,七天。这个数字你读两遍。模型选择器条目比一个月前多。TUI 是另一个程序。传输层是另一个程序。Dashboard 是另一个程序。插件合同是另一份合同。二进制文件上对外的那个品牌名没变。
我见过有项目一年合 1,556 个 commit,把这叫作健康的发布节奏。v0.11.0 是这个数字背后那条节奏故事从市场口号变成工程事实的样子。release notes 自己没炫这个数。"Highlights"那节就只写了"this was the interface release",因为吃掉七天 merge 的那个 interface,确实就是这一版发出去的东西。
---
"界面"类发布之所以容易被低估,是因为界面是一个工具的手感,不是它能做什么。Benchmark 数字不动,功能列表不长。但 v0.11.0 落地后的第二天,我用了两个月的那个 agent,体感上变成了另一个 agent——不再像是一个挂着聊天功能的终端程序,更像是一个碰巧住在终端里的聊天程序。
新 TUI 底下铺的那套架构,是让接下来三周成为可能的那个东西。v0.12.0 会骑在这一层上落地 Autonomous Curator。v0.13.0 会骑在它上面落地多 agent 的 Kanban。v0.14.0 会骑在它上面落地 hermes proxy。v0.11.0 自己,是这整整一个月的地基。