Hermes Agent v0.14.0 在 2026 年 5 月 16 日落地——距 v0.13.0 整整九天。这是这个项目历史上最大的一次发版:633 个 merge 的 PR、1,393 个文件改动、808 次 commit 跑出 165,061 行新代码、关掉 545 个 issue,发布窗口里有 215 位贡献者。上游 tag:v2026.5.16。
release notes 本身写到几千字。下面这 22 件事是你真正想知道的,按它们回答的问题分组。每一条都标了上游 PR 编号——想核对的话点进去就是。
---
安装和分发
1. pip install hermes-agent 上 PyPI 了
折腾了十四个月的"curl 这个脚本"之后,Hermes 终于是一个真正的 PyPI 包了。wheel 把 Ink TUI bundle 和 shell 启动器都带上,开箱就是完整体验。pipx install hermes-agent 也通。老的 curl 一行装、Docker、git-clone 路径都还在——这次只是把 Python 圈那扇门也打开了。(#26593,#26350 的捞救)
2. 装包"瘦身"那波
重量级后端(Slack / Matrix / Feishu / DingTalk 适配器、hindsight 客户端、codex app-server、Pixverse / Camofox / 图像生成 SDK、TTS provider)现在统统改成首次使用时再 lazy install。[all] extras 把所有走 lazy 的依赖剔出去;wheel 装不上你这平台的时候,安装器会逐级回退;每次装包前还有一个 supply-chain advisory checker 扫一遍不安全版本。装包变轻,速度变快,传递依赖里的漏洞也一起变少。(#24220, #24515, #25014, #25038, #25766, #21818)
3. 原生 Windows 进入 early beta
CLI、gateway、TUI、tools 全线落地一条正经的原生 Windows 路径。PowerShell 安装器,自动识别并装 MinGit(约 45 MB,不要管理员权限),认得出 Microsoft Store 那个 python stub,保住前台 Ctrl+C。已经合进去了大概 40 个 Windows-only 的后续修复。WSL2 还是生产环境最被验证过的路径——"early beta"这个标签放在那里是认真的。(#21561)
---
模型和 provider
4. xAI Grok 走 SuperGrok OAuth——grok-4.3 顺手扩到 1M context
你订了 SuperGrok 的话,现在可以直接拿 xAI 账号登进 Hermes 用 Grok——不用 API key,也不用单独再开一份账单。这次接进来的同时,把 grok-4.3 的上下文也升到 1M token——整套代码库或者一摞研究文献塞进一个 prompt 都装得下。entitlement 报错处理做了,远程机 SSH 进去时怎么完成 OAuth 流也写了文档。(#26534, #26664, #26644, #26592)
5. hermes proxy——OAuth 订阅落到你的 localhost
跑 hermes proxy,你就有了一个本地 http://localhost:port 端点,这个端点讲 OpenAI 那套 API,背后接的是你登过的任意一个 OAuth provider——Claude Pro、ChatGPT Pro、SuperGrok。Codex CLI、Aider、Cline、Continue——任何认 OpenAI 兼容端点的工具——直接拿你已经在订的那份订阅用就行,API key 不要。一份订阅,所有工具都能接。(#25969)
6. NovitaAI 进 provider 名单
AI-native 云,按月固定价的 Agent Sandbox,自带 Llama、Qwen、DeepSeek 这些开源模型。#7219 的捞救。(@kshitijk4poor) (#25507)
7. OpenRouter Pareto Code router + min_coding_score
OpenRouter 的 Pareto router 会自动挑出在质量线之上最便宜的那个模型。新加的 min_coding_score 这一档专门给写代码任务定那条线——Hermes 路由到至少这么能编程的模型里最便宜的那个。中档够用的活儿,别再为顶档模型花冤枉钱。(#22838)
8. Codex app-server runtime——给 OpenAI / Codex 模型用
可选的 runtime,OpenAI 或 Codex 路径下用它来在底下驱动 OpenAI 的 Codex CLI。会话复用、卡死的会话自动退役、OAuth refresh 分类做对——agent 长跑不掉链子,靠的就是这一层下水道。(#24182, #25769)
9. Alibaba Cloud 改名 Qwen Cloud
picker 和配置项现在用世界其他地方都在用的那个品牌。已有的配置 key 仍然好使——不破坏兼容——只是 UI 跟实际品牌对齐了。(#24835)
---
聊天平台——一共 22 个
10. Microsoft Teams——端到端
Teams 在 v0.12.0(2026 年 3 月)作为第一个走插件路径出货的平台落地。v0.14.0 把整套 Microsoft Graph 端到端打通:auth + 客户端基座(#21922)、收 Teams 事件的 webhook listener(#21969)、pipeline 插件 runtime(#22007)、走老 adapter 的对外投递(#22024)。bot 接一次,从任意 Teams 频道、私聊、群里都能跟它说话。(#21408–#21411 的捞救)
11. LINE——走官方 LINE Messaging API 接入
LINE 在日本、韩国、台湾市场是绝对主力。Hermes 现在原生进得去。(#23197)
12. SimpleX Chat——去中心、没有用户 ID
主打隐私的去中心化即时通讯,没有任何永久标识符。Hermes 跑在上面,不会暴露任何身份信息。(#26232——捞救 #2558)
13. Discord 加入频道时默认拉历史
Hermes 第一次进入一个 channel 或者 thread 的时候,会先读完最近的消息历史再回复。不会再有"我们刚才在聊什么来着"——别人屏幕上有的上下文,agent 也有。(#25984)
14. Telegram 和 Discord 上 clarify 用平台原生按钮
多选题现在直接弹平台原生的按钮,点一下回答——手机上特别舒服。(#24199, #25485)
---
Agent loop 和会话
15. /handoff 真的能把会话热迁移过去了
对话中途要换一个模型、人格或者 profile——每一条消息、每一次工具调用、每一片上下文都一起搬过去。debug 一半从快模型切到深推理模型,或者一个任务里把会话从一个 profile 倒到另一个 profile,都行。(#23395)
16. /subgoal——往跑着的 /goal 上加判据
Ralph-loop /goal 会让 agent 一直跑到 judge 接受成功判据为止。/subgoal <text> 在循环跑到一半时叠新的判据进去——不用重启循环。(#25449)
17. 每一轮写完文件,自带一份变更对账单
每一轮 agent 写过或者改过文件之后,它会收到一段简短的 footer——告诉它实际写盘的东西是什么:路径、行数、真实 diff。某次写没落盘、或者被默默覆盖掉,自己就能抓出来,而不是底气十足地跟你说"那个函数加上了"。(#24498)
18. 每次写盘都跑 LSP 语义诊断
write_file 和 patch 现在会拿一个真正的 language server 跑你改的那个文件,把新出现的报错在下一轮开始前先回报给 agent。类型错误、未定义符号、漏掉的 import——当场就抓住。比 v0.13.0 那套基础的 Python/JSON/YAML/TOML lint 走得远很多,因为这次跑的是真正的语义分析。(#24168, #25978)
---
性能
19. hermes 冷启动削掉大约 19 秒
skills 缓存 + Feishu 适配器 lazy + 整个 import 图上的 deferred imports + models.dev 改 cache-first 查 + doctor 检查并行化 + chat -q 跳过欢迎横幅。hermes tools All-Platforms 那一屏从 14 秒掉到 1.5 秒以下。(#22138, #22120, #22681, #22790, #22808, #22831, #22859, #22904, #22766, #25341)
20. browser_console 求值快了 180 倍
路由改成走 supervisor 那条常驻的 Chrome DevTools Protocol WebSocket,而不是每次起一个新会话。这之前,browser 工具调用是 agent 最慢的那个操作。这之后,不是了。真实的页面交互体感直接变到"瞬时"。(#23226)
21. Claude prompt cache 跨会话保留 1 小时
你通过 Anthropic、OpenRouter 或 Nous Portal 用 Claude 的时候,prompt prefix(system prompt、skills、memory)会被缓存一小时,跨会话生效。/new 开一段新会话,第一条回复也会更快更便宜——上次会话留下的 cache 还热着。后台跑的 memory review 也吃这一层 cache。(#23828, #25434, #24778)
---
多模态
22. vision_analyze 直接给视觉模型送像素
当前模型自己能看(GPT-5、Claude、Gemini、Grok-vision)的话,vision_analyze 现在会把原始像素直接传过去,而不是先转成文字描述。你拿到的是模型真实的视觉推理,而不是一道掉了精度的文字摘要回环。(#22955)
---
顺带还有这些亮点
上面那 22 条是这次发版的主骨架。再挑 12 条值得一提的:
- •
x_search——一等公民的 X(Twitter)搜索工具,走 OAuth 或者 API key。(#26763) - •
computer_use的 cua-driver 后端——非 Anthropic 的视觉模型也能驱动你的桌面了,带 focus-safe 操作,hermes update时跟着刷新。(#21967, #24063) - •统一
video_generate,provider 后端可插拔——新的视频模型作为一个文件的插件丢进来就用。(#25126) - •任何终端里 URL 都能点开——真的 OSC8 超链接,hover 高亮。(@OutThisLife, #25071, #24013)
- •Zed ACP Registry 一键装,走
uvx,不要 npm。(#26079, #26120, #26234) - •Brave Search + DDGS 加入免费 web 搜索 provider,和 Tavily / SearXNG / Exa 并列。(#21337)
- •9 个新的可选 skill——Hyperliquid、Yahoo Finance、api-testing(REST + GraphQL)、统一 EVM 多链、darwinian-evolver、osint-investigation、pinggy-tunnel、watchers(RSS / HTTP JSON / GitHub 轮询),加上 2026 年 5 月 Developer Platform 那次 Notion 大改。(#23582, #23583, #23590, #25299, #26760, #26729, #26765, #21881, #26612)
- •
huggingface/skills成为信任默认源——发到那里的社区 skill 不用额外配置就能装。(#26219,关掉 #2549) - •sudo 暴力破解阻断 + 三个 dangerous-command 绕过的洞 + tool 报错信息消毒(不会再有从报错字符串注 prompt 的事)。(#23736, #26829, #26823)
- •
/sessions斜杠命令——浏览并恢复历史会话。(@austinpickett, #20805) - •插件可以拿到
ctx.llm+tool_override标志位——插件第一时间用上 LLM,也能干净地替换内置工具。(#23194, #26759) - •API server 把运行审批事件暴露出来——长跑任务遇到要审批的命令再也不会无声卡死。(#21899)
---
发版窗口的数字
| 指标 | 数值 |
|---|---|
| Merge 的 PR | 633 |
| Commit | 808 |
| 改动文件 | 1,393 |
| 新增行数 | 165,061 |
| 关掉的 issue | 545(12 个 P0,50 个 P1) |
| 贡献者 | 215 |
| Tag | v2026.5.16 |
| 距 v0.13.0 的天数 | 9 |
发版窗口里的头部社区贡献者
- •@kshitijk4poor——38 个 PR(Telegram 节奏/流式、安全加固、codex-runtime 整理、NovitaAI provider)
- •@alt-glitch——13 个 PR(Markdown 表格 TUI、
HERMES_SESSION_ID、hindsight-client 改可选依赖) - •@OutThisLife——12 个 PR(TUI turn 分段、markdown 链接标题、OSC8 超链接)
- •@austinpickett——8 个 PR(
/sessions、人格切换、cron modal) - •@helix4u——5 个 PR(Google Chat 安装、Windows Ctrl+C)
- •@rob-maron——4 个 PR(把 Nous Portal 立为模型元数据的权威源)
---