Release Recap

Hermes Agent v0.13.0——那一次，agent 變得擰起來了

Hermes Agent

@hermesagents

May 7, 2026

8 分鐘閱讀

我第一次因為一次網路抽風丟掉一個 Hermes 會話的時候，重構剛跑到二十分鐘，agent 在它腦袋裡搭起了一份我自己手上沒有的程式碼庫地圖。閘道斷線，會話結束。地圖跟著走了。

我不打算說那次經歷就是 v0.13.0 出現的原因。release notes 把這一版叫作「the tenacity release」——這名字乍聽像是從同義詞詞典裡隨手挑的，直到你意識到 v0.13.0 三個頭條功能本質上是用三種方式回答同一個問題：agent 怎麼把它起頭做的事做完？

2026 年 5 月 7 日，距 v0.12.0 整整一週。這一版在禮拜三落地。等禮拜三過完，我伺服器上那個 agent，多了三種「擰下去」的方式。

一塊 Kanban 板，但服務對象是 AI worker

主打功能是 Multi-Agent Kanban——一塊持久化的任務板，多個 Hermes worker 可以協作地認領、移交、完成任務。它底下那層基礎設施不漂亮，但漂亮的就是這層基礎設施本身：心跳監控、僵屍偵測、按任務的重試預算、原子化狀態寫入。

用大白話講：一個 worker 做到一半掛了，另一個 worker 能接過去。閘道重啟了，看板回到它走時的樣子。一個任務連續失敗三次，重試預算說「夠了」，扔到一邊給人看。所有這些鋪管子的活兒是為了同一件事：你能把五個 Hermes 實例怼到一個 backlog 上，然後走開。

這個功能的另一半，沒有那麼花俏但對單實例部署其實更有用：一個 Hermes 實例自己也能當一個「看板 worker」加入到一個多行程計畫裡，一次拿一個任務往前推。某種意義上 agent 學會了當佇列消費者。這件事改變了你能合理交給它的活兒的種類。

/goal 和 Ralph loop

/goal slash 指令是 agent 設計圈裡被叫作 Ralph loop 的那種東西的實作——這是一種長期的設計模式，意思是告訴 agent 把目標咬住，跨多個對話回合都不准鬆口，不管使用者在任何單個回合裡把它往哪邊帶。

如果你曾經抓到過 Hermes 因為最近一條使用者訊息把它拽偏、從而漂離了最初的任務——「等等，我們剛才在做啥？」——/goal 就是修這個的。會話開始時把目標設一次，之後每一輪都按這個目標來評估。agent 可以繞道，但不准把目的地忘掉。

一週後 v0.14.0 會落地的 /subgoal，讓你在跑到一半時插入成功判據。這兩個加起來，是 chat 形態的 agent 離傳統專案計畫做的事最近的一次：一個目標，加上中途逐步細化。

會話持久化——閘道重啟不再等於對話清零

「做完它」系列的第三件事是會話持久化。對話在閘道重啟之後會自己續起來，上下文和執行緒路由都保留。底層是 checkpoints v2，加上原子化的會話持久化——和 Kanban 那一層心跳的本質是同一形狀的工作。

使用者側的體感是幾個月前我求之不得的那一行 bullet：閘道重啟不再意味著對話被重置。拉新版本，重啟行程，對話從它停的地方接著走。自託管 Hermes 的 day-2 維運故事一下子簡單了很多——而對那些 VPS 偶爾會因為核心更新自己重啟的人來說，v0.13.0 是 agent 終於不再介意這件事的那一版。

Google Chat、DeepSeek v4 Pro，和那一波模型

Google Chat 作為第 20 個聊天平台進來。同時進來的還有一個可插拔的 provider 系統，讓第三方適配器可以在核心儲存庫之外發佈——和 v0.11.0 那次傳輸架構的工作是同一種形狀，只不過這次延伸到了閘道適配器層。下一個 iMessage 山寨貨、下一個區域聊天 API、下一個加密聊天 app——沒有一個必須再等核心 merge 了。

模型側：DeepSeek v4 Pro、xAI Grok 4.3、OpenRouter Owl-Alpha（免費檔）、騰訊混元 Hy3 Preview 都是新條目。xAI Custom Voices 帶語音複製給 TTS 用。一個影片分析工具掛在 Gemini 和其他多模態能力的模型上跑，終於讓 Hermes 能去看一段 30 秒的片子，而不是看一摞靜幀。

如果你判斷「這個專案跟沒跟上模型前沿」的標準是「我這週想試的模型他們做沒做支援」，v0.13.0 幾乎肯定通過。

國際化進來了

CLI 和文件拿到了七個語言的翻譯——中文、日文、德文、西班牙文、法文、烏克蘭文、土耳其文。一行 bullet 背後是一大堆工作。如果你最近三個月一直在看英文 CLI 輸出，而你的腦子在累的時候會把英文當外語處理，v0.13.0 是那個讓你能切回去的版本。

值得提一句的副作用：CLI 輸出本地化了之後，錯誤訊息也跟著本地化了。也就是說一個非英語使用者把錯誤貼進論壇的時候，回帖的人看見的是同樣的字。翻譯這事兒很多時候同時也是可除錯性。

安全、ACP，以及 curator 的歸檔子指令

八個 P0 漏洞關掉——release notes 沒逐條掛 CVE 編號，但模式覆蓋很廣：redaction 重新預設開啟（v0.12 那次翻轉翻回來了，因為 redactor 自己被重做過了）、Discord 角色白名單做到 guild 粒度、WhatsApp 預設拒絕未知聯絡人、鑑權系統裡的 TOCTOU 視窗被關掉。

hermes curator archive、prune、list-archived 把 v0.12 的 curator 形式化成了正經子指令。/steer 和 /queue 出現在 ACP 適配器裡（VS Code、Zed、JetBrains）——如果你在編輯器裡用 Hermes，你現在能從編輯器裡給它推一把方向了，不用退回到終端機。

「tenacity」到底買到了什麼

這些功能任意一個單看，都已經在 release tracker 裡掛了一陣子。但合起來它們給你買到的是同一件事：一個不會因為網路眨一下、模型 API 限流、閘道重啟或者使用者走神，就忘了自己剛才在做啥的 Hermes。

這個 agent 一直挺聰明。v0.13 讓它變得擰。聰明跟擰有區別。聰明的 agent 在被打斷之後會優雅地恢復——通常是開始一個新任務，對舊任務沒什麼記憶。擰的 agent 會把舊任務做完。Kanban、目標鎖、會話續傳——它們都是同一種形狀的功能：能撐過那些以前會摧毀它的東西的狀態。

---

AI agent 這個行業這一個季度大半在比拼原始能力——更大的模型、更長的上下文、更多的 skill。v0.13.0 比的是另一根軸。2026 年自託管 agent 真正難的問題不是「它能不能做 X」——而是「它能不能在一次網路事件裡連續三十分鐘都做 X」。agent 的體驗品質，相當大一部分其實就住在第二個問題的答案裡。

這一版的名字是「tenacity」而不是帶 durability 或 reliability 那種詞，本身就說明問題。tenacity 是個用來形容人的詞。言下之意是這個團隊是把 agent 當人那樣看的。