我第一次因為一次網路抽風丟掉一個 Hermes 會話的時候,重構剛跑到二十分鐘,agent 在它腦袋裡搭起了一份我自己手上沒有的程式碼庫地圖。閘道斷線,會話結束。地圖跟著走了。
我不打算說那次經歷就是 v0.13.0 出現的原因。release notes 把這一版叫作「the tenacity release」——這名字乍聽像是從同義詞詞典裡隨手挑的,直到你意識到 v0.13.0 三個頭條功能本質上是用三種方式回答同一個問題:agent 怎麼把它起頭做的事做完?
2026 年 5 月 7 日,距 v0.12.0 整整一週。這一版在禮拜三落地。等禮拜三過完,我伺服器上那個 agent,多了三種「擰下去」的方式。
一塊 Kanban 板,但服務對象是 AI worker
主打功能是 Multi-Agent Kanban——一塊持久化的任務板,多個 Hermes worker 可以協作地認領、移交、完成任務。它底下那層基礎設施不漂亮,但漂亮的就是這層基礎設施本身:心跳監控、僵屍偵測、按任務的重試預算、原子化狀態寫入。
用大白話講:一個 worker 做到一半掛了,另一個 worker 能接過去。閘道重啟了,看板回到它走時的樣子。一個任務連續失敗三次,重試預算說「夠了」,扔到一邊給人看。所有這些鋪管子的活兒是為了同一件事:你能把五個 Hermes 實例怼到一個 backlog 上,然後走開。
這個功能的另一半,沒有那麼花俏但對單實例部署其實更有用:一個 Hermes 實例自己也能當一個「看板 worker」加入到一個多行程計畫裡,一次拿一個任務往前推。某種意義上 agent 學會了當佇列消費者。這件事改變了你能合理交給它的活兒的種類。
/goal 和 Ralph loop
/goal slash 指令是 agent 設計圈裡被叫作 Ralph loop 的那種東西的實作——這是一種長期的設計模式,意思是告訴 agent 把目標咬住,跨多個對話回合都不准鬆口,不管使用者在任何單個回合裡把它往哪邊帶。
如果你曾經抓到過 Hermes 因為最近一條使用者訊息把它拽偏、從而漂離了最初的任務——「等等,我們剛才在做啥?」——/goal 就是修這個的。會話開始時把目標設一次,之後每一輪都按這個目標來評估。agent 可以繞道,但不准把目的地忘掉。
一週後 v0.14.0 會落地的 /subgoal,讓你在跑到一半時插入成功判據。這兩個加起來,是 chat 形態的 agent 離傳統專案計畫做的事最近的一次:一個目標,加上中途逐步細化。
會話持久化——閘道重啟不再等於對話清零
「做完它」系列的第三件事是會話持久化。對話在閘道重啟之後會自己續起來,上下文和執行緒路由都保留。底層是 checkpoints v2,加上原子化的會話持久化——和 Kanban 那一層心跳的本質是同一形狀的工作。
使用者側的體感是幾個月前我求之不得的那一行 bullet:閘道重啟不再意味著對話被重置。拉新版本,重啟行程,對話從它停的地方接著走。自託管 Hermes 的 day-2 維運故事一下子簡單了很多——而對那些 VPS 偶爾會因為核心更新自己重啟的人來說,v0.13.0 是 agent 終於不再介意這件事的那一版。
Google Chat、DeepSeek v4 Pro,和那一波模型
Google Chat 作為第 20 個聊天平台進來。同時進來的還有一個可插拔的 provider 系統,讓第三方適配器可以在核心儲存庫之外發佈——和 v0.11.0 那次傳輸架構的工作是同一種形狀,只不過這次延伸到了閘道適配器層。下一個 iMessage 山寨貨、下一個區域聊天 API、下一個加密聊天 app——沒有一個必須再等核心 merge 了。
模型側:DeepSeek v4 Pro、xAI Grok 4.3、OpenRouter Owl-Alpha(免費檔)、騰訊混元 Hy3 Preview 都是新條目。xAI Custom Voices 帶語音複製給 TTS 用。一個影片分析工具掛在 Gemini 和其他多模態能力的模型上跑,終於讓 Hermes 能去看一段 30 秒的片子,而不是看一摞靜幀。
如果你判斷「這個專案跟沒跟上模型前沿」的標準是「我這週想試的模型他們做沒做支援」,v0.13.0 幾乎肯定通過。
國際化進來了
CLI 和文件拿到了七個語言的翻譯——中文、日文、德文、西班牙文、法文、烏克蘭文、土耳其文。一行 bullet 背後是一大堆工作。如果你最近三個月一直在看英文 CLI 輸出,而你的腦子在累的時候會把英文當外語處理,v0.13.0 是那個讓你能切回去的版本。
值得提一句的副作用:CLI 輸出本地化了之後,錯誤訊息也跟著本地化了。也就是說一個非英語使用者把錯誤貼進論壇的時候,回帖的人看見的是同樣的字。翻譯這事兒很多時候同時也是可除錯性。
安全、ACP,以及 curator 的歸檔子指令
八個 P0 漏洞關掉——release notes 沒逐條掛 CVE 編號,但模式覆蓋很廣:redaction 重新預設開啟(v0.12 那次翻轉翻回來了,因為 redactor 自己被重做過了)、Discord 角色白名單做到 guild 粒度、WhatsApp 預設拒絕未知聯絡人、鑑權系統裡的 TOCTOU 視窗被關掉。
hermes curator archive、prune、list-archived 把 v0.12 的 curator 形式化成了正經子指令。/steer 和 /queue 出現在 ACP 適配器裡(VS Code、Zed、JetBrains)——如果你在編輯器裡用 Hermes,你現在能從編輯器裡給它推一把方向了,不用退回到終端機。
「tenacity」到底買到了什麼
這些功能任意一個單看,都已經在 release tracker 裡掛了一陣子。但合起來它們給你買到的是同一件事:一個不會因為網路眨一下、模型 API 限流、閘道重啟或者使用者走神,就忘了自己剛才在做啥的 Hermes。
這個 agent 一直挺聰明。v0.13 讓它變得擰。聰明跟擰有區別。聰明的 agent 在被打斷之後會優雅地恢復——通常是開始一個新任務,對舊任務沒什麼記憶。擰的 agent 會把舊任務做完。Kanban、目標鎖、會話續傳——它們都是同一種形狀的功能:能撐過那些以前會摧毀它的東西的狀態。
---
AI agent 這個行業這一個季度大半在比拼原始能力——更大的模型、更長的上下文、更多的 skill。v0.13.0 比的是另一根軸。2026 年自託管 agent 真正難的問題不是「它能不能做 X」——而是「它能不能在一次網路事件裡連續三十分鐘都做 X」。agent 的體驗品質,相當大一部分其實就住在第二個問題的答案裡。
這一版的名字是「tenacity」而不是帶 durability 或 reliability 那種詞,本身就說明問題。tenacity 是個用來形容人的詞。言下之意是這個團隊是把 agent 當人那樣看的。