我電腦裡有個裝滿半成品腳本的資料夾。一些是為某個專案起頭寫的、從來沒真的抽象成通用的、也從來沒真的刪掉的小片段。每次回到那個資料夾我都想清理一下,然後並沒有。
讓那個死迴圈終於打破的,是好幾年前的一個備份工具。它不是替我刪檔案——它是把我已經一年沒打開過的檔案挑出來,旁邊標上時間,放到我面前。僅此而已就夠了。多數被扔掉了,少數留下來。資料夾變小了。
我讀 v0.12.0 release notes 的時候反覆想起那個工具。2026 年 4 月 30 日,距 v0.11.0 重做完人機介面七天,v0.12.0 發了一個——據我所知是頭一回——在自託管 AI agent 上出現的功能:一個背景 curator,在你睡覺的時候替你給自己的 skill 庫打分、剪枝。
release notes 把它叫作 Autonomous Curator。v0.12.0 裡其他幾乎所有東西——Microsoft Teams、騰訊元寶、Spotify、Google Meet、LM Studio 升一等、ComfyUI v5 預設內建——在一個普通的版本裡都夠當頭條。在這一版裡,它們和一個一週跑一次、替自己收拾屋子的 agent 共享舞台。
Autonomous Curator
Autonomous Curator 是一個掛在閘道 cron 排程器上的背景 agent,預設週期是七天。它會走一遍你的 skill 庫,按一套 rubric 給每個 skill 打分,把近似重複的合併掉,把死掉的剪掉,再往一個固定路徑寫一份帶推理過程的 markdown 報告。
release notes 裡有兩個技術細節值得拎出來。第一:v0.12.0 裡的自我改進迴圈正確繼承父行程的執行階段組態——也就是說,curator 跑的時候用的是跟啟動它那個 agent 完全同一套模型、同一套沙箱、同一份憑證。不會突然換路、不會突然走另一條帳單線。第二:打分是按顯式 rubric 來的,不是憑感覺——curator 是在按一套你能讀、不同意還能改的標準給 skill 打分。
你沒主動開它。它已經在跑了。下禮拜天,你的 skill 庫會變小一點,變利一點。你會拿到一份報告,告訴你它扔了什麼、為什麼扔。如果它扔了你想留的,你可以拉回來;hermes curator status 按使用頻度給 skill 排個序,讓你能拿 curator 的判斷對一遍你自己的判斷。
值得標記這是一次類別轉換而不只是一個功能的原因是:所有我用過的 AI 工具都有同一個 skill 問題。你裝一個 skill 來試。你忘了你裝過。半年後,你的 skills/ 目錄裡堆了兩百多個條目,裡頭一半在互相矛盾,全部都在往 prompt 裡貢獻 token。agent 自己從來不會說「你該收拾一下了」。直到 v0.12。
差點被 curator 蓋過去的那一波平台
v0.12.0 進來兩個新聊天平台。Microsoft Teams 作為第 19 個聊天平台,先以外掛形式發——完整版(端到端的 Graph 鑑權 + webhook listener + 管線執行階段 + 出站投遞)會在幾週後的 v0.14.0 落地。騰訊元寶(元寶)作為第 18 個進來,帶原生文字和媒體投遞。
v0.9.0 那波「真實消費級聊天平台」(iMessage、WeChat)的節奏在 v0.12 裡重複,但角度換了:v0.12 偏向企業聊天。Slack-和-Discord 時代的 AI bot 是真的過去了。
一波 provider 大水
模型側,頭條是 LM Studio 從「經過測試的社群路徑」被提到了一等公民 provider。如果你一直想讓 Hermes 指著本地模型跑、再也不看一眼那條 curl one-liner,v0.12 是這條路終於變得無聊的那一版——是好的那種無聊。
跟 LM Studio 一起的:GMI Cloud、Azure AI Foundry、MiniMax OAuth、Tencent Tokenhub。一個所有人都會記成「curator 那一版」的發佈裡,四家新 provider 順手進來了。release notes 仔細讀完你才會意識到,v0.12.0 實際上在做三個正常版本的工作量。
Spotify、Google Meet,以及那兩個整合型工具
v0.12.0 裡有兩個原生整合工具值得單拎出來。Spotify,帶 PKCE OAuth——agent 現在能從一個聊天框裡切歌、攢歌單、查哪台裝置正在放什麼。Google Meet 作為外掛,能加入通話、拉 transcript。
對所有人來說這都不算頭條功能。它們對那個一直在想「'AI agent'這個詞能不能真的意味著'能控制我每天在用的那些 app'」的具體使用者來說,是頭條功能。對那個使用者來說,v0.12.0 是終於給了肯定回答的那一版。
Skill 拿到了自己的分發通道
ComfyUI v5 和 TouchDesigner-MCP 從可選畢業成了預設內建。七個新 skill 同時落地:Humanizer(把 AI 腔從輸出裡抹掉)、claude-design、design-md、airtable、pretext、spike、sketch。
真正悄悄推開一扇大得多的門的改動只有 release notes 裡的一行:你現在可以直接從一個 HTTP(S) URL 裝一個 skill。不需要中央註冊表;只要你能託管一份 skill manifest,你就能發一個 skill。把這件事跟 curator 每週幫你修剪 skill 庫放到一起看,你就有了一個真正生態的雛形——人們像分享 gist 那樣分享 skill,agent 自己在本地把庫保持得乾淨。
一個非互動模式,以及 UX 上的其他掃尾
hermes -z <prompt> 是新的非互動一發命中模式——丟一個 prompt 進去,拿一個回答出來,立刻退出。release notes 沒多說,但這是讓 Hermes 真能進 shell pipeline 的那個改動:echo "summarize this log" | hermes -z。
hermes update --check 在拉更新之前先做一遍預檢。/reload-skills 在會話中途重載 skill 庫。/busy 能把 agent 標成「忙」,並帶上一個 steering 選項。可見的 TUI 冷啟動靠懶初始化和 import 圖清理縮短了大約 57%——小到上不了 highlight reel,大到你升級後第一次跑就感覺得到。
破壞性變更
兩條值得標記。Secret redaction 預設改回關(以前是開),以避免把 payload 整壞——以前的預設值偶爾會把模式匹配上的合法 token 一起吃掉。v0.13.0 在 redactor 自己被重做之後,會把這個開關翻回去。/provider 和 /plan 兩個指令被砍了;它們的功能分別被吸進了 /model 和 /steer。
---
我反覆回到 curator 這一段。Hermes 自己 README 裡的「自我改進」框架從第一天就在,多數時候它在實踐裡的意思是:agent 越來越會寫 skill。v0.12.0 加進來了自我改進的另一半。agent 現在也越來越會刪 skill。
這件事工程上比聽起來小,形狀上比看起來大。這一段時間裡其他每一版都讓 agent 能做更多事。v0.12.0 讓 agent 主動去做更少事。第一種發佈讓你需要管理的表面變大。第二種讓它變小。一種接一種的這個節奏,我猜,是這個專案目前沒有在自己的體量下塌陷的真正原因。