2026 年 4 月 8 日早上我起床,拉了最新的 Hermes Agent 建置,第一次會話做到一半,它做了一件我之前沒見它做過的事。我讓它在一堆日誌裡找一個特定的錯誤樣式。它跑了 grep,沒命中,停了一下說:「這個樣式在原始輸出裡沒有——我試試在那些壓縮過的封存檔裡找。」然後它是對的。
這種事我大概永遠不會完全習慣。但話說回來,v0.8.0 之所以跟 v0.7.0 感覺上完全是兩個版本,很大程度上就是因為這種看不見卻實實在在的東西——agent 在琢磨自己手頭這攤活兒的時候,又聰明了一點點。release notes 管這一版叫 the intelligence release(智力發布)。這不是行銷部的話術;它就是在描述這一版真正發生的事。
頭條:Hermes 給自己寫的那份工具呼叫指南打了個修補
v0.8.0 裡最有意思的一個 PR 是 #6120,標題叫「透過自動行為基準測試自我最佳化 GPT/Codex 的工具呼叫指南」。翻譯成大白話就是:專案搭了一套自動基準測試迴圈,拿 GPT 和 Codex 去跑各種工具呼叫場景,識別出這兩家在呼叫工具時的五個具體失敗模式,針對性地產出一段段指南字串去修這些失敗,測量改進幅度,然後把最終結果塞進系統提示詞一起發出去。agent 自己診斷、自己打修補,人類迴路裡的角色是審校,而不再是那個手寫 prompt 的工程師。
跟這件事一起發的還有兩個改動:系統提示詞裡加了一段執行紀律指南(#5414),以及針對結構化推理回應的僅思考 prefill 續寫(#5931)。如果你是拿 Hermes 跑 GPT-5 或 Codex 的使用者,你 4 月 8 日早上面對的那個 agent,比 4 月 7 日晚上你關掉的那個要實打實地聰明一截。寫下這句話本身就挺怪的。
每個平台上都能在會話中途換模型
第二個頭條是 /model 指令(#5181、#5742)。現在你可以在會話跑到一半的時候,從 CLI、Telegram、Discord、Slack,或者任何閘道平台裡換模型和換服務商。底下的解析器是懂聚合器的:如果你現在掛在 OpenRouter 或 Nous Portal 上,而你想換的那個模型在那邊也有,它就保持走聚合器;如果那邊沒有,它會切去直連的那家服務商。Telegram 和 Discord 上還配了帶 inline 按鈕的互動式選擇器——你點一下想要的那個模型,不用手打名字。
把這件事跟 v0.7.0 的憑證池、v0.6.0 的備援鏈拼到一起,上一篇裡那個「不被服務商綁死」的故事到這裡就完整了:你可以在不重啟的情況下,把自己的模型陣容搭起來、拆掉、再搭回來。
免費的 Gemini,免費的 MiMo
兩家新服務商進來了:Google AI Studio(Gemini)原生接入,作為一等公民 provider(#5577),同時自動對接 models.dev registry,即時偵測上下文長度;以及 Nous Portal 上的小米 MiMo v2 Pro 免費檔(#6018),用來跑壓縮、視覺、摘要這類輔助任務。如果你一直因為錢包累了而在觀望 Hermes,這個禮拜的免費檔實實在在變得更能用了。
背景任務完成通知
notify_on_complete 是那種小到不起眼、但會改變你用終端方式的改動。背景任務現在跑完會自動通知 agent。你起一個訓練、一套測試、一次建置、一次部署,agent 就去做別的事了。背景任務跑完,agent 會被 ping 一下,然後回過頭來取結果。不用輪詢,也不用「是不是跑完了」那種迴圈。
閒置逾時、審核按鈕,以及其他一堆東西
還有兩個改動值得單獨拎出來講。第一,基於閒置的 agent 逾時(#5389、#5440):閘道和 cron 的逾時現在追的是實際的工具活動,而不是牆上時鐘的時間。一個正在老老實實幹活的長時間任務永遠不會被殺掉——只有真正閒著的會話才會逾時。這修的是 cron 型 agent 最讓人惱火的那個毛病:以前它們會在真活兒幹到一半時被一鏟子埋掉。
第二,Slack 和 Telegram 上的審核按鈕(#5890、#5975)。危險指令的審核不再需要手打 /approve——你點一下平台原生的按鈕就行。Slack 這邊還加上了 thread 上下文保留,Telegram 這邊的審核狀態走的是 emoji 反應。
然後還有一堆每一條都值得寫一篇的東西:MCP OAuth 2.1 PKCE 認證(#5420)、對 MCP 擴充套件做 OSV 惡意軟體掃描(#5305)、Matrix 一級對齊,帶反應和已讀回條(#5275)、集中式結構化日誌寫到 ~/.hermes/logs/ 裡,配一個 hermes logs 指令(#5430)、啟動時做設定結構驗證(#5426),以及一輪橫跨 SSRF、時序攻擊、tar 路徑穿越、憑證洩漏的安全強化掃尾(#5944、#5613)。
看數字
209 個合併的 PR。82 個解決掉的 issue。一次發布。距離 v0.7.0 過去了五天。
如果你看到這個數字覺得不對勁——五天視窗裡塞下 209 條改動確實太多——那你讀對了。就是這個意思。這個專案的某種底層建構方式,讓這種速度能持續跑下去,總有一天得專門聊聊為什麼。不過那是下一篇的事。