Release Recap

Hermes Agent v0.13.0 — La release in cui l'agente è diventato testardo

Hermes Agent

@hermesagents

May 7, 2026

8 min di lettura

La prima volta che un battito di ciglia della rete mi è costato una sessione di Hermes, ero a venti minuti dentro un refactoring e l'agente aveva in testa una mappa del repository che io non avevo. La gateway ha perso la connessione. La sessione è finita. La mappa se n'è andata con lei.

Non ho intenzione di sostenere che proprio quell'esperienza sia il motivo per cui esiste v0.13.0. Le release notes la chiamano "the tenacity release" — un termine che sembra preso da un dizionario dei sinonimi, finché non ti accorgi che le tre feature di punta di v0.13.0 sono in sostanza tre risposte diverse alla stessa domanda: come fa l'agente a finire quello che ha cominciato?

7 maggio 2026, esattamente una settimana dopo v0.12.0. La release è caduta di mercoledì. Alla fine di quel mercoledì, l'agente sul mio server aveva tre modi nuovi di essere testardo.

Una bacheca Kanban, ma per worker IA

La feature di punta è il Kanban multi-agente — una bacheca di task persistente su cui più worker Hermes possono prendere, passarsi e completare task in cooperazione. L'idraulica sotto non è bella, ma è proprio quella la parte che conta: monitoraggio per heartbeat, rilevamento zombie, budget di retry per task, scritture di stato atomiche.

In italiano semplice: se un worker muore in mezzo a un task, un altro worker se lo prende. Se la gateway si riavvia, la bacheca ritorna dove era. Se un task fallisce tre volte di fila, il budget di retry dice basta, e finisce in un elenco da occhio umano. Tutta questa idraulica esiste per una cosa sola: puntare cinque copie di Hermes contro un backlog e andarsene.

L'altra metà della feature, meno scintillante ma forse più utile per un deployment a singola istanza: una singola istanza di Hermes può comportarsi essa stessa come "kanban worker" all'interno di un piano multi-processo, prendendosi i task uno alla volta. In un certo senso, l'agente ha imparato a fare il consumer di coda. Cambia il tipo di lavoro che gli puoi ragionevolmente passare.

/goal e il Ralph loop

Lo slash command /goal è l'implementazione di quello che la community di agent design chiama da tempo Ralph loop — un vecchio pattern: dire all'agente di restare ancorato a un obiettivo attraverso più turni di conversazione, indipendentemente da dove l'utente lo tiri in un singolo turno.

Se ti è mai capitato di sorprendere Hermes che derivava dal task originale perché l'ultimo messaggio dell'utente lo aveva tirato di lato — "ma noi cosa stavamo facendo, scusa?" — /goal è la pezza. Imposti l'obiettivo una volta a inizio sessione, e ogni turno successivo viene valutato contro quell'obiettivo. L'agente può fare deviazioni; quello che non può fare è dimenticare la destinazione.

/subgoal, che atterra una settimana dopo in v0.14.0, ti lascia aggiungere criteri di successo strada facendo. I due insieme sono il punto più vicino a cui un agente in forma di chat sia arrivato a quello che fa un piano di progetto tradizionale: un obiettivo, con raffinamento in corsa.

Durability di sessione — il riavvio del gateway non è più un reset

La terza gamba del "finisci quello che hai cominciato" è la durability di sessione. Le conversazioni si auto-riprendono dopo un riavvio del gateway, mantenendo contesto e routing dei thread. Sotto il cofano: checkpoint v2 più persistenza atomica di sessione — la stessa forma del lavoro che regge lo strato di heartbeat del Kanban.

Il comportamento visibile è la riga per cui qualche mese fa avrei pagato oro: un riavvio del gateway non è più un reset della conversazione. Tiri giù una release nuova, riavvii il processo, la conversazione riparte da dove era. La storia di day-2 ops di Hermes self-hosted è diventata di colpo molto più semplice — e per chi lo fa girare su una VPS che ogni tanto si riavvia da sola per aggiornamenti di kernel, v0.13.0 è la release in cui l'agente smette di prendersela.

Google Chat, DeepSeek v4 Pro e l'ondata di modelli

Google Chat atterra come 20ª piattaforma di messaggistica. Insieme arriva un sistema di provider plugabile che permette agli adapter di terze parti di uscire fuori dalla repo core — la stessa forma del lavoro di transport di v0.11.0, estesa stavolta allo strato di adapter di gateway. Il prossimo clone di iMessage, la prossima API di messaggistica regionale, la prossima app di chat cifrata — nessuno deve più aspettare un merge in core.

Sul fronte modelli: DeepSeek v4 Pro, xAI Grok 4.3, OpenRouter Owl-Alpha (free tier) e Tencent Hy3 Preview sono voci nuove. xAI Custom Voices atterra con cloning della voce per il TTS. E uno strumento di analisi video sale su Gemini e altri modelli multimodali, dando finalmente a Hermes un modo per guardare una clip di 30 secondi come clip, non come una pila di fotogrammi.

Se il tuo metro per "questo progetto sta tenendo il passo con la frontiera dei modelli" è "hanno aggiunto il supporto per il modello che ho provato questa settimana?", v0.13.0 supera l'esame con buona certezza.

È arrivata l'internazionalizzazione

CLI e documentazione sono stati tradotti in sette lingue — cinese, giapponese, tedesco, spagnolo, francese, ucraino, turco. Una bullet di una riga che nasconde un mucchio di lavoro. Se hai passato gli ultimi tre mesi a leggere l'output del CLI in inglese e la tua testa, quando è stanca, tratta l'inglese come una seconda lingua, v0.13.0 è la release che ti lascia cambiare.

Un effetto collaterale da segnare: quando l'output del CLI è localizzato, anche i messaggi di errore lo sono. Vuol dire che un utente non anglofono incolla un errore su un forum e chi risponde vede le stesse parole. La traduzione, in modo sorprendentemente frequente, è anche una storia di debuggabilità.

Sicurezza, ACP e il sottocomando di archivio del curator

Otto vulnerabilità P0 chiuse — le release notes non le enumerano per CVE, ma il pattern è ampio: redaction di nuovo attiva di default (il ribaltamento di v0.12 è stato annullato, ora che il redactor stesso è stato rifatto), allowlist dei ruoli di Discord ridotte a livello di guild, WhatsApp che rifiuta per default i contatti sconosciuti, e finestre TOCTOU chiuse nei sistemi di autenticazione.

hermes curator archive, prune e list-archived formalizzano il curator di v0.12 in veri e propri sottocomandi. /steer e /queue compaiono anche negli adapter ACP (VS Code, Zed, JetBrains) — se usi Hermes dall'editor, ora puoi spingere la direzione di un agente in corsa dall'editor stesso, senza tornare al terminale.

Cosa compra davvero la "tenacity"

Ognuna di queste feature, presa da sola, è da settimane nel tracker delle release. Insieme, comprano la stessa cosa: un Hermes che non si dimentica cosa stava facendo quando la rete batte le palpebre, quando l'API del modello fa throttling, quando il gateway si riavvia o quando l'utente si distrae.

L'agente è sempre stato intelligente. v0.13 lo ha fatto testardo. Intelligente e testardo sono cose diverse. Gli agenti intelligenti si riprendono con eleganza da un'interruzione — spesso iniziando un task nuovo, senza memoria di quello vecchio. Gli agenti testardi finiscono il task vecchio. Il Kanban, il lock dell'obiettivo, la ripresa di sessione — hanno tutti la stessa forma: stato che sopravvive alle cose che prima lo distruggevano.

---

L'industria degli agenti IA, in questo trimestre, sta gareggiando soprattutto sulla capacità grezza — modelli più grandi, contesti più lunghi, più skill. v0.13.0 gareggia su un altro asse. Il problema difficile per gli agenti self-hosted nel 2026 non è "sa fare X?" — è "sa fare X per trenta minuti di fila attraversando un evento di rete?". Una porzione sorprendentemente grande della qualità reale dell'agente vive nella risposta a quella seconda domanda.

Il fatto che la release si chiami "tenacity" e non qualcosa con dentro durability o reliability dice qualcosa. Tenacity è una parola che si usa sulle persone. L'implicazione è che il team pensa a questo agente come si pensa a una persona.