Ho una cartella piena di script personali fatti a metà. Pezzi che ho iniziato per qualche progetto, mai davvero generalizzati, mai davvero cancellati. Ogni volta che ci torno penso di metterla in ordine. E poi non lo faccio.
Quello che ha davvero rotto quel loop, qualche anno fa, è stato uno strumento di backup che ha iniziato a segnalarmi i file che non aprivo da un anno. Non li cancellava; me li metteva semplicemente davanti, con una data a fianco. Bastava. Quasi tutto è andato via, qualcosa è restato. La cartella si è ristretta.
Mi torna in mente quello strumento quando leggo le release notes di v0.12.0. Il 30 aprile 2026 — sette giorni dopo che v0.11.0 aveva rifatto l'interfaccia — v0.12.0 ha rilasciato qualcosa che, per quanto ne so, in un agente IA self-hosted non si era mai visto: un curator di background che, mentre dormi, valuta e pota la tua libreria di skill.
Le release notes lo chiamano Autonomous Curator. Quasi tutto il resto di v0.12.0 — Microsoft Teams, Tencent Yuanbao, Spotify, Google Meet, LM Studio prima classe, ComfyUI v5 nel bundle — sarebbe il titolone di una release qualunque. In questa, condividono il palco con un agente che una volta a settimana si mette a riordinare quello che ha lasciato in giro.
L'Autonomous Curator
L'Autonomous Curator è un agente di background che vive sul ticker cron del gateway, con un ciclo di default di sette giorni. Attraversa la libreria di skill, valuta ogni skill contro una rubrica, fonde i quasi-duplicati, pota il legno morto e scrive a un percorso noto un report markdown con il ragionamento incluso.
Due dettagli tecnici delle release notes che vale la pena tirare fuori. Primo: in v0.12.0 il loop di self-improvement eredita correttamente la configurazione di runtime del processo padre — il curator gira quindi con lo stesso modello, la stessa sandbox e le stesse credenziali dell'agente che l'ha avviato. Niente deviazioni a sorpresa, niente linea di fatturazione separata. Secondo: la valutazione è basata su rubrica, non a sensazione — il curator sta valutando le skill contro un insieme esplicito di criteri che puoi leggere e, se non sei d'accordo, modificare.
Tu non hai dato l'opt-in al curator. Sta già girando. Domenica prossima la tua libreria di skill sarà un po' più piccola e un po' più affilata. Ti arriverà un report che spiega cosa ha buttato e perché. Se ha buttato qualcosa che volevi tenere, lo puoi recuperare; hermes curator status ordina le skill per uso, così puoi mettere a confronto il giudizio del curator con il tuo.
La ragione per cui vale la pena registrarlo come un cambio di categoria, non come una feature qualsiasi, è che tutti gli strumenti IA che ho usato avevano lo stesso problema di skill. Installi una skill per provarla. Ti dimentichi di averla installata. Sei mesi dopo, la tua skills/ ha duecento voci, metà delle quali si contraddicono attivamente, e tutte contribuiscono token al prompt. L'agente non dice mai "dovresti farci pulizia". Fino a v0.12.
L'ondata di piattaforme che il curator ha quasi seppellito
In v0.12.0 sono atterrate due nuove piattaforme di chat. Microsoft Teams come 19ª piattaforma di messaggistica, in forma di plugin — la versione completa, con auth Graph + listener webhook + runtime di pipeline + delivery in uscita end-to-end, atterra qualche settimana dopo in v0.14.0. E Tencent Yuanbao (元宝) come 18ª, con delivery nativa di testo e media.
Il pattern di v0.9.0 con le "piattaforme consumer vere" (iMessage, WeChat) si ripete in v0.12 ma da un'angolazione diversa: v0.12 si inclina sul lato chat aziendale. L'era dei bot IA Slack-e-Discord è proprio finita.
Un'inondazione di lavoro lato provider
Sul fronte modello, il titolone è LM Studio promosso da "percorso comunitario testato" a provider di prima classe. Se hai sempre voluto puntare Hermes su un modello locale e non vedere mai più un one-liner di curl, v0.12 è la release in cui quel percorso è finalmente diventato noioso — nel senso buono.
Insieme a LM Studio: GMI Cloud, Azure AI Foundry, MiniMax OAuth e Tencent Tokenhub. Quattro provider nuovi in una release che tutti ricorderanno come "quella del curator". Se leggi le release notes con calma, capisci che v0.12.0 sta facendo il lavoro di tre release normali.
Spotify, Google Meet e i tool di integrazione
In v0.12.0 sono atterrati anche due tool di integrazione nativi che meritano un nome proprio. Spotify con PKCE OAuth — l'agente può saltare un brano, costruire una playlist, chiedere cosa sta suonando su quale dispositivo, da una conversazione. Google Meet come plugin che entra in chiamata e tira via il transcript.
Non sono feature da titolone per tutti. Sono feature da titolone per quell'utente specifico che si chiedeva se "agente IA" potesse voler dire davvero "controlla le cose nelle app che uso tutti i giorni". Per quell'utente, v0.12.0 è la release che finalmente risponde di sì.
Le skill hanno il loro canale di distribuzione
ComfyUI v5 e TouchDesigner-MCP si laureano da opzionali a bundle di default. Sette nuove skill atterrano insieme: Humanizer (toglie i tic da IA dall'output), claude-design, design-md, airtable, pretext, spike e sketch.
Il cambiamento che, in silenzio, apre una porta molto più grande sta in una riga delle release notes: ora puoi installare una skill direttamente da un URL HTTP(S). Niente registry centrale necessaria; se sei in grado di ospitare un manifest di skill, sei in grado di distribuirne una. Mettila insieme a "il curator ti pota la libreria di skill ogni settimana" e hai l'ossatura di un vero ecosistema — gente che condivide skill come si condividono gist, e l'agente che si occupa di mantenere sana la libreria locale.
Un modo non-interattivo e il resto del riordino UX
hermes -z <prompt> è il nuovo modo one-shot non-interattivo — lanci un prompt, prendi una risposta, esci. Le release notes non ci ricamano sopra, ma è il cambio che rende Hermes un vero candidato per le pipeline di shell: echo "summarize this log" | hermes -z.
hermes update --check fa un preflight prima di tirare giù. /reload-skills ricarica la libreria di skill a sessione in corso. /busy ti permette di segnare l'agente come occupato, con un'opzione di steering attaccata. Il cold start visibile della TUI si è ridotto di circa il 57% grazie a inizializzazione lazy e pulizia del grafo di import — piccolo abbastanza da non finire nello highlight reel, grande abbastanza da sentirlo al primo avvio dopo l'upgrade.
Cambiamenti incompatibili
Due da segnare. La redaction dei secret ora è di default disattivata (prima attiva), per evitare di rovinare il payload — il default precedente ogni tanto si mangiava token validi che combaciavano col pattern del redactor. v0.13.0 rigirerà l'interruttore una volta che il redactor stesso sarà rifatto. I comandi /provider e /plan sono stati eliminati; i loro ruoli sono stati assorbiti rispettivamente da /model e /steer.
---
Continuo a tornare al curator. La cornice "self-improving" nel README di Hermes c'è dal primo giorno, e in pratica, quasi sempre, voleva dire: l'agente diventa più bravo a scrivere skill. v0.12.0 ha aggiunto l'altra metà del self-improvement. L'agente sta diventando più bravo anche a cancellare skill.
Tecnicamente è più piccolo di quanto sembri; come forma è più grande di quanto sembri. Tutte le altre release di questo periodo hanno reso l'agente capace di fare di più. v0.12.0 ha reso l'agente capace di fare di meno, di propria iniziativa. Il primo tipo di release allarga la superficie che devi gestire. Il secondo la riduce. La cadenza di uno seguito dall'altro, sospetto, è il vero motivo per cui questo progetto non sta crollando sotto il suo stesso peso.