Release Recap

Hermes Agent v0.11.0 — La release che ha rifatto l'interfaccia da capo

Hermes Agent

Hermes Agent

@hermesagents

April 23, 2026

7 min di lettura

L'età di uno strumento si misura da quanto la sua TUI dà per scontato che tu non la stia guardando davvero.

Il terminale di Hermes prima della v0.11.0 era esattamente questo tipo di interfaccia: funzionava, come funziona l'installer in modalità testo di un vecchio Linux box. Ogni tasto faceva qualcosa, ogni comando faceva quello che diceva, e il layout visivo era una sottile cortesia più che un design. Lo usavo tutti i giorni. Non mi sono accorto di quanto lo aggirassi in silenzio finché non è uscita la v0.11.0.

Il 23 aprile 2026, otto giorni dopo la tool gateway di v0.10.0, Hermes Agent ha rilasciato la v0.11.0. Le release notes la chiamano "the interface release" — uno di quei nomi che suonano fiacchi finché non entri sul serio nel changelog. Alla fine di v0.11.0, lo strato tra te e l'agente è un programma diverso da quello che avevi una settimana prima.

Una TUI nuova in React che parla JSON-RPC col Python

Il cambiamento da titolo è la TUI basata su Ink — una riscrittura completa in React/Ink (immagina React, ma che disegna celle di terminale invece che DOM), appoggiata a un backend Python via JSON-RPC. Il guadagno visibile: un composer "sticky" che non si butta in alto quando l'output scorre, streaming live con supporto agli appunti, e un overlay di osservabilità che mostra cosa sta facendo l'agente in questo momento — quale chiamata, quale tool, quale modello — senza che tu debba chiedere.

Il guadagno invisibile pesa di più. La TUI e il core dell'agente sono ormai due processi con un protocollo pulito tra i due. È la frase noiosa che di solito prosegue con "e così abbiamo potuto finalmente rilasciare un'estensione per l'editor". L'estensione per l'editor non si vede ancora in questa release; quello che si vede è tutto ciò che questa architettura rende possibile. I miglioramenti ACP di v0.13.0 ci salgono sopra. Il hermes proxy di v0.14.0 ci sale sopra. La dashboard nata in v0.9.0 cresce sopra.

Architettura di transport: quattro backend, cinque nuove rotte di inferenza

L'altra metà di v0.11.0 è una refactor che la maggior parte degli utenti non vedrà mai direttamente. Lo strato del modello è stato riscritto attorno a una architettura di transport plugabile con quattro backend: AnthropicTransport, ChatCompletionsTransport, ResponsesApiTransport e BedrockTransport. Il punto non è l'astrazione in sé. Il punto è quello che ne cade fuori.

Il supporto nativo ad AWS Bedrock via Converse API atterra in v0.11.0. Così come GPT-5.5 via Codex OAuth, con scoperta del modello in tempo reale nel picker. E NVIDIA NIM, Arcee AI, Step Plan, Google Gemini CLI OAuth e Vercel ai-gateway — cinque nuove rotte di inferenza nella stessa finestra, nessuna delle quali sarebbe stata un lavoro da una settimana prima della refactor.

Anche il picker si è riempito: Claude Opus 4.7, Kimi K2.6 su più provider, Xiaomi MiMo v2.5-pro e v2.5, STT/TTS di xAI Grok e TTS di Google Gemini. Se usi Hermes secondo lo schema "scelgo il modello in base al compito", v0.11.0 ti allunga sensibilmente l'elenco.

Una cosa che sembra piccola ma non lo è: anche la configurazione del timeout per provider e per modello è atterrata in questa versione. Il vecchio "un timeout per tutto" era responsabile di una percentuale imbarazzante di run lunghi che cadevano.

/steer, shell hook e una superficie di plugin molto più larga

/steer <prompt> è il comandino che cambia il modo in cui parli a un agente in esecuzione. Prima della v0.11.0, correggere un task in corso significava annullarlo e rilanciare il prompt — perdendo di solito lo stato di lavoro e il contesto che l'agente aveva accumulato. Con /steer spingi in volo: l'agente mantiene il contesto, accetta la nuova direzione e prosegue. Dal lato input, la modifica piccola-ma-rumorosa che ci si accompagna sono gli shortcut numerici sui prompt di approvazione — premi una cifra, non scrivi /approve.

Attorno a /steer, la superficie dei plugin si è allargata al punto che i plugin di Hermes possono fare cose che prima non potevano. v0.11.0 ha aggiunto hook point per slash command, dispatch dei tool, blocco dell'esecuzione e trasformazione dei risultati. Il confine tra "plugin che aggiunge un bottone" e "plugin che ridisegna davvero il comportamento dell'agente" prima era un muro; v0.11.0 l'ha trasformato in una porta.

Gli shell hook appiccicano script shell come callback di ciclo di vita — li fai scattare all'avvio di sessione, all'uso di tool, al completamento o all'errore. Il modo webhook in consegna diretta spinge l'output verso sistemi esterni con zero LLM nel percorso — l'agente lì è router, non generatore. Il completamento dinamico della shell (bash, zsh, fish) è del tipo "ma dai, questo doveva esserci da sempre" — te ne accorgi solo dopo che è arrivato.

QQBot, dashboard sul telefono e le card IA in streaming di DingTalk

Lato piattaforme, v0.11.0 ha aggiunto QQBot come 17ª piattaforma di messaggistica, su QQ Official API v2, con un wizard di setup via QR che gestisce le credenziali end-to-end. La release ha anche pompato quasi tutte le piattaforme esistenti: Discord (canali forum, accesso per ruolo, toggle degli slash command), Feishu (risposte ai commenti nei documenti, stato delle reazioni), DingTalk (preservazione delle menzioni, card IA in streaming — sì, l'agente può scrivere direttamente dentro una card che si aggiorna in tempo reale su DingTalk), WhatsApp (messaggi vocali, parità di policy) e WeCom/Weixin (creazione bot via scansione QR).

La Local Web Dashboard arrivata da v0.9.0 è cresciuta in questa release. Ha preso i18n (inglese e cinese), cambio tema in tempo reale, sistema di plugin e layout responsive per mobile. La dashboard adesso è davvero il tipo di oggetto che puoi lasciare aperto sul telefono mentre l'agente lavora sul tuo server.

In numeri

La finestra di release tra v0.10.0 e v0.11.0 ha coperto grosso modo 1.556 commit in sette giorni. Rileggilo. Il picker dei modelli ha più voci di un mese fa. La TUI è un altro programma. Lo strato di transport è un altro programma. La dashboard è un altro programma. Il contratto dei plugin è un altro contratto. Il marchio stampato sopra il binario è lo stesso.

Ho visto progetti mergere 1.556 commit in un anno e chiamarlo ciclo di release sano. v0.11.0 mostra che faccia ha quel numero quando la narrativa della cadenza smette di essere uno slogan di marketing e diventa un fatto di ingegneria. Le release notes non se ne vantano. La sezione "Highlights" dice solo "this was the interface release", perché l'interfaccia che si è mangiata sette giorni di merge era, in effetti, ciò che è uscito dalla porta.

---

Le release "di interfaccia" si tendono a sottovalutare perché un'interfaccia è il tatto di uno strumento, non quello che lo strumento fa. I numeri di benchmark non si muovono. La lista delle feature non si allunga. Ma il giorno dopo l'uscita di v0.11.0, l'agente che usavo da due mesi mi è sembrato, in qualche modo difficile da quantificare, un altro agente — meno un programma di terminale con la chat appiccicata, più un programma di chat che per caso vive in un terminale.

L'idraulica sotto la nuova TUI è ciò che rende possibili le tre settimane successive. v0.12.0 ci farà atterrare sopra l'Autonomous Curator. v0.13.0 ci farà atterrare sopra il Kanban multi-agente. v0.14.0 ci farà atterrare sopra hermes proxy. v0.11.0, di per sé, è la fondazione di quell'intero mese.

Per approfondire

Iscriviti agli aggiornamenti

Aggiornamenti dalla community sulle release di Hermes Agent, nuove skill e integrazioni. Niente spam, cancellati quando vuoi.