Hermes Agent v0.14.0 è atterrata il 16 maggio 2026 — esattamente nove giorni dopo v0.13.0. È la release più grossa nella storia del progetto: 633 PR mergiate, 1.393 file toccati, 165.061 righe inserite in 808 commit, 545 issue chiuse, 215 contributori nella finestra di release. Tag upstream: v2026.5.16.
Le release notes da sole sono migliaia di parole. Qui sotto le 22 cose che vuoi davvero sapere, raggruppate per la domanda a cui rispondono. Ogni voce rimanda al PR upstream — se vuoi verificare, ci clicchi sopra.
---
Installazione e distribuzione
1. pip install hermes-agent funziona da PyPI
Dopo quattordici mesi di "fai curl di questo script", Hermes è un pacchetto PyPI vero. Il wheel porta con sé il bundle TUI Ink e il launcher di shell, così l'esperienza completa esce dalla scatola. Anche pipx install hermes-agent va bene. I vecchi percorsi — curl in una riga, Docker, git-clone — restano tutti ; questo si limita ad aprire la porta a chi viene dal mondo Python. (#26593, recupero di #26350)
2. L'onda di "alleggerimento" — installazioni più leggere
I backend pesanti (adapter di Slack / Matrix / Feishu / DingTalk, client hindsight, codex app-server, SDK di Pixverse / Camofox / generazione immagini, provider voice/TTS) ora si installano in lazy al primo uso. Gli extra [all] lasciano fuori tutto quello che è coperto da lazy-deps, l'installer fa fallback a cascata quando un wheel non sta sulla tua piattaforma, e un controllo degli advisory di supply chain scansiona ogni installazione contro versioni a rischio. Footprint più piccolo, install più veloce, meno vulnerabilità transitive. (#24220, #24515, #25014, #25038, #25766, #21818)
3. Windows nativo in early beta
Atterra un percorso Windows nativo di prima classe attraverso CLI, gateway, TUI e tools. Installer PowerShell con MinGit auto-rilevato/auto-installato (~45 MB, senza admin), riconoscimento dello stub python del Microsoft Store, conservazione del Ctrl+C in primo piano. Una quarantina di fix specifici per Windows sono già stati mergiati. WSL2 resta il percorso di produzione più rodato — l'etichetta "early beta" è stata messa lì per un motivo. (#21561)
---
Modelli e provider
4. xAI Grok via SuperGrok OAuth — e grok-4.3 sale a 1M di contesto
Se paghi SuperGrok, ora puoi usare Grok dentro Hermes loggandoti col tuo account xAI — senza API key, senza fatturazione separata. Di passaggio, il cablaggio porta grok-4.3 a una finestra di contesto da 1M token — puoi sbattere intero un codebase o un dossier di ricerca dentro un singolo prompt. Compresa una gestione decente degli errori di entitlement e una pagina di doc su come chiudere il flow OAuth quando sei in SSH su una macchina remota. (#26534, #26664, #26644, #26592)
5. hermes proxy — i tuoi abbonamenti OAuth, sul tuo localhost
Avvii hermes proxy e ti ritrovi un endpoint locale http://localhost:port che parla l'API di OpenAI, appoggiato al provider OAuth con cui sei loggato — Claude Pro, ChatGPT Pro, SuperGrok. Codex CLI, Aider, Cline, Continue — qualsiasi cosa che si aspetti un endpoint OpenAI-compatibile — gira sull'abbonamento che hai già, senza API key. Un abbonamento, tutti gli strumenti. (#25969)
6. NovitaAI entra nella lineup dei provider
Cloud AI-native con un Agent Sandbox a tariffa fissa e modelli open source (Llama, Qwen, DeepSeek). Recupero di #7219. (@kshitijk4poor) (#25507)
7. Pareto Code router di OpenRouter con min_coding_score
Il Pareto router di OpenRouter sceglie automaticamente il modello più economico sopra una soglia di qualità. Il nuovo min_coding_score regola quella soglia per i task di programmazione — Hermes inoltra al modello più economico che è almeno così bravo a programmare. Smetti di pagare il top di gamma quando ti basta una via di mezzo. (#22838)
8. Runtime Codex app-server per i modelli OpenAI / Codex
Runtime opzionale che pilota sotto il cofano il Codex CLI di OpenAI quando sei sui percorsi OpenAI o Codex. Riuso di sessione, pensionamento automatico delle sessioni bloccate, classificazione corretta del refresh OAuth — l'idraulica che impedisce ai run lunghi di agente di crollare. (#24182, #25769)
9. Alibaba Cloud diventa Qwen Cloud
Picker e config ora usano il brand che usa il resto del mondo. Le chiavi di configurazione esistenti continuano a funzionare — niente cambiamenti che rompono — è solo l'UI che si allinea al brand vero. (#24835)
---
Piattaforme di messaggistica — 22 in totale
10. Microsoft Teams — end-to-end
Teams è atterrato in v0.12.0 (marzo 2026) come prima piattaforma distribuita via plugin. v0.14.0 cabla l'intero stack di Microsoft Graph end-to-end: auth + fondazione del client (#21922), un webhook listener che riceve gli eventi di Teams (#21969), un runtime di plugin di pipeline (#22007), consegna in uscita tramite l'adapter esistente (#22024). Colleghi il bot una volta, ci parli da qualunque canale, DM o gruppo Teams. (Recuperi di #21408–#21411.)
11. LINE — prima classe via LINE Messaging API
LINE domina in Giappone, Corea e Taiwan. Hermes adesso ci sta dentro in modo nativo. (#23197)
12. SimpleX Chat — decentralizzato, senza user ID
Messaggistica focalizzata sulla privacy senza identificatori permanenti. Hermes gira sopra senza esporre alcun identificatore. (#26232 — recupero di #2558)
13. Backfill dello storico del canale Discord (acceso di default)
Quando Hermes entra per la prima volta in un canale o thread, legge lo storico recente prima di rispondere. Niente più "di cosa stavamo parlando?" — l'agente ha lo stesso contesto che hanno tutti gli altri sullo schermo. (#25984)
14. UI di bottoni nativi per clarify su Telegram e Discord
I prompt a scelta multipla ora compaiono come bottoni nativi della piattaforma. Tappi per rispondere — particolarmente comodo da mobile. (#24199, #25485)
---
Loop dell'agente e sessioni
15. /handoff trasferisce davvero la sessione live
A metà conversazione, passi la mano a un altro modello, un'altra personalità, un altro profile — ogni messaggio, ogni chiamata di tool, ogni pezzo di contesto si sposta con te. Cambi da un modello veloce a uno di reasoning profondo in pieno debug, o passi una sessione tra profile per parti diverse di un task. (#23395)
16. /subgoal — aggiungere criteri a un /goal attivo
Il /goal stile Ralph loop tiene l'agente in corsa finché un judge non accetta i criteri di successo. /subgoal <testo> impila criteri aggiuntivi su un loop in corso senza riavviarlo. (#25449)
17. Footer di verifica delle mutazioni di file per turno
Dopo ogni turno che ha scritto o modificato file, l'agente riceve un footer breve che riassume cos'è cambiato davvero su disco — path, conteggio righe, il diff vero. Si becca da solo gli errori quando una scrittura non è andata in porto o è stata sovrascritta in silenzio, invece di affermare con sicurezza che la funzione è stata aggiunta. (#24498)
18. Diagnostica semantica LSP a ogni scrittura
write_file e patch ora fanno girare un vero language server contro il file modificato e riportano i nuovi errori all'agente prima del turno successivo. Errori di tipo, simboli non definiti, import mancanti — beccati subito. Va molto oltre il lint base di Python/JSON/YAML/TOML di v0.13.0, perché qui è analisi semantica vera. (#24168, #25978)
---
Performance
19. ~19 secondi tagliati dal cold start di hermes
Cache degli skill + adapter Feishu lazy + import differiti su tutto il grafo + lookup cache-first su models.dev + check del doctor in parallelo + skip del banner di benvenuto su chat -q. La schermata All-Platforms di hermes tools è scesa da 14 secondi a meno di 1,5. (#22138, #22120, #22681, #22790, #22808, #22831, #22859, #22904, #22766, #25341)
20. Valutazioni browser_console 180 volte più veloci
Si instrada attraverso il WebSocket Chrome DevTools Protocol persistente del supervisor invece di aprire una sessione nuova a ogni chiamata. Prima, le chiamate di tool browser erano la singola operazione più lenta dell'agente. Dopo, non lo sono più. Le interazioni reali sulle pagine ti sembrano istantanee. (#23226)
21. Cache di prompt Claude da 1 ora cross-session
Quando usi Claude via Anthropic, OpenRouter o Nous Portal, il prefisso del prompt (system prompt, skill, memory) viene messo in cache per un'ora attraverso le sessioni. Avvii una sessione con /new e la prima risposta torna più veloce e più economica perché la cache è ancora calda dalla sessione precedente. Anche la review della memory in background pesca da questa cache. (#23828, #25434, #24778)
---
Multimodale
22. vision_analyze restituisce pixel ai modelli che vedono
Se il modello attivo vede davvero (GPT-5, Claude, Gemini, Grok-vision), vision_analyze ora passa i pixel grezzi direttamente al modello invece di convertirli prima in una descrizione testuale. Ricevi il vero reasoning visivo del modello al posto di un giro degradato fatto di riassunti in testo. (#22955)
---
Bonus
I 22 qua sopra sono i colpi strutturali. Dodici altri meritano una citazione:
- •
x_search— strumento di ricerca X (Twitter) di prima classe, OAuth o API key. (#26763) - •Backend cua-driver di
computer_use— modelli di vision non-Anthropic ora possono guidare il tuo desktop, con operazioni focus-safe, aggiornate a ognihermes update. (#21967, #24063) - •
video_generateunificato con backend di provider plugabili — i nuovi modelli video entrano come plugin in un singolo file. (#25126) - •URL cliccabili in qualsiasi terminale — veri hyperlink OSC8 con highlight al passaggio del mouse. (@OutThisLife, #25071, #24013)
- •Installazione in un clic dallo Zed ACP Registry via
uvx, senza npm. (#26079, #26120, #26234) - •Brave Search + DDGS come provider gratuiti di ricerca web, accanto a Tavily / SearXNG / Exa. (#21337)
- •9 nuovi skill opzionali — Hyperliquid, Yahoo Finance, api-testing (REST + GraphQL), EVM multi-chain unificato, darwinian-evolver, osint-investigation, pinggy-tunnel, watchers (polling RSS / HTTP JSON / GitHub), e una revisione completa di Notion per la Developer Platform di maggio 2026. (#23582, #23583, #23590, #25299, #26760, #26729, #26765, #21881, #26612)
- •
huggingface/skillscome tap di default fidato — gli skill della community pubblicati lì si installano senza configurazione extra. (#26219, chiude #2549) - •Blocco brute-force per sudo + tre bypass di comando pericoloso chiusi + sanitizzazione degli errori dei tool (niente più prompt injection via stringhe d'errore). (#23736, #26829, #26823)
- •
/sessions— slash command per sfogliare e riprendere sessioni precedenti. (@austinpickett, #20805) - •
ctx.llmnei plugin + flagtool_override— i plugin ottengono accesso di prima classe al LLM e possono sostituire in modo pulito i tool integrati. (#23194, #26759) - •L'API server espone gli eventi di approvazione dei run — i run lunghi non si piantano più in silenzio sui comandi che richiedono approvazione. (#21899)
---
I numeri della finestra di release
| Metrica | Valore |
|---|---|
| PR mergiate | 633 |
| Commit | 808 |
| File modificati | 1.393 |
| Righe inserite | 165.061 |
| Issue chiuse | 545 (12 P0, 50 P1) |
| Contributori | 215 |
| Tag | v2026.5.16 |
| Giorni dalla v0.13.0 | 9 |
I primi contributori della community (finestra di release)
- •@kshitijk4poor — 38 PR (cadenza/streaming di Telegram, hardening di sicurezza, igiene del codex-runtime, provider NovitaAI)
- •@alt-glitch — 13 PR (TUI con tabelle Markdown,
HERMES_SESSION_ID, hindsight-client come dipendenza opzionale) - •@OutThisLife — 12 PR (segmentazione dei turni nella TUI, titoli dei link markdown, hyperlink OSC8)
- •@austinpickett — 8 PR (
/sessions, switch di personalità, modali cron) - •@helix4u — 5 PR (setup Google Chat, Ctrl+C su Windows)
- •@rob-maron — 4 PR (Nous Portal come fonte d'autorità per i metadati dei modelli)
---