Release Recap For Power Users

Hermes Agent v0.14.0 — 22 coisas que você não quer deixar passar

Hermes Agent

Hermes Agent

@hermesagents

May 16, 2026

11 min de leitura

O Hermes Agent v0.14.0 caiu em 16 de maio de 2026 — exatamente nove dias depois da v0.13.0. É o maior release da história do projeto: 633 PRs mergeados, 1.393 arquivos alterados, 165.061 linhas inseridas em 808 commits, 545 issues fechados, 215 contribuidores na janela do release. Tag de origem: v2026.5.16.

As release notes em si têm milhares de palavras. Abaixo estão as 22 coisas que você de verdade quer saber, agrupadas pela pergunta que cada uma responde. Cada item linka pro PR de origem — se quiser conferir, é só entrar.

---

Instalação e distribuição

1. pip install hermes-agent funciona pelo PyPI

Depois de catorze meses de "curl esse script", o Hermes virou um pacote PyPI de verdade. A wheel já vem com o bundle do TUI Ink e o launcher de shell, então a experiência completa sai da caixa. pipx install hermes-agent também rola. Os caminhos antigos — curl em uma linha, Docker, git-clone — continuam disponíveis ; este só abre a porta pro pessoal que vem do Python. (#26593, resgate do #26350)

2. A onda de emagrecimento — instalações mais leves

Backends pesados (adapters de Slack / Matrix / Feishu / DingTalk, cliente hindsight, codex app-server, SDKs de Pixverse / Camofox / geração de imagem, providers de voice/TTS) agora se instalam em lazy no primeiro uso. Os extras [all] deixam cair tudo que está coberto por lazy-deps, o instalador faz fallback em camadas quando uma wheel não cabe na sua plataforma, e um verificador de advisories de cadeia de suprimentos escaneia toda instalação atrás de versões inseguras. Footprint menor, install mais rápido, menos vulnerabilidades transitivas. (#24220, #24515, #25014, #25038, #25766, #21818)

3. Windows nativo em early beta

Um caminho nativo de Windows de primeira classe aterrissa em todo o stack — CLI, gateway, TUI, tools. Instalador em PowerShell com MinGit detectado/instalado automaticamente (~45 MB, sem admin), detecção do stub de python da Microsoft Store, preservação do Ctrl+C em primeiro plano. Cerca de 40 correções específicas de Windows já foram mergeadas. WSL2 segue sendo o caminho de produção mais rodado — a etiqueta "early beta" tá lá com motivo. (#21561)

---

Modelos e providers

4. xAI Grok via SuperGrok OAuth — e o grok-4.3 pula pra 1M de contexto

Se você assina o SuperGrok, agora dá pra usar o Grok dentro do Hermes logando com sua conta xAI — sem API key, sem cobrança em separado. De quebra, a integração empurra o grok-4.3 pra uma janela de contexto de 1M tokens — dá pra jogar uma codebase inteira ou um calhamaço de pesquisa num único prompt. Inclui tratamento decente de erros de entitlement e uma página de doc sobre como fechar o flow OAuth quando você tá num SSH numa máquina remota. (#26534, #26664, #26644, #26592)

5. hermes proxy — suas assinaturas OAuth, no seu localhost

Você roda hermes proxy e ganha um endpoint local em http://localhost:port que fala a API da OpenAI, apoiado em qualquer provider OAuth onde você esteja logado — Claude Pro, ChatGPT Pro, SuperGrok. Codex CLI, Aider, Cline, Continue — qualquer coisa que espere um endpoint compatível com OpenAI — funciona com a assinatura que você já tem, sem API key. Uma assinatura, todas as ferramentas. (#25969)

6. NovitaAI entra na lista de providers

Nuvem AI-native com Agent Sandbox de tarifa fixa e modelos open source (Llama, Qwen, DeepSeek). Resgate do #7219. (@kshitijk4poor) (#25507)

7. Pareto Code router do OpenRouter com min_coding_score

O Pareto router do OpenRouter escolhe automaticamente o modelo mais barato que passa de uma linha de qualidade. O novo min_coding_score regula essa linha especificamente pra tarefas de código — o Hermes roteia pro modelo mais barato que seja pelo menos esse tanto bom em programação. Para de pagar modelo top quando um mid-tier dá conta. (#22838)

8. Runtime de Codex app-server pra modelos OpenAI / Codex

Runtime opcional que dirige o Codex CLI da OpenAI por baixo dos panos quando você tá em caminhos de OpenAI ou Codex. Reuso de sessão, aposentadoria automática de sessões travadas, classificação correta do refresh OAuth — o encanamento que faz os longos runs de agente não cair. (#24182, #25769)

9. Alibaba Cloud foi renomeado pra Qwen Cloud

Picker e config agora usam a marca que o resto do mundo usa. As chaves de config antigas continuam funcionando — sem mudanças quebradoras — só a UI se alinhou com a marca real. (#24835)

---

Plataformas de mensageria — 22 no total

10. Microsoft Teams — ponta a ponta

O Teams pousou na v0.12.0 (março de 2026) como primeira plataforma entregue via plugin. A v0.14.0 fecha o stack inteiro do Microsoft Graph ponta a ponta: auth + fundação do cliente (#21922), um listener de webhook que recebe eventos do Teams (#21969), um runtime de plugin de pipeline (#22007), e entrega de saída pelo adapter existente (#22024). Você liga o bot uma vez e conversa com ele a partir de qualquer canal, DM ou grupo do Teams. (Resgates dos #21408–#21411.)

11. LINE — primeira classe via LINE Messaging API

O LINE domina no Japão, Coreia e Taiwan. O Hermes agora tá lá em modo nativo. (#23197)

12. SimpleX Chat — descentralizado, sem user IDs

Mensageria focada em privacidade sem identificadores permanentes. O Hermes roda em cima sem expor nenhum identificador. (#26232 — resgate do #2558)

13. Backfill de histórico de canal no Discord (ligado por padrão)

Quando o Hermes entra num canal ou thread pela primeira vez, ele lê o histórico recente antes de responder. Acabou aquilo de "do que a gente tava falando?" — o agente tem o mesmo contexto que está na tela pra todo mundo. (#25984)

14. UI nativa de botões pro clarify no Telegram e Discord

Prompts de múltipla escolha agora aparecem como botões nativos da plataforma. Você toca pra responder — fica especialmente bom no celular. (#24199, #25485)

---

Loop do agente e sessões

15. /handoff realmente transfere a sessão viva

No meio da conversa, você passa pra outro modelo, outra personalidade ou outro profile — cada mensagem, cada chamada de tool, cada pedaço de contexto vai junto. Troca de um modelo rápido pra um de raciocínio profundo no meio de um debug, ou passa uma sessão entre profiles pra partes diferentes de uma tarefa. (#23395)

16. /subgoal — adicionar critérios a um /goal em andamento

O /goal no estilo loop de Ralph deixa o agente rodando até um judge aceitar os critérios de sucesso. /subgoal <texto> empilha critérios extras num loop em andamento sem reiniciar a coisa. (#25449)

17. Footer de verificador de mutação de arquivo por turno

Depois de cada turno que escreveu ou editou arquivos, o agente recebe um footer curto resumindo exatamente o que mudou no disco — paths, contagem de linhas, o diff de verdade. Ele pega os próprios erros quando uma escrita não chegou ou foi sobrescrita em silêncio, ao invés de afirmar com a cara cheia que a função foi adicionada. (#24498)

18. Diagnóstico semântico LSP a cada escrita

write_file e patch agora rodam um language server de verdade contra o arquivo editado e devolvem novos erros pro agente antes do próximo turno. Erros de tipo, símbolos não definidos, imports faltando — pegos na hora. Vai bem além do linting básico de Python/JSON/YAML/TOML da v0.13.0, porque isso aqui é análise semântica de verdade. (#24168, #25978)

---

Performance

19. ~19 segundos a menos no cold start do hermes

Cache de skills + adapter Feishu em lazy + imports diferidos no grafo todo + lookup cache-first no models.dev + checks do doctor paralelizados + skip do banner de boas-vindas no chat -q. A tela All-Platforms do hermes tools caiu de 14 segundos pra menos de 1,5. (#22138, #22120, #22681, #22790, #22808, #22831, #22859, #22904, #22766, #25341)

20. Avaliações de browser_console 180 vezes mais rápidas

Rota agora pelo WebSocket persistente de Chrome DevTools Protocol do supervisor, ao invés de abrir uma sessão nova por chamada. Antes disso, as chamadas de tool de browser eram disparado a operação mais lenta do agente. Depois disso, não são mais. Interações reais com páginas parecem instantâneas. (#23226)

21. Cache de prompt do Claude de 1 hora entre sessões

Quando você usa Claude pela Anthropic, OpenRouter ou Nous Portal, o prefixo do prompt (system prompt, skills, memory) fica em cache por uma hora atravessando sessões. Você abre uma sessão com /new e a primeira resposta volta mais rápida e mais barata porque o cache ainda tá quente da sessão anterior. A revisão de memory em background também bate nesse cache. (#23828, #25434, #24778)

---

Multimodal

22. vision_analyze devolve pixels pros modelos que enxergam

Se o modelo ativo enxerga de verdade (GPT-5, Claude, Gemini, Grok-vision), vision_analyze agora passa os pixels brutos direto pro modelo ao invés de antes converter pra descrição textual. Você recebe o raciocínio visual real do modelo, em vez de uma volta degradada por resumo em texto. (#22955)

---

Bônus

Os 22 de cima são as batidas estruturais. Mais doze que merecem menção:

  • x_search — ferramenta de busca de X (Twitter) de primeira classe, OAuth ou API key. (#26763)
  • Backend cua-driver do computer_use — modelos de visão fora da Anthropic agora podem dirigir seu desktop, com operações focus-safe, atualizadas a cada hermes update. (#21967, #24063)
  • video_generate unificado com backends de provider plugáveis — modelos de vídeo novos entram como plugin de um arquivo só. (#25126)
  • URLs clicáveis em qualquer terminal — hyperlinks OSC8 de verdade com destaque ao passar o mouse. (@OutThisLife, #25071, #24013)
  • Install em um clique do Zed ACP Registry via uvx, sem npm. (#26079, #26120, #26234)
  • Brave Search + DDGS como providers gratuitos de busca web, ao lado de Tavily / SearXNG / Exa. (#21337)
  • 9 novos skills opcionais — Hyperliquid, Yahoo Finance, api-testing (REST + GraphQL), EVM multi-chain unificado, darwinian-evolver, osint-investigation, pinggy-tunnel, watchers (polling de RSS / HTTP JSON / GitHub), e uma reformulação completa do Notion pro Developer Platform de maio de 2026. (#23582, #23583, #23590, #25299, #26760, #26729, #26765, #21881, #26612)
  • huggingface/skills como tap padrão confiável — skills publicados ali pela comunidade instalam sem config extra. (#26219, fecha #2549)
  • Bloqueio de força bruta no sudo + três bypasses de comando perigoso fechados + sanitização de erros de tool (não rola mais prompt injection via strings de erro). (#23736, #26829, #26823)
  • /sessions — slash command pra navegar e retomar sessões anteriores. (@austinpickett, #20805)
  • ctx.llm em plugin + flag tool_override — plugins ganham acesso de primeira classe ao LLM e podem substituir tools nativos sem bagunça. (#23194, #26759)
  • API server expõe eventos de aprovação de run — runs longos não travam mais em silêncio em comandos que precisam de aprovação. (#21899)

---

Os números da janela de release

MétricaValor
PRs mergeados633
Commits808
Arquivos alterados1.393
Linhas inseridas165.061
Issues fechados545 (12 P0, 50 P1)
Contribuidores215
Tagv2026.5.16
Dias desde a v0.13.09

Top de contribuidores da comunidade (janela do release)

  • @kshitijk4poor — 38 PRs (cadência/streaming de Telegram, endurecimento de segurança, higiene do codex-runtime, provider NovitaAI)
  • @alt-glitch — 13 PRs (TUI com tabelas Markdown, HERMES_SESSION_ID, hindsight-client como dependência opcional)
  • @OutThisLife — 12 PRs (segmentação de turnos no TUI, títulos de link em markdown, hyperlinks OSC8)
  • @austinpickett — 8 PRs (/sessions, troca de personalidade, modais de cron)
  • @helix4u — 5 PRs (setup de Google Chat, Ctrl+C no Windows)
  • @rob-maron — 4 PRs (Nous Portal como fonte de autoridade pra metadados de modelo)

---

Leia mais

Assine as Atualizações

Novidades da comunidade sobre releases do Hermes Agent, novos skills e integrações. Sem spam, cancele quando quiser.