Release Recap

Hermes Agent v0.13.0 — O release em que o agente virou teimoso

Hermes Agent

Hermes Agent

@hermesagents

May 7, 2026

8 min de leitura

A primeira vez que um piscar de rede me custou uma sessão de Hermes, eu estava vinte minutos dentro de uma refatoração e o agente tinha na cabeça um mapa do repositório que eu não tinha. O gateway perdeu a conexão. A sessão acabou. O mapa foi junto.

Não vou fingir que essa experiência específica seja o motivo da v0.13.0 ter existido. As release notes chamam essa versão de "the tenacity release" — uma palavra que soa puxada de dicionário de sinônimos até você perceber que as três features-manchete da v0.13.0 são, no fundo, três respostas diferentes pra mesma pergunta: como o agente termina o que começou?

7 de maio de 2026, exatamente uma semana depois da v0.12.0. O release caiu numa quarta. No fim daquela quarta, o agente no meu servidor tinha três novas formas de ser teimoso.

Um quadro Kanban, mas pra workers de IA

A feature de capa é o Kanban multi-agente — um quadro de tasks persistido em que vários workers do Hermes pegam, repassam e concluem tarefas em colaboração. O encanamento embaixo não é bonito, mas é justamente a parte que importa: monitoramento por heartbeat, detecção de zumbi, orçamento de retries por task, escrita atômica de estado.

Em português simples: se um worker morre no meio de uma task, outro worker consegue reivindicá-la. Se o gateway reinicia, o quadro volta de onde parou. Se uma task falha três vezes seguidas, o orçamento de retries diz chega, e ela vai pra lista de revisão humana. Todo esse encanamento serve a uma coisa: você consegue apontar cinco cópias do Hermes pra um backlog e dar as costas.

A outra metade da feature, menos cintilante mas talvez mais útil pra deployment de instância única: uma instância isolada de Hermes consegue se comportar como "worker de kanban" num plano multi-processo, pegando tasks uma a uma. Em algum sentido, o agente aprendeu a ser consumidor de fila. Isso muda o tipo de trabalho que você pode razoavelmente entregar pra ele.

/goal e o loop de Ralph

O slash command /goal é a implementação daquilo que a comunidade de design de agentes chama de loop de Ralph — um padrão antigo: dizer ao agente pra manter um objetivo travado ao longo de vários turnos de conversa, não importa pra onde o usuário tente puxar num turno solto.

Se você já flagrou o Hermes derivando da tarefa original porque a última mensagem do usuário puxou ele pra um lado — "peraí, a gente tava fazendo o quê?" — /goal é o conserto. Você define o objetivo uma vez no começo da sessão, e cada turno seguinte é avaliado contra esse objetivo. O agente pode dar voltas; o que ele não pode é esquecer o destino.

/subgoal, que aterrissa uma semana depois na v0.14.0, deixa você acrescentar critério de sucesso no meio do caminho. Os dois juntos são o mais próximo que um agente em formato de chat chegou de um plano de projeto tradicional: um objetivo, com refinamento ao longo do caminho.

Durabilidade de sessão — reiniciar o gateway deixou de ser reiniciar a conversa

A terceira perna do "termina o que começou" é a durabilidade de sessão. As conversas se retomam sozinhas depois de um reinício de gateway, preservando contexto e roteamento de thread. Debaixo do capô, são os checkpoints v2 mais persistência atômica de sessão — a mesma forma de trabalho que sustenta a camada de heartbeats do Kanban.

O comportamento visível é a frase que eu teria pagado caro alguns meses atrás: reinício de gateway não significa mais reset de conversa. Você puxa um release novo, reinicia o processo, a conversa continua de onde parou. A história de day-2 ops do Hermes self-hosted ficou muito mais simples — e, pra quem roda em VPS que dá reboot sozinho de vez em quando por atualização de kernel, a v0.13.0 é o release em que o agente para de se incomodar.

Google Chat, DeepSeek v4 Pro e a onda de modelos

Google Chat entra como 20ª plataforma de mensageria. Junto vem um sistema de providers plugável pra que adaptadores de terceiros consigam ser distribuídos fora do repositório core — a mesma forma do trabalho de transports da v0.11.0, agora estendida pra camada de adaptadores de gateway. O próximo clone de iMessage, a próxima API de mensagem regional, o próximo app de chat criptografado — nenhum precisa mais esperar um merge no core.

Na frente de modelos: DeepSeek v4 Pro, xAI Grok 4.3, OpenRouter Owl-Alpha (free tier), e Tencent Hy3 Preview são entradas novas. xAI Custom Voices chega com clonagem de voz pro TTS. E uma ferramenta de análise de vídeo monta em cima de Gemini e outros modelos multimodais, finalmente dando ao Hermes uma forma de olhar um clipe de 30 segundos como clipe, e não como pilha de frames estáticos.

Se seu critério pra "esse projeto está acompanhando a frente de modelos?" é "eles suportam o modelo que tentei essa semana?", a v0.13.0 quase certamente passa.

A internacionalização chegou

CLI e documentação foram traduzidos em sete locales — chinês, japonês, alemão, espanhol, francês, ucraniano, turco. Uma bullet de uma linha que esconde um monte de trabalho. Se você passou os últimos três meses lendo a saída do CLI em inglês e seu cérebro, quando cansa, trata inglês como segunda língua, a v0.13.0 é o release que te deixa trocar.

Um efeito colateral que vale anotar: quando a saída do CLI é localizada, as mensagens de erro também são. O que quer dizer que um usuário não-anglófono cola um erro num fórum e quem responde vê as mesmas palavras. Tradução, com surpreendente frequência, também é uma história de "facilidade de debugar".

Segurança, ACP e o subcomando de arquivamento do curator

Oito vulnerabilidades P0 fechadas — as release notes não enumeram por CVE, mas o padrão é amplo: redaction de novo por padrão ligado (a inversão da v0.12 foi revertida, agora que o próprio redactor foi refeito), allowlists de roles do Discord delimitadas por guild, WhatsApp rejeitando contatos desconhecidos por padrão, janelas de TOCTOU fechadas nos sistemas de autenticação.

hermes curator archive, prune e list-archived formalizam o curator da v0.12 em subcomandos de verdade. /steer e /queue também aparecem nos adapters de ACP (VS Code, Zed, JetBrains) — se você usa Hermes pelo editor, agora consegue empurrar a direção de um agente em pleno andamento, sem voltar pro terminal.

O que "tenacity" de fato compra

Cada uma dessas features, isoladamente, tá no tracker há semanas. Juntas, elas compram a mesma coisa: um Hermes que não esquece o que estava fazendo quando a rede pisca, quando a API do modelo throttla, quando o gateway reinicia ou quando o usuário se distrai.

O agente sempre foi inteligente. A v0.13 fez ele teimoso. Inteligente e teimoso são coisas diferentes. Agentes inteligentes se recuperam graciosamente de interrupções — frequentemente começando uma task nova, sem memória da antiga. Agentes teimosos terminam a task antiga. O Kanban, o trava-objetivo, a retomada de sessão — todos têm a mesma forma: estado que sobrevive ao que antes destruía.

---

A indústria de agentes de IA, nesse trimestre, está em sua maioria competindo em capacidade bruta — modelos maiores, contextos mais longos, mais skills. A v0.13.0 compete em outro eixo. O problema difícil pra agentes self-hosted em 2026 não é "ele consegue fazer X?" — é "ele consegue fazer X por trinta minutos consecutivos atravessando um evento de rede?". Uma fração surpreendentemente grande da qualidade real de um agente mora na resposta dessa segunda pergunta.

Que esse release se chame "tenacity" em vez de algo com durability ou reliability dentro diz alguma coisa. Tenacity é palavra que a gente usa pra pessoa. A implicação é que o time encara esse agente do jeito que a gente encara gente.

Leia mais

Assine as Atualizações

Novidades da comunidade sobre releases do Hermes Agent, novos skills e integrações. Sem spam, cancele quando quiser.