Acordei na manhã de 8 de abril de 2026, puxei o build mais recente do Hermes Agent, e no meio da minha primeira sessão ele fez algo que eu não tinha visto antes. Eu tinha pedido pra vasculhar um monte de logs procurando um padrão de erro específico. Ele rodou grep, não achou nada, pausou um segundo e disse: "Esse padrão não está na saída bruta — vou tentar nos arquivos descomprimidos." E acertou.
Acho que nunca vou me acostumar completamente com isso. Mas o fato é que muito do que faz a v0.8.0 parecer uma release diferente da v0.7.0 é exatamente esse tipo de elevação pequena e invisível na forma como o agente raciocina sobre o próprio trabalho. As release notes chamam de a release da inteligência. Não é linguagem de marketing; está descrevendo o que realmente mudou.
A manchete: Hermes corrigiu sua própria guidance de uso de ferramentas
O PR mais interessante da v0.8.0 é o #6120, intitulado "Self-optimized GPT/Codex tool-use guidance via automated behavioral benchmarking." Resumidamente: o projeto construiu um loop de benchmarking automatizado que sondou modelos GPT e Codex, identificou cinco modos de falha específicos na forma como chamavam ferramentas, gerou strings de guidance direcionadas pra corrigir essas falhas, mediu a melhoria e embarcou o resultado como parte do system prompt. O agente diagnosticou e se corrigiu sozinho, com humanos no loop como revisores em vez de engenheiros de prompt.
Junto com isso, a v0.8.0 adicionou guidance de disciplina de execução nos system prompts (#5414) e continuação de prefill somente com raciocínio pra respostas de raciocínio estruturado (#5931). Se você usa Hermes com GPT-5 ou Codex, o agente que te acordou em 8 de abril é significativamente mais esperto que o que você colocou pra dormir em 7 de abril. É uma frase estranha de escrever.
Troca de modelo ao vivo em todas as plataformas
A segunda manchete é o comando /model (#5181, #5742). Agora dá pra trocar modelo e provedor no meio da sessão pelo CLI, Telegram, Discord, Slack ou qualquer plataforma do gateway. O resolver é ciente de agregadores: se você está no OpenRouter ou Nous Portal e o modelo está disponível lá, ele te mantém no agregador; se não, pula pro provedor direto. Telegram e Discord ganham seletores interativos com botões inline — você toca no modelo que quer, não precisa digitar o nome.
Combine com os pools de credenciais da v0.7.0 e as cadeias de fallback da v0.6.0, e a história de ser agnóstico de provedor do post anterior agora está completa: dá pra montar, desmontar e remontar seu lineup de modelos sem nunca reiniciar.
Gemini grátis, MiMo grátis
Duas adições grandes de provedores: Google AI Studio (Gemini) nativo como provedor de primeira classe (#5577), com integração automática no registro models.dev pra detecção de tamanho de contexto em tempo real, e Xiaomi MiMo v2 Pro gratuito no Nous Portal (#6018) pra tarefas auxiliares como compressão, visão e sumarização. Se você estava adiando o Hermes porque sua carteira estava cansada, o tier gratuito ficou significativamente mais útil esta semana.
Notificações de tarefas em background
notify_on_complete é o tipo de mudança pequena que transforma como você usa um terminal. Tarefas em background agora notificam o agente automaticamente quando terminam. Inicie um treinamento, uma suíte de testes, um build ou um deploy, e o agente vai fazer outra coisa. Quando a tarefa em background termina, o agente recebe um ping e pode pegar o resultado. Sem polling, sem loops de "já terminou?"
Timeouts por inatividade, botões de aprovação e o resto da lista
Mais duas mudanças que merecem destaque. Primeiro, timeouts de agente baseados em inatividade (#5389, #5440): timeouts de gateway e cron agora rastreiam atividade real de ferramentas em vez de tempo de relógio. Uma tarefa longa que está genuinamente trabalhando nunca será morta — só sessões realmente ociosas dão timeout. Isso corrige o comportamento mais irritante de agentes baseados em cron, que era serem encerrados no meio de trabalho real.
Segundo, botões de aprovação no Slack e Telegram (#5890, #5975). Aprovações de comandos perigosos não exigem mais digitar /approve — você toca um botão nativo da plataforma. Slack também ganha preservação de contexto de thread; Telegram ganha reações de emoji pro status de aprovação.
E uma sacola de outras coisas que mereciam cada uma seu próprio post: autenticação MCP OAuth 2.1 PKCE (#5420), escaneamento de malware OSV em pacotes de extensões MCP (#5305), paridade tier-1 do Matrix com reações e confirmações de leitura (#5275), logging estruturado centralizado em ~/.hermes/logs/ com comando hermes logs (#5430), validação de estrutura de config na inicialização (#5426), e um passo de hardening de segurança contra SSRF, timing attacks, tar traversal e vazamento de credenciais (#5944, #5613).
Pelos números
209 PRs mergeados. 82 issues resolvidas. Uma release. Cinco dias após a v0.7.0.
Se você lê esse número e parece errado — 209 é muita mudança pra uma janela de cinco dias — está lendo corretamente. Esse é o ponto. Algo na forma como este projeto é construído está tornando essa velocidade sustentável, e em algum momento vamos ter que falar sobre por quê. Mas esse é o tema do próximo post.