Tenho uma pasta cheia de scripts pessoais pela metade. Pedaços que comecei pra algum projeto, nunca generalizei direito, nunca apaguei direito. Cada vez que volto naquela pasta, eu penso em arrumar. E aí não arrumo.
O que quebrou esse loop, há alguns anos, foi uma ferramenta de backup que começou a sinalizar pra mim os arquivos que eu não abria há um ano. Não deletava; só colocava na minha frente, com uma data ao lado. Bastava isso. A maioria foi embora, uns poucos ficaram. A pasta encolheu.
Eu lembro dessa ferramenta quando leio as release notes da v0.12.0. Em 30 de abril de 2026 — sete dias depois de a v0.11.0 ter refeito a interface — a v0.12.0 lançou algo que, até onde eu sei, é a primeira vez que aparece em um agente de IA self-hosted: um curator de background que, enquanto você dorme, avalia e poda sua própria biblioteca de skills.
As release notes chamam isso de Autonomous Curator. Quase tudo o resto na v0.12.0 — Microsoft Teams, Tencent Yuanbao, Spotify, Google Meet, LM Studio de primeira classe, ComfyUI v5 no bundle — seria a manchete de um release normal. Neste, dividem o palco com um agente que toda semana senta pra recolher o que ele mesmo deixou espalhado.
O Autonomous Curator
O Autonomous Curator é um agente de background que mora no ticker de cron do gateway, com ciclo padrão de sete dias. Ele atravessa sua biblioteca de skills, dá nota pra cada skill contra uma rubrica, junta os quase-duplicados, poda o que morreu, e escreve num caminho conhecido um relatório markdown com o raciocínio anexo.
Dois detalhes técnicos das release notes que vale a pena destacar. Primeiro: o loop de self-improvement da v0.12.0 agora herda corretamente a configuração de runtime do processo pai — então o curator roda com o mesmo modelo, a mesma sandbox e as mesmas credenciais do agente que o levantou. Sem desvio surpresa, sem linha de cobrança separada. Segundo: a avaliação é baseada em rubrica, não no chute — o curator está avaliando skills contra um conjunto explícito de critérios que você pode ler e, se não concordar, alterar.
Você não fez opt-in no curator. Ele já está rodando. No próximo domingo, sua biblioteca de skills vai estar um pouco menor e mais afiada. Você vai receber um relatório explicando o que ele jogou fora e por quê. Se ele jogou fora algo que você queria manter, dá pra puxar de volta; hermes curator status ordena skills por uso, então dá pra confrontar o julgamento do curator com o seu.
A razão pela qual vale a pena registrar isso como uma mudança de categoria, e não só como uma feature, é que toda ferramenta de IA que usei tinha o mesmo problema de skills. Você instala uma skill pra testar. Esquece que instalou. Seis meses depois, seu diretório skills/ tem duzentas entradas, metade delas se contradiz ativamente, e todas contribuem tokens pro prompt. O agente nunca diz "você devia arrumar isso". Até a v0.12.
A onda de plataformas que o curator quase soterrou
Duas plataformas de chat novas na v0.12.0. Microsoft Teams como 19ª plataforma de mensageria, em formato de plugin — a versão completa, com Graph auth + listener de webhook + runtime de pipeline + delivery de saída ponta a ponta, aterrissa algumas semanas depois na v0.14.0. E Tencent Yuanbao (元宝) como 18ª, com delivery nativa de texto e mídia.
O padrão da v0.9.0 com "plataformas de consumo de verdade" (iMessage, WeChat) volta na v0.12 com um giro: a v0.12 inclina pro lado corporativo de chat. A era Slack-e-Discord dos bots de IA virou passado.
Uma enxurrada de trabalho do lado dos providers
Do lado do modelo, a manchete é o LM Studio ser promovido de "caminho comunitário testado" pra provider de primeira classe. Se você sempre quis apontar o Hermes pra um modelo local e nunca mais olhar pra um one-liner de curl, a v0.12 é o release em que esse caminho finalmente ficou chato — no bom sentido.
Junto com o LM Studio: GMI Cloud, Azure AI Foundry, MiniMax OAuth e Tencent Tokenhub. Quatro providers novos num release que todo mundo vai guardar como "o release do curator". Lendo as release notes com calma, dá pra perceber que a v0.12.0 está fazendo o trabalho de três releases comuns.
Spotify, Google Meet e os tools de integração
Duas tools de integração nativas também caíram na v0.12.0 que merecem nome próprio. Spotify com PKCE OAuth — o agente agora pula música, monta playlist e consulta o que está tocando em qual dispositivo, direto de uma conversa. Google Meet como plugin que entra em chamada e puxa transcrição.
Não são features-manchete pra todo mundo. São features-manchete pra aquele usuário específico que vinha se perguntando se "agente de IA" podia mesmo querer dizer "controla as coisas nos apps que eu uso todo dia". Pra esse usuário, a v0.12.0 é o release que finalmente diz sim.
As skills ganharam o próprio canal de distribuição
ComfyUI v5 e TouchDesigner-MCP se formaram de opcionais pra bundle padrão. Sete skills novas entram junto: Humanizer (tira os tiques de IA da saída), claude-design, design-md, airtable, pretext, spike e sketch.
A mudança que, em silêncio, abre uma porta bem maior aparece em uma linha das release notes: você agora consegue instalar uma skill direto de uma URL HTTP(S). Não precisa de registry central; se você consegue hospedar um skill manifest, consegue distribuir uma skill. Combine isso com "o curator poda sua biblioteca toda semana" e você tem o esqueleto de um ecossistema de verdade — gente compartilhando skills do jeito que compartilha gist, e o agente mantendo a biblioteca local saudável.
Um modo não-interativo e o resto do limpa-UX
hermes -z <prompt> é o novo modo one-shot não-interativo — manda um prompt, recebe uma resposta, sai. As release notes não editorializam, mas é a mudança que torna o Hermes candidato real pra pipeline de shell: echo "summarize this log" | hermes -z.
hermes update --check faz um preflight antes de puxar. /reload-skills recarrega a biblioteca de skills no meio da sessão. /busy marca o agente como ocupado, com uma opção de steering anexada. O cold start visível da TUI encolheu cerca de 57% graças à inicialização lazy e à limpeza do grafo de imports — pequeno demais pra entrar no highlight reel, grande o bastante pra você sentir no primeiro start depois do upgrade.
Quebra de compatibilidade
Duas pra anotar. A redação de secret agora é desativada por padrão (era ligada), pra não corromper payload — o default antigo comia, de vez em quando, tokens válidos que batiam no padrão do redactor. A v0.13.0 vai virar o switch de volta depois que o próprio redactor for refeito. Os comandos /provider e /plan foram removidos; seus papéis foram absorvidos por /model e /steer respectivamente.
---
Continuo voltando ao curator. O enquadramento de "self-improving" no README do Hermes está ali desde o primeiro dia, e na prática, quase sempre, ele quis dizer: o agente fica melhor em escrever skills. A v0.12.0 colocou a outra metade do self-improvement. O agente também está ficando melhor em deletar skills.
Tecnicamente, é menor do que soa; em formato, é maior do que parece. Todo outro release deste período tornou o agente capaz de fazer mais. A v0.12.0 tornou o agente capaz de fazer menos por iniciativa própria. O primeiro tipo de release aumenta a superfície que você tem que gerir. O segundo a encolhe. A cadência de um seguido do outro, eu desconfio, é a verdadeira razão pela qual esse projeto não está desabando sob o próprio peso.