Release Recap The Story

Hermes Agent v0.8.0 — El lanzamiento de la inteligencia

Hermes Agent

@hermesagents

April 8, 2026

10 min de lectura

Me levanté la mañana del 8 de abril de 2026, descargué la última build de Hermes Agent, y a mitad de mi primera sesión hizo algo que no le había visto hacer antes. Le pedí que rastreara un patrón de error concreto en un montón de logs. Lanzó grep, no encontró nada, se paró un segundo y dijo: "Ese patrón no está en la salida en crudo — voy a probarlo en los archivos descomprimidos." Y acertó.

No creo que me acostumbre del todo a eso nunca. Pero el caso es que gran parte de lo que hace que la v0.8.0 se sienta como una versión distinta a la v0.7.0 es exactamente ese tipo de mejora pequeña e invisible en cómo el agente razona sobre su propio trabajo. Las notas de versión lo llaman the intelligence release. No es lenguaje de marketing; es una descripción de lo que realmente cambió.

El titular: Hermes parchó su propio uso de herramientas

El PR más interesante de la v0.8.0 es #6120, titulado "Self-optimized GPT/Codex tool-use guidance via automated behavioral benchmarking." La versión corta: el proyecto construyó un bucle de benchmarking automatizado que probó los modelos GPT y Codex, identificó cinco modos de fallo específicos en cómo llamaban a las herramientas, generó cadenas de orientación dirigidas para corregir esos fallos, midió la mejora y lo incluyó como parte del system prompt. El agente se diagnosticó y se parchó a sí mismo, con humanos en el bucle como revisores, no como ingenieros de prompts.

Junto a eso, la v0.8.0 añadió guía de disciplina de ejecución en los system prompts (#5414) y continuación de prefill solo-pensamiento para respuestas de razonamiento estructurado (#5931). Si usas Hermes con GPT-5 o Codex, el agente con el que te despertaste el 8 de abril era sensiblemente más inteligente que el que dejaste la noche del 7. Es una frase rara de escribir.

Cambio de modelo en vivo en todas las plataformas

El segundo titular es el comando /model (#5181, #5742). Ahora puedes cambiar de modelo y proveedor a mitad de sesión desde el CLI, Telegram, Discord, Slack o cualquier plataforma del gateway. El resolver es consciente de los agregadores: si estás en OpenRouter o Nous Portal y el modelo está disponible ahí, te mantiene en el agregador; si no, salta al proveedor directo. Telegram y Discord tienen selectores interactivos con botones inline — tocas el modelo que quieres, no escribes su nombre.

Combina esto con los pools de credenciales de la v0.7.0 y las cadenas de fallback de la v0.6.0, y la historia de agnoscicismo de proveedor del artículo anterior queda completa: puedes montar, romper y remontar tu lineup de modelos sin reiniciar jamás.

Gemini gratis, MiMo gratis

Dos grandes adiciones de proveedores: Google AI Studio (Gemini) nativo como proveedor de primera clase (#5577), con integración automática en el registro models.dev para detección de longitud de contexto en tiempo real, y Xiaomi MiMo v2 Pro gratis en Nous Portal (#6018) para tareas auxiliares como compresión, visión y resumen. Si estabas posponiendo Hermes porque tu cartera estaba cansada, la tier gratuita se volvió bastante más útil esta semana.

Notificaciones de tareas en segundo plano

notify_on_complete es el tipo de cambio pequeño que transforma cómo usas un terminal. Las tareas en segundo plano ahora notifican automáticamente al agente cuando terminan. Lanzas un entrenamiento, una suite de tests, un build o un despliegue, y el agente se pone a hacer otra cosa. Cuando la tarea termina, el agente recibe un ping y puede recoger el resultado. Sin polling, sin bucles de "¿ya terminó?".

Timeouts por inactividad, botones de aprobación, y el resto de la lista

Dos cambios más que vale la pena destacar. Primero, timeouts de agente basados en inactividad (#5389, #5440): los timeouts del gateway y de cron ahora rastrean actividad real de herramientas en vez de tiempo de reloj. Una tarea de larga duración que realmente está trabajando nunca será cortada — solo las sesiones genuinamente inactivas expiran. Esto corrige el comportamiento más molesto de los agentes basados en cron, que era que te cortaban a mitad de un trabajo real.

Segundo, botones de aprobación en Slack y Telegram (#5890, #5975). Las aprobaciones de comandos peligrosos ya no requieren escribir /approve — tocas un botón nativo de la plataforma. Slack también conserva el contexto del hilo; Telegram usa reacciones emoji para el estado de aprobación.

Y un popurrí de cosas que merecerían su propio artículo: autenticación MCP OAuth 2.1 PKCE (#5420), escaneo de malware OSV en paquetes de extensión MCP (#5305), paridad tier-1 de Matrix con reacciones y recibos de lectura (#5275), logging estructurado centralizado en ~/.hermes/logs/ con un comando hermes logs (#5430), validación de la estructura de configuración al arrancar (#5426), y un pase de hardening de seguridad contra SSRF, ataques de timing, traversal de tar y filtración de credenciales (#5944, #5613).

En números

209 PRs fusionados. 82 issues resueltos. Un lanzamiento. Cinco días después de la v0.7.0.

Si lees ese número y te parece que no cuadra — 209 cambios en una ventana de cinco días es demasiado — lo estás leyendo bien. Ese es el punto. Algo en cómo está construido este proyecto hace que esa velocidad sea sostenible, y en algún momento habrá que hablar de por qué. Pero ese es el tema del próximo artículo.