Release Recap

Hermes Agent v0.13.0 — La release en que el agente se volvió cabezota

Hermes Agent

@hermesagents

May 7, 2026

8 min de lectura

La primera vez que un parpadeo de red me costó una sesión de Hermes yo llevaba veinte minutos en una refactorización y el agente tenía en la cabeza un mapa del repo que yo no tenía. La gateway perdió la conexión. La sesión terminó. El mapa se fue con ella.

No voy a pretender que esa experiencia exacta sea la razón por la que existe v0.13.0. Las release notes la llaman "the tenacity release" — que suena a palabra sacada del diccionario de sinónimos hasta que te das cuenta de que las tres funciones titulares de v0.13.0 son respuestas distintas a la misma pregunta: ¿cómo hace el agente para terminar lo que empezó?

7 de mayo de 2026, exactamente una semana después de v0.12.0. La release cayó en miércoles. Al final de ese miércoles, el agente en mi servidor tenía tres formas nuevas de ser cabezota.

Un Kanban, pero para workers de IA

La función estrella es el Kanban multi-agente — un tablero de tareas persistente donde varios workers Hermes pueden coger, traspasar y completar tareas en colaboración. La fontanería de debajo no es bonita, pero la parte que importa es exactamente esa: monitorización por heartbeat, detección de zombies, presupuesto de reintentos por tarea, escritura atómica de estado.

Traducido a román paladino: si un worker se muere a mitad de una tarea, otro worker la puede reclamar. Si la gateway se reinicia, el tablero vuelve a donde lo dejó. Si una tarea falla tres veces seguidas, el presupuesto de reintentos dice basta y la deja registrada para un humano. Toda esta fontanería existe para una cosa: que puedas apuntar cinco copias de Hermes a un backlog y largarte.

La otra mitad de la función, menos llamativa pero probablemente más útil para un despliegue de una sola instancia: una instancia única de Hermes puede comportarse como un "worker de Kanban" dentro de un plan multi-proceso, cogiendo tareas una a una. En cierto sentido, el agente ha aprendido a ser consumidor de cola. Eso cambia qué clase de trabajos le puedes encargar de verdad.

/goal y el bucle Ralph

El comando /goal es la implementación de lo que la comunidad de diseño de agentes lleva años llamando bucle Ralph — un patrón de diseño de toda la vida que consiste en decirle al agente que mantenga la vista clavada en un objetivo a lo largo de varios turnos, da igual hacia dónde le empuje el usuario en un turno suelto.

Si alguna vez has pillado a Hermes derivando de la tarea original porque el último mensaje del usuario lo arrastró de lado — "espera, ¿qué estábamos haciendo?" — /goal es el remiendo. Pones el objetivo una sola vez al principio de la sesión y cada turno posterior se evalúa contra él. El agente puede dar rodeos; lo que no puede es olvidarse del destino.

/subgoal, que aterriza una semana después en v0.14.0, te deja añadir criterios de éxito en plena ejecución. Los dos juntos son lo más cerca que un agente con forma de chat ha estado de lo que hace un plan de proyecto tradicional: un objetivo con refinamiento sobre la marcha.

Durabilidad de sesión — reiniciar la gateway ya no es reiniciar la conversación

La tercera pata de "terminar lo que empieza" es la durabilidad de sesión. Las conversaciones se reanudan automáticamente después de un reinicio de la gateway, preservando contexto y enrutado de hilos. Debajo hay checkpoints v2 y persistencia atómica de sesión — la misma forma de trabajo que sostiene la capa de heartbeats del Kanban.

El comportamiento visible es esa única línea que llevaba meses queriendo: un reinicio de gateway ya no significa una conversación reiniciada. Tiras de una release nueva, reinicias el proceso, la conversación sigue donde la dejaste. El relato del day-2 operacional de Hermes self-hosted acaba de simplificarse mucho — y, para quien lo corre en un VPS que de vez en cuando se reinicia él solo por actualizaciones de kernel, v0.13.0 es la versión donde el agente deja de ofenderse por eso.

Google Chat, DeepSeek v4 Pro y la ola de modelos

Google Chat aterriza como la 20ª plataforma de mensajería. Junto a ella llega también un sistema de providers enchufables para que los adaptadores de terceros puedan salir fuera del repositorio principal — la misma forma del trabajo de transports de v0.11.0, ahora extendida a la capa de adaptadores de gateway. El próximo clon de iMessage, la próxima API regional de mensajería, la próxima app de chat cifrada — ninguno tiene ya que esperar a un merge en core.

En modelos: DeepSeek v4 Pro, xAI Grok 4.3, OpenRouter Owl-Alpha (gratuito) y Tencent Hy3 Preview son entradas nuevas. xAI Custom Voices llega con clonado de voz para TTS. Y una herramienta de análisis de vídeo se monta sobre Gemini y otros modelos multimodales, dando por fin a Hermes una forma de mirar un clip de 30 segundos en lugar de un montón de frames sueltos.

Si tu medida de "este proyecto sigue al día con la frontera de modelos" es "¿han añadido soporte para el modelo que probé esta semana?", v0.13.0 pasa la prueba con bastante claridad.

Llega la internacionalización

El CLI y la documentación se han traducido a siete locales: chino, japonés, alemán, español, francés, ucraniano y turco. Un bullet de una línea que esconde mucho trabajo detrás. Si llevas tres meses leyendo la salida del CLI en inglés y tu cabeza, cuando está cansada, vuelve a tratar el inglés como segundo idioma, v0.13.0 es la release que te deja cambiarlo.

Un efecto secundario que merece mención: cuando la salida del CLI está localizada, los mensajes de error también lo están. Lo que quiere decir que un usuario no anglófono puede pegar un error en un foro y los que respondan ven las mismas palabras. La traducción es, con sorprendente frecuencia, también una historia de depurabilidad.

Seguridad, ACP y el subcomando de archivado del curator

Ocho vulnerabilidades P0 cerradas — las release notes no las enumeran con CVE, pero el patrón es amplio: redaction otra vez activa por defecto (revirtiendo la inversión de v0.12 ahora que el propio redactor ha sido rehecho), listas blancas de roles de Discord acotadas por servidor, WhatsApp rechazando contactos desconocidos por defecto, y ventanas TOCTOU cerradas en los sistemas de autenticación.

hermes curator archive, prune y list-archived formalizan al curator de v0.12 como subcomandos de verdad. /steer y /queue aparecen también en los adaptadores ACP (VS Code, Zed, JetBrains) — si usas Hermes desde un editor, ahora puedes empujarle dirección al agente desde dentro del editor, sin volver a la terminal.

Qué compra de verdad la "tenacity"

Cada una de estas funciones, por separado, lleva semanas en el roadmap. Juntas compran lo mismo: un Hermes que no olvida lo que estaba haciendo cuando parpadea la red, cuando la API del modelo hace throttle, cuando se reinicia la gateway o cuando el usuario se despista.

El agente siempre fue listo. v0.13 lo hizo cabezota. No es lo mismo. Los agentes listos se recuperan de las interrupciones con elegancia — y a menudo empezando una tarea nueva sin memoria de la vieja. Los agentes cabezotas terminan la tarea vieja. El Kanban, el bloqueo de objetivo, la reanudación de sesión — son la misma forma de función: estado que sobrevive a las cosas que antes lo destruían.

---

Casi toda la industria de los agentes de IA, este trimestre, está compitiendo en capacidad bruta — modelos más grandes, contextos más largos, más skills. v0.13.0 compite en otro eje. El problema difícil para los agentes self-hosted en 2026 no es "¿sabe hacer X?" — es "¿sabe hacer X durante treinta minutos seguidos atravesando un evento de red?". Una fracción sorprendentemente grande de la calidad real del agente vive en la respuesta a esa segunda pregunta.

Que la release se llame "tenacity" en lugar de algo con la palabra durability o reliability dentro dice algo. Tenacity es una palabra que la gente usa sobre otras personas. La implicación es que el equipo está pensando en el agente como uno piensa en una persona.