Hermes Agent v0.14.0 cayó el 16 de mayo de 2026 — exactamente nueve días después de v0.13.0. Es la release más grande de la historia del proyecto: 633 PR mergeados, 1,393 archivos tocados, 165,061 líneas insertadas en 808 commits, 545 issues cerrados, 215 contribuidores en la ventana de release. Tag de origen: v2026.5.16.
Las release notes en sí ocupan miles de palabras. Lo de abajo son las 22 cosas que de verdad te interesa saber, agrupadas por la pregunta que responden. Cada entrada lleva enlazado el PR de origen — si quieres verificar, entras y miras.
---
Instalación y distribución
1. pip install hermes-agent funciona desde PyPI
Después de catorce meses de "curl este script", Hermes es un paquete PyPI de verdad. El wheel incluye el bundle del TUI Ink y el lanzador de shell, así que la experiencia completa sale de la caja. pipx install hermes-agent también funciona. Las vías de curl en una línea, Docker y git-clone siguen ahí — esto simplemente abre la puerta para la gente que viene de Python. (#26593, salvataje de #26350)
2. La ola de adelgazamiento — instalaciones más ligeras
Los backends de peso (adaptadores de Slack / Matrix / Feishu / DingTalk, cliente hindsight, codex app-server, SDKs de Pixverse / Camofox / generación de imagen, providers de voz/TTS) pasan ahora a lazy install al primer uso. Los extras [all] dejan caer todo lo cubierto por lazy-deps, el instalador baja por niveles cuando un wheel no encaja en tu plataforma, y un verificador de avisos de cadena de suministro escanea cada instalación contra versiones inseguras. Huella más pequeña, instalación más rápida, menos vulnerabilidades transitivas. (#24220, #24515, #25014, #25038, #25766, #21818)
3. Windows nativo en early beta
Aterriza un camino nativo de Windows de primera clase a través del CLI, la gateway, el TUI y las tools. Instalador en PowerShell con MinGit autodetectado/autoinstalado (~45 MB, sin admin), detección del stub de python de la Microsoft Store, preservación del Ctrl+C en primer plano. Ya hay unos 40 arreglos solo de Windows mergeados. WSL2 sigue siendo la ruta de producción más rodada — la etiqueta "early beta" está puesta en serio. (#21561)
---
Modelos y providers
4. xAI Grok vía SuperGrok OAuth — y grok-4.3 salta a 1M de contexto
Si pagas SuperGrok, ahora puedes usar Grok dentro de Hermes iniciando sesión con tu cuenta de xAI — sin API key, sin facturación aparte. El cableado, de paso, sube grok-4.3 a una ventana de contexto de 1M tokens, así que puedes meter una base de código entera o un corpus de investigación en un solo prompt. Incluye manejo decente de errores de entitlement y una página de docs sobre cómo cerrar el flujo OAuth cuando estás SSH-eado en una máquina remota. (#26534, #26664, #26644, #26592)
5. hermes proxy — tus suscripciones OAuth, en tu localhost
Lanzas hermes proxy y tienes un endpoint local http://localhost:port que habla la API de OpenAI, respaldado por el provider OAuth con el que estés autenticado — Claude Pro, ChatGPT Pro, SuperGrok. Codex CLI, Aider, Cline, Continue — cualquier cosa que espere un endpoint OpenAI-compatible — funciona con tu suscripción actual, sin API key. Una suscripción, todas las herramientas. (#25969)
6. NovitaAI se suma a la lista de providers
Nube AI-native con un Agent Sandbox de tarifa plana y modelos open source (Llama, Qwen, DeepSeek). Salvataje de #7219. (@kshitijk4poor) (#25507)
7. Pareto Code router de OpenRouter con min_coding_score
El Pareto router de OpenRouter elige automáticamente el modelo más barato que cumple una línea de calidad. El nuevo min_coding_score ajusta esa línea específicamente para tareas de código — Hermes enruta al modelo más asequible que sea por lo menos así de bueno programando. Deja de pagar por modelos top cuando uno de gama media te basta. (#22838)
8. Runtime Codex app-server para modelos OpenAI / Codex
Runtime opcional que conduce por debajo el Codex CLI de OpenAI cuando estás en rutas OpenAI o Codex. Reutilización de sesión, retiro automático de sesiones atascadas, clasificación correcta del refresh OAuth — la fontanería que hace que las ejecuciones largas no se caigan. (#24182, #25769)
9. Alibaba Cloud pasa a llamarse Qwen Cloud
El picker y la config ahora usan la marca que usa el resto del mundo. Las claves de configuración antiguas siguen valiendo — sin cambios que rompan — la UI simplemente se alinea con la marca real. (#24835)
---
Plataformas de mensajería — 22 en total
10. Microsoft Teams — de extremo a extremo
Teams aterrizó en v0.12.0 (marzo de 2026) como la primera plataforma servida vía plugin. v0.14.0 cierra el stack completo de Microsoft Graph: auth + base del cliente (#21922), un webhook listener que recibe eventos de Teams (#21969), un runtime de plugin de pipeline (#22007) y entrega saliente vía el adaptador existente (#22024). Conectas el bot una vez y hablas con él desde cualquier canal, DM o grupo de Teams. (Salvatajes de #21408–#21411.)
11. LINE — de primera clase vía la LINE Messaging API
LINE domina en Japón, Corea y Taiwán. Hermes ya está ahí de forma nativa. (#23197)
12. SimpleX Chat — descentralizado, sin user IDs
Mensajería centrada en privacidad sin identificadores permanentes. Hermes corre encima sin exponer identificadores. (#26232 — salvataje de #2558)
13. Backfill del historial de canal en Discord (activado por defecto)
Cuando Hermes entra por primera vez a un canal o hilo, lee el historial reciente antes de responder. Se acabó el "¿de qué estábamos hablando?" — el agente tiene el contexto que ya está en pantalla para todos los demás. (#25984)
14. UI nativa de botones para clarify en Telegram y Discord
Los prompts de opción múltiple aparecen ahora como botones nativos de la plataforma. Pulsas para responder — se nota especialmente bien en móvil. (#24199, #25485)
---
Loop del agente y sesiones
15. /handoff traspasa la sesión en vivo de verdad
En mitad de una conversación, traspasa a otro modelo, otra personalidad u otro perfil — cada mensaje, cada llamada de tool, cada trozo de contexto se va contigo. Cambias de un modelo rápido a uno de razonamiento profundo en mitad de un debug, o pasas una sesión entre perfiles para distintas partes de una tarea. (#23395)
16. /subgoal — añade criterios a un /goal en marcha
El /goal estilo bucle Ralph hace que el agente siga corriendo hasta que un judge acepte los criterios de éxito. /subgoal <texto> apila criterios extra sobre la marcha sin reiniciar el bucle. (#25449)
17. Footer verificador de mutaciones de archivo por turno
Después de cada turno que escriba o edite archivos, el agente recibe un footer corto resumiendo qué cambió de verdad en disco — rutas, conteo de líneas, el delta real. Pilla sus propios errores cuando una escritura no aterrizó o quedó silenciosamente sobrescrita, en lugar de afirmar con seguridad que la función se añadió. (#24498)
18. Diagnóstico semántico LSP en cada escritura
write_file y patch ahora ejecutan un language server de verdad contra el archivo editado y devuelven errores nuevos al agente antes del siguiente turno. Errores de tipo, símbolos sin definir, imports faltantes — atrapados al instante. Va mucho más allá del lint básico de Python/JSON/YAML/TOML de v0.13.0 porque esto es análisis semántico real. (#24168, #25978)
---
Rendimiento
19. ~19 segundos limpios del arranque en frío de hermes
Caché de skills + adaptador de Feishu lazy + imports diferidos por todo el grafo + lookup cache-first en models.dev + checks de doctor en paralelo + saltarse el banner de bienvenida en chat -q. La pantalla hermes tools All-Platforms cae de 14 segundos a menos de 1.5. (#22138, #22120, #22681, #22790, #22808, #22831, #22859, #22904, #22766, #25341)
20. Evaluaciones browser_console 180 veces más rápidas
Pasan por el WebSocket persistente de Chrome DevTools Protocol del supervisor en lugar de abrir una sesión nueva por llamada. Antes de esto, las llamadas a tools de browser eran de lejos la operación más lenta del agente. Después de esto, no lo son. Las interacciones reales con páginas se sienten instantáneas. (#23226)
21. Caché de prompt de Claude de 1 hora atravesando sesiones
Cuando usas Claude vía Anthropic, OpenRouter o Nous Portal, el prefijo de prompt (system prompt, skills, memory) se cachea durante una hora atravesando sesiones. Abres una sesión con /new y la primera respuesta vuelve más rápida y barata porque la caché sigue caliente de tu sesión anterior. La revisión de memory en background también tira de esa caché. (#23828, #25434, #24778)
---
Multimodal
22. vision_analyze devuelve píxeles a los modelos con visión
Si el modelo activo puede ver de verdad (GPT-5, Claude, Gemini, Grok-vision), vision_analyze pasa ahora los píxeles directamente al modelo en lugar de convertirlos primero a una descripción de texto. Recibes el razonamiento visual real del modelo en vez de un viaje degradado por resumen textual. (#22955)
---
Bonus
Las 22 de arriba son los pulsos estructurales. Doce más que merecen mención:
- •
x_search— herramienta de búsqueda de X (Twitter) de primera clase, OAuth o API key. (#26763) - •Backend cua-driver de
computer_use— modelos de visión no-Anthropic pueden ahora conducir tu escritorio, con operaciones focus-safe, refrescado enhermes update. (#21967, #24063) - •
video_generateunificado con backends de provider enchufables — los modelos de vídeo nuevos entran como plugins de un solo archivo. (#25126) - •URLs cliqueables en cualquier terminal — hipervínculos OSC8 de verdad con resaltado al pasar el ratón. (@OutThisLife, #25071, #24013)
- •Instalación en un clic en el Zed ACP Registry vía
uvx, sin npm. (#26079, #26120, #26234) - •Brave Search + DDGS como providers gratuitos de búsqueda web junto a Tavily / SearXNG / Exa. (#21337)
- •9 skills opcionales nuevos — Hyperliquid, Yahoo Finance, api-testing (REST + GraphQL), EVM multi-chain unificado, darwinian-evolver, osint-investigation, pinggy-tunnel, watchers (RSS / HTTP JSON / GitHub polling) y una revisión completa de Notion para la Developer Platform de mayo de 2026. (#23582, #23583, #23590, #25299, #26760, #26729, #26765, #21881, #26612)
- •
huggingface/skillscomo tap por defecto de confianza — los skills de comunidad publicados ahí se instalan sin configuración extra. (#26219, cierra #2549) - •Bloqueo de fuerza bruta de sudo + tres cierres de bypass de comandos peligrosos + saneamiento de errores de tool (no más prompt injection vía cadenas de error). (#23736, #26829, #26823)
- •
/sessions— comando de barra para navegar y retomar sesiones anteriores. (@austinpickett, #20805) - •
ctx.llmen plugins + flagtool_override— los plugins obtienen acceso de primera clase al LLM y pueden sustituir tools internas limpiamente. (#23194, #26759) - •El API server expone eventos de aprobación de ejecución — las ejecuciones largas ya no se quedan colgadas en silencio en comandos que requieren aprobación. (#21899)
---
Los números de la ventana de release
| Métrica | Cantidad |
|---|---|
| PR mergeados | 633 |
| Commits | 808 |
| Archivos cambiados | 1,393 |
| Líneas insertadas | 165,061 |
| Issues cerrados | 545 (12 P0, 50 P1) |
| Contribuidores | 215 |
| Tag | v2026.5.16 |
| Días desde v0.13.0 | 9 |
Top de contribuidores de la comunidad (ventana de release)
- •@kshitijk4poor — 38 PR (cadencia/streaming de Telegram, endurecimiento de seguridad, higiene del codex-runtime, provider NovitaAI)
- •@alt-glitch — 13 PR (TUI con tablas Markdown,
HERMES_SESSION_ID, hindsight-client como dep opcional) - •@OutThisLife — 12 PR (segmentación de turnos del TUI, títulos en enlaces markdown, hipervínculos OSC8)
- •@austinpickett — 8 PR (
/sessions, cambio de personalidad, modales de cron) - •@helix4u — 5 PR (setup de Google Chat, Ctrl+C en Windows)
- •@rob-maron — 4 PR (Nous Portal como autoridad de metadatos de modelos)
---