How-To Self-Hosting

Hermes Agent en un VPS de $5: guía práctica

Hermes Agent

Hermes Agent

@hermesagents

March 19, 2026

8 min de lectura

Pago 5 dólares al mes por un VPS que la mayor parte del tiempo no hace nada. Un giga de RAM, un CPU compartido, veinte gigas de SSD, una dirección IPv4 pública. Todos los proveedores de VPS venden básicamente esta máquina, y si alguna vez tuviste un proyecto personal pequeño probablemente ya tienes uno con capacidad de sobra.

El mes pasado lo convertí en un gateway de Hermes Agent. Ahora me responde por Telegram, ejecuta cron jobs que publican resúmenes en un canal de Discord que comparto con amigos, vigila una bandeja IMAP, y en este momento — mientras escribo esto — está usando unos 320 megas de RAM y menos del 2% de CPU. Por el precio de un café, tengo un asistente que nunca se apaga.

Este post es una guía práctica del setup, y de las pocas decisiones que realmente importan en una máquina pequeña.

Qué necesitas realmente

Para Hermes, el tier de 5 dólares de cualquier proveedor confiable (Hetzner, DigitalOcean, Vultr, Linode, Contabo, OVH — todos ofrecen lo mismo a más o menos el mismo precio) es suficiente. Los números a buscar:

  • Mínimo 1 GB de RAM. El proceso Python de Hermes ocupa 200-300 MB después de arrancar. Los hilos de gateway de Telegram, Discord y Slack cada uno agrega un pequeño overhead. Deja margen para el buffering de la librería API del modelo y para alguna herramienta que cargue datos grandes.
  • Mínimo 10 GB de disco. Hermes, todas sus dependencias, la base de datos de sesiones, historial de cron y logs caben cómodamente en menos de 5 GB. El resto es margen.
  • HTTPS saliente. Es el único requisito de red. Hermes no necesita puertos entrantes abiertos salvo que corras el servidor API compatible con OpenAI o pongas el adaptador de Telegram en modo webhook en vez de polling.
  • Una distribución Linux moderna con systemd. Ubuntu 22.04 o 24.04 es la opción sin drama. Debian 12 funciona. El asistente de servicio de gateway usa systemd para registrar Hermes como servicio persistente.

Lo que notarás que falta en esta lista: una GPU, una arquitectura de CPU específica (Hermes corre bien en VPS AMD, Intel y ARM64), un dominio, un reverse proxy, o cualquier otra cosa. El gateway es solo saliente por defecto.

La instalación y qué hace

El primer comando es hermes setup. Es el asistente — te pregunta qué proveedor usar (OpenRouter, Nous Portal, Anthropic, OpenAI, Hugging Face, o un endpoint local/personalizado), te ayuda a pegar tu API key, te deja elegir un modelo por defecto, y escribe el resultado en ~/.hermes/config.yaml.

El segundo paso que importa en una máquina pequeña es hermes gateway install. Este comando convierte a Hermes en un servicio systemd, para que sobreviva reinicios y se reinicie automáticamente si se cae. Puedes elegir alcance de usuario (el servicio corre como tu usuario, sin sudo) o alcance de sistema (arranca antes del login, útil para un servidor headless). En un VPS de 5 dólares, generalmente quieres alcance de usuario.

Después, hermes gateway enable telegram (o discord, slack, signal, matrix, etc.) agrega una plataforma. Cada adaptador es un plugin — puedes correr una plataforma o las ocho a la vez; el costo en memoria de cada plataforma adicional es pequeño.

Las decisiones que importan en una caja pequeña

Tres decisiones definen la experiencia en un VPS barato.

Elección de modelo. La huella de memoria del agente en el VPS no depende del tamaño del modelo, porque la inferencia no pasa ahí. Pero la latencia y el costo de cada respuesta sí. El punto ideal para un gateway personal es un modelo mediano y rápido (Claude Sonnet, GPT-4.1 mini, Gemini Flash, o el MiMo v2 Pro gratuito de Nous Portal) por defecto, con el comando /model disponible para escalar a algo más grande cuando haga falta. El cambio de modelo en vivo permite hacerlo dentro de una conversación sin reiniciar nada.

Compresión de contexto. El valor por defecto está bien. Hermes comprime proactivamente el historial cuando la ventana de contexto se llena, y el resumen comprimido se cachea. En un VPS pequeño esto importa porque la compresión corre localmente y usa CPU — dejarla activada mantiene las conversaciones largas rápidas y no quemas todo tu presupuesto de tokens en un solo turno.

Pool de credenciales. Si pagas por múltiples API keys (común si compartes cuenta con amigos o rotas entre tiers gratuitos), Hermes tiene un pool de credenciales del mismo proveedor que rota keys automáticamente ante rate limits o errores 401. En un VPS pequeño esto convierte N tiers gratuitos en una sola key siempre disponible.

Por qué esto funciona

La razón por la que un VPS de 5 dólares puede hospedar un asistente IA real no es que Hermes esté heroicamente optimizado. Es que la arquitectura delega la parte difícil — el modelo de lenguaje — a otro, y se queda solo con la coordinación, la memoria y la ejecución de herramientas. Esa separación es lo que hace razonable el costo mensual y lo que hace que una máquina diminuta sea suficiente.

Auto-hospedar un asistente solía significar correr un modelo. Ya no. Ahora significa correr la cosa que le dice al modelo qué hacer.

Leer más

Mantente al día

Novedades de la comunidad sobre versiones de Hermes Agent, nuevos skills e integraciones. Sin spam, cancela cuando quieras.