How-To Self-Hosting

Hermes Agent draaien op een VPS van $5: een praktische gids

Hermes Agent

Hermes Agent

@hermesagents

March 19, 2026

8 min lezen

Ik betaal 5 dollar per maand voor een VPS die het grootste deel van de tijd niks doet. Eén gigabyte RAM, een gedeelde CPU, twintig gigabyte SSD en een publiek IPv4-adres. Elke VPS-provider verkoopt zo'n machine, en als je ooit een klein persoonlijk project hebt gedraaid, heb je er waarschijnlijk al eentje staan met ruimte over.

Vorige maand heb ik de mijne omgebouwd tot een Hermes Agent-gateway. Hij beantwoordt nu mijn berichten in Telegram, draait geplande cronjobs die samenvattingen posten in een Discord-kanaal dat ik met vrienden deel, houdt een IMAP-inbox in de gaten, en gebruikt op dit moment — terwijl ik dit typ — zo'n 320 megabyte RAM en minder dan 2% CPU. Voor de prijs van een kop koffie heb ik een assistent die altijd aanstaat.

Dit artikel is een praktische gids voor de setup, en voor de paar keuzes die er echt toe doen op een kleine machine.

Wat je echt nodig hebt

Voor Hermes is een VPS-pakket van 5 dollar bij een willekeurige betrouwbare provider (Hetzner, DigitalOcean, Vultr, Linode, Contabo, OVH — ze bieden allemaal ongeveer hetzelfde voor dezelfde prijs) voldoende. Waar je op moet letten:

  • Minimaal 1 GB RAM. Het Python-proces van Hermes zelf zit na het opstarten rond de 200-300 MB. De gateway-threads voor Telegram, Discord en Slack voegen elk een kleine overhead toe. Houd ruimte over voor het bufferen van antwoorden door de taalmodel-API-bibliotheek, en voor tools die af en toe grotere datasets laden.
  • Minimaal 10 GB schijfruimte. Hermes, alle dependencies, de sessiedatabase, crongeschiedenis en logbestanden passen comfortabel in minder dan 5 GB. De rest is marge.
  • Uitgaand HTTPS. Dit is de enige netwerkvereiste. Hermes heeft geen open inkomende poorten nodig, tenzij je de optionele OpenAI-compatibele API-server draait of de Telegram-adapter in webhook-modus gebruikt in plaats van polling.
  • Een moderne Linux-distributie met systemd. Ubuntu 22.04 of 24.04 is de probleemloze standaard. Debian 12 werkt ook. De gateway-installatiewizard gebruikt systemd om Hermes als permanente systeem- of gebruikerservice te registreren.

Wat opvalt in dit lijstje: géén GPU, geen specifieke CPU-architectuur (Hermes draait prima op AMD, Intel en ARM64 VPS'en), geen domeinnaam, geen reverse proxy, niks. De gateway werkt standaard alleen uitgaand.

De installatie, en wat die doet

Het eerste commando is hermes setup. Dit is de wizard — hij vraagt welke provider je wilt gebruiken (OpenRouter, Nous Portal, Anthropic, OpenAI, Hugging Face of een lokaal/custom endpoint), helpt je je API-key te plakken, laat je een standaardmodel kiezen en schrijft het resultaat naar ~/.hermes/config.yaml.

De tweede stap die ertoe doet op een kleine machine is hermes gateway install. Dit commando maakt van Hermes een systemd-service, zodat hij reboots overleeft en automatisch herstart bij crashes. Je kunt kiezen voor user scope (de service draait onder je logingebruiker, geen sudo nodig) of system scope (service start vóór login, handig voor een headless box). Op een VPS van 5 dollar wil je meestal user scope. Op headless systemen schakelt Hermes automatisch systemd linger in, zodat de service blijft draaien nadat je de verbinding verbreekt.

Vervolgens voegt hermes gateway enable telegram (of discord, slack, signal, matrix, etc.) een platform toe. Elke adapter is een plugin — je kunt één platform draaien of alle acht tegelijk; het extra geheugengebruik per platform is klein, een paar MB aan Python-objecten plus wat buffering van de SDK van het platform zelf.

De keuzes die er echt toe doen op een kleine machine

Drie beslissingen bepalen of de ervaring goed is op een goedkope VPS.

Modelkeuze. Het geheugengebruik van de agent op de VPS hangt niet af van de modelgrootte, want inferentie vindt niet op de machine plaats. Maar de latency en kosten per antwoord wel. De sweet spot voor een persoonlijke gateway is meestal een middelgroot snel model (Claude Sonnet, GPT-4.1 mini, Gemini Flash, of het gratis MiMo v2 Pro op Nous Portal voor bijkomende taken) als standaard, met het /model-commando beschikbaar om on-demand naar een zwaarder model te schakelen. Live modelswitching betekent dat je dit midden in een gesprek kunt doen zonder iets te herstarten.

Contextcompressie. De standaardinstelling is prima. Hermes comprimeert proactief de gespreksgeschiedenis wanneer het contextvenster vol raakt, en de gecomprimeerde samenvatting wordt gecacht. Op een kleine VPS is dit belangrijk omdat contextcompressie lokaal draait en CPU kost — door het aan te laten staan blijven lange gesprekken snel en verbrand je niet per ongeluk je hele tokenbudget in één beurt.

Credential pooling. Als je voor meerdere API-keys betaalt (gebruikelijk als je een provideraccount deelt met vrienden of wisselt tussen gratis tiers), heeft Hermes een credential-poolfunctie die automatisch keys roteert bij rate limits of 401-fouten. Op een kleine VPS maakt dit in feite van N gratis tiers één altijd-beschikbare key — precies wat je wilt voor een assistent die altijd aanstaat.

Waarom dit überhaupt werkt

Een VPS van 5 dollar kan een echte AI-assistent hosten, niet omdat Hermes heroïsch geoptimaliseerd is. Het komt doordat de architectuur het zware werk — het taalmodel — aan een ander overlaat en alleen de coördinatie, het geheugen en de tool-executielogica lokaal draait. Die splitsing is wat de maandelijkse kosten betaalbaar maakt en een kleine machine genoeg maakt.

Zelf een assistent hosten betekende vroeger: een model draaien. Dat is niet meer zo. Het betekent nu: het ding draaien dat het model vertelt wat het moet doen.

Meer lezen

Blijf op de hoogte

Community-updates over Hermes Agent-releases, nieuwe vaardigheden en integraties. Geen spam, altijd opzegbaar.