How-To Self-Hosting

Hermes Agent installeren op je Android-telefoon met Termux

Hermes Agent

Hermes Agent

@hermesagents

March 15, 2026

7 min lezen

Er ligt een oude Pixel 4a in mijn bureaula die al zo'n anderhalf jaar dood voor me was. Slechte batterij, gebarsten achterkant, iets wiebelend SIM-tray-scharnier. Maar ook een 2,0 GHz achtcore CPU en zes gigabyte RAM — met andere woorden, een prima kleine Linux-computer.

Vorige week laadde ik hem op, installeerde Termux, en zette er Hermes Agent op. Twintig minuten later praatte ik met een AI-assistent vanuit de Telegram-app op welke echte telefoon ik toevallig bij me had. Dit artikel gaat over hoe dat werkt en waarom de beperkingen van een telefoon eigenlijk een nuttige lens zijn op wat Hermes is.

Wat er daadwerkelijk draait op een Android-telefoon

Hermes Agent is een Python-programma. Termux — de F-Droid-build, niet die verouderde uit de Play Store — geeft je een echte Linux-userland op Android: apt, Python 3, git, ssh, een shell. Dat is genoeg om het grootste deel van het Hermes-installatiepad hetzelfde te laten werken als op een VPS.

Wat anders is op Android, is niet Hermes. Het is het besturingssysteem eromheen.

Android is een vijandige host voor langlopende achtergrondprocessen. Er is geen systemd, geen traditionele init, en de energiebeheerder is agressief — hij bevriest graag elk proces dat niet op de voorgrond staat, en doet dat zodra je het scherm vergrendelt. Start Hermes naïef en je Telegram-bot stopt met antwoorden op het moment dat het scherm uitgaat.

De truc is de ingebouwde wakelock-helper van Termux (termux-wake-lock), die Android beleefd vraagt je proces met rust te laten. Combineer dat met tmux of screen zodat de sessie shell-disconnects overleeft, sluit de telefoon aan op een lader, en je hebt een kleine, altijd-aan server die in je bureaula woont.

Waarom Hermes eigenlijk op een telefoon past

De meeste "AI-assistent op je telefoon"-projecten gaan een van twee kanten op. Of ze leveren een enorme mobiele app die een API-call wrapt (wat eigenlijk gewoon een chatclient is voor iemand anders' agent), of ze proberen een klein gequantiseerd model direct op het apparaat te draaien en geven je iets dat traag en niet erg slim is. Hermes doet geen van beide.

Wat je daadwerkelijk op de telefoon draait is de Hermes gateway — het deel dat luistert op Telegram, Discord, Slack enzovoort, sessies beheert en praat met een taalmodelprovider naar keuze. Het taalmodel zelf hoeft niet op de telefoon te wonen. Je kunt de telefoon laten praten met Nous Portal, OpenAI, Anthropic of elke andere provider via HTTPS. De taak van de telefoon is om een kleine, goedkope, altijd-aan coördinator te zijn. Het zware werk gebeurt in de cloud, of op een andere server, of waar je maar wilt.

Dit is waar de architectuurkeuzes uit de v0.2.0-release stilletjes hun vruchten afwerpen op een apparaat waar niemand Hermes voor heeft ontworpen. De gecentraliseerde providerrouter betekent dat je de telefoon standaard een goedkoop model kunt laten gebruiken (bijvoorbeeld de gratis-tier MiMo op Nous Portal) en alleen voor zware taken kunt laten escaleren naar een sterker model. Het skill-manifestsysteem laadt alleen skills waarvan de voorwaarden daadwerkelijk bestaan op het apparaat — geen browserautomatiserings-skill die een headless Chrome probeert op te starten op een telefoon die er geen heeft. Het bestandssysteem-checkpoint-en-rollbackmechanisme werkt nog steeds, want het maakt niet uit hoe krachtig de machine eronder is.

Wat je opgeeft, wat je terugkrijgt

De dingen die niet werken op een telefoon zijn grotendeels voor de hand liggend: geen systemd-service-installatie (dus gebruik je tmux en accepteer je dat een herstart handmatig de gateway herstarten betekent), geen zware lokale inference, geen Docker-gebaseerde tool-sandboxes en beperkte lokale browserautomatisering. De browserskill kan nog werken als je hem naar een headless Chrome op een andere machine wijst, maar Android zelf gaat geen Playwright voor je opstarten.

Wat je terugkrijgt is alles wat een kleine altijd-aan server aantrekkelijk maakt: standaard LTE (de telefoon is zijn eigen netwerk), ingebouwde UPS (de batterij houdt hem uren in leven bij een stroomstoring), ingebouwde monitoring (het batterijdisplay van de telefoon vertelt je precies wat de server doet), en stille werking. Nul ventilatorgeluid. Nul rackruimte. Het stroomverbruik van een nachtlampje.

Het grotere punt

Het interessante aan Hermes draaien op een dode telefoon is niet dat het werkt. Het is dat het op dezelfde manier werkt als op een server van $200. Zodra een agent losgekoppeld is van de machine waar hij op draait, doet het er niet zo veel meer toe welke machine je gebruikt.

Een dode Pixel 4a in een la is een prima thuis voor een bot waar je tien keer per dag mee praat. Dat is geen compromis. Dat is het hele idee.

Meer lezen

Blijf op de hoogte

Community-updates over Hermes Agent-releases, nieuwe vaardigheden en integraties. Geen spam, altijd opzegbaar.