In meiner Schreibtischschublade liegt ein altes Pixel 4a, das für mich seit ungefähr achtzehn Monaten tot war. Kaputter Akku, Rückseite gerissen, der Scharnierpin am SIM-Tray etwas weich. Aber gleichzeitig auch eine 2,0-GHz-Achtkern-CPU und sechs Gigabyte RAM — also eigentlich ein brauchbarer kleiner Linux-Rechner.
Letzte Woche habe ich es aufgeladen, Termux installiert und Hermes Agent draufgespielt. Zwanzig Minuten später redete ich mit einem KI-Assistenten aus der Telegram-App auf dem Handy, das ich gerade bei mir hatte. Dieser Beitrag erklärt, wie das funktioniert und warum die Einschränkungen eines Handys tatsächlich ein nützlicher Blickwinkel auf das sind, was Hermes ist.
Was auf einem Android-Handy tatsächlich läuft
Hermes Agent ist ein Python-Programm. Termux — der F-Droid-Build, nicht der veraltete aus dem Play Store — gibt dir ein echtes Linux-Userland auf Android: apt, Python 3, git, ssh, eine Shell. Das reicht, damit der Großteil des Hermes-Installationspfads genauso funktioniert wie auf einem VPS.
Was auf Android anders ist, ist nicht Hermes. Es ist das Betriebssystem drumherum.
Android ist ein feindseliger Host für lang laufende Hintergrundprozesse. Es gibt kein systemd, kein traditionelles init, und der Power-Manager ist aggressiv — er friert jeden Prozess ein, dessen Bildschirm nicht im Vordergrund ist, und zwar in dem Moment, in dem du das Handy sperrst. Startest du Hermes einfach so, hört dein Telegram-Bot auf zu antworten, sobald das Display ausgeht.
Der Trick ist Termux' eingebauter Wakelock-Helfer (termux-wake-lock), der Android höflich bittet, deinen Prozess in Ruhe zu lassen. Kombiniere das mit tmux oder screen, damit die Session Shell-Unterbrechungen überlebt, steck das Handy ans Ladegerät, und du hast einen kleinen Always-on-Server in deiner Schublade.
Warum Hermes tatsächlich auf ein Handy passt
Die meisten „KI-Assistent auf dem Handy"-Projekte gehen in eine von zwei Richtungen. Entweder liefern sie eine riesige Mobile-App, die einen API-Call wrappt (was eigentlich nur ein Chat-Client für den Agenten von jemand anderem ist), oder sie versuchen, ein kleines quantisiertes Modell direkt auf dem Gerät auszuführen und liefern etwas Langsames und nicht sehr Schlaues. Hermes macht keins von beidem.
Was du auf dem Handy tatsächlich ausführst, ist das Hermes-Gateway — der Teil, der auf Telegram, Discord, Slack und Co. lauscht, Sessions verwaltet und mit einem Sprachmodellanbieter deiner Wahl kommuniziert. Das Sprachmodell selbst muss nicht auf dem Handy leben. Du kannst das Handy mit Nous Portal, OpenAI, Anthropic oder jedem anderen Provider über HTTPS reden lassen. Die Aufgabe des Handys ist es, ein winziger, billiger, immer eingeschalteter Koordinator zu sein. Die schwere Arbeit passiert in der Cloud, auf einem anderen Server oder wo auch immer du möchtest.
Hier zahlen sich die Architekturentscheidungen aus dem v0.2.0-Release leise auf einem Gerät aus, für das Hermes nie gedacht war. Der zentralisierte Provider-Router bedeutet, dass du das Handy standardmäßig ein billiges Modell nutzen lassen kannst (sagen wir das kostenlose MiMo auf Nous Portal) und es nur für schwierige Aufgaben zu einem stärkeren Modell eskaliert. Das Skill-Manifest-System lädt nur Skills, deren Voraussetzungen tatsächlich auf dem Gerät existieren — kein Browser-Automatisierungs-Skill wird versuchen, ein Headless Chrome auf einem Handy zu starten, das keins hat. Der Dateisystem-Checkpoint-und-Rollback-Mechanismus funktioniert weiterhin, weil es ihm egal ist, wie leistungsfähig die Maschine darunter ist.
Was du aufgibst, was du zurückbekommst
Die Dinge, die auf einem Handy nicht funktionieren, sind größtenteils offensichtlich: kein systemd-Service (also nutzt du tmux und akzeptierst, dass ein Neustart manuelles Neustarten des Gateways bedeutet), keine schwere lokale Inferenz, keine Docker-basierten Tool-Sandboxen und begrenzte lokale Browser-Automatisierung. Der Browser-Skill funktioniert trotzdem, wenn du ihn auf ein Headless Chrome auf einer anderen Maschine zeigst, aber Android selbst wird dir kein Playwright hochfahren.
Was du zurückbekommst, ist alles, was einen kleinen Always-on-Server attraktiv macht: LTE ab Werk (das Handy ist sein eigenes Netz), eingebaute USV (der Akku hält es stundenlang bei Stromausfall am Leben), eingebautes Monitoring (die Akkuanzeige des Handys sagt dir genau, was der Server gerade tut) und lautloser Betrieb. Null Lüftergeräusch. Null Rack-Platz. Der Stromverbrauch eines Nachtlichts.
Der eigentliche Punkt
Das Interessante daran, Hermes auf einem toten Handy zu betreiben, ist nicht, dass es funktioniert. Es ist, dass es genauso funktioniert wie auf einem 200-Dollar-Server. Sobald ein Agent von der Maschine entkoppelt ist, auf der er läuft, spielt es kaum noch eine Rolle, auf welcher Maschine du ihn betreibst.
Ein totes Pixel 4a in einer Schublade ist ein einwandfreies Zuhause für einen Bot, mit dem du zehn Mal am Tag redest. Das ist kein Kompromiss. Das ist die ganze Idee.