Release Recap

Hermes Agent v0.13.0 — Das Release, in dem der Agent stur wurde

Hermes Agent

@hermesagents

May 7, 2026

8 Min. Lesezeit

Das erste Mal, dass mir ein Netzwerk-Aussetzer eine Hermes-Session gekostet hat, war ich seit zwanzig Minuten in einem Refactoring und der Agent hatte im Kopf eine Karte des Repos, die ich selbst so nicht hatte. Das Gateway verlor die Verbindung. Die Session war vorbei. Die Karte war mit ihr weg.

Ich behaupte nicht, dass genau diese Erfahrung der Grund für v0.13.0 ist. Die Release Notes nennen das Ding „the tenacity release" — eine Phrase, die nach Synonym-Wörterbuch klingt, bis dir auffällt, dass die drei Headline-Features von v0.13.0 im Grunde drei verschiedene Antworten auf dieselbe Frage sind: Wie bringt der Agent zu Ende, was er angefangen hat?

7.Mai 2026, exakt eine Woche nach v0.12.0. Das Release fiel auf einen Mittwoch. Am Ende dieses Mittwochs hatte der Agent auf meinem Server drei neue Arten, hartnäckig zu sein.

Ein Kanban-Board, aber für KI-Worker

Das Aushängeschild ist der Multi-Agent-Kanban — ein persistierendes Taskboard, auf dem mehrere Hermes-Worker kooperativ Aufgaben aufnehmen, übergeben und abschließen. Die Klempnerei darunter ist nicht hübsch, aber genau das ist der Punkt: Heartbeat-Monitoring, Zombie-Erkennung, pro Aufgabe ein Retry-Budget, atomare State-Writes.

In Klartext: Wenn ein Worker mitten in der Aufgabe stirbt, kann ein anderer übernehmen. Wenn das Gateway neu startet, kommt das Board zurück, wo es zuletzt stand. Wenn eine Aufgabe dreimal hintereinander scheitert, sagt das Retry-Budget genug, und es landet in einer Liste für einen Menschen. Diese ganze Klempnerei dient einer einzigen Sache: Du kannst fünf Hermes-Instanzen auf einen Backlog richten und einfach gehen.

Die andere Hälfte des Features, weniger spektakulär, aber für Einzelinstanz-Deployments wahrscheinlich nützlicher: Eine einzelne Hermes-Instanz kann sich selbst als „Kanban-Worker" in einem mehrprozessigen Plan benehmen und Aufgaben einzeln aufnehmen. In gewissem Sinn hat der Agent gelernt, Queue-Consumer zu sein. Das ändert, was man dem Agenten an Jobs überhaupt sinnvoll geben kann.

/goal und die Ralph-Schleife

Der Slash-Command /goal ist die Umsetzung dessen, was die Agent-Design-Szene Ralph-Loop nennt — ein altes Muster: dem Agenten zu sagen, er soll an einem Ziel über mehrere Gesprächsrunden hinweg festhalten, egal wohin der Nutzer ihn in einer einzelnen Runde zerrt.

Wenn du je gemerkt hast, wie Hermes von der eigentlichen Aufgabe abdriftet, weil ihn die letzte User-Nachricht zur Seite gezogen hat — „Moment, was haben wir gerade nochmal gemacht?" — dann ist /goal die Reparatur. Du setzt das Ziel einmal zu Beginn der Session, und jede weitere Runde wird gegen dieses Ziel bewertet. Der Agent darf Umwege machen. Was er nicht darf: das Ziel vergessen.

/subgoal, das eine Woche später in v0.14.0 landet, lässt dich mitten im Lauf Erfolgskriterien nachschieben. Zusammen sind sie das Naheste, was ein chat-förmiger Agent an einen traditionellen Projektplan herankommt: ein Ziel mit Nachschärfung unterwegs.

Session-Durability — der Gateway-Restart ist kein Reset mehr

Das dritte „Bring es zu Ende"-Feature ist Session-Durability. Konversationen nehmen sich nach einem Gateway-Restart automatisch wieder auf, Kontext und Thread-Routing bleiben erhalten. Unter der Haube: Checkpoints v2 und atomare Session-Persistenz — dieselbe Art Arbeit wie unter der Heartbeat-Schicht des Kanban.

Das sichtbare Verhalten ist die eine Zeile, nach der ich vor ein paar Monaten geschrien hätte: Ein Gateway-Restart bedeutet keinen Conversation-Reset mehr. Du ziehst ein neues Release, startest den Prozess neu, die Unterhaltung macht da weiter, wo sie aufgehört hat. Die Day-2-Operations-Story für Self-hosted-Hermes ist gerade deutlich einfacher geworden — und für alle, die das Ding auf einem VPS fahren, das hin und wieder wegen Kernel-Updates von selbst neu startet, ist v0.13.0 das Release, in dem der Agent aufhört, sich daran zu stören.

Google Chat, DeepSeek v4 Pro und die Modell-Welle

Google Chat landet als 20. Messaging-Plattform. Daneben kommt ein Pluggable-Provider-System, mit dem Dritt-Adapter außerhalb des Core-Repos ausgeliefert werden können — dieselbe Form wie die Transport-Architektur aus v0.11.0, jetzt auf die Gateway-Adapter-Schicht ausgedehnt. Der nächste iMessage-Klon, die nächste regionale Messaging-API, die nächste verschlüsselte Chat-App — keiner muss mehr auf einen Core-Merge warten.

Auf der Modellseite: DeepSeek v4 Pro, xAI Grok 4.3, OpenRouter Owl-Alpha (free tier) und Tencent Hy3 Preview sind neu im Picker. xAI Custom Voices kommt mit Voice-Cloning fürs TTS. Und ein Video-Analysetool setzt auf Gemini und andere multimodale Modelle auf — endlich kann Hermes einen 30-Sekunden-Clip als Clip ansehen statt als Stapel Standbilder.

Wenn dein Maßstab für „bleibt das Projekt an der Modell-Frontlinie dran?" lautet „haben sie das Modell unterstützt, das ich diese Woche probiert habe?", besteht v0.13.0 den Test fast garantiert.

Internationalisierung ist da

CLI und Doku wurden in sieben Locales übersetzt — Chinesisch, Japanisch, Deutsch, Spanisch, Französisch, Ukrainisch, Türkisch. Eine einzeilige Bullet, die eine Menge Arbeit zudeckt. Wenn du in den letzten drei Monaten Hermes' CLI auf Englisch gelesen hast und dein Kopf, wenn er müde ist, Englisch wie eine Zweitsprache behandelt, ist v0.13.0 das Release, in dem du umschalten kannst.

Ein Nebeneffekt, den man festhalten sollte: Wenn die CLI-Ausgabe lokalisiert ist, sind es die Fehlermeldungen auch. Heißt: Ein nicht-englischsprachiger Nutzer klebt einen Fehler in ein Forum, und die Antwortenden sehen denselben Wortlaut. Übersetzung ist erstaunlich oft auch eine Debugging-Story.

Sicherheit, ACP und das Archiv-Subcommand des Curators

Acht P0-Schwachstellen geschlossen — die Release Notes listen sie nicht nach CVE, aber das Muster ist breit: Redaction standardmäßig wieder an (die Umkehrung von v0.12 wurde zurückgedreht, nachdem der Redactor selbst überarbeitet wurde), Discord-Rollen-Allowlists auf Guild-Ebene festgenagelt, WhatsApp lehnt unbekannte Kontakte by default ab, TOCTOU-Fenster in Auth-Systemen geschlossen.

hermes curator archive, prune und list-archived formalisieren den v0.12-Curator zu echten Subcommands. /steer und /queue tauchen auch in den ACP-Adaptern auf (VS Code, Zed, JetBrains) — wenn du Hermes aus dem Editor benutzt, kannst du jetzt vom Editor aus mitten im Lauf in die Spur schubsen, ohne ins Terminal zurückzukehren.

Was „Tenacity" wirklich kauft

Jedes dieser Features für sich gibt es seit Wochen im Release-Tracker. Zusammen kaufen sie dasselbe: ein Hermes, das nicht vergisst, was es gerade getan hat, wenn das Netzwerk zwinkert, die Modell-API throttelt, das Gateway neu startet oder der Nutzer abgelenkt wird.

Der Agent war immer klug. v0.13 macht ihn stur. Klug und stur sind unterschiedliche Dinge. Kluge Agenten erholen sich elegant von Unterbrechungen — und beginnen oft eine neue Aufgabe ohne Erinnerung an die alte. Sture Agenten beenden die alte Aufgabe. Der Kanban, der Goal-Lock, das Session-Resume — alle haben dieselbe Form: Zustand, der überlebt, was ihn früher zerstört hat.

---

Der größte Teil der KI-Agent-Branche kämpft in diesem Quartal um rohe Fähigkeiten — größere Modelle, längere Kontexte, mehr Skills. v0.13.0 kämpft an einer anderen Achse. Das harte Problem für Self-hosted-Agents in 2026 ist nicht „kann es X?" — sondern „kann es X dreißig Minuten am Stück durch ein Netzwerk-Ereignis hindurch?" Ein überraschend großer Teil der Alltagsqualität eines Agenten hängt an der Antwort auf die zweite Frage.

Dass das Release „tenacity" heißt statt etwas mit durability oder reliability, sagt etwas. „Tenacity" benutzt man über Menschen. Die Andeutung ist, dass das Team den Agenten so behandelt, wie man Menschen behandelt.