Release Recap The Story

Hermes Agent v0.8.0 — Das Intelligenz-Release

Hermes Agent

@hermesagents

April 8, 2026

10 Min. Lesezeit

Am Morgen des 8. April 2026 bin ich aufgestanden, habe den neuesten Hermes-Agent-Build gezogen, und mitten in meiner ersten Session hat er etwas getan, das ich vorher nicht gesehen hatte. Ich hatte ihn gebeten, einen bestimmten Fehler in einem Haufen Logs aufzuspüren. Er lief grep, fand nichts, hielt eine Sekunde inne und sagte: „Das Pattern ist nicht in der Rohausgabe — ich probiere es an den dekomprimierten Archiven." Dann hatte er recht.

Ich glaube nicht, dass ich mich daran jemals ganz gewöhnen werde. Aber genau das ist der Punkt: Ein großer Teil von dem, was v0.8.0 sich so anders anfühlen lässt als v0.7.0, ist genau diese Art von kleiner, unsichtbarer Verbesserung darin, wie der Agent über seine eigene Arbeit nachdenkt. Die Release Notes nennen es the intelligence release. Das ist kein Marketing-Sprech — es beschreibt, was sich tatsächlich geändert hat.

Die Schlagzeile: Hermes hat seine eigene Tool-Use-Anleitung gepatcht

Der interessanteste PR in v0.8.0 ist #6120 mit dem Titel „Self-optimized GPT/Codex tool-use guidance via automated behavioral benchmarking." Kurz gesagt: Das Projekt hat eine automatisierte Benchmarking-Schleife gebaut, die GPT- und Codex-Modelle durchgetestet, fünf spezifische Fehlermodi in deren Tool-Aufrufen identifiziert, gezielte Guidance-Strings zur Behebung generiert, die Verbesserung gemessen und das Ergebnis als Teil des System-Prompts ausgeliefert hat. Der Agent hat sich selbst diagnostiziert und gepatcht — Menschen waren als Reviewer in der Schleife, nicht als Prompt-Ingenieure.

Daneben hat v0.8.0 eine Execution-Discipline-Guidance in die System-Prompts eingebaut (#5414) sowie Thinking-Only-Prefill-Continuation für strukturierte Reasoning-Antworten (#5931). Wer Hermes mit GPT-5 oder Codex nutzt: Der Agent, mit dem du am 8. April aufgewacht bist, war spürbar schlauer als der, den du am Abend des 7. April abgestellt hast. Es ist ein seltsamer Satz zum Aufschreiben.

Live-Modellwechsel auf jeder Plattform

Die zweite Schlagzeile ist der /model-Befehl (#5181, #5742). Du kannst jetzt Modell und Provider mitten in der Session wechseln — aus dem CLI, Telegram, Discord, Slack oder jeder anderen Gateway-Plattform heraus. Der Resolver kennt Aggregatoren: Wenn du auf OpenRouter oder Nous Portal bist und das Modell dort verfügbar ist, bleibst du auf dem Aggregator; wenn nicht, springt er zum Direkt-Provider. Telegram und Discord bekommen interaktive Auswahlelemente mit Inline-Buttons — du tippst auf das Modell, das du willst, statt seinen Namen einzutippen.

Kombiniere das mit den Credential-Pools aus v0.7.0 und den Fallback-Ketten aus v0.6.0, und die Provider-agnostische Geschichte aus dem letzten Artikel ist komplett: Du kannst dein Modell-Lineup aufbauen, umwerfen und neu aufbauen, ohne jemals neu zu starten.

Kostenloses Gemini, kostenloses MiMo

Zwei große Provider-Neuzugänge: Natives Google AI Studio (Gemini) als First-Class-Provider (#5577), mit automatischer Integration in die models.dev-Registry für Echtzeit-Kontextlängenerkennung, und Xiaomi MiMo v2 Pro gratis auf Nous Portal (#6018) für Hilfsaufgaben wie Komprimierung, Vision und Zusammenfassung. Wer Hermes bisher gescheut hat, weil das Portemonnaie müde war: Der Gratis-Tier ist diese Woche deutlich brauchbarer geworden.

Benachrichtigungen bei Hintergrundaufgaben

notify_on_complete ist die Art kleiner Änderung, die verändert, wie du ein Terminal benutzt. Hintergrundaufgaben benachrichtigen den Agenten jetzt automatisch, wenn sie fertig sind. Du startest einen Trainingsrun, eine Testsuite, einen Build oder ein Deployment, und der Agent macht derweil etwas anderes. Wenn die Hintergrundaufgabe fertig ist, bekommt der Agent einen Ping und kann das Ergebnis aufgreifen. Kein Polling, keine „Ist es schon fertig?"-Schleifen.

Inaktivitäts-Timeouts, Genehmigungsbuttons und der Rest

Zwei weitere Änderungen, die es verdienen, hervorgehoben zu werden. Erstens: Inaktivitätsbasierte Agent-Timeouts (#5389, #5440): Gateway- und Cron-Timeouts tracken jetzt echte Tool-Aktivität statt Wanduhrzeit. Eine lang laufende Aufgabe, die tatsächlich arbeitet, wird nie abgeschossen — nur wirklich inaktive Sessions laufen ab. Das behebt das nervigste Verhalten von Cron-basierten Agenten: dass sie einem mitten in der echten Arbeit den Stecker gezogen haben.

Zweitens: Genehmigungsbuttons in Slack und Telegram (#5890, #5975). Genehmigungen für gefährliche Befehle erfordern kein Eintippen von /approve mehr — du tippst auf einen nativen Plattform-Button. Slack bewahrt außerdem den Thread-Kontext; Telegram nutzt Emoji-Reaktionen für den Genehmigungsstatus.

Dazu noch ein Sammelsurium aus Dingen, die jeweils einen eigenen Artikel verdient hätten: MCP OAuth 2.1 PKCE-Authentifizierung (#5420), OSV-Malware-Scanning von MCP-Erweiterungspaketen (#5305), Matrix-Tier-1-Parität mit Reaktionen und Lesebestätigungen (#5275), zentralisiertes strukturiertes Logging nach ~/.hermes/logs/ mit einem hermes logs-Befehl (#5430), Konfigurationsstruktur-Validierung beim Start (#5426), und ein Security-Hardening-Durchlauf gegen SSRF, Timing-Angriffe, Tar-Traversal und Credential-Leaks (#5944, #5613).

In Zahlen

209 gemergte PRs. 82 gelöste Issues. Ein Release. Fünf Tage nach v0.7.0.

Wenn du diese Zahl liest und sie dir falsch vorkommt — 209 Änderungen in einem Fünf-Tage-Fenster ist verdammt viel — dann liest du richtig. Genau das ist der Punkt. Irgendetwas daran, wie dieses Projekt gebaut ist, macht diese Geschwindigkeit nachhaltig, und irgendwann müssen wir darüber reden, warum. Aber das ist das Thema des nächsten Artikels.