Release Recap

Hermes Agent v0.12.0 — Das Release, in dem der Agent gelernt hat, wegzuschmeißen

Hermes Agent

@hermesagents

April 30, 2026

7 Min. Lesezeit

Ich habe einen Ordner voll mit halbfertigen persönlichen Skripten. Schnipsel, die ich für irgendein Projekt angefangen, nie wirklich generalisiert und nie wirklich gelöscht habe. Jedes Mal, wenn ich in den Ordner zurückkomme, denke ich darüber nach, ihn aufzuräumen. Und mache es dann nicht.

Was die Schleife vor Jahren wirklich gebrochen hat, war ein Backup-Tool, das anfing, mir Dateien anzuzeigen, die ich seit einem Jahr nicht mehr geöffnet hatte. Es hat sie nicht gelöscht; es hat sie mir nur vor die Nase gelegt, mit einem Datum dahinter. Das hat gereicht. Das meiste ging, ein paar Sachen blieben. Der Ordner schrumpfte.

An dieses Tool muss ich denken, wenn ich die Release Notes von v0.12.0 lese. Am 30. April 2026 — sieben Tage nachdem v0.11.0 das Interface neu gebaut hatte — hat v0.12.0 etwas ausgeliefert, das, soweit ich es überblicke, in einem Self-hosted-KI-Agent zum ersten Mal vorkommt: einen Hintergrund-Curator, der nachts, während du schläfst, deine eigene Skill-Bibliothek bewertet und ausdünnt.

Die Release Notes nennen das Ding Autonomous Curator. Fast alles andere in v0.12.0 — Microsoft Teams, Tencent Yuanbao, Spotify, Google Meet, LM Studio first-class, ComfyUI v5 bundled — wäre für ein normales Release der Aufmacher. In diesem Release teilen sie sich die Bühne mit einem Agenten, der einmal die Woche selbst hinter sich aufräumt.

Der Autonomous Curator

Der Autonomous Curator ist ein Hintergrund-Agent, der auf dem Cron-Ticker des Gateways läuft, mit einem Standardzyklus von sieben Tagen. Er geht die Skill-Bibliothek durch, bewertet jedes Skill gegen eine Rubrik, fasst Beinahe-Duplikate zusammen, schneidet das tote Holz weg und schreibt an einen festen Pfad ein Markdown-Protokoll mit der Argumentation dazu.

Zwei technische Details aus den Release Notes, die es wert sind, herauszuziehen. Erstens: Die Self-Improvement-Schleife in v0.12.0 erbt die Runtime-Konfiguration des Parent-Prozesses jetzt korrekt — der Curator läuft also mit demselben Modell, derselben Sandbox und denselben Credentials wie der Agent, der ihn gestartet hat. Keine überraschenden Pfadwechsel, keine separate Rechnungslinie. Zweitens: Die Bewertung läuft rubric-basiert, nicht aus dem Bauch — der Curator bewertet Skills gegen einen expliziten Satz Kriterien, die du lesen und, falls du anderer Meinung bist, ändern kannst.

Du hast den Curator nicht eingeschaltet. Er läuft schon. Am nächsten Sonntag ist deine Skill-Bibliothek ein bisschen kleiner und schärfer. Du bekommst ein Protokoll, das erklärt, was er weggeschmissen hat und warum. Wenn er etwas weggeschmissen hat, das du behalten wolltest, kannst du es zurückholen; hermes curator status sortiert Skills nach Nutzungshäufigkeit, sodass du das Urteil des Curators gegen dein eigenes halten kannst.

Der Grund, das nicht nur als Feature, sondern als Kategoriewechsel zu vermerken, ist: Jedes KI-Werkzeug, das ich je benutzt habe, hatte dasselbe Skill-Problem. Du installierst ein Skill, um es zu probieren. Du vergisst, dass du es installiert hast. Sechs Monate später hat dein skills/-Verzeichnis zweihundert Einträge, von denen die Hälfte sich aktiv widersprechen und alle Prompt-Tokens kosten. Der Agent selbst sagt nie „du solltest hier aufräumen". Bis v0.12.

Die Plattform-Welle, die der Curator beinahe begraben hätte

In v0.12.0 sind zwei neue Chat-Plattformen gelandet. Microsoft Teams als 19. Messaging-Plattform, in Form eines Plugins — die Vollversion mit Graph-Auth + Webhook-Listener + Pipeline-Runtime + Outbound-Delivery Ende-zu-Ende landet ein paar Wochen später in v0.14.0. Und Tencent Yuanbao (元宝) als 18., mit nativer Text- und Media-Zustellung.

Das Muster von v0.9.0, „echte Consumer-Plattformen" (iMessage, WeChat), wiederholt sich in v0.12 mit anderem Vorzeichen: v0.12 lehnt sich auf die Enterprise-Chat-Seite. Die Slack-und-Discord-Ära der KI-Bots ist wirklich vorbei.

Eine Flut an Provider-Arbeit

Auf der Modellseite ist die Schlagzeile, dass LM Studio vom „getesteten Community-Pfad" zum First-Class-Provider hochgestuft wurde. Wer immer schon Hermes auf ein lokales Modell zeigen und nie wieder ein curl-One-Liner sehen wollte: v0.12 ist das Release, in dem dieser Pfad endlich langweilig wird — im guten Sinn.

Neben LM Studio: GMI Cloud, Azure AI Foundry, MiniMax OAuth und Tencent Tokenhub. Vier neue Provider in einem Release, das alle als „das Curator-Release" in Erinnerung behalten werden. Wenn du die Release Notes sorgfältig liest, merkst du, dass v0.12.0 die Arbeit von drei normalen Releases erledigt.

Spotify, Google Meet und die Integration-Tools

In v0.12.0 sind zwei native Integration-Tools gelandet, die einen eigenen Namen verdienen. Spotify mit PKCE OAuth — der Agent kann jetzt einen Song überspringen, eine Playlist bauen, abfragen, was auf welchem Gerät läuft, aus einer Chat-Konversation heraus. Google Meet als Plugin, das in Anrufe joint und Transkripte zieht.

Das sind keine Headline-Features für alle. Es sind Headline-Features für genau den Nutzer, der sich gefragt hat, ob „KI-Agent" auch wirklich „Dinge in den Apps steuern, die ich täglich nutze" bedeuten kann. Für diesen Nutzer ist v0.12.0 das Release, das endlich ja sagt.

Skills haben ihren eigenen Distributionsweg bekommen

ComfyUI v5 und TouchDesigner-MCP sind von „optional" zu standardmäßig gebundled aufgestiegen. Sieben neue Skills sind dazugekommen: Humanizer (entfernt KI-Ismen aus dem Output), claude-design, design-md, airtable, pretext, spike und sketch.

Die Änderung, die im Stillen eine viel größere Tür aufmacht, steht als eine Zeile in den Release Notes: Du kannst ein Skill jetzt direkt von einer HTTP(S)-URL installieren. Kein zentraler Registry erforderlich; wenn du ein Skill-Manifest hosten kannst, kannst du ein Skill ausliefern. Kombiniert mit „der Curator beschneidet deine Skill-Bibliothek wöchentlich", hast du das Knochengerüst eines echten Ökosystems — Leute teilen Skills, wie sie Gists teilen, und der Agent hält die lokale Bibliothek selbst gesund.

Ein Non-Interactive-Modus und der Rest der UX-Ausräumarbeiten

hermes -z <prompt> ist der neue non-interactive One-Shot-Modus — Prompt rein, Antwort raus, beenden. Die Release Notes sind hier ruhig, aber das ist die Änderung, die Hermes zum echten Kandidaten für Shell-Pipelines macht: echo "summarize this log" | hermes -z.

hermes update --check macht einen Preflight, bevor es zieht. /reload-skills lädt die Skill-Bibliothek mitten in der Session neu. /busy markiert den Agent als beschäftigt, mit angehängter Steering-Option. Der sichtbare TUI-Cold-Start ist dank Lazy-Initialisierung und Aufräumarbeit am Import-Graph um etwa 57% geschrumpft — klein genug, um es nicht ins Highlight-Reel zu schaffen, groß genug, um es beim ersten Start nach dem Upgrade zu spüren.

Breaking Changes

Zwei zur Kenntnis. Secret-Redaction ist jetzt standardmäßig aus (vorher an), um Payload-Korruption zu vermeiden — der alte Default hat hin und wieder gültige Tokens gefressen, die zum Redactor-Muster passten. v0.13.0 dreht den Schalter zurück, sobald der Redactor selbst überarbeitet wurde. Die Commands /provider und /plan sind gestrichen; ihre Funktion wird von /model bzw. /steer aufgesogen.

---

Ich komme immer wieder auf den Curator zurück. Der „self-improving"-Rahmen im README von Hermes ist seit Tag eins da, und in der Praxis meinte er meistens: der Agent wird besser im Schreiben von Skills. v0.12.0 hat die andere Hälfte des Self-Improvement hinzugefügt. Der Agent wird auch besser im Entfernen von Skills.

Technisch ist das kleiner, als es klingt; in der Form ist es größer, als es aussieht. Jedes andere Release in diesem Abschnitt hat den Agenten in die Lage versetzt, mehr zu tun. v0.12.0 hat den Agenten in die Lage versetzt, weniger zu tun, aus eigener Initiative. Releases der ersten Sorte vergrößern die Oberfläche, die du verwalten musst. Releases der zweiten Sorte verkleinern sie. Das Aufeinanderfolgen dieser beiden Sorten ist, vermute ich, der eigentliche Grund, warum dieses Projekt nicht unter seinem eigenen Gewicht zusammenbricht.