Release Recap For Power Users

Hermes Agent v0.14.0 — 22 Dinge, die du nicht verpassen willst

Hermes Agent

Hermes Agent

@hermesagents

May 16, 2026

11 Min. Lesezeit

Hermes Agent v0.14.0 landete am 16. Mai 2026 — genau neun Tage nach v0.13.0. Es ist das größte Release in der Projektgeschichte: 633 gemergte PRs, 1.393 geänderte Dateien, 165.061 eingefügte Zeilen über 808 Commits, 545 geschlossene Issues, 215 Mitwirkende im Release-Fenster. Upstream-Tag: v2026.5.16.

Die Release Notes selbst sind tausende Wörter lang. Unten sind die 22 Dinge, die du wirklich wissen willst, gruppiert nach der Frage, die sie beantworten. Jeder Eintrag verweist auf den Ursprungs-PR — wenn du nachsehen willst, gehst du rein.

---

Installation und Verteilung

1. pip install hermes-agent läuft auf PyPI

Nach vierzehn Monaten „curl dieses Skript" ist Hermes jetzt ein echtes PyPI-Paket. Das Wheel bringt das Ink-TUI-Bundle und den Shell-Launcher mit, also kommt das volle Erlebnis frisch aus der Box. pipx install hermes-agent funktioniert auch. Die alten Wege über das curl-Einzeiler, Docker und git-clone bleiben — das Update öffnet schlicht die Tür für die Python-Crowd. (#26593, Bergung von #26350)

2. Die Abspeck-Welle — leichtere Installs

Schwergewichtige Backends (Adapter für Slack / Matrix / Feishu / DingTalk, hindsight-Client, codex app-server, SDKs für Pixverse / Camofox / Bildgenerierung, Voice-/TTS-Provider) installieren sich jetzt lazy beim ersten Aufruf. Die [all]-Extras lassen alles fallen, was lazy-deps abdecken; der Installer fällt stufenweise zurück, wenn ein Wheel nicht zu deiner Plattform passt; und vor jeder Installation scannt ein Supply-Chain-Advisory-Checker gegen unsichere Versionen. Kleinerer Footprint, schnellere Installation, weniger transitive Verwundbarkeiten. (#24220, #24515, #25014, #25038, #25766, #21818)

3. Natives Windows in Early Beta

Ein erstklassiger nativer Windows-Pfad landet über CLI, Gateway, TUI und Tools. PowerShell-Installer mit automatisch erkanntem/installiertem MinGit (~45 MB, kein Admin nötig), Erkennung des python-Stubs aus dem Microsoft Store, Erhalt von Ctrl+C im Vordergrund. Rund 40 Windows-spezifische Folgefixes sind schon gemergt. WSL2 bleibt der am besten erprobte Produktionspfad — das „Early Beta"-Label steht da nicht aus Spaß. (#21561)

---

Modelle und Provider

4. xAI Grok via SuperGrok-OAuth — und grok-4.3 springt auf 1M Context

Wenn du SuperGrok bezahlst, kannst du jetzt Grok in Hermes nutzen, indem du dich mit deinem xAI-Konto einloggst — ohne API Key, ohne separates Billing. Die Anbindung schiebt nebenbei grok-4.3 auf ein 1M-Token-Context-Fenster — du kannst ganze Codebases oder einen Stapel Recherche in ein einzelnes Prompt werfen. Inklusive sauberer Behandlung von Entitlement-Fehlern und einer Doku-Seite dazu, wie du den OAuth-Flow abschließt, wenn du via SSH auf einer Remote-Box sitzt. (#26534, #26664, #26644, #26592)

5. hermes proxy — deine OAuth-Subscriptions, deine Localhost

Du startest hermes proxy und bekommst einen lokalen http://localhost:port-Endpoint, der die OpenAI-API spricht, gestützt auf den OAuth-Provider, in den du eingeloggt bist — Claude Pro, ChatGPT Pro, SuperGrok. Codex CLI, Aider, Cline, Continue — alles, was einen OpenAI-kompatiblen Endpoint erwartet — läuft ohne API Key mit deiner bestehenden Subscription. Eine Subscription, alle Tools. (#25969)

6. NovitaAI tritt der Provider-Riege bei

KI-native Cloud mit pauschalpreisiger Agent Sandbox und Open-Source-Modellen (Llama, Qwen, DeepSeek). Bergung von #7219. (@kshitijk4poor) (#25507)

7. OpenRouter Pareto Code Router mit min_coding_score

Der Pareto-Router von OpenRouter wählt automatisch das günstigste Modell, das eine Qualitätsschwelle erfüllt. Der neue min_coding_score setzt diese Schwelle speziell für Coding-Aufgaben — Hermes routet aufs günstigste Modell, das beim Programmieren mindestens so gut ist. Hör auf, Top-Modelle zu bezahlen, wenn ein Mittelfeld-Modell reicht. (#22838)

8. Codex-app-server-Runtime für OpenAI-/Codex-Modelle

Optionale Runtime, die im Hintergrund OpenAIs Codex CLI fährt, wenn du auf OpenAI- oder Codex-Pfaden bist. Session-Reuse, automatischer Ruhestand für festgefahrene Sessions, korrekte Klassifizierung des OAuth-Refresh — die Klempnerei, die lange Agent-Läufe nicht umkippen lässt. (#24182, #25769)

9. Alibaba Cloud heißt jetzt Qwen Cloud

Picker und Config nutzen jetzt die Marke, die der Rest der Welt verwendet. Bestehende Config-Keys funktionieren weiter — keine brechenden Änderungen — die UI ist nur auf die echte Marke geeicht. (#24835)

---

Messaging-Plattformen — 22 insgesamt

10. Microsoft Teams — Ende-zu-Ende

Teams landete in v0.12.0 (März 2026) als erste plugin-ausgelieferte Plattform. v0.14.0 zieht den vollen Microsoft-Graph-Stack durch: Auth + Client-Fundament (#21922), ein Webhook-Listener, der Teams-Events entgegennimmt (#21969), ein Pipeline-Plugin-Runtime (#22007) und ausgehende Zustellung über den bestehenden Adapter (#22024). Du verdrahtest den Bot einmal und sprichst dann aus jedem Teams-Channel, DM oder Gruppe mit ihm. (Bergungen von #21408–#21411.)

11. LINE — erstklassig via die LINE Messaging API

LINE dominiert in Japan, Korea und Taiwan. Hermes ist jetzt nativ dort drin. (#23197)

12. SimpleX Chat — dezentral, ohne User-IDs

Privacy-fokussierter Messenger ohne dauerhafte Identifier. Hermes läuft drauf, ohne irgendeinen Identifier preiszugeben. (#26232 — Bergung von #2558)

13. Discord-Channel-History-Backfill (standardmäßig an)

Wenn Hermes zum ersten Mal in einen Channel oder Thread kommt, liest er die letzten Nachrichten, bevor er antwortet. Schluss mit „Worüber reden wir gerade?" — der Agent hat denselben Kontext wie alle anderen auf dem Bildschirm. (#25984)

14. Native-Button-UI für clarify auf Telegram und Discord

Multiple-Choice-Prompts erscheinen jetzt als echte plattformnative Buttons. Du tippst zum Antworten — besonders angenehm am Handy. (#24199, #25485)

---

Agent-Loop und Sessions

15. /handoff übergibt die Session jetzt wirklich live

Mitten in der Unterhaltung übergibst du an ein anderes Modell, eine andere Persönlichkeit oder ein anderes Profile — jede Nachricht, jeder Tool-Call, jedes Stück Kontext zieht mit. Du wechselst beim Debuggen von einem schnellen Modell auf eines mit tiefer Reasoning-Kraft, oder reichst eine Session zwischen Profiles für unterschiedliche Teile einer Aufgabe weiter. (#23395)

16. /subgoal — Kriterien an ein aktives /goal anhängen

Der Ralph-Loop-/goal lässt den Agenten laufen, bis ein Judge die Erfolgskriterien akzeptiert. /subgoal <text> schichtet weitere Kriterien drauf, ohne den Loop neu zu starten. (#25449)

17. Pro-Turn-Footer als Datei-Mutations-Verifier

Nach jedem Turn, in dem geschrieben oder editiert wurde, bekommt der Agent einen kurzen Footer mit, der zusammenfasst, was tatsächlich auf der Platte geändert wurde — Pfade, Zeilenzahlen, das echte Delta. So fängt er seine eigenen Fehler ab, wenn ein Write nicht durchging oder still überschrieben wurde, statt selbstbewusst zu behaupten, die Funktion sei jetzt drin. (#24498)

18. LSP-Semantische-Diagnose bei jedem Write

write_file und patch lassen jetzt einen echten Language Server gegen die geänderte Datei laufen und reichen neue Fehler vor dem nächsten Turn an den Agenten zurück. Typfehler, undefinierte Symbole, fehlende Imports — sofort gefangen. Geht weit über das grundlegende Python/JSON/YAML/TOML-Linting aus v0.13.0 hinaus, weil das hier echte semantische Analyse ist. (#24168, #25978)

---

Performance

19. ~19 Sekunden weniger Kaltstart bei hermes

Skills-Cache + Lazy-Feishu-Adapter + verzögerte Imports quer durch den Import-Graph + Cache-first-Lookup auf models.dev + parallelisierte Doctor-Checks + Skip des Welcome-Banners bei chat -q. Der All-Platforms-Bildschirm von hermes tools fiel von 14 Sekunden auf unter 1,5. (#22138, #22120, #22681, #22790, #22808, #22831, #22859, #22904, #22766, #25341)

20. 180-mal schnellere browser_console-Auswertungen

Routing über das persistente Chrome-DevTools-Protocol-WebSocket des Supervisors, statt für jeden Aufruf eine neue Session aufzumachen. Vorher waren Browser-Tool-Aufrufe die mit Abstand langsamste Operation des Agents. Danach nicht mehr. Echte Seiten-Interaktionen fühlen sich sofort an. (#23226)

21. Sessionsübergreifender 1-Stunden-Claude-Prompt-Cache

Wenn du Claude über Anthropic, OpenRouter oder Nous Portal nutzt, wird das Prompt-Präfix (System Prompt, Skills, Memory) eine Stunde lang sessionsübergreifend gecacht. Du startest eine Session mit /new, und die erste Antwort kommt schneller und billiger zurück, weil der Cache aus der vorigen Session noch warm ist. Das Background-Memory-Review zieht auch über diesen Cache. (#23828, #25434, #24778)

---

Multimodal

22. vision_analyze schickt Pixel direkt an sehfähige Modelle

Wenn das aktive Modell wirklich sehen kann (GPT-5, Claude, Gemini, Grok-vision), gibt vision_analyze die Rohpixel jetzt direkt an das Modell weiter, statt sie vorher in eine Textbeschreibung umzuwandeln. Du bekommst das echte visuelle Reasoning des Modells statt einen degradierten Text-Summary-Roundtrip. (#22955)

---

Bonus-Highlights

Die 22 oben sind die strukturellen Schläge. Zwölf weitere sind eine Erwähnung wert:

  • x_search — Erstklasse-X-(Twitter-)Suchtool, OAuth oder API Key. (#26763)
  • computer_use cua-driver-Backend — Vision-Modelle außerhalb von Anthropic können jetzt deinen Desktop steuern, mit Focus-safe-Operationen, aufgefrischt bei hermes update. (#21967, #24063)
  • Einheitliches video_generate mit steckbaren Provider-Backends — neue Video-Modelle landen als Ein-Datei-Plugin. (#25126)
  • Anklickbare URLs in jedem Terminal — echte OSC8-Hyperlinks mit Hover-Highlight. (@OutThisLife, #25071, #24013)
  • Zed-ACP-Registry: Ein-Klick-Install via uvx, ohne npm. (#26079, #26120, #26234)
  • Brave Search + DDGS als kostenlose Web-Such-Provider neben Tavily / SearXNG / Exa. (#21337)
  • 9 neue optionale Skills — Hyperliquid, Yahoo Finance, api-testing (REST + GraphQL), Unified-EVM-Multichain, darwinian-evolver, osint-investigation, pinggy-tunnel, watchers (RSS / HTTP JSON / GitHub-Polling) und eine volle Notion-Überarbeitung für die Developer Platform vom Mai 2026. (#23582, #23583, #23590, #25299, #26760, #26729, #26765, #21881, #26612)
  • huggingface/skills als vertrauenswürdiger Default-Tap — dort veröffentlichte Community-Skills installieren sich ohne Extra-Config. (#26219, schließt #2549)
  • Sudo-Bruteforce-Blockade + drei geschlossene Bypass-Routen bei gefährlichen Kommandos + Sanitierung von Tool-Fehlerstrings (keine Prompt Injection mehr über Fehlertexte). (#23736, #26829, #26823)
  • /sessions — Slash-Command zum Durchstöbern und Wiederaufnehmen alter Sessions. (@austinpickett, #20805)
  • Plugin-ctx.llm + tool_override-Flag — Plugins bekommen erstklassigen LLM-Zugriff und können eingebaute Tools sauber ersetzen. (#23194, #26759)
  • API-Server gibt Run-Approval-Events nach außen — lange Läufe hängen nicht mehr stumm an genehmigungspflichtigen Befehlen. (#21899)

---

Die Zahlen aus dem Release-Fenster

MetrikWert
Gemergte PRs633
Commits808
Geänderte Dateien1.393
Eingefügte Zeilen165.061
Geschlossene Issues545 (12 P0, 50 P1)
Mitwirkende215
Tagv2026.5.16
Tage seit v0.13.09

Top-Community-Mitwirkende (Release-Fenster)

  • @kshitijk4poor — 38 PRs (Telegram-Kadenz/-Streaming, Sicherheits-Härtung, codex-runtime-Hygiene, NovitaAI-Provider)
  • @alt-glitch — 13 PRs (Markdown-Tabellen-TUI, HERMES_SESSION_ID, hindsight-client als optionale Abhängigkeit)
  • @OutThisLife — 12 PRs (TUI-Turn-Segmentierung, Markdown-Link-Titel, OSC8-Hyperlinks)
  • @austinpickett — 8 PRs (/sessions, Persönlichkeits-Switch, cron-Modals)
  • @helix4u — 5 PRs (Google-Chat-Setup, Windows Ctrl+C)
  • @rob-maron — 4 PRs (Nous Portal als Autorität für Modell-Metadaten)

---

Weiterlesen

Updates abonnieren

Community-Updates zu Hermes-Agent-Releases, neuen Skills und Integrationen. Kein Spam, jederzeit abbestellbar.