Release Recap For Power Users

Hermes Agent v0.14.0 — 22 rzeczy, których nie chcesz przegapić

Hermes Agent

Hermes Agent

@hermesagents

May 16, 2026

11 min czytania

Hermes Agent v0.14.0 spadł 16 maja 2026 — dziewięć dni po v0.13.0. To największe wydanie w historii projektu: 633 zmergowane PR-y, 1 393 zmienione pliki, 165 061 wstawionych linii w 808 commitach, 545 zamkniętych issue, 215 kontrybutorów w oknie wydania. Tag upstreamowy: v2026.5.16.

Same release notes idą na tysiące słów. Poniżej 22 rzeczy, które naprawdę chcesz znać, pogrupowane według pytania, na które odpowiadają. Każdy punkt ma przypiętą referencję do PR-a z upstreamu — chcesz to sprawdzić, klikasz.

---

Instalacja i dystrybucja

1. pip install hermes-agent działa z PyPI

Po czternastu miesiącach „curl tego skryptu" Hermes jest prawdziwym pakietem na PyPI. Wheel niesie ze sobą bundla Ink TUI i shell-launcher, więc pełne doświadczenie wypada z pudełka. pipx install hermes-agent też przechodzi. Stara curl-jednolinijka, Docker i git-clone wciąż są wspierane — to po prostu otwiera drzwi pythonowej publice. (#26593, uratowanie #26350)

2. Fala odchudzania — lżejsze instalacje

Ciężkie backendy (adaptery Slack / Matrix / Feishu / DingTalk, klient hindsight, codex app-server, SDK Pixverse / Camofox / image-gen, providery voice/TTS) instalują się teraz lazy przy pierwszym użyciu. Extra [all] wyrzuca wszystko, co jest pokryte przez lazy-deps, instalator opada przez kolejne piętra, kiedy wheel nie pasuje do twojej platformy, a supply-chain advisory checker skanuje każdą instalację pod kątem niebezpiecznych wersji. Mniejszy ślad, szybsza instalacja, mniej tranzytywnych podatności. (#24220, #24515, #25014, #25038, #25766, #21818)

3. Natywny Windows w early becie

Pierwszej klasy ścieżka natywnego Windowsa ląduje w CLI, gateway-u, TUI i toolsach. PowerShell-owy instalator z automatycznie wykrytym/zainstalowanym MinGitem (~45 MB, bez admina), wykrywanie pythonowego stuba ze Microsoft Store, zachowanie Ctrl+C na foregroundzie. Około 40 follow-upowych fiksów Windows-only już zmergowanych. WSL2 zostaje najlepiej obstrzelaną ścieżką produkcyjną — etykieta „early beta" tu naprawdę pracuje. (#21561)

---

Modele i providery

4. xAI Grok przez SuperGrok OAuth — a grok-4.3 skacze na kontekst 1M tokenów

Jeśli płacisz za SuperGrok, możesz teraz używać Groka wewnątrz Hermesa, logując się przez konto xAI — bez klucza API, bez osobnego billingu. Ta sama integracja podbija grok-4.3 do kontekstu 1M tokenów, więc możesz wrzucić całe codebase'y albo korpusy badań do jednego promptu. Dorzucono porządną obsługę błędów entitlement i stronę dokumentacji „SSH-do-tunelu" na wypadek, kiedy siedzisz po SSH na zdalnej maszynie i musisz domknąć OAuth-owy flow. (#26534, #26664, #26644, #26592)

5. hermes proxy — twoje subskrypcje OAuth, twój localhost

Odpalasz hermes proxy i dostajesz lokalny endpoint http://localhost:port, który gada w API OpenAI, podpięty pod jakikolwiek provider OAuth, do którego jesteś zalogowany — Claude Pro, ChatGPT Pro, SuperGrok. Codex CLI, Aider, Cline, Continue — wszystko, co spodziewa się endpointu OpenAI-compatible — po prostu działa z twoją obecną subskrypcją, klucz API niepotrzebny. Jedna subskrypcja, wszystkie narzędzia. (#25969)

6. NovitaAI dołącza do stajni providerów

Chmura AI-native z Agent Sandboxem w stałej cenie, otwartoźródłowymi modelami (Llama, Qwen, DeepSeek). Uratowanie #7219. (@kshitijk4poor) (#25507)

7. OpenRouter Pareto Code router z min_coding_score

Pareto router OpenRoutera dobiera automatycznie najtańszy model, który łapie poprzeczkę jakości. Nowa gałka min_coding_score ustawia tę poprzeczkę konkretnie dla zadań kodowych — Hermes routuje do najtańszego modelu, który jest przynajmniej tak dobry w kodzie. Przestań płacić za top-tierowe modele, kiedy mid-tier wystarczy. (#22838)

8. Runtime Codex app-server dla modeli OpenAI / Codex

Opcjonalny runtime, który pod maską odpala OpenAI-ową Codex CLI, kiedy lecisz ścieżkami OpenAI albo Codex. Reuse sesji, automatyczne emerytowanie zaklinowanych sesji, poprawna klasyfikacja OAuth-refresh — hydraulika, która sprawia, że długie agentic-runy nie wywracają się. (#24182, #25769)

9. Alibaba Cloud przemianowana na Qwen Cloud

Picker i config używają teraz brandu, którego używa reszta świata. Istniejące klucze konfiguracji wciąż działają — żadnych breaking changes — tylko UI dopasowane do realnego brandu. (#24835)

---

Platformy komunikacyjne — 22 łącznie

10. Microsoft Teams — od końca do końca

Teams wystartowały w v0.12.0 (marzec 2026) jako pierwsza platforma dostarczona przez plugin. v0.14.0 doprowadza cały stack Microsoft Graph od końca do końca: auth + fundament klienta (#21922), webhook listener przyjmujący eventy Teams (#21969), runtime pluginu pipeline (#22007), outbound delivery przez istniejący adapter (#22024). Podłączasz bota raz, czatujesz z dowolnego kanału Teams, DM-a albo grupy. (Uratowania #21408–#21411.)

11. LINE — first-class przez oficjalne LINE Messaging API

LINE dominuje w Japonii, Korei i na Tajwanie. Hermes jest tam teraz natywnie. (#23197)

12. SimpleX Chat — zdecentralizowany, bez user-ID

Komunikator skupiony na prywatności bez stałych identyfikatorów. Hermes na nim chodzi bez wystawiania żadnych identyfikatorów. (#26232 — ratuje #2558)

13. Discord backfill historii kanału (domyślnie włączony)

Kiedy Hermes pierwszy raz wchodzi do kanału albo wątku, czyta świeżą historię wiadomości, zanim odpowie. Koniec z „o czym my w ogóle teraz rozmawiamy?" — agent ma ten sam kontekst, który już mają wszyscy na ekranie. (#25984)

14. Natywny UI guzików dla clarify na Telegramie i Discordzie

Prompt-y wielokrotnego wyboru pokazują się teraz jako prawdziwe natywne guziki platformy. Klikasz, żeby odpowiedzieć — szczególnie miłe na mobilce. (#24199, #25485)

---

Pętla agenta i sesje

15. /handoff naprawdę przenosi sesję na żywo

W środku rozmowy oddajesz sesję innemu modelowi, osobowości albo profilowi — każda wiadomość, każdy tool call, każdy kawałek kontekstu jadą z tobą. Przełącz się z szybkiego modelu na deep-reasoningowego w środku debugowania albo przekazuj sesję między profilami pod różne części zadania. (#23395)

16. /subgoal — dopisać kryteria do aktywnego /goal

Ralph-loopowy /goal trzyma agenta w biegu, dopóki sędzia nie zaakceptuje kryteriów sukcesu. /subgoal <text> nakłada dodatkowe kryteria w środku biegu, bez restartu pętli. (#25449)

17. Footer weryfikacji mutacji plików na każdą turę

Po każdej turze, w której agent pisał albo edytował pliki, dostaje krótki footer podsumowujący dokładnie to, co zmieniło się na dysku — ścieżki, liczby linii, prawdziwa delta. Łapie własne pomyłki, kiedy zapis nie wylądował albo został cicho nadpisany, zamiast pewnie informować, że funkcja została dodana. (#24498)

18. Diagnostyka semantyczna LSP na każdym zapisie

write_file i patch odpalają teraz prawdziwy language server na edytowanym pliku i wystawiają agentowi nowe błędy przed kolejną turą. Błędy typów, niezdefiniowane symbole, brakujące importy — łapane natychmiast. Idzie znacznie dalej niż bazowe lintowanie Python/JSON/YAML/TOML z v0.13.0, bo to rzeczywista analiza semantyczna. (#24168, #25978)

---

Wydajność

19. ~19 sekund mniej cold startu hermes

Cache skilli + lazy adapter Feishu + deferred-imports po całym grafie importów + cache-first lookup w models.dev + równoległe checki doctora + skip welcome-bannera w chat -q. Ekran All-Platforms w hermes tools zleciał z 14 sekund na poniżej 1,5. (#22138, #22120, #22681, #22790, #22808, #22831, #22859, #22904, #22766, #25341)

20. browser_console szybsze 180×

Routujesz przez stale otwarty WebSocket Chrome DevTools Protocol u supervisora zamiast otwierać nową sesję na każdy call. Wcześniej browser-tool-calls były najwolniejszą pojedynczą operacją agenta. Teraz nie są. Realne interakcje na stronie czuje się jako natychmiastowe. (#23226)

21. Cross-sesyjny godzinny cache promptu Claude

Kiedy gadasz z Claudem przez Anthropic, OpenRouter albo Nous Portal, prefix promptu (system prompt, skills, memory) cache'uje się na godzinę między sesjami. Odpalasz /new i pierwsza odpowiedź wraca szybciej i taniej, bo cache jest jeszcze ciepły z poprzedniej sesji. Backgroundowy memory review też bije w ten cache. (#23828, #25434, #24778)

---

Multimodalność

22. vision_analyze oddaje piksele modelom z wizją

Jeśli aktywny model naprawdę widzi (GPT-5, Claude, Gemini, Grok-vision), vision_analyze szle teraz surowe piksele wprost do modelu, zamiast najpierw konwertować je na opis tekstowy. Dostajesz rzeczywiste wizualne reasoning modelu, a nie zdegradowaną tekstową okrężną drogę. (#22955)

---

Bonusowe highlighty

22 powyżej to strukturalne uderzenia. Dwanaście kolejnych wartych wzmianki:

  • x_search — first-classowy tool do szukania na X (Twitterze), OAuth albo klucz API. (#26763)
  • Backend cua-driver dla computer_use — modele vision nie-Anthropicowe potrafią teraz prowadzić twój desktop, focus-safe operacje, odświeżane na hermes update. (#21967, #24063)
  • Zunifikowane video_generate z podłączalnymi backendami providerów — nowe modele wideo wskakują jako jednoplikowe pluginy. (#25126)
  • Klikalne URL-e w dowolnym terminalu — prawdziwe hiperlinki OSC8 z podświetleniem na hoverze. (@OutThisLife, #25071, #24013)
  • Zed ACP Registry — instalka jednym kliknięciem przez uvx, bez npm. (#26079, #26120, #26234)
  • Brave Search + DDGS jako darmowe providery web-searcha obok Tavily / SearXNG / Exa. (#21337)
  • 9 nowych opcjonalnych skilli — Hyperliquid, Yahoo Finance, api-testing (REST + GraphQL), zunifikowany EVM multi-chain, darwinian-evolver, osint-investigation, pinggy-tunnel, watchers (polling RSS / HTTP JSON / GitHub) i pełna przeróbka Notion pod Developer Platform z maja 2026. (#23582, #23583, #23590, #25299, #26760, #26729, #26765, #21881, #26612)
  • huggingface/skills jako zaufany tap domyślny — skille społeczności publikowane tam instalują się bez dodatkowej konfiguracji. (#26219, zamyka #2549)
  • Block brute-force'u na sudo + zamknięcie trzech bypassów dangerous-command + sanitacja błędów toolów (żadnej już prompt injection przez stringi błędów). (#23736, #26829, #26823)
  • /sessions — slash-komenda do przeglądania i wznawiania wcześniejszych sesji. (@austinpickett, #20805)
  • ctx.llm w pluginie + flaga tool_override — pluginy dostają first-classowy dostęp do LLM-a i mogą czysto zastąpić wbudowane toole. (#23194, #26759)
  • API-serwer wystawia eventy approval-a dla runów — długie runy nie wiszą już po cichu na komendach wymagających zatwierdzenia. (#21899)

---

Cyfry z okna wydania

MetrykaLiczba
Zmergowane PR-y633
Commity808
Zmienione pliki1 393
Wstawione linie165 061
Zamknięte issue545 (12 P0, 50 P1)
Kontrybutorzy215
Tagv2026.5.16
Dni od v0.13.09

Top kontrybutorzy społeczności (okno wydania)

  • @kshitijk4poor — 38 PR-ów (kadencja/streaming Telegramu, security-hardening, higiena codex-runtime, provider NovitaAI)
  • @alt-glitch — 13 PR-ów (TUI z tabelami Markdowna, HERMES_SESSION_ID, hindsight-client jako opcjonalna zależność)
  • @OutThisLife — 12 PR-ów (segmentacja tur w TUI, tytuły linków markdownowych, hiperlinki OSC8)
  • @austinpickett — 8 PR-ów (/sessions, przełączanie osobowości, modale crona)
  • @helix4u — 5 PR-ów (setup Google Chat, Windows Ctrl+C)
  • @rob-maron — 4 PR-y (Nous Portal jako autorytet od metadanych modeli)

---

Dalsza lektura

Subskrybuj aktualizacje

Aktualności społeczności o wydaniach Hermes Agent, nowych umiejętnościach i integracjach. Bez spamu, wypisz się kiedy chcesz.