Release Recap

Hermes Agent v0.13.0 — wydanie, w którym agent zrobił się uparty

Hermes Agent

@hermesagents

May 7, 2026

8 min czytania

Pierwszy raz, kiedy migotnięcie sieci kosztowało mnie sesję Hermesa, byłem w dwudziestej minucie refaktoru, a agent miał w głowie mapę repozytorium, której ja sam nie miałem. Gateway stracił połączenie. Sesja się skończyła. Mapa poszła z nią.

Nie zamierzam twierdzić, że właśnie to doświadczenie jest powodem, dla którego powstało v0.13.0. Release notes nazywają je „the tenacity release" — to taka nazwa, która wygląda na wyjętą ze słownika synonimów, dopóki nie zauważysz, że trzy główne ficze v0.13.0 to w istocie trzy różne odpowiedzi na to samo pytanie: jak agent kończy to, co zaczął?

7 maja 2026, dokładnie tydzień po v0.12.0. Wydanie spadło w środę. Pod koniec tej środy agent na moim serwerze miał trzy nowe sposoby, żeby być upartym.

Tablica Kanban, tylko dla AI-workerów

Główną fichą jest Multi-Agent Kanban — trwała tablica zadań, na której kilku Hermes-workerów wspólnie przejmuje, przekazuje i kończy zadania. Hydraulika pod spodem nie jest piękna, ale to właśnie ona ma znaczenie: monitorowanie heartbeatów, wykrywanie zombie, budżety retry na zadanie, atomowe zapisy stanu.

Po ludzku: worker padł w środku zadania — inny worker je przejmuje. Gateway się zrestartował — tablica wraca tam, gdzie była. Zadanie spadło trzy razy z rzędu — budżet retry mówi „wystarczy" i wrzuca je na półkę dla człowieka. Cała ta hydraulika istnieje po to, żeby można było nakierować pięć kopii Hermesa na backlog i odejść.

Druga połowa ficzy, mniej efektowna, ale w deploymencie jedno-instancyjnym pewnie przydatniejsza: jedna instancja Hermesa może sama zachowywać się jak „kanban worker" w wieloprocesowym planie i brać zadania po jednym. Agent w pewnym sensie nauczył się być konsumentem kolejki. To zmienia profil prac, jakie sensownie można mu oddać.

/goal i pętla Ralpha

Slash-komenda /goal to implementacja tego, co społeczność agent-designu nazywa Ralph loop — wieloletni wzorzec mówiący agentowi, żeby zaciął się w celu i nie odpuścił go przez wiele tur rozmowy, niezależnie od tego, w którą stronę użytkownik szarpie go w pojedynczej turze.

Jeśli kiedykolwiek złapałeś Hermesa na tym, że odpłynął od oryginalnego zadania, bo ostatni komunikat użytkownika pociągnął go w bok — „zaraz, co my właściwie robiliśmy?" — /goal jest na to lekarstwem. Cel ustawiasz raz, na początku sesji, a każda kolejna tura jest ważona względem niego. Agentowi wolno robić objazdy; nie wolno mu zapomnieć celu podróży.

/subgoal, który ląduje tydzień później w v0.14.0, pozwala dorzucić kryteria sukcesu w trakcie biegu. Razem te dwie komendy są najbliżej tego, co tradycyjny plan projektu — cel, plus stopniowe uściślanie — jakie kiedykolwiek osiągnął agent w formie czatu.

Session durability — restart gateway-a to już nie reset

Trzecią fichą z serii „kończy to, co zaczął" jest session durability. Rozmowy wznawiają się automatycznie po restarcie gateway-a, z zachowanym kontekstem i routingiem wątków. Pod maską siedzi checkpoints v2 plus atomowa persystencja sesji — dokładnie ten sam kształt pracy, co warstwa heartbeatów w Kanbanie.

Widoczne zachowanie to ten bullet, za który kilka miesięcy temu oddałbym dużo: restart gateway-a to nie jest już reset rozmowy. Wciągasz nową wersję, restartujesz proces, rozmowa wraca tam, gdzie się skończyła. Day-2 dla self-hostowanego Hermesa zrobił się od razu znacznie prostszy — a dla każdego, kto gania go na VPS-ie, który co jakiś czas sam się restartuje pod aktualizacje kernela, v0.13.0 to wydanie, w którym agent przestaje to brać do siebie.

Google Chat, DeepSeek v4 Pro i fala modeli

Google Chat wjeżdża jako 20. platforma komunikacyjna. Wydanie wprowadza też podłączalny system providerów, żeby adaptery z zewnątrz mogły być publikowane poza core-repem — ten sam kształt pracy, co architektura transportu z v0.11.0, tylko teraz rozszerzony na adaptery gateway-a. Następny klon iMessage, następne regionalne API mesengera, następny szyfrowany komunikator — żaden z nich nie musi już czekać na merge do core'a.

Po stronie modeli: DeepSeek v4 Pro, xAI Grok 4.3, OpenRouter Owl-Alpha (free tier) i Tencent Hy3 Preview są nowymi pozycjami. xAI Custom Voices wchodzi z obsługą voice-cloningu dla TTS. A tool do analizy wideo siedzi na Gemini i innych multimodalnych modelach, dając Hermesowi w końcu możliwość obejrzenia trzydziestosekundowego klipu zamiast stosu klatek.

Jeśli twój benchmark na „czy ten projekt nadąża za frontem modeli" brzmi „czy obsługują ten model, którego próbowałem w tym tygodniu", v0.13.0 prawie na pewno go zdaje.

Internacjonalizacja wchodzi

CLI i dokumentacja zostały przetłumaczone na siedem locale-ów — chiński, japoński, niemiecki, hiszpański, francuski, ukraiński, turecki. To jedna linijka bulletu, pod którą siedzi sporo pracy. Jeśli przez ostatnie trzy miesiące czytałeś output CLI Hermesa po angielsku, a twój mózg, gdy jesteś zmęczony, traktuje angielski jak drugi język, to v0.13.0 jest wydaniem, w którym w końcu możesz się przełączyć.

Efekt uboczny wart wskazania: kiedy output CLI jest zlokalizowany, lokalizują się też komunikaty błędów. To znaczy, że nieanglojęzyczny użytkownik może wkleić błąd na forum, a odpowiadający widzą te same słowa. Tłumaczenie zaskakująco często okazuje się też historią o debuggability.

Bezpieczeństwo, ACP i podkomendy archive curatora

Zamknięto osiem podatności P0 — release notes nie wyliczają ich po CVE, ale wzorzec jest szeroki: redakcja sekretów znów domyślnie włączona (odkręcając flip z v0.12, teraz że sam redactor został przepisany), allowlisty roli w Discordzie ograniczone do guildu, WhatsApp domyślnie odbija nieznane kontakty, okna TOCTOU w systemach auth domknięte.

hermes curator archive, prune i list-archived formalizują curatora z v0.12 do porządnych podkomend. /steer i /queue pojawiają się w adapterach ACP (VS Code, Zed, JetBrains) — jeśli gonisz Hermesa z poziomu edytora, możesz pchnąć pracującego agenta z wnętrza edytora, a nie tylko z terminala.

Co właściwie daje ci „tenacity"

Każda z tych fich z osobna od jakiegoś czasu wisiała w trackerze. Razem dają to samo: Hermesa, który nie zapomina, co robił, kiedy sieć mrugnie, API modelu zacznie dławić, gateway się zrestartuje albo użytkownika coś rozproszy.

Agent zawsze był mądry. v0.13 zrobiło z niego upartego. To różne rzeczy. Mądry agent elegancko wraca po przerwaniu — zwykle zaczyna nowe zadanie bez pamięci o starym. Uparty agent kończy stare. Kanban, lock na cel, wznowienie sesji — wszystkie mają ten sam kształt: stan, który przeżywa rzeczy, które do tej pory go niszczyły.

---

Większość branży AI-agentów rywalizuje w tym kwartale na surowej zdolności — większe modele, dłuższe konteksty, więcej skilli. v0.13.0 rywalizuje na innej osi. Trudny problem dla self-hostowanych agentów w 2026 to nie „czy potrafi zrobić X". To „czy potrafi zrobić X przez trzydzieści minut z rzędu, mimo zdarzenia w sieci". Zaskakująco duża część agent-quality-of-life mieszka w odpowiedzi na to drugie pytanie.

To, że wydanie nazywa się „tenacity", a nie czymś ze słowem durability albo reliability w środku, samo w sobie jest znamienne. Tenacity to słowo, którego używa się o innych ludziach. Pod spodem siedzi sugestia, że zespół tak myśli o agencie.

Dalsza lektura

Udostępnij na:

star Star on GitHub

arrow_back

Poprzedni

Hermes Agent v0.14.0 — 22 rzeczy, których nie chcesz przegapić

Następny

Hermes Agent v0.12.0 — wydanie, w którym agent nauczył się wyrzucać rzeczy

arrow_forward

auto_stories Powiązane artykuły

May 16, 2026 · 11 min czytania