Mam folder pełen niedokończonych prywatnych skryptów. Kawałki, które zacząłem do jakiegoś projektu, których nigdy porządnie nie uogólniłem i nigdy porządnie nie skasowałem. Za każdym razem, gdy go otwieram, myślę, że powinienem to uporządkować. I tego nie robię.
To, co tę pętlę kilka lat temu w końcu przerwało, to zwykłe narzędzie do backupu, które zaczęło mi pokazywać pliki nieotwierane od roku. Nie kasowało — po prostu kładło je przede mną, z datą obok. To wystarczyło. Większość poszła w kosz, kilka zostało. Folder się skurczył.
Wracam do tego narzędzia, kiedy czytam release notes v0.12.0. 30 kwietnia 2026 — siedem dni po tym, jak v0.11.0 przebudowało interfejs — v0.12.0 wypuściło coś, czego, o ile mi wiadomo, w self-hostowanym agencie AI wcześniej nie było: tła curatora, który, gdy ty śpisz, ocenia i przycina twoją własną bibliotekę skilli.
Release notes nazywają to Autonomous Curator. Prawie wszystko inne w v0.12.0 — Microsoft Teams, Tencent Yuanbao, Spotify, Google Meet, LM Studio first-class, ComfyUI v5 w bundle'u — w normalnym wydaniu byłoby nagłówkiem. W tym dzielą scenę z agentem, który raz w tygodniu siada i sprząta po sobie.
Autonomous Curator
Autonomous Curator to agent działający w tle, posadzony na cron-tickerze gateway-a, z domyślnym cyklem siedmiu dni. Przechodzi twoją bibliotekę skilli, każdemu skillowi wystawia ocenę względem rubryki, scala bliskie duplikaty, przycina martwe drewno, a na koniec pisze do znanej ścieżki raport markdown z dołączonym tokiem rozumowania.
Dwa techniczne szczegóły z release notes warte wyciągnięcia. Pierwsza: pętla self-improvementu w v0.12.0 prawidłowo dziedziczy konfigurację runtime'u od rodzica — czyli curator pracuje na tym samym modelu, tej samej sandboxie i tych samych credentialach, co agent, który go odpalił. Żadnego niespodziewanego dryfu, żadnej osobnej linii billingowej. Druga: ocena jest oparta na rubryce, nie na wyczuciu — curator ocenia skille po jawnym zestawie kryteriów, który możesz przeczytać i, jeśli się nie zgadzasz, zmienić.
Nie zrobiłeś opt-inu do curatora. On już działa. W przyszłą niedzielę twoja biblioteka skilli będzie trochę mniejsza i trochę ostrzejsza. Dostaniesz raport mówiący, co wyrzucił i dlaczego. Jeśli wyrzucił coś, co chciałeś zachować, możesz to ściągnąć z powrotem; hermes curator status sortuje skille po częstości użycia, żebyś mógł porównać werdykt curatora ze swoim.
Powód, dla którego warto oznaczyć to jako zmianę kategorii, a nie zwykłą funkcję, jest taki, że każde narzędzie AI, które prowadziłem, miało ten sam problem ze skillami. Instalujesz skill, żeby spróbować. Zapominasz, że go zainstalowałeś. Pół roku później twój katalog skills/ ma dwieście wpisów, z których połowa aktywnie sobie przeczy, a wszystkie razem dorzucają tokeny do prompta. Sam agent nigdy nie mówi „powinieneś to uporządkować". Do v0.12.
Fala platform, którą curator prawie pogrzebał
W v0.12.0 wjeżdżają dwie nowe platformy chatu. Microsoft Teams jako 19. platforma komunikacyjna, w postaci pluginu — pełna wersja, ze end-to-endową Graph auth + listenerem webhooków + runtime'em pipeline'u + outbound delivery, ląduje kilka tygodni później w v0.14.0. I Tencent Yuanbao (元宝) jako 18., z natywną dostawą tekstu i mediów.
Schemat z v0.9.0 z „prawdziwymi konsumenckimi platformami" (iMessage, WeChat) powtarza się w v0.12, ale pod innym kątem: v0.12 przechyla się w stronę chatów korporacyjnych. Era botów AI w Slacku i Discordzie należy już do przeszłości.
Potop pracy po stronie providerów
Po stronie modeli nagłówkiem jest LM Studio, awansowane z „przetestowanej ścieżki społecznościowej" do statusu first-class providera. Jeśli zawsze chciałeś nakierować Hermesa na lokalny model i nigdy więcej nie patrzeć na curl-jednolinijkowca, v0.12 to wydanie, w którym ta droga w końcu zrobiła się nudna — w dobrym sensie.
Razem z LM Studio: GMI Cloud, Azure AI Foundry, MiniMax OAuth i Tencent Tokenhub. Cztery nowe providery w wydaniu, które wszyscy zapamiętają jako „to z curatorem". Po dokładnej lekturze release notes orientujesz się, że v0.12.0 odwala robotę za trzy normalne wydania.
Spotify, Google Meet i toole integracyjne
W v0.12.0 lądują też dwa natywne toole integracyjne warte osobnej wzmianki. Spotify z PKCE OAuth — agent może z poziomu czatu pominąć utwór, zbudować playlistę, sprawdzić, co i na którym urządzeniu leci. Google Meet jako plugin, który wchodzi na spotkania i wyciąga transkrypcje.
Dla większości to nie są fichy-nagłówki. Są fichami-nagłówkami dla tego konkretnego użytkownika, który zastanawiał się, czy „agent AI" naprawdę może oznaczać „steruje rzeczami w aplikacjach, których używam codziennie". Dla tego użytkownika v0.12.0 to wydanie, które w końcu mówi tak.
Skille mają teraz własny kanał dystrybucji
ComfyUI v5 i TouchDesigner-MCP awansują z opcjonalnych do domyślnego bundle'a. Razem ląduje siedem nowych skilli: Humanizer (zdejmuje tiki AI z wyjścia), claude-design, design-md, airtable, pretext, spike i sketch.
Zmiana, która w ciszy otwiera dużo szersze drzwi, mieści się w jednej linijce release notes: skill można od teraz zainstalować bezpośrednio z URL HTTP(S). Bez centralnego rejestru; jeśli potrafisz wyhostować manifest skilla, potrafisz go dystrybuować. Połącz to z „curator co tydzień przycina ci bibliotekę" i masz szkielet prawdziwego ekosystemu — ludzie dzielą się skillami tak, jak dzielą się gistami, a agent sam dba o to, żeby lokalna biblioteka była zdrowa.
Tryb nieinteraktywny i reszta sprzątania UX
hermes -z <prompt> to nowy nieinteraktywny tryb one-shot — wrzucasz prompt, dostajesz odpowiedź, wychodzisz. Release notes nie rozwodzą się nad tym, ale to ta zmiana, która sprawia, że Hermes staje się realnym kandydatem do shellowych pipeline'ów: echo "summarize this log" | hermes -z.
hermes update --check robi preflight przed pobraniem. /reload-skills przeładowuje bibliotekę skilli w środku sesji. /busy oznacza agenta jako zajętego, z opcją steeringu w komplecie. Widoczny cold start TUI skurczył się o około 57% dzięki leniwej inicjalizacji i czyszczeniu grafu importów — za mały, żeby trafić do highlight reela, za duży, żeby nie poczuć go przy pierwszym uruchomieniu po upgrade'ie.
Zmiany niezgodne wstecz
Dwie do odnotowania. Redakcja sekretów jest teraz domyślnie wyłączona (wcześniej włączona), żeby nie psuć payloadu — stary default raz na jakiś czas zjadał poprawne tokeny, które wpadały w wzorzec redactora. v0.13.0 przełączy włącznik z powrotem, gdy sam redactor zostanie przepisany. Komendy /provider i /plan zostały usunięte; ich role zostały odpowiednio wchłonięte przez /model i /steer.
---
Wracam wciąż do curatora. Hasło „self-improving" w README Hermesa siedzi tam od pierwszego dnia, i w praktyce prawie zawsze znaczyło: agent staje się coraz lepszy w pisaniu skilli. v0.12.0 dorzuciło drugą połowę self-improvementu. Agent staje się też coraz lepszy w usuwaniu skilli.
Technicznie to mniejsza rzecz, niż brzmi; kształtowo — większa, niż wygląda. Wszystkie inne wydania w tym odcinku sprawiały, że agent umiał więcej. v0.12.0 sprawiło, że agent umie z własnej inicjatywy robić mniej. Pierwszy typ wydania powiększa powierzchnię, którą musisz pilnować. Drugi ją kurczy. Naprzemienność tych dwóch rzeczy to, podejrzewam, prawdziwy powód, dla którego projekt jeszcze nie wali się pod własnym ciężarem.