Architecture Messaging

Z 7 do 22 w 14 miesięcy: każda platforma czatu, na której chodzi Hermes Agent

Hermes Agent

Hermes Agent

@hermesagents

May 18, 2026

9 min czytania

Kiedy Hermes Agent wydał v0.2.0 dwunastego marca 2026, gadał z siedmioma platformami czatu z jednego procesu gateway-a — Telegram, Discord, Slack, WhatsApp, Signal, Email i CLI. Czternaście miesięcy później ta liczba to 22.

Sama liczba nie jest najciekawsza. Najciekawsze jest to, co architektonicznie oznacza jeden proces gadający 22 protokołami — i co każda nowa platforma odblokowała komu. Ten wpis to pełna mapa: jak to urosło, co jest na liście dziś i jak gateway sprawia, że „jeden agent, dwadzieścia dwie drzwi wejściowe" faktycznie działa.

Droga, wydanie po wydaniu

WydanieDataCo wjechałoŁącznie
v0.2.02026-03-12Telegram, Discord, Slack, WhatsApp, Signal, Email, CLI7
v0.6.02026-03-30Feishu/Lark, WeCom9
v0.9.02026-04-13BlueBubbles (iMessage), WeChat (Weixin), WeCom callback12
v0.11.02026-04-23QQBot13
v0.12.02026-04-30Microsoft Teams (pierwsza platforma dostarczona przez plugin), Tencent Yuanbao15
v0.13.02026-05-07Google Chat (wg upstreamu 20. platforma)
v0.14.02026-05-16LINE Messaging API, SimpleX Chat22

Liczby w skrajnej prawej kolumnie to oficjalne sumy, które Nous Research podaje per wydanie. Dziury w licznikach po drodze biorą się z sub-trybów adapterów (WeCom callback, Feishu comment relay itp.), które upstream liczy jako osobne platformy; ten fanowski wpis trzyma się nazw, które rozpoznajesz.

Te 22, według kategorii

Mainstreamowe komunikatory konsumenckie

  • Telegram — first-party Bot API od v0.2.0. v0.13.0 dorzucił natywny streaming draftów (przyrostowe edycje token-po-tokenie przez sendMessageDraft). v0.14.0 dorzucił inline-keyboardowe guziki dla toola clarify — prompt-y wielokrotnego wyboru pojawiają się jako prawdziwe guziki Telegrama, zamiast odpisywać numerem.
  • Discord — kanały, wątki, DM-y. v0.14.0 zrobił backfill historii kanału domyślnie włączonym (bot przed odpowiedzią wczytuje świeże wiadomości) i renderuje wybory clarify jako natywne guziki Discorda.
  • WhatsApp — gateway przez Baileysa. Instalator ściąga Node.js v22 specjalnie dla tego mostu. v0.14.0 wystawia metadane quoted-reply z Baileysa, żeby agent mógł rozstrzygnąć „na którą wiadomość odpisałeś?".
  • Signal — oparte na relay, DM-y i grupy, E2E zachowane.
  • LINE — dodany w v0.14.0 przez oficjalne LINE Messaging API. Duża sprawa dla userów w Japonii, Korei i na Tajwanie, gdzie LINE dominuje rynek komunikatorów.
  • iMessage (przez BlueBubbles) — dodany w v0.9.0. Wymaga Maca w tej samej sieci z BlueBubblesem jako relay-em; konto iMessage z macOS-a zostaje na swojej rodzimej maszynie, agent dociera do niego mostem BlueBubbles.

Robocze / enterprise

  • Slack — first-party integracja aplikacji od v0.2.0. Dostarczana jako extra .[slack] w pyproject.toml. v0.14.0 dorzucił !cmd jako alternatywny prefix dla slash-komend wewnątrz wątków.
  • Microsoft Teams — debiutował w v0.12.0 jako pierwsza platforma dostarczona przez plugin. v0.14.0 przepuścił przez maszynę cały stack Microsoft Graph: auth + fundament klienta (#21922), webhook listener przyjmujący eventy Teams (#21969), runtime pluginu pipeline (#22007), outbound delivery przez istniejący adapter (#22024). Rejestrujesz aplikację Graph, wklejasz credentialsy, a bot czyta i pisze w dowolnym kanale, DM-ie albo grupie.
  • Google Chat — dodany w v0.13.0. Integracja z Workspace przez webhooka.
  • Mattermost — open-source-owa alternatywa dla Slacka, wspierana.
  • Email — wysyłka SMTP plus odbiór IMAP. Uniwersalny back-channel; czasem najwyżej dźwigniona platforma z całej listy.

Chiński ekosystem

  • WeChat (Weixin) — dodany w v0.9.0. Społecznościowy most HermesClaw potrafi też równolegle obsługiwać Hermesa i OpenClaw na tym samym koncie WeChat, jeśli migrujesz.
  • WeCom (Enterprise WeChat) — dodany w v0.6.0. v0.9.0 dorzucił tryb WeCom callback dla webhooków przychodzących.
  • Feishu / Lark — enterprise-owy komunikator ByteDance. Dodany w v0.6.0. v0.14.0 dorzucił natywne update-promptowe karty.
  • DingTalk — enterprise-owy komunikator Alibaby.
  • QQBot — ekosystem QQ od Tencenta, dodany w v0.11.0.
  • Tencent Yuanbao — AI-native platforma czatowa Tencenta, dodana w v0.12.0.

Prywatność / zdecentralizowane

  • Matrix — federacyjny, z możliwością E2E. Dostarczany jako extra .[matrix].
  • SimpleX Chat — dodany w v0.14.0. Skupiony na prywatności zdecentralizowany komunikator bez trwałych identyfikatorów użytkowników — Hermes na nim chodzi, nie ujawniając identyfikatorów, w przeciwieństwie do wszystkich innych platform z tej listy, gdzie bot ma stabilną tożsamość.

Inne powierzchnie

  • CLI — terminalowe UI samo w sobie jest „platformą" w sensie gateway-a: te same slash-komendy, ta sama memory, te same skille. Jedyna platforma, w której Hermes jest, a nie do której się mostuje.
  • SMS — most SMS-owy dla userów, którzy nie używają żadnego z powyższych komunikatorów.
  • Home Assistant — ściśle rzecz biorąc nie platforma czatowa, ale wspierany jako notification-target i powierzchnia rozmowy dla userów smart-home.
  • Webhook — generyczny inbound/outbound webhook dla dowolnej custom-platformy, którą sam podepniesz. Klapa awaryjna.

Jak gateway sprawia, że 22 jest możliwe

Liczba nie jest najciekawsza. Najciekawsze jest to, co architektonicznie oznacza jeden proces gadający w 22 protokołach.

Każda platforma żyje w upstreamie pod gateway/platforms/ jako cienki adapter implementujący ten sam bazowy interfejs — receive, send, edit, react, thread. Rdzeń agenta widzi jeden strumień wiadomości, niezależnie od tego, skąd ona przyszła. Memory, skille, osobowość i tool-use żyją warstwę wyżej, nad adapterami.

To jest to, co pozwala ci zacząć rozmowę na jednej platformie i kontynuować ją na innej. Session ID jest globalny; platforma to tylko koperta. /handoff z v0.14.0 formalizuje tę zasadę — możesz oddać żywą sesję z jednego modelu do innego w środku rozmowy, a ta sama maszyneria podpisuje się pod ciągłością cross-platform.

v0.14.0 podpiął też per-platformowy circuit breaker i slash-komendę /platform (#26600), żeby jeden padający adapter — Telegram w rate-limicie, wygasły token Slacka, zepsuty callback WeCom — nie kładł całego gateway-a. Jedna platforma chora — inne nadal działają.

Jak jedną podłączyć

Zajmuje się tym kreator setupu. Po instalacji:

bash
hermes gateway setup

Wymienia, które platformy są skonfigurowane, a które nie, i przeprowadza cię przez OAuth-owe flow albo wklejanie tokenów per platforma. Dla Telegrama i Discorda — wklejasz token bota z BotFathera albo discord.dev. Dla Slacka i Teams — rejestrujesz aplikację i wklejasz credentialsy. Dla WhatsAppa — skanujesz QR telefonem. Dla Signala — linkujesz urządzenie. Dla SimpleX — wskazujesz endpoint SimpleX-owego bota.

Jeśli chcesz tylko podzbiór — powiedzmy, tylko Telegram i Discord — wybierz je w kreatorze. Reszta zostaje w stanie uśpionym i nie zżera zasobów.

Co dają te 22

Trzy miesiące temu „agent na WhatsAppie" i „agent na Slacku" to były różne rozmowy. Teraz to ten sam agent — ta sama memory, ta sama biblioteka skilli, ta sama osobowość — dosięgany przez te drzwi wejściowe, których ta rozmowa potrzebuje.

To jest ta nudna infrastruktura, która po cichu zmienia, co znaczy „agent AI" w 2026: nie okno czatu, do którego się idzie, tylko obecność, która mieszka tam, gdzie ty już mieszkasz.

Dalsza lektura

Subskrybuj aktualizacje

Aktualności społeczności o wydaniach Hermes Agent, nowych umiejętnościach i integracjach. Bez spamu, wypisz się kiedy chcesz.