The Story Release Recap

Hermes Agent v0.2.0——最初の公開リリース

Hermes Agent

Hermes Agent

@hermesagents

March 12, 2026

6 分で読める

Hermes Agent を最初に目にしたときには、もう「早かった」と言えるタイミングは過ぎていた。

2026 年 3 月 12 日、木曜日。基調講演もカウントダウンも、X でのローンチスレッドもなし。Nous Research はただ git tag を打ち、GitHub のリポジトリを public に切り替え、Discord に一言だけ書き残した——「this exists now(これ、今から存在してる)」。翌朝金曜の時点でリポジトリのスターは 1,000 を超え、20 のタイムゾーンにまたがる人たちが「どのインストール手順を使うべきか」で言い合いを始めていた。

その tag が打たれるまでの二週間で、一度も顔を合わせたことのない 63 人のコントリビューターが、プロジェクトに 216 本の PR を投げ込み、119 本の issue を閉じ、テストスイートをほぼゼロから 3,289 本まで育て上げていた。誰一人として Nous Research の社員ではない。彼らは GitHub のコメント欄越しに言い合いを続け、14 日目に、実際に動くものを世に出した。

で、箱の中には結局何が入っていたのか。

一つのプロセス、七つの玄関

v0.2.0 の目玉はマルチプラットフォーム・メッセージング・ゲートウェイだ。一つの Hermes プロセスが、Telegram、Discord、Slack、WhatsApp、Signal、IMAP/SMTP のメール、それに Home Assistant を同時に聞いている。セッション管理もメモリもツールレジストリも全部ひとつ。プラットフォームごとに「どのスキルを使えるか」「添付をどう扱うか」は別々に設定できるが、向こう側にいる agent は常に同じ一人の agent だ。

これは聞こえよりずっと面白い話で、というのも普通にやられる代替案——プラットフォームごとに別々のボットを七つ立てて、それぞれに状態を持たせる——は悲惨だからだ。記憶は分岐する。ツールの状態は少しずつずれていく。Hermes はゲートウェイそのものを統合ポイントにして、agent は一体のまま保つ。5 ドルの VPS に一台入れておけば、その瞬間手元で開いている app がどれでも、同じ agent にたどり着ける。

ネイティブの MCP、後付けじゃない

ゲートウェイのすぐ隣には、完全な Model Context Protocol クライアントが居座っている。stdio と HTTP の両方のトランスポートに対応。再接続、リソースと prompt の発見、サーバ起点の sampling まで揃っている。agent 界隈にそこまで深入りしていない読者のために書いておくと、MCP は Anthropic が公開したオープン標準で、LLM に外部ツールと一貫したやり方で対話させるためのものだ。多くのフレームワークは、古いツール呼び出しシステムの上にあとから MCP を「被せる」アダプタとして足した。Hermes は初日からそれをコアに直接配線した——MCP をしゃべるツールは、ラッパーなしでそのまま動く。

スキルはファーストクラスの単位

v0.2.0 には70 を超えるバンドル済みスキルが 15 のカテゴリに分かれて同梱されていて、その裏側にいるのが Skills Hub と呼ばれる仕組みだ。条件付き起動(前提条件が揃ったときだけスキルがロードされる)、前提条件の検証、そしてコミュニティからの発見機能。この Hub はのちに agentskills.io になる。初日から使えるスキルには、画像解析、サンドボックス内での Python 実行、ファイル検索、Web フェッチ、それにあと二、三十個が並んでいる。

ここでの技術的な選択は、スキルを「import 時に登録される Python 関数」ではなく、manifest と依存関係と起動条件を持った宣言的な単位として扱うということだ。これが、一つの agent が 70 個のスキルを同時に背負っても prompt が溶けない理由でもある。

プロバイダルーターとセーフティネット

v0.2.0 にはもう二つ、以降の全てを形作ることになるアーキテクチャ上の判断が入っている。

一つ目は集中型のプロバイダルーター。統一された call_llm() / async_call_llm() という API が、視覚、要約、圧縮、トラジェクトリ保存といったあちこちに散らばっていたプロバイダのロジックを置き換えている。どの補助的な呼び出し元も同じコードパスを通り、認証情報の解決も自動だ。退屈に聞こえる話だが、実際にプロバイダを差し替えようとした瞬間に印象が変わる——そのときあなたが触るのはファイル一つ、11 個ではない。

二つ目は安全のための二本立て。git worktree 分離hermes -w を付けると各セッションは隔離された worktree の中で立ち上がるので、agent があなたの本物のコードに誤って触ることがない)と、ロールバック付きのファイルシステム・チェックポイント(破壊的操作の前にスナップショットを取り、/rollback で巻き戻す)。agent が大胆にふるまうことを許されているのは、本当に戻せるからだ。ここにあるのは、「慎重に振る舞う AI アシスタント」と、「システムの側が慎重にしてくれているから大胆に動ける AI アシスタント」の違いだ。

それからエディタ側の話

リリースノートの中に埋もれがちだが外せない最後の一つ——ACP サーバのサポートだ。Agent Communication Protocol を介して、Hermes は VS Code、Zed、JetBrains にネイティブで統合される。「ターミナルに棲む何か」であることをやめて、あなたが実際に日常使っているエディタの中で暮らし始める、ということだ。

---

三月のあの木曜日のことを、今でもよく思い返す。アナウンスもデッキも投資家向けのコールもなく、あったのはただの git tag と、public への一回の切り替えと、扉が開いた瞬間にたまたま中にいた 63 人だけだった。このブログに通底するテーマがあるとすれば、それは——Hermes を作っている人たちのスピードが、どの個別機能のスピードよりも、結果的にずっと重要だった、ということだ。

もっと読む

最新を逃さない

Hermes Agent の新リリース、新しいスキル、新しい統合をコミュニティの視点でお届け。スパムなし、いつでも解除できる。