Release Recap For Power Users

Hermes Agent v0.14.0——見逃したくない 22 のハイライト

Hermes Agent

Hermes Agent

@hermesagents

May 16, 2026

11 分で読める

Hermes Agent v0.14.0 は 2026 年 5 月 16 日に着地した——v0.13.0 からちょうど 9 日後。プロジェクト史上最大のリリースだ:merge した PR が 633 件、変更ファイル 1,393、808 コミットで挿入 165,061 行、クローズした issue 545、リリース窓口の貢献者 215 名。上流タグ:v2026.5.16

リリースノート自体は数千語に渡る。下の 22 件が「自分が本当に知りたいこと」を質問別にまとめたものだ。どの項目も上流の PR 番号を引いてある——確認したくなったら踏みに行ける。

---

インストールと配布

1. pip install hermes-agent が PyPI に乗った

14 ヶ月の「このスクリプトを curl」のあとで、Hermes はついに本物の PyPI パッケージになった。wheel が Ink TUI バンドルと shell ランチャを同梱しているので、入れた瞬間からフル体験が出る。pipx install hermes-agent も通る。古い curl 一行、Docker、git-clone の経路は全部残っている——今回はそれに加えて Python 圏向けの扉を開けたという話だ。(#26593、#26350 のサルベージ)

2. 「ダイエット」の波

重量級バックエンド(Slack / Matrix / Feishu / DingTalk アダプタ、hindsight クライアント、codex app-server、Pixverse / Camofox / 画像生成 SDK、TTS プロバイダ)が、初回使用時の lazy install に揃って切り替わった。[all] extras から lazy で入るやつは全部抜けたし、wheel が自分の環境に合わないときはインストーラが段階的にフォールバックする。インストール前には supply-chain advisory チェッカが不安全バージョンを一通り検査する。インストールが軽くなり、速くなり、推移的依存にぶら下がる脆弱性も減った。(#24220, #24515, #25014, #25038, #25766, #21818)

3. ネイティブ Windows が early beta に

CLI、gateway、TUI、tools——全線にわたって正式なネイティブ Windows の道が敷かれた。PowerShell インストーラ、MinGit を自動検出・自動インストール(約 45 MB、管理者権限不要)、Microsoft Store の python stub の判別、フォアグラウンド Ctrl+C の維持。すでに 40 個ほどの Windows 専用フォローアップ修正が merge 済みだ。本番運用としては WSL2 が一番枯れている経路で、「early beta」というラベルは本気で付けてある。(#21561)

---

モデルとプロバイダ

4. xAI Grok が SuperGrok OAuth で——grok-4.3 はついでに 1M context へ

SuperGrok を契約しているなら、xAI アカウントでログインして Hermes 内で Grok が使えるようになった——API key 不要、別途の請求関係もいらない。これと一緒に grok-4.3 のコンテキストが 1M トークンまで上がった——コードベース丸ごと、あるいは研究論文の束をそのまま一つの prompt に放り込める。entitlement 周りのエラー処理は仕込んであるし、リモート機に SSH で入っているときに OAuth を完了する手順もドキュメント化されている。(#26534, #26664, #26644, #26592)

5. hermes proxy——OAuth 契約が自分の localhost に降りてくる

hermes proxy を走らせると、ローカルに http://localhost:port のエンドポイントが立つ。このエンドポイントは OpenAI の API を喋る——背後にいるのは、自分が Hermes 経由でログインしている OAuth プロバイダのどれか:Claude Pro、ChatGPT Pro、SuperGrok。Codex CLI、Aider、Cline、Continue——OpenAI 互換エンドポイントを期待するツールはどれも——既存の契約をそのまま使って動く、API key は要らない。一つの契約、すべてのツール。(#25969)

6. NovitaAI がプロバイダ陣営に参加

AI ネイティブのクラウド、定額制の Agent Sandbox、Llama / Qwen / DeepSeek などのオープンソースモデルを抱えている。#7219 のサルベージ。(@kshitijk4poor) (#25507)

7. OpenRouter Pareto Code router と min_coding_score

OpenRouter の Pareto router は品質ラインを満たす最安モデルを自動で選ぶ。新しい min_coding_score はそのラインをコーディング系タスク向けに引くノブだ——Hermes は「そのスコア以上のうち最も安いモデル」にルーティングする。中堅で十分な作業に最上位モデルの金を払うのはやめよう。(#22838)

8. OpenAI / Codex モデル向けの Codex app-server runtime

オプショナルな runtime で、OpenAI や Codex 経路にいるときに裏で OpenAI の Codex CLI を駆動する。セッション再利用、固まったセッションの自動引退、OAuth refresh の分類が正しい——エージェントの長時間ランが落ちずに走るのは、この配管のおかげだ。(#24182, #25769)

9. Alibaba Cloud が Qwen Cloud に改名

picker と設定では、世界の他の場所と同じブランド名を使うようになった。既存の設定キーは引き続き有効で——破壊的変更ではない——UI が実際のブランドに揃っただけだ。(#24835)

---

メッセージングプラットフォーム——合計 22 個

10. Microsoft Teams——エンドツーエンド

Teams は v0.12.0(2026 年 3 月)で「プラグイン出荷型の最初のプラットフォーム」として着地した。v0.14.0 が Microsoft Graph スタックをエンドツーエンドで通す:認証+クライアント基盤(#21922)、Teams のイベントを受ける webhook listener(#21969)、パイプラインプラグイン runtime(#22007)、既存アダプタ経由の対外配信(#22024)。Bot を一度繋げば、任意の Teams チャネル、DM、グループから話しかけられる。(#21408–#21411 のサルベージ)

11. LINE——公式 LINE Messaging API でファーストクラス

LINE は日本、韓国、台湾で圧倒的だ。Hermes がそこにネイティブで入った。(#23197)

12. SimpleX Chat——分散、ユーザ ID なし

プライバシー特化の分散型メッセンジャ、永続的識別子なし。Hermes は識別子を一切露出せずに走る。(#26232——#2558 のサルベージ)

13. Discord のチャネル履歴を既定でバックフィル

Hermes がチャネルやスレッドに初めて入ったとき、最近のメッセージ履歴を読んでから返答する。もう「自分たち何の話してたんだっけ?」とは言わない——画面上で他の人が見ている文脈を、エージェントも持っている。(#25984)

14. Telegram と Discord の clarify がプラットフォームネイティブのボタンに

複数選択のプロンプトが、プラットフォームネイティブの本物のボタンとして出るようになった。タップして答える——スマホで特に気持ちいい。(#24199, #25485)

---

Agent loop とセッション

15. /handoff が実際にセッションを生きたまま移送するようになった

会話の途中で別のモデル、別のパーソナリティ、別のプロファイルへ引き渡す——メッセージも、ツール呼び出しも、コンテキストの一切も、一緒に動く。デバッグの途中で速いモデルから深推論モデルに切り替えたり、一つのタスクの中でプロファイル間にセッションを渡したり、できる。(#23395)

16. /subgoal——走っている /goal に基準を後付け

Ralph ループ式の /goal は、judge が成功基準を受理するまでエージェントを走らせ続ける。/subgoal <text> はそのループに走行中で追加基準を載せられる——ループを再起動せずに。(#25449)

17. 1 ターンごとのファイル変更レポートフッタ

ファイルを書いたり編集したりしたターンの後、エージェントには「ディスクで何が変わったか」を要約した短いフッタが手渡される——パス、行数、実際の差分。書き込みが落ちなかった、あるいは黙って上書きされたといったケースを、エージェントが自分で捕まえる——「あの関数を追加した」と自信満々に主張する代わりに。(#24498)

18. 書き込みのたびに LSP の意味的診断

write_filepatch は今や、編集したファイルに対して本物の language server を走らせ、新しく出たエラーを次ターンが始まる前にエージェントに返す。型エラー、未定義シンボル、足りない import——即座に捕まる。v0.13.0 の基本的な Python/JSON/YAML/TOML lint からは大きく前進——今回は本当の意味的解析だ。(#24168, #25978)

---

パフォーマンス

19. hermes の冷起動から約 19 秒削減

skills キャッシュ + Feishu アダプタの lazy 化 + import グラフ全体での遅延 import + models.dev の cache-first 検索 + doctor チェックの並列化 + chat -q での歓迎バナーのスキップ。hermes tools の All-Platforms 画面は 14 秒から 1.5 秒未満に下がった。(#22138, #22120, #22681, #22790, #22808, #22831, #22859, #22904, #22766, #25341)

20. browser_console の評価が 180 倍速く

supervisor が持ち続ける Chrome DevTools Protocol の WebSocket 経由でルーティングする——呼び出しごとに新しいセッションを開く代わりに。以前は browser ツールの呼び出しがエージェント最速の足を引っ張る一手だった。今は違う。リアルなページ操作の体感は「即時」だ。(#23226)

21. Claude の prompt cache がセッションを跨いで 1 時間保持

Anthropic、OpenRouter、または Nous Portal で Claude を使っているとき、prompt prefix(system prompt、skills、memory)が 1 時間、セッションを跨いでキャッシュされる。/new で新セッションを開いても、前のセッションが残した温かいキャッシュのおかげで最初の応答が速くて安い。バックグラウンドの memory レビューもこのキャッシュに乗る。(#23828, #25434, #24778)

---

マルチモーダル

22. vision_analyze がビジョン対応モデルにピクセルを直送

アクティブモデルが実際に「見える」(GPT-5、Claude、Gemini、Grok-vision)場合、vision_analyze は生のピクセルをモデルに直接渡すようになった——一旦テキスト記述に変換するのをやめた。文字に要約してから戻すラウンドトリップで精度を落とした版ではなく、モデルの本当の視覚推論が手に入る。(#22955)

---

ボーナスハイライト

上の 22 件が構造的な柱だ。一言添えておきたいものがあと 12 件:

  • x_search——一級市民の X(Twitter)検索ツール、OAuth でも API key でも。(#26763)
  • computer_use の cua-driver バックエンド——Anthropic 以外のビジョンモデルでもデスクトップを駆動できるようになった。フォーカス安全な操作付き、hermes update で更新される。(#21967, #24063)
  • 統一 video_generate、プロバイダバックエンドはプラガブル——新しい動画モデルが 1 ファイルのプラグインとして入る。(#25126)
  • どんなターミナルでも URL がクリックできる——本物の OSC8 ハイパーリンク、ホバーハイライト付き。(@OutThisLife, #25071, #24013)
  • Zed ACP Registry の 1 クリックインストールuvx 経由、npm 不要。(#26079, #26120, #26234)
  • Brave Search と DDGS が無料の web 検索プロバイダに加入、Tavily / SearXNG / Exa と並ぶ。(#21337)
  • 9 個の新しいオプショナル skill——Hyperliquid、Yahoo Finance、api-testing(REST + GraphQL)、統一 EVM マルチチェーン、darwinian-evolver、osint-investigation、pinggy-tunnel、watchers(RSS / HTTP JSON / GitHub ポーリング)、そして 2026 年 5 月の Developer Platform に合わせた Notion の全面改修。(#23582, #23583, #23590, #25299, #26760, #26729, #26765, #21881, #26612)
  • huggingface/skills が信頼デフォルトの tap に——そこに公開された community skill は追加設定なしでインストールできる。(#26219、#2549 をクローズ)
  • sudo ブルートフォースのブロック + 3 件の dangerous-command バイパス封じ + ツールエラーのサニタイズ(エラー文字列経由のプロンプトインジェクションはもう成立しない)。(#23736, #26829, #26823)
  • /sessions スラッシュコマンド——過去のセッションをブラウズして再開する。(@austinpickett, #20805)
  • プラグインに ctx.llmtool_override フラグ——プラグインがファーストクラスで LLM にアクセスでき、内蔵ツールを綺麗に差し替えられる。(#23194, #26759)
  • API server が承認イベントを公開——長時間ランの承認待ちで黙って固まることがなくなった。(#21899)

---

リリース窓口の数字

指標
merge した PR633
コミット808
変更ファイル1,393
挿入行165,061
クローズした issue545(P0 が 12、P1 が 50)
貢献者215
タグv2026.5.16
v0.13.0 から9 日

リリース窓口のトップコミュニティ貢献者

  • @kshitijk4poor——38 PR(Telegram のリズム/ストリーミング、セキュリティ強化、codex-runtime の整理、NovitaAI プロバイダ)
  • @alt-glitch——13 PR(Markdown テーブル TUI、HERMES_SESSION_ID、hindsight-client のオプショナル化)
  • @OutThisLife——12 PR(TUI のターン分割、markdown リンクのタイトル、OSC8 ハイパーリンク)
  • @austinpickett——8 PR(/sessions、パーソナリティ切り替え、cron モーダル)
  • @helix4u——5 PR(Google Chat のセットアップ、Windows の Ctrl+C)
  • @rob-maron——4 PR(Nous Portal をモデルメタデータの権威源に)

---

もっと読む

アップデートを購読

Hermes Agent の新リリース、新しいスキル、新しい統合をコミュニティの視点でお届け。スパムなし、いつでも解除できる。