2026 年 4 月 8 日の朝に起きて、最新の Hermes Agent ビルドを引いてきて、その日最初のセッションの途中、前には見たことがないことをこいつがやった。大量のログから特定のエラーパターンを探させていた。grep を走らせて、何も引っかからず、一秒止まってからこう言ったのだ——「このパターンは素の出力には入っていない。代わりに解凍済みアーカイブ側で試してみる」。で、実際に正解だった。
この感覚にはたぶん一生完全には慣れない。でも、v0.8.0 が v0.7.0 とは別物のリリースに感じられる要因のかなりの部分が、実際こういうタイプの——エージェントが自分の仕事について考える力の、小さくて目に見えない底上げ——だったりする。リリースノートはこのリリースを intelligence release(知性のリリース)と呼んでいる。これはマーケティングの言い回しではなく、実際に起きたことをそのまま記述した表現だ。
目玉——Hermes が自分自身のツール利用ガイダンスにパッチを当てた
v0.8.0 で一番興味深い PR は #6120 だ。タイトルは「自動行動ベンチマークによる GPT/Codex ツール利用ガイダンスの自己最適化」。短く言うとこうなる——プロジェクトは GPT と Codex のモデルを突っつく自動ベンチマークループを組み、これらがツール呼び出しで失敗する具体的な 5 つのパターンを特定し、それを直すためのターゲット付きガイダンス文字列を生成し、改善幅を測定し、その結果をシステムプロンプトの一部として出荷した。つまりエージェントは自分自身を診断してパッチを当てた。人間はその過程でプロンプトを書くエンジニアではなく、レビュアーとしてループに入っていた、ということだ。
これと並行して、v0.8.0 はシステムプロンプトに実行規律ガイダンス(#5414)を追加し、構造化された推論応答に対する思考のみのプレフィル継続(#5931)も入れた。GPT-5 や Codex で Hermes を使っているなら、4 月 8 日の朝に目を覚まして向き合ったエージェントは、4 月 7 日の夜に寝かしたエージェントより目に見えて賢くなっている。こう書くこと自体、ちょっと奇妙な気分になる一文だ。
すべてのプラットフォームで走るライブモデル切り替え
二つ目の目玉は /model コマンド(#5181、#5742)だ。CLI、Telegram、Discord、Slack、あるいは任意のゲートウェイプラットフォームから、セッションの途中でモデルとプロバイダを切り替えられるようになった。リゾルバはアグリゲータを意識して動く——OpenRouter や Nous Portal を使っていて、そこで目的のモデルが使えるなら、そのままアグリゲータに留まる。無ければ直結プロバイダに飛ぶ。Telegram と Discord にはインラインボタン付きのインタラクティブピッカーが用意されていて、使いたいモデルをタップするだけでいい。名前を手で打たなくて済む。
これを v0.7.0 の認証情報プール、v0.6.0 のフォールバックチェーンと組み合わせると、前回の記事で描いた「プロバイダに縛られない」物語がここで完成する——再起動することなく、自分のモデルラインナップを組み立て、壊し、組み直すことができる。
無料の Gemini、無料の MiMo
プロバイダまわりでの大きな追加が二つ。Google AI Studio(Gemini)のネイティブ対応が一等市民のプロバイダとして入った(#5577)。models.dev レジストリとの自動統合により、コンテキスト長をリアルタイムで検出する。もうひとつが Nous Portal 上の Xiaomi MiMo v2 Pro 無料枠(#6018)で、圧縮、ビジョン、要約といった補助タスク用に使える。財布が疲れていて Hermes に踏み込めずにいた人にとって、今週、無料枠は実効的にずっと有用になった。
バックグラウンドタスクの完了通知
notify_on_complete は、見た目は小さいのにターミナルの使い方そのものを作り直してくるタイプの改修だ。バックグラウンドタスクは終了時にエージェントへ自動的に通知を送るようになった。トレーニング、テストスイート、ビルド、デプロイを叩き込んでおいて、その間エージェントは別の仕事に出かけられる。バックグラウンドタスクが終わるとエージェントが ping を受けて、結果を拾いにいく。ポーリングも「もう終わった?」のループもいらない。
無操作タイムアウト、承認ボタン、そしてそれ以外の一覧
他にも二つだけ、単独で取り上げておきたい変更がある。まず、無操作ベースのエージェントタイムアウト(#5389、#5440)——ゲートウェイや cron のタイムアウトが壁時計の経過ではなく、実際のツール活動を基準にするようになった。真面目に働き続けている長時間タスクは絶対に殺されない。切れるのは本当にアイドルなセッションだけだ。cron 系エージェントで一番腹立たしかった挙動——本物の仕事の真っ最中にシャベルで埋められる——が、これでようやく直った。
次に、Slack と Telegram の承認ボタン(#5890、#5975)。危険コマンドの承認に /approve と打つ必要がなくなった。プラットフォームのネイティブボタンをタップすればいい。Slack はスレッドコンテキストの保持が、Telegram は承認状態の emoji リアクションが加わった。
そしてそれぞれが独立の記事を立てられるような細かい改修がまだ残っている。MCP OAuth 2.1 PKCE 認証(#5420)、MCP 拡張パッケージに対する OSV マルウェアスキャン(#5305)、リアクションと既読通知を含む Matrix のティア 1 パリティ(#5275)、~/.hermes/logs/ へ書き出される集中化された構造化ログと hermes logs コマンド(#5430)、起動時の設定構造バリデーション(#5426)、そして SSRF、タイミング攻撃、tar のパストラバーサル、認証情報リークをまたぐセキュリティ強化の一巡(#5944、#5613)。
数字で見る
マージされた PR 209 件。解決された issue 82 件。リリースは 1 回。v0.7.0 からの経過日数は 5 日。
この数字を見て「何かおかしい」と感じたとしたら——5 日間の窓に 209 件の変更はどう考えても多すぎる——正しく読めている。そこが肝だ。このプロジェクトの作り方のどこかが、このタイプの速度を持続可能にしている。いずれその「なぜ」について話さなければならない。だがそれは次の記事のテーマだ。