Release Recap

Hermes Agent v0.13.0 — La release où l'agent est devenu têtu

Hermes Agent

Hermes Agent

@hermesagents

May 7, 2026

8 min de lecture

La première fois qu'un clignement de réseau m'a coûté une session Hermes, j'étais à vingt minutes dans une refacto et l'agent avait dans la tête une carte du dépôt que je n'avais pas. La gateway a perdu la connexion. La session s'est arrêtée. La carte est partie avec.

Je ne vais pas prétendre que cette expérience précise est la raison pour laquelle v0.13.0 existe. Les release notes appellent cette version « the tenacity release » — un mot qui sonne tiré d'un dictionnaire de synonymes, jusqu'à ce que tu réalises que les trois fonctionnalités-titres de v0.13.0 sont essentiellement trois réponses différentes à la même question : comment l'agent termine-t-il ce qu'il a commencé ?

7 mai 2026, pile une semaine après v0.12.0. La release tombe un mercredi. À la fin de ce mercredi, l'agent sur mon serveur connaît trois nouvelles façons d'être têtu.

Un Kanban, mais pour des workers IA

La fonctionnalité vedette, c'est le Kanban multi-agent — un tableau de tâches persistant sur lequel plusieurs workers Hermes peuvent prendre, transférer et terminer des tâches en collaboration. La tuyauterie en dessous n'est pas jolie, mais c'est précisément la pièce qui compte : surveillance par heartbeat, détection des zombies, budget de retries par tâche, écritures d'état atomiques.

En clair : si un worker meurt en cours de tâche, un autre worker peut la reprendre. Si la gateway redémarre, le tableau revient là où il l'a quitté. Si une tâche échoue trois fois d'affilée, le budget de retries dit stop, et la tâche est mise de côté pour un humain. Toute cette tuyauterie sert une chose : pouvoir pointer cinq copies de Hermes sur un backlog et partir.

L'autre moitié de la fonctionnalité, moins clinquante mais sans doute plus utile pour un déploiement à une seule instance : une instance de Hermes peut elle-même se comporter en « kanban worker » dans un plan multi-processus, en prenant les tâches une par une. Dans un certain sens, l'agent a appris à devenir consommateur de file. Ça change le type de jobs qu'on peut raisonnablement lui confier.

/goal et la boucle de Ralph

La commande slash /goal est l'implémentation de ce que la communauté de design d'agents appelle la boucle de Ralph — un vieux pattern de design : dire à l'agent de rester accroché à un objectif sur plusieurs tours de conversation, peu importe où l'utilisateur le pousse sur un tour donné.

Si tu as déjà surpris Hermes en train de dériver de la tâche d'origine parce que le dernier message de l'utilisateur l'a tiré de côté — « attends, on faisait quoi, déjà ? » — /goal est la rustine. Tu poses l'objectif une fois au début de la session, et chaque tour suivant est évalué contre cet objectif. L'agent a le droit de faire des détours ; ce qu'il n'a pas le droit, c'est d'oublier la destination.

/subgoal, qui atterrit une semaine plus tard dans v0.14.0, te laisse ajouter des critères de succès en cours de route. Les deux mis ensemble, c'est ce qui rapproche le plus un agent en forme de chat de ce que fait un plan de projet traditionnel : un objectif, avec affinage en cours de route.

Durabilité de session — le redémarrage de gateway n'est plus un reset

Le troisième volet du « finir ce qu'on a commencé », c'est la durabilité de session. Les conversations reprennent automatiquement après un redémarrage de gateway, en conservant contexte et routage de thread. Sous le capot, on trouve les checkpoints v2 et la persistance atomique de session — le même type de travail qui sous-tend la couche de heartbeats du Kanban.

Le comportement visible, c'est la ligne pour laquelle j'aurais payé cher il y a quelques mois : un redémarrage de gateway n'est plus un reset de conversation. Tu tires une nouvelle release, tu redémarres le process, la conversation reprend là où elle s'était arrêtée. L'histoire opérationnelle day-2 du Hermes auto-hébergé vient juste de devenir nettement plus simple — et pour quiconque le fait tourner sur un VPS qui redémarre de temps en temps pour des mises à jour de kernel, v0.13.0 est la release où l'agent cesse de s'en offusquer.

Google Chat, DeepSeek v4 Pro, et la vague de modèles

Google Chat atterrit comme 20ᵉ plateforme de messagerie. À ses côtés : un système de providers enfichable pour que les adaptateurs tiers puissent sortir hors du dépôt principal — la même forme de travail que l'architecture de transports de v0.11.0, étendue cette fois à la couche d'adaptateurs de gateway. Le prochain clone d'iMessage, la prochaine API régionale de messagerie, la prochaine app de chat chiffrée — aucun ne doit plus attendre un merge dans core.

Côté modèles : DeepSeek v4 Pro, xAI Grok 4.3, OpenRouter Owl-Alpha (palier gratuit), et Tencent Hy3 Preview sont des entrées neuves. xAI Custom Voices débarque avec du clonage vocal pour le TTS. Et un outil d'analyse vidéo monte sur Gemini et d'autres modèles multimodaux, donnant enfin à Hermes une façon de regarder un clip de 30 secondes au lieu d'une pile d'images fixes.

Si ton critère pour « ce projet suit la frontière des modèles » est « ont-ils ajouté le support du modèle que j'ai essayé cette semaine ? », v0.13.0 passe la barre presque à coup sûr.

L'internationalisation arrive

Le CLI et la doc ont été traduits dans sept locales — chinois, japonais, allemand, espagnol, français, ukrainien, turc. Une ligne à puce qui cache une énorme quantité de travail. Si tu lis la sortie CLI de Hermes en anglais depuis trois mois et que ton cerveau, quand il est fatigué, traite l'anglais comme une langue étrangère, v0.13.0 est la release qui te laisse changer.

Un effet secondaire qui vaut la peine d'être noté : quand la sortie CLI est localisée, les messages d'erreur le sont aussi. Ce qui veut dire qu'un utilisateur non-anglophone qui colle une erreur dans un forum voit les mêmes mots que ceux qui répondent. La traduction, étonnamment souvent, est aussi une histoire de débogabilité.

Sécurité, ACP et la sous-commande d'archivage du curator

Huit vulnérabilités P0 fermées — les release notes ne les énumèrent pas par CVE, mais le motif est large : redaction par défaut à nouveau activée (le retournement de v0.12 est annulé, maintenant que le redactor lui-même a été refait), liste blanche de rôles Discord limitée par guild, WhatsApp rejetant les contacts inconnus par défaut, et fenêtres TOCTOU fermées dans les systèmes d'authentification.

hermes curator archive, prune et list-archived formalisent le curator de v0.12 en vraies sous-commandes. /steer et /queue apparaissent aussi dans les adaptateurs ACP (VS Code, Zed, JetBrains) — si tu utilises Hermes depuis ton éditeur, tu peux maintenant pousser le sens d'un agent en pleine route depuis l'éditeur, sans repasser par le terminal.

Ce que la « tenacity » achète vraiment

Chacune de ces fonctionnalités, prise isolément, est dans le tracker depuis des semaines. Ensemble, elles achètent une seule et même chose : un Hermes qui n'oublie pas ce qu'il était en train de faire quand le réseau cligne, quand l'API du modèle throttle, quand la gateway redémarre ou quand l'utilisateur s'absente.

L'agent a toujours été intelligent. v0.13 l'a rendu têtu. C'est différent. Les agents intelligents se remettent élégamment d'une interruption — souvent en démarrant une nouvelle tâche, sans mémoire de l'ancienne. Les agents têtus terminent l'ancienne tâche. Le Kanban, le verrouillage d'objectif, la reprise de session — tous ont la même forme : un état qui survit à ce qui le détruisait avant.

---

L'industrie des agents IA, ce trimestre, se bat surtout sur la capacité brute — modèles plus grands, contextes plus longs, plus de skills. v0.13.0 se bat sur un autre axe. Le problème difficile pour les agents auto-hébergés en 2026, ce n'est pas « peut-il faire X ? » — c'est « peut-il faire X trente minutes d'affilée à travers un événement réseau ? ». Une portion étonnamment grande de la qualité réelle d'un agent vit dans la réponse à cette seconde question.

Que cette release s'appelle « tenacity » plutôt que quelque chose avec durability ou reliability dedans, ça dit quelque chose. Tenacity, c'est un mot qu'on emploie pour parler de gens. Sous-entendu : l'équipe pense à cet agent comme on pense à une personne.

Pour aller plus loin

Abonne-toi aux mises à jour

Actualités communautaires sur les releases, les nouveaux skills et les intégrations de Hermes Agent. Pas de spam, désinscription à tout moment.