네트워크가 한 번 깜빡인 것 때문에 Hermes 세션을 통째로 잃은 첫 경험 당시, 나는 리팩터링 20분 차에 있었고, 에이전트는 내 손엔 없는 코드베이스 지도를 자기 머릿속에 짜놓고 있었다. 게이트웨이가 연결을 잃었다. 세션이 끝났다. 지도도 같이 사라졌다.
그 경험이 v0.13.0을 불러왔다고 주장할 생각은 없다. 릴리스 노트는 이 버전을 "the tenacity release"라고 부른다—동의어 사전에서 골라낸 단어처럼 들리지만, v0.13.0의 세 가지 헤드라인 기능이 본질적으로 같은 질문에 대한 세 가지 답이라는 걸 알아채는 순간 그 인상은 바뀐다: 에이전트가, 자기가 시작한 일을, 어떻게 끝까지 가져가지?
2026년 5월 7일, v0.12.0에서 정확히 일주일 뒤. 릴리스는 수요일에 떨어졌다. 그 수요일이 끝날 즈음 내 서버의 에이전트는 "놓아주지 않는" 새 방식을 셋 익히고 있었다.
Kanban 보드, 단 대상은 AI 워커
주연 기능은 Multi-Agent Kanban—여러 Hermes 워커가 협업해서 태스크를 집고, 넘기고, 완료시키는 영속화 태스크 보드다. 그 밑의 인프라는 예쁘진 않지만, 예쁘지 않은 그 부분이 핵심이다: 하트비트 모니터링, zombie 감지, 태스크별 리트라이 예산, 원자적 상태 쓰기.
평이한 말로 옮기면: 워커가 작업 중에 죽어도 다른 워커가 받아간다. 게이트웨이가 재시작돼도 보드는 떠난 자리로 돌아온다. 태스크가 연달아 세 번 실패하면 리트라이 예산이 "그만하자" 하고 사람이 볼 수 있게 로그를 남긴다. 이 모든 배관 작업의 목적은 하나—Hermes 인스턴스 다섯 개를 백로그에 겨눠놓고 그대로 자리를 비울 수 있게 하는 것.
이 기능의 다른 절반은, 덜 화려하지만 단일 인스턴스 배포엔 더 쓸모가 있다: 단일 Hermes 인스턴스 자신이 "kanban worker"로서 다중 프로세스 계획에 의미 있게 참여할 수 있게 됐다. 어떤 의미에서 에이전트가 큐 컨슈머가 되는 법을 배운 것. 이건 네가 에이전트한테 합리적으로 맡길 수 있는 일의 종류를 바꾼다.
/goal과 Ralph 루프
/goal 슬래시 커맨드는 에이전트 설계 커뮤니티가 Ralph 루프라고 불러온 그것의 구현이다—사용자가 어떤 한 턴에서 어디로 끌고 가든, 여러 대화 턴을 가로질러 에이전트를 목표에 단단히 물려두는, 오랜 디자인 패턴.
가장 최근 사용자 메시지에 끌려가서 Hermes가 본래 작업에서 벗어나는 걸 잡아본 적이 있다면—"잠깐, 우리가 뭐 하고 있었지?"—/goal이 그걸 고치는 도구다. 세션 시작 시 목표를 한 번 설정하면, 그 뒤 모든 턴이 그 목표에 비추어 평가된다. 에이전트는 우회할 수 있다. 단 목적지를 잊는 건 허락되지 않는다.
일주일 뒤 v0.14.0에 안착할 /subgoal은 도중에 성공 기준을 덧붙일 수 있게 한다. 둘 합치면, 챗 모양 에이전트가 전통적 프로젝트 플랜이 하는 일에 가장 가까워진 형태가 된다: 목표 하나, 중간에 다듬어가며.
Session durability—게이트웨이 재시작이 더는 리셋이 아니다
"시작한 거 끝내기" 시리즈의 세 번째가 session durability다. 게이트웨이 재시작 뒤 대화가 자동으로 이어진다. 컨텍스트와 스레드 라우팅도 보존된다. 내부적으론 checkpoints v2와 원자적 세션 영속화—Kanban의 하트비트 계층과 같은 형태의 작업.
사용자 측에 보이는 동작은 몇 달 전이라면 내가 무진 갈망했을 그 한 줄이다: 게이트웨이 재시작이 더는 대화 리셋을 뜻하지 않는다. 새 릴리스를 당기고 프로세스를 재시작해도, 대화는 멈춘 자리에서 계속된다. 셀프호스트 Hermes의 day-2 운영 이야기가 갑자기 훨씬 쉬워졌다—커널 업데이트로 가끔 자기 혼자 재부팅하는 VPS에서 굴리는 사람한텐, v0.13.0이 에이전트가 그런 일을 더는 신경 쓰지 않게 된 버전이다.
Google Chat, DeepSeek v4 Pro, 그리고 그 모델 물결
Google Chat이 20번째 메시징 플랫폼으로 안착. 같이 들어온 건 제3자 어댑터가 코어 리포지토리 밖에서 출하될 수 있게 하는 플러그블 프로바이더 시스템—v0.11.0 transport 아키텍처 작업과 같은 모양을, 이번엔 게이트웨이 어댑터 층으로 확장한 것이다. 다음 iMessage 클론, 다음 지역 메시징 API, 다음 암호화 채팅 앱—그 어느 것도 코어 머지를 기다릴 필요가 없어졌다.
모델 쪽: DeepSeek v4 Pro, xAI Grok 4.3, OpenRouter Owl-Alpha(무료 티어), Tencent Hy3 Preview가 신규 엔트리. xAI Custom Voices가 음성 클로닝 지원과 함께 TTS에 안착. video 분석 도구가 Gemini와 다른 멀티모달 가능 모델 위에 올라타서, Hermes가 마침내 30초짜리 클립을 정지 프레임 더미가 아니라 영상으로 볼 수 있게 됐다.
"이 프로젝트가 모델 프런티어를 따라가고 있나"의 기준이 "내가 이번 주 시도해 본 모델이 지원되나"라면, v0.13.0은 거의 확실히 통과한다.
국제화가 왔다
CLI와 문서가 일곱 개 로케일로 번역됐다—중국어, 일본어, 독일어, 스페인어, 프랑스어, 우크라이나어, 터키어. 한 줄 bullet 뒤에 산더미 같은 작업이 있다. 지난 석 달 동안 영어 CLI 출력을 읽어왔고 피곤할 때 너의 뇌가 영어를 2외국어로 처리한다면, v0.13.0이 그걸 전환할 수 있게 해주는 그 버전이다.
기록할 가치가 있는 부수효과: CLI 출력이 로컬라이즈됐다는 건 에러 메시지도 로컬라이즈됐다는 뜻이다. 즉 영어가 모국어가 아닌 사용자가 포럼에 에러를 붙였을 때 답글 다는 쪽이 같은 문자열을 본다. 번역은 종종, 의외로 자주, 디버깅 가능성의 이야기이기도 하다.
보안, ACP, 그리고 curator의 아카이브 서브커맨드
P0 취약점 8건 잠금—릴리스 노트가 CVE 번호로 일일이 나열하진 않지만 패턴은 폭넓다: redaction이 다시 기본 ON(v0.12 뒤집기가 되돌려졌다, redactor 자체가 재작업됐기 때문에), Discord 역할 허용 목록을 guild 범위로, WhatsApp이 미지의 연락처를 기본적으로 거부, 인증 시스템의 TOCTOU 윈도우가 닫혔다.
hermes curator archive, prune, list-archived가 v0.12의 curator를 제대로 된 서브커맨드로 형식화했다. /steer와 /queue가 ACP 어댑터(VS Code, Zed, JetBrains)에도 나타난다—에디터에서 Hermes를 쓴다면, 이젠 돌고 있는 에이전트의 방향을 에디터에서 살짝 밀 수 있다. 터미널로 돌아가지 않고도.
"tenacity"가 사실 사주는 것
이 기능들 각각은 단독으로 보면 한동안 릴리스 트래커에 떠 있던 것들이다. 그런데 묶고 보면 사주는 건 같은 한 가지다: 네트워크가 깜빡거리거나, 모델 API가 throttle 되거나, 게이트웨이가 재시작되거나, 사용자가 한눈팔아도, 방금 뭘 하고 있었는지 잊지 않는 Hermes.
에이전트는 늘 똑똑했다. v0.13이 그걸 놓아주지 않는 에이전트로 만들었다. 똑똑함과 놓지 않음은 다른 거다. 똑똑한 에이전트는 중단에서 우아하게 회복한다—종종 옛 태스크의 기억 없이 새 태스크를 시작한다. 놓지 않는 에이전트는 옛 태스크를 끝낸다. Kanban, 목표 락, 세션 재개—다 같은 모양의 기능이다: 예전엔 에이전트를 파괴하던 일들을 살아남는 상태.
---
AI 에이전트 업계는 이번 분기에 대부분 원시적 능력으로 경쟁한다—더 큰 모델, 더 긴 컨텍스트, 더 많은 skill. v0.13.0은 다른 축에서 경쟁한다. 2026년 셀프호스트 에이전트의 진짜 어려운 문제는 "X를 할 수 있냐"가 아니다—"네트워크 이벤트를 가로질러 30분 연속으로 X를 할 수 있냐"다. 에이전트의 실용 품질의 놀랍게 큰 부분이 두 번째 질문의 답 안에 산다.
이 릴리스의 이름이 durability나 reliability가 들어간 뭔가가 아니라 "tenacity"라는 사실 자체가 무언가를 말해준다. tenacity는 사람한테 쓰는 단어다. 팀이 이 에이전트를 사람을 대하는 방식으로 보고 있다는 뜻이다.