2026년 4월 8일 아침, 나는 일어나서 최신 Hermes Agent 빌드를 땡겨 왔다. 그날의 첫 세션을 반쯤 진행했을 때, 이 친구는 내가 이전엔 본 적 없는 일을 했다. 나는 로그 더미에서 특정 에러 패턴을 찾아 달라고 시켰다. 에이전트는 grep을 돌렸고, 아무것도 안 잡혔고, 잠깐 멈추더니 이렇게 말했다. "이 패턴은 원본 출력에는 없네요 — 대신 압축된 아카이브 쪽에서 찾아볼게요." 그리고 그 말이 맞았다.
이런 장면에 나는 아마 완전히는 익숙해지지 못할 거다. 그런데 v0.8.0이 v0.7.0과 사실상 다른 릴리스처럼 느껴지는 이유의 상당수는 바로 저런 것 — 에이전트가 자기 일에 대해 어떻게 추론하는지에 붙은 작고 눈에 안 띄는 들어올림 — 이다. 릴리스 노트는 이 판본을 the intelligence release라고 부른다. 마케팅 카피가 아니라, 실제로 무엇이 바뀌었는지를 그대로 기술한 거다.
헤드라인 — Hermes가 자기 자신의 툴 사용 가이던스에 패치를 붙였다
v0.8.0에서 제일 흥미로운 PR은 #6120이다. 제목은 "자동 행동 벤치마킹을 통한 GPT/Codex 툴 사용 가이던스 자기 최적화". 이게 뭘 한 건지 짧게 풀어 쓰면 이렇다. 이 프로젝트는 자동 벤치마킹 루프를 짜서 GPT와 Codex 모델을 찔러 보고, 이들이 툴을 호출할 때 보이는 다섯 가지 구체적인 실패 모드를 식별하고, 그 실패를 고칠 맞춤형 가이던스 문자열을 생성하고, 개선 폭을 측정한 다음, 결과를 시스템 프롬프트의 일부로 출하했다. 에이전트가 스스로를 진단하고 스스로에게 패치를 붙인 거다 — 인간은 프롬프트 엔지니어가 아니라 리뷰어로 루프 안에 앉아 있었다.
그와 함께 v0.8.0은 시스템 프롬프트에 실행 규율 가이던스(#5414)와, 구조화된 추론 응답을 위한 생각 전용 프리필 이어 쓰기(#5931)를 추가했다. 당신이 Hermes를 GPT-5나 Codex로 돌리고 있다면, 4월 8일 아침에 마주친 에이전트는 4월 7일 밤에 당신이 재워 둔 에이전트보다 체감상 꽤 더 똑똑하다. 문장으로 적어 놓고 보니 희한한 말이긴 하다.
모든 플랫폼에서 쓰는 라이브 모델 전환
두 번째 헤드라인은 /model 커맨드(#5181, #5742)다. 이제 당신은 CLI, 텔레그램, 디스코드, 슬랙, 또는 어느 게이트웨이 플랫폼에서든 세션 도중에 모델과 프로바이더를 바꿀 수 있다. 리졸버는 애그리게이터를 이해한다. 당신이 OpenRouter나 Nous Portal에 붙어 있고 원하는 모델이 거기에 있으면 애그리게이터에 그대로 남겨 두고, 거기에 없으면 직결 프로바이더로 건너뛴다. 텔레그램과 디스코드에는 인라인 버튼 기반의 인터랙티브 피커가 붙었다 — 원하는 모델을 탭하면 되지, 이름을 손으로 칠 필요가 없다.
이 기능을 v0.7.0의 자격 증명 풀과 v0.6.0의 폴백 체인에 포개면, 이전 글에서 얘기한 "프로바이더에 종속되지 않는" 이야기가 이제 완결된다. 당신은 아무것도 재시작하지 않고 모델 라인업을 쌓고, 부수고, 다시 쌓을 수 있다.
무료 Gemini, 무료 MiMo
프로바이더 두 개가 크게 붙었다. 네이티브 Google AI Studio (Gemini)가 퍼스트 클래스 프로바이더로 들어왔고(#5577), models.dev 레지스트리에 자동 연동돼서 실시간 컨텍스트 길이 감지를 해 준다. 그리고 Nous Portal 위의 무료 티어 샤오미 MiMo v2 Pro(#6018)가 압축, 비전, 요약 같은 보조 작업용으로 들어왔다. 지갑이 피곤해서 Hermes를 미뤄 두고 있던 사람이라면, 이번 주 무료 티어는 체감상 꽤 쓸 만해졌다.
백그라운드 작업 완료 알림
notify_on_complete는 터미널 사용법 자체를 새로 빚어 놓는 작은 변경이다. 이제 백그라운드 작업이 끝나면 에이전트한테 자동으로 통지가 간다. 학습 실행이나 테스트 스위트, 빌드, 배포를 걸어 놓으면 에이전트는 가서 다른 일을 한다. 백그라운드 작업이 끝나면 에이전트가 ping을 받고 결과를 주워 간다. 폴링도 없고 "다 끝났어?" 루프도 없다.
무활동 타임아웃, 승인 버튼, 그리고 나머지 목록
따로 언급할 가치가 있는 변경이 두 개 더 있다. 첫째, 무활동 기반 에이전트 타임아웃(#5389, #5440)이다. 이제 게이트웨이와 cron 타임아웃은 벽시계 시간이 아니라 실제 툴 활동을 따라간다. 진짜로 일하고 있는 장시간 작업은 절대 잘리지 않는다 — 정말로 놀고 있는 세션만 타임아웃된다. 이건 cron 기반 에이전트의 가장 짜증 나는 버릇 — 진짜 일이 한창일 때 한 삽에 묻혀 버리는 것 — 을 고쳐 준다.
둘째, 슬랙과 텔레그램의 승인 버튼(#5890, #5975)이다. 위험 커맨드 승인을 더 이상 /approve라고 타이핑할 필요가 없다 — 플랫폼 네이티브 버튼을 탭하면 된다. 슬랙 쪽에는 스레드 컨텍스트 보존이 붙었고, 텔레그램 쪽 승인 상태는 이모지 반응으로 표시된다.
그리고 각각이 자기 블로그 글을 가질 자격이 있는 잡다한 것들: MCP OAuth 2.1 PKCE 인증(#5420), MCP 확장 패키지에 대한 OSV 악성코드 스캔(#5305), 리액션과 읽음 확인을 갖춘 Matrix 티어 1 동등 지원(#5275), ~/.hermes/logs/로 떨어지고 hermes logs 커맨드가 달린 중앙화 구조화 로그(#5430), 기동 시점에 도는 설정 구조 검증(#5426), 그리고 SSRF, 타이밍 공격, tar 경로 순회, 자격 증명 유출에 걸친 한 차례 보안 강화 패스(#5944, #5613).
숫자로 보면
머지된 PR 209개. 해결된 이슈 82개. 릴리스 한 번. v0.7.0에서 닷새 뒤.
이 숫자를 보고 뭔가 어긋났다는 느낌이 든다면 — 5일이라는 창에 변경 209건은 아무리 봐도 과하다 — 제대로 읽은 거다. 그게 요점이다. 이 프로젝트가 만들어지는 방식의 어딘가가, 이런 종류의 속도를 지속 가능하게 만들고 있다. 언젠가는 왜 그런지를 얘기해야 할 거다. 그건 다음 글의 주제다.