Hermes Agent v0.14.0 đáp xuống ngày 16 tháng 5 năm 2026 — đúng chín ngày sau v0.13.0. Đây là bản phát hành lớn nhất trong lịch sử project: 633 PR đã merge, 1.393 file thay đổi, 165.061 dòng được chèn qua 808 commit, 545 issue đóng, 215 contributor trong cửa sổ phát hành. Tag thượng nguồn: v2026.5.16.
Bản thân release notes dài đến hàng nghìn chữ. Phía dưới là 22 điều bạn thực sự muốn biết, gom theo câu hỏi mà chúng trả lời. Mỗi bullet có dẫn nguồn PR ở thượng nguồn để bạn tự kiểm chứng.
---
Cài đặt & phân phối
1. pip install hermes-agent chạy từ PyPI
Sau mười bốn tháng theo lối "curl script này", Hermes đã là một gói PyPI thực sự. Wheel mang theo bundle Ink TUI và shell launcher, nên trải nghiệm đầy đủ ra ngay từ hộp. pipx install hermes-agent cũng chạy. Curl một dòng cũ, Docker, git-clone — tất cả vẫn được hỗ trợ, chỉ là cửa nay mở cho cộng đồng Python. (#26593, cứu vớt #26350)
2. Đợt giảm béo — cài đặt nhẹ hơn
Các backend nặng (adapter Slack / Matrix / Feishu / DingTalk, client hindsight, codex app-server, SDK Pixverse / Camofox / image-gen, nhà cung cấp voice/TTS) giờ cài lazy khi lần đầu dùng. Extra [all] bỏ tất cả những thứ đã được phủ bằng lazy-deps, installer rơi xuống theo các bậc khi wheel không vừa platform của bạn, và một supply-chain advisory checker quét mỗi lần cài tìm phiên bản không an toàn. Footprint nhỏ hơn, cài nhanh hơn, ít lỗ hổng tranzitive hơn. (#24220, #24515, #25014, #25038, #25766, #21818)
3. Native Windows ở early beta
Một đường native Windows hạng nhất đáp xuống xuyên CLI, gateway, TUI và tools. Installer PowerShell với MinGit tự phát hiện/tự cài (~45 MB, không cần admin), nhận diện stub python của Microsoft Store, giữ Ctrl+C ở foreground. Khoảng 40 fix follow-up dành riêng cho Windows đã merge. WSL2 vẫn là đường production được rèn nhiều nhất; cái nhãn "early beta" ở đây làm việc thật. (#21561)
---
Model & nhà cung cấp
4. xAI Grok qua SuperGrok OAuth — và grok-4.3 nhảy lên context 1M token
Nếu bạn trả tiền cho SuperGrok, giờ bạn có thể dùng Grok bên trong Hermes bằng cách đăng nhập tài khoản xAI — không cần API key, không cần billing riêng. Cùng đường nối đó nâng grok-4.3 lên context 1M token, nên bạn có thể nhét cả codebase hay tập tài liệu nghiên cứu vào một prompt. Bao gồm xử lý lỗi entitlement đàng hoàng và một trang docs về SSH-tới-tunnel cho lúc bạn đang SSH vào một máy từ xa và cần hoàn tất luồng OAuth. (#26534, #26664, #26644, #26592)
5. hermes proxy — các gói OAuth của bạn, chạy trên localhost
Chạy hermes proxy và bạn có một endpoint cục bộ http://localhost:port mà nói API OpenAI, đứng sau là OAuth provider nào bạn đang đăng nhập — Claude Pro, ChatGPT Pro, SuperGrok. Codex CLI, Aider, Cline, Continue — mọi thứ chờ một endpoint OpenAI-compatible — chạy ngon với gói bạn đang có, không cần API key. Một gói, mọi tool. (#25969)
6. NovitaAI gia nhập dãy provider
Cloud AI-native với Agent Sandbox giá cố định, model mã nguồn mở (Llama, Qwen, DeepSeek). Cứu vớt #7219. (@kshitijk4poor) (#25507)
7. OpenRouter Pareto Code router với min_coding_score
Pareto router của OpenRouter tự chọn model rẻ nhất đạt một mức chất lượng. Nút mới min_coding_score đặt mức đó riêng cho task code — Hermes route tới model phải-chăng-nhất mà ít nhất giỏi code đến mức đó. Đừng trả tiền cho model top-tier khi mid-tier đã đủ. (#22838)
8. Codex app-server runtime cho model OpenAI / Codex
Runtime tùy chọn lái Codex CLI của OpenAI dưới capô khi bạn đi đường OpenAI hay Codex. Tái sử dụng session, tự đào tẩu session bị kẹt, phân loại OAuth refresh đúng cách — đường ống làm cho các đợt agent dài không bị đổ. (#24182, #25769)
9. Alibaba Cloud đổi tên thành Qwen Cloud
Picker và config giờ dùng brand mà cả thế giới còn lại đang dùng. Các key config cũ vẫn chạy — không breaking — chỉ là UI khớp với brand thật. (#24835)
---
Nền tảng nhắn tin — tổng cộng 22
10. Microsoft Teams — đầu đến cuối
Teams đáp xuống ở v0.12.0 (tháng 3/2026) như nền tảng đầu tiên giao qua plugin. v0.14.0 nối toàn bộ stack Microsoft Graph từ đầu đến cuối: auth + nền tảng client (#21922), webhook listener nhận event Teams (#21969), pipeline plugin runtime (#22007), giao hàng ra ngoài qua adapter sẵn có (#22024). Nối bot một lần, chat từ bất kỳ kênh, DM hay nhóm Teams nào. (Cứu vớt #21408–#21411.)
11. LINE — hạng nhất qua LINE Messaging API chính thức
LINE thống trị ở Nhật, Hàn và Đài Loan. Hermes nay có mặt native ở đó. (#23197)
12. SimpleX Chat — phi tập trung, không user ID
Messenger lấy quyền riêng tư làm trọng tâm, không định danh cố định. Hermes chạy trên đó mà không lộ định danh nào. (#26232 — cứu vớt #2558)
13. Discord backfill lịch sử kênh (mặc định bật)
Khi Hermes vào một kênh hoặc thread lần đầu, nó đọc lịch sử tin nhắn gần đây trước khi trả lời. Không còn "chúng ta đang nói chuyện gì nhỉ?" — agent có cùng ngữ cảnh mà mọi người khác đã thấy trên màn hình. (#25984)
14. UI nút native cho clarify trên Telegram và Discord
Prompt trắc nghiệm giờ hiện như nút native thật của nền tảng. Chạm để trả lời — đặc biệt thoải mái trên điện thoại. (#24199, #25485)
---
Vòng lặp agent & session
15. /handoff thực sự chuyển session đang sống
Giữa cuộc trò chuyện, chuyển sang một model, personality hay profile khác — mọi tin nhắn, mọi tool call, mọi mảnh context đi cùng bạn. Đổi từ model nhanh sang model deep-reasoning giữa lúc debug, hoặc luân chuyển session giữa các profile cho các phần khác nhau của task. (#23395)
16. /subgoal — gắn tiêu chí vào /goal đang sống
/goal Ralph-loop giữ agent chạy đến khi judge chấp nhận tiêu chí thành công. /subgoal <text> xếp thêm tiêu chí giữa chừng không cần restart vòng. (#25449)
17. Footer xác minh thay đổi file theo từng lượt
Sau mỗi lượt mà agent ghi hoặc sửa file, agent nhận một footer ngắn tóm tắt chính xác cái gì đã đổi trên đĩa — đường dẫn, số dòng, delta thật. Tự bắt được lỗi của chính mình khi một lần ghi không đáp xuống hay bị ghi đè âm thầm, thay vì tự tin báo "đã thêm hàm". (#24498)
18. Chẩn đoán semantic LSP trên mỗi lần ghi
write_file và patch giờ chạy một language server thật trên file đã sửa và đẩy lỗi mới trở lại cho agent trước lượt tiếp theo. Lỗi kiểu, biến chưa định nghĩa, thiếu import — bắt ngay tại chỗ. Đi xa hơn rất nhiều so với lint Python/JSON/YAML/TOML cơ bản của v0.13.0 vì đây là phân tích semantic thực sự. (#24168, #25978)
---
Hiệu năng
19. ~19 giây cắt khỏi cold start của hermes
Skills cache + lazy adapter Feishu + deferred imports xuyên đồ thị import + cache-first lookup ở models.dev + doctor check song song + bỏ welcome banner ở chat -q. Màn All-Platforms của hermes tools rơi từ 14 giây xuống dưới 1,5. (#22138, #22120, #22681, #22790, #22808, #22831, #22859, #22904, #22766, #25341)
20. browser_console nhanh hơn 180×
Đi qua WebSocket Chrome DevTools Protocol thường trực của supervisor thay vì mở session mới cho mỗi call. Trước cú này, browser tool call là thao tác chậm nhất của agent. Sau cú này, không còn. Tương tác trang thật cảm giác tức thì. (#23226)
21. Cache prompt Claude một giờ xuyên session
Khi bạn dùng Claude qua Anthropic, OpenRouter hay Nous Portal, prefix prompt (system prompt, skills, memory) cache trong một giờ xuyên session. Bắt đầu một session /new thì câu trả lời đầu về nhanh hơn và rẻ hơn vì cache vẫn còn ấm từ session trước. Background memory review cũng đập vào cache đó. (#23828, #25434, #24778)
---
Đa phương thức
22. vision_analyze trả pixel cho model có khả năng nhìn
Nếu model đang dùng thực sự nhìn được (GPT-5, Claude, Gemini, Grok-vision), vision_analyze nay đẩy pixel thô thẳng vào model thay vì chuyển sang mô tả văn bản trước. Bạn nhận reasoning thị giác thật của model thay vì một vòng tóm tắt bằng chữ bị hạ cấp. (#22955)
---
Điểm thưởng
22 ở trên là các nhịp cấu trúc. Mười hai cái nữa đáng nhắc:
- •
x_search— tool tìm kiếm X (Twitter) hạng nhất, OAuth hoặc API key. (#26763) - •Backend cua-driver cho
computer_use— model vision không-Anthropic giờ có thể lái desktop của bạn, thao tác focus-safe, làm mới khihermes update. (#21967, #24063) - •
video_generatethống nhất với backend provider có thể cắm — model video mới đáp xuống dạng plugin một file. (#25126) - •URL bấm được trong mọi terminal — hyperlink OSC8 thật với highlight khi hover. (@OutThisLife, #25071, #24013)
- •Zed ACP Registry cài một cú qua
uvx, không cần npm. (#26079, #26120, #26234) - •Brave Search + DDGS làm provider tìm kiếm web miễn phí song song với Tavily / SearXNG / Exa. (#21337)
- •9 skill tùy chọn mới — Hyperliquid, Yahoo Finance, api-testing (REST + GraphQL), EVM multi-chain hợp nhất, darwinian-evolver, osint-investigation, pinggy-tunnel, watchers (RSS / HTTP JSON / GitHub polling), và đại tu Notion cho Developer Platform tháng 5/2026. (#23582, #23583, #23590, #25299, #26760, #26729, #26765, #21881, #26612)
- •
huggingface/skillslàm trusted default tap — skill cộng đồng đăng ở đó cài không cần cấu hình thêm. (#26219, đóng #2549) - •Chặn brute-force sudo + đóng ba lối bypass dangerous-command + sanitize lỗi tool (hết prompt injection qua string lỗi). (#23736, #26829, #26823)
- •
/sessionsslash command để duyệt và phục hồi các session trước. (@austinpickett, #20805) - •Plugin
ctx.llm+ cờtool_override— plugin lấy quyền truy cập LLM hạng nhất và có thể thay thế gọn tool tích hợp. (#23194, #26759) - •API server phơi event approval cho các run — các run chạy lâu không còn treo lặng lẽ ở các lệnh cần phê duyệt. (#21899)
---
Con số từ cửa sổ phát hành
| Thước đo | Số lượng |
|---|---|
| PR đã merge | 633 |
| Commit | 808 |
| File thay đổi | 1.393 |
| Dòng được chèn | 165.061 |
| Issue đóng | 545 (12 P0, 50 P1) |
| Contributor | 215 |
| Tag | v2026.5.16 |
| Ngày kể từ v0.13.0 | 9 |
Top contributor cộng đồng (cửa sổ phát hành)
- •@kshitijk4poor — 38 PR (cadence/streaming Telegram, hardening bảo mật, vệ sinh codex-runtime, provider NovitaAI)
- •@alt-glitch — 13 PR (TUI bảng Markdown,
HERMES_SESSION_ID, hindsight-client thành dep tùy chọn) - •@OutThisLife — 12 PR (phân đoạn lượt TUI, tiêu đề link markdown, hyperlink OSC8)
- •@austinpickett — 8 PR (
/sessions, chuyển personality, modal cron) - •@helix4u — 5 PR (setup Google Chat, Ctrl+C Windows)
- •@rob-maron — 4 PR (Nous Portal làm nguồn quyền uy cho metadata model)
---