Deep Dive For Power Users

Kiến trúc bộ nhớ Hermes Agent: Honcho và giao diện bộ nhớ tháo lắp được

Hermes Agent

Hermes Agent

@hermesagents

March 29, 2026

9 phút đọc

Hầu hết giao diện AI chat bạn từng dùng không thật sự có bộ nhớ. Chúng có cửa sổ ngữ cảnh, là thứ rất khác. Những gì bạn nói trước đó trong cùng cuộc trò chuyện vẫn ở trước model. Những gì nói hôm qua thì biến mất. Ngày mới bắt đầu từ số không, trợ lý lại tự giới thiệu như người lạ.

Hermes Agent khác. Nó có lớp bộ nhớ thật — tách biệt khỏi ngữ cảnh hội thoại — học về bạn theo thời gian, mang theo qua các phiên và nền tảng, và làm bot cư xử như cùng một thực thể mỗi lần nói chuyện. Bài này về cách nó thật sự hoạt động, quyết định nào quan trọng, và giao diện bộ nhớ tháo lắp v0.7.0 thay đổi gì.

Bộ nhớ ngắn hạn vs dài hạn

Phân biệt quan trọng trước.

Bộ nhớ ngắn hạn là cửa sổ ngữ cảnh session. Là lát cắt lịch sử hội thoại agent đang có, quản lý bằng chiến lược nén chủ động: khi ngữ cảnh gần giới hạn model, Hermes chạy lượt tóm tắt thu gọn lượt cũ thành bản tóm tắt có cấu trúc trong khi giữ nguyên trao đổi gần nhất. Nén được tinh chỉnh qua nhiều bản phát hành — tóm tắt có cấu trúc với cập nhật lặp trong v0.4.0, bảo vệ đuôi theo budget token, endpoint tóm tắt tùy chỉnh và hỗ trợ model dự phòng. Trên hội thoại dài, nó âm thầm giữ agent nhanh và rẻ mà không bỏ ngữ cảnh quan trọng.

Bộ nhớ dài hạn mới là phần thú vị. Kho sự kiện, sở thích, chỉnh sửa và mô hình người dùng sống ngoài cuộc trò chuyện. Khi bạn nói "tôi tên Alice" trên Telegram hôm nay, dữ kiện đó ghi vào bộ nhớ dài hạn. Ngày mai hỏi gì đó trên Slack, dữ kiện được kéo ra và tiêm vào ngữ cảnh trước khi agent thấy tin nhắn. Model vẫn chỉ nhận vừa cửa sổ, nhưng cửa sổ được mồi bằng những thứ nó nên biết về bạn.

Bộ nhớ ngắn hạn là buffer. Bộ nhớ dài hạn là con người.

Honcho: nó là gì và vì sao quan trọng

Provider bộ nhớ dài hạn mặc định trong Hermes là Honcho, thư viện được xây riêng cho bộ nhớ AI-native. Công việc của Honcho là chạy sau agent và làm ba việc:

  1. 1.Quan sát. Mọi tin nhắn user và phản hồi agent được đưa vào Honcho như luồng sự kiện. Honcho xây mô hình người dùng nội bộ — không phải lịch sử chat thô, mà sự kiện và sở thích có cấu trúc suy ra từ hội thoại.
  2. 2.Suy luận về người dùng. Honcho chạy lớp "biện chứng" nhỏ cố xây bức tranh mạch lạc về bạn là ai, muốn gì và đã chỉnh sửa gì. Không chỉ trích xuất từ khóa — mà là mô hình tâm lý liên tục về người dùng.
  3. 3.Tiêm. Mỗi lượt mới, Honcho tạo đoạn ngữ cảnh ngắn tóm tắt điều nó nghĩ quan trọng về user, Hermes gắn trước system prompt. Đoạn này thay đổi khi Honcho học thêm.

Hai chi tiết đáng chú ý vì dễ bỏ qua.

Thứ nhất, ghi Honcho là bất đồng bộ. Agent không chặn trên ghi bộ nhớ. Nó trả lời, lớp bộ nhớ xử lý trao đổi ở nền. Hội thoại dài không trả thuế độ trễ cho cập nhật bộ nhớ, và sự cố backend bộ nhớ không dừng bot — bạn mất cập nhật trong lúc sự cố, nhưng trợ lý vẫn nói chuyện.

Thứ hai, recall Honcho được giữ ngoài phần system prefix đã cache. Tính năng cache prompt Anthropic (dùng nhiều trên model như Claude Sonnet 4.6) muốn system prompt ổn định giữa các lượt để cache trúng. Đoạn tiêm Honcho thay đổi mỗi lượt, nên Hermes cố ý gắn sau phần system đã cache. Cache vẫn hoạt động cho phần tĩnh; lớp bộ nhớ động vẫn hoạt động cho phần thay đổi. Loại đánh đổi cơ học không vào release notes nhưng quyết định hóa đơn hàng tháng 50 đô hay 500 đô.

Cô lập đa user trong chế độ gateway

Gateway Hermes mặc định chạy nhiều user qua cùng tiến trình agent. Bộ nhớ dài hạn phải theo user, nếu không dị ứng Alice sẽ rơi vào gợi ý nấu ăn Bob. v0.3.0 thêm cô lập đa user cho Honcho trong gateway:

  • Mỗi user ID gateway ánh xạ đến Honcho peer riêng, ghi bộ nhớ theo phạm vi peer.
  • Session chat nhóm kế thừa session theo user mặc định, nên kênh chung vẫn ghi luồng bộ nhớ riêng cho mỗi người tham gia.
  • Cô lập bộ nhớ theo profile (v0.5.0/v0.6.0) nghĩa là chạy nhiều profile Hermes trên cùng máy, bộ nhớ mỗi profile là vũ trụ riêng. Đổi profile không rò rỉ nhân cách này sang nhân cách khác.

Người dùng không thấy gì trong số này. Tất cả là lý do bot không vô tình nhớ nhầm người.

Giao diện bộ nhớ tháo lắp (v0.7.0)

Năm bản đầu của Hermes, Honcho được gắn cứng. v0.7.0 tái cấu trúc lớp bộ nhớ thành interface provider — ABC Python nhỏ mà bất kỳ backend bộ nhớ nào cũng triển khai được. Thay đổi nhỏ về kiến trúc, to khổng lồ trong thực tế.

Interface cho phép đổi backend bộ nhớ mà không đụng lõi Hermes:

  • Honcho là provider tham chiếu (và vẫn mặc định). Đầy đủ tính năng, chạy mô hình user thật, xử lý cô lập đa user đúng.
  • Supermemory được thêm trong v0.8.0 như provider hạng nhất thứ hai, hỗ trợ đa container, chế độ tìm kiếm tùy chỉnh và templating danh tính.
  • mem0, OpenViking, RetainDB, HindsightByteRover đều có plugin bộ nhớ cộng đồng trong hệ thống plugin Hermes.
  • Bạn cũng viết được riêng. ABC nhỏ: triển khai write(), recall(), vài lifecycle hook, đăng ký plugin.

Provider bộ nhớ tích hợp — mặc định không dependency nếu chưa cài gì — là kho sự kiện SQLite xử lý cơ bản: ghi sự kiện, recall theo độ liên quan, phạm vi theo user. Không thông minh bằng Honcho, nhưng không cần dịch vụ ngoài, và cho trợ lý cá nhân trên VPS 5 đô thường là đủ.

Điều lặng lẽ mà nó mở khóa

Bộ nhớ tháo lắp là loại thay đổi kiến trúc trông như dọn nhà trong release notes. "Tái cấu trúc bộ nhớ thành interface provider" không phải tiêu đề. Thứ nó thật sự làm là tách câu hỏi "trợ lý AI nên nhớ gì về bạn" khỏi câu hỏi "Hermes hoạt động thế nào."

Giờ bạn thay Honcho bằng backend bộ nhớ phù hợp use case — vector store cho ai muốn tìm kiếm ngữ nghĩa trên knowledge base cá nhân, graph database cho ai muốn quan hệ thực thể rõ ràng, kho SQLite thuần local cho ai không muốn dữ liệu bộ nhớ rời khỏi máy, dịch vụ bộ nhớ nội bộ công ty cho team. Agent không đổi. Chỉ thứ sau interface memory thay đổi.

Đó là abstraction đúng cho dự án muốn tồn tại vài năm. Bộ nhớ là cá nhân, và backend bộ nhớ đúng cho bạn không nhất thiết đúng cho ai khác. Việc Hermes là công dân tốt với bất kỳ lớp bộ nhớ nào bạn cắm vào, và tránh đường nó.

Đọc thêm

Cập nhật thường xuyên

Tin tức cộng đồng về bản phát hành, skill mới và tích hợp của Hermes Agent. Không spam, hủy đăng ký bất cứ lúc nào.