How-To Self-Hosting

Chạy Hermes Agent trên VPS 5 đô: hướng dẫn thực tế

Hermes Agent

Hermes Agent

@hermesagents

March 19, 2026

8 phút đọc

Tôi trả 5 đô mỗi tháng cho VPS gần như không làm gì. Một gig RAM, một CPU chia sẻ, hai mươi gig SSD, một địa chỉ IPv4 công khai. Nhà cung cấp VPS nào cũng bán cỗ máy kiểu này, và nếu bạn từng chạy dự án cá nhân nhỏ thì chắc đã có một con đang nằm rỗi.

Tháng trước tôi biến nó thành gateway Hermes Agent. Giờ nó trả lời tôi trên Telegram, chạy cron job đăng tóm tắt lên kênh Discord chia sẻ với bạn bè, canh hộp thư IMAP, và hiện tại — lúc tôi gõ dòng này — ngốn khoảng 320 megabyte RAM với dưới 2% CPU. Giá một ly cà phê, tôi có trợ lý luôn bật.

Bài này là hướng dẫn thực tế cho cách thiết lập, và vài quyết định thật sự quan trọng trên máy nhỏ.

Bạn thật sự cần gì

Cho Hermes, gói VPS 5 đô từ bất kỳ nhà cung cấp uy tín nào (Hetzner, DigitalOcean, Vultr, Linode, Contabo, OVH — đều bán cùng thứ với giá gần nhau) là đủ. Các con số cần chú ý:

  • Ít nhất 1 GB RAM. Tiến trình Python của Hermes chiếm khoảng 200-300 MB sau khởi động. Thread gateway Telegram, Discord và Slack thêm overhead nhỏ. Để dư cho thư viện API model buffer response, và cho tool thỉnh thoảng tải dữ liệu lớn.
  • Ít nhất 10 GB ổ đĩa. Hermes, tất cả dependency, database session, lịch sử cron và log nằm thoải mái trong dưới 5 GB. Phần còn lại là dự phòng.
  • HTTPS đi ra ngoài. Đây là yêu cầu mạng duy nhất. Hermes không cần mở cổng đến trừ khi bạn chạy API server tương thích OpenAI tùy chọn hoặc adapter Telegram ở chế độ webhook thay vì polling.
  • Bản phân phối Linux hiện đại có systemd. Ubuntu 22.04 hoặc 24.04 là lựa chọn an toàn. Debian 12 cũng được. Trình hướng dẫn gateway service dùng systemd đăng ký Hermes như service hệ thống hoặc người dùng lâu dài.

Đáng chú ý không có trong danh sách: GPU, kiến trúc CPU cụ thể (Hermes chạy tốt trên VPS AMD, Intel và ARM64), tên miền, reverse proxy, hay gì khác. Gateway mặc định chỉ kết nối ra ngoài.

Cài đặt, và nó làm gì

Lệnh đầu tiên là hermes setup. Đây là trình hướng dẫn — hỏi bạn dùng provider nào (OpenRouter, Nous Portal, Anthropic, OpenAI, Hugging Face, hoặc endpoint local/tùy chỉnh), giúp dán API key, chọn model mặc định, và ghi kết quả vào ~/.hermes/config.yaml.

Bước thứ hai quan trọng trên máy nhỏ là hermes gateway install. Lệnh này biến Hermes thành service systemd, sống sót qua reboot và tự khởi động lại khi crash. Bạn chọn user scope (service chạy như user đăng nhập, không cần sudo) hoặc system scope (service khởi chạy trước login, hữu ích cho máy headless). Trên VPS 5 đô, user scope thường là thứ bạn muốn. Trên hệ thống headless, Hermes tự bật systemd linger để service tiếp tục chạy sau khi ngắt kết nối.

Từ đó, hermes gateway enable telegram (hoặc discord, slack, signal, matrix, v.v.) thêm nền tảng. Mỗi adapter là plugin — bạn chạy một nền tảng hoặc cả tám cùng lúc; chi phí bộ nhớ cho mỗi nền tảng thêm rất nhỏ, vài MB đối tượng Python cộng buffer SDK nền tảng.

Những quyết định thật sự quan trọng trên máy nhỏ

Ba lựa chọn quyết định trải nghiệm trên VPS rẻ.

Chọn model. Footprint bộ nhớ agent trên VPS không phụ thuộc kích thước model, vì suy luận không diễn ra trên máy. Nhưng độ trễ và chi phí mỗi response thì có. Điểm ngọt cho gateway cá nhân thường là model nhanh cỡ trung (Claude Sonnet, GPT-4.1 mini, Gemini Flash, hoặc MiMo v2 Pro miễn phí trên Nous Portal cho tác vụ phụ) dùng mặc định, với lệnh /model sẵn sàng leo lên model lớn hơn khi cần. Đổi model ngay lúc chạy nghĩa là bạn làm điều này từ trong cuộc trò chuyện mà không cần restart.

Nén ngữ cảnh. Mặc định là ổn. Hermes chủ động nén lịch sử hội thoại khi cửa sổ ngữ cảnh đầy, và bản tóm tắt nén được cache. Trên VPS nhỏ điều này quan trọng vì nén ngữ cảnh chạy local và dùng CPU — để nén bật nghĩa là hội thoại dài vẫn nhanh và không vô tình đốt hết budget token trong một lượt.

Gom credential. Nếu bạn trả cho nhiều API key (phổ biến khi chia sẻ tài khoản provider với bạn bè hoặc xoay giữa các tier miễn phí), Hermes có tính năng gom credential cùng provider, tự xoay key khi bị rate limit hoặc lỗi 401. Trên VPS nhỏ, điều này biến N tier miễn phí thành một key luôn khả dụng — đúng thứ bạn cần cho trợ lý luôn bật.

Vì sao nó chạy được

Lý do VPS 5 đô host được trợ lý AI thật không phải Hermes được tối ưu anh hùng. Mà là kiến trúc ủy phần khó nhất — model ngôn ngữ — cho bên khác, và chỉ giữ lại logic điều phối, bộ nhớ và thực thi công cụ ở local. Sự phân tách đó khiến chi phí hàng tháng hợp lý và máy nhỏ vẫn đủ.

Self-host trợ lý từng có nghĩa chạy model. Giờ không còn. Nó có nghĩa chạy thứ bảo model phải làm gì.

Đọc thêm

Cập nhật thường xuyên

Tin tức cộng đồng về bản phát hành, skill mới và tích hợp của Hermes Agent. Không spam, hủy đăng ký bất cứ lúc nào.