How-To Self-Hosting

Cài Hermes Agent lên điện thoại Android bằng Termux

Hermes Agent

Hermes Agent

@hermesagents

March 15, 2026

7 phút đọc

Trong ngăn kéo bàn tôi có một con Pixel 4a cũ đã "chết" với tôi cỡ mười tám tháng. Pin tệ, lưng nứt, khay SIM hơi lỏng. Nhưng nó cũng có CPU tám nhân 2.0 GHz và sáu gig RAM — tức là một máy tính Linux nhỏ hoàn toàn tốt.

Tuần trước tôi sạc nó, cài Termux, rồi nhét Hermes Agent vào. Hai mươi phút sau tôi đang nói chuyện với trợ lý AI từ app Telegram trên bất kỳ điện thoại thật nào trong tay. Bài này kể cách đó hoạt động và vì sao những giới hạn của điện thoại lại là góc nhìn hữu ích để hiểu Hermes.

Thật sự chạy gì trên điện thoại Android

Hermes Agent là chương trình Python. Termux — bản F-Droid, không phải bản Play Store đã lỗi thời — cho bạn không gian người dùng Linux thật trên Android: apt, Python 3, git, ssh, một shell. Vậy là đủ để hầu hết đường cài Hermes chạy y hệt VPS.

Thứ khác biệt trên Android không phải Hermes. Mà là hệ điều hành bao quanh nó.

Android là host thù nghịch với tiến trình nền chạy lâu. Không systemd, không init truyền thống, và trình quản lý pin rất hung hãn — nó sẵn lòng đóng băng bất kỳ tiến trình nào không ở foreground, ngay lúc bạn khóa màn hình. Chạy Hermes thô thì bot Telegram ngừng trả lời ngay khi tắt màn hình.

Mẹo là wakelock helper tích hợp của Termux (termux-wake-lock), lịch sự nhờ Android đừng đụng tiến trình. Kết hợp với tmux hoặc screen để session sống sót khi shell ngắt, cắm sạc, và bạn có server nhỏ luôn bật nằm trong ngăn kéo.

Vì sao Hermes thật sự vừa điện thoại

Hầu hết dự án "trợ lý AI trên điện thoại" đi một trong hai đường. Hoặc ship app mobile khổng lồ bọc lời gọi API (thực chất chỉ là chat client cho agent người khác), hoặc cố chạy model lượng tử hóa nhỏ trên thiết bị và cho bạn thứ chậm và không thông minh lắm. Hermes không đi đường nào.

Thứ bạn thật sự chạy trên điện thoại là gateway Hermes — phần lắng nghe Telegram, Discord, Slack, v.v., quản lý session, và nói chuyện với nhà cung cấp model bạn chọn. Model ngôn ngữ không cần sống trên điện thoại. Bạn cho điện thoại nói chuyện qua HTTPS với Nous Portal, OpenAI, Anthropic, hay bất kỳ provider nào. Việc của điện thoại là làm bộ điều phối nhỏ, rẻ, luôn bật. Việc nặng diễn ra trên cloud, server khác, hay đâu tùy bạn.

Đây là nơi các quyết định kiến trúc từ v0.2.0 âm thầm trả quả trên thiết bị không ai thiết kế Hermes cho. Bộ định tuyến provider tập trung nghĩa là bạn có thể đặt điện thoại dùng model rẻ mặc định (như MiMo miễn phí trên Nous Portal) và chỉ leo lên model mạnh khi cần. Hệ thống manifest skill chỉ tải skill có tiên quyết thật sự tồn tại trên thiết bị — skill tự động hóa trình duyệt sẽ không cố mở Chrome headless trên điện thoại không có. Checkpoint và rollback hệ thống file vẫn hoạt động, vì nó không quan tâm máy bên dưới mạnh cỡ nào.

Mất gì, được gì

Những thứ không chạy trên điện thoại phần lớn hiển nhiên: không cài service systemd (nên dùng tmux, chấp nhận reboot phải khởi động lại gateway bằng tay), không suy luận local nặng, không sandbox tool Docker, và tự động hóa trình duyệt local hạn chế. Skill trình duyệt vẫn chạy được nếu trỏ đến Chrome headless trên máy khác, nhưng Android sẽ không spin Playwright cho bạn.

Đổi lại bạn được mọi thứ hấp dẫn của server nhỏ luôn bật: mặc định có LTE (điện thoại tự có mạng), UPS tích hợp (pin giữ sống hàng giờ khi mất điện), giám sát tích hợp (màn hình pin cho biết server đang làm gì), và im lặng. Không tiếng quạt. Không tốn rack. Tốn điện bằng đèn ngủ.

Ý nghĩa lớn hơn

Điều thú vị khi chạy Hermes trên điện thoại chết không phải là nó chạy được. Mà là nó chạy đúng cách như trên server 200 đô. Một khi agent được tách khỏi máy nó chạy, máy nào cũng không còn quá quan trọng nữa.

Một Pixel 4a chết trong ngăn kéo là nơi ở hoàn toàn tốt cho bot bạn nói chuyện mười lần mỗi ngày. Đó không phải thỏa hiệp. Đó chính là ý tưởng.

Đọc thêm

Cập nhật thường xuyên

Tin tức cộng đồng về bản phát hành, skill mới và tích hợp của Hermes Agent. Không spam, hủy đăng ký bất cứ lúc nào.