How-To Self-Hosting

5 美元 VPS 上跑 Hermes Agent:一份实操指南

Hermes Agent

Hermes Agent

@hermesagents

2026年3月19日

8 分钟阅读

我每月花 5 美元养一台 VPS,大部分时间它啥也不干。1 GB 内存、一颗共享 CPU、20 GB SSD,外加一个公网 IPv4。每家 VPS 厂商都卖差不多这规格的机器——如果你跑过任何一个小个人项目,大概率手边已经有一台还剩余量的在待命。

上个月我把自己那台改成了 Hermes Agent 网关。它现在会在 Telegram 里回我,按 cron 定时往我和朋友共享的 Discord 频道里贴总结,盯着一个 IMAP 收件箱——写这段话的此刻——吃着大约 320 MB 内存和不到 2% 的 CPU。一杯咖啡的钱,我就有了一个常开的助手。

这篇文章是这套设置的实操指南,也捎上在小机器上真正要紧的那几个决定。

你到底需要什么

要跑 Hermes,任何一家靠谱厂商(Hetzner、DigitalOcean、Vultr、Linode、Contabo、OVH——价格都差不多的那种)的 5 美元档 VPS 就够了。要看的数字是:

  • 至少 1 GB 内存。 Hermes 的 Python 进程启动后本身就占 200-300 MB。Telegram、Discord、Slack 这些网关线程每个会再加一点。再给语言模型 API 库缓冲响应留点余量,偶尔有工具加载较大数据时也要有空间。
  • 至少 10 GB 磁盘。 Hermes、所有依赖、会话数据库、cron 历史和日志文件加起来舒舒服服装在 5 GB 以下,剩下的是余量。
  • 能向外走 HTTPS。 这是唯一的网络要求。Hermes 默认不需要对外开入站端口,除非你要跑可选的 OpenAI 兼容 API 服务器,或者把 Telegram 适配器从轮询模式换成 webhook 模式。
  • 带 systemd 的现代 Linux 发行版。 Ubuntu 22.04 或 24.04 是最省心的默认选择。Debian 12 也行。网关服务向导会用 systemd 把 Hermes 注册成一个常驻的系统或用户服务。

这份清单里明显缺席的东西:GPU、某种特定的 CPU 架构(AMD、Intel、ARM64 的 VPS 上 Hermes 都跑得好)、域名、反向代理,或者任何别的。网关默认只走出站。

安装过程,以及它做了什么

第一条命令是 hermes setup。这是个向导——它问你要用哪家服务商(OpenRouter、Nous Portal、Anthropic、OpenAI、Hugging Face,或者本地/自定义端点),引你把 API key 粘进去,让你选一个默认模型,再把结果写进 ~/.hermes/config.yaml

在小机器上第二条重要的命令是 hermes gateway install。这条命令会把 Hermes 变成一个 systemd 服务,重启能自己起,崩了也能自动拉回。你可以选 user 作用域(服务以你的登录用户身份跑,不用 sudo)或 system 作用域(服务在登录前就启动,适合无头机器)。5 美元 VPS 上,你一般想要的是 user 作用域。对无头系统,Hermes 会自动启用 systemd linger,所以你断开连接之后服务也能继续跑。

接下来,hermes gateway enable telegram(或者 discordslacksignalmatrix 之类)就能加上一个平台。每个适配器都是插件——你可以只跑一个平台,也可以八个一起跑。每多挂一个平台的内存开销很小:几 MB 的 Python 对象,再加上那个平台 SDK 自己要做的缓冲。

在小盒子上真正要紧的那几个决定

在便宜 VPS 上,有三个选择直接决定体验好坏。

模型选择。 Agent 在 VPS 上吃多少内存和模型大小无关,因为推理根本不在这台机器上跑。但每次响应的延迟和成本都跟模型有关。个人网关的甜蜜点通常是一个中等大小的快模型(Claude Sonnet、GPT-4.1 mini、Gemini Flash,或者 Nous Portal 上免费的 MiMo v2 Pro 跑辅助任务)当默认,需要时用 /model 命令升级到更大的模型。运行时切模型意味着你在对话里就能切,不用重启任何东西。

上下文压缩。 默认值就挺好。Hermes 会在上下文窗口快满的时候主动压缩对话历史,压完的摘要会缓存。这件事在小 VPS 上有意义,因为上下文压缩是在本地跑的、吃 CPU——让压缩开着意味着长对话依然跑得快,也不会一次手滑把整个 token 预算烧光。

凭据池。 如果你手里有好几把 API key(跟朋友合租服务商账号、或者在多个免费档之间轮换的人经常这样),Hermes 有一个同服务商凭据池特性,会在限流或 401 错误时自动换下一把。在小 VPS 上,这相当于把 N 个免费档合成一把永远可用的 key,这正是一个常开助手想要的效果。

这件事为什么行得通

一台 5 美元的 VPS 能托管一个真正的 AI 助手,原因不是 Hermes 被英勇地优化过。原因是架构把最重的那块——语言模型——外包给了别人,只把协调、记忆和工具执行这几块留在本地。就是这一刀切分让月费变得合理,也让一台很小的机器就足够用。

过去自托管一个助手的意思是你得自己跑一个模型。现在不是了。现在的意思是跑那个负责告诉模型该干什么的东西。

延伸阅读

别掉队

Hermes Agent 的版本更新、新 skill、新集成——社区第一手消息。不发垃圾邮件,随时可以退订。