How-To Self-Hosting

Запуск Hermes Agent на VPS за 5$: практический гайд

Hermes Agent

Hermes Agent

@hermesagents

March 19, 2026

8 мин чтения

Я плачу 5 долларов в месяц за VPS, которая большую часть времени простаивает. 1 ГБ ОЗУ, один разделяемый CPU, 20 ГБ SSD и публичный IPv4. Все хостеры продают примерно такие машины — если ты запускал хоть один маленький персональный проект, у тебя наверняка уже есть одна с запасом мощности.

В прошлом месяце я превратил свою в шлюз Hermes Agent. Теперь он отвечает мне в Telegram, по крону постит резюме в Discord-канал, который я делю с друзьями, мониторит IMAP-ящик — и прямо сейчас потребляет примерно 320 МБ памяти и меньше 2% CPU. За цену чашки кофе — постоянно работающий ассистент.

Эта статья — практический гайд по такой конфигурации, плюс те немногие решения, которые реально важны на маленькой машине.

Что тебе реально нужно

Для Hermes хватит VPS за 5 долларов у любого приличного провайдера (Hetzner, DigitalOcean, Vultr, Linode, Contabo, OVH — в этом ценовом диапазоне все одинаковые). Вот на что смотреть:

  • Минимум 1 ГБ RAM. Python-процесс Hermes после запуска занимает 200-300 МБ. Потоки шлюза Telegram, Discord и Slack каждый добавляют немного. Оставь запас на буферизацию ответов библиотекой языковой модели и на случай, когда инструмент загружает большие данные.
  • Минимум 10 ГБ диска. Hermes, все зависимости, база сессий, история cron и логи комфортно укладываются в 5 ГБ. Остальное — запас.
  • Исходящий HTTPS. Это единственное сетевое требование. Hermes не нуждается в открытых входящих портах, если ты не запускаешь опциональный OpenAI-совместимый API-сервер или Telegram-адаптер в режиме webhook вместо поллинга.
  • Современный Linux-дистрибутив с systemd. Ubuntu 22.04 или 24.04 — беспроблемный дефолт. Debian 12 тоже подходит. Мастер установки шлюза использует systemd для регистрации Hermes как постоянного системного или пользовательского сервиса.

В этом списке примечательно отсутствуют: GPU, какая-то конкретная архитектура CPU (Hermes нормально работает на AMD, Intel и ARM64 VPS), доменное имя, реверс-прокси и вообще что-либо ещё. Шлюз по умолчанию только исходящий.

Установка и что она делает

Первая команда — hermes setup. Это мастер — он спрашивает, какого провайдера использовать (OpenRouter, Nous Portal, Anthropic, OpenAI, Hugging Face или локальный/кастомный эндпоинт), помогает вставить API-ключ, даёт выбрать модель по умолчанию и записывает результат в ~/.hermes/config.yaml.

Второй важный шаг на маленькой машине — hermes gateway install. Эта команда превращает Hermes в systemd-сервис, который переживает перезагрузки и автоматически перезапускается при падениях. Можно выбрать пользовательский scope (сервис работает от твоего пользователя, sudo не нужен) или системный (сервис стартует до логина, полезно для headless-серверов). На VPS за $5 обычно нужен пользовательский scope. На headless-системах Hermes автоматически включает systemd linger, чтобы сервис продолжал работать после отключения.

Дальше hermes gateway enable telegram (или discord, slack, signal, matrix и т.д.) подключает платформу. Каждый адаптер — плагин: можно запустить одну платформу или все восемь разом; потребление памяти каждой дополнительной платформы невелико — несколько МБ Python-объектов плюс буферы SDK самой платформы.

Решения, которые реально важны на маленьком сервере

Три выбора определяют, будет ли опыт хорошим на дешёвом VPS.

Выбор модели. Потребление памяти агентом на VPS не зависит от размера модели, потому что инференс не происходит на этой машине. Но задержка и стоимость каждого ответа зависят. Оптимум для персонального шлюза — обычно средняя быстрая модель (Claude Sonnet, GPT-4.1 mini, Gemini Flash или бесплатный MiMo v2 Pro на Nous Portal для вспомогательных задач) по умолчанию, с командой /model для переключения на более мощную по запросу. Смена модели в реально�� времени означает, что это можно сделать прямо из разговора, ничего не перезапуская.

Сжатие контекста. Дефолт подходит. Hermes проактивно сжимает историю разговора, когда окно контекста заполняется, и сжатое резюме кэшируется. На маленьком VPS это важно, потому что сжатие контекста работает локально и ест CPU — если оставить его включённым, длинные разговоры остаются быстрыми и ты случайно не сожжёшь весь бюджет токенов за один ход.

Пул учётных данных. Если у тебя несколько API-ключей (обычное дело при совместном использовании аккаунта провайдера с друзьями или ротации бесплатных тарифов), Hermes умеет автоматически ротировать ключи одного провайдера при rate limit или ошибке 401. На маленьком VPS это фактически превращает N бесплатных тарифов в один всегда доступный ключ — именно то, что нужно для постоянно работающего ассистента.

Почему это вообще работает

VPS за $5 может хостить настоящего ИИ-ассистента не потому, что Hermes героически оптимизирован. А потому, что архитектура делегирует тяжёлую часть — языковую модель — кому-то другому, оставляя локально только координацию, память и логику выполнения инструментов. Именно это разделение делает месячную стоимость разумной, а крошечную машину — достаточной.

Раньше самостоятельный хостинг ассистента озн��чал запуск модели. Больше нет. Теперь это означает запуск того, что говорит модели, что делать.

Подробнее

Поделиться в:
star Star on GitHub

Будь в курсе

Новости сообщества о релизах Hermes Agent, новых навыках и интеграциях. Без спама, отписаться можно в любой момент.