Tem um Pixel 4a velho na minha gaveta que estava morto pra mim havia uns dezoito meses. Bateria ruim, traseira trincada, bandeja do SIM com a dobradiça meio frouxa. Mas também um CPU octa-core de 2.0 GHz e seis gigabytes de RAM — ou seja, um computador Linux pequeno e perfeitamente utilizável.
Semana passada eu carreguei, instalei o Termux e coloquei o Hermes Agent nele. Vinte minutos depois eu já estava conversando com um assistente de IA pelo app do Telegram em qualquer celular real que estivesse comigo. Este post é sobre como isso funciona e por que as limitações de um celular são na verdade uma lente útil pra entender o que o Hermes é.
O que de fato roda num celular Android
O Hermes Agent é um programa Python. O Termux — a build do F-Droid, não aquela velha da Play Store — te dá um userland Linux de verdade no Android: apt, Python 3, git, ssh, um shell. Isso basta pra quase todo o caminho de instalação do Hermes funcionar igual numa VPS.
O que é diferente no Android não é o Hermes. É o sistema operacional ao redor dele.
O Android é um host hostil pra processos de background de longa duração. Não tem systemd, não tem init tradicional, e o gerenciador de energia é agressivo — ele congela com prazer qualquer processo que não esteja em primeiro plano na tela, e faz isso no instante em que você bloqueia o celular. Rode o Hermes sem preparação e seu bot do Telegram para de responder no segundo em que o display apaga.
O truque é o helper de wakelock nativo do Termux (termux-wake-lock), que pede educadamente ao Android pra deixar seu processo em paz. Combine com tmux ou screen pra a sessão sobreviver a desconexões do shell, aponte o celular pra um carregador, e você tem um servidor pequeno, sempre ligado, morando dentro da sua gaveta.
Por que o Hermes realmente cabe num celular
A maioria dos projetos de "assistente de IA no celular" segue um de dois caminhos. Ou mandam um app mobile gigante que faz wrap numa chamada de API (que no fundo é só um chat client do agente de outra pessoa), ou tentam rodar um modelo quantizado pequeno direto no dispositivo e te entregam algo lento e pouco esperto. O Hermes não faz nenhum dos dois.
O que você roda de verdade no celular é o gateway do Hermes — a parte que escuta no Telegram, Discord, Slack e afins, gerencia sessões e conversa com o provedor de modelo de linguagem que você escolher. O modelo de linguagem em si não precisa morar no celular. Você pode fazer o celular falar com Nous Portal, OpenAI, Anthropic ou qualquer outro provedor via HTTPS. O trabalho do celular é ser um coordenador minúsculo, barato e sempre ligado. O trabalho pesado acontece na nuvem, ou em outro servidor, ou onde você quiser.
É aqui que as decisões de arquitetura da v0.2.0 pagam dividendos silenciosos num dispositivo pra o qual ninguém projetou o Hermes. O roteador centralizado de provedores permite configurar o celular pra usar um modelo barato por padrão (tipo o MiMo gratuito no Nous Portal) e escalar pra um modelo mais forte só pra tarefas difíceis. O sistema de manifesto de skills só carrega skills cujos pré-requisitos de fato existem no dispositivo — nenhum skill de automação de browser vai tentar subir um Chrome headless num celular que não tem um. O mecanismo de checkpoint e rollback do sistema de arquivos continua funcionando, porque ele não liga pro quão musculosa é a máquina embaixo dele.
O que você perde, o que ganha de volta
O que não funciona num celular é na maioria óbvio: sem install de serviço systemd (então você usa tmux, e aceita que um reboot significa reiniciar o gateway na mão), sem inferência local pesada, sem sandboxes de ferramentas baseadas em Docker, e automação de browser local limitada. O skill de browser ainda funciona se você apontar pra um Chrome headless em outra máquina, mas o Android em si não vai subir Playwright pra você.
O que você ganha de volta é tudo que torna um servidor pequeno e sempre ligado atraente: LTE por padrão (o celular é sua própria rede), UPS embutido (a bateria mantém ele vivo por horas durante uma queda de luz), monitoramento embutido (o display de bateria do celular te conta exatamente o que o servidor está fazendo) e operação silenciosa. Zero barulho de fan. Zero espaço em rack. Consumo de energia de uma luzinha noturna.
O ponto maior
A coisa interessante sobre rodar o Hermes num celular morto não é que funciona. É que funciona do mesmo jeito que funciona num servidor de 200 dólares. Uma vez que um agente está desacoplado da máquina onde roda, deixa de importar muito qual máquina você usa.
Um Pixel 4a morto numa gaveta é um lar perfeitamente bom pra um bot com quem você conversa dez vezes por dia. Isso não é um compromisso. Essa é a ideia toda.