Assistente Hermes AI - Instalação, Configuração, Fluxo de Trabalho e Solução de Problemas

Instalação e início rápido do Agente Hermes para desenvolvedores

Conteúdo da página

O Hermes Agent é um assistente de IA auto-hospedado e agnóstico de modelos que roda em máquinas locais ou VPS de baixo custo, opera através de interfaces de terminal e de mensagens, e melhora ao longo do tempo ao transformar tarefas repetidas em habilidades reutilizáveis.

Ele é muito semelhante em funcionalidade ao OpenClaw, outra pilha de assistentes auto-hospedados construída em torno de ferramentas, memória e controle local.

Se você quer uma visão mais ampla sobre assistentes auto-hospedados, recuperação e infraestrutura local ao redor do Hermes, esta visão geral de sistemas de IA conecta esses tópicos aos mesmos problemas que o Hermes tenta resolver.

Para compensações de implantação e escolhas de tempo de execução, Hospedagem de LLM em 2026: Comparação de Infraestrutura Local, Auto-Hospedada e em Nuvem fornece o mapa de hospedagem, enquanto Desempenho de LLM em 2026: Benchmarks, Gargalos e Otimização cobre o lado de vazão e latência uma vez que o Hermes está em execução.

assistente-ia-pessoal no laptop

Minha opinião tendenciosa: o Hermes é mais interessante quando tratado como infraestrutura, não como uma aba que você abre ocasionalmente. Uma vez que ele roda como um serviço e tem um diretório de casa estável, seus prompts começam a parecer menos como “conversa” e mais como “operações”.

O que é o Hermes Agent e por que é importante

O Hermes Agent é um agente de IA de código aberto construído pela Nous Research. Ele é projetado para rodar de forma persistente, usar ferramentas (terminal, arquivos, web e mais) e melhorar seu próprio comportamento ao longo do tempo com um sistema de habilidades e memória.

Duas escolhas de design valem a pena serem explicadas, pois elas moldam tudo o resto neste guia.

Primeiro, o Hermes não está travado em um único provedor de modelo. O fluxo de configuração oficial suporta múltiplos provedores e qualquer endpoint compatível com OpenAI, e a troca é feita via o comando hermes model em vez de edições de código.

Segundo, o Hermes traça uma linha dura entre “conversa” e “execução”. O agente pode conversar o dia todo, mas quando precisa agir, faz isso através de ferramentas explícitas e um backend de execução configurável. É ali que residem a segurança, a reprodutibilidade e a solução de problemas.

Custos e licenciamento são refrescantemente chatos. O próprio Hermes Agent é software livre sob a licença MIT. Se você usar modelos hospedados, o custo contínuo é o que seu provedor cobrar. Se você rodar modelos locais, pode evitar completamente as taxas de API.

Se sua configuração do Hermes usa o Claude através de camadas de ferramentas externas, esta mudança na assinatura da Anthropic é uma referência útil sobre por que a cobrança baseada em API é agora o caminho esperado.

Instalar o Hermes Agent

O Hermes tem um caminho de instalação rápido para Linux, macOS e WSL2. A documentação oficial mantém intencionalmente simples.

Instalação em uma linha

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

Após a instalação, recarregue seu shell e inicie o CLI.

source ~/.bashrc   # ou source ~/.zshrc
hermes

O instalador não é apenas uma camada fina. De acordo com o guia de instalação, ele configura dependências, o repositório, um ambiente virtual e o comando hermes, levando-o a um estado pronto para o primeiro chat.

Notas para Windows e Android

Windows nativo não é suportado. A documentação recomenda o WSL2 e rodar o Hermes dentro dele.

Para Android, o Hermes suporta um caminho de instalação Termux. Ele é projetado para detectar o Termux e adaptar sua configuração de dependências e ambiente de acordo.

Início Rápido

A primeira execução mais rápida é literalmente apenas hermes, mas um início rápido significativo significa duas decisões extras: qual provedor de modelo usar e quais ferramentas devem ser habilitadas.

Escolha um provedor e modelo

O Hermes expõe três pontos de entrada complementares:

  • hermes model para escolher um provedor e modelo padrão
  • hermes tools para habilitar ou desabilitar conjuntos de ferramentas
  • hermes setup para executar um assistente interativo nas principais áreas de configuração

Um fluxo mínimo parece assim:

hermes model
hermes tools
hermes

Em termos do que é realmente suportado, o Início Rápido oficial lista uma gama de provedores e também destaca que o Hermes funciona com APIs compatíveis com OpenAI. Isso importa porque inclui tanto serviços hospedados quanto endpoints auto-hospedados.

Prove a execução de ferramentas cedo

Antes de construir hábitos em torno do Hermes, vale a pena verificar que o uso de ferramentas funciona em seu ambiente. O Início Rápido sugere explicitamente o uso do terminal como o primeiro recurso a tentar.

Na prática, um pequeno prompt de “teste de fumaça” faz dois trabalhos: verifica a ferramenta de terminal e valida os prompts de permissão.

Exemplo de prompt:

Mostre meu uso de disco e os cinco maiores diretórios.

Se o Hermes não puder executar a ferramenta de terminal, pule para a Solução de Problemas. A má configuração do backend do terminal é uma das causas mais comuns, e a correção geralmente é óbvia assim que você olha a configuração.

Configuração que escala

O Hermes recompensa quem entende onde ele armazena o estado e como resolve a configuração. Este é também o local de onde vêm muitos problemas do tipo “funcionava ontem”.

Onde a configuração e o estado residem

O Hermes armazena suas configurações e estado sob ~/.hermes. O guia de configuração oficial documenta o layout, incluindo config.yaml para configurações, .env para segredos, auth.json para credenciais OAuth, SOUL.md para identidade e pastas para memórias, habilidades, cron, sessões e logs.

Isso importa por duas razões.

  • A solução de problemas torna-se mecânica porque você sabe exatamente onde procurar.
  • Os backups tornam-se diretos porque um único diretório captura a maior parte do estado do agente que você se importa.

Precedência de configuração e manter segredos fora do config.yaml

O Hermes resolve a configuração com uma ordem de precedência. No topo estão as substituições do CLI, depois config.yaml, depois .env, com valores padrão embutidos no fundo.

O detalhe agradável é que hermes config set roteia valores para o arquivo correto: chaves de API para .env e configurações não secretas para config.yaml.

hermes config set model openrouter/meta-llama/llama-3.1-70b-instruct
hermes config set terminal.backend docker
hermes config set OPENROUTER_API_KEY sk-or-v1-xxxxxxxx

O Hermes também suporta substituição de variáveis de ambiente dentro do config.yaml via sintaxe ${VAR_NAME}. Isso é útil quando você quer manter certos valores no ambiente enquanto ainda os referencia em uma configuração estruturada.

Sandbox e backends de execução

O Hermes suporta múltiplos backends de terminal que definem onde os comandos de shell realmente rodam. O guia de configuração lista local, docker, ssh, modal, daytona e singularity.

A maneira opinada, mas não evangelista, de pensar sobre isso é:

  • local é o mais rápido e simples, mas não é isolado
  • docker é uma camada pragmática de segurança e reprodutibilidade
  • ssh é uma maneira limpa de separar seu dispositivo de chat da sua caixa de computação
  • modal e daytona se encaixam em fluxos de trabalho “serverless mas persistentes o suficiente”
  • singularity é a opção amigável para HPC

Um exemplo mínimo de backend Docker:

# ~/.hermes/config.yaml
terminal:
  backend: docker
  docker_image: "nikolaik/python-nodejs:python3.11-nodejs20"
  docker_volumes:
    - "/home/user/projects:/workspace/projects"
  docker_forward_env:
    - "GITHUB_TOKEN"

A documentação também descreve o endurecimento de segurança para o backend Docker, como abandonar capacidades e desabilitar a escalonamento de privilégios.

Habilidades, memória e perfis

O Hermes tem dois mecanismos relacionados para compor valor.

Habilidades são memória procedimental. O Hermes pode criar, atualizar e excluir suas próprias habilidades e pode oferecer salvar uma abordagem como uma habilidade após completar uma tarefa complexa.

A memória embutida é armazenada como arquivos como MEMORY.md e USER.md sob ~/.hermes, e o Hermes também pode usar provedores de memória externos para recordação mais profunda. A documentação de memória lista vários plugins de provedores, e o guia de provedores de memória documenta um fluxo de configuração interativo.

Se você quiser múltiplos agentes independentes na mesma máquina, os perfis do Hermes fornecem isolamento. Cada perfil recebe seu próprio diretório com sua própria configuração, segredos, memórias, sessões, habilidades, trabalhos cron e estado de gateway.

Para uma olhada mais profunda em quais habilidades funcionam bem em produção por papel — engenheiros, pesquisadores, operadores e fluxos de trabalho executivos — veja Habilidades do Assistente de IA Hermes para Configurações Reais de Produção.

Fluxo de trabalho típico

Se você tratar o Hermes como um agente que você manterá, o fluxo de trabalho começa a parecer com engenharia de serviços.

Uma linha de base estável

Uma linha de base que tende a não se deteriorar é:

  1. Instale e execute um primeiro chat no CLI.
  2. Escolha um provedor e modelo com hermes model, depois confirme os custos.
  3. Configure conjuntos de ferramentas e decida se a execução do terminal é local ou sandboxed.
  4. Faça uma mudança rápida no SOUL.md apenas após ter usado o padrão por um tempo. Mudanças de identidade importam mais do que as pessoas esperam porque é o “slot 1” no prompt do sistema.

Uso diário que compõe

O Hermes tem uma UI de terminal em vez de uma UI web, e é projetado para sessões longas com comandos de barra, sessões retomáveis e saída de ferramentas em streaming.

Na prática, um ritmo útil é:

  • executar trabalho em uma sessão nomeada para um projeto
  • comprimir contexto quando ele cresce demais
  • deixar o Hermes transformar rotinas repetidas em habilidades
  • manter uma fronteira mental entre “perguntar” e “agir” para que a execução de ferramentas permaneça auditável

Gateway de mensagens para acesso 24/7

O gateway de mensagens é a peça que faz o Hermes sentir-se como um assistente em vez de um aplicativo de terminal. A documentação descreve-o como um único processo que se conecta a múltiplas plataformas, lida com sessões, executa trabalhos cron e entrega mensagens.

A configuração é invocada via hermes gateway setup, e o gateway pode rodar em primeiro plano ou como um serviço de usuário. A referência do CLI documenta subcomandos do gateway como run, install, start, stop, status e restart.

A segurança para um bot que usa ferramentas importa. A documentação do gateway descreve listas de permissão para plataformas específicas e um fluxo de emparelhamento DM que emite códigos de emparelhamento de uso único e requer aprovação via hermes pairing approve.

Atualizações sem drama

Atualizações do Hermes são um comando de primeira classe. O guia de atualização documenta hermes update, verificações de migração de configuração e uma pequena rotina de validação pós-atualização incluindo hermes doctor e hermes gateway status.

hermes update
hermes doctor
hermes gateway status

Solução de problemas e diagnósticos

A maioria das falhas do Hermes não é misteriosa. Elas parecem misteriosas porque as pessoas apenas verificam a camada de modelo e ignoram a camada de tempo de execução.

Comandos de triagem rápida

A referência do CLI posiciona explicitamente três comandos como o loop central:

  • hermes doctor para diagnósticos interativos
  • hermes status para uma visão geral rápida
  • hermes dump para um resumo de configuração compartilhável e redigido

Para logs, hermes logs lista arquivos armazenados sob ~/.hermes/logs.

hermes doctor --fix
hermes status
hermes dump --show-keys
hermes logs errors -f

Falhas de instalação comuns

A FAQ e o guia de solução de problemas listam vários problemas recorrentes e suas correções, incluindo problemas de versão Python, uv não encontrado e problemas de permissão causados por misturar instalações sudo com instalações de usuário.

Se você encontrar esses erros, a documentação fornece etapas de remediação específicas, como atualizar o Python, instalar uv e reinstalar o Hermes sem sudo.

Problemas de provedor e modelo

Quando chaves de API não funcionam, a FAQ recomenda verificar a configuração, re-executar hermes model ou definir uma chave diretamente via hermes config set. Ele também destaca um problema comum: chaves são específicas do provedor.

Para problemas de “modelo não encontrado”, a FAQ aponta de volta para usar hermes model para escolher um identificador válido e mostra tanto a configuração quanto as substituições por sessão.

Problemas de limitação de taxa e comprimento de contexto também são abordados. A FAQ sugere esperar por erros 429, mudar de provedores ou modelos e reduzir a pressão de contexto via compressão ou uma sessão fresca.

Problemas de backend de terminal e gateway

Se comandos de terminal falham imediatamente, o guia de configuração inclui uma seção de “problemas comuns de backend de terminal” e aponta para as causas típicas por backend, incluindo Docker não rodando e variáveis SSH ausentes. Ele também nota que voltar para o local é um movimento de depuração válido quando a configuração de sandbox está em questão.

Para problemas de gateway, o guia de mensagens destaca listas de permissão e emparelhamento como os padrões seguros, o que significa que muitos incidentes de “bot está silencioso” são na verdade a autorização fazendo seu trabalho.

Referências

Assinar

Receba novos artigos sobre sistemas, infraestrutura e engenharia de IA.