Asistente de IA Hermes: Instalación, configuración, flujo de trabajo y solución de problemas

Instalación y guía rápida de inicio para desarrolladores de Hermes Agent

Índice

El Agente Hermes es un asistente de IA autoalojado y agnóstico al modelo que se ejecuta en una máquina local o en un VPS de bajo costo, funciona a través de interfaces de terminal y mensajería, y mejora con el tiempo al convertir tareas repetidas en habilidades reutilizables.

Es muy similar en funcionalidad a OpenClaw, otra pila de asistentes autoalojados construida en torno a herramientas, memoria y control local. Muchos desarrolladores encontraron su camino hacia Hermes después de que Anthropic bloqueó el acceso por suscripción de Claude a OpenClaw en abril de 2026; la cronología de la ascensión y caída de OpenClaw explica por qué Hermes surgió como el destino natural para los usuarios que buscaban automatización persistente y autoalojada sin la dependencia del proveedor.

Si deseas tener una visión más amplia sobre los asistentes autoalojados, la recuperación y la infraestructura local en torno a Hermes, este resumen de sistemas de IA conecta esos temas con los mismos problemas que Hermes intenta resolver.

Para las compensaciones de despliegue y las elecciones de tiempo de ejecución, Alojamiento de LLMs en 2026: Infraestructura Local, Autoalojada y en la Nube Comparada proporciona el mapa de alojamiento, mientras que Rendimiento de LLMs en 2026: Benchmarks, Cuellos de Botella y Optimización cubre el lado del rendimiento y la latencia una vez que Hermes está en ejecución.

asistente-de-ia-personal en portátil

Mi opinión parcializada: Hermes es más interesante cuando se trata como infraestructura, no como una pestaña que abres ocasionalmente. Una vez que se ejecuta como un servicio y tiene un directorio de inicio estable, tus prompts comienzan a parecer menos como un “chat” y más como “operaciones”.

Qué es el Agente Hermes y por qué importa

El Agente Hermes es un agente de IA de código abierto construido por Nous Research. Está diseñado para ejecutarse de forma persistente, utilizar herramientas (terminal, archivos, web y más) y mejorar su propio comportamiento con el tiempo mediante un sistema de habilidades y memoria.

Dos decisiones de diseño merecen ser explicadas porque moldean todo lo demás en esta guía.

En primer lugar, Hermes no está bloqueado a un solo proveedor de modelos. El flujo de configuración oficial admite múltiples proveedores y cualquier punto final compatible con OpenAI, y el cambio se realiza mediante el comando hermes model en lugar de editar código.

En segundo lugar, Hermes traza una línea dura entre “conversación” y “ejecución”. El agente puede hablar todo el día, pero cuando necesita actuar, lo hace a través de herramientas explícitas y un backend de ejecución configurable. Ahí es donde reside la seguridad, la reproducibilidad y la solución de problemas.

El costo y la licencia son refrescantemente aburridos. El propio Agente Hermes es software gratuito bajo la licencia MIT. Si utilizas modelos alojados, el costo continuo es lo que cobre tu proveedor. Si ejecutas modelos locales, puedes evitar por completo las tarifas de la API.

Si tu configuración de Hermes utiliza Claude a través de capas de herramientas externas, este cambio en la suscripción de Anthropic es una referencia útil sobre por qué la facturación basada en API es ahora el camino esperado.

Instalar el Agente Hermes

Hermes tiene una vía de instalación rápida para Linux, macOS y WSL2. La documentación oficial lo mantiene intencionalmente simple.

Instalación de Hermes en Linux

sudo apt-get update
sudo apt-get upgrade
sudo apt-get curl git
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

Después de la instalación, recarga tu shell y arranca la CLI.

source ~/.bashrc   # o source ~/.zshrc
hermes

El instalador no es solo un envoltorio delgado. Según la guía de instalación, configura las dependencias, el repositorio, un entorno virtual y el comando hermes, llevándote a un estado inicial listo para chatear.

Notas para Windows y Android

Windows nativo no es compatible. La documentación recomienda WSL2 y ejecutar Hermes dentro de él.

Para Android, Hermes admite una vía de instalación en Termux. Está diseñado para detectar Termux y adaptar su configuración de dependencias y entorno en consecuencia.

Inicio Rápido

La primera ejecución más rápida es literalmente solo hermes, pero un inicio rápido significativo implica dos decisiones adicionales: qué proveedor de modelos utilizar y qué herramientas deben habilitarse.

Elegir un proveedor y un modelo

Hermes expone tres puntos de entrada complementarios:

  • hermes model para elegir un proveedor y un modelo predeterminado
  • hermes tools para habilitar o deshabilitar conjuntos de herramientas
  • hermes setup para ejecutar un asistente interactivo en las principales áreas de configuración

Un flujo minimalista se ve así:

hermes model
hermes tools
hermes

En cuanto a lo que realmente se admite, el Inicio Rápido oficial enumera una serie de proveedores y también destaca que Hermes funciona con APIs compatibles con OpenAI. Esto es importante porque incluye tanto servicios alojados como puntos finales autoalojados.

Comprobar la ejecución de herramientas temprano

Antes de crear hábitos en torno a Hermes, vale la pena verificar que el uso de herramientas funcione en tu entorno. El Inicio Rápido sugiere explícitamente el uso de la terminal como la primera característica a probar.

En la práctica, un pequeño prompt de “prueba de humo” cumple dos funciones: verifica la herramienta de terminal y valida los prompts de permisos.

Prompt de ejemplo:

Muéstrame el uso de mi disco y los cinco directorios más grandes.

Si Hermes no puede ejecutar la herramienta de terminal, salta a la sección de Solución de Problemas. La mala configuración del backend de terminal es una de las causas más comunes, y la solución suele ser obvia una vez que miras la configuración.

Configuración que escala

Hermes recompensa a quienes entienden dónde almacena el estado y cómo resuelve la configuración. Este es también el lugar de donde provienen muchos problemas de “ayer funcionaba”.

Dónde viven la configuración y el estado

Hermes almacena sus ajustes y estado bajo ~/.hermes. La guía de configuración oficial documenta el esquema, incluyendo config.yaml para ajustes, .env para secretos, auth.json para credenciales OAuth, SOUL.md para identidad, y carpetas para memorias, habilidades, cron, sesiones y registros.

Esto importa por dos razones.

  • La depuración se vuelve mecánica porque sabes exactamente dónde mirar.
  • Las copias de seguridad se vuelven sencillas porque un solo directorio captura la mayor parte del estado del agente que te importa.

Precedencia de configuración y mantener los secretos fuera de config.yaml

Hermes resuelve la configuración con un orden de precedencia. En la parte superior están las anulaciones de CLI, luego config.yaml, luego .env, con los valores predeterminados integrados en la parte inferior.

El detalle agradable es que hermes config set enruta los valores al archivo correcto: claves API a .env y ajustes no secretos a config.yaml.

hermes config set model openrouter/meta-llama/llama-3.1-70b-instruct
hermes config set terminal.backend docker
hermes config set OPENROUTER_API_KEY sk-or-v1-xxxxxxxx

Hermes también admite la sustitución de variables de entorno dentro de config.yaml mediante la sintaxis ${VAR_NAME}. Esto es útil cuando deseas mantener ciertos valores en el entorno mientras los referencias aún en la configuración estructurada.

Sandbox y backends de ejecución

Hermes admite múltiples backends de terminal que definen dónde se ejecutan realmente los comandos de shell. La guía de configuración enumera local, docker, ssh, modal, daytona y singularity.

La forma de pensar sobre esto, con opinión pero no evangelista, es:

  • local es el más rápido y simple, pero no está aislado
  • docker es una capa pragmática de seguridad y reproducibilidad
  • ssh es una forma limpia de separar tu dispositivo de chat de tu caja de cómputo
  • modal y daytona encajan en flujos de trabajo “serverless pero lo suficientemente persistentes”
  • singularity es la opción amigable con HPC (cómputo de alto rendimiento)

Un ejemplo minimalista de backend Docker:

# ~/.hermes/config.yaml
terminal:
  backend: docker
  docker_image: "nikolaik/python-nodejs:python3.11-nodejs20"
  docker_volumes:
    - "/home/user/projects:/workspace/projects"
  docker_forward_env:
    - "GITHUB_TOKEN"

La documentación también describe el endurecimiento de seguridad para el backend Docker, como la eliminación de capacidades y la desactivación de la escalada de privilegios.

Habilidades, memoria y perfiles

Hermes tiene dos mecanismos relacionados para compounding value (acumular valor).

Las habilidades son memoria procedimental. Hermes puede crear, actualizar y eliminar sus propias habilidades y puede ofrecer guardar un enfoque como habilidad después de completar una tarea compleja.

La memoria incorporada se almacena como archivos como MEMORY.md y USER.md bajo ~/.hermes, y Hermes también puede utilizar proveedores de memoria externos para una recuperación más profunda. Los documentos de memoria enumeran múltiples plugins de proveedores, y la guía de proveedores de memoria documenta un flujo de configuración interactivo. Para un desglose técnico completo de cómo funciona la arquitectura de memoria — instantáneas congeladas, límites de caracteres, los ocho proveedores externos y la filosofía detrás de la memoria acotada — consulta Sistema de Memoria del Agente Hermes: Cómo Funciona Realmente la Memoria Persistente de IA.

Si deseas múltiples agentes independientes en la misma máquina, los perfiles de Hermes proporcionan aislamiento. Cada perfil obtiene su propio directorio con su propia configuración, secretos, memorias, sesiones, habilidades, trabajos cron y estado de la pasarela.

Para una mirada más profunda a qué habilidades funcionan bien en producción por rol — ingenieros, investigadores, operadores y flujos de trabajo ejecutivos — consulta Habilidades del Asistente de IA Hermes para Configuraciones de Producción Reales.

Flujo de trabajo típico

Si tratas a Hermes como un agente que mantendrás cerca, el flujo de trabajo comienza a parecer ingeniería de servicios.

Una línea base estable

Una línea base que tiende a no deteriorarse es:

  1. Instalar y ejecutar un primer chat en la CLI.
  2. Elegir un proveedor y modelo con hermes model, luego confirmar los costos.
  3. Configurar conjuntos de herramientas y decidir si la ejecución de la terminal es local o en sandbox.
  4. Hacer un cambio rápido a SOUL.md solo después de haber usado el predeterminado por un tiempo. Los cambios de identidad importan más de lo que la gente espera porque es el “slot 1” en el prompt del sistema.

Uso diario que se acumula

Hermes tiene una interfaz de usuario de terminal en lugar de una interfaz web, y está diseñado para sesiones largas con comandos slash, sesiones reanudables y salida de herramientas en streaming.

En la práctica, una cadencia útil es:

  • ejecutar trabajo en una sesión nombrada para un proyecto
  • comprimir el contexto cuando crece demasiado
  • dejar que Hermes convierta rutinas repetidas en habilidades
  • mantener una frontera mental entre “preguntar” y “actuar” para que la ejecución de herramientas siga siendo auditable

Pasarela de mensajería para acceso 24/7

La pasarela de mensajería es la pieza que hace que Hermes se sienta como un asistente en lugar de una aplicación de terminal. La documentación lo describe como un proceso único que se conecta a múltiples plataformas, maneja sesiones, ejecuta trabajos cron y entrega mensajes.

La configuración se invoca mediante hermes gateway setup, y la pasarela puede ejecutarse en primer plano o como un servicio de usuario. La referencia de la CLI documenta subcomandos de pasarela como run, install, start, stop, status y restart.

La seguridad para un bot que usa herramientas importa. Los documentos de la pasarela describen listas blancas para plataformas específicas y un flujo de emparejamiento de DM que emite códigos de emparejamiento de un solo uso y requiere aprobación mediante hermes pairing approve.

Actualizaciones sin dramas

Las actualizaciones de Hermes son un comando de primera clase. La guía de actualización documenta hermes update, comprobaciones de migración de configuración y una pequeña rutina de validación posterior a la actualización que incluye hermes doctor y hermes gateway status.

hermes update
hermes doctor
hermes gateway status

Solución de problemas y diagnóstico

La mayoría de los fallos de Hermes no son misteriosos. Parecen misteriosos porque la gente solo verifica la capa del modelo e ignora la capa de tiempo de ejecución.

Comandos de triaje rápido

La referencia de la CLI posiciona explícitamente tres comandos como el ciclo principal:

  • hermes doctor para diagnóstico interactivo
  • hermes status para una visión general rápida
  • hermes dump para un resumen de configuración compartible y redactado

Para los registros, hermes logs muestra los archivos almacenados bajo ~/.hermes/logs.

hermes doctor --fix
hermes status
hermes dump --show-keys
hermes logs errors -f

Fallos comunes de instalación

La FAQ y la guía de solución de problemas enumeran varios problemas recurrentes y sus soluciones, incluyendo problemas de versión de Python, uv no encontrado y problemas de permisos causados por mezclar instalaciones con sudo con instalaciones de usuario.

Si te encuentras con estos errores, la documentación proporciona pasos de remediación específicos como actualizar Python, instalar uv y reinstalar Hermes sin sudo.

Problemas de proveedor y modelo

Cuando las claves API no funcionan, la FAQ recomienda verificar la configuración, volver a ejecutar hermes model o establecer una clave directamente mediante hermes config set. También destaca un problema común: las claves son específicas del proveedor.

Para los problemas de “modelo no encontrado”, la FAQ apunta de nuevo a usar hermes model para elegir un identificador válido y muestra tanto anulaciones de configuración como por sesión.

También se cubren los problemas de limitación de tasa y longitud de contexto. La FAQ sugiere esperar para errores 429, cambiar de proveedor o modelo, y reducir la presión del contexto mediante compresión o una sesión nueva.

Problemas de backend de terminal y pasarela

Si los comandos de terminal fallan inmediatamente, la guía de configuración incluye una sección de “problemas comunes del backend de terminal” y apunta a las causas típicas por backend, incluyendo Docker no ejecutándose y variables SSH faltantes. También nota que volver a local es un movimiento de depuración válido cuando la configuración del sandbox está en duda.

Para problemas de pasarela, la guía de mensajería destaca las listas blancas y el emparejamiento como los valores predeterminados seguros, lo que significa que muchos incidentes de “el bot está en silencio” son en realidad la autorización haciendo su trabajo.

Referencias

Suscribirse

Recibe nuevas publicaciones sobre sistemas, infraestructura e ingeniería de IA.