¿Cuál es la diferencia entre la memoria de la IA y las habilidades de la IA?

La memoria almacena datos sobre usuarios, proyectos y contexto, mientras que las habilidades almacenan procedimientos reutilizables para gestionar tareas recurrentes.

¿Cuándo debe un asistente de IA utilizar perfiles separados?

Los perfiles separados son útiles cuando los equipos, entornos, credenciales o responsabilidades deben mantenerse aislados en la memoria, las sesiones, las herramientas y las automatizaciones.

¿Cómo deberían separarse los secretos y la configuración del asistente de IA?

Los secretos deben ir en los archivos de entorno, mientras que el comportamiento no secreto, como modelos, conjuntos de herramientas, backends y límites, debe ir en el archivo de configuración principal.

¿Qué habilidades de los asistentes de IA son más importantes para los flujos de trabajo de codificación?

Las habilidades de codificación más valiosas suelen abarcar la autenticación de repositorios, los flujos de trabajo de incidencias y solicitudes de extracción, la revisión de código, la depuración y la implementación basada en planes.

¿Cómo mantienen su fiabilidad los flujos de trabajo de IA programados?

Los flujos de trabajo programados mantienen su fiabilidad cuando los prompts son autónomos, las habilidades se adjuntan de forma explícita y la ejecución se realiza en backends aislados con objetivos de entrega claros.

Habilidades del Asistente Hermes AI para Entornos de Producción Reales

Configuraciones de Hermes con prioridad en el perfil para cargas de trabajo serias

Índice

El asistente de IA Hermes, documentado oficialmente como Hermes Agent, no está posicionado como un simple envoltorio de chat.

Para la instalación, la configuración del proveedor, el aislamiento de herramientas y la configuración de la pasarela, consulte la Guía del asistente de IA Hermes. Las interfaces de línea de comandos diarias (hermes profile, hermes skills, hermes cron y comandos relacionados) se resumen en la Hoja de trucos de la CLI de Hermes Agent. Este artículo se centra en la arquitectura de habilidades y perfiles que determina cómo se comporta Hermes una vez que está en ejecución. Para información concreta sobre la creación de SKILL.md —campos de frontmatter, estructura de directorios, secretos frente a config.yaml y habilidades que desaparecen de los comandos de barra diagonal— consulte Creación de habilidades de Hermes Agent: Estructura de SKILL.md y mejores prácticas.

La documentación oficial y el repositorio describen un agente de autoaprendizaje con un bucle de aprendizaje integrado que crea habilidades a partir de la experiencia, las mejora durante su uso, persiste el conocimiento entre sesiones y se ejecuta en cualquier cosa, desde un VPS de bajo costo hasta entornos aislados en la nube.

hermes ai assistant skills

En abril de 2026, el repositorio público de GitHub muestra aproximadamente 94,6k estrellas, 13,2k bifurcaciones y una última versión etiquetada como v0.10.0 el 16 de abril de 2026. Esa es suficiente actividad para llamar al proyecto de rápido movimiento, bien adoptado y, al mismo tiempo, aún joven operativamente.

Esa naturaleza dual es importante para el diseño de producción. Hermes es lo suficientemente maduro para soportar trabajo real, pero lo suficientemente dinámico como para que una configuración desordenada envejezca mal. El artículo de abajo trata la configuración y las habilidades como una pregunta de arquitectura operativa, no como una lista de características.

Por qué Hermes necesita una arquitectura centrada en el perfil

Las habilidades de Hermes son documentos de conocimiento bajo demanda. Utilizan la divulgación progresiva para que el agente pueda ver primero un índice de habilidades compacto y solo cargar el contenido completo de la habilidad cuando sea necesario, lo que mantiene el uso de tokens bajo control incluso cuando se instalan muchas habilidades. Cada habilidad instalada se convierte en un comando de barra diagonal en la CLI y en las superficies de mensajería, y la documentación posiciona explícitamente las habilidades como el mecanismo de extensión preferido cuando una capacidad puede expresarse con instrucciones, comandos de shell y herramientas existentes en lugar de código de agente personalizado.

La complicación de producción es que Hermes trata las habilidades como un estado vivo, no como paquetes congelados. Las habilidades integradas, las habilidades instaladas desde el hub y las habilidades creadas por el agente viven todas bajo ~/.hermes/skills/, y la documentación indica que el agente puede modificar o eliminar habilidades. El mismo sistema expone acciones de creación, parcheo, edición, eliminación y archivos de soporte para la gestión de habilidades. Eso es poderoso, pero también significa que un agente “hacedor de todo” excesivamente grande tiende a convertirse en un cajón de sastre procedimental.

Los perfiles son la respuesta. Los perfiles de Hermes son entornos completamente aislados, cada uno con su propio config.yaml, .env, SOUL.md, memorias, sesiones, habilidades, trabajos programados y base de datos de estado. La CLI también convierte un perfil en su propio alias de comando, por lo que un perfil llamado coder se convierte en coder chat, coder setup, coder gateway start, y así sucesivamente. En la práctica, eso hace que los perfiles sean la verdadera unidad de propiedad de producción, no la habilidad individual.

La línea base de producción

La forma de la línea base es sorprendentemente limpia. Hermes almacena el comportamiento no secreto en ~/.hermes/config.yaml, los secretos en ~/.hermes/.env, la identidad en SOUL.md, los hechos persistentes en memories/, el conocimiento procedimental en skills/, los trabajos programados en cron/, las sesiones en sessions/ y los registros en logs/. El comando hermes config set enruta las claves API a .env y todo lo demás a config.yaml, y el orden de precedencia documentado es primero las banderas de CLI, luego config.yaml, luego .env, y finalmente los valores predeterminados integrados. Esa también es la respuesta más limpia a la pregunta frecuente de producción sobre cómo deben dividirse los secretos y la configuración.

Una disposición práctica de múltiples perfiles suele terminar pareciéndose a esto, con un perfil por responsabilidad en lugar de un perfil por persona:

~/.hermes/profiles/
  eng/
  research/
  ops/
  execops/
  ml/

Ese patrón coincide con cómo se documentan los perfiles de Hermes: cada perfil es su propio entorno aislado, y los perfiles pueden clonarse desde una configuración base cuando son útiles los valores predeterminados comunes. La documentación también señala que los perfiles no comparten memoria ni sesiones, y que las habilidades actualizadas pueden sincronizarse entre perfiles cuando se actualiza la instalación principal.

El siguiente límite de producción es la ejecución. Hermes admite seis backends terminales: local, Docker, SSH, Modal, Daytona y Singularity, y la documentación de seguridad describe un modelo de defensa en profundidad que incluye aprobación de comandos peligrosos, aislamiento de contenedores, filtrado de credenciales MCP, escaneo de archivos de contexto, aislamiento entre sesiones y saneamiento de entrada. En otras palabras, la decisión “perfil primero” responde quién posee el estado, y la decisión del backend responde dónde se permite que ocurra el trabajo riesgoso.

La automatización se sitúa sobre esa línea base. Los trabajos programados de Hermes pueden adjuntar cero, uno o múltiples habilidades, y se ejecutan en sesiones de agente frescas en lugar de heredar el chat actual. La pasarela de mensajería también es el proceso en segundo plano que gestiona sesiones, ejecuta trabajos programados y enruta resultados hacia plataformas como Telegram, Discord, Slack, WhatsApp, Email, Matrix y otras. La guía oficial de MCP añade una regla de producción más que es fácil pasar por alto: el mejor patrón no es conectar todo, sino exponer la superficie útil más pequeña. Para la ejecución multi-agente estilo cola en modelos autoalojados, use Kanban en Hermes Agent para flujos de trabajo de LLM autoalojados como libro de ejecución complementario. Si su disposición de producción coloca a Hermes en una máquina sin interfaz gráfica y los operadores se conectan desde clientes de escritorio, use Configuración de servidor sin interfaz y escritorio remoto de Hermes Agent para la topología de red y servicios.

El perfil de ingeniería de software

La persona más obvia de Hermes es el ingeniero de software que quiere que el agente se comporte menos como una ventana de chat y más como un operador de repositorio repetible. Este perfil suele preocuparse por la autenticación del repositorio, el triaje de incidencias, la creación de solicitudes de extracción (PR), la revisión de código, la depuración y la ejecución respaldada por planes. En los catálogos de Hermes, el paquete de habilidades integrado central es inusualmente coherente para ese trabajo: github-auth, github-issues, github-pr-workflow, github-code-review, code-review, plan, writing-plans, systematic-debugging y test-driven-development. Si la delegación es importante, Hermes también incluye habilidades de agentes autónomos integradas como codex, claude-code, opencode y hermes-agent-spawning.

Lo que hace útil a ese paquete no es ninguna habilidad individual. Es la forma en que las habilidades codifican el procedimiento de desarrollo. github-pr-workflow cubre el ciclo de vida completo de la PR, github-issues formaliza las operaciones de incidencias, github-code-review y code-review hacen de la revisión un paso distinto en lugar de una posterior reflexión, y systematic-debugging evita que el agente salte directamente a correcciones prematuras. Eso también responde a la pregunta práctica de qué habilidades de asistente de IA son más importantes para los flujos de trabajo de codificación. Las habilidades de mayor valor suelen ser aquellas que aseguran la higiene del repositorio y la disciplina de revisión, no las que prometen más generación de código en bruto.

La delegación de Hermes refuerza aún más este perfil. La plataforma puede generar agentes hijos aislados con su propia conversación, sesión de terminal y conjunto de herramientas, y solo se devuelve el resumen final al padre. Para bases de código, eso es un ajuste más limpio que meter cada diff intermedio, traza de pila y nota de revisión en una sola conversación. En términos de producción, el perfil de ingeniería se beneficia de conjuntos de habilidades estrechos, un backend aislado como Docker o SSH, y un uso generoso de la delegación cuando el ruido de contexto comienza a dominar.

El perfil de investigación y conocimiento

El perfil de investigación es donde Hermes comienza a sentirse distinto de los asistentes ordinarios. Los catálogos integrados ya incluyen arxiv, duckduckgo-search, blogwatcher, llm-wiki, ocr-and-documents, obsidian, domain-intel y ml-paper-writing, mientras que el catálogo oficial opcional añade qmd, parallel-cli, scrapling y una capa de investigación más amplia para dominios especializados. Esa pila cubre búsqueda de papers, monitoreo de fuentes, OCR, sistemas de notas locales, reconocimiento del dominio, escritura y recuperación híbrida sin forzar todo en un patrón RAG único.

Este perfil también es el lugar más claro para responder a la pregunta de memoria versus habilidades. La documentación de Hermes define la memoria como hechos sobre usuarios, proyectos y preferencias, mientras que las habilidades almacenan procedimientos sobre cómo hacer las cosas. El trabajo de investigación necesita ambos. La memoria guarda lo que el asistente ya ha aprendido sobre el dominio y las preferencias del lector; las habilidades codifican procedimientos repetibles como “escanear arXiv, resumir nuevos papers y escribir notas en Obsidian”. Esa distinción es importante porque los sistemas de investigación de producción fallan cuando todo se trata como memoria o todo se trata como flujo de trabajo. Hermes da hogares separados a esas preocupaciones. Para la imagen técnica completa de cómo funciona la memoria —la arquitectura de dos archivos, límites de caracteres, almacenamiento en caché de prefijos y las ocho opciones de proveedores externos— consulte Sistema de memoria de Hermes Agent.

El perfil de investigación también se beneficia desproporcionadamente de los trabajos programados. Los trabajos programados de Hermes pueden cargar explícitamente habilidades antes de la ejecución, y las guías de automatización enfatizan que los prompts programados deben ser completamente autosuficientes porque se ejecutan en sesiones frescas. Una tubería recurrente que combina blogwatcher, arxiv, obsidian o llm-wiki es, por lo tanto, más fiable que un trabajo vago de “verificar qué cambió hoy”. En otras palabras, los perfiles de investigación funcionan mejor cuando el descubrimiento de fuentes, la escritura de notas y el almacenamiento a largo plazo están representados cada uno por una habilidad nombrada en lugar de escondidos dentro de un prompt largo de lenguaje natural.

El perfil de automatización y operaciones

El perfil de operaciones es menos glamoroso y a menudo más valioso. Este es el usuario que quiere que Hermes reaccione a eventos, inspeccione sistemas, ejecute verificaciones scripteadas, enrute la salida a un canal y haga todo eso sin convertir el host en una responsabilidad. Hermes tiene los bloques de construcción adecuados para ese estilo de trabajo: webhook-subscriptions integradas para activación impulsada por eventos, native-mcp y mcporter integrados para herramientas basadas en MCP, y habilidades oficiales opcionales como docker-management, fastmcp, cli y 1password cuando el flujo de trabajo se expande a contenedores, servidores MCP personalizados o inyección de secretos.

La razón por la que este paquete funciona es que cada habilidad posee un límite. webhook-subscriptions maneja la entrada de sistemas externos. docker-management convierte las tareas de contenedores en un procedimiento nombrado en lugar de un juego de shell libre. fastmcp es útil cuando Hermes necesita convertirse en el orquestador alrededor de nuevas herramientas MCP, y 1password mantiene el manejo de secretos explícito en lugar de contrabandearlo en el historial de shell o archivos markdown. La guía oficial de MCP refuerza el mismo instinto de producción: conectar la cosa correcta con la superficie útil más pequeña. Cuando este perfil de operaciones se consume a través de interfaces de chat móviles, los detalles de implementación se cubren en Control de voz de Hermes desde su teléfono.

Este perfil también es el lugar más limpio para responder cómo los flujos de trabajo de IA programados se mantienen fiables. La documentación de trabajos programados de Hermes dice que los trabajos se ejecutan en sesiones frescas, pueden adjuntar una o más habilidades y deben usar prompts autosuficientes. La guía de solución de problemas de trabajos programados añade que la activación automática depende del ticker de la pasarela en lugar de una sesión de chat CLI ordinaria. Por lo tanto, el patrón fiable es straightforward incluso si la implementación no lo es: habilidades explícitas, objetivo de entrega explícito, prompt autosuficiente, backend aislado y una pasarela que realmente esté en ejecución.

El perfil de operaciones ejecutivas

Existe una persona más silenciosa pero muy real de Hermes que se parece a un jefe de personal, líder de operaciones o fundador sobrecargado. Las habilidades relevantes son menos llamativas y más orientadas a la oficina: google-workspace, notion, linear, nano-pdf, powerpoint, y la habilidad de email himalaya integrada, además de habilidades oficiales opcionales como agentmail, telephony y one-three-one-rule. Esa mezcla da a Hermes acceso al buzón, calendario, documentos, tareas, presentaciones, limpieza de PDF, un marco de comunicación estructurado e incluso flujos de trabajo de teléfono y SMS donde eso realmente importa.

El flujo aquí es más importante que el catálogo. google-workspace ancla la ejecución diaria. Notion y Linear evitan que el asistente se convierta en el sistema de registro de tareas. one-three-one-rule es sorprendentemente útil porque el apoyo a la toma de decisiones a menudo es lo más difícil de estandarizar, y esa habilidad da a Hermes un procedimiento nombrado para propuestas en lugar de un comportamiento genérico de “resumir esto”. nano-pdf y powerpoint son el tipo de multiplicadores operativos que parecen pequeños hasta que un equipo comienza a tocar presentaciones y PDFs todos los días.

Las características de mensajería y voz de Hermes hacen que este perfil sea más práctico de lo que parece a primera vista. La pasarela puede exponer el agente a través de Slack, Telegram, Discord, WhatsApp, Email, Matrix y varios otros canales, y la pila de voz admite entrada de micrófono, respuestas habladas en mensajería y conversaciones de voz en vivo en Discord. La documentación también señala que una instancia de Hermes puede servir a múltiples usuarios a través de listas de permitidos y emparejamiento de mensajes directos, mientras que los tokens de bot permanecen exclusivos de un solo perfil. Por eso, un despliegue pesado en comunicación suele beneficiarse de al menos un perfil dedicado en lugar de compartir la misma identidad de bot con ingeniería o operaciones.

El perfil de plataforma de ML y datos

Hermes es construido por un laboratorio de investigación, y esa línea genealógica se muestra. Los catálogos incluyen jupyter-live-kernel para trabajo estilo cuaderno con estado, huggingface-hub para operaciones de modelos y conjuntos de datos, evaluating-llms-harness y weights-and-biases para evaluación y seguimiento de experimentos, qdrant-vector-search para almacenamiento RAG de producción, y una gran capa de MLOps integrada y opcional con habilidades como axolotl, fine-tuning-with-trl, modal-serverless-gpu, lambda-labs-gpu-cloud, flash-attention, tensorrt-llm, pinecone, qdrant y nemo-curator.

Lo notable aquí no es solo la amplitud. Es que las habilidades abarcan toda la pila, desde la iteración de cuadernos hasta la curación de datos, evaluación, búsqueda vectorial, ajuste fino y optimización de inferencia. Para un usuario de plataforma de ML, Hermes deja de sentirse como un asistente y comienza a sentirse como un plano de control que puede llevar procedimientos a través del ciclo de vida. jupyter-live-kernel maneja la exploración iterativa, evaluating-llms-harness y weights-and-biases formalizan la medición, y las habilidades opcionales de cómputo y optimización permiten que Hermes hable coherentemente tanto sobre experimentación como sobre despliegue.

Este es también el perfil donde la moderación es más importante. Debido a que el catálogo opcional de MLOps es tan grande, una configuración de producción de Hermes para trabajo de ML suele beneficiarse de ser opinada sobre el alcance. Un perfil de ingeniería de plataforma que posee evaluación y despliegue no necesita cada marco de entrenamiento instalado. Un perfil de investigación que posee papers y sistemas de notas no necesita cada habilidad de base de datos vectorial. Hermes puede携带 grandes inventarios de habilidades, pero la utilidad de producción sigue viniendo de estrechar la superficie activa.

Donde las habilidades se convierten en responsabilidades

La parte más fuerte del sistema de habilidades de Hermes también es el lugar donde las configuraciones de producción salen mal. Hermes puede navegar e instalar habilidades desde su catálogo integrado, el catálogo oficial opcional, skills.sh de Vercel, puntos finales de habilidades bien conocidos, repositorios de GitHub directos y fuentes comunitarias estilo marketplace. El modelo de seguridad distingue entre fuentes builtin, official, trusted y community, ejecuta escaneos de seguridad para habilidades instaladas desde el hub y permite --force solo para bloques de política no peligrosos. Un veredicto de escaneo peligroso permanece bloqueado. Hermes también muestra metadatos upstream como URL del repositorio, instalaciones semanales y señales de auditoría durante la inspección. Eso es un modelo de confianza sólido, pero no es un sustituto del gusto.

También hay un límite a lo que se debe pedir a una habilidad. La documentación de Hermes es explícita de que las habilidades son la elección preferida cuando el trabajo puede expresarse como instrucciones más comandos de shell más herramientas existentes, mientras que los plugins son la abstracción más honesta para herramientas personalizadas, hooks y comportamiento de ciclo de vida. La guía de plugins incluso muestra cómo un plugin puede incluir su propia habilidad. En producción, eso significa que las habilidades son mejor tratadas como procedimientos reutilizables, no como un sustituto forzado para el diseño de herramientas o plugins adecuados.

La comunidad y el apoyo se ven sanos, pero no borran la velocidad de cambio. La documentación de Hermes dirige a los usuarios a Discord, Discusiones de GitHub, Incidencias y el Hub de Habilidades, y el repositorio público muestra lanzamientos frecuentes y una gran huella de contribución. La conclusión operativa es lo suficientemente simple: las actualizaciones son parte del sistema, no un evento fuera de él. Una configuración de producción real asume que los perfiles, las habilidades y los supuestos de flujo de trabajo evolucionarán, y luego usa aislamiento y paquetes de habilidades estrechos para que el cambio permanezca local cuando inevitablemente llegue.

Hermes funciona mejor cuando las habilidades se tratan como contratos procedimentales alrededor de perfiles claramente separados. El momento en que un perfil se convierte en el agente de ingeniería, el asistente de investigación, el trabajador de operaciones, el bot de buzón y la plataforma de ML todo a la vez, el sistema deja de compounding y comienza a filtrar responsabilidades. El patrón de producción limpio es menos sobre tener más habilidades y más sobre dar a cada perfil una descripción de trabajo que pueda mantener realmente.

Este artículo es parte del clúster de Sistemas de IA, que cubre asistentes autoalojados, arquitectura de recuperación, infraestructura de LLM local y observabilidad.