Umiejętności asystenta Hermes AI w rzeczywistych środowiskach produkcyjnych
Konfiguracje Hermes oparte na profilach dla wymagających obciążeń
Asystent AI Hermes, oficjalnie dokumentowany jako Hermes Agent, nie jest pozycjonowany jako prosty interfejs czatu.
Informacje dotyczące instalacji, konfiguracji dostawcy, piaskownicy narzędziowej oraz konfiguracji bramki można znaleźć w przewodniku po asystencie AI Hermes. Niniejszy artykuł skupia się na architekturze umiejętności i profili, która określa zachowanie Hermesa po jego uruchomieniu.
Oficjalna dokumentacja i repozytorium opisują agenta samousprawniającego się, wyposażonego w wbudowaną pętlę uczenia się. Tworzy on umiejętności na podstawie doświadczeń, udoskonala je podczas użycia, utrzymuje wiedzę między sesjami i działa na dowolnym sprzęcie – od taniego VPS po piaskownice chmurowe.

W kwietniu 2026 roku publiczne repozytorium na GitHubie wykazywało około 94,6 tys. gwiazdek, 13,2 tys. forków, a najnowszą wersję oznaczono jako v0.10.0 w dniu 16 kwietnia 2026 roku. Tak aktywny rozwój pozwala nazwać projekt szybko ewolucjonującym, dobrze przyjętym, a jednocześnie wciąż operacyjnie młodym.
Ta podwójna natura ma znaczenie dla projektowania rozwiązań produkcyjnych. Hermes jest na tyle dojrzały, aby wspierać realną pracę, ale na tyle dynamiczny, że niechlujna konfiguracja szybko stanie się przestarzała. Poniższy artykuł traktuje konfigurację i umiejętności jako pytanie o architekturę operacyjną, a nie tylko jako listę funkcji.
Dlaczego Hermes wymaga architektury opartej na profilach
Umiejętności Hermesa to dokumenty wiedzy dostępne na żądanie. Korzystają z progresywnego ujawniania treści, dzięki czemu agent widzi najpierw skompaktowaną indeksację umiejętności i ładuje pełną treść tylko wtedy, gdy jest to konieczne, co pozwala kontrolować zużycie tokenów, nawet przy zainstalowaniu wielu umiejętności. Każda zainstalowana umiejętność staje się komendą slashową w CLI i na powierzchniach komunikacyjnych, a dokumentacja wyraźnie pozycjonuje umiejętności jako preferowany mechanizm rozszerzeń, gdy dana zdolność może być wyrażona za pomocą instrukcji, komend powłoki i istniejących narzędzi, zamiast tworzenia niestandardowego kodu agenta.
Komplikacją w środowisku produkcyjnym jest fakt, że Hermes traktuje umiejętności jako stan żyjący, a nie zamrożone pakiety. Wbudowane umiejętności, umiejętności zainstalowane z hubu oraz umiejętności tworzone przez agenta znajdują się w katalogu ~/.hermes/skills/, a dokumentacja stwierdza, że agent może modyfikować lub usuwać umiejętności. Ten sam system udostępnia akcje tworzenia, łatkowania, edycji, usuwania oraz pliki pomocnicze do zarządzania umiejętnościami. Jest to potężne, ale oznacza również, że jeden przesadnie rozbudowany agent „robiony wszystko” ma tendencję do zamieniania się w chaotyczne schowisko procedur.
Rozwiązaniem są profile. Profile Hermesa to w pełni izolowane środowiska, z własnymi plikami config.yaml, .env, SOUL.md, pamięcią, sesjami, umiejętnościami, zadaniami cron i bazą danych stanu. CLI przekształca również profil w własny alias komendy, więc profil o nazwie coder staje się coder chat, coder setup, coder gateway start itd. W praktyce sprawia to, że profile są prawdziwą jednostką własności produkcyjnej, a nie pojedyncza umiejętność.
Podstawowa konfiguracja produkcyjna
Podstawowa struktura jest zaskakująco czysta. Hermes przechowuje zachowanie niesecretowe w ~/.hermes/config.yaml, sekrety w ~/.hermes/.env, tożsamość w SOUL.md, trwałe fakty w memories/, wiedzę proceduralną w skills/, zadania zaplanowane w cron/, sesje w sessions/ oraz logi w logs/. Komenda hermes config set kieruje klucze API do .env, a resztę do config.yaml. Dokumentowana kolejność pierwszeństwa to: flagi CLI, następnie config.yaml, następnie .env, a na końcu domyślne ustawienia wbudowane. Jest to również najczystsza odpowiedź na częste pytanie produkcyjne dotyczące podziału sekretów i konfiguracji.
Praktyczny układ wieloprofilowy zwykle wygląda mniej więcej tak, z jednym profilem na odpowiedzialność, a nie jednym profilem na człowieka:
~/.hermes/profiles/
eng/
research/
ops/
execops/
ml/
Ten wzorzec pasuje do tego, jak profile Hermesa są dokumentowane: każdy profil to własne izolowane środowisko, a profile można klonować z konfiguracji bazowej, gdy przydatne są wspólne domyślne ustawienia. Dokumentacja wskazuje również, że profile nie współdzielą pamięci ani sesji, oraz że zaktualizowane umiejętności mogą być synchronizowane między profilami po aktualizacji głównej instalacji.
Następnym produkcyjnym ograniczeniem jest wykonanie. Hermes obsługuje sześć backendów terminalowych – lokalny, Docker, SSH, Modal, Daytona i Singularity – a dokumentacja bezpieczeństwa opisuje model obrony w głębi, który obejmuje zatwierdzanie niebezpiecznych komend, izolację kontenerów, filtrowanie poświadczeń MCP, skanowanie plików kontekstowych, izolację między sesjami oraz oczyszczanie wejścia. Innymi słowy, decyzja „profil first” odpowiada na pytanie, kto jest właścicielem stanu, a decyzja o backendzie odpowiada na pytanie, gdzie dozwolone jest wykonywanie ryzykownych zadań.
Automatyzacja opiera się na tej podstawie. Zadania cron Hermesa mogą mieć przypisane zero, jedno lub wiele umiejętności i są uruchamiane w nowych sesjach agenta, zamiast dziedziczyć bieżący czat. Bramka wiadomości jest również procesem w tle, który zarządza sesjami, uruchamia cron i przekierowuje wyniki do platform takich jak Telegram, Discord, Slack, WhatsApp, Email, Matrix i innych. Oficjalny przewodnik MCP dodaje jeszcze jedną łatwą do przeoczenia zasadę produkcyjną: najlepszym wzorcem nie jest łączenie wszystkiego, ale ekspozycja najmniejszej użytecznej powierzchni.
Profil inżynierii oprogramowania
Najbardziej oczywistą personą Hermesa jest inżynier oprogramowania, który chce, aby agent zachowywał się mniej jak okno czatu, a bardziej jak powtarzalny operator repozytorium. Ten profil zazwyczaj koncentruje się na uwierzytelnianiu repozytorium, triażu problemów, tworzeniu PR, recenzji kodu, debugowaniu i wykonaniu opartym na planach. W katalogach Hermesa podstawowy wbudowany pakiet umiejętności jest niezwykłe spójny dla tej pracy: github-auth, github-issues, github-pr-workflow, github-code-review, code-review, plan, writing-plans, systematic-debugging oraz test-driven-development. Jeśli delegacja ma znaczenie, Hermes dostarcza również wbudowane umiejętności autonomicznych agentów, takie jak codex, claude-code, opencode i hermes-agent-spawning.
To, co czyni ten pakiet przydatnym, to nie pojedyncza umiejętność, ale sposób, w jaki umiejętności kodują procedury deweloperskie. github-pr-workflow obejmuje cały cykl życia PR, github-issues formalizuje operacje na problemach, github-code-review i code-review czynią recenzję odrębnym krokiem, a nie czymś dołożonym z grubsza, a systematic-debugging zapobiega skakaniu agenta do przedwczesnych napraw. Odpowiada to również na praktyczne pytanie, które umiejętności asystenta AI są najważniejsze w przepływach pracy kodowania. Najbardziej wartościowe umiejętności to zazwyczaj te, które narzucają higienę repozytorium i dyscyplinę recenzji, a nie te, które obiecują większą generację surowego kodu.
Delegacja w Hermesie dodatkowo wzmacnia ten profil. Platforma może tworzyć izolowane child-agenty z własną konwersacją, sesją terminalową i zestawem narzędzi, a do rodzica wracana jest tylko końcowa podsumowanie. Dla baz kodu jest to czystsze rozwiązanie niż wpakowywanie każdej pośredniej różnicy, śladu stosu i notatki z recenzji do jednej konwersacji. W terminach produkcyjnych profil inżynierski korzyści z wąskich zestawów umiejętności, sandboxowanego backendu, takiego jak Docker lub SSH, oraz hojnego wykorzystania delegacji, gdy szum kontekstowy zaczyna dominować.
Profil badawczy i wiedzy
Profil badawczy to miejsce, gdzie Hermes zaczyna czuć się odmiennie od zwykłych asystentów. Wbudowane katalogi zawierają już arxiv, duckduckgo-search, blogwatcher, llm-wiki, ocr-and-documents, obsidian, domain-intel i ml-paper-writing, podczas gdy oficjalny opcjonalny katalog dodaje qmd, parallel-cli, scrapling oraz szerszą warstwę badawczą dla specjalistycznych domen. Ten stos obejmuje wyszukiwanie artykułów, monitorowanie źródeł, OCR, lokalne systemy notatek, rekonstrukcję domen, pisanie i hybrydowe odzyskiwanie, bez wymuszania wszystkiego na pojedynczy wzorzec RAG.
Ten profil jest również najjaśniejszym miejscem do odpowiedzi na pytanie o pamięć versus umiejętności. Dokumentacja Hermesa definiuje pamięć jako fakty o użytkownikach, projektach i preferencjach, podczas gdy umiejętności przechowują procedury dotyczące tego, jak robić rzeczy. Praca badawcza potrzebuje obu. Pamięć przechowuje to, co asystent już wynegocjował o domenie i preferencjach czytelnika; umiejętności kodują powtarzalne procedury, takie jak „przeskanuj arXiv, podsumuj nowe artykuły i zapisz notatki do Obsidiana”. To rozróżnienie ma znaczenie, ponieważ produkcyjne systemy badawcze zawodzą, gdy wszystko jest traktowane jako pamięć lub wszystko jest traktowane jako przepływ pracy. Hermes daje tym zmartczeniom osobne domy. Pełny techniczny obraz tego, jak działa pamięć – architekturę dwóch plików, limity znaków, prefiksowe cache i wszystkie osiem opcji zewnętrznych dostawców – można znaleźć w Systemie pamięci agenta Hermes.
Profil badawczy czerpie również nieproporcjonalnie dużo korzyści z cron. Zadania cron Hermesa mogą jawnie ładować umiejętności przed wykonaniem, a przewodniki automatyzacji podkreślają, że zaplanowane prompty muszą być w pełni samodzielne, ponieważ są uruchamiane w nowych sesjach. Powtarzalny potok łączący blogwatcher, arxiv, obsidian lub llm-wiki jest więc bardziej niezawodny niż niejasne zadanie „sprawdź, co się zmieniło dzisiaj”. Innymi słowy, profile badawcze działają najlepiej, gdy odkrywanie źródeł, zapisywanie notatek i długoterminowe przechowywanie są reprezentowane przez nazwane umiejętności, a nie ukryte wewnątrz jednego długiego promptu języka naturalnego.
Profil automatyzacji i operacji
Profil operacyjny jest mniej glamour, ale często bardziej wartościowy. To użytkownik, który chce, aby Hermes reagował na zdarzenia, inspekcjonował systemy, uruchamiał skryptowane kontrole, przekierowywał wyjście do kanału i robił wszystko to bez zamieniania hosta w zobowiązanie. Hermes ma odpowiednie elementy budowlane dla tego stylu pracy: wbudowane webhook-subscriptions do aktywacji napędzanej zdarzeniami, wbudowane native-mcp i mcporter do narzędzi opartych na MCP, a także oficjalne opcjonalne umiejętności, takie jak docker-management, fastmcp, cli i 1password, gdy przepływ pracy rozszerza się na kontenery, niestandardowe serwery MCP lub wstrzykiwanie sekretów.
Powodem, dla którego ten pakiet działa, jest fakt, że każda umiejętność posiada jedną granicę. webhook-subscriptions obsługuje przychodzące sygnały z zewnętrznych systemów. docker-management przekształcza kontenerowe czynności w nazwaną procedurę, zamiast gry w wolną formę powłoki. fastmcp jest przydatny, gdy Hermes musi stać się orkiestratorem wokół nowych narzędzi MCP, a 1password utrzymuje obsługę sekretów jawną, zamiast ukrywać ją w historii powłoki lub plikach markdown. Oficjalne wskazówki MCP wzmacniają tę samą intuicję produkcyjną: podłącz odpowiednią rzecz z najmniejszą użyteczną powierzchnią.
Ten profil jest również najczystszym miejscem do odpowiedzi na pytanie, jak zaplanowane przepływy pracy AI pozostają niezawodne. Dokumentacja cron Hermesa mówi, że zadania są uruchamiane w nowych sesjach, mogą mieć przypisane jedną lub więcej umiejętności i powinny używać samodzielnych promptów. Przewodnik rozwiązywania problemów cron dodaje, że automatyczne odpalanie zależy od tickera bramki, a nie od zwykłej sesji czatu CLI. Niezawodny wzorzec jest więc prosty, nawet jeśli implementacja nie jest: jawne umiejętności, jawny cel dostawy, samodzielny prompt, izolowany backend i bramka, która jest faktycznie uruchomiona.
Profil operacji wykonawczych
Istnieje cichsza, ale bardzo realna persona Hermesa, która wygląda jak szef sztabu, lider operacyjny lub mocno przeciążony założyciel. Odpowiednie umiejętności są mniej efektowne i bardziej biurowe: google-workspace, notion, linear, nano-pdf, powerpoint oraz wbudowana umiejętność emailowa himalaya, plus oficjalne opcjonalne umiejętności, takie jak agentmail, telephony i one-three-one-rule. Ta mieszanka daje Hermesowi dostęp do skrzynki odbiorczej, kalendarza, dokumentów, zadań, prezentacji, porządkowania PDF, strukturyzowanego frameworku komunikacyjnego, a nawet przepływów pracy telefonicznych i SMS, gdzie to naprawdę ma znaczenie.
Strumień tutaj jest ważniejszy niż katalog. google-workspace kotwiczy codzienną egzekucję. Notion i Linear zapobiegają temu, by asystent stał się systemem zadań do zapisu. one-three-one-rule jest zaskakująco przydatna, ponieważ wsparcie decyzyjne jest często najtrudniejsze do ustandaryzowania, a ta umiejętność daje Hermesowi nazwaną procedurę dla propozycji, zamiast generycznego zachowania „podsumuj to”. nano-pdf i powerpoint to rodzaj operacyjnych mnożników, które wydają się małe, dopóki zespół nie zacznie codziennie dotykać prezentacji i PDF.
Funkcje wiadomości i głosu Hermesa czynią ten profil bardziej praktycznym, niż się wydaje na pierwszy rzut oka. Bramka może eksponować agenta przez Slack, Telegram, Discord, WhatsApp, Email, Matrix i kilka innych kanałów, a stos głosowy obsługuje wejście mikrofonowe, wypowiedziane odpowiedzi w wiadomościach i żywe rozmowy głosowe na Discordzie. Dokumentacja wskazuje również, że jedna instancja Hermesa może obsługiwać wielu użytkowników za pomocą list dozwolonych i parowania DM, podczas gdy tokeny botów pozostają wykluczne dla pojedynczego profilu. Dlatego wdrożenie o dużej ilości komunikacji zazwyczaj korzyści z co najmniej jednego dedykowanego profilu, zamiast dzielenia tej samej tożsamości bota z inżynierią lub operacjami.
Profil platformy ML i danych
Hermes jest budowany przez laboratorium badawcze, a ta linia pokazuje się. Katalogi zawierają jupyter-live-kernel do pracy w stylu notatników stanowych, huggingface-hub do operacji na modelach i zbiorach danych, evaluating-llms-harness i weights-and-biases do ewaluacji i śledzenia eksperymentów, qdrant-vector-search do produkcyjnego magazynu RAG, a także dużą wbudowaną i opcjonalną warstwę MLOps z umiejętnościami takimi jak axolotl, fine-tuning-with-trl, modal-serverless-gpu, lambda-labs-gpu-cloud, flash-attention, tensorrt-llm, pinecone, qdrant i nemo-curator.
To, co tu godne uwagi, to nie tylko zakres. To fakt, że umiejętności obejmują cały stos od iteracji notatników, przez kurację danych, ewaluację, wyszukiwanie wektorowe, fine-tuning, po optymalizację wnioskowania. Dla użytkownika platformy ML, Hermes przestaje czuć się jak asystent i zaczyna czuć się jak płaszczyzna kontrolna, która może przenosić procedury przez cykl życia. jupyter-live-kernel obsługuje eksplorację iteracyjną, evaluating-llms-harness i weights-and-biases formalizują pomiar, a opcjonalne umiejętności obliczeniowe i optymalizacyjne pozwalają Hermesowi spójnie rozmawiać zarówno o eksperymentach, jak i wdrożeniach.
To również profil, gdzie opanowanie ma największe znaczenie. Ponieważ opcjalny katalog MLOps jest tak duży, produkcyjny setup Hermesa do pracy ML zazwyczaj korzyści z bycia opiniotwórczym co do zakresu. Profil inżynierii platformy, który zajmuje się ewaluacją i wdrożeniem, nie potrzebuje każdej instalowanej ramy treningowej. Profil badawczy, który zajmuje się artykułami i systemami notatek, nie potrzebuje każdej umiejętności bazy wektorowej. Hermes może unieść ogromne inwentarze umiejętności, ale produkcyjna użyteczność nadal pochodzi z zawężania aktywnej powierzchni.
Gdzie umiejętności stają się zobowiązaniami
Najsilniejszą częścią systemu umiejętności Hermesa jest również miejsce, gdzie setupy produkcyjne idą źle. Hermes może przeglądać i instalować umiejętności ze wbudowanego katalogu, oficjalnego opcjonalnego katalogu, skills.sh Vercel, dobrze znanych punktów końcowych umiejętności, bezpośrednich repozytoriów GitHub i społecznościowych źródeł w stylu marketplace. Model bezpieczeństwa rozróżnia źródła builtin, official, trusted i community, uruchamia skany bezpieczeństwa dla umiejętności zainstalowanych z hubu i pozwala --force tylko dla niebezpiecznych bloków polityki. Niebezpieczna werdykt skanu pozostaje zablokowany. Hermes ujawnia również metadane upstream, takie jak URL repozytorium, tygodniowe instalacje i sygnały audytu podczas inspekcji. To solidny model zaufania, ale nie zastępuje smaku.
Istnieje również ograniczenie tego, czego można poprosić umiejętność. Dokumentacja Hermesa jest jawna, że umiejętności są preferowanym wyborem, gdy zadanie można wyrazić jako instrukcje plus komendy powłoki plus istniejące narzędzia, podczas gdy wtyczki są bardziej uczciwą abstrakcją dla niestandardowych narzędzi, haków i zachowań cyklu życia. Przewodnik po wtyczkach nawet pokazuje, jak wtyczka może spakować własną umiejętność. W produkcji oznacza to, że umiejętności są najlepiej traktowane jako wielokrotnego użytku procedury, a nie wymuszone substytut dla właściwego projektowania narzędzi lub wtyczek.
Społeczność i wsparcie wyglądają zdrowo, ale nie usuwają prędkości zmian. Dokumentacja Hermesa kieruje użytkowników do Discorda, Dyskusji GitHub, Problemów i Huba Umiejętności, a publiczne repozytorium pokazuje częste wydania i duży ślad wkładu. Operacyjne wnioski są proste: aktualizacje są częścią systemu, a nie wydarzeniem poza nim. Realny setup produkcyjny zakłada, że profile, umiejętności i założenia przepływu pracy będą ewoluować, a następnie używa izolacji i wąskich pakietów umiejętności, aby zmiana pozostawała lokalna, gdy nieuchronnie nadejdzie.
Hermes działa najlepiej, gdy umiejętności są traktowane jako umowy proceduralne wokół wyraźnie oddzielonych profili. Moment, w którym jeden profil staje się agentem inżynierskim, asystentem badawczym, pracownikiem operacyjnym, botem skrzynki odbiorczej i platformą ML jednocześnie, system przestaje kumuluć i zaczyna przeciekać odpowiedzialności. Czysty wzorzec produkcyjny dotyczy mniej posiadania więcej umiejętności, a bardziej nadawania każdemu profilowi opisu pracy, który może faktycznie utrzymać.
Ten artykuł jest częścią klastra Systemy AI, który obejmuje samohostowane asystenty, architekturę odzyskiwania, lokalną infrastrukturę LLM i obserwowalność.