Agentminnesleverantörer jämförda — Honcho, Mem0, Hindsight och fem till

Åttan inkopplingsbara backends för persistent agentminne.

Sidinnehåll

Moderna assistenter glömmer fortfarande allt när du stänger fliken om inte något överlever kontextfönstret. Tjänster för agenterminne (agent memory providers) är tjänster eller bibliotek som lagrar fakta och sammanfattningar över sessioner — ofta integrerade som plugin så att ramverket förblir lättviktigt medan minnet skalas.

Den här guiden jämför åtta backendar som levereras som externa minnesplugin för Hermes Agent — Honcho, OpenViking, Mem0, Hindsight, Holographic, RetainDB, ByteRover och Supermemory — och förklarar hur de passar in i bredare AI-system-stackar. Samma leverantörer finns även i OpenClaw och andra agentverktyg via community- eller officiella integrationer. AI-systems Memory hub listar denna artikel tillsammans med Cognee och relaterade guider.

För Hermes-specifikt begränsat kärnminne (MEMORY.md och USER.md), frysfunktioner och utlösare, se Hermes Agent Memory System. För kontext kring hur Hermes åtta inbyggda minnesleverantörer bidrar till dess ökande fördel i adoption jämfört med OpenClaw — inklusive GitHub-stjärnor, OpenRouter-tokenrankningar och jämförelser av ekosystemets storlek — se OpenClaw vs Hermes Agent: Stars, Downloads & Usage 2026.


Hermes Agent listar åtta externa minnesleverantörsplugin för bestående, över sessionsgränsen sträckande kunskap. Endast en extern leverantör kan vara aktiv i taget. De inbyggda filerna MEMORY.md och USER.md laddas fortfarande tillsammans med den — det är additivt, inte ett ersättande.

Externa beroenden. Varje extern leverantör utom Holographic kräver minst ett externt tjänstanrop — en LLM för minnesextraktion, en inbäddningsmodell (embedding model) för semantisk sökning eller en databas som PostgreSQL för lagring. Dessa beroenden har direkta konsekvenser för integritet, kostnad och om din minnesstack kan köras helt self-hosted. Hindsight och ByteRover minskar eller eliminerar flest beroenden; Honcho, Mem0 och Supermemory kräver flest komponenter. Där en leverantör stöder Ollama eller någon OpenAI-kompatibel endpoint, kan du routa LLM- och inbäddningsanrop till en lokal modell och hålla data borta från tredjepartsservrar helt.

ai agent memory system providers

Aktivering med Hermes Agent

Kommandoradstegen nedan speglar tabellerna i Hermes Agent CLI cheat sheet.

hermes memory setup   # Interaktiv valmeny + konfiguration
hermes memory status  # Kontrollera vad som är aktivt
hermes memory off     # Inaktivera extern leverantör

Eller manuellt i ~/.hermes/config.yaml:

memory:
  provider: openviking  # eller honcho, mem0, hindsight, holographic, retaindb, byterover, supermemory

Jämförelse av leverantörer

Leverantör Lagring Kostnad Externa beroenden Möjlig self-hosting Unik funktion
Honcho Moln/Self-hosted Betalt/Kostnadsfri LLM + Inbäddningsmodell + PostgreSQL/pgvector + Redis Ja — Docker / K3s / Fly.io Dialektisk användarmodellering + sessionsbaserad kontext
OpenViking Self-hosted Kostnadsfri LLM (VLM) + Inbäddningsmodell Ja — lokal server; Ollama-innat wizard Filsystemhierarki + nivåbaserad laddning
Mem0 Moln/Self-hosted Betalt/Kostnadsfri OSS LLM + Inbäddningsmodell + Vektordatabas (Qdrant eller pgvector) Ja — Docker Compose OSS; fullt lokalt möjligt Serverbaserad LLM-extraktion
Hindsight Moln/Lokal Kostnadsfri/Betalt LLM + inbunden PostgreSQL + inbyggd inbäddare + inbyggd reranker Ja — Docker eller inbäddad Python; fullt lokalt med Ollama Kunskapsgraf + reflect-syntes
Holographic Lokal Kostnadsfri Inga Nativt — ingen infrastruktur krävs HRR-algebra + förtroendepoäng
RetainDB Moln $20/mån Molnhanterad (LLM + hämtning på RetainDB:s servrar) Nej Deltakomprimering
ByteRover Lokal/Moln Kostnadsfri/Betalt Endast LLM — ingen inbäddningsmodell, ingen DB Ja — lokal först som standard; Ollama stöds Filbaserad kontextträd; ingen inbäddningspipeline
Supermemory Moln Betalt LLM + PostgreSQL/pgvector (enterprise Cloudflare-deploy) Endast enterpriseplan Kontextavskärmning + sessionsgraf-ingest

Detaljerad genomgång

Honcho

Bäst för: multi-agent-system, kontext över sessioner, användare-agent-avstämnning.

Honcho körs parallellt med befintligt minne — USER.md förblir oförändrad, och Honcho lägger till ett ytterligare kontextlager. Det modellerar samtal som jämlikar (peers) som utbyter meddelanden — en användar-peer plus en AI-peer per Hermes-profil, alla delande ett arbetsområde (workspace).

Externa beroenden: Honcho kräver en LLM för sessionssammanfattning, härledning av användarrepresentation och dialektisk resonemang; en inbäddningsmodell för semantisk sökning över observationer; PostgreSQL med pgvector-tillägget för vektorlagring; och Redis för cachning. Den hanterade molntjänsten på api.honcho.dev hanterar allt detta åt dig. För self-hosted-installationer (Docker, K3s eller Fly.io) tillhandahåller du egna autentiseringsuppgifter. LLM-slotten accepterar vilken OpenAI-kompatibel endpoint som helst, inklusive Ollama och vLLM, så att inferens kan hållas on-premises. Inbäddningsslotten standardinställning är openai/text-embedding-3-small men stödjer konfigurerbara leverantörer via LLM_EMBEDDING_API_KEY och LLM_EMBEDDING_BASE_URL — vilken OpenAI-kompatibel inbäddningsserver som helst fungerar, inklusive lokala alternativ som vLLM med en BGE-modell.

Verktyg: honcho_profile (läs/uppdatera peer-kort), honcho_search (semantisk sökning), honcho_context (sessionskontext — sammanfattning, representation, kort, meddelanden), honcho_reasoning (LLM-syntetiserad), honcho_conclude (skapa/radera slutsatser).

Viktiga konfigurationsinställningar:

  • contextCadence (standard 1): Minsta antal turar mellan uppdatering av baslagret
  • dialecticCadence (standard 2): Minsta antal turar mellan LLM-anrop till peer.chat() (1-5 rekommenderas)
  • dialecticDepth (standard 1): Antal .chat()-pass per anrop (klippt till 1-3)
  • recallMode (standard ‘hybrid’): hybrid (auto+verktyg), context (endast injicering), tools (endast verktyg)
  • writeFrequency (standard ‘async’): Uppdateringstidpunkt: async, turn, session eller heltal N
  • observationMode (standard ‘directional’): directional (allt på) eller unified (delad pool)

Arkitektur: Två-lagers kontextinjektion — baslager (sessionsammanfattning + representation + peer-kort) + dialektiskt tillägg (LLM-resonemang). Väljer automatiskt kallstart vs varma prompts.

Multi-peer-mappning: Arbetsområdet är en gemensam miljö över profiler. Användar-peer (peerName) är en global mänsklig identitet. AI-peer (aiPeer) är en per Hermes-profil (hermes som standard, hermes.<profil> för andra).

Installation:

hermes memory setup  # välj "honcho"
# eller legacy: hermes honcho setup

Konfiguration: $HERMES_HOME/honcho.json (profil-lokal) eller ~/.honcho/config.json (global).

Profilhantering:

hermes profile create coder --clone  # Skapar hermes.coder med delat arbetsområde
hermes honcho sync                   # Backfills AI-peers för befintliga profiler

OpenViking

Bäst för: self-hosted kunskapsstyrning med strukturerad navigering.

OpenViking tillhandahåller en filsystemhierarki med nivåbaserad laddning. Det är kostnadsfritt, self-hosted, och ger dig full kontroll över din minneslagring.

Externa beroenden: OpenViking kräver en VLM (vision-language model) för semantisk bearbetning och minnesextraktion, samt en inbäddningsmodell för vektorsökning — båda är obligatoriska. Stödda VLM-leverantörer inkluderar OpenAI, Anthropic, DeepSeek, Gemini, Moonshot och vLLM (för lokal distribution). För inbäddningar inkluderar stödda leverantörer OpenAI, Volcengine (Doubao), Jina, Voyage och — via Ollama — vilken lokalt serverad inbäddningsmodell som helst. Den interaktiva guiden openviking-server init kan upptäcka tillgängligt RAM och rekommendera lämpliga Ollama-modeller (t.ex. Qwen3-Embedding 8B för inbäddningar, Gemma 4 27B för VLM) och konfigurera allt automatiskt för en fullt lokal, noll-API-nyckel-installation. Ingen extern databas krävs; OpenViking lagrar minnet i filsystemet.

Verktyg: viking_search, viking_read (nivåbaserad), viking_browse, viking_remember, viking_add_resource.

Installation:

pip install openviking
openviking-server init   # interaktiv guide (rekommenderar Ollama-modeller för lokal installation)
openviking-server
hermes memory setup  # välj "openviking"
echo "OPENVIKING_ENDPOINT=http://localhost:1933" >> ~/.hermes/.env

Mem0

Bäst för: hands-off minnesstyrning med automatisk extraktion.

Mem0 hanterar minnesextraktion server-side via ett LLM-anrop vid varje add-operation — den läser samtalet, extraherar diskreta fakta, dedublicerar och lagrar dem. Den hanterade moln-API:n hanterar all infrastruktur. Det öppna källkods-biblioteket och self-hosted-servern ger dig full kontroll.

Externa beroenden: Mem0 kräver en LLM för minnesextraktion (standard: OpenAI gpt-4.1-nano; 20 leverantörer stöds, inklusive Ollama, vLLM och LM Studio för lokala modeller) och en inbäddningsmodell för hämtning (standard: OpenAI text-embedding-3-small; 10 leverantörer stöds, inklusive Ollama och HuggingFace för lokala modeller). Lagring använder Qdrant på /tmp/qdrant i biblioteksläge, eller PostgreSQL med pgvector i self-hosted serverläge — båda kan köras lokalt. En fullt lokal, noll-moln Mem0-stack är möjlig: Ollama för LLM, Ollama för inbäddningar, och en lokal Qdrant-instans, allt konfigurerat via Memory.from_config.

Verktyg: mem0_profile, mem0_search, mem0_conclude.

Installation:

pip install mem0ai
hermes memory setup  # välj "mem0"
echo "MEM0_API_KEY=your-key" >> ~/.hermes/.env

Konfiguration: $HERMES_HOME/mem0.json (user_id: hermes-user, agent_id: hermes).

Hindsight

Bäst för: minnesåterhämtning baserad på kunskapsgrafer med entitetsrelationer.

Hindsight bygger en kunskapsgraf av ditt minne, och extraherar entiteter och relationer. Dess unika verktyg reflect utför kors-minnessyntes — den kombinerar flera minnen till nya insikter. Återhämtning kör fyra hämtstrategier parallellt (semantisk, nyckelord/BM25, graftraversering, temporär), och sammanfogar sedan och omordnar resultaten med reciprocal rank fusion.

Externa beroenden: Hindsight kräver en LLM för fakta- och entitetsextraktion vid retain-anrop, och för syntes vid reflect-anrop (standard: OpenAI; stödda leverantörer inkluderar Anthropic, Gemini, Groq, Ollama, LM Studio och vilken OpenAI-kompatibel endpoint som helst). Inbäddningsmodellen och cross-encoder reranking-modellen är inbundna i Hindsight självt — de körs lokalt inom hindsight-all-paketet och kräver inga externa API:er. PostgreSQL är också inbunden med den inbäddade Python-installationen via en hanterad pg0-datamapp; du kan alternativt peka Hindsight mot en extern PostgreSQL-instans. För en fullt lokal, noll-moln-installation, sätt HINDSIGHT_API_LLM_PROVIDER=ollama och peka den mot en lokal Ollama-modell — retain och recall fungerar fullt ut; reflect kräver en modell som stödjer tool-calling (t.ex. qwen3:8b).

Verktyg: hindsight_retain, hindsight_recall, hindsight_reflect (unik kors-minnessyntes).

Installation:

hermes memory setup  # välj "hindsight"
echo "HINDSIGHT_API_KEY=your-key" >> ~/.hermes/.env

Auto-installerar hindsight-client (moln) eller hindsight-all (lokal). Kräver >= 0.4.22.

Konfiguration: $HERMES_HOME/hindsight/config.json

  • mode: cloud eller local
  • recall_budget: low / mid / high
  • memory_mode: hybrid / context / tools
  • auto_retain / auto_recall: true (standard)

Lokal UI: hindsight-embed -p hermes ui start

Holographic

Bäst för: integritetsfokuserade installationer med endast lokal lagring.

Holographic använder HRR (Holographic Reduced Representation)-algebra för minneskodning, med förtroendepoäng för minnespålitlighet. Inget molnberoende — allt körs lokalt på din egen hårdvara.

Externa beroenden: Inga. Holographic kräver ingen LLM, ingen inbäddningsmodell, ingen databas och ingen nätverksanslutning. Minneskodningen görs helt genom HRR-algebra som körs in-process. Detta gör den unik bland alla åtta leverantörer — den är den enda som opererar med noll externa anrop. Avvägningen är att återhämtningskvaliteten är lägre än inbäddningsbaserad semantisk sökning, och det finns ingen kors-minnessyntes som Hindsights reflect. För användare där integritet och noll-beroende-operation är ovillkorliga, är Holographic det enda alternativet som levererar detta ovillkorligt.

Verktyg: 2 verktyg för minnesoperationer via HRR-algebra.

Installation:

hermes memory setup  # välj "holographic"

RetainDB

Bäst för: högfrekventa uppdateringar med deltakomprimering.

RetainDB använder deltakomprimering för att effektivt lagra minnesuppdateringar och hybridhämtning (vektor + BM25 + reranking) för att framhäva relevant kontext. Det är molnbaserat med en kostnad på $20/månad, med all minnesbearbetning hanterad server-side.

Externa beroenden: RetainDB:s LLM-anrop, inbäddningspipeline och reranking körs alla på RetainDB:s egen molninfrastruktur — du tillhandahåller endast en RETAINDB_KEY. Minnesextraktion använder Claude Sonnet server-side. Det finns ingen self-hosting-alternativ och inget lokalt läge. All samtaldata skickas till RetainDB:s servrar för bearbetning och lagring. Om datasuverenitet eller offline-drift är viktigt för ditt användningsfall, är denna leverantör inte lämplig.

Verktyg: retaindb_profile (användarprofil), retaindb_search (semantisk sökning), retaindb_context (uppgiftsrelevant kontext), retaindb_remember (lagring med typ + viktighet), retaindb_forget (radera minnen).

Installation:

hermes memory setup  # välj "retaindb"

ByteRover

Bäst för: lokal först-minne med mänskligt läsbar, granskbar lagring.

ByteRover lagrar minnet som en strukturerad markdown-kontextträd — en hierarki av domän-, ämnes- och underämnesfiler — snarare än inbäddningsvektorer eller en databas. En LLM läser källinnehåll, resonemang kring det och placerar extraherad kunskap på rätt plats i hierarkin. Återhämtning är MiniSearch fulltextsökning med nivåbaserad fallback till LLM-driven sökning, utan krav på vektordatabas.

Externa beroenden: ByteRover kräver en LLM för minneskuratering och sökning (18 leverantörer stöds, inklusive Anthropic, OpenAI, Google, Ollama och vilken OpenAI-kompatibel endpoint som helst via openai-compatible-leverantörsslotten). Den kräver ingen inbäddningsmodell och ingen databas — kontextträdet är en lokal katalog med vanliga markdown-filer. Molnsynkronisering är valfri och används endast för team-samarbete; allt fungerar fullt offline som standard. För en fullt självständig lokal installation, anslut Ollama som leverantör (brv providers connect openai-compatible --base-url http://localhost:11434/v1) och ingen data lämnar din maskin.

Verktyg: 3 verktyg för minnesoperationer.

Installation:

hermes memory setup  # välj "byterover"

Supermemory

Bäst för: enterprise-flöden med kontextavskärmning och sessionsgraf-ingest.

Supermemory tillhandahåller kontextavskärmning (isolering av minne efter kontext) och sessionsgraf-ingest (import av hela samtalshistoriker). Den extraherar automatiskt minnen, bygger användarprofiler och kör hybridhämtning som kombinerar semantisk och nyckelordsbaserad sökning. Den hanterade moln-API:n är primära distributionsmålet.

Externa beroenden: Supermemory:s molntjänst hanterar all LLM-inferens och inbäddning server-side — du tillhandahåller endast en Supermemory API-nyckel. Self-hosting finns endast som ett enterprise-plan-tillägg och distribueras till Cloudflare Workers; det kräver att du tillhandahåller PostgreSQL med pgvector-tillägget (för vektorlagring) och en OpenAI API-nyckel (obligatorisk, med Anthropic och Gemini som valfria tillägg). Det finns ingen Docker-baserad eller lokal self-hosting-väg — arkitekturen är starkt kopplad till Cloudflare Workers edge compute. För användare som behöver full datasuverenitet utan ett enterprise-kontrakt, är denna leverantör inte rätt val.

Verktyg: 4 verktyg för minnesoperationer.

Installation:

hermes memory setup  # välj "supermemory"

Hur man väljer

  • Behöver multi-agent-stöd? Honcho
  • Vill ha self-hosted och kostnadsfritt? OpenViking eller Holographic
  • Vill ha noll-konfiguration? Mem0
  • Vill ha kunskapsgrafer? Hindsight
  • Vill ha deltakomprimering? RetainDB
  • Vill ha bandbreddseffektivitet? ByteRover
  • Vill ha enterprise-funktioner? Supermemory
  • Vill ha integritet (endast lokal)? Holographic
  • Vill ha fullt lokalt med noll externa tjänster? Holographic (inga beroenden alls) eller Hindsight/Mem0/ByteRover med Ollama
  • Vill ha mänskligt läsbar, granskbar minne utan inbäddningspipeline? ByteRover

För fullständiga profil-för-profil-leverantörskonfigurationer och arbetsflödesmönster i praktiken, se Hermes Agent production setup.


Relaterade guider

Prenumerera

Få nya inlägg om system, infrastruktur och AI-ingenjörskonst.