Сравнение провайдеров памяти для агентов — Honcho, Mem0, Hindsight и ещё пять

Восемь подключаемых бэкендов для постоянного хранения памяти агента.

Содержимое страницы

Современные ассистенты по-прежнему забывают всё, когда вы закрываете вкладку, если ничего не сохраняется за пределами окна контекста. Провайдеры памяти агентов — это сервисы или библиотеки, которые хранят факты и резюме между сессиями; они часто подключаются как плагины, чтобы фреймворк оставался легковесным, в то время как память масштабируется.

В этом руководстве сравниваются восемь бэкендов, поставляемых в качестве внешних плагинов памяти для Hermes Agent — Honcho, OpenViking, Mem0, Hindsight, Holographic, RetainDB, ByteRover и Supermemory, — и объясняется, как они встраиваются в более широкие стеки AI-систем. Те же поставщики появляются в OpenClaw и других инструментах для агентов через интеграции сообщества или официальные интеграции. В Центре памяти AI-систем эта статья указана наряду с Cognee и связанными руководствами.

Для информации о встроенной ограниченной памяти Hermes (файлы MEMORY.md и USER.md), поведении блокировки и триггерах, см. Систему памяти агента Hermes. Для контекста о том, как восемь встроенных провайдеров памяти Hermes способствуют его растущему преимуществу в принятии перед OpenClaw — включая звезды на GitHub, рейтинги токенов OpenRouter и сравнения размера экосистемы — см. OpenClaw против Hermes Agent: Звезды, загрузки и использование 2026.


Hermes Agent перечисляет восемь плагинов внешних провайдеров памяти для постоянных знаний между сессиями. Одновременно может быть активен только один внешний провайдер. Встроенные файлы MEMORY.md и USER.md остаются загруженными вместе с ним — они дополняют, а не заменяют его.

Внешние зависимости. Каждый внешний провайдер, кроме Holographic, требует как минимум одного вызова внешнего сервиса — LLM для извлечения памяти, модели эмбеддингов для семантического поиска или базы данных, такой как PostgreSQL, для хранения. Эти зависимости напрямую влияют на конфиденциальность, стоимость и возможность полностью локального размещения вашего стека памяти. Hindsight и ByteRover объединяют или устраняют большинство зависимостей; Honcho, Mem0 и Supermemory требуют наибольшего количества компонентов. Там, где провайдер поддерживает Ollama или любой endpoint, совместимый с OpenAI, вы можете направлять вызовы LLM и эмбеддингов на локальную модель и полностью сохранять данные вне сторонних серверов.

ai agent memory system providers

Активация с Hermes Agent

Шаги командной строки ниже соответствуют таблицам в Шпаргалке CLI агента Hermes.

hermes memory setup   # Интерактивный выборщик + конфигурация
hermes memory status  # Проверить, что активно
hermes memory off     # Отключить внешнего провайдера

Или вручную в ~/.hermes/config.yaml:

memory:
  provider: openviking  # или honcho, mem0, hindsight, holographic, retaindb, byterover, supermemory

Сравнение провайдеров

Провайдер Хранение Стоимость Внешние зависимости Возможность локального размещения Уникальная особенность
Honcho Облако/Локально Платно/Бесплатно LLM + Модель эмбеддингов + PostgreSQL/pgvector + Redis Да — Docker / K3s / Fly.io Диалектическое моделирование пользователя + контекст, ограниченный сессией
OpenViking Локально Бесплатно LLM (VLM) + Модель эмбеддингов Да — локальный сервер; мастер настройки Ollama-native Иерархия файловой системы + послойная загрузка
Mem0 Облако/Локально Платно/Бесплатно (OSS) LLM + Модель эмбеддингов + Векторное хранилище (Qdrant или pgvector) Да — Docker Compose OSS; возможно полностью локально Извлечение памяти на стороне сервера через LLM
Hindsight Облако/Локально Бесплатно/Платно LLM + встроенная PostgreSQL + встроенный эмбеддер + встроенный ранжировщик Да — Docker или встроенный Python; полностью локально с Ollama Граф знаний + синтез reflect
Holographic Локально Бесплатно Нет Нативно — инфраструктура не требуется Алгебра HRR + оценка доверия
RetainDB Облако $20/мес Управляемое облако (LLM + извлечение на серверах RetainDB) Нет Дельта-сжатие
ByteRover Локально/Облако Бесплатно/Платно Только LLM — без модели эмбеддингов, без БД Да — локально по умолчанию; поддерживается Ollama Контекстное дерево на основе файлов; без конвейера эмбеддингов
Supermemory Облако Платно LLM + PostgreSQL/pgvector (корпоративное развертывание Cloudflare) Только корпоративный план Ограничение контекста + импорт графа сессий

Подробный разбор

Honcho

Лучше всего подходит для: мультиагентных систем, контекста между сессиями, выравнивания пользователь-агент.

Honcho работает параллельно с существующей памятью — USER.md остается без изменений, а Honcho добавляет дополнительный слой контекста. Он моделирует разговоры как обмен сообщениями между равными — один пользовательский пир и один AI-пир на профиль Hermes, все они делят рабочее пространство.

Внешние зависимости: Honcho требует LLM для суммирования сессии, вывода представления пользователя и диалектического рассуждения; модели эмбеддингов для семантического поиска по наблюдениям; PostgreSQL с расширением pgvector для векторного хранения; и Redis для кэширования. Управляемое облако на api.honcho.dev обрабатывает все это за вас. Для локальных развертываний (Docker, K3s или Fly.io) вы предоставляете свои собственные учетные данные. Слот LLM принимает любой endpoint, совместимый с OpenAI, включая Ollama и vLLM, поэтому вывод может оставаться на-premises. Слот эмбеддингов по умолчанию использует openai/text-embedding-3-small, но поддерживает настраиваемых провайдеров через LLM_EMBEDDING_API_KEY и LLM_EMBEDDING_BASE_URL — работает любой сервер эмбеддингов, совместимый с OpenAI, включая локальные варианты, такие как vLLM с моделью BGE.

Инструменты: honcho_profile (чтение/обновление карточки пира), honcho_search (семантический поиск), honcho_context (контекст сессии — резюме, представление, карточка, сообщения), honcho_reasoning (синтезированный LLM), honcho_conclude (создание/удаление выводов).

Ключевые параметры конфигурации:

  • contextCadence (по умолчанию 1): Минимальное количество ходов между обновлениями базового слоя
  • dialecticCadence (по умолчанию 2): Минимальное количество ходов между вызовами LLM peer.chat() (рекомендуется 1-5)
  • dialecticDepth (по умолчанию 1): Проходы .chat() на один вызов (ограничено 1-3)
  • recallMode (по умолчанию ‘hybrid’): hybrid (авто+инструменты), context (только внедрение), tools (только инструменты)
  • writeFrequency (по умолчанию ‘async’): Время сброса: async, turn, session или целое число N
  • observationMode (по умолчанию ‘directional’): directional (все включено) или unified (общий пул)

Архитектура: Двухслойное внедрение контекста — базовый слой (резюме сессии + представление + карточка пира) + диалектическое дополнение (рассуждения LLM). Автоматически выбирает холодный запуск против теплых промптов.

Маппинг нескольких пиров: Рабочее пространство — это общая среда для профилей. Пользовательский пир (peerName) — это глобальная человеческая идентичность. AI-пир (aiPeer) — один на профиль Hermes (hermes по умолчанию, hermes.<profile> для других).

Настройка:

hermes memory setup  # выбрать "honcho"
# или устаревший: hermes honcho setup

Конфиг: $HERMES_HOME/honcho.json (локально для профиля) или ~/.honcho/config.json (глобально).

Управление профилями:

hermes profile create coder --clone  # Создает hermes.coder с общим рабочим пространством
hermes honcho sync                   # Заполняет AI-пиров для существующих профилей

OpenViking

Лучше всего подходит для: локального управления знаниями со структурированным просмотром.

OpenViking предоставляет иерархию файловой системы с послойной загрузкой. Он бесплатен, размещается локально и дает вам полный контроль над хранением памяти.

Внешние зависимости: OpenViking требует VLM (модель языка с визуальным восприятием) для семантической обработки и извлечения памяти, а также модель эмбеддингов для векторного поиска — оба обязательны. Поддерживаемые провайдеры VLM включают OpenAI, Anthropic, DeepSeek, Gemini, Moonshot и vLLM (для локального развертывания). Для эмбеддингов поддерживаемые провайдеры включают OpenAI, Volcengine (Doubao), Jina, Voyage и — через Ollama — любую локально обслуживаемую модель эмбеддингов. Интерактивный мастер openviking-server init может обнаружить доступную оперативную память и рекомендовать подходящие модели Ollama (например, Qwen3-Embedding 8B для эмбеддингов, Gemma 4 27B для VLM) и настроить все автоматически для полностью локальной настройки без API-ключей. Внешняя база данных не требуется; OpenViking хранит память в файловой системе.

Инструменты: viking_search, viking_read (послойно), viking_browse, viking_remember, viking_add_resource.

Настройка:

pip install openviking
openviking-server init   # интерактивный мастер (рекомендует модели Ollama для локальной настройки)
openviking-server
hermes memory setup  # выбрать "openviking"
echo "OPENVIKING_ENDPOINT=http://localhost:1933" >> ~/.hermes/.env

Mem0

Лучше всего подходит для: управления памятью без вмешательства с автоматическим извлечением.

Mem0 обрабатывает извлечение памяти на стороне сервера через вызов LLM при каждой операции add — он читает разговор, извлекает дискретные факты, удаляет дубликаты и сохраняет их. Управляемый облачный API обрабатывает всю инфраструктуру. Библиотека с открытым исходным кодом и локальный сервер дают вам полный контроль.

Внешние зависимости: Mem0 требует LLM для извлечения памяти (по умолчанию: OpenAI gpt-4.1-nano; поддерживается 20 провайдеров, включая Ollama, vLLM и LM Studio для локальных моделей) и модель эмбеддингов для извлечения (по умолчанию: OpenAI text-embedding-3-small; поддерживается 10 провайдеров, включая Ollama и HuggingFace для локальных моделей). Хранение использует Qdrant в /tmp/qdrant в режиме библиотеки или PostgreSQL с pgvector в режиме локального сервера — оба могут работать локально. Полностью локальный стек Mem0 без облака достижим: Ollama для LLM, Ollama для эмбеддингов и локальный экземпляр Qdrant, все настроено через Memory.from_config.

Инструменты: mem0_profile, mem0_search, mem0_conclude.

Настройка:

pip install mem0ai
hermes memory setup  # выбрать "mem0"
echo "MEM0_API_KEY=your-key" >> ~/.hermes/.env

Конфиг: $HERMES_HOME/mem0.json (user_id: hermes-user, agent_id: hermes).

Hindsight

Лучше всего подходит для: восстановления на основе графа знаний с отношениями сущностей.

Hindsight создает граф знаний вашей памяти, извлекая сущности и отношения. Его уникальный инструмент reflect выполняет межпамятный синтез — объединяя несколько воспоминаний в новые инсайты. Восстановление запускает четыре стратегии извлечения параллельно (семантическая, ключевое слово/BM25, обход графа, временная), затем объединяет и переупорядочивает результаты, используя взаимное ранжирование.

Внешние зависимости: Hindsight требует LLM для извлечения фактов и сущностей при вызовах retain и для синтеза при вызовах reflect (по умолчанию: OpenAI; поддерживаемые провайдеры включают Anthropic, Gemini, Groq, Ollama, LM Studio и любой endpoint, совместимый с OpenAI). Модель эмбеддингов и модель ранжирования кросс-энкодера встроены в сам Hindsight — они работают локально внутри пакета hindsight-all и не требуют внешнего API. PostgreSQL также встроен в установку Python через управляемый каталог данных pg0; вы можете alternatively указать Hindsight на внешний экземпляр PostgreSQL. Для полностью локальной настройки без облака установите HINDSIGHT_API_LLM_PROVIDER=ollama и направьте его на локальную модель Ollama — retain и recall работают полностью; reflect требует модель, способную к вызову инструментов (например, qwen3:8b).

Инструменты: hindsight_retain, hindsight_recall, hindsight_reflect (уникальный межпамятный синтез).

Настройка:

hermes memory setup  # выбрать "hindsight"
echo "HINDSIGHT_API_KEY=your-key" >> ~/.hermes/.env

Автоматически устанавливает hindsight-client (облако) или hindsight-all (локально). Требуется >= 0.4.22.

Конфиг: $HERMES_HOME/hindsight/config.json

  • mode: cloud или local
  • recall_budget: low / mid / high
  • memory_mode: hybrid / context / tools
  • auto_retain / auto_recall: true (по умолчанию)

Локальный UI: hindsight-embed -p hermes ui start

Holographic

Лучше всего подходит для: настроек, ориентированных на конфиденциальность, с исключительно локальным хранением.

Holographic использует алгебру HRR (Holographic Reduced Representation) для кодирования памяти с оценкой доверия для надежности памяти. Нет зависимости от облака — все работает локально на вашем собственном оборудовании.

Внешние зависимости: Нет. Holographic не требует LLM, модели эмбеддингов, базы данных или сетевого подключения. Кодирование памяти выполняется полностью через алгебру HRR, работающую в процессе. Это делает его уникальным среди всех восьми провайдеров — он единственный, который работает с нулевыми внешними вызовами. Компромисс заключается в том, что качество извлечения ниже, чем при семантическом поиске на основе эмбеддингов, и нет межпамятного синтеза, как reflect в Hindsight. Для пользователей, для которых конфиденциальность и работа без зависимостей являются непререкаемыми, Holographic — единственный вариант, который предоставляет это безусловно.

Инструменты: 2 инструмента для операций с памятью через алгебру HRR.

Настройка:

hermes memory setup  # выбрать "holographic"

RetainDB

Лучше всего подходит для: высокочастотных обновлений с дельта-сжатием.

RetainDB использует дельта-сжатие для эффективного хранения обновлений памяти и гибридное извлечение (вектор + BM25 + ранжирование) для выявления релевантного контекста. Это облачное решение со стоимостью $20 в месяц, при этом вся обработка памяти выполняется на стороне сервера.

Внешние зависимости: Вызовы LLM, конвейер эмбеддингов и ранжирование RetainDB выполняются на собственной облачной инфраструктуре RetainDB — вы предоставляете только RETAINDB_KEY. Извлечение памяти использует Claude Sonnet на стороне сервера. Нет опции локального размещения и нет локального режима. Все данные разговоров отправляются на серверы RetainDB для обработки и хранения. Если суверенитет данных или автономная работа важны для вашего случая использования, этот провайдер не подходит.

Инструменты: retaindb_profile (профиль пользователя), retaindb_search (семантический поиск), retaindb_context (контекст, релевантный задаче), retaindb_remember (хранить с типом + важностью), retaindb_forget (удалить воспоминания).

Настройка:

hermes memory setup  # выбрать "retaindb"

ByteRover

Лучше всего подходит для: локальной памяти с читаемым человеком, проверяемым хранением.

ByteRover хранит память как структурированное контекстное дерево markdown — иерархию файлов домена, темы и подтемы — а не векторы эмбеддингов или базу данных. LLM читает исходный контент, рассуждает о нем и помещает извлеченные знания в правильное место в иерархии. Извлечение — это полнотекстовый поиск MiniSearch с послойным резервным переключением на поиск, управляемый LLM, без необходимости векторной базы данных.

Внешние зависимости: ByteRover требует LLM для курирования памяти и поиска (поддерживается 18 провайдеров, включая Anthropic, OpenAI, Google, Ollama и любой endpoint, совместимый с OpenAI, через слот провайдера openai-compatible). Он не требует модели эмбеддингов и базы данных — контекстное дерево — это локальный каталог простых файлов markdown. Облачная синхронизация является опциональной и используется только для командного сотрудничества; все работает полностью автономно по умолчанию. Для полностью автономной локальной настройки подключите Ollama как провайдера (brv providers connect openai-compatible --base-url http://localhost:11434/v1), и никакие данные не покинут ваш компьютер.

Инструменты: 3 инструмента для операций с памятью.

Настройка:

hermes memory setup  # выбрать "byterover"

Supermemory

Лучше всего подходит для: корпоративных рабочих процессов с ограничением контекста и импортом графа сессий.

Supermemory предоставляет ограничение контекста (изоляция памяти по контексту) и импорт графа сессий (импорт всей истории разговоров). Он автоматически извлекает воспоминания, создает профили пользователей и запускает гибридное извлечение, сочетающее семантический и ключевой поиск. Управляемый облачный API является основной целью развертывания.

Внешние зависимости: Облачный сервис Supermemory обрабатывает все выводы LLM и эмбеддинги на стороне сервера — вы предоставляете только ключ API Supermemory. Локальное размещение доступно исключительно как дополнение к корпоративному плану и разворачивается на Cloudflare Workers; оно требует, чтобы вы предоставили PostgreSQL с расширением pgvector (для векторного хранения) и ключ API OpenAI (обязательно, с Anthropic и Gemini как опциональными дополнениями). Нет пути локального размещения на основе Docker — архитектура тесно связана с граничными вычислениями Cloudflare Workers. Для пользователей, которым нужен полный суверенитет данных без корпоративного контракта, этот провайдер не является правильным выбором.

Инструменты: 4 инструмента для операций с памятью.

Настройка:

hermes memory setup  # выбрать "supermemory"

Как выбрать

  • Нужна поддержка мультиагентов? Honcho
  • Хотите локально и бесплатно? OpenViking или Holographic
  • Хотите нулевую конфигурацию? Mem0
  • Хотите графы знаний? Hindsight
  • Хотите дельта-сжатие? RetainDB
  • Хотите эффективность полосы пропускания? ByteRover
  • Хотите корпоративные функции? Supermemory
  • Хотите конфиденциальность (только локально)? Holographic
  • Хотите полностью локально без внешних сервисов? Holographic (вообще без зависимостей) или Hindsight/Mem0/ByteRover с Ollama
  • Хотите читаемую человеком, проверяемую память без конвейера эмбеддингов? ByteRover

Для полных конфигураций провайдеров по профилям и реальных шаблонов рабочих процессов см. Продуктивную настройку агента Hermes.


Связанные руководства

Подписаться

Получайте новые материалы про системы, инфраструктуру и AI engineering.