Сравнение провайдеров памяти для агентов — Honcho, Mem0, Hindsight и ещё пять
Восемь подключаемых бэкендов для постоянного хранения памяти агента.
Современные ассистенты по-прежнему забывают всё, когда вы закрываете вкладку, если ничего не сохраняется за пределами окна контекста. Провайдеры памяти агентов — это сервисы или библиотеки, которые хранят факты и резюме между сессиями; они часто подключаются как плагины, чтобы фреймворк оставался легковесным, в то время как память масштабируется.
В этом руководстве сравниваются восемь бэкендов, поставляемых в качестве внешних плагинов памяти для Hermes Agent — Honcho, OpenViking, Mem0, Hindsight, Holographic, RetainDB, ByteRover и Supermemory, — и объясняется, как они встраиваются в более широкие стеки AI-систем. Те же поставщики появляются в OpenClaw и других инструментах для агентов через интеграции сообщества или официальные интеграции. В Центре памяти AI-систем эта статья указана наряду с Cognee и связанными руководствами.
Для информации о встроенной ограниченной памяти Hermes (файлы MEMORY.md и USER.md), поведении блокировки и триггерах, см. Систему памяти агента Hermes. Для контекста о том, как восемь встроенных провайдеров памяти Hermes способствуют его растущему преимуществу в принятии перед OpenClaw — включая звезды на GitHub, рейтинги токенов OpenRouter и сравнения размера экосистемы — см. OpenClaw против Hermes Agent: Звезды, загрузки и использование 2026.
Hermes Agent перечисляет восемь плагинов внешних провайдеров памяти для постоянных знаний между сессиями. Одновременно может быть активен только один внешний провайдер. Встроенные файлы MEMORY.md и USER.md остаются загруженными вместе с ним — они дополняют, а не заменяют его.
Внешние зависимости. Каждый внешний провайдер, кроме Holographic, требует как минимум одного вызова внешнего сервиса — LLM для извлечения памяти, модели эмбеддингов для семантического поиска или базы данных, такой как PostgreSQL, для хранения. Эти зависимости напрямую влияют на конфиденциальность, стоимость и возможность полностью локального размещения вашего стека памяти. Hindsight и ByteRover объединяют или устраняют большинство зависимостей; Honcho, Mem0 и Supermemory требуют наибольшего количества компонентов. Там, где провайдер поддерживает Ollama или любой endpoint, совместимый с OpenAI, вы можете направлять вызовы LLM и эмбеддингов на локальную модель и полностью сохранять данные вне сторонних серверов.

Активация с Hermes Agent
Шаги командной строки ниже соответствуют таблицам в Шпаргалке CLI агента Hermes.
hermes memory setup # Интерактивный выборщик + конфигурация
hermes memory status # Проверить, что активно
hermes memory off # Отключить внешнего провайдера
Или вручную в ~/.hermes/config.yaml:
memory:
provider: openviking # или honcho, mem0, hindsight, holographic, retaindb, byterover, supermemory
Сравнение провайдеров
| Провайдер | Хранение | Стоимость | Внешние зависимости | Возможность локального размещения | Уникальная особенность |
|---|---|---|---|---|---|
| Honcho | Облако/Локально | Платно/Бесплатно | LLM + Модель эмбеддингов + PostgreSQL/pgvector + Redis | Да — Docker / K3s / Fly.io | Диалектическое моделирование пользователя + контекст, ограниченный сессией |
| OpenViking | Локально | Бесплатно | LLM (VLM) + Модель эмбеддингов | Да — локальный сервер; мастер настройки Ollama-native | Иерархия файловой системы + послойная загрузка |
| Mem0 | Облако/Локально | Платно/Бесплатно (OSS) | LLM + Модель эмбеддингов + Векторное хранилище (Qdrant или pgvector) | Да — Docker Compose OSS; возможно полностью локально | Извлечение памяти на стороне сервера через LLM |
| Hindsight | Облако/Локально | Бесплатно/Платно | LLM + встроенная PostgreSQL + встроенный эмбеддер + встроенный ранжировщик | Да — Docker или встроенный Python; полностью локально с Ollama | Граф знаний + синтез reflect |
| Holographic | Локально | Бесплатно | Нет | Нативно — инфраструктура не требуется | Алгебра HRR + оценка доверия |
| RetainDB | Облако | $20/мес | Управляемое облако (LLM + извлечение на серверах RetainDB) | Нет | Дельта-сжатие |
| ByteRover | Локально/Облако | Бесплатно/Платно | Только LLM — без модели эмбеддингов, без БД | Да — локально по умолчанию; поддерживается Ollama | Контекстное дерево на основе файлов; без конвейера эмбеддингов |
| Supermemory | Облако | Платно | LLM + PostgreSQL/pgvector (корпоративное развертывание Cloudflare) | Только корпоративный план | Ограничение контекста + импорт графа сессий |
Подробный разбор
Honcho
Лучше всего подходит для: мультиагентных систем, контекста между сессиями, выравнивания пользователь-агент.
Honcho работает параллельно с существующей памятью — USER.md остается без изменений, а Honcho добавляет дополнительный слой контекста. Он моделирует разговоры как обмен сообщениями между равными — один пользовательский пир и один AI-пир на профиль Hermes, все они делят рабочее пространство.
Внешние зависимости: Honcho требует LLM для суммирования сессии, вывода представления пользователя и диалектического рассуждения; модели эмбеддингов для семантического поиска по наблюдениям; PostgreSQL с расширением pgvector для векторного хранения; и Redis для кэширования. Управляемое облако на api.honcho.dev обрабатывает все это за вас. Для локальных развертываний (Docker, K3s или Fly.io) вы предоставляете свои собственные учетные данные. Слот LLM принимает любой endpoint, совместимый с OpenAI, включая Ollama и vLLM, поэтому вывод может оставаться на-premises. Слот эмбеддингов по умолчанию использует openai/text-embedding-3-small, но поддерживает настраиваемых провайдеров через LLM_EMBEDDING_API_KEY и LLM_EMBEDDING_BASE_URL — работает любой сервер эмбеддингов, совместимый с OpenAI, включая локальные варианты, такие как vLLM с моделью BGE.
Инструменты: honcho_profile (чтение/обновление карточки пира), honcho_search (семантический поиск), honcho_context (контекст сессии — резюме, представление, карточка, сообщения), honcho_reasoning (синтезированный LLM), honcho_conclude (создание/удаление выводов).
Ключевые параметры конфигурации:
contextCadence(по умолчанию 1): Минимальное количество ходов между обновлениями базового слояdialecticCadence(по умолчанию 2): Минимальное количество ходов между вызовами LLMpeer.chat()(рекомендуется 1-5)dialecticDepth(по умолчанию 1): Проходы.chat()на один вызов (ограничено 1-3)recallMode(по умолчанию ‘hybrid’):hybrid(авто+инструменты),context(только внедрение),tools(только инструменты)writeFrequency(по умолчанию ‘async’): Время сброса:async,turn,sessionили целое число NobservationMode(по умолчанию ‘directional’):directional(все включено) илиunified(общий пул)
Архитектура: Двухслойное внедрение контекста — базовый слой (резюме сессии + представление + карточка пира) + диалектическое дополнение (рассуждения LLM). Автоматически выбирает холодный запуск против теплых промптов.
Маппинг нескольких пиров: Рабочее пространство — это общая среда для профилей. Пользовательский пир (peerName) — это глобальная человеческая идентичность. AI-пир (aiPeer) — один на профиль Hermes (hermes по умолчанию, hermes.<profile> для других).
Настройка:
hermes memory setup # выбрать "honcho"
# или устаревший: hermes honcho setup
Конфиг: $HERMES_HOME/honcho.json (локально для профиля) или ~/.honcho/config.json (глобально).
Управление профилями:
hermes profile create coder --clone # Создает hermes.coder с общим рабочим пространством
hermes honcho sync # Заполняет AI-пиров для существующих профилей
OpenViking
Лучше всего подходит для: локального управления знаниями со структурированным просмотром.
OpenViking предоставляет иерархию файловой системы с послойной загрузкой. Он бесплатен, размещается локально и дает вам полный контроль над хранением памяти.
Внешние зависимости: OpenViking требует VLM (модель языка с визуальным восприятием) для семантической обработки и извлечения памяти, а также модель эмбеддингов для векторного поиска — оба обязательны. Поддерживаемые провайдеры VLM включают OpenAI, Anthropic, DeepSeek, Gemini, Moonshot и vLLM (для локального развертывания). Для эмбеддингов поддерживаемые провайдеры включают OpenAI, Volcengine (Doubao), Jina, Voyage и — через Ollama — любую локально обслуживаемую модель эмбеддингов. Интерактивный мастер openviking-server init может обнаружить доступную оперативную память и рекомендовать подходящие модели Ollama (например, Qwen3-Embedding 8B для эмбеддингов, Gemma 4 27B для VLM) и настроить все автоматически для полностью локальной настройки без API-ключей. Внешняя база данных не требуется; OpenViking хранит память в файловой системе.
Инструменты: viking_search, viking_read (послойно), viking_browse, viking_remember, viking_add_resource.
Настройка:
pip install openviking
openviking-server init # интерактивный мастер (рекомендует модели Ollama для локальной настройки)
openviking-server
hermes memory setup # выбрать "openviking"
echo "OPENVIKING_ENDPOINT=http://localhost:1933" >> ~/.hermes/.env
Mem0
Лучше всего подходит для: управления памятью без вмешательства с автоматическим извлечением.
Mem0 обрабатывает извлечение памяти на стороне сервера через вызов LLM при каждой операции add — он читает разговор, извлекает дискретные факты, удаляет дубликаты и сохраняет их. Управляемый облачный API обрабатывает всю инфраструктуру. Библиотека с открытым исходным кодом и локальный сервер дают вам полный контроль.
Внешние зависимости: Mem0 требует LLM для извлечения памяти (по умолчанию: OpenAI gpt-4.1-nano; поддерживается 20 провайдеров, включая Ollama, vLLM и LM Studio для локальных моделей) и модель эмбеддингов для извлечения (по умолчанию: OpenAI text-embedding-3-small; поддерживается 10 провайдеров, включая Ollama и HuggingFace для локальных моделей). Хранение использует Qdrant в /tmp/qdrant в режиме библиотеки или PostgreSQL с pgvector в режиме локального сервера — оба могут работать локально. Полностью локальный стек Mem0 без облака достижим: Ollama для LLM, Ollama для эмбеддингов и локальный экземпляр Qdrant, все настроено через Memory.from_config.
Инструменты: mem0_profile, mem0_search, mem0_conclude.
Настройка:
pip install mem0ai
hermes memory setup # выбрать "mem0"
echo "MEM0_API_KEY=your-key" >> ~/.hermes/.env
Конфиг: $HERMES_HOME/mem0.json (user_id: hermes-user, agent_id: hermes).
Hindsight
Лучше всего подходит для: восстановления на основе графа знаний с отношениями сущностей.
Hindsight создает граф знаний вашей памяти, извлекая сущности и отношения. Его уникальный инструмент reflect выполняет межпамятный синтез — объединяя несколько воспоминаний в новые инсайты. Восстановление запускает четыре стратегии извлечения параллельно (семантическая, ключевое слово/BM25, обход графа, временная), затем объединяет и переупорядочивает результаты, используя взаимное ранжирование.
Внешние зависимости: Hindsight требует LLM для извлечения фактов и сущностей при вызовах retain и для синтеза при вызовах reflect (по умолчанию: OpenAI; поддерживаемые провайдеры включают Anthropic, Gemini, Groq, Ollama, LM Studio и любой endpoint, совместимый с OpenAI). Модель эмбеддингов и модель ранжирования кросс-энкодера встроены в сам Hindsight — они работают локально внутри пакета hindsight-all и не требуют внешнего API. PostgreSQL также встроен в установку Python через управляемый каталог данных pg0; вы можете alternatively указать Hindsight на внешний экземпляр PostgreSQL. Для полностью локальной настройки без облака установите HINDSIGHT_API_LLM_PROVIDER=ollama и направьте его на локальную модель Ollama — retain и recall работают полностью; reflect требует модель, способную к вызову инструментов (например, qwen3:8b).
Инструменты: hindsight_retain, hindsight_recall, hindsight_reflect (уникальный межпамятный синтез).
Настройка:
hermes memory setup # выбрать "hindsight"
echo "HINDSIGHT_API_KEY=your-key" >> ~/.hermes/.env
Автоматически устанавливает hindsight-client (облако) или hindsight-all (локально). Требуется >= 0.4.22.
Конфиг: $HERMES_HOME/hindsight/config.json
mode:cloudилиlocalrecall_budget:low/mid/highmemory_mode:hybrid/context/toolsauto_retain/auto_recall:true(по умолчанию)
Локальный UI: hindsight-embed -p hermes ui start
Holographic
Лучше всего подходит для: настроек, ориентированных на конфиденциальность, с исключительно локальным хранением.
Holographic использует алгебру HRR (Holographic Reduced Representation) для кодирования памяти с оценкой доверия для надежности памяти. Нет зависимости от облака — все работает локально на вашем собственном оборудовании.
Внешние зависимости: Нет. Holographic не требует LLM, модели эмбеддингов, базы данных или сетевого подключения. Кодирование памяти выполняется полностью через алгебру HRR, работающую в процессе. Это делает его уникальным среди всех восьми провайдеров — он единственный, который работает с нулевыми внешними вызовами. Компромисс заключается в том, что качество извлечения ниже, чем при семантическом поиске на основе эмбеддингов, и нет межпамятного синтеза, как reflect в Hindsight. Для пользователей, для которых конфиденциальность и работа без зависимостей являются непререкаемыми, Holographic — единственный вариант, который предоставляет это безусловно.
Инструменты: 2 инструмента для операций с памятью через алгебру HRR.
Настройка:
hermes memory setup # выбрать "holographic"
RetainDB
Лучше всего подходит для: высокочастотных обновлений с дельта-сжатием.
RetainDB использует дельта-сжатие для эффективного хранения обновлений памяти и гибридное извлечение (вектор + BM25 + ранжирование) для выявления релевантного контекста. Это облачное решение со стоимостью $20 в месяц, при этом вся обработка памяти выполняется на стороне сервера.
Внешние зависимости: Вызовы LLM, конвейер эмбеддингов и ранжирование RetainDB выполняются на собственной облачной инфраструктуре RetainDB — вы предоставляете только RETAINDB_KEY. Извлечение памяти использует Claude Sonnet на стороне сервера. Нет опции локального размещения и нет локального режима. Все данные разговоров отправляются на серверы RetainDB для обработки и хранения. Если суверенитет данных или автономная работа важны для вашего случая использования, этот провайдер не подходит.
Инструменты: retaindb_profile (профиль пользователя), retaindb_search (семантический поиск), retaindb_context (контекст, релевантный задаче), retaindb_remember (хранить с типом + важностью), retaindb_forget (удалить воспоминания).
Настройка:
hermes memory setup # выбрать "retaindb"
ByteRover
Лучше всего подходит для: локальной памяти с читаемым человеком, проверяемым хранением.
ByteRover хранит память как структурированное контекстное дерево markdown — иерархию файлов домена, темы и подтемы — а не векторы эмбеддингов или базу данных. LLM читает исходный контент, рассуждает о нем и помещает извлеченные знания в правильное место в иерархии. Извлечение — это полнотекстовый поиск MiniSearch с послойным резервным переключением на поиск, управляемый LLM, без необходимости векторной базы данных.
Внешние зависимости: ByteRover требует LLM для курирования памяти и поиска (поддерживается 18 провайдеров, включая Anthropic, OpenAI, Google, Ollama и любой endpoint, совместимый с OpenAI, через слот провайдера openai-compatible). Он не требует модели эмбеддингов и базы данных — контекстное дерево — это локальный каталог простых файлов markdown. Облачная синхронизация является опциональной и используется только для командного сотрудничества; все работает полностью автономно по умолчанию. Для полностью автономной локальной настройки подключите Ollama как провайдера (brv providers connect openai-compatible --base-url http://localhost:11434/v1), и никакие данные не покинут ваш компьютер.
Инструменты: 3 инструмента для операций с памятью.
Настройка:
hermes memory setup # выбрать "byterover"
Supermemory
Лучше всего подходит для: корпоративных рабочих процессов с ограничением контекста и импортом графа сессий.
Supermemory предоставляет ограничение контекста (изоляция памяти по контексту) и импорт графа сессий (импорт всей истории разговоров). Он автоматически извлекает воспоминания, создает профили пользователей и запускает гибридное извлечение, сочетающее семантический и ключевой поиск. Управляемый облачный API является основной целью развертывания.
Внешние зависимости: Облачный сервис Supermemory обрабатывает все выводы LLM и эмбеддинги на стороне сервера — вы предоставляете только ключ API Supermemory. Локальное размещение доступно исключительно как дополнение к корпоративному плану и разворачивается на Cloudflare Workers; оно требует, чтобы вы предоставили PostgreSQL с расширением pgvector (для векторного хранения) и ключ API OpenAI (обязательно, с Anthropic и Gemini как опциональными дополнениями). Нет пути локального размещения на основе Docker — архитектура тесно связана с граничными вычислениями Cloudflare Workers. Для пользователей, которым нужен полный суверенитет данных без корпоративного контракта, этот провайдер не является правильным выбором.
Инструменты: 4 инструмента для операций с памятью.
Настройка:
hermes memory setup # выбрать "supermemory"
Как выбрать
- Нужна поддержка мультиагентов? Honcho
- Хотите локально и бесплатно? OpenViking или Holographic
- Хотите нулевую конфигурацию? Mem0
- Хотите графы знаний? Hindsight
- Хотите дельта-сжатие? RetainDB
- Хотите эффективность полосы пропускания? ByteRover
- Хотите корпоративные функции? Supermemory
- Хотите конфиденциальность (только локально)? Holographic
- Хотите полностью локально без внешних сервисов? Holographic (вообще без зависимостей) или Hindsight/Mem0/ByteRover с Ollama
- Хотите читаемую человеком, проверяемую память без конвейера эмбеддингов? ByteRover
Для полных конфигураций провайдеров по профилям и реальных шаблонов рабочих процессов см. Продуктивную настройку агента Hermes.
Связанные руководства
- Центр памяти AI-систем — область этого подкластера и ссылки на руководства Cognee
- Система памяти агента Hermes — основная двухфайловая память перед плагинами
- Продуктивная настройка агента Hermes — подключение провайдеров для профилей на практике