AI 시스템 메모리 — 지속적 지식 및 에이전트 메모리

단일 채팅 스레드를 넘어 지속되는 지식

Page content

이 섹션에서는 AI 시스템의 지속적 지식 및 메모리에 대한 가이드를 수집합니다. 즉, 어시스턴트가 모든 토큰을 하나의 프롬프트에 무작정 넣지 않고 세션 간에 사실, 선호도 및 정제된 컨텍스트를 유지하는 방법을 다룹니다. 여기서 메모리란 GPU RAM이나 모델 가중치가 아닌, 의도적인 유지(사용자 사실, 요약, 플러그인 기반 저장소)를 의미합니다.

이 내용은 OpenClaw, Hermes, 오케스트레이션 등 더 광범위한 AI 시스템 클러스터를 보완하며, 검색 메커니즘에 관한 RAG와 모델 실행에 관한 LLM 호스팅과 함께 위치합니다.

메모리는 라우팅, 도구 사용, 관찰 가능성(observability)과 함께 AI 어시스턴트 아키텍처에서 설명되는 광범위한 어시스턴트 스택 내부에 위치합니다.


에이전트 메모리 제공자

Hermes Agent 및 OpenClaw와 같은 프레임워크에서 노출하는 드롭인(Drop-in) 백엔드 — Honcho, OpenViking, Mem0, Hindsight 등 — 는 LLM, 임베딩 및 데이터베이스 간의 다양한 트레이드오프를 제공합니다.

Hermes 전용 제한된 핵심 메모리(MEMORY.md / USER.md)에 대해서는 **Hermes 에이전트 메모리 시스템**을 참조하십시오.


지식 그래프 및 Cognee

검색 인식 어시스턴트를 위해 그래프로 추출된 기관 및 프로젝트 지식.

Cognee와 같은 그래프 빌더는 일반적으로 사람들이 이미 편집한 마크다운 볼트, 위키 또는 내보내기된 데이터를 가져옵니다. 따라서 임베딩에 청크가 도달하기 전 이미 중요성, 명명 규칙 및 “왜 이것이 중요한가"가 대부분 결정되어 있습니다. 부실한 업스트림 코퍼스(upstream corpus)는 모호성을 어시스턴트에게 다시 학습시킵니다. 반면, 표현을 통한 체계적인 캡처 워크플로우(workflow)는 이러한 손상을 제한합니다. 검색 중심 RAG와의 차이점을 포함한 이 인간 중심의 프레임워크에 대해서는 엔지니어를 위한 두 번째 뇌 설명을 참조하십시오.


스택 컨텍스트

구독하기

시스템, 인프라, AI 엔지니어링에 관한 새 글을 받아보세요.