SelfHosting

Sistemas de Memória em Assistentes de IA

Sistemas de Memória em Assistentes de IA

Memória de trabalho, estruturada e de recuperação para assistentes.

A memória transforma assistentes de reativos em persistentes, mas também é onde muitos sistemas se deterioram silenciosamente. Pesquisas argumentam que a divisão entre memória de curto e longo prazo já não é suficiente para a memória moderna de agentes; os SDKs da OpenAI e do LangGraph apontam para uma pilha mais simples — memória de trabalho, estado durável e recuperação.

Qwen 3.6 27B e 35B MTP versus Padrão em GPU de 16GB

Qwen 3.6 27B e 35B MTP versus Padrão em GPU de 16GB

MTP versus decodificação padrão na RTX 4080 — benchmarks reais

Testei o desempenho da Decodificação Especulativa (Previsão de Múltiplos Tokens, MTP) nos modelos Qwen 3.6 27B e 35B em uma RTX 4080 com 16 GB de VRAM.

Criação de Habilidades do Agente Hermes — Estrutura e Melhores Práticas do SKILL.md

Criação de Habilidades do Agente Hermes — Estrutura e Melhores Práticas do SKILL.md

Habilidades do autor Hermes que carregam rapidamente e comportam-se de forma confiável

O Hermes Agent trata skills (habilidades) como a forma padrão de ensinar fluxos de trabalho repetíveis. A documentação oficial descreve-os como documentos de conhecimento sob demanda, alinhados com a especificação aberta agentskills.io, carregados através de revelação progressiva para que o modelo veja primeiro um índice pequeno e só carregue as instruções completas quando uma tarefa realmente precisar delas.

Memória de Sistemas de IA — Conhecimento Persistente e Memória de Agentes

Memória de Sistemas de IA — Conhecimento Persistente e Memória de Agentes

Conhecimento persistente além de uma única thread de chat.

Esta seção reúne guias sobre conhecimento persistente e memória para sistemas de IA — como assistentes mantêm fatos, preferências e contexto distilado entre sessões, sem sobrecarregar um único prompt com todos os tokens. Aqui, memória refere-se à retenção intencional (fatos do usuário, resumos, armazenamentos suportados por plugins), não à memória RAM da GPU ou aos pesos do modelo.

Provedores de Memória de Agentes Comparados — Honcho, Mem0, Hindsight e mais cinco

Provedores de Memória de Agentes Comparados — Honcho, Mem0, Hindsight e mais cinco

Oito backends plugáveis para memória persistente de agentes.

Assistentes modernos ainda esquecem tudo quando você fecha a aba, a menos que algo persista além da janela de contexto. Provedores de memória de agentes são serviços ou bibliotecas que mantêm fatos e resumos entre sessões — frequentemente integrados como plugins para que o framework permaneça leve enquanto a memória escala.

Sistema de Memória do Agente Hermes: Como a Memória Persistente de IA Funciona

Sistema de Memória do Agente Hermes: Como a Memória Persistente de IA Funciona

A memória é a diferença entre uma ferramenta e um parceiro.

Você já sabe como funciona. Você abre um chat com um agente de IA, explica seu projeto, compartilha suas preferências, realiza algum trabalho e fecha a aba. Ao voltar na semana seguinte, é como falar com um estranho — todo o contexto sumiu, todas as preferências foram esquecidas, o projeto precisa ser explicado do zero.