AI

Vergleich von Agent Memory Providern — Honcho, Mem0, Hindsight und fünf weitere

Vergleich von Agent Memory Providern — Honcho, Mem0, Hindsight und fünf weitere

Acht anpassbare Backends für ein persistentes Agentengedächtnis.

Moderne Assistenten vergessen nach dem Schließen des Tabs immer noch alles, es sei denn, etwas bleibt über das Kontextfenster hinaus bestehen. Agent Memory Provider (Speicheranbieter für Agenten) sind Dienste oder Bibliotheken, die Fakten und Zusammenfassungen über Sitzungen hinweg halten – oft als Plugins integriert, damit das Framework schlank bleibt, während der Speicher skaliert.

Hermes-Agent-Speichersystem: So funktioniert persistentes KI-Speicher

Hermes-Agent-Speichersystem: So funktioniert persistentes KI-Speicher

Der Unterschied zwischen einem Werkzeug und einem Partner liegt in der „Erinnerung“.

Sie kennen das Prinzip. Sie öffnen einen Chat mit einem KI-Agenten, erläutern Ihr Projekt, teilen Ihre Präferenzen, lassen Aufgaben erledigen und schließen den Tab. Wenn Sie in der folgenden Woche zurückkehren, ist es, als würden Sie mit einem Fremden sprechen – der gesamte Kontext ist verloren, jede Präferenz vergessen, das Projekt muss von Grund auf neu erklärt werden.

Vane (Perplexica 2.0) Schnellstart mit Ollama und llama.cpp

Vane (Perplexica 2.0) Schnellstart mit Ollama und llama.cpp

Selbst gehostete KI-Suche mit lokalen LLMs

Vane ist einer der pragmatischeren Einträge im Bereich „KI-Suche mit Quellenangaben": eine selbst gehostete Antwortmaschine, die live abrufbare Websuche mit lokalen oder Cloud-LLMs kombiniert, während der gesamte Stack unter Ihrer Kontrolle bleibt.

Hermes AI-Assistent – Installation, Einrichtung, Workflow und Fehlerbehebung

Hermes AI-Assistent – Installation, Einrichtung, Workflow und Fehlerbehebung

Installation und Schnellstart des Hermes-Agenten für Entwickler

Hermes Agent ist ein selbst gehosteter, modellunabhängiger KI-Assistent, der auf einem lokalen Computer oder einem kostengünstigen VPS läuft, über Terminal- und Messaging-Schnittstellen arbeitet und sich durch die Umwandlung wiederkehrender Aufgaben in wiederverwendbare Fähigkeiten im Laufe der Zeit verbessert.

Ollama in Docker Compose mit GPU und persistenter Modell-Speicherung

Ollama in Docker Compose mit GPU und persistenter Modell-Speicherung

Compose-first Ollama-Server mit GPU und Persistenz.

Ollama funktioniert hervorragend auf Bare Metal. Es wird noch interessanter, wenn man es wie einen Service behandelt: ein stabiler Endpunkt, fixierte Versionen, persistente Speicherung und eine GPU, die entweder verfügbar ist oder eben nicht.