DevOps

KI-Assistenten-Architektur: LLM, Speicher, Werkzeuge, Routing, Observability

KI-Assistenten-Architektur: LLM, Speicher, Werkzeuge, Routing, Observability

Wie ernsthafte Assistenten tatsächlich aufgebaut sind.

Ein AI-Assistent für den produktiven Einsatz ist nicht einfach „ein LLM mit einem Prompt“. Er ist ein System, das Absichten akzeptiert, Zustand verwaltet, entscheidet, wann abgerufen oder gehandelt werden soll, und genügend Runtime-Details offenlegt, um Fehler zu analysieren.

Kanban in Hermes Agent für selbst gehostete LLM-Workflows

Kanban in Hermes Agent für selbst gehostete LLM-Workflows

Steuern Sie die Hermes-Kanban-Auslastung auf Ihrem selbst gehosteten LLM.

Der Hermes Agent wird mit einem Kanban-Board und dem Hermes Gateway ausgeliefert. Wenn zu viele Aufgaben auf einmal zugewiesen werden, kann dies Ihr selbst gehostetes LLM überlasten.

Hermes AI-Assistent – Installation, Einrichtung, Workflow und Fehlerbehebung

Hermes AI-Assistent – Installation, Einrichtung, Workflow und Fehlerbehebung

Installation und Schnellstart des Hermes-Agenten für Entwickler

Hermes Agent ist ein selbst gehosteter, modellunabhängiger KI-Assistent, der auf einem lokalen Computer oder einem kostengünstigen VPS läuft, über Terminal- und Messaging-Schnittstellen arbeitet und sich durch die Umwandlung wiederkehrender Aufgaben in wiederverwendbare Fähigkeiten im Laufe der Zeit verbessert.

Ollama in Docker Compose mit GPU und persistenter Modell-Speicherung

Ollama in Docker Compose mit GPU und persistenter Modell-Speicherung

Compose-first Ollama-Server mit GPU und Persistenz.

Ollama funktioniert hervorragend auf Bare Metal. Es wird noch interessanter, wenn man es wie einen Service behandelt: ein stabiler Endpunkt, fixierte Versionen, persistente Speicherung und eine GPU, die entweder verfügbar ist oder eben nicht.

llama.swap Modellwechsler: Schnellstart für OpenAI-kompatible lokale LLMs

llama.swap Modellwechsler: Schnellstart für OpenAI-kompatible lokale LLMs

Lokale LLMs ohne Änderung der Clients austauschen.

Bald jonglieren Sie mit vLLM, llama.cpp und mehr – jeder Stack auf einem eigenen Port. Alles nachgeschaltete System erwartet dennoch eine einzige /v1-Basis-URL; andernfalls sortieren Sie ständig Ports, Profile und Einmal-Skripte neu. llama-swap ist der /v1-Proxy vor diesen Stacks.

Entwicklertools: Der umfassende Leitfaden für moderne Entwicklungs-Workflows

Entwicklertools: Der umfassende Leitfaden für moderne Entwicklungs-Workflows

Die Softwareentwicklung umfasst Git für die Versionskontrolle, Docker für die Containerisierung, Bash für die Automatisierung, PostgreSQL für Datenbanken und VS Code als Editor – sowie unzählige andere Tools, die Ihre Produktivität entweder fördern oder behindern können. Diese Seite fasst die essentiellen Cheat-Sheets, Workflows und Vergleiche zusammen, die Sie benötigen, um effizient über den gesamten Entwicklungsstack hinweg zu arbeiten.