AI voor kennisbeheer: Werkelijke workflows die standhouden
AI verandert kennismanagement, niet het doel ervan.
AI vervangt kennismanagement niet; het verandert de vorm ervan voor zowel individuen als teams.
AI verandert kennismanagement, niet het doel ervan.
AI vervangt kennismanagement niet; het verandert de vorm ervan voor zowel individuen als teams.
Sterren, tokens, downloads — wie wint er eigenlijk?
Open-source AI-agentframeworks winnen explosief aan populariteit op GitHub. Twee projecten die centraal staan in het ecosysteem van zelfgehoste AI-systemen — OpenClaw en Hermes Agent — zijn zo ver vooruit gelopen dat de rest van het veld strijdt om een verre derde plaats.
MTP versus standaard decoding op de RTX 4080 — echte benchmarks
Ik heb de prestaties van speculatief decoderen (Multi-Token Prediction, MTP) getest in Qwen 3.6 27B en 35B op een RTX 4080 met 16 GB VRAM.
Gratis VRAM zonder llama-server te beëindigen.
Routermodus van llama.cpp is een van de meest nuttige wijzigingen aan llama-server in jaren. Het geeft lokale LLM-beheerders eindelijk iets dat lijkt op de modelbeheerservaring die mensen verwachten van Ollama, terwijl het de ruwe prestaties en lage-level controle behoudt die llama.cpp in de eerste plaats de moeite waard maken.
Gecompileerde kennis voor AI-systemen
De uitgangspunt is eenvoudig: gecompileerde kennis is herbruikbaarder dan opgeroepen fragmenten. RAG (Retrieval-Augmented Generation) is het standaardantwoord geworden op een eenvoudige vraag – hoe geef ik een LLM (Large Language Model) toegang tot externe kennis?
Stop met het interpreteren van vibes. Valideer contracten.
De meeste tutorials over “gestructureerde output” van GPT-modellen (LLM’s) zijn niet serieus. Ze leren je beleefd om JSON te vragen en hopen daarna dat het model zich gedraagt. Dat is geen validatie. Dat is optimisme met accolades.
Referentie voor het afstellen van agentische LLM’s
Deze pagina is een praktische referentie voor het afstemmen van agentische LLM-inferentie (temperatuur, top_p, top_k, penalties en hoe deze interacteren in meervoudige stappen en workflows met veel hulpmiddelen).
Gesprek voeren met Hermes vanaf je telefoon
Je chat al met Hermes Agent via je telefoon met tekst. Nu wil je er direct mee praten en gesproken antwoorden terugkrijgen. Dat is meestal de juiste zet, zeker als je al Hermes als een persistente, zelf gehoste assistent gebruikt. Het typen van lange prompts op een klein scherm is traag en foutgevoelig.
Beheer de Hermes Kanban-belasting op uw zelfgehoste LLM.
Hermes Agent wordt geleverd met een Kanban-stijl board en de Hermes Gateway, die uw self-hosted LLM kan verzadigen als er te veel taken tegelijk worden uitgestuurd.
Author Hermes vaardigheden die snel laden en betrouwbaar werken
Hermes Agent behandelt vaardigheden (skills) als de standaardmanier om herhaalbare werkstromen te leren. De officiële documentatie beschrijft ze als kennisdocumenten op aanvraag, afgestemd op de open agentskills.io specificatie, die worden geladen via progressive disclosure (stapsgewijze onthulling), zodat het model eerst een kleine index ziet en volledige instructies alleen ophaalt wanneer een taak dit daadwerkelijk vereist.
Shell- en TUI-commando’s voor de zelfgehoste Hermes Agent.
Hermes Agent van Nous Research is een modelagnostische, toolgebruikende assistent die lokaal of op een VPS wordt uitgevoerd.
Voer OpenClaw veilig uit met NemoClaw
De meeste AI-agent-stacks behandelen beveiliging nog steeds als een reparatie na de demonstratie. NemoClaw begint van het tegenovergestelde uitgangspunt en maakt isolatie, beleid en routing vanaf dag één tot de standaard.
Duurzame kennisbuiten een enkele chatthread.
Deze sectie verzamelt handleidingen over duurzame kennis en geheugen voor AI-systemen — hoe assistenten feiten, voorkeuren en samengevatte context behouden over sessies heen, zonder elke token in één prompt te proppen. Hier betekent geheugen intentionele retentie (gebruikersfeiten, samenvattingen, door plugins ondersteunde opslag), niet GPU-geheugen of modelparameters.
Acht uitbreidbare backends voor persistente agentgeheugen.
Moderne assistenten vergeten nog steeds alles als je het tabblad sluit, tenzij er iets persists buiten het contextvenster. Agent-memoryproviders zijn diensten of bibliotheken die feiten en samenvattingen over sessies heen bewaren — vaak geïntegreerd als plugins, zodat het framework slank blijft terwijl het geheugen schaalt.
Geheugen is het verschil tussen een tool en een partner.
Je kent het ritueel wel. Je opent een chat met een AI-agent, legt je project uit, deelt je voorkeuren, krijgt wat werk gedaan en sluit het tabblad. Je komt de volgende week terug en het is alsof je met een vreemde praat — alle context is weg, elke voorkeur is vergeten, het project moet vanaf nul opnieuw worden uitgelegd.
OpenClaw steeg snel op. Vervolgens verdween het nog sneller.
OpenClaw faalde niet als product. Het verloor zijn brandstof.