AI voor kennisbeheer: Werkelijke workflows die standhouden
AI verandert kennismanagement, niet het doel ervan.
AI vervangt kennismanagement niet; het verandert de vorm ervan voor zowel individuen als teams.
AI verandert kennismanagement, niet het doel ervan.
AI vervangt kennismanagement niet; het verandert de vorm ervan voor zowel individuen als teams.
Stel een ontwikkelaarskennisgrafiek samen.
Ontwikkelaars lijden meestal niet aan een gebrek aan informatie. Wij lijden aan te veel daarvan.
Sterren, tokens, downloads — wie wint er eigenlijk?
Open-source AI-agentframeworks winnen explosief aan populariteit op GitHub. Twee projecten die centraal staan in het ecosysteem van zelfgehoste AI-systemen — OpenClaw en Hermes Agent — zijn zo ver vooruit gelopen dat de rest van het veld strijdt om een verre derde plaats.
MTP versus standaard decoding op de RTX 4080 — echte benchmarks
Ik heb de prestaties van speculatief decoderen (Multi-Token Prediction, MTP) getest in Qwen 3.6 27B en 35B op een RTX 4080 met 16 GB VRAM.
Gratis VRAM zonder llama-server te beëindigen.
Routermodus van llama.cpp is een van de meest nuttige wijzigingen aan llama-server in jaren. Het geeft lokale LLM-beheerders eindelijk iets dat lijkt op de modelbeheerservaring die mensen verwachten van Ollama, terwijl het de ruwe prestaties en lage-level controle behoudt die llama.cpp in de eerste plaats de moeite waard maken.
Zoeken is geen kennisstructuur
De meeste moderne kennissystemen optimaliseren de terugwinning (retrieval), en dat is begrijpelijk. Zoeken is zichtbaar, eenvoudig te demonstreren en voelt magisch wanneer het werkt. Typ een vraag, krijg een antwoord.
Gecompileerde kennis voor AI-systemen
De uitgangspunt is eenvoudig: gecompileerde kennis is herbruikbaarder dan opgeroepen fragmenten. RAG (Retrieval-Augmented Generation) is het standaardantwoord geworden op een eenvoudige vraag – hoe geef ik een LLM (Large Language Model) toegang tot externe kennis?
Een kaart van moderne kennissystemen
PKM, RAG, wikis en AI-geheugensystemen worden vaak besproken alsop ze hetzelfde probleem oplossen. Dat doen ze niet. Ze hebben allemaal te maken met kennis, maar ze werken op verschillende lagen:
Notities zijn opslag. Een tweede brein is berekening.
Informatieoverload gaat minder om de louter grote hoeveelheid dan om onopgeloste input. Modern kenniswerk achterlaat een spoor van tabbladen, chatthreads, documenten, highlights, codefragmenten, transcripties, screenshots en halfgeschreven notities.
Stop met het interpreteren van vibes. Valideer contracten.
De meeste tutorials over “gestructureerde output” van GPT-modellen (LLM’s) zijn niet serieus. Ze leren je beleefd om JSON te vragen en hopen daarna dat het model zich gedraagt. Dat is geen validatie. Dat is optimisme met accolades.
Referentie voor het afstellen van agentische LLM’s
Deze pagina is een praktische referentie voor het afstemmen van agentische LLM-inferentie (temperatuur, top_p, top_k, penalties en hoe deze interacteren in meervoudige stappen en workflows met veel hulpmiddelen).
Voorkom dubbele bijwerkingen
Idempotentie in gedistribueerde systemen is de eigenschap die je redt nadat het netwerk faalt, de wachtrij opnieuw probeert, de client paniekt en de operator een replay uitvoert. In productiesystemen is dubbele levering normaal. Dubbele bijwerkingen zijn de bug.
Gesprek voeren met Hermes vanaf je telefoon
Je chat al met Hermes Agent via je telefoon met tekst. Nu wil je er direct mee praten en gesproken antwoorden terugkrijgen. Dat is meestal de juiste zet, zeker als je al Hermes als een persistente, zelf gehoste assistent gebruikt. Het typen van lange prompts op een klein scherm is traag en foutgevoelig.
Beheer de Hermes Kanban-belasting op uw zelfgehoste LLM.
Hermes Agent wordt geleverd met een Kanban-stijl board en de Hermes Gateway, die uw self-hosted LLM kan verzadigen als er te veel taken tegelijk worden uitgestuurd.
Author Hermes vaardigheden die snel laden en betrouwbaar werken
Hermes Agent behandelt vaardigheden (skills) als de standaardmanier om herhaalbare werkstromen te leren. De officiële documentatie beschrijft ze als kennisdocumenten op aanvraag, afgestemd op de open agentskills.io specificatie, die worden geladen via progressive disclosure (stapsgewijze onthulling), zodat het model eerst een kleine index ziet en volledige instructies alleen ophaalt wanneer een taak dit daadwerkelijk vereist.
Shell- en TUI-commando’s voor de zelfgehoste Hermes Agent.
Hermes Agent van Nous Research is een modelagnostische, toolgebruikende assistent die lokaal of op een VPS wordt uitgevoerd.
Ontvang nieuwe berichten over systemen, infrastructuur en AI-engineering.