AI för kunskaps hantering: verkliga arbetsflöden som håller
AI förändrar kunskaps hanteringen, inte dess syfte.
AI ersätter inte kunskapsstyrning; den förändrar dess form för både individer och team.
AI förändrar kunskaps hanteringen, inte dess syfte.
AI ersätter inte kunskapsstyrning; den förändrar dess form för både individer och team.
Bygg en kunskapsgraf för utvecklare.
Utvecklare lider sällan av informationsbrist. Vi lider av för mycket information.
Stjärnor, tokens, nedladdningar – vinner verkligen någon?
Open-source-ram för AI-agenter exploderar i popularitet på GitHub. Två projekt som ligger i kärnan av ekosystemet för självhushållande AI-system — OpenClaw och Hermes Agent — har dragit så långt ifrån att resten av fältet slåss om en fjärran tredjeplats.
MTP jämfört med standarddekodning på RTX 4080 — verkliga benchmarkresultat
Jag testade prestandan för spekulativ dekodning (Multi-Token Prediction, MTP) i Qwen 3.6 27B och 35B på en RTX 4080 med 16 GB VRAM.
Frigör VRAM utan att stoppa llama-server.
Routerläge för llama.cpp är en av de mest användbara förändringarna i llama-server på flera år. Det ger slutligen lokala aktörer av LLM (Large Language Models) något som liknar modellhanteringsupplevelsen som man förväntar sig från Ollama, samtidigt som det behåller den råa prestanda och den lågnivåkontroll som gör llama.cpp värd att använda i första hand.
Sök är inte kunskapsstruktur
De flesta moderna kunskapssystem optimerar hämtning (retrieval), och det är förståeligt. Sök är synligt, lätt att demonstrera och känns magiskt när det fungerar. Skriv en fråga, få ett svar.
Sammanställd kunskap för AI-system
Premissen är enkel: sammanställd kunskap är mer återanvändbar än hämtade fragment. RAG blev det självklara svaret på en enkel fråga – hur ger jag en LLM (storspråkmodell) tillgång till extern kunskap?
En karta över moderna kunskapssystem
PKM, RAG, wikier och AI-minnesystem diskuteras ofta som om de löser samma problem. Det gör de inte. De hanterar alla kunskap, men de opererar på olika lager:
Anteckningar är lagring. Ett andra hjärna är beräkning.
Informationsöverbelastning handlar mindre om ren volym än om olösta indata. Modern kunskapsarbete lämnar en spår av flikar, chatttrådar, dokument, markeringar, kodbitar, transkript, skärmdumpar och halvfärdiga anteckningar.
Sluta tolka stämningar. Validera kontrakt.
De flesta tutorials om “strukturerad utdata” från stora språkmodeller (LLM) är oseriösa. De lägger upp det som att du ska be artigt om JSON och sedan hoppas att modellen beter sig. Det är inte validering. Det är optimisme med klammermärken.
Referens för agensbaserad LLM-tuning
Denna sida är en praktisk referens för justering av agentic LLM-inferens (temperatur, top_p, top_k, strafftermer och hur de samverkar i flerstegs- och verktygstäta arbetsflöden).
Stoppa dubbla sideffekter
Idempotens i distribuerade system är den egenskap som räddar dig när nätverket ljuger, köen gör om försöket, klienten paniker och operatören spelar upp om händelser. I produktionssystem är dubbel leverans normalt. Dubbla biverkningar är buggen.
Kontakta Hermes från din telefon
Du chattar redan med Hermes Agent från din telefon med text. Nu vill du prata med den direkt och få muntliga svar tillbaka. Det är oftast rätt val, särskilt om du redan använder Hermes som en självhostad assistent. Att skriva långa prompter på en liten skärm är långsamt och benäget för fel
Styra Hermes Kanban-belastningen på din egenhostade LLM.
Hermes Agent levereras med ett Kanban-styrt flödessystem och Hermes Gateway, vilket kan mätta din egenhostade LLM om för många uppgifter skickas ut samtidigt.
Författar färdigheter för Hermes som laddar snabbt och fungerar pålitligt
Hermes Agent behandlar färdigheter (skills) som det vanliga sättet att lära ut återanvändbara arbetsflöden. Officiell dokumentation beskriver dem som kunskapsdokument på begäran, anpassade efter den öppna agentskills.io-specifikationen, och de laddas genom progressiv diskling (progressive disclosure) så att modellen först ser en liten index och endast hämtar fullständiga instruktioner när en uppgift faktiskt kräver dem.
Shell- och TUI-kommandon för självhostad Hermes-agent.
Hermes Agent från Nous Research är en modellagnostisk, verkstugsanvändande assistent som du kör lokalt eller på en VPS.
Få nya inlägg om system, infrastruktur och AI-ingenjörskonst.