AI - Page 2 - Rost Glukhov | Personlig webbplats och teknisk blogg

Arkitektur för AI-assistent: LLM, minne, verktyg, routing, observabilitet

Ett produktionsberett AI-assistent är inte “en LLM med en prompt”. Det är ett system som accepterar avsikt, behåller tillstånd, avgör när det ska hämta data eller utföra åtgärder, och exponerar tillräckligt med detaljer om körningen för att kunna felsöka misslyckanden.

AI för kunskaps hantering: verkliga arbetsflöden som håller

AI ersätter inte kunskapsstyrning; den förändrar dess form för både individer och team.

OpenClaw vs Hermes Agent: Stjärnor, nedladdningar och användning 2026

Open-source-ram för AI-agenter exploderar i popularitet på GitHub. Två projekt som ligger i kärnan av ekosystemet för självhushållande AI-system — OpenClaw och Hermes Agent — har dragit så långt ifrån att resten av fältet slåss om en fjärran tredjeplats.

Qwen 3.6 27B och 35B MTP jämfört med Standard på 16 GB GPU

Jag testade prestandan för spekulativ dekodning (Multi-Token Prediction, MTP) i Qwen 3.6 27B och 35B på en RTX 4080 med 16 GB VRAM.

Avladda alla llama.cpp-routermodeller utan att starta om

Routerläge för llama.cpp är en av de mest användbara förändringarna i llama-server på flera år. Det ger slutligen lokala aktörer av LLM (Large Language Models) något som liknar modellhanteringsupplevelsen som man förväntar sig från Ollama, samtidigt som det behåller den råa prestanda och den lågnivåkontroll som gör llama.cpp värd att använda i första hand.

LLM Wiki - Sammanställt kunskapsunderlag som RAG inte kan ersätta

Premissen är enkel: sammanställd kunskap är mer återanvändbar än hämtade fragment. RAG blev det självklara svaret på en enkel fråga – hur ger jag en LLM (storspråkmodell) tillgång till extern kunskap?

PKM kontra RAG kontra Wiki kontra minnessystem – tydligt förklarat

PKM, RAG, wikier, AI-minnessystem och nu praktiska AI-assisterade arbetsflöden diskuteras ofta som om de löser samma problem. Det gör de inte. De hanterar alla kunskap, men de opererar på olika lager:

Validering av strukturerad output från LLM:er i Python som håller

De flesta tutorials om “strukturerad utdata” från stora språkmodeller (LLM) är oseriösa. De lägger upp det som att du ska be artigt om JSON och sedan hoppas att modellen beter sig. Det är inte validering. Det är optimisme med klammermärken.

Referens för agenta LLM-inferensparametrar för Qwen och Gemma

Denna sida är en praktisk referens för justering av agentic LLM-inferens (temperatur, top_p, top_k, strafftermer och hur de samverkar i flerstegs- och verktygstäta arbetsflöden).

Du chattar redan med Hermes Agent från din telefon med text. Nu vill du prata med den direkt och få muntliga svar tillbaka. Det är oftast rätt val, särskilt om du redan använder Hermes som en självhostad assistent. Att skriva långa prompter på en liten skärm är långsamt och benäget för fel

Kanban i Hermes Agent för självhostade LLM-arbetsflöden

Hermes Agent levereras med ett Kanban-styrt flödessystem och Hermes Gateway, vilket kan mätta din egenhostade LLM om för många uppgifter skickas ut samtidigt.

Att skapa Hermes-agentkompetenser — Struktur och bästa praxis för SKILL.md

Hermes Agent behandlar färdigheter (skills) som det vanliga sättet att lära ut återanvändbara arbetsflöden. Officiell dokumentation beskriver dem som kunskapsdokument på begäran, anpassade efter den öppna agentskills.io-specifikationen, och de laddas genom progressiv diskling (progressive disclosure) så att modellen först ser en liten index och endast hämtar fullständiga instruktioner när en uppgift faktiskt kräver dem.

Hermes Agent CLI-antatt: Kommandon, flaggor och snedstrecks-genvägar

Hermes Agent från Nous Research är en modellagnostisk, verktygsanvändande assistent som du kör lokalt eller på en VPS.

NemoClaws praktiska guide för säkra OpenClaw-operationer 2026

De flesta AI-agentstackar behandlar fortfarande säkerhet som en korrigering efter demonstrationen. NemoClaw utgår från motsatta antaganden och gör isolering, policy och ruttning till standard från dag ett.

Agentminnesleverantörer jämförda — Honcho, Mem0, Hindsight och fem till

Moderna assistenter glömmer fortfarande allt när du stänger fliken om inte något överlever kontextfönstret. Tjänster för agenterminne (agent memory providers) är tjänster eller bibliotek som lagrar fakta och sammanfattningar över sessioner — ofta integrerade som plugin så att ramverket förblir lättviktigt medan minnet skalas.

AI-systems minne – bestående kunskap och agentminne

Denna sektion samlar guider om bestående kunskap och minne för AI-system — hur assistenter behåller fakta, preferenser och sammanfattad kontext över sessioner utan att stoppa in varje token i en enda prompt. Här innebär minne medveten bevarande (användarfakta, sammanfattningar, pluginbaserade lagringar), inte GPU-minne eller modellvikt.