SelfHosting

Llama-Server-routarläge – dynamisk modellbytte utan omstarter

En lång tid hade llama.cpp en uppenbar begränsning:
du kunde bara servera en modell per process, och byte innebar ett omstart.

Kunskapsförvaltning 2026: PKM-verktyg, självhysta wikier och digitala system

Personlig kunskapsförvaltning (PKM) sträcker sig över Obsidian, Logseq, DokuWiki, Zettelkasten och PARA – rätt val beror på om du vill ha en lokal anteckningsgraf, en självhöstad wiki eller ett arbetsflöte driven av utformare.

Hermes AI-assistants färdigheter för verkliga produktionsmiljöer

Hermes AI-assistenten, officiellt dokumenterad som Hermes Agent, positioneras inte som en enkel chatt-hylsa.

OpenClaw-färdighetsekosystem och praktiska produktionsval

OpenClaw har två typer av utökningsberättelser, och de är lätta att blanda ihop.

Plugin utökar runtime-miljön. Färdigheter (skills) utökar agentens beteende.

OpenClaw-plugins — Översikt över ekosystemet och praktiska val

Den här artikeln handlar om OpenClaw-tillägg — inbyggda gateway-paket som lägger till kanaler, modellleverantörer, verktyg, röstminne, media, webbsökning och andra runtime-ytor.

Mönster för produktionsmiljö för OpenClaw med plugin och färdigheter

OpenClaw ser enkelt ut i demonstrationer. I produktion blir det ett system.

Vane (Perplexica 2.0) – Snabbstart med Ollama och llama.cpp

Vane är en av de mer pragmatiska lösningarna inom området för “AI-sök med källhänvisningar”: ett självärbetet svarsmotor som blandar live-webbhämtning med lokala eller molnbaserade LLM:er, samtidigt som hela stacken hålls under din kontroll.

Hermes AI-assistent – installation, konfiguration, arbetsflöde och felsökning

Hermes Agent är en självhöstad, modellagnostisk AI-assistent som kör på en lokal maskin eller en billig VPS, fungerar via terminal- och meddelargränssnitt och förbättras över tid genom att omvandla upprepade uppgifter till återanvändbara färdigheter.

TGI – Text Generation Inference – Installation, konfiguration och felsökning

Text Generation Inference (TGI) har en mycket specifik energi. Det är inte den nyaste killen på inferensgatan, men det är den som redan har lärt sig hur produktion bryts –

SGLang-Start: Installera, konfigurera och servera LLM via OpenAI API

SGLang är ett högpresterande ramverk för servering av stora språkmodeller och multimodala modeller, byggt för att leverera inferens med låg latens och hög genomströmning över allt från en enda GPU till distribuerade kluster.

Llama.swap Modellväxlar – Snabbstart för lokala, OpenAI-kompatibla LLM:ar

Snart kastar du mellan vLLM, llama.cpp och mer – varje stack på sin egen port. Allt nedströms vill fortfarande ha en enda bas-URL /v1; annars fortsätter du att shuffla med portar, profiler och skript för enskilda fall. llama-swap är /v1-proxyn som ligger framför dessa stackar.

llama.cpp: Snabbstart med CLI och server

Jag återvänder alltid till llama.cpp för lokal inferens – det ger dig kontroll som Ollama och andra abstraherar bort, och det fungerar helt enkelt. Det är enkelt att köra GGUF-modeller interaktivt med llama-cli eller exponera en OpenAI-kompatibel HTTP-API med llama-server.

OpenClaw: En granskning av en självhyst AI-assistent som ett verkligt system

De flesta lokala AI-uppställningar börjar på samma sätt: en modell, en runtime och ett chattgränssnitt.

Strapi vs Directus vs Payload: Headless CMS-jämförelse

Att välja rätt headless CMS kan avgöra om din innehållshanteringsstrategi blir framgångsrik eller misslyckas. Låt oss jämföra tre öppna källkods-lösningar som påverkar hur utvecklare bygger innehållsdrivna applikationer.

Här listas några AI-assisterade kodverktyg och AI-kodassistenten samt deras fördelar.