Self-Hosting

Här är en jämförelse mellan Qwen3:30b och GPT-OSS:20b fokuserande på instruktionssäljning och prestandaparametrar, specifikationer och hastighet.

Writefreely Federerad Bloggplattform - självvärd vs hanterade kostnader

Här är en snabb information om Write.as / WriteFreely - hur det passar in i fediversumet, var man kan få hanterad värd, hur användningstrenden ser ut och hur man själv värdar (plus grova kostnadsberäkningar).

Integrera Ollama med Python: Exempel på REST API och Python-klient

I detta inlägg kommer vi att utforska två sätt att ansluta din Python-applikation till Ollama: 1. Via HTTP REST API; 2. Via den officiella Ollama Python-biblioteket.

Proxmox 2025: En praktisk, all-i-ett virtualiseringslösning

Proxmox Virtual Environment (Proxmox VE) är en öppen källkod, typ-1 hypervisor och datacenter-orkestreringsplattform byggd på Debian.

Priser på NVIDIA RTX 5080 och RTX 5090 i Australien – oktober 2025

Låt oss jämföra prissättning för toppkategorins konsument-GPU:n, som är särskilt lämpade för LLM och AI i allmänhet. Specifikt tittar jag på RTX-5080 och RTX-5090-priser. De har sjunkit lite.

Ollama GPT-OSS Strukturerade utgångsproblem

Ollama’s GPT-OSS modeller har återkommande problem med att hantera strukturerad utdata, särskilt när de används med ramverk som LangChain, OpenAI SDK, vllm och andra.

Begränsa LLMs med strukturerad utdata: Ollama, Qwen3 & Python eller Go

Stora språkmodeller (LLMs) är kraftfulla, men i produktion vill vi sällan ha fritt formulerade stycken. Istället vill vi ha förutsägbart data: attribut, fakta eller strukturerade objekt som du kan mata in i en app. Det är LLM Strukturerad Utdata.

Kubuntu kontra KDE Neon: En teknisk djupdykning

För KDE Plasma-fans kommer två Linux-distributioner ofta upp i diskussionen: Kubuntu och KDE Neon. De kan verka liknande – båda levereras med KDE Plasma som standardbördsystem, båda baseras på Ubuntu och båda är vänliga mot nybörjare.

Minnesallokering och modellschemaläggning i Ollama nya versionen - v0.12.1

Här jämför jag hur mycket VRAM den nya versionen av Ollama allokerar för modellen hur mycket VRAM den nya versionen av Ollama allokerar för modellen med den tidigare versionen av Ollama. Den nya versionen är sämre.

Hur man ändrar en statisk IP-adress i Ubuntu Server

Denna guide kommer att guida dig genom processen att ändra den statiska IP-adressen på en Ubuntu Server.

Ollama Enshittification – de tidiga tecknen

Ollama har snabbt blivit en av de mest populära verktygen för att köra LLM:er lokalt. Dess enkla CLI och streamlina modellhantering har gjort det till ett förfrågat alternativ för utvecklare som vill arbeta med AI-modeller utanför molnet.

Hur man installerar Mumble-server på Ubuntu och använder Mumble på Android och iOS

Mumble är en fri och öppen källkodstalkapplikation för röst över IP (VoIP) som främst är utformad för realtidskommunikation. Den använder en klient-serverarkitektur där användare ansluter till en gemensam server för att prata med varandra.

Chattgränssnitt för lokala Ollama-instanser

Lokalt värd Ollama möjliggör att köra stora språkmodeller på din egen dator, men att använda den via kommandoraden är inte användarvänligt. Här är flera öppen källkodprojekt som tillhandahåller ChatGPT-stilgränssnitt som ansluter till en lokal Ollama.

GPU-overvakningsprogram i Linux / Ubuntu

GPU-lastmätningsprogram: nvidia-smi vs nvtop vs nvitop vs KDE plasma systemmonitor.

Installation av k3s på bare metal - steg-för-steg genomgång och med Terraform

Här är en steg-för-steg-guide för installation av en 3-nod K3s-kluster på bare-metal servrar (1 master + 2 workers).

Kubernetes-distributioner - en snabb översikt över kubeadm, k3s, MicroK8s, Minikube, Talos Linux och RKE2

Jämförelse av self-hosting Kubernetes-distributioner för värd på bare-metal eller hemservrar, med fokus på enkel installation, prestanda, systemkrav och funktionsuppsättningar.