Rost Glukhov | Persoonlijke website en technische blog

Korte handleiding voor de llama.swap-modelwisselaar voor lokaal openai-compatibele LLM's

Binnenkort balanceren vLLM, llama.cpp en meer—elk stack op zijn eigen poort. Alles downstream wil nog steeds één /v1 basis-URL; anders blijf je met poorten, profielen en eenmalige scripts shuffelen. llama-swap is de /v1 proxy voor die stacks.

Apache Kafka Snelstart – Installeer Kafka 4.2 met CLI en lokale voorbeelden

Apache Kafka 4.2.0 is de huidige ondersteunde release, en vormt de beste basis voor een moderne Quickstart, omdat Kafka 4.x volledig vrij is van ZooKeeper en standaard gebouwd is rondom KRaft.

Oh My Opencode Beoordeling: Eerlijke Resultaten, Factureringsrisico's en Wanneer het de Loon waard is

Oh My Opencode belooft een “virtueel AI-ontwikkelteam” — Sisyphus die specialisten coördineert, taken die parallel worden uitgevoerd en het magische ultrawork-sleutelwoord dat alles activeert.

Oh My Opencode: Diepgaande Analyse en Modelgids voor Gespecialiseerde Agents

De grootste sprong in capaciteit in OpenCode komt van gespecialiseerde agents: een doordachte scheiding van orkestratie, planning, uitvoering en onderzoek.

Oh My Opencode QuickStart voor OpenCode: Installeren, configureren, uitvoeren

Oh My Opencode maakt van OpenCode een multi-agent codeerhulpmiddel: een orchestrator delegeert werk aan specialistische agenten die parallel draaien.

Beste LLM's voor OpenCode – van Gemma 4 tot Qwen 3.6, lokaal getest

Ik heb getest hoe OpenCode werkt met verschillende lokaal gehoste LLM’s op Ollama en llama.cpp, en voor vergelijking heb ik enkele gratis modellen van OpenCode Zen toegevoegd.

OpenHands Coding Assistant Snelstart: Installatie, CLI-Vlaggen, Voorbeelden

OpenHands is een open-source, model-agnostisch platform voor door AI-aangedreven softwareontwikkelingsagenten.
Het stelt een agent in staat om zich meer te gedragen als een programmeerpartner dan als een eenvoudig hulpmiddel voor automatische voltooijing.

LocalAI QuickStart: Voer OpenAI-compatibele LLM's lokaal uit

LocalAI is een self-hosted, local-first inference server die ontworpen is om te gedragen als een drop-in OpenAI API voor het uitvoeren van AI-werklasten op uw eigen hardware (laptop, workstation of on-premise server).

Snelstart van llama.cpp met CLI en server

Ik keer steeds terug naar llama.cpp voor lokale inferentie: het geeft je controle die Ollama en anderen abstracteren, en het werkt gewoon. Het is eenvoudig om GGUF-modellen interactief uit te voeren met llama-cli of een OpenAI-compatibele HTTP-API bloot te stellen met llama-server.

OpenCode Quickstart: installeren, configureren en gebruiken van de Terminal AI Coding Agent

OpenCode is een open-source AI-coding agent die je in de terminal kunt uitvoeren (TUI + CLI) met optionele desktop- en IDE-interfaces. Dit is de OpenCode Quickstart: installeren, verifiëren, een model/aanbieder verbinden en werkelijke workflows uitvoeren (CLI + API).

Airtable voor ontwikkelaars en DevOps - Plannen, API, Webhooks en Go/Python-voorbeelden

Airtable is het beste te beschouwen als een low-code toepassingsplatform dat is opgebouwd rondom een samenwerkende “database-achtige” spreadsheet UI - ideaal voor het snel maken van operationele tools (interne trackers, lichte CRM’s, content pijplijnen, AI evaluatie wachtrijen) waarbij niet-ontwikkelaars een vriendelijke interface nodig hebben, maar ontwikkelaars ook een API oppervlak nodig hebben voor automatisering en integratie.

Monitoren van LLM-inferentie in productie (2026): Prometheus en Grafana voor vLLM, TGI en llama.cpp

LLM-inferentie lijkt op “nog een API” — totdat de latentie piekt, wachtrijen oplopen en je GPU’s 95% geheugen gebruiken zonder duidelijke verklaring.

OpenClaw: Een zelf-gehoste AI-assistent als echt systeem onder de loep

De meeste lokale AI-opstellingen beginnen op dezelfde manier: een model, een runtime en een chat-interface.

OpenClaw Snelstart: Installeren met Docker (Ollama GPU of Claude + CPU)

OpenClaw is een zelf-gehoste AI-assistent die is ontworpen om te draaien met lokale LLM-runtimes zoals Ollama of met cloudgebaseerde modellen zoals Claude Sonnet.

Garage vs MinIO vs AWS S3: Objectopslagvergelijking en functiematrix

AWS S3 blijft de “standaard” basislijn voor objectopslag: het is volledig beheerd, sterk consistent en ontworpen voor extreem hoge duurzaamheid en beschikbaarheid.
Garage en MinIO zijn zelfgehoste, S3-compatibele alternatieven: Garage is ontworpen voor lichte, geografisch verspreide kleine- tot middelgrote clusters, terwijl MinIO zich richt op brede S3 API functiebedekking en hoge prestaties bij grotere implementaties.

Workflowtoepassingen implementeren met Temporal in Go: een compleet gids

Temporal is een open-source, enterprise-klasse workflow engine die ontwikkelaars in staat stelt om duurzame, schaalbare en fouttolerante workflow toepassingen te bouwen met behulp van bekende programmeertalen zoals Go.

Abonneren