DevOps

Llama-Server-routermodus: dynamisch wisselen van modellen zonder herstart

Lang had llama.cpp een opvallende beperking:
je kon slechts één model per proces bedienen, en om te wisselen moest je herstarten.

OpenClaw-plug-ins — Ecosysteemgids en praktische keuzes

Dit artikel gaat over OpenClaw-plug-ins — native gateway-pakketten die kanalen, modelproviders, tools, spraak, geheugen, media, webzoeken en andere runtime-oppervlakken toevoegen.

Hermes AI-assistent: installatie, configuratie, werkwijze en probleemoplossing

Hermes Agent is een zelfgehoste, model-onafhankelijke AI-assistent die lokaal op een machine of een goedkope VPS draait, werkt via terminal- en messaging-interfaces en in de loop der tijd verbetert door herhaalde taken om te zetten in herbruikbare vaardigheden.

Op afstand toegang tot Ollama via Tailscale of WireGuard, zonder openbare poorten.

Ollama is het meest tevreden wanneer het wordt behandeld als een lokale daemon: de CLI en uw apps communiceren met een loopback HTTP API, en de rest van het netwerk komt er nooit achter dat het bestaat.

Ollama in Docker Compose met GPU en persistente modelopslag

Ollama werkt uitstekend op bare metal. Het wordt nog interessanter wanneer je het als een service behandelt: een stabiel eindpunt, vastgezet versies, persistente opslag en een GPU die ofwel beschikbaar is of niet.

Ollama achter een reverse proxy met Caddy of Nginx voor HTTPS-streaming

Ollama achter een reverse proxy draaien is de eenvoudigste manier om HTTPS, optionele toegangscontrole en voorspelbaar streamgedrag te krijgen.

Apache Flink op K8s en Kafka: PyFlink, Go, beheer en geprijsde beheerde diensten

Apache Flink is een framework voor stateful computations (berekeningen met toestand) over oneindige en eindige datastromen.

Neo4j-graafdatabase voor GraphRAG, installatie, Cypher, vectoren, Ops

Neo4j is waar je naartoe grijpt wanneer de relaties de data zijn. Als je domein eruitziet als een whitebord met cirkels en pijlen, dan is het pijnlijk om dit in tabellen te dwingen.

IndexNow uitgelegd - zoekmachines informeren bij het publiceren

Statische websites en blogs veranderen telkens wanneer je ze uitrolt. Zoekmachines die IndexNow ondersteunen, kunnen op de hoogte worden gebracht van deze wijzigingen zonder te hoeven wachten op de volgende blinde crawl.

SGLang QuickStart: installeer, configureer en serveer LLM's via de OpenAI API

SGLang is een high-performance framework voor het uitvoeren van inference bij grote taalmodellen en multimodale modellen, ontworpen om lage latentie en hoge doorvoer te leveren, variërend van een enkele GPU tot gedistribueerde clusters.

Apache Kafka Snelstart – Installeer Kafka 4.2 met CLI en lokale voorbeelden

Apache Kafka 4.2.0 is de huidige ondersteunde release, en vormt de beste basis voor een moderne Quickstart, omdat Kafka 4.x volledig vrij is van ZooKeeper en standaard gebouwd is rondom KRaft.

Korte handleiding voor de llama.swap-modelwisselaar voor lokaal openai-compatibele LLM's

Binnenkort balanceren vLLM, llama.cpp en meer—elk stack op zijn eigen poort. Alles downstream wil nog steeds één /v1 basis-URL; anders blijf je met poorten, profielen en eenmalige scripts shuffelen. llama-swap is de /v1 proxy voor die stacks.

Ontwikkeltools: De complete gids voor moderne ontwikkelwerkwijzen

Het ontwikkelen van software omvat Git voor versiebeheer, Docker voor containerisatie, Bash voor automatisering, PostgreSQL voor databases en VS Code voor editing — naast talloze andere tools die uw productiviteit bepalen. Deze pagina verzamelt de essentiële cheat sheets, workflows en vergelijkingen die u nodig heeft om efficiënt te werken binnen de volledige ontwikkelstack.

LocalAI QuickStart: Voer OpenAI-compatibele LLM's lokaal uit

LocalAI is een self-hosted, local-first inference server die ontworpen is om te gedragen als een drop-in OpenAI API voor het uitvoeren van AI-werklasten op uw eigen hardware (laptop, workstation of on-premise server).

Snelstart van llama.cpp met CLI en server

Ik keer steeds terug naar llama.cpp voor lokale inferentie: het geeft je controle die Ollama en anderen abstracteren, en het werkt gewoon. Het is eenvoudig om GGUF-modellen interactief uit te voeren met llama-cli of een OpenAI-compatibele HTTP-API bloot te stellen met llama-server.

AI-ontwikkeltools: De complete gids voor AI-aangedreven ontwikkeling

Kunstmatige intelligentie (AI) hervormt de manier waarop software wordt geschreven, gecontroleerd, uitgebracht en onderhouden. Van AI-coderingsassistenten tot GitOps-automatisering en DevOps-workflows: ontwikkelaars vertrouwen nu op AI-aangedreven tools in de volledige softwarelevenscyclus.