Hosting

Claude, OpenClaw und das Ende der Flat-Rate-Preise für Agenten

Die ruhige Lücke, die eine Welle an Experimenten mit Agenten antrieb, ist nun geschlossen.

Remote-Zugriff auf Ollama über Tailscale oder WireGuard, ohne öffentliche Ports

Ollama ist am glücklichsten, wenn es wie ein lokaler Daemon behandelt wird: Die CLI und Ihre Apps kommunizieren mit einer Loopback-HTTP-API, und der Rest des Netzwerks erfährt nie von ihrer Existenz.

Netlify für Hugo und statische Websites: Preismodelle, Gratis-Tier und Alternativen

Netlify ist eine der entwicklerfreundlichsten Methoden, um Hugo-Websites und moderne Webanwendungen mit einem Workflow auf Produktionsniveau zu veröffentlichen: Vorschau-URLs für jede Pull-Request, atomare Bereitstellungen, ein globales CDN sowie optionale serverlose und Edge-Funktionen.

Vergleich von gehosteten E-Mail-Diensten für Custom Domains: Workspace, Microsoft 365, Zoho, Proton und WorkMail

E-Mail auf Ihrer eigenen Domain klingt nach einer DNS-Aufgabe für das Wochenende. In der Praxis handelt es sich dabei um ein kleines verteiltes System mit einer zwanzigjährigen Historie.

Apache Kafka Schnellstart – Installation von Kafka 4.2 mit CLI und lokalen Beispielen

Apache Kafka 4.2.0 ist die aktuell unterstützte Release-Linie und stellt die beste Basis für einen modernen Quickstart dar, da Kafka 4.x standardmäßig vollständig ohne ZooKeeper auskommt und auf KRaft aufbaut.

Die besten LLMs für OpenCode – Von Gemma 4 bis Qwen 3.6, lokal getestet

Ich habe getestet, wie sich OpenCode mit mehreren lokal auf Ollama und llama.cpp gehosteten LLMs verhält, und habe zum Vergleich einige kostenlose Modelle von OpenCode Zen hinzugefügt.

Airtable für Entwickler und DevOps – Pläne, API, Webhooks und Go/Python-Beispiele

Airtable ist am besten als eine Low-Code-Plattform für Anwendungen zu verstehen, die um eine kooperative „datenbankähnliche“ Tabellenansicht herum gebaut ist – ideal für die schnelle Erstellung von operativen Tools (interne Tracker, leichte CRM-Systeme, Inhaltspipelines, AI-Bewertungsqueues), bei denen Nicht-Entwickler eine freundliche Oberfläche benötigen, aber Entwickler auch eine API-Oberfläche für Automatisierung und Integration benötigen.

Überwachung der LLM-Inferenz im Produktivumfeld (2026): Prometheus und Grafana für vLLM, TGI und llama.cpp

LLM-Inferenz sieht aus wie „nur eine weitere API" – bis die Latenzspitzen auftreten, Warteschlangen sich stauen und Ihre GPUs eine Speichernutzung von 95 % haben, ohne dass eine offensichtliche Erklärung dafür vorhanden ist.

OpenClaw Schnellstart: Installation mit Docker (Ollama GPU oder Claude + CPU)

OpenClaw ist ein selbst gehosteter KI-Assistent, der mit lokalen LLM-Runtimes wie Ollama oder mit cloud-basierten Modellen wie Claude Sonnet ausgeführt werden kann.

Garage vs. MinIO vs. AWS S3: Vergleich von Objekt-Speicher und Funktionenmatrix

AWS S3 bleibt der „Standard“-Grundlage für Objekt-Speicher: Er ist vollständig verwaltet, stark konsistent und für extrem hohe Ausfallsicherheit und Verfügbarkeit konzipiert.
Garage und MinIO sind selbstgehostete, S3-kompatible Alternativen: Garage ist für leichte, geodistrierte kleine- bis mittelgroße Cluster konzipiert, während MinIO eine breite Abdeckung der S3-API-Funktionen und eine hohe Leistung in größeren Bereitstellungen betont.

Observabilität für LLM-Systeme: Metriken, Spuren, Logs und Testing in der Produktion

LLM-Systeme scheitern auf Weisen, die herkömmliche API-Überwachung nicht aufdecken kann – Warteschlangen füllen sich schweigend, die GPU-Speicherbelegung erreicht den Sättigungspunkt lange bevor der CPU beschäftigt aussieht und Latenz explodiert in der Batch-Schicht anstatt in der Anwendungsschicht. Dieser Leitfaden behandelt eine End-to-End- Überwachungsstrategie für LLM-Abduktion und LLM-Anwendungen: Was gemessen werden sollte, wie man es mit Prometheus, OpenTelemetry und Grafana instrumentiert und wie man die Telemetrie-Pipeline im großen Maßstab bereitstellt.

LLM-Hosting 2026: Vergleich lokaler, selbstgehosteter und Cloud-Infrastrukturen

Strategic guide to hosting large language models locally with Ollama, llama.cpp, vLLM, or in the cloud. Compare tools, performance trade-offs, and cost considerations.

AWS CloudFront unter Pay-as-You-Go (nicht den Free Plan) erstellen

Die AWS Free-Plan-Funktion funktioniert nicht für mich und
Pay-as-you-go ist bei neuen CloudFront-Distributionen versteckt auf der AWS-Konsole.

Selbstgehostete LLMs und AI-Souveränität

Das Selbst-Hosting von LLMs hält Daten, Modelle und Inferenzen unter Ihrer Kontrolle – ein praktischer Weg zur AI Sovereignty für Teams, Unternehmen und Nationen.

Hugo-Website auf AWS S3 mit AWS CLI bereitstellen

Bereitstellung einer Hugo-Statik-Website auf AWS S3 mit der AWS CLI bietet eine robuste, skalierbare Lösung für die Hosting Ihrer Website. Diese Anleitung behandelt den gesamten Bereitstellungsprozess, von der anfänglichen Einrichtung bis zu fortgeschrittenen Automatisierungs- und Cache-Management-Strategien.

Hugo-Caching-Strategien für die Leistung

Hugo-Caching-Strategien sind entscheidend für die Maximierung der Leistung Ihres statischen Site-Generators. Während Hugo statische Dateien generiert, die von Natur aus schnell sind, kann die Implementierung einer ordnungsgemäßen Caching-Strategie auf mehreren Ebenen die Build-Zeiten deutlich verbessern, die Serverlast reduzieren und die Benutzererfahrung optimieren.