AI - Rost Glukhov | Persönliche Website und technischer Blog

Open WebUI: Selbstgehostete LLM-Schnittstelle

Open WebUI ist eine leistungsstarke, erweiterbare und funktionsreiche selbstgehostete Webschnittstelle zur Interaktion mit großen Sprachmodellen.

Tech-Events in Melbourne, die man 2026 besuchen sollte

Melbournes Tech-Community bleibt 2026 mit einem beeindruckenden Programm aus Konferenzen, Meetups und Workshops zu Themen wie Softwareentwicklung, Cloud Computing, KI, Cybersicherheit und aufstrebenden Technologien weiterhin lebendig.

vLLM ist ein hochleistungsfähiger, speichereffizienter Inference- und Serving-Engine für Large Language Models (LLMs), entwickelt vom Sky Computing Lab der UC Berkeley.

DGX Spark AU Preise: 6.249 $-7.999 $ bei großen Händlern

Der NVIDIA DGX Spark (GB10 Grace Blackwell) ist jetzt in Australien erhältlich bei großen PC-Händlern mit lokalem Lagerbestand. Wenn Sie die globale DGX Spark-Preisgestaltung und Verfügbarkeit verfolgt haben, werden Sie interessiert sein zu erfahren, dass die australischen Preise je nach Speicherkonfiguration und Händler zwischen 6.249 und 7.999 AUD liegen.

Erkennung von AI-Slop: Techniken und Warnsignale

Die Verbreitung von KI-generierten Inhalten hat eine neue Herausforderung geschaffen: den Unterschied zwischen echter menschlicher Schrift und “AI slop” - niedrigwertigen, massenhaft produzierten synthetischen Texten - zu erkennen.

Selbsthosting von Cognee: LLM-Leistungstests

Cognee ist ein Python-Framework zum Aufbau von Wissensgraphen aus Dokumenten unter Verwendung von LLMs. Aber funktioniert es mit selbstgehosteten Modellen?

BAML vs Instructor: Strukturierte LLM-Ausgaben

Wenn Sie mit Large Language Models in der Produktion arbeiten, ist es entscheidend, strukturierte, typensichere Ausgaben zu erhalten. Zwei beliebte Frameworks - BAML und Instructor - gehen unterschiedliche Wege, um dieses Problem zu lösen.

Die richtige LLM-Auswahl für Cognee: Lokale Ollama-Konfiguration

Die Auswahl des besten LLM für Cognee erfordert eine Balance zwischen Graphenbauqualität, Halluzinationsraten und Hardware-Beschränkungen. Cognee glänzt mit größeren, halluzinationsarmen Modellen (32B+) über Ollama, aber mittlere Optionen eignen sich für leichtere Setups.

Steigern Sie die Produktivität mit Jupyter Notebook mit wesentlichen Shortcuts, Zauberbefehlen und Workflow-Tipps, die Ihr Datenwissenschafts- und Entwicklererlebnis transformieren werden.

Verwendung der Ollama Web Search API in Python

Ollamas Python-Bibliothek umfasst nun native OLlama Websuche-Funktionen. Mit nur wenigen Codezeilen können Sie Ihre lokalen LLMs mit Echtzeitinformationen aus dem Web erweitern, um Halluzinationen zu reduzieren und die Genauigkeit zu verbessern.

Die Wahl des richtigen Vektor-Speichers kann über Leistung, Kosten und Skalierbarkeit Ihrer RAG-Anwendung entscheiden. Dieser umfassende Vergleich deckt die beliebtesten Optionen für 2024-2025 ab.

Verwendung der Ollama Web Search API in Go

Ollamas Web-Search-API ermöglicht es Ihnen, lokale LLMs mit Echtzeit-Webinformationen zu erweitern. Diese Anleitung zeigt Ihnen, wie Sie Web-Suchfunktionen in Go implementieren, von einfachen API-Aufrufen bis hin zu vollwertigen Suchagenten.

RAM-Preisanstieg: Bis zu 619 % im Jahr 2025

Der Speichermarkt erlebt im späten Jahr 2025 eine beispiellose Preisschwankung, wobei die RAM-Preise stark gestiegen sind.

Lokales LLM-Hosting: Komplettführer 2025 - Ollama, vLLM, LocalAI, Jan, LM Studio & Mehr

Lokale Bereitstellung von LLMs hat an Beliebtheit zugenommen, da Entwickler und Organisationen eine verbesserte Privatsphäre, reduzierte Latenz und eine größere Kontrolle über ihre KI-Infrastruktur anstreben.

Microservices für die Orchestrierung von KI/ML

Als KI- und ML-Workloads zunehmend komplexer werden, steigt der Bedarf an robusten Orchestrierungssystemen. Die Einfachheit, Leistung und Parallelverarbeitung von Go machen es zur idealen Wahl für den Aufbau der Orchestrierungsebene von ML-Pipelines, selbst wenn die Modelle selbst in Python geschrieben sind.

Cross-Modal-Einbettungen: Brücken zwischen KI-Modalen

Cross-modale Einbettungen stellen einen Durchbruch in der künstlichen Intelligenz dar und ermöglichen das Verständnis und die Schlussfolgerung über verschiedene Datentypen hinweg in einem einheitlichen Darstellungsraum.

AI

Open WebUI: Selbstgehostete LLM-Schnittstelle

Tech-Events in Melbourne, die man 2026 besuchen sollte

vLLM Quickstart: Hochleistungs-LLM-Serving

DGX Spark AU Preise: 6.249 $-7.999 $ bei großen Händlern

Erkennung von AI-Slop: Techniken und Warnsignale

Selbsthosting von Cognee: LLM-Leistungstests

BAML vs Instructor: Strukturierte LLM-Ausgaben

Die richtige LLM-Auswahl für Cognee: Lokale Ollama-Konfiguration

Jupyter Notebook Cheatsheet

Verwendung der Ollama Web Search API in Python

Vektor-Speicher für RAG-Vergleiche

Verwendung der Ollama Web Search API in Go

RAM-Preisanstieg: Bis zu 619 % im Jahr 2025

Lokales LLM-Hosting: Komplettführer 2025 - Ollama, vLLM, LocalAI, Jan, LM Studio & Mehr

Microservices für die Orchestrierung von KI/ML

Cross-Modal-Einbettungen: Brücken zwischen KI-Modalen