Self-Hosting

Dokumente mit Ollama und dem Qwen3 Reranker-Modell neu sortieren – in Go

Da der Standard-Ollama keine direkte Rerank-API bietet, müssen Sie das Reranking mit dem Qwen3 Reranker in GO implementieren, indem Sie Embeddings für Abfrage-Dokumenten-Paare generieren und diese bewerten.

Vergleich der Qualität der Hugo-Seitentranslation – LLMs auf Ollama

In diesem Test vergleiche ich, wie verschiedene LLMs, die auf Ollama gehostet werden, Hugo- Seiten von englisch auf deutsch übersetzen.

Neuranking von Texten mit Ollama und Qwen3 Embedding-LLM – in Go

Dieses kleine Go-Code-Beispiel für das Neuranking ruft Ollama auf, um Embeddings zu generieren für die Abfrage und für jedes Kandidatendokument, sortiert dann absteigend nach der Kosinus-Ähnlichkeit.

Nvidia RTX 5080 und RTX 5090 Preise in Australien – Juni 2025

Vor genau drei Monaten waren die RTX 5090 noch nicht in den Läden zu sehen, und jetzt sind sie da, aber die Preise liegen etwas höher als der MRSP.

Vergleichen wir die günstigsten Preise für RTX 5080 und RTX 5090 in Australien und sehen wir, wie es aussieht.

YaCy: Dezentrale Suchmaschine, Vorteile, Herausforderungen und Zukunft

YaCy ist eine dezentrale, Peer-to-Peer-(P2P)-Suchmaschine, die ohne zentrale Server arbeitet und es Nutzern ermöglicht, lokale oder globale Indizes zu erstellen und durch Abfragen verteilter Peers Suchvorgänge durchzuführen.

Top Automatisiertes System für eine großartige Aufgabe.

Qwen3-Embedding- und Reranker-Modelle auf Ollama: State-of-the-Art-Leistung

Die Qwen3 Embedding- und Reranker-Modelle sind die neuesten Veröffentlichungen in der Qwen-Familie und wurden speziell für fortgeschrittene Text-Einbettungs-, Abruf- und Neuklassifizierungsaufgaben entwickelt.

Wie Sie Vorschaubilder in den Ordner der Page Bundle-Datei für Hugo-Webseiten mit dem Mainroad-Theme speichern können

Schon seit geraumer Zeit plagt mich diese lästige Sache, Thumbnail-Bilder der Seiten in das statische Verzeichnis zu legen: Thumbnail-Bilder der Seiten.

Das gilt für Mainroad, Rodster und ähnliche Hugo-Themen.

LLM-Leistung und PCIe-Slots: Wichtige Aspekte

Wie PCIe-Lanes die Leistung von LLMs beeinflussen? Je nach Aufgabe. Bei Training und Multi-GPU- Inferenz ist der Leistungsverlust erheblich.

Mit Gitea Actions einen Hugo-Webserver auf AWS S3 bereitstellen

Der nächste Schritt besteht darin, einige CI/CD-Tools zu implementieren und Gitea Actions für die Hugo-Website, um die Website automatisch auf AWS S3 zu pushen einzurichten, sobald der Master-Branch aktualisiert wird.

HTML-Inhalt in Markdown konvertieren mit LLM und Ollama

Im Ollama-Modell-Repository gibt es Modelle, die in der Lage sind, HTML-Inhalt in Markdown umzuwandeln, was für Aufgaben der Inhaltskonvertierung nützlich ist. Dieser Leitfaden ist Teil unseres Hubs Dokumentations-Tools 2026: Markdown, LaTeX, PDF & Druckworkflows.

Hier finden Sie einige KI-gestützte Codierungswerkzeuge und KI-Codierungsassistenten sowie deren positiven Aspekte.

Test: Wie Ollama die Intel CPU Performance und Efficient Cores verwendet

Ich habe eine Theorie, die ich testen möchte – wenn man alle Kerne eines Intel-Prozessors nutzt, würde das die Geschwindigkeit von LLMs erhöhen? Test: Wie Ollama die Leistung des Intel-Prozessors und der effizienten Kerne nutzt

Es nervt mich, dass das neue Gemma3-Modell mit 27 Bit (gemma3:27b, 17 GB auf Ollama) nicht in die 16 GB VRAM meines GPUs passt und teilweise auf dem CPU läuft.

MinIO-Befehlszeilenparameter-Kurzanleitung

MinIO bietet zwei Standard-UIs an: (1) MinIO Console – das ist eine Web-Oberfläche und (2) MinIO Command – dies ist eine Befehlszeile mit mc.

Minio als AWS-S3-Alternative: Übersicht und Installation

MinIO ist ein Open-Source-, leistungsstarkes, verteiltes Objekt-Speichersystem, das vollständig kompatibel mit der Amazon S3-API sein soll.

Vergleich der Eignung von NVIDIA-GPUs für KI

Inmitten des Chaos der modernen Welt vergleiche ich hier die technischen Spezifikationen verschiedener Grafikkarten für KI-Aufgaben (Deep Learning, Objekterkennung und LLMs). Sie sind alle jedoch unglaublich teuer.

Self-Hosting

Dokumente mit Ollama und dem Qwen3 Reranker-Modell neu sortieren – in Go

Vergleich der Qualität der Hugo-Seitentranslation – LLMs auf Ollama

Neuranking von Texten mit Ollama und Qwen3 Embedding-LLM – in Go

Nvidia RTX 5080 und RTX 5090 Preise in Australien – Juni 2025

YaCy: Dezentrale Suchmaschine, Vorteile, Herausforderungen und Zukunft

Ist die Quadro RTX 5880 Ada 48GB gut?

Qwen3-Embedding- und Reranker-Modelle auf Ollama: State-of-the-Art-Leistung

Wie Sie Vorschaubilder in den Ordner der Page Bundle-Datei für Hugo-Webseiten mit dem Mainroad-Theme speichern können

LLM-Leistung und PCIe-Slots: Wichtige Aspekte

Mit Gitea Actions einen Hugo-Webserver auf AWS S3 bereitstellen

HTML-Inhalt in Markdown konvertieren mit LLM und Ollama

Vergleich von KI-Coding-Assistenten

Test: Wie Ollama die Intel CPU Performance und Efficient Cores verwendet

MinIO-Befehlszeilenparameter-Kurzanleitung

Minio als AWS-S3-Alternative: Übersicht und Installation

Vergleich der Eignung von NVIDIA-GPUs für KI