site logo
Notes on the margins
Rost Glukhov. Personal site and technical blog
  • Programmierung
  • DevOps
  • Kochbuch
  • Hardware
  • KI
  • Spickzettel
  • Anleitungen
  • Offline
  • Über
Ollama-Clients für Go: SDK-Vergleich und Beispiele für Qwen3/GPT-OSS

Ollama-Clients für Go: SDK-Vergleich und Beispiele für Qwen3/GPT-OSS

Integrieren Sie Ollama mit Go: SDK-Anleitung, Beispiele und Produktions-Best-Praktiken.

Dieser Leitfaden bietet einen umfassenden Überblick über verfügbare Go SDKs für Ollama und vergleicht deren Funktionsumfänge.

6 Wege zur Verwaltung des Zustands in Flutter-Apps (mit Codebeispielen)

6 Wege zur Verwaltung des Zustands in Flutter-Apps (mit Codebeispielen)

Wie man den Zustand in Flutter verwaltet

In diesem Artikel werden wir sechs beliebte Methoden zur Verwaltung des Zustands in Flutter-Apps erkunden, einschließlich echter Beispiele und Best Practices:

Aufbau einer Dual-Mode AWS Lambda mit Python und Terraform

Aufbau einer Dual-Mode AWS Lambda mit Python und Terraform

Schritt-für-Schritt-Beispiel

Hier haben wir ein Python Lambda-Beispiel eines SQS-Nachrichtenprozessors + REST-API mit API-Schlüssel-Schutz + Terraform-Skript zur Bereitstellung für serverlose Ausführung.

Vergleich: Qwen3:30b vs GPT-OSS:20b

Vergleich: Qwen3:30b vs GPT-OSS:20b

Geschwindigkeit, Parameter und Leistung dieser beiden Modelle im Vergleich

Hier ist ein Vergleich zwischen Qwen3:30b und GPT-OSS:20b mit Fokus auf Befolgung von Anweisungen und Leistungsparametern, Spezifikationen und Geschwindigkeit:

Writefreely-Föderierte Blogging-Plattform - Selbsthosting vs. verwaltete Kosten

Writefreely-Föderierte Blogging-Plattform - Selbsthosting vs. verwaltete Kosten

Geschätzte Hostingkosten im Vergleich zu Abonnements.

Hier ist eine schnelle Information zu Write.as / WriteFreely – wie es in das Fediverse passt, wo man verwaltetes Hosting bekommt, wie der Nutzungs-Trend aussieht und wie man es selbst hostet (inklusive grober Kostenvoranschläge).

Integration von Ollama mit Python: Beispiele für REST-API und Python-Client

Integration von Ollama mit Python: Beispiele für REST-API und Python-Client

+ Spezifische Beispiele unter Verwendung von Thinking LLMs

In diesem Beitrag werden wir zwei Möglichkeiten erkunden, Ihre Python-Anwendung mit Ollama zu verbinden: 1. Über die HTTP REST API; 2. Über die offizielle Ollama Python-Bibliothek.

Proxmox im Jahr 2025: Ein praktischer, all-in-one-Virtualisierungs-Stack

Proxmox im Jahr 2025: Ein praktischer, all-in-one-Virtualisierungs-Stack

Was ist Proxmox?

Proxmox Virtual Environment (Proxmox VE) ist eine Open-Source-, Typ-1-Hypervisor- und Rechenzentrums-Orchestrierungsplattform, die auf Debian basiert.

Konfiguration der SEO für mehrsprachige Websites mit Hugo

Konfiguration der SEO für mehrsprachige Websites mit Hugo

Was tun mit `canonical`, `lang` und `hreflang`

Übersetzen Ihrer Hugo-Website kann Ihre Google- und Bing-Rangfolge verbessern - aber nur, wenn der übersetzte Inhalt von hoher Qualität ist, lokalisiert und richtig für mehrsprachige SEO strukturiert.

Datenschutzorientierte Browser: Praktischer Leitfaden für sichereres Surfen im Internet

Datenschutzorientierte Browser: Praktischer Leitfaden für sichereres Surfen im Internet

Inklusive Installationsanleitungen für Windows, Linux und Mac

Online-Datenschutz ist ein heißes Thema. Von gezielten Werbeanzeigen bis zu stillen Trackern teilen viele Mainstream-Browser mehr über Sie mit, als Sie möchten. Zum Glück gibt es mehrere privacyorientierte Browser, die Ihnen helfen, sicher und anonym zu bleiben.

NVIDIA RTX 5080- und RTX 5090-Preise in Australien – Oktober 2025

NVIDIA RTX 5080- und RTX 5090-Preise in Australien – Oktober 2025

Preise für AI-geeignete Consumer-GPUs - RTX 5080 und RTX 5090

Wiederholt vergleichen wir die Preise für High-End-Consumer-GPUs, die insbesondere für LLMs und allgemein für KI geeignet sind. Speziell betrachte ich die Preise für RTX-5080 und RTX-5090. Diese sind leicht gesunken.

Erstellen, Veröffentlichen und Monetarisieren von Alexa-Skills

Erstellen, Veröffentlichen und Monetarisieren von Alexa-Skills

Wie man eine Amazon Alexa Skill entwickelt - Anleitung.

In diesem Artikel werden wir uns Alexa-Skill-Entwicklung, -Test und -Veröffentlichung eingehend ansehen. Wir werden auch Designprinzipien, technische Überlegungen und bewährte Methoden behandeln, um sicherzustellen, dass Ihr Skill ein ansprechendes und natürliches Nutzererlebnis bietet.

Probleme mit strukturierten Ausgaben in Ollama GPT-OSS

Probleme mit strukturierten Ausgaben in Ollama GPT-OSS

Nicht sehr nett.

Ollamas GPT-OSS-Modelle haben wiederkehrende Probleme bei der Handhabung strukturierter Ausgaben, insbesondere bei der Verwendung mit Frameworks wie LangChain, OpenAI SDK, vllm und anderen.

Strukturierter Output-Vergleich bei beliebten LLM-Anbietern - OpenAI, Gemini, Anthropic, Mistral und AWS Bedrock

Strukturierter Output-Vergleich bei beliebten LLM-Anbietern - OpenAI, Gemini, Anthropic, Mistral und AWS Bedrock

Leicht unterschiedliche APIs erfordern einen speziellen Ansatz.

Hier ist ein Seitenvergleich der Unterstützung für strukturierte Ausgaben (zuverlässige JSON-Rückgabe) bei beliebten LLM-Anbietern, plus minimale Python-Beispiele

Einschränkung von LLMs mit strukturierten Ausgaben: Ollama, Qwen3 & Python oder Go

Einschränkung von LLMs mit strukturierten Ausgaben: Ollama, Qwen3 & Python oder Go

Einige Möglichkeiten, um strukturierte Ausgaben von Ollama zu erhalten

Große Sprachmodelle (LLMs) sind leistungsfähig, aber in der Produktion wollen wir selten frei formulierte Absätze. Stattdessen wollen wir vorhersehbare Daten: Attribute, Fakten oder strukturierte Objekte, die Sie in eine Anwendung einspeisen können. Das ist LLM-Strukturierte Ausgabe.

PostgreSQL-Cheatsheet: Ein schneller Leitfaden für Entwickler

PostgreSQL-Cheatsheet: Ein schneller Leitfaden für Entwickler

Schnelle Referenz zu PostgreSQL

Ein schneller Referenzleitfaden für den täglichen Umgang mit PostgreSQL: Verbindungen, SQL-Syntax, psql-Meta-Befehle, Leistung, JSON, Fensterfunktionen und mehr.

1/12 »

Letzte Beiträge

  • Ollama-Clients für Go: SDK-Vergleich und Beispiele für Qwen3/GPT-OSS
  • 6 Wege zur Verwaltung des Zustands in Flutter-Apps (mit Codebeispielen)
  • Aufbau einer Dual-Mode AWS Lambda mit Python und Terraform
  • Vergleich: Qwen3:30b vs GPT-OSS:20b
  • Writefreely-Föderierte Blogging-Plattform - Selbsthosting vs. verwaltete Kosten

Kategorien

  • AI
  • Cheatsheet
  • Coding
  • Cookbook
  • Dev
  • Devops
  • Hardware
  • Howtos
  • Offline
  • Research

Tags

AI AI Coding Alexa Anaconda Android API AWS AWS Amplify Backup Bash Cheatsheet Cloud Community Cookbook Database DeepLearning Dev DevOps Digital Detox Docker Filofax Flutter Food Git Gitea Go Golang Hardware Hosting Hugo Images JavaScript K8S LabelStudio Latex Linux LLM Mainroad Markdown Melbourne Minio MMDetection Node.js NVidia ObjectDetection Offline Ollama Open Source Perplexica Photos PostgreSQL Privacy Python PyTorch RAG Self-Hosting SEO Serverless SQL Terraform VSCode Web Hosting Windows

Soziale Netzwerke

Twitter
LinkedIn
root@@@glukhov.au
Mastodon
Mastodon
rost @ lemmy.world
rosgluk @ github
rosgluk @ bluesky
gluk @ reddit
rosgluk @ Medium
rosgluk @ blogspot
rosgluk @ tumblr

Sprachen

  • EN English
  • RU Русский
  • DE Deutsch
  • ES Español
  • FR Français
  • IT Italiano
  • ID Bahasa indonesia
  • JA 日本語
  • HI ह न द
  • KO 한국어
  • PL Polski
  • PT Português
  • NL Nederlands
  • ZH-CN 中文 (简体)
  • AR العربية
© 2025 Rost Glukhov. Erstellt mit Hugo und Mainroad Theme.