Self-Hosting

Problèmes de sortie structurée d'Ollama GPT-OSS

Les modèles GPT-OSS d’Ollama présentent régulièrement des problèmes pour gérer les sorties structurées, surtout lorsqu’ils sont utilisés avec des cadres comme LangChain, OpenAI SDK, vllm et d’autres.

Contrainte des LLM avec une sortie structurée : Ollama, Qwen3 & Python ou Go

Les grands modèles de langage (LLMs) sont puissants, mais en production, nous souhaitons rarement des paragraphes libres. Au contraire, nous voulons des données prévisibles : des attributs, des faits ou des objets structurés que vous pouvez alimenter dans une application. C’est la sortie structurée des LLM.

Kubuntu vs KDE Neon : Une analyse technique approfondie

Pour les fans de KDE Plasma, deux distributions Linux apparaissent fréquemment dans les discussions : Kubuntu et KDE Neon. Ils peuvent sembler similaires – tous deux livrent KDE Plasma comme bureau par défaut, tous deux sont basés sur Ubuntu, et tous deux sont conviviaux pour les nouveaux utilisateurs.

Allocation de mémoire et planification du modèle dans la nouvelle version d'Ollama - v0.12.1

Ici, je compare la quantité de VRAM allouée par la nouvelle version d’Ollama au modèle par rapport à la version précédente d’Ollama. La nouvelle version est pire.

Comment changer une adresse IP statique sur un serveur Ubuntu

Ce guide vous guidera à travers le processus de modification de l’adresse IP statique sur un serveur Ubuntu.

L'Enshittification d'Ollama - Les premiers signes

Ollama est rapidement devenu l’un des outils les plus populaires pour exécuter des LLM localement. Son interface CLI simple et sa gestion des modèles optimisée l’ont rendu l’option de prédilection pour les développeurs souhaitant travailler avec des modèles d’IA en dehors du cloud.

Comment installer le serveur Mumble sur Ubuntu et utiliser Mumble sur Android et iOS

Mumble est une application de communication vocale par Internet (VoIP) gratuite et open source, principalement conçue pour la communication vocale en temps réel. Elle utilise une architecture client-serveur où les utilisateurs se connectent à un serveur partagé pour s’entretenir entre eux.

Interfaces de chat pour les instances locales d'Ollama

Localement hébergé, Ollama permet d’exécuter des modèles de langage sur votre propre machine, mais son utilisation via la ligne de commande n’est pas très conviviale.
Voici plusieurs projets open source qui proposent des interfaces du style ChatGPT qui se connectent à un Ollama local.

Applications de surveillance du GPU sous Linux / Ubuntu

Applications de surveillance de la charge du GPU :
nvidia-smi vs nvtop vs nvitop vs KDE plasma systemmonitor.

Installer k3s sur du baremetal - tutoriel étape par étape et avec Terraform

Voici un walkthrough étape par étape de
l’installation d’un cluster K3s à 3 nœuds
sur des serveurs physiques (1 maître + 2 travailleurs).

Distributions Kubernetes - aperçu rapide de kubeadm, k3s, MicroK8s, Minikube, Talos Linux et RKE2

Comparaison des distributions de self-hosting Kubernetes pour l’hébergement sur serveurs physiques ou serveurs domestiques, en se concentrant sur la facilité d’installation, les performances, les exigences système et les ensembles de fonctionnalités.

Comparaison des distributions Kubernetes pour un homelab à 3 nœuds

Je compare les variantes de Kubernetes auto-hébergées que l’on peut utiliser dans un homelab basé sur Ubuntu avec 3 nœuds (16 Go de RAM, 4 cœurs chacun), en mettant l’accent sur la facilité d’installation et de maintenance, ainsi que le support des volumes persistants et des LoadBalancers.

Fiche de raccourcis GitHub Actions - Structure standard et liste des actions les plus utiles

GitHub Actions
est une plateforme d’automatisation et de CI/CD au sein de GitHub, utilisée pour construire, tester et déployer votre code en fonction d’événements tels que les pushes, les demandes de fusion ou un calendrier.

Fiche de raccourcis Docker Compose - Les commandes les plus utiles avec des exemples

Voici un fichier d’astuces Docker Compose avec des exemples annotés pour vous aider à maîtriser rapidement les fichiers et les commandes Compose.

Utiliser Obsidian pour la gestion de la connaissance personnelle

Voici une analyse détaillée de
Obsidian en tant qu’outil puissant pour la gestion de la connaissance personnelle (GCP),
expliquant son architecture, ses fonctionnalités, ses forces et la manière dont il soutient les workflows modernes de gestion de la connaissance.

NVIDIA DGX Spark - nouveau petit superordinateur AI

Nvidia est sur le point de lancer le NVIDIA DGX Spark – un petit superordinateur d’IA basé sur l’architecture Blackwell, doté d’une mémoire unifiée de 128+Go et d’une performance d’IA de 1 PFLOPS. Un appareil intéressant pour exécuter les LLM.