K8S - Rost Glukhov | Site personnel et blog technique

Surveillance de l'inférence des LLM en production (2026) : Prometheus & Grafana pour vLLM, TGI et llama.cpp

L’inférence LLM ressemble à « une API comme les autres » — jusqu’à ce que les pics de latence apparaissent, les files d’attente s’allongent et que vos GPU atteignent 95 % de mémoire sans explication évidente.

Top 19 des projets Go tendance sur GitHub - Janvier 2026

L’écosystème Go continue de prospérer avec des projets innovants couvrant l’outillage IA, les applications auto-hébergées et l’infrastructure développeur. Ce panorama analyse les dépôts Go les plus tendance sur GitHub ce mois-ci.

Open WebUI : interface auto-hébergée pour LLM

Open WebUI est une application web puissante, extensible et riche en fonctionnalités pour interagir avec les grands modèles de langage, hébergée localement.

Événements Tech à Melbourne à Ne Pas Manquer en 2026

La communauté technologique de Melbourne continue de prospérer en 2026 avec une impressionnante programmation de conférences, rencontres et ateliers couvrant le développement logiciel, l’informatique en nuage, l’IA, la cybersécurité et les technologies émergentes.

vLLM est un moteur d’inférence et de déploiement à haut débit et économe en mémoire pour les grands modèles de langage (LLM), développé par le Sky Computing Lab de l’Université de Californie à Berkeley.

Les outils de vérification de code Go : des outils essentiels pour la qualité du code

Le développement moderne en Go exige des normes rigoureuses de qualité du code. Les linters pour Go automatisent la détection des bugs, des vulnérabilités de sécurité et des incohérences de style avant qu’ils n’atteignent la production.

Microservices Go pour l'orchestration AI/ML

Alors que les charges de travail d’IA et de ML deviennent de plus en plus complexes, le besoin de systèmes d’orchestration robustes est devenu plus important que jamais. La simplicité, la performance et la concurrence de Go en font un choix idéal pour construire la couche d’orchestration des pipelines ML, même lorsque les modèles eux-mêmes sont écrits en Python.

Infrastructure IA sur du matériel grand public

La démocratisation de l’IA est arrivée. Avec des LLM open-source comme Llama, Mistral et Qwen qui rivalisent désormais avec les modèles propriétaires, les équipes peuvent construire une puissante infrastructure IA utilisant du matériel grand public - réduisant les coûts tout en conservant un contrôle total sur la confidentialité des données et le déploiement.

Surveillance Prometheus : Configuration complète et bonnes pratiques

Prometheus est devenu le standard de facto pour la surveillance des applications et des infrastructures cloud-native, offrant la collecte de métriques, la requête et l’intégration avec des outils de visualisation.

Installer et utiliser Grafana sur Ubuntu : guide complet

Grafana est la plateforme open source leader pour le monitoring et l’observabilité, transformant les métriques, les logs et les traces en informations exploitables grâce à des visualisations spectaculaires.

Helm Charts : Gestion des packages Kubernetes

Helm a révolutionné le déploiement d’applications Kubernetes en introduisant des concepts de gestion de paquets familiers provenant des systèmes d’exploitation traditionnels.

StatefulSets et stockage persistant dans Kubernetes

Kubernetes StatefulSets sont la solution idéale pour gérer les applications stateful qui nécessitent des identités stables, un stockage persistant et des schémas de déploiement ordonnés — essentielles pour les bases de données, les systèmes distribués et les couches de mise en cache.

Patterns architecturaux pour la sécurisation des données : au repos, en transit et en cours d'exécution

Lorsque les données constituent un actif précieux, leur sécurisation est devenue plus critique que jamais.
Du moment où l’information est créée jusqu’au moment où elle est éliminée,
son parcours est marqué de risques - qu’elle soit stockée, transférée ou utilisée activement.

Mettre en œuvre un Service Mesh avec Istio et Linkerd : un guide complet

Découvrez comment implémenter et optimiser les architectures de service mesh en utilisant Istio et Linkerd. Ce guide couvre les stratégies de déploiement, les comparaisons de performance, les configurations de sécurité et les bonnes pratiques pour les environnements de production.

Installer k3s sur du baremetal - tutoriel étape par étape et avec Terraform

Voici un walkthrough étape par étape de
l’installation d’un cluster K3s à 3 nœuds
sur des serveurs physiques (1 maître + 2 travailleurs).

Distributions Kubernetes - aperçu rapide de kubeadm, k3s, MicroK8s, Minikube, Talos Linux et RKE2

Comparaison des distributions de self-hosting Kubernetes pour l’hébergement sur serveurs physiques ou serveurs domestiques, en se concentrant sur la facilité d’installation, les performances, les exigences système et les ensembles de fonctionnalités.