Hardware

Stratégies de découpage dans la comparaison de RAG : alternatives, compromis et exemples

Chunking est le hyperparamètre le plus sous-estimé dans le génération augmentée par recherche (RAG) : il détermine silencieusement ce que votre LLM “voit”, combien coûte l’ingestion, et combien de la fenêtre de contexte de l’LLM vous brûlez par réponse.

A hub for compute hardware analysis covering GPUs, CPUs, memory trends, and AI-focused workstation infrastructure.

Hébergement autonome des LLM et souveraineté en IA

L’hébergement local des LLM permet de garder les données, les modèles et l’inférence sous votre contrôle : une approche pratique pour atteindre la souveraineté en IA pour les équipes, les entreprises et les nations.

Comparaison des performances des LLM sur Ollama sur une GPU avec 16 Go de VRAM

Exécuter des modèles de langage volumineux localement vous offre la confidentialité, la capacité hors ligne et un coût API nul. Ce benchmark révèle exactement ce à quoi on peut s’attendre à partir de 14 modèles populaires LLMs sur Ollama sur un RTX 4080.

Hausse des prix des GPU et RAM en Australie : RTX 5090 en hausse de 15 %, RAM en hausse de 38 % - janvier 2026

Aujourd’hui, nous examinons les GPU grand public haut de gamme et les modules de RAM. Plus précisément, j’étudie les prix des RTX-5080 et RTX-5090, ainsi que les modules de 32GB (2x16GB) DDR5 6000.

Meilleurs émulateurs de terminal Linux : comparaison 2026

L’un des outils les plus essentiels pour les utilisateurs de Linux est l’émulateur de terminal (https://www.glukhov.org/fr/post/2026/01/terminal-emulators-for-linux-comparison/ “Linux l’émulateur de terminal”).

Prix de DGX Spark AU : 6 249 $ - 7 999 $ chez les grands détaillants

Le NVIDIA DGX Spark (GB10 Grace Blackwell) est maintenant disponible en Australie chez les principaux détaillants de PC avec des stocks locaux. Si vous avez suivi les prix et disponibilités mondiaux du DGX Spark, vous serez intéressé de savoir que les prix australiens vont de 6 249 à 7 999 AUD selon la configuration de stockage et le détaillant.

Auto-hébergement de Cognee : choisir un LLM sur Ollama

Cognee est un framework Python permettant de construire des graphes de connaissances à partir de documents en utilisant des LLM. Mais fonctionne-t-il avec des modèles auto-hébergés ?

Ubuntu a perdu la connexion réseau après une mise à niveau du noyau

Après avoir installé automatiquement un nouveau noyau, Ubuntu 24.04 a perdu la connexion réseau Ethernet. Ce problème frustrant s’est produit une deuxième fois pour moi, donc je documente la solution ici pour aider les autres confrontés au même problème.

Prix de la RAM en Australie - décembre 2025

Avec cette folle volatilité des prix de la RAM, pour former et avoir une meilleure idée, traçons d’abord nous-mêmes le prix de la RAM en Australie.

Augmentation du prix de la RAM : jusqu'à 619 % en 2025

Le marché de la mémoire connaît une volatilité de prix sans précédent à la fin de 2025, avec une hausse dramatique des prix de la RAM sur tous les segments : augmentation des prix de la RAM.

Prix de la carte graphique NVidia RTX 5080 et RTX 5090 en Australie - novembre 2025

Commençons par comparer les prix des cartes graphiques de haut de gamme destinées aux consommateurs, qui sont particulièrement adaptées aux LLM et plus généralement à l’IA. Plus précisément, je regarde prix des RTX-5080 et RTX-5090.

Infrastructure d'IA sur le matériel grand public

La démocratisation de l’IA est ici. Avec des LLM open source comme Llama 3, Mixtral et Qwen qui rivalisent désormais avec les modèles propriétaires, les équipes peuvent construire une infrastructure puissante d’IA à l’aide du matériel grand public - réduisant les coûts tout en maintenant un contrôle complet sur la confidentialité des données et le déploiement.

Ajout de la prise en charge des GPU NVIDIA au Docker Model Runner

Docker Model Runner est l’outil officiel de Docker pour exécuter des modèles d’IA localement, mais l’activation de l’accélération GPU NVidia dans Docker Model Runner nécessite une configuration spécifique.

NVIDIA DGX Spark vs Mac Studio vs RTX-4080 : Comparaison des performances d'Ollama

J’ai découvert des tests de performance intéressants sur l’exécution du modèle GPT-OSS 120b avec Ollama sur trois plateformes différentes : NVIDIA DGX Spark, Mac Studio, et RTX 4080. Le modèle GPT-OSS 120b de la bibliothèque Ollama pèse 65 Go, ce qui signifie qu’il ne peut pas s’exécuter dans les 16 Go de VRAM d’un RTX 4080 (ou sur le plus récent RTX 5080).

Fichier d'aide-mémoire Docker Model Runner : commandes et exemples

Docker Model Runner (DMR) est la solution officielle de Docker pour exécuter des modèles d’IA localement, introduite en avril 2025. Cette fiche pratique fournit un référentiel rapide pour toutes les commandes essentielles, les configurations et les bonnes pratiques.