AI - Page 3 - Rost Glukhov | Site personnel et blog technique

Reranking des textes avec Ollama et Qwen3 Embedding LLM - en Go

Ce petit exemple de code Go pour le reranking appelle Ollama pour générer des embeddings pour la requête et pour chaque document candidat, puis trie par ordre décroissant de similarité cosinus.

Modèles d'embedding et de réorganisation Qwen3 sur Ollama : une performance d'avant-garde

Les modèles Qwen3 Embedding and Reranker sont les dernières sorties de la famille Qwen, spécifiquement conçus pour des tâches avancées d’embedding de texte, de récupération et de réordonnancement.

Comparaison de la pertinence des GPU NVidia pour l'IA

Dans le chaos du monde moderne ici, je compare les spécifications techniques de différentes cartes adaptées aux tâches IA
(Deep Learning,
Détection d’objets
et LLMs).
Elles sont toutes extrêmement coûteuses toutefois.

Vibe coding est une approche de programmation pilotée par l’IA où les développeurs décrivent les fonctionnalités souhaitées en langage naturel, permettant aux outils d’IA de générer automatiquement du code.

J’ai utilisé MMDetection (mmengine, mdet, mmcv) assez souvent,
et maintenant il semble qu’il ait quitté la scène.
C’est une perte. J’aimais sa zoo de modèles.

DeepSeek’s première génération de modèles de raisonnement avec des performances comparables à celles d’OpenAI-o1,
y compris six modèles denses distillés à partir de DeepSeek-R1 basés sur Llama et Qwen.

Voici la liste et les exemples des commandes Ollama les plus utiles (fiche de commandes Ollama) que j’ai compilées il y a un certain temps. J’espère qu’elles vous seront également utiles.

Il y a peu de temps a été publié. Commençons par un point de situation et testons comment Mistral Small se compare aux autres LLM.

Récemment, Black Forest Labs a publié un ensemble de
modèles d’IA texte à image.
Ces modèles sont dit avoir une qualité de sortie bien plus élevée.
Essayons-les

La bonne nourriture est aussi un plaisir pour les yeux. Mais dans cet article, nous allons comparer deux systèmes de recherche basés sur l’IA, Farfalle et Perplexica.

C’est très excitant !
Au lieu d’appeler Copilot ou Perplexity.ai et de tout raconter au monde,
vous pouvez maintenant héberger un service similaire sur votre propre ordinateur ou laptop !

Quand j’ai commencé à expérimenter avec les LLM, les interfaces utilisateur pour eux étaient en développement actif, et maintenant certaines d’entre elles sont vraiment excellentes.

Récemment, nous avons vu plusieurs nouveaux LLM sortir. Des temps excitants. Testons-les et voyons comment ils se débrouillent lors de la détection des fautes logiques.

Il existe toutefois quelques approches courantes pour rédiger des prompts efficaces afin que le modèle de langage ne se confonde pas en tentant de comprendre ce que vous souhaitez.

Quand j’ai entraîné un détecteur d’objets AI il y a un certain temps - LabelImg était un outil très utile, mais l’exportation depuis Label Studio vers le format COCO n’était pas acceptée par le framework MMDetection..

Comparaison des capacités de résumé des modèles LLM

Testing comment sur les modèles avec un nombre différent de paramètres et la quantification.

AI

Reranking des textes avec Ollama et Qwen3 Embedding LLM - en Go

Modèles d'embedding et de réorganisation Qwen3 sur Ollama : une performance d'avant-garde

Comparaison de la pertinence des GPU NVidia pour l'IA

Vibe Coding - Sens et description

MMdetection n'est plus pris en charge.

Test de Deepseek-R1 sur Ollama

Ollama Cheatsheet - commandes les plus utiles

Mistral Small, Gemma 2, Qwen 2.5, Mistral Nemo, LLama3 et Phi - Test de modèles LLM

Modèle d'IA Flux texte en image

Farfalle vs Perplexica

Auto-hébergement de Perplexica avec Ollama

Frontends des LLM

Gemma2 vs Qwen2 vs Mistral Nemo vs...

Rédiger des prompts efficaces pour les LLMs

Formation d'un détecteur d'objets AI avec Label Studio & MMDetection

Comparaison des capacités de résumé des modèles LLM