AI - Page 7 - Rost Glukhov | Site personnel et blog technique

Reranking est une deuxième étape dans les systèmes de Génération Augmentée par Récupération (RAG) systèmes, située juste entre la récupération et la génération.

Récemment, Black Forest Labs a publié un ensemble de
modèles d’IA texte à image.
Ces modèles sont dit avoir une qualité de sortie bien plus élevée.
Essayons-les

Une excellente cuisine est aussi un plaisir pour les yeux. Mais dans cet article, nous allons comparer deux systèmes de recherche basés sur l’IA, Farfalle et Perplexica.

C’est très excitant ! Au lieu d’appeler Copilot ou Perplexity.ai et de révéler à tout le monde ce que vous recherchez, vous pouvez désormais héberger un service similaire sur votre propre PC ou ordinateur portable !

Récemment, nous avons vu plusieurs nouveaux LLM sortir. Des temps excitants. Testons-les et voyons comment ils se débrouillent lorsqu’ils détectent les fautes logiques.

Il existe toutefois quelques approches courantes pour rédiger des prompts efficaces afin que le modèle de langage ne se confonde pas en tentant de comprendre ce que vous souhaitez.

Parfois, j’ai besoin de cela mais je ne le trouve pas immédiatement.
Donc, je les garde toutes ici.

Quand j’ai entraîné un détecteur d’objets AI il y a un certain temps - LabelImg était un outil très utile, mais l’exportation depuis Label Studio vers le format COCO n’était pas acceptée par le framework MMDetection..

Comparaison des capacités de résumé des LLM

Testons comment les modèles avec différents nombres de paramètres et de quantification se comportent.

Après l’installation d’Ollama, il est préférable de reconfigurer Ollama pour les stocker immédiatement dans le nouvel emplacement. Ainsi, lorsqu’un nouveau modèle est téléchargé, il ne sera pas enregistré dans l’ancien emplacement.

Comparaison de la vitesse de prédiction de plusieurs versions de LLMs : llama3 (Meta/Facebook), phi3 (Microsoft), gemma (Google), mistral (open source) sur CPU et GPU.

Ici, je compare plusieurs versions de LLM : Llama3 (Meta), Phi3 (Microsoft), Gemma (Google), Mistral Nemo (Mistral AI) et Qwen (Alibaba).

AI

Reclassement avec des modèles d'incorporation

Modèle d'IA Flux texte en image

Farfalle contre Perplexica

Auto-hébergement de Perplexica — avec Ollama

Gemma2 vs Qwen2 vs Mistral Nemo vs...

Rédiger des prompts efficaces pour les LLMs

Feuille de triche Python - Des morceaux utiles de code Python.

Formation d'un détecteur d'objets AI avec Label Studio & MMDetection

Comparaison des capacités de résumé des LLM

Déplacer les modèles Ollama vers un autre emplacement

Test de vitesse des grands modèles de langage

Détection des fautes logiques avec les LLMs