RAG

Récupération vs Représentation dans les Systèmes de Connaissance

Récupération vs Représentation dans les Systèmes de Connaissance

La recherche n'est pas une structure de connaissances

La plupart des systèmes de connaissances modernes optimisent la récupération (retrieval), et cela est compréhensible. La recherche est visible, facile à démontrer et semble magique lorsqu’elle fonctionne. Tapez une question, obtenez une réponse.

LLM Wiki - Savoir compilé que le RAG ne peut remplacer

LLM Wiki - Savoir compilé que le RAG ne peut remplacer

Connaissances compilées pour les systèmes d'IA

Le principe est simple : les connaissances compilées sont plus réutilisables que les fragments récupérés. RAG est devenu la réponse par défaut à une question simple : comment donner à un LLM (modèle de langage) l’accès à des connaissances externes ?

Le Second Cerveau expliqué pour les ingénieurs et les travailleurs de la connaissance

Le Second Cerveau expliqué pour les ingénieurs et les travailleurs de la connaissance

Les notes constituent le stockage. Un second cerveau assure le calcul.

La surcharge informationnelle tient moins à l’abondance brute des données qu’à la présence d’entrées non résolues. Le travail intellectuel moderne laisse une traînée d’onglets, de fils de discussion, de documents, de surlignages, de fragments de code, de transcriptions, de captures d’écran et de notes à moitié rédigées.

Validation des sorties structurées des LLM en Python qui tient la route

Validation des sorties structurées des LLM en Python qui tient la route

Arrêtez d’interpréter des vibes. Validez les contrats.

La plupart des tutoriels sur les « sorties structurées » des LLM manquent de sérieux. Ils vous apprennent à demander du JSON poliment, puis à espérer que le modèle se comporte correctement. Ce n’est pas de la validation. C’est de l’optimisme entre accolades.

Embeddings de texte pour RAG et recherche - Python, Ollama, API compatibles OpenAI

Embeddings de texte pour RAG et recherche - Python, Ollama, API compatibles OpenAI

Intégration RAG - Python, Ollama, API OpenAI.

Si vous travaillez sur la génération augmentée par récupération (RAG), cette section explique les incorporations de texte (text embeddings) en termes simples : ce qu’elles sont, comment elles s’intègrent dans la recherche et la récupération, et comment appeler deux configurations locales courantes depuis Python en utilisant Ollama ou une API HTTP compatible OpenAI (comme le font de nombreux serveurs basés sur llama.cpp).