AI - Page 7 - Rost Glukhov | Sito personale e blog tecnico

Reranking è un secondo passo nella Generazione Aumentata dal Recupero (RAG) sistemi, posizionato esattamente tra il Recupero e la Generazione.

Recentemente Black Forest Labs ha pubblicato un insieme di modelli AI testo-immagine.
Questi modelli si dice che abbiano una qualità di output molto superiore.
Proviamoli

Il cibo meraviglioso è un piacere anche per i tuoi occhi. Ma in questo post confronteremo due sistemi di ricerca basati sull’IA, Farfalle e Perplexica.

È davvero entusiasmante! Invece di chiamare Copilot o Perplexity.ai e rivelare al mondo intero cosa stai cercando, ora puoi ospitare un servizio simile sul tuo PC o laptop!

Recentemente abbiamo visto l’uscita di diversi nuovi LLM. Tempi eccitanti. Proviamo a testarli e a vedere come si comportano nel rilevare le fallacie logiche.

Tuttavia, esistono alcuni approcci comuni per scrivere promemoria efficaci in modo che i modelli linguistici non si confondano cercando di capire cosa si desidera da essi.

A volte ne ho bisogno ma non riesco a trovarli subito.
Per questo motivo li tengo tutti qui.

Quando ho addestrato un rilevatore di oggetti AI qualche tempo fa - LabelImg era uno strumento molto utile, ma l’esportazione da Label Studio al formato COCO non era accettata dal framework MMDetection..

Confronto delle capacità di sintesi degli LLM

Testare come si comportano i modelli con diverso numero di parametri e quantizzazione.

Dopo aver installato ollama, è meglio riconfigurare Ollama per memorizzarli subito in un nuovo luogo. In questo modo, dopo aver scaricato un nuovo modello, non verrà scaricato nella posizione vecchia.

Confronto della velocità di previsione di diverse versioni degli LLM (Large Language Models): llama3 (Meta/Facebook), phi3 (Microsoft), gemma (Google), mistral (open source) su CPU e GPU.

Ecco qui che confronto diverse versioni di LLM: Llama3 (Meta), Phi3 (Microsoft), Gemma (Google), Mistral Nemo (Mistral AI) e Qwen (Alibaba).

AI

Reranking con modelli di embedding

Modello AI Flux da testo a immagine

Farfalle contro Perplexica

Self-hosting di Perplexica - con Ollama

Gemma2 vs Qwen2 vs Mistral Nemo vs...

Scrivere prompt efficaci per i modelli linguistici di grandi dimensioni

Foglio di riferimento Python - Utili frammenti di codice Python.

Addestrare un rilevatore di oggetti AI con Label Studio & MMDetection

Confronto delle capacità di sintesi degli LLM

Spostare i modelli Ollama in una posizione diversa

Test di velocità dei modelli linguistici di grandi dimensioni

Rilevamento delle fallacie logiche con i modelli linguistici di grandi dimensioni