Self-Hosting Cognee: Scegliere LLM su Ollama
Test di Cognee con LLM locali - risultati reali
Cognee è un framework Python per costruire grafi di conoscenza da documenti utilizzando LLM. Ma funziona con modelli auto-hostati?
Test di Cognee con LLM locali - risultati reali
Cognee è un framework Python per costruire grafi di conoscenza da documenti utilizzando LLM. Ma funziona con modelli auto-hostati?
Riflessioni sui modelli LLM per Cognee autoospitati
Scegliere il miglior LLM per Cognee richiede di bilanciare la qualità della costruzione del grafo, i tassi di allucinazione e i vincoli hardware. Cognee eccelle con modelli più grandi a bassa allucinazione (32B+) tramite Ollama ma le opzioni di dimensioni medio-piccole funzionano per le configurazioni più leggere.
Costruisci agenti di ricerca AI con Python e Ollama
La libreria Python di Ollama ora include funzionalità native di ricerca web OLLama. Con poche righe di codice, puoi arricchire i tuoi LLM locali con informazioni in tempo reale dal web, riducendo le illusioni e migliorando l’accuratezza.
Scegli il database vettoriale giusto per il tuo stack RAG
La scelta del giusto vettore store può fare la differenza per le prestazioni, i costi e la scalabilità della tua applicazione RAG. Questo confronto completo copre le opzioni più popolari nel 2024-2025.
Costruisci agenti di ricerca AI con Go e Ollama
L’API di ricerca web di Ollama ti permette di integrare LLM locali con informazioni in tempo reale dal web. Questa guida ti mostra come implementare le capacità di ricerca web in Go, dal semplice utilizzo dell’API alle funzionalità complete degli agenti di ricerca.
Confronta i migliori strumenti di hosting locale per LLM nel 2026: maturità dell'API, supporto hardware, tool calling e casi d'uso reali.
L’esecuzione di LLM in locale è ora pratica per sviluppatori, startup e persino team aziendali.
Ma la scelta dello strumento giusto — Ollama, vLLM, LM Studio, LocalAI o altri — dipende dai tuoi obiettivi:
Distribuisci l'AI enterprise su hardware economico con modelli open source.
La democratizzazione dell’IA è qui. Con LLM open-source come Llama, Mistral e Qwen che ora competono con i modelli proprietari, i team possono costruire potenti infrastrutture AI utilizzando hardware consumer - riducendo drasticamente i costi mantenendo il controllo totale sulla privacy dei dati e sul deployment.
LongRAG, Self-RAG, GraphRAG: tecniche di prossima generazione
Generazione Aumentata da Recupero (RAG) è evoluta ben oltre la semplice ricerca di similarità vettoriale. LongRAG, Self-RAG e GraphRAG rappresentano l’avanguardia di queste capacità.
Riduci i costi degli LLM fino all'80% con l'ottimizzazione intelligente dei token
L’ottimizzazione dei token è l’abilità fondamentale che distingue le applicazioni LLM economicamente efficienti dagli esperimenti che prosciugano il budget.
Python per convertire HTML in Markdown pulito e pronto per l'LLM
Conversione di HTML in Markdown è un compito fondamentale nei flussi di lavoro di sviluppo moderni, in particolare quando si prepara il contenuto web per i Large Language Models (LLMs), i sistemi di documentazione o i generatori di siti statici come Hugo. Questa guida fa parte del nostro Strumenti di Documentazione nel 2026: Markdown, LaTeX, PDF e Flussi di Lavoro per la Stampa hub.
Integra Ollama con Go: guida all'SDK, esempi e best practice per la produzione.
Questo documento fornisce un’overview completa degli SDK Go per Ollama disponibili e confronta i loro set di funzionalità.
Confronto di velocità, parametri e prestazioni di questi due modelli
Ecco un confronto tra Qwen3:30b e GPT-OSS:20b con un focus sul rispetto delle istruzioni e sui parametri di prestazione, specifiche e velocità.
+ Esempi Specifici Utilizzando LLM Pensanti
In questo post, esploreremo due modi per connettere la tua applicazione Python a Ollama: 1. Attraverso l’HTTP REST API; 2. Attraverso la libreria ufficiale Python di Ollama.
API leggermente diverse richiedono un approccio specifico.
Ecco un confronto tra il supporto per output strutturati (ottenimento di JSON affidabili) tra i principali provider di LLM, insieme a esempi Python minimi.
Qualche modo per ottenere output strutturato da Ollama
I Large Language Models (LLM) sono potenti, ma in produzione raramente vogliamo paragrafi liberi. Invece, vogliamo dati prevedibili: attributi, fatti o oggetti strutturati che puoi alimentare in un’applicazione. Questo è l’Output Strutturato degli LLM.
Implementi RAG? Ecco alcuni frammenti di codice in Go - 2...
Dato che Ollama standard non dispone di una API diretta per il ricalcolo del ranking (reranking), dovrai implementare il reranking utilizzando Qwen3 Reranker in GO generando embedding per le coppie query-documento e assegnando loro un punteggio.