Rost Glukhov | Sito personale e blog tecnico

Manutenzione della LLM Wiki: Deriva, Contraddizioni e Revisione

Un Wiki LLM fallisce quando vecchi fatti rimangono plausibili, le contraddizioni diventano lucide e i riassunti generati si allontanano dalle loro fonti.

Sincronizzazione dei File con Syncthing per Sistemi di Conoscenza Auto-Hosted

Syncthing mantiene i file sincronizzati tra i dispositivi che controlli, rendendolo uno degli strumenti più pratici per un’infrastruttura di conoscenza auto-ospitata che evita la dipendenza da fornitori cloud.

Pattern Circuit Breaker in Go: Fermare i guasti a cascata

Un circuit breaker impedisce al tuo servizio Go di bombardare una dipendenza in errore, prevenendo guasti a cascata che consumano goroutine, socket e memoria fino al collasso dell’intero sistema.

Podman Quadlet vs Docker Compose per i servizi Linux

Docker Compose e Podman Quadlet risolvono problemi sovrapposti ma provengono da centri di progettazione diversi, e la scelta tra i due dipende dal fatto che si pensi in termini di stack di applicazioni o di servizi Linux.

GPU per l'IA nel 2026: NVIDIA, AMD e Intel confrontate

Il panorama dell’hardware per l’IA è cambiato significativamente nel 2026, con NVIDIA, AMD e Intel che competono per gli sviluppatori che necessitano di GPU in grado di eseguire localmente modelli linguistici di grandi dimensioni (LLM) e carichi di lavoro di inferenza IA.

Agente Hermes: configurazione di server headless e desktop remoto

L’esecuzione di Hermes Agent su un server headless, connesso da un client desktop su un’altra macchina, richiede due processi sul server e una singola connessione client.

Flussi di lavoro SDD: GitHub Spec Kit contro Kiro e Claude Code

Gli sviluppatori che confrontano le configurazioni per lo Spec-Driven Development nel 2026 di solito non chiedono quale modello sia il più intelligente. Chiedono quale flusso di lavoro manterrà allineato l’agente AI senza seppellirli in una procedura eccessivamente complessa.

Flusso di lavoro dello sviluppo guidato dalle specifiche: dai requisiti al codice

Lo Spec-Driven Development funziona quando la specifica è un flusso di lavoro, non un documento da archiviare dopo il kickoff. L’obiettivo non è produrre un ampio documento di requisiti del prodotto.

Sicurezza degli agenti A2A e MCP: identità, delega e audit trail

L’iniezione di prompt riceve la maggior parte dell’attenzione in termini di sicurezza nei sistemi LLM e merita attenzione, ma non è l’unico problema una volta che gli agenti iniziano a chiamare strumenti e a delegare il lavoro ad altri agenti.

La maggior parte delle demo di agenti AI si comporta ancora come completamenti di chat con passaggi aggiuntivi: invii un prompt, aspetti qualche secondo e ricevi una risposta in un’unica output.

Esegui Docker Compose come servizio Linux con systemd

Docker Compose su un server Linux dovrebbe avviarsi all’avvio, fermarsi in modo pulito allo spegnimento e sopravvivere ai riavvii senza intervento manuale.

Installazione di Docker su Ubuntu: APT, Snap, Rootless – Guida completa 2026

L’installazione di Docker su Ubuntu dovrebbe essere semplice, ma nella pratica diverse opzioni “a forma di Docker” competono per lo stesso nome comando, ognuna con packaging, comportamenti di aggiornamento e implicazioni di sicurezza diversi.

Risoluzione dei problemi di APT in Ubuntu: correzione di pacchetti rotti, Holds ed errori GPG

I guasti di APT sono comuni nelle macchine Ubuntu di lunga durata e di solito si manifestano dopo un aggiornamento di rilascio, una modifica di un repository di terze parti, la rimozione di un PPA, un’installazione manuale di un pacchetto .deb o un’installazione di pacchetti interrotta.

Decodifica Speculativa: Inferenza di LLM 20-50% più rapida

Un modello da 70B genera un token per ogni passaggio in avanti (forward pass), e ogni passaggio ricarica i pesi dalla VRAM, calcola l’attenzione su tutto il contesto e sincronizza la memoria. Tra un token e l’altro, la GPU rimane inattiva mentre attende la risoluzione delle dipendenze sequenziali.

Pattern di orchestrazione multi-agente: una guida pratica

I sistemi IA a agente singolo hanno raggiunto il loro apice nel 2025: si forniva a un LLM un prompt, alcuni strumenti e un obiettivo, ed eseguiva compiti limitati in modo ragionevolmente efficace.

Pattern Transactional Outbox in Go con PostgreSQL

Due scritture che dovrebbero riuscire insieme finiscono per fallire separatamente. Il tuo servizio ordini salva l’ordine nel database, quindi pubblica un evento order.created su un message broker.

Iscriviti