Rost Glukhov | Site pessoal e blog técnico

Manutenção da Wiki de LLMs: Deriva, Contradições e Revisão

Uma Wiki de LLM falha quando fatos antigos permanecem plausíveis, contradições ficam polidas e resumos gerados se afastam de suas fontes.

Sincronização de Arquivos com Syncthing para Sistemas de Conhecimento Auto-hospedados

O Syncthing mantém os arquivos sincronizados entre os dispositivos que você controla, tornando-o uma das ferramentas mais práticas para uma infraestrutura de conhecimento auto-hospedada que evita a dependência de provedores de nuvem (cloud lock-in).

Padrão Circuit Breaker em Go: Evitando Falhas em Cascata

Um circuit breaker (disjuntor) impede que seu serviço em Go continue a sobrecarregar uma dependência falha, prevenindo falhas em cascata que consomem goroutines, sockets e memória até que todo o sistema colapse.

Podman Quadlet vs Docker Compose para serviços Linux

Docker Compose e Podman Quadlet resolvem problemas sobrepostos, mas vêm de centros de design diferentes, e a escolha entre eles depende de você pensar em pilhas de aplicativos ou em serviços Linux.

GPUs para IA em 2026: NVIDIA, AMD e Intel Comparadas

O cenário do hardware de IA mudou significativamente em 2026, com NVIDIA, AMD e Intel competindo por desenvolvedores que necessitam de GPUs capazes de executar modelos de linguagem grandes (LLMs) e cargas de trabalho de inferência de IA localmente.

Agente Hermes: Servidor Headless + Configuração de Área de Trabalho Remota

Executar o Hermes Agent em um servidor sem interface gráfica (headless) enquanto se conecta a partir de um cliente desktop em outra máquina requer dois processos de servidor e uma única conexão de cliente.

GitHub Spec Kit vs Kiro vs Fluxos de Trabalho SDD do Claude Code

Desenvolvedores que comparam configurações de Desenvolvimento Orientado por Especificação (SDD) em 2026 geralmente não perguntam qual modelo é o mais inteligente. Eles perguntam qual fluxo de trabalho manterá um agente de IA alinhado sem soterrar a equipe em burocracia.

Fluxo de Trabalho de Desenvolvimento Orientado por Especificações: Dos Requisitos ao Código

O Desenvolvimento Dirigido por Especificação (SDD) funciona quando a especificação é um fluxo de trabalho, não um documento que você arquiva após o início. O objetivo não é produzir um grande documento de requisitos do produto.

Segurança de Agentes A2A e MCP: Identidade, Delegação e Rastreamento de Auditoria

A injeção de prompt recebe a maior parte da atenção em relação à segurança em sistemas de LLM (Modelos de Linguagem de Grande Escala), e merece atenção, mas não é o único problema quando os agentes começam a chamar ferramentas e delegar trabalho a outros agentes.

A maioria das demonstrações de agentes de IA ainda se comporta como conclusões de chat com passos extras: você envia um prompt, aguarda alguns segundos e recebe uma resposta em uma única mensagem.

Execute o Docker Compose como um Serviço Linux com systemd

O Docker Compose em um servidor Linux deve iniciar na boot, parar limpaamente durante o desligamento e sobreviver a reinicializações sem intervenção manual.

Instalando o Docker no Ubuntu: APT, Snap, Rootless — Guia Completo 2026

Instalar o Docker no Ubuntu deveria ser simples, mas na prática, várias opções relacionadas ao Docker competem pelo mesmo nome de comando, cada uma com empacotamento, comportamento de atualização e implicações de segurança diferentes.

Solução de problemas do APT no Ubuntu: corrigir pacotes quebrados, retenções e erros de GPG

Falhas no APT são comuns em máquinas Ubuntu de longa duração e geralmente surgem após uma atualização de versão, uma mudança em repositórios de terceiros, a remoção de um PPA, a instalação manual de um .deb ou uma instalação de pacote interrompida.

Decodificação Especulativa: Inferência de LLM 20-50% Mais Rápida

Um modelo de 70B gera um token por passagem direta (forward pass), e cada passagem recarrega os pesos da VRAM, calcula a atenção em todo o contexto e sincroniza a memória. Entre os tokens, a GPU fica ociosa enquanto aguarda a resolução das dependências sequenciais.

Padrões de Orquestração de Multi-Agentes: Um Guia Prático

Os sistemas de IA de agente único atingiram seu auge em 2025 — você dava um prompt a um LLM, algumas ferramentas e um objetivo, e ele desempenhava razoavelmente bem em tarefas delimitadas.

Padrão de Caixas de Saída Transacional em Go com PostgreSQL

Duas escritas que deveriam ter sucesso juntas eventualmente falharão separadamente. Seu serviço de pedidos salva o pedido no banco de dados e, em seguida, publica um evento order.created em um broker de mensagens.

Assinar