Docker

Início Rápido do Vane (Perplexica 2.0) com Ollama e llama.cpp

Vane é uma das entradas mais pragmáticas no espaço de “busca de IA com citações”: um motor de respostas auto-hospedado que combina recuperação da web em tempo real com LLMs locais ou na nuvem, mantendo toda a pilha sob seu controle.

Assistente de IA Hermes - Instalação, Configuração, Fluxo de Trabalho e Solução de Problemas

O Hermes Agent é um assistente de IA auto-hospedado e agnóstico em relação ao modelo que roda em uma máquina local ou em um VPS de baixo custo, opera por meio de interfaces de terminal e mensagens e melhora ao longo do tempo, transformando tarefas repetidas em habilidades reutilizáveis.

TGI – Text Generation Inference – Instalação, Configuração e Solução de Problemas

A Inferência de Geração de Texto (TGI) tem uma energia muito específica. Não é o mais novo na rua da inferência, mas é aquele que já aprendeu como a produção quebra -

Ollama no Docker Compose com GPU e Armazenamento Persistente de Modelos

Ollama funciona muito bem em metal nu. Torna-se ainda mais interessante quando tratado como um serviço: um endpoint estável, versões fixas, armazenamento persistente e uma GPU que está disponível ou não.

Banco de dados gráfico Neo4j para GraphRAG, instalação, Cypher, vetores e operações.

O Neo4j é a ferramenta a que você recorre quando as relações são os dados. Se o seu domínio se parece com um quadro branco cheio de círculos e setas, forçá-lo em tabelas é doloroso.

SGLang QuickStart: Instale, Configure e Execute LLMs via API OpenAI

O SGLang é um framework de serviço de alto desempenho para grandes modelos de linguagem e modelos multimodais, construído para fornecer inferência de baixa latência e alto throughput, desde uma única GPU até clusters distribuídos.

Início Rápido do Apache Kafka - Instale o Kafka 4.2 com CLI e Exemplos Locais

O Apache Kafka 4.2.0 é a linha de versão suportada atualmente e representa a melhor base para um Quickstart moderno, pois o Kafka 4.x é totalmente livre de ZooKeeper e construído em torno do KRaft por padrão.

Início Rápido do Seletor de Modelos llama.swap para LLMs Locais Compatíveis com OpenAI

Em breve, você estará equilibrando vLLM, llama.cpp e mais — cada pilha em sua própria porta. Tudo a jusante ainda deseja uma URL base /v1; caso contrário, você continuará movendo portas, perfis e scripts pontuais. O llama-swap é o proxy /v1 antes dessas pilhas.

Ferramentas para Desenvolvedores: O Guia Completo de Fluxos de Trabalho Modernos

Desenvolver software envolve Git para controle de versão, Docker para containerização, bash para automação, PostgreSQL para bancos de dados e VS Code para edição — além de inúmeras outras ferramentas que podem fazer ou quebrar sua produtividade. Esta página reúne os atalhos essenciais, fluxos de trabalho e comparações necessários para trabalhar de forma eficiente em toda a pilha de desenvolvimento.

Início Rápido do OpenHands Coding Assistant: Instalação, Opções de CLI e Exemplos

OpenHands é uma plataforma de código aberto e agnóstica em relação ao modelo para agentes de desenvolvimento de software impulsionados por IA. Ele permite que um agente se comporte mais como um parceiro de programação do que como uma simples ferramenta de autocompletar.

Início Rápido do LocalAI: Execute LLMs Compatíveis com OpenAI Localmente

O LocalAI é um servidor de inferência de auto-hospedagem, com prioridade local, projetado para funcionar como uma API OpenAI plug-and-play para executar cargas de trabalho de IA no seu próprio hardware (laptop, estação de trabalho ou servidor local).

Monitoramento de Inferência de LLM em Produção (2026): Prometheus e Grafana para vLLM, TGI e llama.cpp

A inferência de LLM parece ser “apenas outra API” — até que a latência dispare, as filas se acumulem e suas GPUs fiquem com 95% de memória sem uma explicação óbvia.

Início Rápido do OpenClaw: Instalação com Docker (Ollama GPU ou Claude + CPU)

O OpenClaw é um assistente de IA hospedado localmente projetado para funcionar com tempos de execução de LLM locais, como o Ollama, ou com modelos baseados em nuvem, como o Claude Sonnet.

Os 19 Projetos Go Mais Populares no GitHub – Janeiro de 2026

O ecossistema Go continua a prosperar com projetos inovadores que abrangem ferramentas de IA, aplicativos auto-hospedados e infraestrutura de desenvolvimento. Esta análise examina os repositórios Go mais populares no GitHub deste mês.

Open WebUI: Interface Autohospedada para LLMs

Open WebUI é uma interface web auto-hospedada poderosa, extensível e repleta de recursos para interação com grandes modelos de linguagem.

vLLM é um motor de inferência e serviço de alto rendimento e eficiente em memória para Grandes Modelos de Linguagem (LLMs), desenvolvido pelo Laboratório de Computação Sky da UC Berkeley.